亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

題目: Review: deep learning on 3D point clouds

簡介:

點云是在三維度量空間中定義的點集。點云已經成為三維表示中最重要的數據格式之一。由于激光雷達等獲取設備的可用性增加以及機器人、自動駕駛、增強和虛擬現實等領域的應用增加,它越來越受歡迎。深度學習現在是計算機視覺中最強大的數據處理工具,成為分類、分割和檢測等任務的首選技術。深度學習技術主要應用于具有結構化網格的數據,而點云則是非結構化的。點云的無結構使得深度學習直接處理點云非常具有挑戰性。早期的方法通過將點云預處理成結構化的網格格式來克服這一挑戰,代價是計算成本的增加或深度信息的丟失。然而,最近許多先進的深度學習技術正在開發中,這些技術可以直接操作點云。這篇論文包含了對當前最先進的深度學習技術的調查,這些技術主要集中在點云數據上。我們首先簡要地討論了在點云上直接使用深度學習所面臨的主要挑戰,我們還簡要地討論了通過將點云預處理成結構化網格來克服這些挑戰的早期方法。然后,我們回顧了各種先進的深度學習方法,直接處理點云的非結構化形式。我們介紹了流行的3D點云基準數據集。我們還進一步討論了深度學習在當前流行的三維視覺任務中的應用,包括分類、分割和檢測。

作者:

王程,福建省特支“雙百計劃”入選者、福建省科技創新領軍人才、廈門大學計算機科學系教授、博士生導師、副院長。研究方向:三維視覺,空間大數據分析,激光雷達,虛擬/增強現實。個人主頁:

付費5元查看完整內容

相關內容

根據激光測量原理得到的點云,包括三維坐標(XYZ)和激光反射強度(Intensity)。 根據攝影測量原理得到的點云,包括三維坐標(XYZ)和顏色信息(RGB)。 結合激光測量和攝影測量原理得到點云,包括三維坐標(XYZ)、激光反射強度(Intensity)和顏色信息(RGB)。 在獲取物體表面每個采樣點的空間坐標后,得到的是一個點的集合,稱之為“點云”(Point Cloud)

摘要: 目標檢測算法應用廣泛,一直是計算機視覺領域備受關注的研究熱點。近年來,隨著深度學習的發展,3D圖像的目標檢測研究取得了巨大的突破。與2D目標檢測相比,3D目標檢測結合了深度信息,能夠提供目標的位置、方向和大小等空間場景信息,在自動駕駛和機器人領域發展迅速。文中首先對基于深度學習的2D目標檢測算法進行概述;其次根據圖像、激光雷達、多傳感器等不同數據采集方式,分析目前具有代表性和開創性的3D目標檢測算法;結合自動駕駛的應用場景,對比分析不同 3D 目標檢測算法的性能、優勢和局限性;最后總結了3D目標檢測的應用意義以及待解決的問題,并對 3D 目標檢測的發展方向和新的挑戰進行了討論和展望。

付費5元查看完整內容

主題: A Review on Deep Learning Techniques for Video Prediction

摘要: 預測,預期和推理未來結果的能力是智能決策系統的關鍵組成部分。鑒于深度學習在計算機視覺中的成功,基于深度學習的視頻預測已成為有前途的研究方向。視頻預測被定義為一種自我監督的學習任務,它代表了一個表示學習的合適框架,因為它展示了提取自然視頻中潛在模式的有意義的表示的潛在能力。視頻序列預測的深度學習方法。我們首先定義視頻預測的基礎知識,以及強制性的背景概念和最常用的數據集。接下來,我們會仔細分析根據擬議的分類法組織的現有視頻預測模型,突出顯示它們的貢獻及其在該領域的意義。數據集和方法的摘要均附有實驗結果,有助于在定量基礎上評估現有技術。通過得出一些一般性結論,確定開放研究挑戰并指出未來的研究方向來對本文進行總結。

付費5元查看完整內容

主題: Comprehensive Review of Deep Reinforcement Learning Methods and Applicationsin Economic

摘要: 深度強化學習(DRL)方法在經濟學中的應用已成倍增加。 DRL通過從強化學習(RL)和深度學習(DL)的廣泛功能來處理復雜的動態業務環境提供了廣闊的機遇。 DRL的特點是可伸縮性,它有可能結合經濟數據的噪聲和非線性模式應用于高維問題。在這項工作中,我們首先考慮對經濟學中各種應用中的DL,RL和深層RL方法進行簡要回顧,以提供對最新技術水平的深入了解。此外,研究了應用于經濟應用的DRL體系結構,以突出其復雜性,魯棒性,準確性,性能,計算任務,風險約束和獲利能力。調查結果表明,與傳統算法相比,DRL可以提供更好的性能和更高的精度,同時在存在風險參數和不確定性不斷增加的情況下面臨實際的經濟問題。

付費5元查看完整內容

題目: A Survey on Deep Geometry Learning: From a Representation Perspective

摘 要:

目前,研究人員已經在利用深度學習處理二維圖像方面取得了很大的成功。近年來,三維計算機視覺和幾何深度學習越來越受到人們的重視。針對不同的應用,提出了許多先進的三維造型技術。與二維圖像可以由像素的規則網格統一表示不同,三維圖形具有多種表示,如深度和多視圖圖像、基于體素的表示、基于點的表示、基于網格的表示、隱式的表面表示等。然而,不同應用程序的性能在很大程度上取決于所使用的表示,并且沒有一種惟一的表示可以適用于所有應用程序。因此,在本次調查中,我們從表象的角度回顧了三維幾何深度學習的最新發展,總結了不同表象在不同應用中的優缺點。我們也提出現有的數據集在這些表示和進一步討論未來的研究方向。

付費5元查看完整內容

3D點云學習( Point Clouds)作為近年來的研究熱點之一,受到了廣泛關注,每年在各大會議上都有大量的相關文章發表。當前,點云上的深度學習變得越來越流行,人們提出了許多方法來解決這一領域的不同問題。國防科技大學郭裕蘭老師課題組新出的這篇論文對近幾年點云深度學習方法進行了全面綜述,是第一篇全面涵蓋多個重要點云相關任務的深度學習方法的綜述論文,包括三維形狀分類、三維目標檢測與跟蹤、三維點云分割等,并對點云深度學習的機制和策略進行全面的歸納和解讀,幫助讀者更好地了解當前的研究現狀和思路。也提供了現有方法在幾個可公開獲得的數據集上的全面比較,最后也介紹了未來的研究方向。

【摘要】點云學習近年來受到越來越多的關注,因為它在許多領域都有廣泛的應用,比如計算機視覺、自動駕駛和機器人技術。作為人工智能的主要技術之一,深度學習已經成功地用于解決各種二維視覺問題。然而,由于使用深度神經網絡處理點云所面臨的獨特挑戰,對點云的深度學習仍處于起步階段。最近,點云上的深度學習變得越來越流行,人們提出了許多方法來解決這一領域的不同問題。為了激發未來的研究,本文對點云深度學習方法的最新進展進行了綜述。它涵蓋了三個主要任務,包括三維形狀分類,三維目標檢測和跟蹤以及三維點云分割。我們還提供了一些可公開獲得的數據集的比較結果,以及有見地的觀察和啟發性的未來研究方向。

引言

3D數據在不同的領域有許多應用,包括自動駕駛、機器人、遙感、醫療和設計行業[4]。近年來,深度學習技術在計算機視覺、語音識別、自然語言處理(NLP)、生物信息學等研究領域占據主導地位。但是,在三維點云上進行深度學習仍然面臨數個重大挑戰[5],例如數據集規模小,維數高和三維點云的非結構化性質。在此基礎上,本文重點分析了用于處理三維點云的深度學習方法。

一些公開的數據集也被發布,例如ModelNet [6],ShapeNet [7],ScanNet [8],Semantic3D [9]和KITTI Vision Benchmark Suite [10]。這些數據集進一步推動了對三維點云的深度學習研究,提出了越來越多的方法來解決與點云處理相關的各種問題,包括三維形狀分類、三維目標檢測與跟蹤、三維點云分割等。

這篇論文是第一個專門針對點云的深度學習方法的綜述。此外,論文全面涵蓋了分類,檢測,跟蹤和分割等不同應用。圖1顯示了三維點云的現有深度學習方法的分類。

圖1:三維點云深度學習方法分類。

這項工作的主要貢獻可以概括如下:

  • 1)據我們所知,這是第一篇全面涵蓋多個重要點云相關任務的深度學習方法的綜述論文,包括三維形狀分類、三維目標檢測與跟蹤、三維點云分割等。

  • 2)相對于已有的綜述[11],[12],我們特別關注三維點云的深度學習方法,而不是所有類型的三維數據。

  • 3)本文介紹了點云深度學習的最新進展。因此,它為讀者提供了最先進的方法。

  • 4)提供了現有方法在幾個可公開獲得的數據集上的全面比較(例如,表1、2、3、4),并提供了簡要的總結和深入的討論。

本文的結構如下。第2節回顧了三維形狀分類的方法。第3節概述了現有的三維目標檢測和跟蹤方法。第4節介紹了點云分割的方法,包括語義分割、實例分割和部件分割。最后,第5節總結了論文。

論文還在以下網址上提供了定期更新的項目頁面:

//github.com/QingyongHu/SoTA-Point-Cloud

圖2:三維形狀分類網絡的時間順序概覽。

圖3:PointNet的體系結構。

圖4:點的局部鄰居的連續和離散卷積的圖解。(a)代表一個局部鄰居;(b)和(c)分別表示三維連續卷積和離散卷積。

圖5:基于圖的網絡的圖解。

表1:在ModelNet10/40基準上比較三維形狀分類結果。這里,我們只關注基于點的網絡,“#params”表示相應模型的參數數量。“OA”表示總體精度,“mAcc”表示表中的平均精度。符號“-”表示結果不可用。

圖6:按時間順序概述的最相關的基于深度學習的三維目標檢測方法。

圖7:三類三維目標檢測方法的典型網絡。從上到下:(a)基于多視圖,(b)基于分割,(c)基于視錐的方法。

表2:在KITTI測試三維檢測基準上的三維目標檢測結果對比。

表3:在KITTI test BEV檢測基準上三維目標檢測結果對比。

圖8:按時間順序概述了一些最相關的基于深度學習的點云語義分割方法。

圖9:基于投影方法的中間表示圖。

圖10:PointNet++[27]框架的示意圖。

圖11:有代表性的三維點云實例分割方法的年代概述。

未來方向

表4展示了現有方法在公共基準測試上的結果,包括S3DIS[176]、Semantic3D[9]、ScanNet[102]、SemanticKITTI[177]。需要進一步研究的問題有:

  • 基于點的網絡是最常被研究的方法。然而,點表示自然不具有顯式的鄰近信息,現有的大多數基于點的方法不得不借助于昂貴的鄰近搜索機制(如KNN[52]或ball query [27])。這從本質上限制了這些方法的效率,因為鄰居搜索機制既需要很高的計算成本,又需要不規則的內存訪問[214]。

  • 從不平衡數據中學習仍然是點云分割中一個具有挑戰性的問題。雖然有幾種的方法取得了顯著的綜合成績[42]、[170]、[182],但它們在類標很少的情況下表現仍然有限。例如,RandLA-Net[95]在Semantic3D的reduced-8子集上獲得了76.0%的整體IoU,而在hardscape類上獲得了41.1%的非常低的IoU。

  • 大多數現有的方法[5]、[27]、[52]、[170]、[171]都適用于小點云(如1m*1m,共4096個點)。在實際中,深度傳感器獲取的點云通常是巨大的、大規模的。因此,有必要進一步研究大規模點云的有效分割問題。

  • 已有少數文獻[145]、[146]、[167]開始研究動態點云的時空信息。預期時空信息可以幫助提高后續任務的性能,如三維目標識別、分割和完成。

表4:S3DIS(包括Area5和6-fold cross validation)[176]、Semantic3D(包括semantic-8和reduced-8子集)[9]、ScanNet[8]和SemanticKITTI[177]數據集的語義分割結果對比。

結論

本文介紹了如今最先進的三維理解方法,包括三維形狀分類,三維目標檢測和跟蹤,以及三維場景和目標分割。對這些方法進行了全面的分類和性能比較。介紹了各種方法的優缺點,并提出了今后的研究方向。

付費5元查看完整內容

題目: A Survey of Deep Learning Applications to Autonomous Vehicle Control

摘要:

為自動駕駛車輛設計一個能夠在所有駕駛場景中提供足夠性能的控制器是一個挑戰,因為它的環境非常復雜,而且無法在部署后可能遇到的各種場景中測試系統。然而,深度學習方法已經顯示出巨大的潛力,不僅為復雜的非線性控制問題提供了出色的性能,而且還可以將以前學習的規則推廣到新的場景中。基于這些原因,在車輛控制中使用深度學習變得越來越流行。雖然在這一領域取得了重要的進展,但這些工作尚未得到全面總結。本文調查了文獻報道的廣泛的研究工作,旨在通過深度學習的方法來控制車輛。雖然控制和感知之間存在重疊,但本文的重點是車輛控制,而不是更廣泛的感知問題,包括語義分割和目標檢測等任務。本文通過比較分析,明確了現有深度學習方法的優勢和局限性,并從計算、體系結構選擇、目標規范、泛化、驗證和驗證以及安全性等方面探討了研究的挑戰。總的來說,這項調查為智能交通系統相關的一個快速發展的領域帶來了及時和熱門的信息。

作者:

Sampo Kuutti是薩里大學汽車工程中心碩士研究生,研究興趣是機器學習,強化學習,自動車輛。

Richard Bowden是英國薩里大學計算機視覺和機器學習教授,在倫敦大學獲得計算機科學學士學位,利茲大學獲得理學碩士學位,布魯內爾大學獲得計算機視覺博士學位。Richard Bowden教授領導視覺、語言和信號處理中心的認知視覺小組,他的研究中心是利用計算機視覺來定位、跟蹤和理解人類。他是圖像和視覺計算、IEEE模式分析和機器智能的副主編,是英國機器視覺協會(BMVA)執行委員會的成員。

付費5元查看完整內容

教程題目:Learning from 3D (Point Cloud) Data

教程簡介

在(3D)點云上學習對于自動駕駛、機器人感知、VR/AR、游戲和安全等廣泛的新興應用至關重要。由于激光雷達、3D相機和RGB-D等3D傳感器的普及,這種需求最近有所增加。點云由成千上萬個點組成,是對傳統2D相機的補充。點云數據上的三維學習算法是一種全新的、令人興奮的方法,可以解決三維分類、檢測、語義分割和人臉識別等眾多核心問題。本教程涵蓋點云數據的需求、捕獲數據的背景、3D表示、新興應用程序、核心問題、最新的學習算法(例如,基于體素、基于點的算法等)和未來的研究機會。還將展示最近工作在幾個三維基準,如ScanNet, KITTI等。

組織者:

徐宏民教授是一位活躍的研究人員,致力于大型圖像/視頻檢索/挖掘、視覺識別和機器智能。他是國立臺灣大學計算機科學與資訊工程學系的教授。他和他的團隊獲得了多媒體和計算機視覺研究領域的技術獎項,包括IBM research的Pat Goldberg Memorial最佳論文獎(2018),2017年ACM多媒體大會最佳新創意論文獎,IARPA變臉大賽第一名(CVPR 2018), 2011年ACM多媒體大挑戰一等獎,2013/2014年度ACM多媒體大挑戰多模態獎等。徐教授熱衷于通過學術-產業合作和共同創辦創業公司來實現對商業成果的先進研究。2014年,他是微軟雷德蒙德研究院的訪問科學家,2016-2017年,他在IBM TJ Watson研究中心休了一年的年假。他曾擔任《IEEE視頻技術電路與系統學報》(TCSVT)和《IEEE多媒體學報》(IEEE Multimedia Transactions on Video Technology)的副主編,并擔任《IEEE多媒體雜志》(2010 - 2017)的編委。

付費5元查看完整內容
北京阿比特科技有限公司