在目標檢測技術的驅動下,被賦予智能感知能力的無人機得以實現高效靈活的數據收集能力。隨著無人機 的普及與智能技術的成熟,無人機視角下的目標檢測在諸多領域中作為關鍵核心技術,具有重要的研究意義。為了 進一步促進無人機視角下目標檢測研究的發展,本文對無人機視角下的目標檢測算法進行了全面的總結,并對已有 算法進行了歸類、分析和比較。首先,介紹無人機視角下的目標檢測概念,并總結了無人機視角下目標檢測所面臨 的目標尺度、空間分布、樣本數量、類別語義以及優化目標等五大不均衡挑戰。**在介紹現有研究方法的基礎上,本 文特別整理并介紹了無人機視角下目標檢測算法在交通監控、電力巡檢、作物分析和災害救援等實際場景中的應用。**然后,重點闡述從數據增強策略、多尺度特征融合、區域聚焦策略、多任務學習、以及模型輕量化等方面來提升無 人機視角下目標檢測性能的方法,總結這些方法的優缺點并分析了其與現存挑戰之間的關聯性。之后,全面介紹基 于無人機視角的目標檢測數據集,并呈現已有算法在兩個較為常用的公共數據集上的性能評估。最后本文對無人機 視角下目標檢測技術的未來發展方向進行了展望。
0. 引言
計算機視覺技術為無人機賦予了自主感知、分 析和決策能力,而目標檢測則是提高無人機感知能 力的關鍵技術之一。無人機結合智能目標檢測技術 可充分發揮其高機動性優勢,在廣闊的空中視野中 定位感興趣目標,進而實現靈活高效的數據收集能 力。在目標檢測技術的驅動下,無人機在交通監控 (Byun 等,2021)、電力巡檢(Abdelfattah 等, 2020)、作物分析(Osco 等,2021a)和災害救援 (Bo?i?-?tuli? 等,2019)等多個領域中展現出廣闊 的應用前景。例如在交通監控領域,無人機可以空 中飛行進行偵測,不受道路限制,具有速度快、自 由度高、視野寬廣等優點。當交通事故等突發事件 發生時,無人機可以第一時間進行響應,到達現場 進行圖像采集與分析,為應急救援與管理提供及時 有效的數據支撐。在深度學習的驅動下,目標檢測 技術獲得了長足的發展,取得了諸多令人矚目的成 就。然而,大多數研究聚焦于地面視頻監控圖像的 分析,面向無人機視角圖像的目標檢測還未得到充 分的研究。目前,即使是最好的目標檢測算法,在 無人機圖像上的平均精確率也難以達到40%(Cao 等,2021)。
**無人機視角下的目標檢測之所以難,其主要原 因在于無人機圖像存在尺度變化、疏密分布、目標 數量較多且小目標占比較高等問題,特別是無人機 高分辨率圖像高計算需求與現階段低功耗芯片有 限算力之間的矛盾難以平衡。**相對于地面視角拍攝 的自然圖像,無人機視角下的廣闊視場意味著更為 復雜的場景和更加多樣的目標,在提供更為豐富的 可視化信息的同時,也帶來了更多無用噪聲的干擾。特別是無人機視角下,圖像中的目標往往因遠端拍 攝、背景遮擋或光照影響等因素檢測難度較大,需 要使用高分辨率圖像提供更多的信息以達到較好 的檢測效果。這極大地增加了目標檢測算法的計算 開銷與內存需求,特別是直接使用未經過特殊設計 的通用目標檢測算法將帶來難以承受的計算開銷 與內存需求,進一步加劇了目標檢測的難度。在實 際應用場景中,往往面臨著類似于識別車輛種類這 種細粒度分類的問題,這些相似目標給模型正確識 別目標帶來了巨大的挑戰。此外,受限于現實世界 中的目標數量,無人機視角下某些類別的樣本數量 往往極為有限,這種數據不均衡的狀況也對模型的 學習能力提出了更高的要求。因此,緊密地結合智能目標檢測技術,針對無 人機圖像的特性設計行之有效的方法,促使模型學 習理解無人機視角下的視覺數據,對于無人機在實 際場景中充分發揮其效用是至關重要的。無人機視 角下的目標檢測在應用廣泛的同時面臨著諸多挑 戰,具有深刻的現實意義與重要的研究意義。對無 人機視角下的目標檢測展開研究將有助于推動目 標檢測領域的進一步發展,增強目標檢測在面對真 實場景時的應用能力。
目標檢測作為計算機視覺領域的基礎研究,已 有學者對此進行研究與總結,并發表許多優秀的綜 述。Zou等人(2019)梳理了400多篇關于目標檢測 技術發展的論文,系統而全面地展現了目標檢測領 域。Oksuz等人(2020)則從目標檢測中存在的類別 不平衡、尺度不平衡、空間不平衡以及優化目標不 平衡等四大不平衡問題出發,對現有的目標檢測算 法進行了深入的總結。Chen等人(2020)則從小目 標四大基礎方法的角度出發,總結并分析了小目標 檢測的相關優化思路。曹家樂等人(2022)回顧并 總結了基于單目相機的視覺目標檢測方法,并對比 介紹了單目目標檢測和雙目目標檢測的國內外研 究進展情況。然而,以上綜述對于無人機視角下目 標檢測的關注不夠,未能系統地梳理無人機視角下 的目標檢測方法和面臨的挑戰。 **聚焦到無人機視角下的目標檢測,Mittal等人 (2020)關注低空無人機數據集,評估并總結了當 前流行的目標檢測算法,但是局限于簡單的性能對 比,沒有深入的總結分析。**Sambolek等人(2020) 介紹了在搜索和救援行動中使用無人機的可能性, 并提供了在無人機圖像中檢測相關人員的方法概 述。Srivastava等人(2021)則關注無人機圖像的車 輛檢測,從提高精度和減少計算開銷兩個方面回顧 了這些工作。Bouguettaya等人(2021)則關注于無 人機視角下的車輛檢測應用,總結并介紹了多種網 絡結構對于改善車輛檢測的貢獻。江波等人(2021) 對常見的航空影像數據集進行了梳理,并對近期的 無人機目標檢測研究進行了歸納和分析。楊浩然等 人(2022a)則對目標檢測相關算法進行了簡單的優 缺點分析。然而,這些綜述對于無人機視角下面臨 的挑戰總結不夠系統,算法方面的趨勢總結較為薄 弱,而且對于目標檢測算法的實際應用闡述也較少。
與以往關注通用領域的目標檢測綜述或僅關 注于無人機相關的特定應用場景下的綜述不同,**本 文著重于對無人機視角下的目標檢測這一意義重大且極具挑戰性的研究領域進行系統且深入的分 析與總結。**本文首先簡要闡述無人機視角下目標檢 測的重要研究意義,然后將對無人機視角下目標檢 測領域中存在的挑戰進行系統的歸納和總結,隨之 將介紹并分析無人機視角下的目標檢測優化思路, 包括數據增強、多尺度特征融合、區域聚焦策略、 多任務學習、模型輕量化以及其他優化策略等。本 文將特別展示無人機視角下目標檢測算法的應用, 闡明該研究的實際意義。此外,本文將介紹無人機 視角下適用于檢測任務的相關數據集,并在常用的 數據集上分析對比現有算法的檢測性能。最后,對 本文內容進行簡要的總結,并討論無人機視角下的 目標檢測未來可能的研究方向和發展趨勢。
近年來,無人機因其小巧靈活、智能自主等特點被廣泛應用于民用 和軍事等領域中,特別是搜索偵察過程中首要的目標跟蹤任務。無人機 視覺目標跟蹤場景的復雜性和運動目標的多變性,使得目標特征提取及 模型建立困難,對目標跟蹤性能帶來巨大的挑戰。本文首先介紹了無人 機視覺目標跟蹤的研究現狀,梳理了經典和最新的目標跟蹤算法,特別 是基于相關濾波的跟蹤算法和基于深度學習的跟蹤算法,并對比了不同 算法的優缺點。其次,歸納了常用的目標跟蹤數據集和性能評價指標。 最后,展望了無人機視覺目標跟蹤算法的未來發展趨勢。
近年來,無人機憑借其體積小、動作靈活及易于 操控等特點,在民用、軍事以及科學研究等多個領域 得到越來越廣泛的應用,例如,惡劣環境下的電力線 路檢測、大氣環境檢測、搶險救災、偵察敵情、敵方 目標跟蹤、搜索戰場情報等[1-6] 。在無人機的諸多 任務類型中,無人機目標跟蹤有著重要的研究意義, 并逐漸成為目前無人機領域熱點研究方向之一[7-8] 。**無人機的目標跟蹤能夠通過多種方式來實現,比如,在跟蹤目標上綁定電子標簽或安裝 GPS追蹤 器來輔助跟蹤,但該類方法需要與目標進行近距離 接觸,在實際跟蹤任務中往往難以做到。**隨著計算 機視覺技術的飛速發展,基于視覺的無人機目標跟 蹤已成為最接近人類行為且最為直觀的跟蹤形式。 具體地,視覺目標跟蹤是指在給定某視頻初始幀中 感興趣區域(如人、車輛等)的情況下,對視頻中的 運動目標進行特征提取,根據提取到的目標特征來 預測未來時間幀中運動目標的位置和大小,從而完 成對目標的追蹤任務[9-11] 。
無人機視覺目標跟蹤與地面目標跟蹤相比,面 臨著 4個挑戰:1)由于空中視野廣闊,干擾物體數 量較多,目標與其他物體之間、目標與背景之間相 互干擾,可區分性差,導致目標模型的可辨識性和 排他性不高,建立精準的目標模型較困難。2)當 無人機飛行在一定高度時,圖像影幅變大,分辨率 和清晰度變低,地面上的待跟蹤目標尺度變得很 小,目標特征和紋理變得稀少,使得目標特征提取 困難,特征表示不顯著,導致目標檢測和跟蹤難度 變大。3)無人機在跟蹤過程中易受到風力等外界 因素的影響,導致相機抖動、視角變化、運動模糊 等現象頻繁,從而易產生跟蹤漂移和丟失的情況, 實現魯棒、穩定、長時的無人機目標跟蹤較為困 難。4)由于無人機自身結構特點,大多數無人機 僅有一個 CPU,計算資源有限,無法承受復雜度太 高的運算,如何在保證精度的情況下開發復雜度低 的跟蹤算法是極具挑戰的。隨著無人機技術的發展 和計算機信息處理能力的提升,盡管無人機視覺目 標跟蹤算法有了突破性進展,但由于上述難點的存 在,無人機視覺目標跟蹤算法仍有很大的發展空間。 視覺目標跟蹤方法主要分為生成類跟蹤方 法[12-13] 和判別類跟蹤方法[14-16] 。生成類跟蹤方法 通常忽略背景信息的影響且假設目標外觀在一定時 間內保持不變,故該方法無法處理和適應復雜的跟 蹤變化。判別類跟蹤方法,尤其是基于相關濾波和 基于深度學習的算法,在一定程度上解決了樣本不 足的問題,且能夠提取目標中更多有用信息,顯著 提高目標跟蹤準確率和速度。判別類跟蹤算法出現 之后,經典的生成類跟蹤算法逐漸淡出,其主要原 因是因為這些算法無法適應復雜多變的跟蹤場景, 其魯棒性和準確性被前沿算法所超越。然而,由于 上述目標跟蹤挑戰的存在,判別類跟蹤算法仍存在 一些不足。為了構建一個更精準、更高效且更魯棒 的通用跟蹤器,未來研究應重點關注高效的在線訓 練和失跟后的重新檢測機制,提高目標被完全遮擋 后的跟蹤效果,同時,應關注如何引入遷移學習和 對抗學習等前沿方法來提高特征提取有效性,提高 算法對低分辨率的小目標的跟蹤性能,從而應用于 機載無人機來完成實時跟蹤任務。文[1]重點對無 人機目標跟蹤算法的共同框架進行了詳細描述,分 析了現有技術的不足,并提出了目標跟蹤未來的發 展方向。文[16]系統地介紹了基于生成類和判別 類的視覺目標跟蹤算法,但未涉及目標跟蹤效果的 相關評估標準,且未對無人機空中監視場景中的難 點進行分析。為使相關研究人員對無人機視覺目標 跟蹤領域的研究有更加清晰深入的了解,本文結合 無人機自身結構特點,首先對應用于無人機領域的 目標跟蹤算法進行了梳理總結,分析了各算法的核 心思想及優缺點。其次,考慮到跟蹤算法在無人機 平臺上的應用前景,重點對基于相關濾波的跟蹤算 法和基于深度學習的跟蹤算法進行了詳細介紹,闡 述了各算法的特點和貢獻,并對比了各算法的跟蹤 效果,圖 1為兩類目標跟蹤算法的分類框架圖,圖 中所涉及的算法縮寫及其全稱如表 1所示。接著, 歸納了無人機目標跟蹤領域的跟蹤數據集和跟蹤性 能評價標準。最后,對全文進行了總結,并對無人 機視覺目標跟蹤的發展方向進行了展望。
摘要
無人機(UAV)由于有效且靈活的數據采集,近年來已成為計算機視覺(CV)和遙感(RS)領域的研究熱點。由于最近深度學習(DL)的成功,許多先進的目標檢測和跟蹤方法已被廣泛應用于與無人機相關的各種任務,例如環境監測、精準農業、交通管理。本文全面綜述了基于DL的無人機目標檢測與跟蹤方法的研究進展和前景。具體來說,我們首先概述了挑戰,統計了現有的方法,并從基于DL的模型的角度提供了解決方案,這三個研究課題分別是:來自圖像的目標檢測,來自視頻的目標檢測,來自視頻的目標跟蹤。利用無人機主導目標檢測與跟蹤相關的開放數據集,利用4個基準數據集,采用最先進的方法進行性能評估。最后,對今后的工作進行了展望和總結。本文對基于DL的無人機目標探測與跟蹤方法進行了綜述,并對其進一步發展提出了一些思考,以期為來自遙感領域的研究人員提供參考。
//www.zhuanzhi.ai/paper/d2cb72aa7da469d6481f2fc9e9c6454a
引言
目標檢測與跟蹤作為遙感領域的重要研究課題,已廣泛應用于環境監測、地質災害檢測、精準農業、城市規劃等各種民用和軍事任務中。傳統的目標捕獲方法主要來源于衛星和載人飛行器。這兩種平臺通常在固定軌道上運行或按照預定的路徑運行,也可以根據委托的任務,如城市規劃和測繪,或在惡劣和不適宜居住的環境下進行物體觀測,如冰凍圈遙感,臨時改變運行路線并懸停。然而,衛星和載人飛機的成本以及飛行員潛在的安全問題不可避免地限制了此類平臺的應用范圍。
隨著微電子軟硬件的發展,導航和通信技術的更新,以及材料和能源技術的突破,無人機(UAV)平臺已經成為國際遙感領域的研究熱點,迅速崛起。無人機遙感系統是將科技與無人機、遙感、全球定位系統(GPS)定位和慣性測量單元(IMU)姿態確定手段相結合的高科技組合。它是一個以獲取低空高分辨率遙感圖像為目標的專用遙感系統。與傳統平臺相比,無人機彌補了由于天氣、時間等限制造成的信息損失。此外,無人機的高機動性使其能夠靈活地采集視頻數據,不受地理限制。這些數據無論在內容上還是時間上都信息量極大,目標檢測與跟蹤進入了大規模無人機[1]-[3]時代,在土地覆蓋測繪[4]、[5]、智慧農業[6]、[7]、智慧城市[8]、交通監控[9]、災害監控[10]等領域發揮著越來越重要的作用。
目標檢測與跟蹤作為計算機視覺的基本問題之一,采用了經典的基于統計的方法[11]、[12]。然而,當前海量數據影響了這些傳統方法的性能,造成了特征維數爆炸的問題,存儲空間和時間成本較高。由于深度神經網絡(deep neural network, DL)技術[13]-[15]的出現,可以用深度復雜網絡學習具有足夠樣本數據的層次特征表示。自2015年以來,深度神經網絡已經成為無人機目標檢測與跟蹤的主流框架[16],[17]。圖1為無人機遙感在城市區域目標檢測與跟蹤的示例。經典的深度神經網絡主要分為兩大類:兩階段網絡和單階段網絡。其中,RCNN[18]、Fast RCNN[19]和Faster RCNN[20]等兩階段網絡首先需要生成region proposal (RP),然后對候選區域進行分類和定位。[21] -[23]的一系列工作證明了兩級網絡適用于具有較高檢測精度的應用。一級網絡,如SSD[24]和YOLO[16],[25],[26],直接產生類概率和坐標位置,比二級網絡更快。同樣,也有一些更快的輕量級網絡,如mobilenet SSD [27], YOLOv3 [28], ESPnet v2[29]等。因此,對高速需求的無人機遙感實際應用而言,一級快速輕量化網絡是最終的贏家。但對于低分辨率的數據,如果不對圖像進行預處理或對經典的神經網絡結構進行修改,則無法產生良好的效果。
本文以最大起飛重量小于30公斤的無人機為研究對象,通過總結最新發表的研究成果,對基于深度學習(DL)的無人機目標檢測與跟蹤方法進行了全面綜述,討論了關鍵問題和難點問題,并描述了未來的發展領域。本文的其余部分組織如下。第二節概述了無人機的統計情況和相關出版物。第六節介紹現有的基于無人機的遙感數據集。第三至第五節綜述了三個分支在基于無人機的目標檢測和跟蹤方面的現有基于DL的工作。第八節討論結論。
小目標檢測長期以來是計算機視覺中的一個難點和研究熱點。在深度學習的驅動下,小目標 檢測已取得了重大突破,并成功應用于國防安全、智能交通和工業自動化等領域。為了進一步促進小 目標檢測的發展,本文對小目標檢測算法進行了全面的總結,并對已有算法進行了歸類、分析和比較。首先,對小目標進行了定義,并概述小目標檢測所面臨的挑戰。然后,重點闡述從數據增強、多尺度學 習、上下文學習、生成對抗學習以及無錨機制等方面來提升小目標檢測性能的方法,并分析了這些方法 的優缺點和關聯性。之后,全面介紹小目標數據集,并在一些常用的公共數據集上對已有算法進行了 性能評估。最后本文對小目標檢測技術的未來發展方向進行了展望。
目標檢測是計算機視覺領域中的一個重要研究方向,也是其他復雜視覺任務的基礎。作為圖像理 解和計算機視覺的基石,目標檢測是解決分割、場景理解、目標跟蹤、圖像描述和事件檢測等更高層次 視覺任務的基礎。小目標檢測長期以來是目標檢測中的一個難點,其旨在精準檢測出圖像中可視化特 征極少的小目標(32 像素×32 像素以下的目標)。在現實場景中,由于小目標是的大量存在,因此小目 標檢測具有廣泛的應用前景,在自動駕駛、智慧醫療、缺陷檢測和航拍圖像分析等諸多領域發揮著重要 作用。近年來,深度學習技術的快速發展為小目標檢測注入了新鮮血液,使其成為研究熱點。然而,相 對于常規尺寸的目標,小目標通常缺乏充足的外觀信息,因此難以將它們與背景或相似的目標區分開 來。在深度學習的驅動下,盡管目標檢測算法已取得了重大突破,但是對于小目標的檢測仍然是不盡 人意的。在目標檢測公共數據集 MS COCO[1]上,小目標和大目標在檢測性能上存在顯著差距,小目標 的檢測性能通常只有大目標的一半。由此可見,小目標檢測仍然是充滿挑戰的。此外,真實場景是錯 綜復雜的,通常會存在光照劇烈變化、目標遮擋、目標稠密相連和目標尺度變化等問題,而這些因素對 小目標特征的影響是更加劇烈的,進一步加大了小目標檢測的難度。事實上,小目標檢測具有重要的 研究意義和應用價值。對于機場跑道,路面上會存在微小物體,如螺帽、螺釘、墊圈、釘子和保險絲等, 精準地檢測出跑道的這些小異物將避免重大的航空事故和經濟損失。對于自動駕駛,從汽車的高分辨 率場景照片中準確地檢測出可能引起交通事故的小物體是非常有必要的。對于工業自動化,同樣需要 小目標檢測來定位材料表面可見的小缺陷。對于衛星遙感圖像,圖像中的目標,例如車、船,可能只有 幾十甚至幾個像素。精確地檢測出衛星遙感圖像中的微小目標將有助于政府機構遏制毒品和人口販 運,尋找非法漁船并執行禁止非法轉運貨物的規定。
綜上所述,小目標檢測具有廣泛的應用價值和重 要的研究意義。對小目標檢測展開研究將有助于推動目標檢測領域的發展,擴寬目標檢測在現實世界 的應用場景,提高中國的科技創新水平和加快中國全面步入智能化時代的步伐。目標檢測作為計算機視覺的基礎研究,已有許多優秀的綜述發表。Zou 等[2]梳理了 400 多篇關于目 標檢測技術發展的論文,包括歷史上的里程碑檢測器、檢測框架、評價指標、數據集、加速技術和檢測應 用等諸多內容,系統而全面地展現了目標檢測這個領域的現狀。Oksuz 等[3]則從目標檢測中存在的類 別不平衡、尺度不平衡、空間不平衡以及多任務損失優化之間的不平衡等四大不平衡問題出發,對現有 的目標檢測算法進行了深入的總結。Zhao 等[4]在對比總結目標檢測中提及了小目標檢測所面臨的挑 戰。Agawal 等[5]則在目標檢測任務的主要挑戰中簡要介紹了幾種常用的小目標檢測方法。Chen 等[6] 立意于小目標檢測的 4 大支柱性方法,詳細描述了多尺度表示、上下文信息、超分辨率、區域建議以及其 他方法等 5 類具代表性的網絡,并介紹了部分小目標數據集。Tong 等[7]從多尺度學習、數據增強、訓練 策略、基于上下文的檢測和基于生成對抗網絡的檢測等 5 個維度全面回顧了基于深度學習的小目標檢 測方法,并在一些流行的小目標檢測數據集上,對當前經典的小目標檢測算法進行了比較分析。Liu 等[8]在總結對比最近用于小目標檢測的深度學習方法的基礎上,還簡單闡述了常規目標檢測、人臉檢 測、航空圖像目標檢測以及圖像分割等 4 個研究領域的相關技術。此外,還有文獻[9?10]等中文綜述中 對小目標檢測這一領域做了一定的總結工作。然而,文獻[2]主要對一般目標檢測算法進行了回顧,而 對小目標檢測方法的介紹甚少。文獻[3]則主要關注于目標檢測領域中存在的不平衡問題。文獻[4?5] 對目標檢測領域進行了全面的綜述總結,雖然有所涉及小目標檢測問題,但是并沒有進行全面的總結 和深入的分析。文獻[6?8]是針對小目標這一問題的綜述,對小目標檢測方法與性能評估進行了較為全 面的總結,但是在對小目標的定義、難點分析和性能評估等方面仍有所欠缺。文獻[9?10]作為中文的小 目標檢測綜述,分別對小目標檢測這一領域進行了總結綜述,但是對于小目標檢測方法的歸類與分析仍不夠深入。
與以往將小目標與常規目標等同對待或只關注特定應用場景下的目標檢測綜述不同,本文對小目 標檢測這一不可或缺且極具挑戰性的研究領域進行了系統且深入的分析與總結。本文不僅對小目標 的定義進行了解釋,也對小目標檢測領域存在的挑戰進行了詳細地分析和總結,同時重點闡述了小目 標檢測優化思路,包括數據增強、多尺度學習、上下文學習、生成對抗學習以及無錨機制以及其他優化 策略等。此外,本文還在常用的小目標數據集上分析對比了現有算法的檢測性能。最后,對本文內容 進行了簡要的總結,并討論了小目標檢測未來可能的研究方向和發展趨勢。
目標檢測的任務是從圖像中精確且高效地識別、定位出大量預定義類別的物體實例。隨著深度學習的廣泛應用,目標檢測的精確度和效率都得到了較大提升,但基于深度學習的目標檢測仍面臨改進與優化主流目標檢測算法的性能、提高小目標物體檢測精度、實現多類別物體檢測、輕量化檢測模型等關鍵技術的挑戰。針對上述挑戰,本文在廣泛文獻調研的基礎上,從雙階段、單階段目標檢測算法的改進與結合的角度分析了改進與優化主流目標檢測算法的方法,從骨干網絡、增加視覺感受野、特征融合、級聯卷積神經網絡和模型的訓練方式的角度分析了提升小目標檢測精度的方法,從訓練方式和網絡結構的角度分析了用于多類別物體檢測的方法,從網絡結構的角度分析了用于輕量化檢測模型的方法。此外,對目標檢測的通用數據集進行了詳細介紹,從4個方面對該領域代表性算法的性能表現進行了對比分析,對目標檢測中待解決的問題與未來研究方向做出預測和展望。目標檢測研究是計算機視覺和模式識別中備受青睞的熱點,仍然有更多高精度和高效的算法相繼提出,未來將朝著更多的研究方向發展。
摘要: 目標檢測算法應用廣泛,一直是計算機視覺領域備受關注的研究熱點。近年來,隨著深度學習的發展,3D圖像的目標檢測研究取得了巨大的突破。與2D目標檢測相比,3D目標檢測結合了深度信息,能夠提供目標的位置、方向和大小等空間場景信息,在自動駕駛和機器人領域發展迅速。文中首先對基于深度學習的2D目標檢測算法進行概述;其次根據圖像、激光雷達、多傳感器等不同數據采集方式,分析目前具有代表性和開創性的3D目標檢測算法;結合自動駕駛的應用場景,對比分析不同 3D 目標檢測算法的性能、優勢和局限性;最后總結了3D目標檢測的應用意義以及待解決的問題,并對 3D 目標檢測的發展方向和新的挑戰進行了討論和展望。