三維目標檢測通常涉及復雜的訓練和測試流程,這需要對單個數據集的大量領域知識。根據目前非最大抑制二維目標檢測模型,提出了一種基于點云的三維目標檢測體系結構。我們的方法將三維目標檢測建模為動態圖上傳遞的消息,將DGCNN框架泛化到預測一組目標。在我們的構建中,我們去掉了通過對象置信聚合或非最大抑制進行后處理的必要性。為了便于從稀疏點云中進行目標檢測,我們還提出了一種定制的集到集蒸餾方法。該方法以置換不變的方式將教師模型和學生模型的輸出進行對齊,顯著簡化了三維檢測任務的知識提取。我們的方法在自動駕駛基準上達到了最先進的性能。我們還提供了豐富的檢測模型和蒸餾框架分析。
摘要: 目標檢測算法應用廣泛,一直是計算機視覺領域備受關注的研究熱點。近年來,隨著深度學習的發展,3D圖像的目標檢測研究取得了巨大的突破。與2D目標檢測相比,3D目標檢測結合了深度信息,能夠提供目標的位置、方向和大小等空間場景信息,在自動駕駛和機器人領域發展迅速。文中首先對基于深度學習的2D目標檢測算法進行概述;其次根據圖像、激光雷達、多傳感器等不同數據采集方式,分析目前具有代表性和開創性的3D目標檢測算法;結合自動駕駛的應用場景,對比分析不同 3D 目標檢測算法的性能、優勢和局限性;最后總結了3D目標檢測的應用意義以及待解決的問題,并對 3D 目標檢測的發展方向和新的挑戰進行了討論和展望。