其中一項非常值得研究的工作,點云配準旨在將多個點云正確配準到同一個坐標系下,形成更完整的點云。點云配準要應對點云非結構化、不均勻、噪聲等的干擾,要以更短的時間消耗達到更高的精度,但是時間消耗和精度往往是矛盾的,但在一定程度上優化是有可能的。點云配準廣泛應用于三維重建、參數評估、定位和姿態估計等領域,在自動駕駛、機器人、增強現實等新興應用上也有點云配準技術的參與。為此研究者開發了多樣又巧妙的點云配準方法,本文梳理了一些比較有代表性的點云配準方法并進行分類總結,對比相關工作,盡量覆蓋點云配準的各種形式,并對一些方法的細節加以分析介紹。將現有方法歸納為非學習方法和基于學習的方法進行分析。非學習方法分為經典方法和基于特征的方法,基于學習的方法分為結合了非學習方法的部分學習方法和直接的端到端學習方法這兩類。分別介紹了各類方法的典型算法,對比總結算法特性,展望點云配準技術的未來研究方向。
//www.cjig.cn/jig/ch/reader/view_abstract.aspx?flag=2&file_no=2024&journal_id=jig
基于多尺度變換的像素級圖像融合是計算機視覺領域的研究熱點,廣泛應用于醫學圖像處理等領域。本文對多尺度變換的像素級圖像融合進行綜述,闡述多尺度變換圖像融合的基本原理和框架。在多尺度分解方面,以時間為序梳理了塔式分解、小波變換和多尺度幾何分析方法的發展歷程。在融合規則方面,圍繞Piella框架和Zhang框架,討論通用的像素級圖像融合框架;在低頻子帶融合規則方面,總結基于像素、區域、模糊理論、稀疏表示和聚焦測度的5種融合規則;在高頻子帶融合規則方面,綜述基于像素、邊緣、區域、稀疏表示和神經網絡的5種融合規則。總結12種跨模態醫學圖像融合方式,討論該領域面臨的主要挑戰,并對未來的發展方向進行展望。本文系統梳理了多尺度變換像素級圖像融合過程中的多尺度分解方法和融合規則,以及多尺度變換在醫學圖像融合中的應用,對多尺度變換像素級醫學圖像融合方法的研究具有積極的指導意義。
//www.cjig.cn/jig/ch/reader/view_abstract.aspx?file_no=20210904&flag=1
在疾病診斷、手術引導及放射性治療等圖像輔助診療場景中,將不同時間、不同模態或不同設備的圖像通過合理的空間變換進行配準是必要的處理流程之一。隨著深度學習的快速發展,基于深度學習的醫學圖像配準研究以其耗時短、精度高的優勢吸引了研究者的廣泛關注。本文全面整理了2015—2019年深度醫學圖像配準方向的論文,系統地分析了深度醫學圖像配準領域的最新研究進展,展現了深度配準算法研究從迭代優化到一步預測、從有監督學習到無監督學習的總體發展趨勢。具體來說,本文在界定深度醫學圖像配準問題和介紹配準研究分類方法的基礎上,以相關算法的網絡訓練過程中所使用的監督信息多少作為分類標準,將深度醫學圖像配準劃分為全監督、雙監督與弱監督、無監督醫學圖像配準方法。全監督配準方法通過采用隨機變換、傳統算法和模型生成等方式獲取近似的金標準作為監督信息;雙監督、無監督配準方法通過引入圖像相似度損失、標簽相似度損失等其他監督信息以降低對金標準的依賴;無監督配準方法則完全消除對標注數據的需要,僅使用圖像相似度損失和正則化損失監督網絡訓練。目前,無監督醫學圖像算法已經成為醫學圖像配準領域的研究重點,在無需獲得代價高昂的標注信息下就能夠取得與有監督和傳統方法相當甚至更高的配準精度。在此基礎上,本文進一步討論了醫學圖像配準研究后續可能的4個未來挑戰,希望能夠為更高精度、更高效率的深度醫學圖像配準算法的研究提供方向,并推動深度醫學圖像配準技術在臨床診療中落地應用。
//www.cjig.cn/jig/ch/reader/view_abstract.aspx?file_no=20210901&flag=1
隨著卷積神經網絡(Convolutional Neural Network,CNN)的不斷發展,目標檢測作為計算機視覺中最基本的技術,已取得了令人矚目的進展。介紹了強監督目標檢測算法對數據集標注精度要求高的現狀。對基于弱監督學習的目標檢測算法進行研究,按照不同的特征處理方法將該算法歸為四類,并分析比較了各類算法的優缺點。通過實驗比
較了各類基于弱監督學習的目標檢測算法的檢測精度,并將其與主流的強監督目標檢測算法進行了比較。展望了基于弱監督學習的目標檢測算法未來的研究熱點。
摘 要:小目標檢測長期以來是計算機視覺中的一個難點和研究熱點。在深度學習的驅動下,小目標 檢測已取得了重大突破,并成功應用于國防安全、智能交通和工業自動化等領域。為了進一步促進小 目標檢測的發展,本文對小目標檢測算法進行了全面的總結,并對已有算法進行了歸類、分析和比較。首先,對小目標進行了定義,并概述小目標檢測所面臨的挑戰。然后,重點闡述從數據增強、多尺度學 習、上下文學習、生成對抗學習以及無錨機制等方面來提升小目標檢測性能的方法,并分析了這些方法 的優缺點和關聯性。之后,全面介紹小目標數據集,并在一些常用的公共數據集上對已有算法進行了 性能評估。最后本文對小目標檢測技術的未來發展方向進行了展望。
圖像配準是醫學影像處理與智能分析領域中的重要環節和關鍵技術.傳統的圖像配準算法由于復雜性較高、計算代價較大等問題,無法實現配準的實時性要求.隨著深度學習方法的發展,基于學習的圖像配準方法也取得顯著效果.文中系統總結基于深度學習的醫學圖像配準方法.具體地,將方法歸為3類:監督學習,無監督學習和對偶監督/弱監督學習.在此基礎上,分析和討論各自優缺點.進一步,著重討論近年來提出的正則化方法,特別是基于微分同胚表示的正則和基于多尺度的正則.最后,根據當前醫學圖像配準方法的發展趨勢,展望基于深度學習的醫學圖像配準方法.
//manu46.magtech.com.cn/Jweb_prai/CN/abstract/abstract12159.shtml
在自動駕駛、機器人、數字城市、以及虛擬/混合現實等應用的驅動下,三維視覺在近年來得到了廣泛的關注。三維視覺研究主要圍繞深度圖像獲取、視覺定位與制圖、三維建模及三維理解等任務而展開。本文圍繞上述三維視覺任務,對國內外研究進展進行了詳細地綜合評述和對比分析。首先,針對深度圖像獲取任務,本文從非端到端立體匹配、端到端立體匹配及無監督立體匹配三個方面對立體匹配研究進展進行了回顧,從深度回歸網絡和深度補全網絡兩個方面對單目深度估計研究進展進行了回顧。其次,針對視覺定位與制圖任務,本文從端到端視覺定位和非端到端視覺定位兩個方面對大場景下的視覺定位研究進展進行了回顧,并從視覺同步定位與地圖構建和融合其它傳感器的同步定位與地圖構建兩個方面對同步定位與地圖構建的研究進展進行了回顧。再次,針對三維建模任務,本文從深度三維表征學習、深度三維生成模型、結構化表征學習與生成模型、以及基于深度學習的三維重建等四個方面對三維幾何建模研究進展進行了回顧,并從多視RGB重建、單深度相機和多深度相機方法、以及單視圖RGB方法等三個方面對人體動態建模研究進展進行了回顧。最后,針對三維理解任務,本文從點云語義分割和點云實例分割兩個方面對點云語義理解研究進展進行了回顧。在此基礎上,本文給出了三維視覺研究的未來發展趨勢,旨在為相關研究者提供參考。
//www.cjig.cn/jig/ch/reader/view_abstract.aspx?flag=2&file_no=2022&journal_id=jig
行人檢測技術在智能交通系統,智能安防監控等領域表現出了極高的應用價值,已經成為計算機視覺領域的重要研究方向之一。得益于深度學習的飛速發展,基于深度卷積神經網絡的通用目標檢測模型被不斷擴展應用到行人檢測領域,并取得了良好的性能。但是由于行人目標內在的特殊性、復雜性,特別是考慮到復雜場景下的行人遮擋、尺度變化等問題,深度學習方法也面臨著嚴峻的挑戰。本文針對上述問題,以基于深度學習的行人檢測技術為研究對象,在充分調研文獻的基礎上,分別從基于錨點框、基于無錨點框以及通用技術改進(例如損失函數,非極大值抑制等)三個角度,對各類行人檢測算法進行細分,并選取具有代表性的方法進行詳細介紹和對比分析。此外,本文對行人檢測的通用數據集進行了詳細的介紹,對該領域先進算法的性能進行了對比分析,對行人檢測中待解決的問題與未來的研究方向做出預測和展望。
//www.cjig.cn/jig/ch/reader/view_abstract.aspx?flag=2&file_no=2020&journal_id=jig
數據作為深度學習的驅動力,對于模型的訓練至關重要。充足的訓練數據不僅可以緩解模型在訓練時的過擬合問題,而且可以進一步擴大參數搜索空間,幫助模型進一步朝著全局最優解優化。然而,在許多領域或任務中,獲取到充足訓練樣本的難度和代價非常高。因此,數據增廣成為一種常用的增加訓練樣本的手段。本文對目前深度學習中的圖像數據增廣方法進行研究綜述,梳理了目前深度學習領域為緩解模型過擬合問題而提出的各類數據增廣方法,按照方法本質原理的不同,將其分為單數據變形、多數據混合、學習數據分布和學習增廣策略等4類方法,并以圖像數據為主要研究對象,對各類算法進一步按照核心思想進行細分,并對方法的原理、適用場景和優缺點進行比較和分析,幫助研究者根據數據的特點選用合適的數據增廣方法,為后續國內外研究者應用和發展研究數據增廣方法提供基礎。針對圖像的數據增廣方法,單數據變形方法主要可以分為幾何變換、色域變換、清晰度變換、噪聲注入和局部擦除等5種;多數據混合可按照圖像維度的混合和特征空間下的混合進行劃分;學習數據分布的方法主要基于生成對抗網絡和圖像風格遷移的應用進行劃分;學習增廣策略的典型方法則可以按照基于元學習和基于強化學習進行分類。目前,數據增廣已然成為推進深度學習在各領域應用的一項重要技術,可以很有效地緩解訓練數據不足帶來的深度學習模型過擬合的問題,進一步提高模型的精度。在實際應用中可根據數據和任務的特點選擇和組合最合適的方法,形成一套有效的數據增廣方案,進而為深度學習方法的應用提供更強的動力。在未來,根據數據和任務基于強化學習探索最優的組合策略,基于元學習自適應地學習最優數據變形和混合方式,基于生成對抗網絡進一步擬合真實數據分布以采樣高質量的未知數據,基于風格遷移探索多模態數據互相轉換的應用,這些研究方向十分值得探索并且具有廣闊的發展前景。
對流體圖像序列進行運動分析一直是流體力學、醫學和計算機視覺等領域的重要研究課題。從圖像對中提取的密集精確的速度矢量場能夠為許多領域提供有價值的信息,基于光流法的流體運動估計技術因其獨特的優勢成為一個有前途的方向。光流法可以獲得具有較高分辨率的密集速度矢量場,在小尺度精細結構的測量上有所改進,彌補了基于相關分析法的粒子圖像測速技術的不足。此外,光流方法還可以方便的引入各種物理約束,獲得較為符合流體運動特性的運動估計結果。為了全面反映基于光流法的流體運動估計算法的研究進展,本文在廣泛調研相關文獻的基礎上,對國內外具有代表性的論文進行了系統闡述。首先介紹了光流法的基本原理,然后將現有算法按照要解決的突出問題進行分類:結合流體力學知識的能量最小化函數,提高對光照變化的魯棒性,大位移估計和消除異常值。對每類方法,從問題解決過程的角度予以介紹,分析了各類突出問題中現有算法的特點和局限性。最后,總結分析了流體運動估計技術當前面臨的問題和挑戰,并對未來基于光流法的運動估計算法的研究方向和研究重點進行了展望。
//www.cjig.cn/jig/ch/reader/view_abstract.aspx?file_no=20210209&flag=1
在計算機視覺領域中,語義分割是場景解析和行為識別的關鍵任務,基于深度卷積神經網絡的圖像語義分割方法已經取得突破性進展。語義分割的任務是對圖像中的每一個像素分配所屬的類別標簽,屬于像素級的圖像理解。目標檢測僅定位目標的邊界框,而語義分割需要分割出圖像中的目標。本文首先分析和描述了語義分割領域存在的困難和挑戰,介紹了語義分割算法性能評價的常用數據集和客觀評測指標。然后,歸納和總結了現階段主流的基于深度卷積神經網絡的圖像語義分割方法的國內外研究現狀,依據網絡訓練是否需要像素級的標注圖像,將現有方法分為基于監督學習的語義分割和基于弱監督學習的語義分割兩類,詳細闡述并分析這兩類方法各自的優勢和不足。本文在PASCAL VOC(pattern analysis, statistical modelling and computational learning visual object classes)2012數據集上比較了部分監督學習和弱監督學習的語義分割模型,并給出了監督學習模型和弱監督學習模型中的最優方法,以及對應的MIoU(mean intersection-over-union)。最后,指出了圖像語義分割領域未來可能的熱點方向。
//www.cjig.cn/jig/ch/reader/view_abstract.aspx?file_no=20200601&flag=1