人工智能技術在醫學影像領域的應用是醫學研究的熱點之一。然而,這一領域最近的成功主要依賴于大量仔細注釋的數據,而對醫學圖像進行注釋是一個昂貴的過程。在本文中,我們提出了一種新的方法,稱為FocalMix,據我們所知,這是第一個利用半監督學習(SSL)的最新進展來進行3D醫學圖像檢測的方法。我們對兩個廣泛應用的肺結節檢測數據集LUNA16和NLST進行了廣泛的實驗。結果表明,與最先進的監督學習方法相比,我們提出的SSL方法可以通過400個未標記的CT掃描實現高達17.3%的實質性改進。
小樣本學習(FSL)近年來引起了越來越多的關注,但仍然具有挑戰性,因為學習從少數例子中歸納的固有困難。本文提出了一種自適應間隔原則,以提高基于度量的元學習方法在小樣本學習問題中的泛化能力。具體地說,我們首先開發了一個與類相關的加性邊緣損失算法,該算法考慮了每對類之間的語義相似性,從而將特征嵌入空間中的樣本從相似的類中分離出來。此外,我們在抽樣訓練任務中加入所有類別之間的語義上下文,并開發了與任務相關的附加間隔損失,以更好地區分不同類別的樣本。我們的自適應間隔方法可以很容易地推廣到更現實的廣義FSL設置。大量的實驗表明,在標準FSL和通用FSL設置下,所提出的方法可以提高現有基于度量的元學習方法的性能。
領域適應(DA)提供了重用數據和模型用于新問題領域的有價值的方法。然而,對于具有不同數據可用性的時間序列數據,還沒有考慮到健壯的技術。在本文中,我們做出了三個主要貢獻來填補這一空白。我們提出了一種新的時間序列數據卷積深度域自適應模型(CoDATS),該模型在現實傳感器數據基準上顯著提高了最先進的DA策略的準確性和訓練時間。通過利用來自多個源域的數據,我們增加了CoDATS的有用性,從而進一步提高了與以前的單源方法相比的準確性,特別是在域之間具有高度可變性的復雜時間序列數據集上。其次,我們提出了一種新的弱監督域自適應(DA-WS)方法,利用目標域標簽分布形式的弱監督,這可能比其他數據標簽更容易收集。第三,我們對不同的真實數據集進行了綜合實驗,以評估我們的域適應和弱監督方法的有效性。結果表明,用于單源DA的CoDATS比最先進的方法有了顯著的改進,并且我們使用來自多個源域和弱監督信號的數據實現了額外的準確性改進。
摘要: 目標檢測算法應用廣泛,一直是計算機視覺領域備受關注的研究熱點。近年來,隨著深度學習的發展,3D圖像的目標檢測研究取得了巨大的突破。與2D目標檢測相比,3D目標檢測結合了深度信息,能夠提供目標的位置、方向和大小等空間場景信息,在自動駕駛和機器人領域發展迅速。文中首先對基于深度學習的2D目標檢測算法進行概述;其次根據圖像、激光雷達、多傳感器等不同數據采集方式,分析目前具有代表性和開創性的3D目標檢測算法;結合自動駕駛的應用場景,對比分析不同 3D 目標檢測算法的性能、優勢和局限性;最后總結了3D目標檢測的應用意義以及待解決的問題,并對 3D 目標檢測的發展方向和新的挑戰進行了討論和展望。
基于學習的圖匹配方法已經發展和探索了十多年,最近在范圍和受歡迎程度方面迅速增長。然而,以往的基于學習的算法,無論有沒有深度學習策略,都主要關注節點和/或邊緣親和力生成的學習,而對組合求解器的學習關注較少。在這篇論文中,我們提出了一個完全可訓練的圖匹配框架,在這個框架中,親和的學習和組合優化的求解不像以前的許多技術那樣被明確地分開。首先將兩個輸入圖之間的節點對應問題轉化為從一個構造的賦值圖中選擇可靠節點的問題。然后,利用圖網絡塊模塊對圖進行計算,形成每個節點的結構化表示。最后對每個節點預測一個用于節點分類的標簽,并在正則化的排列差異和一對一匹配約束下進行訓練。該方法在四個公共基準上進行了評估,并與最先進的算法進行了比較,實驗結果表明了該方法的良好性能。
隨著機器學習、圖形處理技術和醫學成像數據的迅速發展,機器學習模型在醫學領域的使用也迅速增加。基于卷積神經網絡(CNN)架構的快速發展加劇了這一問題,醫學成像社區采用這種架構來幫助臨床醫生進行疾病診斷。自2012年AlexNet取得巨大成功以來,CNNs越來越多地被用于醫學圖像分析,以提高臨床醫生的工作效率。近年來,三維(3D) CNNs已被用于醫學圖像分析。在這篇文章中,我們追溯了3D CNN的發展歷史,從它的機器學習的根源,簡單的數學描述3D CNN和醫學圖像在輸入到3D CNNs之前的預處理步驟。我們回顧了在不同醫學領域,如分類、分割、檢測和定位,使用三維CNNs(及其變體)進行三維醫學成像分析的重要研究。最后,我們討論了在醫學成像領域使用3D CNNs的挑戰(以及使用深度學習模型)和該領域可能的未來趨勢。
題目: Self-Supervised Viewpoint Learning From Image Collections
簡介:
訓練深度神經網絡以估計對象的視點需要標記大型訓練數據集。但是,手動標記視點非常困難,容易出錯且耗時。另一方面,從互聯網(例如汽車或人臉)上挖掘許多未分類的物體類別圖像相對容易。我們試圖回答這樣的研究問題:是否可以僅通過自我監督將這種未標記的野外圖像集合成功地用于訓練一般對象類別的視點估計網絡。這里的自我監督是指網絡具有的唯一真正的監督信號是輸入圖像本身。我們提出了一種新穎的學習框架,該框架結合了“綜合分析”范式,利用生成網絡以視點感知的方式重構圖像,并具有對稱性和對抗性約束,以成功地監督我們的視點估計網絡。我們表明,對于人臉,汽車,公共汽車和火車等幾個對象類別,我們的方法在完全監督方法上具有競爭性。我們的工作為自我監督的觀點學習開辟了進一步的研究,并為其提供了堅實的基礎。
主題: Learning Video Object Segmentation from Unlabeled Videos
摘要:
我們提出了一種新的視頻對象分割方法(VOS),解決了從未標記的視頻中學習對象模式的問題,而現有的方法大多依賴于大量的帶注釋的數據。我們引入了一個統一的無監督/弱監督學習框架,稱為MuG,它全面地捕捉了VOS在多個粒度上的內在特性。我們的方法可以幫助提高對VOS中可視模式的理解,并顯著減少注釋負擔。經過精心設計的體系結構和強大的表示學習能力,我們的學習模型可以應用于各種VOS設置,包括對象級零鏡頭VOS、實例級零鏡頭VOS和單鏡頭VOS。實驗表明,在這些設置下,有良好的性能,以及利用無標記數據進一步提高分割精度的潛力。
半監督學習介于傳統監督學習和無監督學習之間,是一種新型機器學習方法,其思想是在標記樣本數量很少的情況下,通過在模型訓練中引入無標記樣本來 避免傳統監督學習在訓練樣本不足(學習不充分)時出現性能(或模型)退化的問 題。上海交通大學屠恩美和楊杰老師撰寫了一篇關于《半監督學習理論及其研究進展概述》論文,詳細闡述了最新回顧了半監督學習的發展歷程和主要理 論,并介紹了半監督學習研究的最新進展,最后結合應用實例分析了半監督學習在 解決實際問題中的重要作用。