醫學影像是醫療健康中的重要工具,放射科醫生經過高度培訓,能夠在醫學圖像中檢測和描述疾病。然而,僅依賴人類的分析有其局限性:它可能耗時、變化大且難以擴展。自動化部分醫學圖像分析流程可以克服這些局限性,以支持和擴展臨床醫生和放射科醫生的能力。在本文中,我們將重點研究深度學習在自動化醫學圖像分析中可能起到的轉變性角色。我們將分割視為基于深度學習的圖像分析的關鍵工具,并展示了如何在沒有大量手動注釋訓練數據集的情況下,分割神經網絡可以在許多醫學圖像分析任務上實現高性能。
我們首先描述了兩種在標簽數據有限的情況下訓練醫學圖像分割神經網絡的方法。在我們的第一種方法中,我們將弱監督適應于分割。在我們的第二種方法中,我們將數據增強、一致性正則化和偽標簽融合在一個統一的半監督流程中。這些方法將多種有限標簽訓練方法融入到同一框架中,利用每種方法的優點實現高性能,同時保持標簽負擔低。接下來,我們評估了在多機構、多掃描儀、多疾病數據集上使用有限標簽數據訓練的網絡在臨床相關指標上的表現。我們發現,我們的半監督網絡在某些泛化任務上比全監督網絡(訓練數據標簽多100倍以上)表現更好,與人類注釋者的一致性更強。然而,我們發現了標簽效率方法表現不佳的數據子集。我們提出了一種針對我們半監督流程的主動學習擴展,以解決這些錯誤模式,使困難數據切片上的半監督性能提高18.5%。通過這種評估,我們了解了如何使用有限標簽數據訓練的網絡在臨床任務上的表現,它們與使用豐富標簽數據訓練的網絡的比較,以及如何減輕錯誤模式。
最后,我們將標簽高效的分割模型應用到更廣泛的醫學圖像分析任務中。具體來說,我們展示了分割如何以及為什么可以使醫學圖像分類受益。我們首先分析了為什么在同一數據集和任務上,分割模型和分類模型可能達到不同的性能。然后,我們實現了使用分割模型對醫學圖像進行分類的方法,我們稱之為"以分割為分類",并將這些方法與三個回顧性數據集上的傳統分類進行比較。最后,我們利用我們的分析和實驗總結了與標準分類相比,使用"以分割為分類"的優點,包括:改善樣本效率,能夠在標簽圖像更少的情況下(少一個數量級)提高性能,在低發病率類別和某些罕見子組中(最高提高161.1%的召回率);提高對假相關的魯棒性(最高提高44.8%的魯棒AUROC);以及提高模型的可解釋性,評估和錯誤分析。這些結果表明,利用分割模型可以在常見設置中導致更高質量的醫學圖像分類器。總的來說,本文聚焦于將分割作為支持自動化醫學圖像分析的關鍵工具,并展示了如何訓練分割網絡,在沒有大量標簽負擔的情況下,在許多圖像分析任務上實現高性能。
盡管深度學習方法在提高醫學圖像分割的最新水平準確性方面取得了近期的成功,但一些主要的限制仍然限制了它們在診所中的應用。深度學習基礎分割方法的一個主要限制是它們對圖像采集協議和在訓練數據集中未被代表或者代表不足的成像解剖的變化的魯棒性不足。這意味著需要向訓練數據集中添加新的手動分割圖像以更好地覆蓋圖像的變化。然而,在大多數情況下,醫學圖像的手動分割需要高技能的評估者并且耗時,使得這種解決方案的成本過高。即使從不同來源可獲得手動分割的圖像,它們也很少針對完全相同的感興趣區域進行注釋。這對當前依賴于監督學習的最新深度學習分割方法構成了額外的挑戰,因為它們需要所有的感興趣區域對所有用于訓練的圖像進行分割。本論文引入了新的數學和優化方法來減輕這些限制。我們的貢獻有三個方面。我們引入了標簽集損失函數的數學框架。這是一個無限大的損失函數家族,可用于訓練使用部分注釋的圖像的深度神經網絡,也就是對一些但不一定是所有的感興趣區域進行了分割的圖像,或者是對一些感興趣區域的分割進行了分組的圖像。我們提出了一種將任何現有的損失函數轉換為標簽集損失函數的方法,此外,我們還提出了一種新的標簽集損失函數,我們發現它能提高分割的準確性。
我們引入了一種使用分布魯棒優化(DRO)訓練深度神經網絡的優化算法。我們建議使用DRO來改善在訓練數據集中代表不足的人群上訓練后的深度神經網絡的泛化能力。當應用于深度神經網絡時,我們正式證明了算法的收斂性。我們還對DRO和最壞情況性能最大化之間的聯系給出了數學洞見。我們基于Dempster-Shaffer理論提出了一種可靠的深度學習醫學圖像分割方法。可靠的AI是一個在社會學中越來越多地被討論的概念,在安全部署深度學習等新興技術的指南中也有涉及。我們提出了第一個具體的可靠AI醫學圖像分割的數學框架和實現。我們的方法旨在使深度學習分割算法根據專家知識衍生出來的標準(稱為信任契約)而變得可靠,這些標準符合放射科專家在手頭的分割任務中的期望。我們通過對幾個以胎兒大腦3D T2w MRI分割為重點的分割任務進行說明和評估,提出了這些方法。胎兒大腦MRI的分割對于研究正常和異常的胎兒大腦發育至關重要。可靠的分析和評估胎兒大腦結構也可能支持中樞神經系統病理診斷,胎兒手術的患者選擇,結果的評估和預測,因此也有助于對父母進行咨詢。胎兒大腦3D T2w MRI分割呈現多種挑戰,這些挑戰與本論文旨在減輕的當前深度學習算法的限制相一致。手動分割的胎兒大腦3D T2w MRI是稀缺的,他們的注釋水平也有所不同。臨床中心之間使用的T2w MRI協議存在變化。最后但并非最不重要的,胎兒大腦解剖在孕齡和正常與異常的胎兒大腦解剖之間存在驚人的變化。
深度學習的發展導致了在各種應用領域的各種任務上的顯著性能提升,這些應用領域包括計算機視覺、自然語言處理、強化學習、生成模型,以及最近從圖結構數據中進行的關系學習。這一成功的主要原因是計算能力的提高,這允許深度和高度參數化的神經網絡架構,這些架構可以從原始數據中學習復雜的特征轉換。然而,深度神經網絡的高表示能力往往是以高模型復雜度為代價的,這指的是高參數化,以及與深度學習相關的內存和計算負擔。**在本文中,我依靠參數有效的神經算子,對數據的適當建模假設和網絡結構的歸納偏差,在幾個應用領域提出更簡單的神經網絡模型。**對于我工作的每個應用領域,我使用這些效率原則的組合來設計新穎的方法。首先,在醫學圖像處理的背景下,我觀察到空間對齊的神經圖像比自然圖像表現出更少的自由度,這證明使用低容量卷積算子是合理的。我通過應用參數高效的卷積變體來實現這一點。我展示了早期阿爾茨海默病預測的最先進結果,同時使用的參數減少了多達125倍,乘累加操作減少了17倍以上。對于設計用于識別受試者亞型的神經圖像的無監督方法也得出了類似的結論。其次,我著手緩解從零開始訓練參數高效的深度模型的挑戰。這可以減少在資源受限的"邊緣"設備上訓練深度模型的不可行性。所提方法基于一個簡化的網絡結構假設,即參數無關性,允許在組合多臂匪徒的背景下建模問題。該方法可以動態地,即在訓練期間,在遵循預定義的內存使用預算的同時,在超參數化模型中識別高性能緊湊的子網絡。這是通過將顯著性指標與每個神經元相關聯來實現的,然后用于驅動參數激活,類似于門控機制,同時學習參數。因此,深度神經網絡訓練和推理過程中的計算和內存負擔都顯著減少。最后,提出一種深度概率模型,用于學習動態圖中的無監督節點和社區嵌入。基于網絡固有的社團結構,引入了關于邊形成機制的結構歸納偏差。此外,我還假設節點和社區都是平滑的時間演化,其靈感來自于數據中缺乏破壞性事件。本文提出一種該方法的參數高效實現,在各種動態預測任務上優于最先進的圖卷積網絡。
抽象知識深植根于許多基于計算機的應用中。人工智能(AI)的一個重要研究領域是從數據中自動推導知識。機器學習提供了相應的算法。其中一個研究領域是生物啟發學習算法的開發。各自的機器學習方法都是基于神經學概念,因此它們可以系統地從數據中獲取知識并存儲它。一種可以歸類為深度學習模型的機器學習算法被稱為深度神經網絡(DNNs)。DNN由多層排列的多個人工神經元組成,通過反向傳播算法進行訓練。這些深度學習方法在從高維數據推斷和存儲復雜知識方面表現出驚人的能力。
然而,DNN會受到一個問題的影響,即無法將新知識添加到現有的知識庫中。不斷積累知識的能力是促進進化的重要因素,因此是發展強大人工智能的先決條件。所謂的“災難性遺忘”(CF)效應導致DNN在對新數據分布進行幾次訓練迭代后,立即失去已經派生的知識。只有用過去和新數據的聯合數據分布進行昂貴的再訓練,才能抽象出整個新知識集。為了抵消這種影響,各種旨在緩解甚至解決CF問題的技術已經并且仍在開發中。這些已發表的CF回避研究通常暗示他們的方法對各種持續學習任務的有效性。
本文的研究背景是基于深度學習方法的持續機器學習。第一部分是面向實際應用的評估協議的開發,該協議可以用于研究不同的機器學習模型對協同效應的抑制。在第二部分,綜合研究表明,在面向應用的需求下,所研究的模型都不能表現出令人滿意的持續學習效果。第三部分提出了一種新的深度學習模型——深度卷積高斯混合模型(deep Convolutional Gaussian Mixture Models, DCGMMs)。DCGMMs建立在無監督高斯混合模型(GMMs)的基礎上。gmm不能被認為是深度學習方法,它必須在訓練前以數據驅動的方式進行初始化。這些方面限制了gmm在持續學習場景中的使用。本文提出的訓練過程使使用隨機梯度下降(SGD)(應用于dnn)來訓練GMMs成為可能。集成退火方案解決了數據驅動的初始化問題,這是GMM訓練的先決條件。實驗證明,新的訓練方法在不迭代其缺點的情況下,可以得到與傳統方法相當的結果。另一個創新是GMM以層的形式排列,這類似于DNN。將GMM轉換為層使其能夠與現有層類型相結合,從而構建深層體系結構,從而可以用較少的資源派生出更復雜的知識。
在本工作的最后一部分,研究DCGMM模型的持續學習能力。為此,提出一種稱為高斯混合重放(GMR)的重放方法。GMR利用DCGMM的功能來描述數據樣本的生成和重現。與現有CF回避模型的比較表明,在面向應用的條件下,GMR可以取得類似的持續學習效果。總之,所提出的工作表明,確定的面向應用的需求仍然是“應用”持續學習研究方法的開放問題。此外,新的深度學習模型為許多其他研究領域提供了一個有趣的起點。
深度學習算法,比如那些用于圖像識別的算法,在自動化醫療診斷和指導臨床決策方面大有前途。與此同時,醫學深度學習系統的開發和臨床轉化還面臨著一些重要的挑戰。首先,開發大型且注釋良好的數據集成本很高。其次,醫學圖像判讀有必要識別病灶的微妙關鍵特征,盡管在人群中生理外觀有很大差異。第三,由于域轉移問題,將深度學習算法的性能從一種設置轉移到另一種設置具有挑戰性。第四,深度學習系統的輸出需要是可解釋的,以便臨床醫生能夠理解系統。本文研究了如何應對這些挑戰,從小型數據集構建可泛化和可解釋的深度學習模型。本文研究了將從非醫療源ImageNet學習到的先驗知識遷移到醫療應用對模型性能的影響,特別是當數據集大小不夠時。與直接從ImageNet轉移學習不同,GrayNet被提議作為一個橋梁數據集,在從ImageNet學習到的通用圖像特征上創建一個預先訓練的豐富醫學圖像表示的模型。分析了GrayNet的優點,包括總體性能和跨不同成像掃描儀的泛化,并與使用小數據從頭開始訓練和從ImageNet轉移學習進行了比較。受放射科醫生如何解釋診斷圖像的啟發,還介紹了特定領域的技術,包括窗口設置優化和切片插值,并展示了進一步增強模型性能的方法。引入了一個新的可視化模塊,能夠在訓練過程中生成一個圖像圖譜,并將其顯示為測試過程中所做的模型預測的基礎,以證明模型預測的合理性,并使臨床醫生更容易理解它們。本論文通過三種不同的應用展示了深度學習在醫學圖像判讀方面的潛力,包括人工智能輔助骨齡評估,以提高人類的準確性和可變性,發現以前未識別的模式,在手部x光片中進行骨性別分類,以及處理原始計算機斷層掃描數據,而不需要圖像重建。本論文的貢獻有望促進各種醫療應用中可推廣和可解釋的深度學習算法的發展,從而加速人工智能系統進入臨床實踐。
在本文中,我們的目標是改進深度強化學習中的泛化。對任何類型的學習來說,泛化都是一項基本挑戰,它決定了如何將已獲得的知識轉移到新的、以前從未見過的情況中。本文專注于強化學習,這是一個描述人工智能體如何學習與環境交互以實現目標的框架。近年來,利用神經網絡表示智能體取得了顯著的成功,并極大地擴展了其可能的應用范圍。本文的目標是通過允許這些智能體更快地學習,學習更好的解決方案,并對以前未見過的情況做出魯棒的反應,從而提高它們的性能。在這個探索中,我們探索了一系列不同的方法和途徑。我們專注于將額外的結構,也稱為歸納偏差,納入主體。專注于特定的,但廣泛適用的問題領域,我們可以開發專門的架構,從而大大提高性能。在第3章中,我們關注的是部分可觀察環境,在這種環境中,智能體每時每刻都不能完全訪問所有與任務相關的信息。在第4章中,我們將注意力轉向多任務和遷移學習,并設計了一種新的訓練方法,允許訓練分層結構的智能體。我們的方法優化了單個解決方案的可重用性,大大提高了傳輸設置中的性能。
//ora.ox.ac.uk/objects/uuid:9fdfadb0-e527-4421-9a22-8466c9fed9c8 在本文的第二部分中,我們將注意力轉向正則化,這是另一種形式的歸納偏差,作為提高深度智能體泛化的方法。在第五章中,我們首先探討了強化學習(RL)中的隨機正則化。雖然這些技術已被證明在監督學習中非常有效,但我們強調并克服了將它們直接應用到在線RL算法中的困難,這是RL中最強大和應用最廣泛的學習類型之一。在第6章中,我們通過探索訓練數據中的瞬態非平穩性如何干擾神經網絡的隨機梯度訓練,并使其偏向較差的解,在更基本的水平上研究了深度rl中的泛化。許多先進的RL算法將這些類型的非平穩性引入到訓練中,甚至在平穩環境中,通過使用持續改進的數據收集策略。我們提出了一個新的框架,以減少經過訓練的策略所經歷的非平穩性,從而允許改進的泛化。
在過去的幾年中,深度學習和醫學的交叉領域取得了快速的發展,特別是在醫學圖像的解譯方面。在本文中,我描述了三個關鍵方向,為醫學圖像解釋的深度學習技術的發展提出了挑戰和機遇。首先,我討論了專家級醫學圖像解譯算法的發展,重點是用于低標記醫學數據設置的遷移學習和自監督學習算法。其次,我討論了高質量數據集的設計和管理以及它們在推進算法發展中的作用,重點是使用有限的手動注釋的高質量標記。第三,我討論了真實世界的評估醫學圖像算法的研究,系統地分析了在臨床相關分布變化下的性能。總之,這篇論文總結了關鍵貢獻和見解,在這些方向與關鍵應用跨醫學專業。