亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

約翰霍普金斯大學(JHU)與羅切斯特大學合作,致力于研究和開發分析技術,以支持一個更大的知識驅動的假設測試框架。該計劃的參與者負責合作開發一個數據處理框架,該框架從原始的非結構化內容(文本、圖像、帶有音頻的視頻)開始,將這些內容轉換為共享本體下的知識聲明,將各信息源的結果合并為一個知識圖譜,然后對該圖譜進行推理,提出可以從直接觀察到的內容中獲得的額外信息。我們,JHU的團隊,專注于這個過程的第一步。我們提出了一個框架,可以處理所有需要的輸入模式,但被選擇專注于多語言文本和語音(沒有計算機視覺)。我們作為一個獨立的團隊參與了該計劃的初始階段,提供分析結果作為NIST運行的全計劃評估的一部分。在第二階段,我們提供了較少的組件,只專注于文本。在項目評估期間,我們與BBN共享這些組件。在第三階段,我們的主要重點是在新提出的 "聲稱框架(claim frame) "任務下的數據注釋,這鍛煉了我們在眾包豐富語言注釋方面的背景。

我們提出了對語義分割的關注:對意義的細粒度多值化處理。由于該項目的共同目標和集中在一個單一的項目范圍內的本體,我們專注于針對共同任務的新的最先進的語言分析技術,以及針對項目本體之外的方面的新的分解性資源的開發。我們團隊的成果中值得注意的例子包括: 構建RAMs,這是第一個公開可用的多句子事件提取數據集;開發最先進的多語言核心推理模型,包括以固定內存量處理長文件的在線變體,以及專注于多人對話的新多語言數據集; 一個新的有監督的跨語言對齊方法,支持通過從英語到資源較少的語言的投射來自動創建訓練數據;一個句子級的轉述和數據增強的框架;在 "探測 "神經語言模型的新興科學方面的合作;以及開發新的分解資源和跨越一些新語言維度的分析。

引言

在過去的十年里,語言分析的技術水平已經迅速提高。DARPA AIDA發生時,文本分析的神經模型在準確性方面正在迅速突破。這始于對之前的統計NLP管道的改進,然后分析開始被訓練成 "端到端":模型不再需要部分語音標記、同步語法分析等等,以支持整體的語言理解過程。相反,模型直接在目標輸出上進行訓練,并假定在預訓練的語言模型的參數中捕獲足夠的語言特征。AIDA結束時,社區開始考慮方法上的另一個進步,即通過像GPT3這樣的大規模語言模型(LMs)的語境學習(提示-黑客),以及對生成性LMs的普遍關注。

JHU和合作伙伴羅切斯特大學對信息提取的神經模型的技術水平做出了貢獻,同時也對探測大型語言模型的新科學做出了貢獻。模型的新科學。利用我們在分解語義學的數據集創建方面的專長,開發了專門針對信息提取的新數據集。新的數據集,專門針對AIDA計劃的提取問題(特別是在事件提取和核心推理方面)。我們開發了分解語義學的新資源,在項目的最后階段,我們致力于新的倡議 了解如何對文本中的事實主張(所謂的 "主張框架")進行注釋。

在項目評估方面,我們努力滿足NIST及其合作伙伴不斷變化的要求。我們發現,在我們所關注的部分,特別是在多語種核心參考文獻的解決方面,我們經常具有競爭力,甚至優于其他執行者。由于管道要求和知識驅動的工作流程是在項目進行過程中臨時制定的,所以大家都認為在不同的執行者之間進行協調是不容易的,特別是在評估前后的時間敏感的情況下。不幸的是,這導致JHU對管道的貢獻往往是有限的:強大的分析組件并不總是在更大的原型框架中得到充分鍛煉。與正式的評估分開,我們建立了一個獨立的分析框架,并將其開源,重新發布給社區。這個 "LOME "包(大型本體多語言提取)在AIDA計劃之外的相關應用中被采用,并以該計劃所設想的任務需求為目標。我們在AIDA中的努力部分地導致了對其他相關項目的參與,包括DARPA KAIROS和IARPA BETTER,所有這些項目的主要重點都是增強語言技術的發展。

在下文中,我們將重點介紹我們在參與AIDA項目過程中出現的關鍵方法和結果。在有參考資料的地方,我們審查了提供進一步細節的科學文章。正如我們在總結中所說,我們的成果中值得注意的例子包括: 構建了RAMS,這是第一個公開可用的多句子事件提取數據集;開發了最先進的多語言核心推理模型,包括一個用固定內存處理長文檔的在線變體,以及一個專注于多人對話的新的多語言數據集; 一個新的有監督的跨語言對齊方法,支持通過從英語到資源較少的語言的投射來自動創建訓練數據;一個句子級的轉述和數據增強的框架;在 "探測 "神經語言模型的新興科學方面的合作;以及開發新的分解資源和跨越一些新的語言層面的分析。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

圖1:GAN Turk假標簽和GAN Turk合成系統圖

這份最終報告記錄了在DARPA的“少標簽學習” (LwLL)項目過程中進行的一系列調查。專注于圖像分類的領域適應和目標檢測的地理空間應用。探索了生成建模技術,包括新穎的GAN Turk方法,以及主動學習,以減少圖像分類的標簽要求。還研究了使用GAN Turk、一致性正則化和自我訓練來進行地理空間數據集的目標檢測。發現:

  • 使用生成模型來進行圖像翻譯的領域適應性對領域配對和生成對抗網絡(GAN)模型訓練的不穩定性很敏感
  • 理想的主動學習方法很難預先選擇,而且不同數據集的選擇也不同
  • 自我訓練和一致性正則化是半監督學習的一對有希望的技術。

評估了幾種用于圖像分類和物體檢測的生成式建模技術。評估了CycleGAN、CUT和我們自己的GAN Turk方法的兩次迭代,該方法受到CycleGAN的啟發。

作為第一年評估的一部分,還考慮了主動學習,并提交了一個coreset主動學習組件作為評估的一部分。coreset方法是在與基于熵的選擇方法和其他抽樣方法進行比較后選擇的,除了其以特征距離為動機的設計外,還基于公開和內部結果。然而,內部結果和評估結果顯示它不是一個可靠的方法。

自我訓練和一致性正則化的結合是在這個項目中研究的最有希望的方法。研究了STAC方法作為第三年評估的目標檢測系統。內部結果顯示,這兩種技術的結合可以用于合成到真實領域的適應性,也可以更普遍地用于地理空間應用。此外,還表明,在地理空間數據集中,為一致性正則化而對空圖像進行偽標簽的做法對STAC產生了好處。在第三年的評估中,假標簽空圖像的顯著優勢未能得到測試,因為這些數據集不包含任何圖像,即所有的圖像至少包含一個感興趣的目標。

作為項目要求的一部分,參加了年度獨立的第三方評估,并在第3.6至3.8節中記錄了這些結果。在評估過程中,主要挑戰之一是計算預算。提交的GAN Turk和STAC系統需要比基線方法多得多的計算。因此,這些方法學在每個評估任務中只提交了幾個檢查點。

在第4節中,記錄了我們的軟件可交付成果,并對軟件架構進行了簡要概述。還提供了Docker鏡像的配置,以打包系統進行評估。

總的來說,團隊為政府的知識庫做出了貢獻,即哪些方法對少許標簽的學習有希望,哪些沒有。這種探索是使用合理的科學方法和精心控制的實驗進行的,旨在對各種方法進行無偏見的評估。本報告總結了在整個LwLL計劃中的主要發現,并強調了認為有希望的幾個領域,以及根據我們在這個基礎研究計劃中收集到的證據,不建議追求的其他領域。

付費5元查看完整內容

由CMU和USC/ISI聯合開發的OPERA系統(面向運行的概率提取、推理和分析)是針對DARPA的“對不同方案的主動解釋”(AIDA)計劃的綜合解決方案,其形式是:(i) 針對文本、語音和圖像/視頻數據的高性能媒體分析(TA1),(ii) 語義表示和推理支持(TA1和TA2),(iii) 跨媒介和跨語言整合(TA2),和(iv) 假設創建、管理和假設探索(TA3)。鑒于這樣一個系統的所有必要組成部分仍然是活躍的研究領域,創建一個單一的系統(流水線或其他方式)有可能出現大量的復合錯誤率。早期創建的系統版本有很強的抽象邊界,用于系統之間有限的信息共享。后來的化身得益于允許提取器的輸出與原始文本字符串和嵌入向量相耦合。在存在編碼世界知識的大規模語言模型的情況下,以及在將預測與開放領域的本體(如WikiData)相一致時,這些證明是特別有利的。

DARPA的“對不同方案的主動解釋”(AIDA)計劃的目標是開發一個多假設語義引擎,它可以從各種非結構化的來源產生對事件、情況和趨勢的明確的替代解釋。這些事件可能是自然災害或國際沖突,在這些事件中,分析人員往往很快就會被大量嘈雜、沖突和可能具有欺騙性的信息所淹沒,這使得他們很難理解什么是相關的以及如何做出適當的反應。AIDA引擎必須能夠從多種語言和媒體來源中自動提取知識元素,匯總來自這些來源的信息,并生成和探索關于正在發生的事件的多種備選假設,然后可以呈現給用戶(如情報分析員)并由其進行互動探索。

CMU在這次合作中的作用集中在TA1和TA2上--創建文件間和文件內或模式表示。

  • 文件內 在單個文件內,系統必須對實體、事件和關系進行準確的提取。這種精確性與召回率的閾值必須適合于豐富的假說表述,而沒有不適當的噪音傳播。提取器還需要在多語言和從視覺上操作。這里同時采用了高精度的專家注釋方法和高召回率的學習技術。

  • 文件間 一旦建立了本地知識實體,它們就會在文件和模式間進行聚類,以開始類似證據的統一。

USC/ISI在這一合作中的作用是設計和開發表示機制和軟件組件,以提供以下高級功能:

  • 通用語義庫,它提供了一個表示形式、本體、存儲庫、推理引擎和API,以存儲、訪問、映射、消除歧義和鏈接由TA1模塊生成或由分析師直接輸入的知識元素(KEs)。

  • 假設生成和管理,生成和管理語義上連貫的假設,這些假設在某種最低程度上得到OPERA可用證據的支持,并記錄和管理備選方案,允許在假設推理器的指導下進行回溯和撤回。

AIDA計劃的目標非常宏大,對處理這些問題的各個團隊提出了極其困難的技術和工程挑戰。鑒于所有不同的輸入模式、語言、媒體類型、源和提取噪聲,以及對知識元素提取、推理、鏈接、查詢、跨組件和跨團隊集成、容器化和端到端系統自動化的要求,所產生的系統變成了極其復雜和難以構建、測試和調試的系統,特別是在一個學術、非商業研究環境中。最終的組件構成了龐大的代碼庫,每個代碼庫都有幾萬行。這個非常可觀的代碼庫的很大一部分集中在工程和集成問題上,而這些問題對于整個系統的性能來說往往比許多有趣的技術問題更重要,這些問題也必須解決。

付費5元查看完整內容

美國仍然是世界上最突出的軍事和技術力量。在過去十年中,美國認識到人工智能作為力量倍增器的潛力,越來越多地將人工智能(AI)的熟練程度視為美國重要利益和保證美國軍事和經濟實力的機制。特別是,在過去十年中,人工智能已成為美國國防的一項關鍵能力,特別是考慮到2022年美國國防戰略對印度-太平洋地區的關注。

因此,美國國防部(DoD)(以及美國政府和國防機構總體上)對人工智能和相關新興技術表現出越來越大的熱情。然而,雖然美國目前在學術界和私營部門的人工智能研究和開發方面取得了巨大進展,但國防部尚未在廣泛范圍內成功地將商業人工智能的發展轉化為真正的軍事能力。

美國政府在利用國防人工智能和人工智能支持的系統方面通常處于有利地位。然而,在過去的幾年里,各種官僚主義、組織和程序上的障礙減緩了國防部在國防人工智能采用和基于技術的創新方面的進展。最關鍵的是,國防部遭受了復雜的收購過程和廣泛的數據、STEM和AI人才和培訓的短缺。從事人工智能和人工智能相關技術和項目的組織往往是孤立的,而且還存在必要的數據和其他資源相互分離。在美國防部內部存在一種傾向于可靠方法和系統的文化,有時趨向于勒德主義。所有這些因素都導致了人工智能采用的速度出奇的緩慢。美國家安全委員會2021年提交給國會的最終報告總結說,"盡管有令人興奮的實驗和一些小型的人工智能項目,但美國政府離人工智能就緒還有很長的路要走"。

因此,盡管人工智能有可能增強美國的國家安全并成為一個優勢領域,而且鑒于美國在軍事、創新和技術領導方面的長期傳統,人工智能有可能成為一個薄弱點,擴大 "美國已經進入的脆弱窗口"。 如果美國不加快創新步伐,達到負責任的速度,并奠定必要的制度基礎,以支持一支精通人工智能的軍隊,人工智能將繼續成為一個不安全點。

去年,美國防部在這些挑戰中的一些方面取得了進展,調整了國防人工智能的方法。2022年6月,美國防部發布了《負責任人工智能戰略和實施途徑》,將更有數據依據的、負責任的、可操作的人工智能工作列為優先事項,此后開始執行。最重要的是,美國防部已經啟動了對其人工智能組織結構的重大改革,創建了一個新的首席數字和人工智能辦公室(CDAO),以整合其不同的人工智能項目和利益相關者,并使其與該部門的數據流更好地協調。值得注意的是,美國國防部目前正在對其國防人工智能的整體方法進行重大變革和振興。然而,這些新的人工智能努力是否足以讓美國彌補失去的時間,還有待觀察。

付費5元查看完整內容

美國空軍研究實驗室(AFRL)在技術開發方面的主要目標之一是將技術轉移給 "客戶",以滿足能力需求。這種轉換可以是在AFRL內部,也可以是向工業界,向系統項目辦公室(SPO),或直接向作戰人員。每個 "客戶 "類別都描述了一個潛在的 "過渡伙伴"。技術開發可以發生在支持客戶要求的成熟期("技術拉動"),即客戶提出他們的需求("要求"),AFRL用為滿足該需求而定制的技術發展來回應。當AFRL開發新技術或根據其作為關鍵技術領域的科學和技術(S&T)領導者的角色為舊技術找到新用途時,技術發展也可以在沒有具體要求的情況下發生。這被稱為 "技術推動",當AFRL科學家進行的基礎和/或應用科學研究發現了以前未知的軍事能力的潛力時,就會發生這種情況。技術拉動 "和 "技術推動 "項目都可以改變AFRL其他項目、工業、SPO或作戰人員的可能性,創造出潛在的破壞性能力,如果沒有相應的科技研究活動,對手是很難對付的。任何轉型所面臨的挑戰是,技術的價值可能沒有被更廣泛的社會所理解,在新技術的情況下,也沒有被進行研究的科學家所理解。

科學家和潛在的過渡伙伴之間的討論往往不能準確地確定一項技術的成熟度、潛在的軍事用途,以及一項技術的合理和可靠的使用時間表。在 "技術拉動 "和 "技術推動 "的情況下,對技術成熟度的準確描述是必要的,以告知科技領導層和潛在過渡伙伴開發的進展。成熟度,通常被稱為技術準備水平(TRL),是一個時間快照,它描述了演示或測試環境的特點,在該環境下,一項特定的技術被成功地測試。美國國防部(DoD)對TRL有一個標準的定義,從1到9,范圍從基本原理到實際任務操作中證明的實際系統。 從歷史上看,官方的TRL評估只在正式的采購過程中被系統地分配,然而,在AFRL項目開發的各個層面,通常都會要求進行技術成熟度評估。

目前缺乏一種系統的方法來評估AFRL技術,也缺乏對任何評估的文件驗證。雖然這并不是轉型失敗的原因,但有條不紊、準確和可驗證的TRL評估過程有助于為其他多個過程奠定基礎;支持與其他科技專業人士、管理機構和潛在的轉型伙伴進行有意義的合作;并支持提高AFRL技術轉型的概率。這些其他過程包括技術成熟計劃(TMP)、推進難度(AD2)、制造準備水平(MRL)、集成準備水平(IRL)、系統準備評估和水平(SRA和SRL)、空軍未來(HAF/A57,正式的空軍作戰人員集成能力(AFWIC))。技術、任務、資源、組織(TMRO)方法,AFRL過渡指標(ATM)和項目管理審查(PMR)。

TRL可以通過各種方式得出,但通常是通過技術準備評估(TRA)來確定。技術準備評估是在對技術的形式、與系統其他部分的集成程度以及操作環境等方面的保真度逐步提高的基礎上確定TRL的。TRA是一個系統的、以證據為基礎的過程,評估關鍵技術要素(CTE)的成熟度,這些要素可以是硬件、軟件、過程或它們的組合。一個技術要素是 "關鍵 "的,如果被收購的系統依賴于這個技術要素來滿足操作要求(在可接受的成本和進度限制內),如果該技術要素或其應用是一項新技術,以一種新的方式使用舊的/更新的技術,或者該技術要素或其應用在詳細設計或演示期間被用于構成重大技術風險的領域。正式的TRA最常被用來支持一個采購項目的確定階段,如美國法典第10章第2366b條詳細規定的要求,即在里程碑B批準之前,一個項目必須在相關環境中進行演示;然而,非正式的,或 "知識建設TRA",也可以用來評估技術成熟度,為開發人員、項目經理、管理機構和潛在的過渡伙伴提供有用的信息,以更有效地成熟關鍵技術,確定一個技術的準備程度,管理和解決當前和未來的發展風險。

今天,國防戰略和空軍參謀長和空間業務主管要求加速技術發展,并使能力更快地進入作戰人員手中。 一個可靠的、可重復的技術成熟度評估是后續和同步進程和方法的關鍵,如TMPs、AD2、MRLs、IRLs、SRAs和SRLs、TMRO、ATM和PMRs,并為支持AFRL內部、工業、SPO或在技術被證明達到適當水平后直接向作戰人員的快速過渡活動建立了基礎。本研究提出了進行這些TRA的建議程序和工具。

研究目標

本研究的主要目的是確定和推薦一個嚴格的、標準化的、可重復的程序和支持工具,以進行TRA,從伙伴的角度增加現有技術解決方案的可信度,并支持增加成功技術的過渡概率。因此,本研究將:

  • 確定一個量身定做的、嚴格的、標準化的、可重復的TRA流程,以進行可靠的TRA,同時提供支持流程執行的工具。

  • 將評估何時進行TRA的過程系統化,如何處理結果,以及如何確定下一步。

  • 詳細說明識別CTE的系統方法

  • 制作一個可定制的TRA模板,包括對可信度和客觀性至關重要的特征

  • 確定支持技術成熟和TRL評估的RY能力

  • 將技術要素納入建模、模擬和分析(MS&A)的方法。

  • 確定數據工件和儲存庫,以證明所分配的TRL。

付費5元查看完整內容

這個項目的目標是開發在具有挑戰性的多目標環境中自主分布式傳感器管理和融合所需的基礎方法。這涉及到開發能夠自動跟蹤多個目標的算法,根據從具有數據關聯不確定性和高誤報率的多個平臺收到的信息進行分類并分配資源。在研究者最近在多目標跟蹤和分布式傳感器融合方面的發展基礎上,該工作方案開發了能夠在大規模多傳感器多目標跟蹤應用中基于信息理論標準實現自主傳感器分配的方法。這是通過重新評估信息理論中的關鍵工具來實現的,這些工具適用于基于點過程理論的多目標監視的挑戰,該理論旨在適應單個目標的狀態和目標數量的不確定性。所開發的信息理論方法被應用于多傳感器問題,使人們能夠決定如何分配傳感器資源,以及完善對場景的認識。所開發的工具將有助于減少監測單一傳感器饋電的勞動密集型負擔,并能做出適應性決定,以優化多模式網絡的運行,并增強對監測區域的整體認識。對多目標跟蹤情景的信息理論表述的關注,將使人們能夠驗證傳感器饋電是否能夠可靠地融合,以避免數據損壞的可能性。該項目在智能傳感方面提供了關鍵的先進技術,以實現動態環境中的連續和適應性監視。這些將是可擴展的,可用于從多個分布式傳感器對許多目標進行大規模跟蹤。

該項目的總體目標是研究和開發基于信息理論原則的分布式多傳感器多目標系統的自主傳感器控制的新策略:

  • 為大規模系統的多目標跟蹤開發可擴展的解決方案。

  • 開發基于信息論原理的多傳感器融合的分布式解決方案。

  • 確定多傳感器多目標跟蹤系統可以交換多少信息。

該項目為多傳感器多目標跟蹤開發了基本的解決方案:

  • 對許多目標進行大規模跟蹤。問題的規模越來越大,因此解決方案需要可擴展,跟蹤許多目標需要減輕組合復雜性的算法。多目標跟蹤的低復雜度解決方案將被開發出來,并在復雜環境中進行測試。開發了一種用于穩健地跟蹤大量目標的方法,該方法在目標數量和測量數量上是可擴展的,這使得數百萬目標可以被跟蹤。

  • 確定多傳感器多目標跟蹤系統的信息含量。在具有高密度信息的傳感器網絡中,帶寬可能是多傳感器多目標跟蹤的一個制約因素。這個項目得出了確定用于多目標跟蹤的傳感器網絡的信息含量的結果。預計這將有助于評估傳感網絡的效率和有效性,并與發送數據的數量和頻率相平衡。

  • 來自多個傳感器的數據的分布式整合。操作員需要根據來自多個跟蹤系統的信息做出決定,以提高整體的態勢感知。為多傳感器集成開發了一種分布式多傳感器多目標跟蹤的新方法,該方法可減輕來自不準確或誤導性數據源的損壞。

  • 對多目標監視應用中的威脅進行評估。對許多物體的大規模跟蹤能夠識別直接威脅。然而,有些威脅可能比其他威脅更有針對性。開發了一種新的對抗性風險的表述,為操作人員提供態勢感知,以幫助確定傳感資產的優先次序。

  • 目標跟蹤估計器的性能界限。費舍爾信息的倒數,即克拉默-拉奧約束,為參數的估計器提供了一個約束,是統計分析的基礎。它為一個參數提供了一個可實現的最小方差或協方差。根據量子場理論的數學概念,為點過程推導出克拉默-拉奧約束,將這一概念推廣到具有空間變量的變量。

付費5元查看完整內容

在學習型網絡物理系統(LE-CPS)中使用的機器學習模型,如自動駕駛汽車,需要能夠在可能的新環境中獨立決策,這可能與他們的訓練環境不同。衡量這種泛化能力和預測機器學習模型在新場景中的行為是非常困難的。在許多領域,如計算機視覺[1]、語音識別[2]和文本分析[3]的標準數據集上,學習型組件(LEC),特別是深度神經網絡(DNN)的成功并不代表它們在開放世界中的表現,在那里輸入可能不屬于DNN被訓練的訓練分布。因此,這抑制了它們在安全關鍵系統中的部署,如自動駕駛汽車[4]、飛機防撞[5]、戰場上的自主網絡物理系統(CPS)網絡系統[6]和醫療診斷[7]。這種脆性和由此產生的對基于DNN的人工智能(AI)系統的不信任,由于對DNN預測的高度信任而變得更加嚴重,甚至在預測通常不正確的情況下,對超出分布范圍(OOD)的輸入也是如此。文獻[8, 9]中廣泛報道了這種對分布外(OOD)輸入的不正確預測的高信心,并歸因于模型在負對數似然空間中的過度擬合。要在高安全性的應用中負責任地部署 DNN 模型,就必須檢測那些 DNN 不能被信任的輸入和場景,因此,必須放棄做出決定。那么問題來了:我們能不能把這些機器學習模型放在一個監測架構中,在那里它們的故障可以被檢測出來,并被掩蓋或容忍?

我們認為,我們已經確定了這樣一個用于高安全性學習的CPS的候選架構:在這個架構中,我們建立一個預測性的上下文模型,而不是直接使用深度學習模型的輸出,我們首先驗證并將其與上下文模型融合,以檢測輸入是否會給模型帶來驚喜。這似乎是一個語義學的練習--即使是通常的機器學習模型通常也會 "融合 "來自不同傳感器的解釋,這些解釋構成了模型的輸入,并隨著時間的推移進行整理--但我們認為,我們提出的監測架構相當于重點的轉移,并帶來了新的技術,正如我們將在本報告中說明的。我們建議,一個更好的方法是根據背景模型來評估輸入:模型是我們所學到的和所信任的一切的積累,根據它來評估新的輸入比只預測孤立的輸入更有意義。這是我們推薦的方法的基礎,但我們把它定位在一個被稱為預測處理(PP)的感知模型中[10],并輔以推理的雙重過程理論[11]。在這份報告中,我們還提供了這個運行時監控架構的候選實現,使用基于歸一化流的特征密度建模來實現第一層監控,以及基于圖馬爾科夫神經網絡的神經符號上下文建模來實現第二層。

我們用一個自主汽車的簡單例子來解釋我們方法背后的基本原理,并展示了上下文模型如何在監測LEC中發揮作用。考慮一下汽車視覺系統中有關檢測交通線的部分。一個基本的方法是尋找道路上畫的或多或少的直線,自下而上的方法是在處理每一幀圖像時執行這一過程。但這是低效的--當前圖像幀中的車道很可能與前幾幀中的車道相似,我們肯定應該利用這一點作為搜索的種子,而且它是脆弱的--車道標記的缺失或擦傷可能導致車道未被檢測到,而它們本來可以從以前的圖像中推斷出來。一個更好的方法是建立一個道路及其車道的模型,通過預測車道的位置,用它來作為搜索當前圖像中車道的種子。該模型及其對車道的預測將存在一些不確定性,因此發送給視覺系統的將是最好的猜測,或者可能是幾個此類估計的概率分布。視覺系統將使用它作為搜索當前圖像中車道的種子,并將預測和當前觀察之間的差異或 "誤差 "發送回來。誤差信號被用來完善模型,旨在最小化未來的預測誤差,從而使其更接近現實。

這是一個 "綜合分析 "的例子,意味著我們提出假設(即候選世界模型),并偏向于那些預測與輸入數據相匹配的模型。在實際應用中,我們需要考慮有關 "預測 "的層次:我們是用世界模型來合成我們預測傳感器將檢測到的原始數據(如像素),還是針對其局部處理的某個更高層次(如物體)?

這種自上而下的方法的重要屬性是,它專注于世界模型(或模型:一個常見的安排有一個模型的層次)的構建和前利用,與更常見的自下而上的機器學習模型形成對比。我們將展開論證,自上而下的方法對于自主系統中感知的解釋和保證是有效的,但有趣的是,也許可以放心的是,人們普遍認為這是人類(和其他)大腦中感知的工作方式,這是由Helmholtz在19世紀60年代首次提出的[12]。PP[13],也被稱為預測編碼[14]和預測誤差最小化[15],認為大腦建立了其環境的模型,并使用這些模型來預測其感覺輸入,因此,它的大部分活動可以被視為(近似于)迭代貝葉斯更新以最小化預測誤差。PP有先驗的 "預測 "從模型流向感覺器官,貝葉斯的 "修正 "又流回來,使后驗模型跟蹤現實。("自由能量"[16]是一個更全面的理論,包括行動:大腦 "預測 "手,比如說,在某個地方,為了盡量減少預測誤差,手實際上移動到那里。) 這與大腦從上層到下層的神經通路多于反之的事實是一致的:模型和預測是向下流動的,只有修正是向上流動的。

有趣的是,大腦似乎以這種方式工作,但有獨立的理由認為,PP是組織自主系統感知系統的好方法,而不是一個主要是自下而上的系統,其中傳感器的測量和輸入被解釋和融合以產生一個世界模型,很少有從模型反饋到傳感器和正在收集的輸入。2018年3月18日在亞利桑那州發生的Uber自動駕駛汽車與行人之間的致命事故說明了這種自下而上的方法的一些不足之處[17]。

純粹的自下而上的系統甚至不能回憶起之前的傳感器讀數,這就排除了從位置計算速度的可能性。因此,感知系統通常保持一個簡單的模型,允許這樣做:林的視覺處理管道的物體跟蹤器[18]就是一個例子,Uber汽車也采用了這樣的系統。Uber汽車使用了三個傳感器系統來建立其物體追蹤器模型:攝像頭、雷達和激光雷達。對于這些傳感器系統中的每一個,其自身的物體檢測器都會指出每個檢測到的物體的位置,并試圖將其分類為,例如,車輛、行人、自行車或其他。物體追蹤器使用一個 "優先級方案來融合這些輸入,該方案促進某些追蹤方法而不是其他方法,并且還取決于觀察的最近時間"[17,第8頁]。在亞利桑那車禍的案例中,這導致了對受害者的識別 "閃爍不定",因為傳感器系統自己的分類器改變了它們的識別,而且物體追蹤器先是喜歡一個傳感器系統,然后是另一個,如下所示[17,表1]。

  • 撞擊前5.6秒,受害者被列為車輛,由雷達識別
  • 撞擊前5.2秒,受害者被歸類為其他,通過激光雷達
  • 撞擊前4.2秒,根據激光雷達,受害者被歸類為車輛
  • 在撞擊前3.8秒和2.7秒之間,通過激光雷達,在車輛和其他之間交替進行分類
  • 撞擊前2.6秒,根據激光雷達,受害者被歸類為自行車
  • 撞擊前1.5秒,根據激光雷達,受害者被歸類為不知名。
  • 撞擊前1.2秒,根據激光雷達,受害者被歸類為自行車。

這種 "閃爍 "識別的深層危害是:"如果感知模型改變了檢測到的物體的分類,在生成新的軌跡時就不再考慮該物體的跟蹤歷史"[17,第8頁]。因此,物體追蹤器從未為受害者建立軌跡,車輛與她相撞,盡管她已經以某種形式被探測了幾秒鐘。

這里有兩個相關的問題:一個是物體追蹤器保持著一個相當不完善的世界和決策背景的模型,另一個是它對輸入的決策方法沒有注意到背景。預測性處理中的感知所依據的目標是建立一個準確反映世界的背景模型;因此,它所編碼的信息要比單個輸入多得多。我們想要的是一種測量情境模型和新輸入之間的分歧的方法;小的分歧應該表明世界的常規演變,并可以作為模型的更新納入;大的分歧需要更多的關注:它是否表明一個新的發展,或者它可能是對原始傳感器數據解釋的缺陷?在后面兩種情況中的任何一種,我們都不能相信機器學習模型的預測結果。

預測處理方法的實施可以采用貝葉斯方法[19]。場景模型表示環境中的各種物體,以及它們的屬性,如類型、軌跡、推斷的意圖等,并對其中的一些或全部進行概率分布函數(pdf s)。觀察更新這些先驗,以提供精確的后驗估計。這種貝葉斯推理通常會產生難以處理的積分,因此預測處理采用了被稱為變異貝葉斯的方法,將問題轉化為后驗模型的迭代優化,以最小化預測誤差。卡爾曼濾波器也可以被看作是執行遞歸貝葉斯估計的一種方式。因此,像神經科學、控制理論、信號處理和傳感器融合這樣不同的領域都可能采用類似的方法,但名稱不同,由不同的歷史派生。思考PP的一種方式是,它將卡爾曼濾波的思想從經典的狀態表征(即一組連續變量,如控制理論)擴展到更復雜的世界模型,其中我們也有物體 "類型 "和 "意圖 "等表征。預測處理的一個有吸引力的屬性是,它為我們提供了一種系統的方法來利用多個輸入和傳感器,并融合和交叉檢查它們的信息。假設我們有一個由相機數據建立的情境模型,并且我們增加了一個接近傳感器。預測處理可以使用從相機中獲得的模型來計算接近傳感器預計會 "看到 "什么,這可以被看作是對模型準確性的可驗證的測試。如果預測被驗證了,那么我們就有了對我們上下文模型某些方面的獨立確認。我們說 "獨立 "是因為基于不同現象的傳感器(如照相機、雷達、超聲波)具有完全不同的解釋功能,并在不同的數據集上進行訓練,這似乎是可信的,它們會有獨立的故障。在一個完全集成的預測處理監視器中,情境模型將結合來自所有來源的信息。情境模型將保守地更新以反映這種不確定性,監測器將因此降低其對機器學習模型的信心,直到差異得到解決。

請注意,上下文模型可以是相當簡單粗暴的:我們不需要場景的照片,只需要知道我們附近的重要物體的足夠細節,以指導安全行動,所以相機和接近傳感器 "看到 "的相鄰車輛的輪廓之間的差異,例如,可能沒有什么意義,因為我們需要知道的是他們的存在,位置,類型和推斷的意圖。事實上,正如我們將在后面討論的那樣,我們可以在不同的細節層次上對上下文進行建模,自上而下的生成模型的目標是生成不同層次的感知輸入的抽象,而不是準確的傳感器值。在報告中討論的我們的實現中,我們在兩個層次上對上下文進行建模--第一個層次使用深度神經網絡的特征,第二個層次對場景中物體之間更高層次的空間和時間關系進行建模。除了傳感器,感知的上層也將獲得關于世界的知識,可能還有人工智能對世界及其模型的推理能力。例如,它可能知道視線和被遮擋的視野,從而確定在我們附近的車輛可能無法看到我們,因為一輛卡車擋住了它的去路,這可以作為有關車輛的可能運動("意圖")的增加的不確定性納入世界模型中。同樣,推理系統可能能夠推斷出反事實,比如 "我們將無法看到可能在那輛卡車后面的任何車輛",這些可以作為 "幽靈 "車輛納入世界模型,直到它們的真實性被證實或被否定。我們對監控架構第2層的神經符號建模的選擇對于整合這種背景和學習的知識以及對這些知識進行推理至關重要。

在這方面,另一個關于人腦組織的理論很有意思;這就是 "雙過程 "模型[20, 21],由卡尼曼推廣的獨立 "快慢 "思維系統[22]。它的效用最近已經通過一個非常有限的實現被證明用于計算機器學習模型的信心[23, 24]。系統1是無意識的、快速的、專門用于常規任務的;系統2是有意識的、緩慢的、容易疲勞的、能夠斟酌和推理的,這就是我們所說的 "思考"。就像預測處理一樣,我們提倡雙過程模型并不僅僅是因為它似乎符合大腦的工作方式,而是因為它似乎是獨立的,是一個好架構。在這里,我們可以想象一個特征密度正常化的流生成模型形成一個高度自動化的 "系統1",而更多的深思熟慮的神經符號模型構成一個 "系統2",當系統1遇到大的預測錯誤時,該系統會主動參與。系統1維持一個單一的生成性世界模型,而系統2或者對其進行潤色,或者維持自己的更豐富的世界模型,具有對符號概念進行反事實的 "what-if "推理能力。人們認為,人類保持著一個模型的層次結構[20, 21, 22],這似乎也是自主系統的一個好方法。我們的想法是,在每一對相鄰的模型(在層次結構中)之間都有一個預測處理的循環,因此,較低的層次就像上層的傳感器,其優先級和更新頻率由預測誤差的大小決定。

人類的預測處理通常被認為是將 "驚訝 "降到最低的一種方式,或者說是保持 "情況意識"。加強這一點的一個方法是在構建世界模型時增加系統2對假設推理的使用,以便將沒有看到但 "可能存在 "的東西明確地表示為 "幽靈 "或表示為檢測到的物體屬性的不確定性增加。一個相關的想法是利用人工智能進行推斷,例如,檢測到前面有許多剎車燈,就可以推斷出某種問題,這將被表示為世界模型中增加的不確定性。這樣一來,本來可能是意外情況的驚奇出現,反而會發展為不確定性的逐漸變化,或將幽靈解決為真實的物體。圖馬爾科夫神經網絡提供了一個有效的機制,既可以對這些關系和更豐富的背景進行建模,又可以通過反事實查詢和背景知情的預測進行審議。因此,雙重過程理論激發了我們的運行時監控器的兩層預測編碼結構。雖然這些理論旨在解釋人類的認知,但我們將這些作為運行時監控器來計算底層模型的驚喜,因此,當模型由于新奇的或超出分布的或脫離上下文的輸入而不能被信任時,就會被發現。

圖 1:基于預測處理和雙過程理論的自主量化保障架構

圖1展示了所提出的深度學習模型運行時監控的整體架構。如圖所示,該架構有兩個層次(由雙重過程理論激發)。在第一層,我們使用生成模型,學習輸入的聯合分布、預測的類輸出和模型提供的解釋。在第二層,我們使用圖馬爾可夫神經網絡來學習物體檢測任務的物體之間的空間和時間關系(更一般地說,輸入的組成部分)。在這兩層中,我們在本報告中的重點是運行時監測,而不是開發一個認知系統本身(而使用所提出的方法建立一個強大的、有彈性的、可解釋的系統將是自然的下一步)。因此,由這兩層檢測到的驚喜被監控者用來識別底層LEC何時不能被信任。這也可以作為LE-CPS的一個定量保證指標。

提綱

第3節介紹了預測性處理和雙進程架構(低級別的自動化和高級別的審議),并認為這可以支持一種可信的方法來保證自主系統的穩健行為。它也被廣泛認為反映了人類大腦的組織。我們提出了使用不同的神經架構和神經符號模型的組成來可擴展地完成這些的機制。結果在第4節報告。第5節提供了一些與工業建議的比較,并提出了結論和額外研究的建議。

付費5元查看完整內容

1.0 總結

機器學習在商業領域的巨大成功未能轉化為高性能的軍事應用。盡管深度學習開始在一些特定的軍事任務中顯示出令人印象深刻的結果,但由于它們需要極其龐大的、有標簽的訓練集,目前的能力不能充分地發揮。軍方需要一支由人工智能和機器學習專家組成的世界級團隊,在標簽高效半監督學習、模型轉移和主動學習方面的進行必要創新,來解決實際的軍事學習問題。為了滿足這一需求,Charles River Analytics公司組建了一支由概率建模和機器學習相關領域的研究人員以及從業人員組成的優秀團隊,提供概率標簽高效的深度生成結構(PLEDGES)。

我們在概率建模和深度學習的結合點上進行了開創性的研究。概率模型有利于少標簽學習,因為與需要基于標簽的誤差函數的神經網絡不同,它們可以使用任何種類的觀察,其中可以包括標簽,但不依賴于標簽。因此,概率模型對半監督學習很有用,因為它們可以從無標簽的數據中學習盡可能多的知識,并使用少量的有標簽的數據對其進行擴充。它們對模型轉移也很有用,因為它們是用有語義的組件來構造的,這些組件可以被組合和重新應用,以便將模型有效地轉移到新領域。概率模型還通過提供精心校準的不確定性估計來直接支持主動學習,這些估計是對哪些實例進行標記的重要基礎。

為了確保概率模型的高性能,它們必須與深度學習表征相結合。我們研究了三個主要方向。首先,我們開發了結構化深層概率模型(SDPMs),它在無標簽的數據觀察上定義了結構化和無關聯的聯合概率分布。SDPMs提供了類似于神經的表征,在從少數標簽中學習的同時,具有與最先進的神經方法相媲美的性能。第二,我們致力于在大容量的概率模型實現高效和準確的算法,完成了對傳統概率模型的數量級改進,使我們能夠使用反映最先進神經網絡結構的模型。第三,我們開發了用于半監督和弱監督學習的深度學習模型的概率模型變體,包括用于少數鏡頭視覺分類和目標檢測的元學習方法,以及用于零鏡頭目標檢測的弱監督方法

特別地,在PLEDGES項目中我們:

  • 開發了概率模型和模型組件,以支持用較少的標簽學習。這些模型包括變異SDPMs和可操作的大容量模型
  • 開發了從大量未標記的訓練數據和少量標記的訓練數據中學習模型的方法。
  • 開發了將從通用數據集學習到的模型轉移到特定應用程序的方法,在新應用程序中使用很少的標簽。
  • 開發了推薦專家標記實例的方法。

我們使用這些概率模型和方法來支持LwLL的關鍵成分:半監督學習、模型轉移和主動學習。我們能夠在SDPM和可操作的高容量模型上取得更大的進展,我們的工作表明,這兩種方法都有很好的前景,比以前的概率模型有更高的準確性和可擴展性。我們還發現,神經模型的概率公式可以帶來重大進展。我們的簡單CNAPS方法在幾張照片的視覺分類上取得了比最先進的方法(包括CNAPS)更大的進步。簡單的CNAP也構成了各種擴展的基礎,包括一個顯示出進一步改進的transductive版本。對于主動學習,我們的基礎工作產生了一套基于數據重要性的新方法,并且我們能夠展示對基于不確定性采樣的現有方法的改進。

關鍵詞:概率模型、Scruff、結構化深度概率模型、半監督學習、模型轉移、主動學習、變異方法、可分離信念傳播

2 引言

2.1 問題描述

機器學習的在商業領域的巨大成功未能轉化為高性能的軍事應用。盡管深度學習開始在一些特定的軍事任務中展現出令人印象深刻的成果,但目前由于需要極其龐大的、有標簽的訓練集,深度學習能力還未能充分發揮。與商業應用不同,大多數重要的軍事應用都有目標對象、事件或未翻譯的單詞,而這些目標對象、事件或單詞往往是新穎的,沒有大規模的真實標簽。另外,標簽的專業知識是有限的,這就禁止了從人群中創建標簽數據集。基于軍事學習的應用需要新的無監督和半監督學習方法,以實現深度學習系統的性能,但只需要10到100個標簽。此外,學習算法必須有效地利用有限的軍事專家和訓練數據,例如,通過主動識別最具代表性和最不自信的學習實例。最后,用于識別軍事目標和活動的學習模型必須具有新的組件重用級別,以通過模型重組進行適應。機器學習應用程序因其龐大的機制而臭名昭著,這些機制很難擴展,并且無法在任務和應用程序之間推廣。解決這些挑戰需要基本的新思維來超越當前機器學習的局限性,需要在標簽高效半監督學習、模型轉移和主動學習方面進行必要的創新,以解決現實世界中的軍事學習問題。

今天,基于深度神經網絡的方法在機器學習的研究中占主導地位。盡管取得了許多成功,但神經網絡有幾個關鍵的局限性,包括數據需求量大,渴望數據,需要大量的標記數據。兩相對比,這使得概率方法非常有吸引力,它需要的標記數據要少得多。概率模型有利于標簽效率的學習,因為與需要基于標簽的誤差函數的神經網絡不同,它們可以使用任何種類的觀察,其中可以包括標簽,但不依賴于標簽。因此,概率模型對半監督學習很有用,因為它們可以從無標簽的數據中學習盡可能多的知識,并使用少量的有標簽的數據對其進行擴充。它們對模型轉移也很有用,因為它們是用有語義的組件來構造的,這些組件可以被組合和重新應用,以便將模型有效地轉移到新領域。概率模型還通過提供精心校準的不確定性估計來直接支持主動學習,這是對哪些要進行標記的實例所做知情決策的基礎。

事實上,概率模型一直是無監督和半監督學習的主要方法之一,像k-means聚類這樣的方法使用得非常廣泛。然而,正如這個例子所示,用于無監督學習和半監督學習的概率模型往往很簡單;k-means本質上是就是高斯方法的混合物。過去,概率方法的性能落后于神經網絡,主要原因是難以將推理和學習的規模擴大到海量的模型中。因此,為了達到美國防部重大應用所需的實際效果,概率模型必須與深度學習方法相結合

我們預計,我們的努力成果將在有效推斷和學習豐富概率模型的能力方面取得革命性進展,使深度概率方法最終成為在非概率深度學習在現實問題中的可行替代方法。這些進步將帶來比當前基于神經網絡的方法更好的半監督學習、模型轉移和主動學習方法。

2.2 技術方法

我們在團隊最近將概率模型與深度表示相結合的工作基礎上進行了改進。我們沿著三個平行的方向前進。

首先,我們為半監督和弱監督的學習開發了深度學習模型的概率模型變體。我們稱這些模型為結構化深度概率模型(SDPMs)。這項工作建立在最近的語言創新上,如Edward、Pyro和Probabilistic Torch,后者是由聯合創始人JanWillem van de Meent領導。這些框架使用變異方法來訓練概率模型,其中神經網絡定義了條件分布,將深度學習的靈活性與概率模型的數據效率相結合。使用這些方法的初步工作被證明是非常有效的。在每個類別只有10個標簽的情況下,我們使用概率Torch在數據集上取得了超過90%的分類準確率,例如使用美國國家標準與技術研究所(MNIST)的修改數據集進行測試。在此工程中,我們以各種方式擴展了這些方法,以獲得明顯高于其他概率變異方法的準確性。

對于第二個方向,我們為高容量概率模型尋求高效準確的算法,這些模型反映了最先進的神經網絡的結構,同時保持完全概率。該方法基于PI-Avi-Pfeffer最近的工作,該工作表明,通過使用稱為可分離信念傳播(SBP)的方法編碼有關聯合分布的信息,任何有向概率模型都可以轉換為二級模型,在該模型中,推理是按線性時間進行且準確的。深度學習的成功依賴于這樣一個事實,即大多數觀察到的數據都存在于一個可以稀疏表示的低維流形上,這為我們提供了強有力的理由,讓我們相信,對于現實世界的軍事應用來說,二級模型是很小的。因此,使用SBP的高容量概率模型可以實現與神經網絡方法類似的可操作性,同時在低標簽真實美國防部問題上擁有更好的性能。

對于第三個方向,我們對現有的非概率深度學習方法進行了概率性的重新解釋和變體。特別是,我們開發了簡單CNAPS算法,這是一種用于少數鏡頭視覺分類的元學習算法,該算法具有神經特征提取器和概率分類器,并且從具有有限標簽的數據中學習。我們還開發了一個簡單CNAPS的歸納版本,以及一個用于0-shot/any-shot物體檢測的弱監督學習方法。

我們使用在這兩個線程下開發的概率模型來提供LwLL的關鍵組成部分:半監督學習、模型轉移和主動學習。半監督學習的成功依賴于在沒有標簽的情況下學習有關領域的大部分知識,只剩下少量參數需要從標簽數據中學習。概率模型自然適合于半監督學習,因為豐富、高度結構化的模型可以單獨從未標記的數據中學習。該模型可以是一個具有多個參數的復雜網絡,這些參數可以從大量未標記數據中精確擬合,然后通過具有少量參數的薄標記層進行擴展,以從少數實例中學習。我們通過成對學習來增強這一洞察力,在這種學習中,我們比較和對比不同的數據實例,以了解它們的比較標簽,即使它們本身沒有標簽。與類標簽相比,成對比較噪音更小,信息更豐富,因此可以更好地利用稀疏標簽。在最初的工作中,我們確定,通過合并比較,我們可以在只有80個樣本的數據集上訓練和優化具有5974577個參數的神經網絡。

對于模型傳輸,概率方法允許我們組合語義上有意義的模型組件,并將其重新應用于新情況。我們在這一見解的基礎上提出了一些切實可行的想法。非參數方法通過識別不屬于任何已知類的相似實例簇,使我們能夠識別新的對象類,即使該類的標記實例為零。概率零點學習方法還使我們能夠使用輔助信息來識別沒有標記實例的類的實例。重新編程方法使我們能夠通過在應用程序之間映射概念,例如輸入、輸出和概念的內部表示,將原始模型轉移到新的應用程序。

對于主動學習,我們使用了一種基于概率模型的決策理論方法。現有的大多數主動學習工作有兩個目標:挑選最不自信的實例,以及挑選最有代表性的實例。雖然對于可以直接定義相似性度量的簡單任務,已經實現了將這些目標結合在一起,但對于大多數實際應用來說,相似性度量并不容易獲得。我們基于數據重要性的概念開發了一種新的主動學習方法,并將這些方法與SDPM相結合。

2.3 技術目標

查爾斯河分析公司(Charles River Analytics)與東北大學、不列顛哥倫比亞大學(UBC)和加利福尼亞大學歐文分校(UCI)的合作者一起,開發了概率標簽高效深度生成結構(PLEDGES),用于少標簽學習(LwLL)。我們在概率建模和深度學習的結合點上進行了開創性的研究。與需要使用基于標簽的誤差函數的神經網絡不同,概率模型可以使用任何種類的觀察,它可以包括標簽,但不依賴于標簽。我們開發了結構化深度概率模型(SDPMs),它在無標簽的數據觀測上定義了結構化和無聯系的聯合概率分布;開發了可操作的大容量概率模型,它能在大型網絡上進行快速和準確的推理;開發了概率的重新解釋和神經算法的變體。

我們對SDPMs的研究目標有三條線。首先,對于半監督學習來說,SDPM提供了類似于神經的表征,能夠在從少數標簽中學習的同時擁有與最先進的神經方法相媲美的性能。因此,SDPM是半監督學習的理想選擇,因為它們可以從未標記的數據中學習盡可能多的知識,并使用少量的標記數據來增強這些知識。第二,要把學到的知識從一個模型轉移到一個有少量標簽的新模型,SDPM也是模型轉移的理想選擇,因為它們的結構是使用有語義的組件,這些組件可以被組合和重新應用,把模型有效地轉移到新領域。第三,對于學習系統可以對數據提出問題的主動學習來說,概率模型也直接支持主動學習,因為它提供了經過良好校準的不確定性估計,這是決定對哪些實例進行標記的基礎。

2.4 相關工作

為了開發適用于大規模應用的實用概率模型,我們以最近的變異推理發展為基礎。在這一工作中,我們開發了新的攤銷變分推理方法,它訓練神經網絡使用隨機梯度下降進行推理。攤銷變分方法已經在Edward、Pyro和Probabilistic Torch等語言中得到了應用。Probabilistic Torch的設計從一開始就考慮到了半監督學習策略,并且已經被證明是非常有效的;每個類別只有10個標簽,我們在MNIST等數據集上的分類準確率已經超過90%。概率Torch還提供了一個高質量的組件庫,可以從組件中組裝出復雜的模型。例如,這使我們能夠將一個物體檢測模型嵌入到第二個識別圖像中感興趣區域的模型中,從而形成一個可以以端到端、半監督方式訓練的多目標檢測模型。我們在現有Probabilistic Torch工作的基礎上,取得了一些創新的進展,包括針對活動識別和機器翻譯等順序性問題的攤銷式順序推理,以及適應概率程序推理的技術來估計全局變量。

我們對高容量、完全概率模型的研究受到Wood開發的一種叫做推理編譯的方法的啟發,這種方法學習一個神經網絡來回答一個由概率程序定義的查詢。雖然有效,但學習的網絡不是一個聲明性的概率模型,只能回答單一種類的查詢,而不是為推理提供一個數據結構。我們的關鍵見解是,我們可以將原始的概率模型編譯成一個替代的概率模型,該模型支持原始模型的所有功能,但其中的推理是按照線性時間進行的。這使得概率模型的所有優勢都能被用于具有數百萬個參數的模型,如最先進的神經網絡。還有其他方法將概率模型編譯成支持線性時間推理的數據結構,如算術電路和和積網絡,但這些電路一般是指數級大小。相比之下,我們的數據結構在緊湊型網絡中捕捉潛在的復雜信息,類似于緊湊型神經網絡,后者代表了豐富的實際應用功能。使概率模型具有如同神經網絡一般的靈活性和性能將產生深遠的影響,這不僅關系到較少標簽的學習,同時也還包括其他很多方面。概率模型解決了神經網絡的一些基本局限,例如難以納入先驗知識,需要大量數據,以及因果關系建模困難。

付費5元查看完整內容
北京阿比特科技有限公司