亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

FLASH 項目的最初目標是利用豐富的結構化知識形式,開發新型高效的機器學習算法。具體來說,我們的假設是,適當使用結構化知識可以大幅減少在標準機器學習任務中實現一流性能所需的手工標記數據量,并解決兩個關鍵挑戰:

  • 利用結構:開發利用結構的通用算法,以便從很少或沒有手工標記的示例中學習新概念。
  • 推斷結構:通過主動從頭開始學習或從其他領域轉移結構,開發推斷結構的通用算法。

我們項目最初的重點是:(1) 程序合成/結構化預測: 設計新的結構化預測和程序合成算法,并利用它們來推斷和利用結構;(2) 研究神經表征(向量嵌入),并利用它們來開發將結構嵌入向量表征的新算法,并利用它來支持轉移和利用結構;(3) 推斷和利用領域知識和輔助信號作為誘導結構的一種方式,更好地解決轉移學習問題,并開發新的受限深度學習算法來納入輔助信號。

FLASH 計劃執行了這一計劃,并在上述所有領域做出了一系列理論和實踐貢獻。除了開發理論、算法和表征之外,我們還利用這些理論、算法和表征開發了自然語言和計算機視覺方面的應用。

此外,在 DARPA LwLL 項目過程中,由于大型預訓練生成式人工智能模型(包括 ChatGPT 等大型語言模型 (LLM))的成功,該領域的重點發生了變化。雖然工作目標沒有改變,但我們自己的研究議程適應了該領域的這些變化,同時與我們最初提議的廣泛目標保持一致。例如,我們提出的大部分向量嵌入工作都擴展到了研究 LLM,我們在程序合成方面的工作也加入了神經肌張力元素,詳見下文。

FLASH 計劃在頂級會議上發表了大量論文,下文的描述不會涉及所有這些貢獻。相反,我們將重點介紹每個技術領域的一些關鍵貢獻,并請讀者參閱以下豐富的參考文獻以獲取完整信息。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

在圖 1 中簡要介紹了布朗大學團隊的研究工作。在美國國防部高級研究計劃局(DARPA)的 "少標簽學習"(LwLL)項目中,團隊的工作包括技術領域 1(TA1)和技術領域 2(TA2)。技術領域 1 的目標是開發以下學習算法 (1) 將從頭開始建立模型所需的標注數據量減少至少 10^6 倍;以及 (2) 適應具有數百個標注示例的新環境。TA2 的目標是正式證明解決特定機器學習問題所需的標注數據量的限制。具體來說,我們的貢獻有兩個方面:首先,我們開發了廣泛適用的系統和方法,以減少學習對標注數據的需求;其次,我們定義了穩健的理論分析和框架,這些分析和框架是程序化弱監督和零點學習范例的基礎。

在該計劃中,預訓練的大型語言和視覺語言模型的出現帶來了新的挑戰,因為這些模型出色的泛化能力大大提高了基準性能。雖然這些進步降低了針對新目標任務完善模型時對標注數據的需求,但能否獲得足夠的特定目標數據仍然至關重要,尤其是對于遠離模型訓練數據的領域。考慮到這一點,我們的團隊將注意力轉向了在資源有限的情況下對這些大型模型進行參數高效調整。

總的來說,貢獻總結如下:

  • 推出了 TAGLETS [1],這是首個端到端機器學習系統,能以統一的方式自動整合數據和模型生態系統。在數據量較少的情況下,沒有經驗法則可以事先選出最佳學習策略。TAGLETS 包括來自不同學習范式的多種算法,如遷移學習、半監督學習和零點學習。每個模型最初都會在目標相關的輔助數據上進行微調,這些數據是從其他任務的標注數據集合中提取的[1, 2]。然后,將訓練好的模型作為弱標簽器,為未標簽數據生成偽標簽。新標注的數據和為數不多的標注數據被送入最終模型,成為系統的輸出結果。TAGLETS 最初使用較小的預訓練模型作為模型的骨干。用更大的預訓練模型取代這些骨干模型的進一步實驗表明,TAGLETS 的架構和任務相關輔助數據的重點,即使是更大的預訓練模型,也能從中獲益。(TA1)

  • 設計了一種新穎的零點學習方法(zero-shot learning approach),利用常識知識圖譜來豐富未見目標類的信息(ZSL-KG)[3]。在使用描述類別的屬性進行零點學習的背景下,我們首次提出了從屬性到類別的最佳映射的最壞情況誤差的非難下限,即使有完美的屬性檢測器也是如此[4]。該下界描述了基于可用信息--類-屬性矩陣--的零點問題的理論內在難度,而且該下界實際上是可計算的。(TA1 和 TA2)

  • 探索了如何在不同的低資源學習范式[5]下利用偽標記來提高視覺語言模型(VLM)在新任務上的能力。我們的主要觀察結果是,在半監督、無監督和轉導式零點學習設置中使用相同的學習策略,通過偽標簽學習可持續提高對比語言-圖像預訓練(CLIP)的性能。此外,通過使用假標簽進行提示來調整 CLIP,可減輕 CLIP 對某些類別的偏差。(TA1)

  • 開發了一種使用 CLIP(組合軟提示)[6] 學習如何組合概念的新方法。我們的方法在組合零點學習(即預測未見屬性-對象組合(如老貓和小老虎)的任務)方面表現良好。除了提出這種新方法外,我們還研究了 CLIP 編碼組合概念的能力,以及以對結構敏感的方式綁定變量的能力(例如,區分球體后面的立方體和立方體后面的球體)[7]。(TA1)

  • 從理論上研究并提供了在去除獨立性假設后組合弱標簽器的新方法。特別是,我們設計了具有誤差理論保證的解決方案[8, 9]。我們將這一分析擴展到漂移數據 [10]。此外,為了克服標簽輸出單一類標簽的假設,我們研究了用戶可以創建部分標簽輸出可能類標簽子集的情況 [11]。(TA1 和 TA2)

  • 在大型語言模型和視覺語言模型出現后,我們開發了 Alfred:第一個允許通過提示對大量未標記數據進行標記的框架[12]。(TA1)

方法對項目整體范圍的影響。

  • 布朗大學在 JPL 設計的圖像和視頻分類任務中評估了其 TAGLETS 系統。此外,我們還評估了 GRIP,這是一種利用偽標簽的基于 CLIP 的提示調整方法,用于解決 JPL 的零鏡頭學習任務。
    • 在圖像分類任務中,TAGLETS 的表現躋身前六名。
    • 在視頻分類任務中,當標記數據量增加時,TAGLETS 是表現最好的方法。
    • 在零鏡頭學習任務中,GRIP 的表現一直名列前茅,與基線相比提高了 20%。
付費5元查看完整內容

本文總結了我們在 DARPA LwLL(少標簽學習)項目中的研究和技術貢獻,該項目旨在減少訓練和調整機器學習模型所需的標簽數據。基于遷移學習,我們的方法利用了從數據集、知識資源、模型和架構、現有任務和訓練算法等各種來源獲得的歸納偏差。它將上述方法整合到一個連貫的框架中,并與 LwLL 評估協議保持一致,以便在各種學習條件下,在有限的監督下進行學習。利用生成式人工智能的最新進展,這項工作研究了注入適當歸納偏差的新穎而有效的方法,以推動圖像分類、物體檢測、視頻分類和機器翻譯領域的技術發展。研究成果包括在頂級人工智能刊物上發表大量論文、組織研討會以及培訓博士后和博士生。該團隊還在 LwLL 評估中表現出色,其對象檢測系統入選 NGA 過渡任務。此外,從 LwLL 項目中獲得的知識和技能還被應用到我們團隊參與的 DARPA CCU 項目中,該項目中只有 20% 的數據是有標簽的。

人類和許多動物都能通過少量實例學習新概念,從而快速適應新環境。然而,最先進的深度神經網絡過去往往需要大量標注數據才能學習感興趣的目標概念,這主要是由于這些模型的學習能力較強。不過,最近在生成式人工智能和指令跟隨大型語言模型(LLMs)方面取得的進展為機器學習系統在標記數據稀缺的情況下快速學習和適應開辟了新的可能性。在本項目中,我們的方法是學習如何通過將知識從某些任務轉移到其他任務(又稱轉移學習),從而在標簽較少的情況下有效地學習和適應。

從標簽較少的數據中學習的方法的一個必要條件是,它不應該專門針對為學習概念而制定的特定任務。粗略地說,一個任務包括一個數據集和一個學習特定概念的評估指標,例如 ImageNet 挑戰賽。從較少的標簽中學習的臨時和啟發式方法并不可取,因為它們無法在不同的數據和任務分布中始終如一地發揮良好作用。在本項目中,我們設計了有效的策略,通過利用泛化所需的歸納偏差來學習和/或適應新概念。在遷移學習的大框架下,利用不同的機制將這些歸納偏差 "遷移 "到感興趣的目標任務中。我們研究了多種深度神經網絡的泛化,包括圖像分類、物體檢測、視頻分類和機器翻譯等領域最先進的模型。

如前所述,我們通過注入歸納偏差實現了少標簽學習(LwLL)的樣本效率。本報告中使用的學習機 "歸納偏差 "概念值得澄清。"學習 "涉及從過去的經驗中歸納出新情況的能力,這種新情況與過去的經驗 "相關"。處理新情況所需的歸納飛躍似乎只有在選擇一種情況概括而非另一種情況概括的某些偏差下才有可能實現"[1]。

在本報告中,我們對 "偏差 "的工作定義是:"指除與觀察到的訓練實例嚴格一致之外,選擇一種概括[或假設]而非另一種概括的任何依據"[1]。我們使用的 "遷移學習 "是廣義的、通用的,包括最近的一些進展,如 (i) 預訓練--然后--再調整范式,以及 (ii) 使用指令跟隨大型語言模型(LLM)的零/少鏡頭學習。前者包括通過使用具有不同分布的海量無標記自然出現的網絡規模數據進行自我監督學習,從而提煉知識和歸納偏差。從根本上說,人們可能會問,這種歸納偏差的轉移是如何發生的?我們提供了一種基于壓縮論證的直覺[2]。在大型神經網絡定義的函數空間中,使用基于梯度搜索的壓縮算法對大量數據進行 "壓縮",從而捕捉到規律性,然后在感興趣的目標監督學習任務中加以利用,例如,通過自動制作的信息性和預測性特征。

后者依賴于 "調動 "大型神經網絡在預訓練階段所學到的提煉知識和歸納偏差,使目標任務受益。實現 "指令跟隨 "的方法是,讓經過預訓練的大型 LLM 接觸各種指令集,使網絡能夠理解并跟隨人類的新指令,從而獲取網絡中提煉出的大量知識。例如,這些指令可以是對如何生成分類任務標簽的描述,類似于在策劃標簽數據集時給人類注釋者的指令。這實際上將 LLM 變成了 "噪聲注釋器",或者換句話說,變成了 "零鏡頭 "方式的分類器。

利用這些進展,在 DARPA LwLL 的整個工作過程中,我們研究并探索了在各種學習環境中進一步注入適當的歸納偏差,以推動圖像分類、物體檢測、視頻分類和機器翻譯領域的技術發展。我們的目標是針對通用智能體在部署階段遇到的感興趣的學習環境,"自動專業化 "通用預訓練模型。這需要對各種挑戰和學習條件進行整體處理,包括采用適當的骨干預訓練架構(模型選擇)、識別智能體的知識差距并從人類注釋者那里查詢適當的未標注數據點的標簽(主動學習)、從已標注和未標注數據的組合中學習的算法(半監督學習),以及適應數據分布發生變化的新領域(領域適應)。我們要強調的是,在已發表的作品中,研究界通常只關注上述機器學習設置中的 "一種"。然而,自主智能體應該能夠處理系統部署過程中出現的所有這些設置,而這正是我們的工作所要解決的核心問題,與 LwLL 計劃的評估協議相一致。此外,我們在視覺和語言問題上始終使用 Transformer 架構[3],對這些不同的模式進行了統一處理,實現了對各種想法的無縫探索。

本報告的組織結構如下。首先,我們介紹了 DARPA LwLL 計劃的評估協議,并描述了我們應對使用較少標簽學習所面臨挑戰的主要框架。隨后是方法論部分,描述了我們的框架如何適應 LwLL 評估中考慮的四個問題:圖像分類、物體檢測、視頻分類和機器翻譯。然后,我們在 "結果與討論 "部分報告了評估結果和發現。最后,我們總結了我們的貢獻以及對未來少標簽學習的思考,以此結束本報告。

付費5元查看完整內容

本報告詳細介紹了在 DARPA LwLL 或 "少標簽學習 "項目中采用的方法和取得的成果。

本報告解決的關鍵問題是從小標簽數據集學習的問題。這是許多應用領域經常遇到的問題。尤其是在國防應用領域,標簽數據可能是分類數據,因此數量有限。不幸的是,現代深度學習系統需要大量的標注訓練示例,這使得它們在標注較少的情況下效果不佳。在本報告中,我們將介紹我們在開發新型學習機器方面所做的努力,這些機器可以有效地從少量標簽中學習。

我們對這一問題的主要見解是利用任務和領域中的結構。這種結構可以是關于所需不變性的領域知識。它也可能更無定形,難以具體化,但它可能決定了哪些分類器能在該領域發揮良好的作用。我們探索了三種納入這種領域結構思想的方法:

1.納入已知不變量: 我們探索了明確包含已知不變量的機器學習新架構。特別是,我們設計的識別架構允許特征在空間上移動,以納入姿勢不變性。

2.跨領域學習: 考慮到不同領域之間的相似性,我們探索了跨領域傳輸所學模型的新技術。

3.特定領域的學習算法: 我們還探索了兩個領域的專業學習技術:衛星圖像和自動駕駛汽車。對于這些領域,我們利用數據的特殊結構來學習無標簽模型。

使用標準基準和 DARPA 評估進行了實驗。普遍發現

1.在對領域一無所知的情況下,最佳策略是自我訓練,即使用經過適當過濾的網絡自身輸出作為 "地面實況 "標簽。在這里,我們發現了進行自我訓練的新方法,即使網絡是在完全不同的問題領域中訓練出來的。

2.如果我們了解我們正在處理的領域,我們甚至可以建立完全無監督的識別模型,其性能優于有監督的模型。關鍵是要利用底層數據生成過程的知識。我們在衛星圖像和自動駕駛汽車上都展示了結果。

付費5元查看完整內容

本研究旨在研究如何通過在大規模文本文檔中執行開放式信息提取技術來構建網絡安全知識圖譜表示法。之后,我們將研究如何將深度學習應用于網絡安全的知識圖譜表示。我們將考慮在圖深度學習模型中使用注意力機制,并比較可用于圖表示數據學習的各種深度學習模型。此外,我們還將研究利用無標記數據的半監督學習框架,以提高預測和排序問題的性能。所提出的方法將用于檢測網絡安全領域的惡意軟件和代碼缺陷。

付費5元查看完整內容

適應性記憶(AC)是作為一種查找表(LUT)通用技術新推出的。它由一系列生成模型組成,其設計方式是學習每種算法的輸出。在本報告中,我們重點介紹基于條件生成對抗網絡(cGAN)的 AC 改進版。與之前的結構相比,新開發的生成式結構具有多項優勢。從本質上講,它不需要生成模型陣列。相反,兩個適當制作的生成模型就足夠了,從而大大縮短了整體寫入時間。此外,它還能在感興趣的區域提供更好的抑制水平。最后,它還能在抑制水平性能和損失函數衡量的生成保真度之間做出選擇。

認知雷達(CR)是當前雷達理論研究中一個引人注目的趨勢。盡管不同學者對這一概念的定義大相徑庭[11],但這些定義都有其主要內容。例如,[12]、[10]和[6]認為從環境和經驗中學習是認知雷達的主要特征,而[10]則認為具有適應復雜情況的能力。認知雷達與完全自適應雷達的區別還在于,認知雷達應 "學會調整操作和處理參數,并能在較長時間內做到這一點"[1]。因此,學習和存儲知識是一個必備要素[13, 15]。

與此同時,Gurbuz 等人[11] 綜述了與認知雷達有關的 83 種期刊和 238 篇會議論文。他們發現,大多數研究至少涉及某種形式的波形選擇、優化或設計。在這些研究中,通常使用收集到的認知來決定哪種波形適合當前環境。一種突出的方法是利用在時頻觀察到的雜波認知[5, 21,18, 20]。由于雷達界廣泛使用模糊函數(AF)來表示時頻景觀,因此幾乎所有此類研究都涉及設計或塑造發射波形的模糊函數。在本報告中,我們給出了一種基于 AF 塑造研究的深度學習方法,它可以復制任何迭代算法的結果。我們首先在文獻[7]中以容納記憶(AM)的名稱引入了這一概念,然后在本報告中對其進行了優化和改進。

下面,我們首先回顧一下它在學習方面提出的條件生成對抗網絡。接著,我們在第 2 節中提出了認知接收波形,并觀察到為了最小化總干擾功率(PTD),應基于雜波認知設計離散時間模糊函數。然后,我們提出了一種基于 cGAN 的雙生成深度結構,它可以學習信號-AF 對并對其進行再生。這里我們將最小平方損失函數和 Wasserstein 損失函數作為模型損失函數。第 3 節專門報告給定方法的實證結果,其中我們研究了名為條件部分的特定結構超參數的影響。最后。第 4 節是本報告的結尾。

付費5元查看完整內容

本項目的目標是提高具有智能體間通信基礎設施的多智能體分布式任務協調的效率。在這個項目的第一階段,我們探索了基于共識的捆綁算法(CBBA)在預算約束下的分布式任務分配的改進。CBBA技術的局限性在于,環境必須被所有的智能體預先知道,任務必須被明確定義,并有已知的成本和獎勵。這種技術顯然不適合在未知環境中的合作任務,在這種環境中,智能體必須一起探索和即興行動。在這個項目的第二階段,我們研究了在未知環境中執行任務的合作技術,其中智能體只有部分觀察。該研究使用多智能體捕食者和獵物游戲作為平臺。目標是讓智能體聯合定位并捕獲獵物。智能體對環境和獵物的逃逸算法沒有事先了解。他們相互交流,以獲得超出他們自己本地觀察范圍的環境信息。基于他們對環境的局部理解,智能體選擇自己的行動,包括在哪里移動以及是否與其他智能體溝通,以使團隊獎勵最大化。強化學習被應用于優化智能體的政策,以便用最少的步驟完成游戲。

第二階段研究的主要貢獻是信仰圖譜輔助的多智能體系統(BAMS)。信念圖代表了智能體在融合了傳入的信息后所保持的環境的隱藏狀態。通過將信仰圖譜與強化學習框架相結合,并向信仰圖譜提供反饋,我們加速了訓練并提高了系統可以獲得的獎勵。在不同復雜程度的環境中,使用合作的捕食者和獵物游戲對BAMS的性能進行了評估。與現有的具有信息傳遞能力的多智能體模型相比,BAMS具有以下優點。

1)訓練收斂速度快68%,使用BAMS模型訓練的智能體完成游戲的步驟少27.5%。

2)它具有強大的性能。在應用模式中,智能體的數量不必與訓練環境相同。

3)智能體之間的信息是加密的。BAMS中的信息是智能體對環境信念的學習表示的向量。它們不僅包含關于智能體和環境的當前狀態的信息,而且還包含未來的狀態。每個數字都與智能體或環境的任何物理屬性沒有對應關系。除非有經過訓練的BAMS模型,否則不可能解碼這些信息。

4)智能體在訓練中達成默契。從實驗結果來看,使用BAMS訓練的智能體似乎不需要明確的交流就能理解對方的意圖。

  1. 解碼后的信念圖為智能體的決定提供了一個粗略的解釋。信念圖解碼器與BAMS中的策略網絡一起訓練。通過比較信仰地圖和實際地圖,系統收到額外的反饋渠道,從而監督訓練過程。在執行過程中,信仰圖譜提供了一種解釋智能體隱藏狀態的方法,這可以進一步用來解釋智能體的行為。

付費5元查看完整內容

本項目的目標是利用智能體間通信基礎設施提高多智能體任務分布式協調的效率。在這個項目的第一階段,我們探索了基于共識捆綁算法(CBBA)的增強,用于預算約束下的分布式任務分配。CBBA技術的局限性在于,所有智能體必須預先知道環境,并且必須清楚地定義具有已知代價和回報的任務。這種技術顯然不適合在未知環境下的合作任務,因為智能體間必須一起探索和即興發揮他們的行動。在本項目的第二階段,我們研究了在未知環境下,智能體只有部分觀測的任務合作技術。本研究以多智能體捕食博弈為平臺。目標是讓智能體共同定位和捕獲獵物。智能體對環境和獵物的逃跑算法沒有先驗知識。他們相互交流,以獲得超出自己局部觀測的環境信息。基于對環境的局部理解,智能體選擇自己的行動,包括移動到哪里以及是否與其他智能體通信,以最大化團隊獎勵。應用強化學習來優化智能體的策略,使游戲以最少的步驟完成。

我們第二階段研究的主要貢獻是信念圖輔助多智能體系統(BAMS)。信任映射表示智能體在融合傳入消息后維護環境的隱藏狀態。通過將信念圖與強化學習框架集成,并向信念圖提供反饋,我們加速了訓練并提高了系統可以接收的獎勵。在不同復雜程度的環境中,使用捕食者和獵物合作游戲來評估BAMS的性能。與具有消息傳遞功能的現有多智能體模型相比,BAMS提供了以下優點:

1)訓練收斂速度加快68%,使用BAMS模型訓練的智能體完成游戲的步數減少了27.5%。

2)性能穩健:應用模式下,智能體的數量不必與訓練環境相同。

3)對智能體之間的通信信息進行加密。BAMS中的信息是智能體對環境信念的學習表征的向量。它們不僅包含關于智能體和環境的當前和未來狀態的信息。每個數字與智能體或環境的任何物理屬性都不對應。除非有經過訓練的BAMS模型,否則不可能解碼信息。

4)智能體在訓練過程中達成默契。從實驗結果來看,使用BAMS訓練的智能體似乎可以在沒有明確通信的情況下理解彼此的意圖。

5)解碼后的信念圖為智能體的決策提供了一個粗略的解釋。在BAMS中,信念圖解碼器與策略網絡一起訓練。通過將信念圖與實際圖進行比較,系統接收到額外的反饋通道,從而監督訓練過程。在執行過程中,信念圖提供了一種解釋智能體隱藏狀態的方法,可以進一步用于解釋智能體的行為。

付費5元查看完整內容

本報告是在 FA9453-19-1-0078 資助下編寫的。首先,提出了兩種數值方法來解決通信和導航中產生的非線性優化問題。其次,開發了兩個關于機器學習模型的解決方案質量和安全性的結果。

該研究項目的目標是開發高效的大規模非線性優化算法,以解決通信和導航方面的數據分析問題。這些問題被公認為在數學上具有挑戰性,并與空軍的利益直接相關。

在資助期間,我們成功研究了兩個研究方向。首先,我們設計了大規模非線性優化問題的最佳一階方法。在這個方向上,我們提出了兩個一階方法,可以對決策變量進行近似梯度更新。這兩種方法都可以解決分散通信的多Agent優化所產生的非線性優化問題。通過將多代理優化重新表述為約束性問題,我們開發的方法可以以最佳梯度/操作者評估復雜度來解決問題。我們開發的方法也可用于解決圖像重建問題。

第二,我們分析了機器學習模型中的解決方案質量和安全問題。在這個方向上,我們完成了兩個研究結果。我們的第一個成果是關于在多集群環境下,從二元結果的條件邏輯回歸模型中計算出來的估計值的屬性。我們表明,當每個單獨的數據點被無限次復制時,來自該模型的條件最大似然估計值漸進地接近最大似然估計值。我們的第二個結果是關于安全的矩陣乘法問題,我們設計了一種準確和安全地進行分布式矩陣乘法的方法。我們的安全協議可以確保在進行這種矩陣乘法的通信過程中沒有任何信息被泄露。

付費5元查看完整內容

Juneberry 旨在通過提供一個框架來針對多個數據集自動訓練、評估和比較多個模型,從而減少錯誤并提高可重復性,從而改進機器學習實驗。

付費5元查看完整內容

本報告重點討論了如何利用模擬或生成模型創建的合成數據來解決深度學習的數據挑戰。這些技術有很多優點:1)可以為現實世界中難以觀察到的罕見情況創建數據;2)數據可以在沒有錯誤的情況下被自動標記;3)數據的創建可以很少或沒有侵犯隱私和完整性。

合成數據可以通過數據增強等技術整合到深度學習過程中,或者在訓練前將合成數據與真實世界的數據混合。然而,本報告主要關注遷移學習技術的使用,即在解決一個問題時獲得的知識被遷移到更有效地解決另一個相關問題。

除了介紹合成數據的生成和轉移學習技術,本報告還介紹了實驗結果,這些結果對合成數據方法在飛行員行為克隆、車輛檢測和人臉驗證任務中的潛力提供了寶貴的見解。實驗的初步結果表明,軍事模擬器和生成模型可以用來支持深度學習應用。然而,性能往往受限于合成數據和真實世界數據之間的保真度差距。

1 引言

深度學習(DL)是一種技術,它提高了在廣泛的現實世界應用中實現復雜任務自動化的能力。翻譯、轉錄、視頻監控、推薦系統和自動駕駛汽車都是基于DL的解決方案已經被開發和部署用于商業目的的例子。在軍事領域,DL有可能支持人類在所有領域和戰爭級別的決策,其應用包括自動目標識別、預測性維護和無人駕駛車輛的自動控制。

與其他機器學習(ML)技術類似,DL使用算法來從數據中提取知識。在這種情況下,知識被編碼在大容量的深度神經網絡(DNNs)中,這些網絡可能由數千、數百萬甚至數十億的可調整參數組成,這取決于所考慮的任務的復雜性。為了正確調整這些參數,學習算法需要大量的訓練數據。沒有這些數據,DNN將無法泛化,因此,當遇到以前未見過的數據時,它將不會有好的表現。

獲取DL的訓練數據是困難的。這在商業應用中是存在的,而在軍事領域更是如此。瓶頸之一是,學習算法通常需要經過人工標注的數據(即為每個輸入數據點提供一個正確的答案)。因此,即使在獲取大量輸入數據相對低成本的情況下,正確標記所有的數據也往往是高成本和費時的。例如,Cityscapes數據集中的5,000個樣本中,每個樣本平均需要1.5個小時來標注(整個數據集大約需要十個月)[1]。此外,由于標注是由人類來完成的,其結果可能是不正確的、有偏見的甚至是有成見的,這也會反映在訓練過的模型的行為上。

此外,訓練數據往往存在長尾分布的問題。也就是說,對于數量有限的普通案例,訓練數據相對容易獲得,但對于大量重要的邊緣案例,訓練數據本身就很難獲得。例如,考慮一個基于無人機的軍用車輛監視和跟蹤系統。在這種情況下,友好車輛的空中圖像相對容易獲得。車輛數據可以在不同的地點、高度、角度、天氣條件、環境等方面獲得。獲取代表合格敵方車隊的類似現實世界的數據集通常是不可能的,因為這種侵入性的情報行動會導致對手的行動。使用遵循長尾分布的數據集訓練的系統通常實用價值有限,因為它只能在條件理想時使用(即,輸入數據與常見情況相似)。當遇到代表邊緣案例的真實世界的數據時,該系統將不會有好的表現,也不能被依賴。

1.1 目的和范圍

本報告的目的是介紹可用于解決軍事背景下有限訓練數據所帶來的一些挑戰的技術。具體來說,本報告重點討論如何將使用軍事模擬或生成模型創建的合成數據與微調、領域適應、多任務學習和元學習等遷移學習技術結合起來,以加速未來DL在軍事領域應用的開發和部署。

1.2 目標讀者群

本報告的目標讀者是操作、獲取或開發AI/ML/DL技術,用于或嵌入軍事系統的人員。

1.3 閱讀說明

本報告假定讀者具有關于ML和DL概念的基本知識,如監督學習、強化學習、損失函數、梯度下降和反向傳播。鼓勵缺乏此類知識的讀者在繼續閱讀本報告之前,先閱讀FOI-報告FOI-R-4849-SE[2]中的第二章。

1.4 提綱

第2章概述了在深度學習中可以用來生成和整合合成訓練數據的技術和方法。第3章概述了轉移學習技術,可以用來促進知識從一個任務到另一個任務的重用。在第4章中,對這些技術的一個子集進行了評估,并提供了深入了解合成數據方法潛力的實驗結果。第5章中提出了結論。

圖2.2: 一幅戰斗機的圖像(2.2a)通過添加噪聲(2.2b)、濾色器(2.2c)和模糊(2.2d),以及通過縮放(2.2e)和縮放后的旋轉(2.2f)得到增強。每幅圖像都附有所有像素的平均RGB值分布的相應圖表。雖然所有圖像在語義上是不變的,但分布的形狀卻有很大的不同。

圖4.7:從我們的訓練數據集中隨機選擇的合成圖像。對于每一對圖像,左邊顯示的是最初生成的臉,右邊顯示的是編輯過的臉。請注意,所有圖像都在臉部周圍進行了裁剪。

付費5元查看完整內容
北京阿比特科技有限公司