亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

1.0 總結

機器學習在商業領域的巨大成功未能轉化為高性能的軍事應用。盡管深度學習開始在一些特定的軍事任務中顯示出令人印象深刻的結果,但由于它們需要極其龐大的、有標簽的訓練集,目前的能力不能充分地發揮。軍方需要一支由人工智能和機器學習專家組成的世界級團隊,在標簽高效半監督學習、模型轉移和主動學習方面的進行必要創新,來解決實際的軍事學習問題。為了滿足這一需求,Charles River Analytics公司組建了一支由概率建模和機器學習相關領域的研究人員以及從業人員組成的優秀團隊,提供概率標簽高效的深度生成結構(PLEDGES)。

我們在概率建模和深度學習的結合點上進行了開創性的研究。概率模型有利于少標簽學習,因為與需要基于標簽的誤差函數的神經網絡不同,它們可以使用任何種類的觀察,其中可以包括標簽,但不依賴于標簽。因此,概率模型對半監督學習很有用,因為它們可以從無標簽的數據中學習盡可能多的知識,并使用少量的有標簽的數據對其進行擴充。它們對模型轉移也很有用,因為它們是用有語義的組件來構造的,這些組件可以被組合和重新應用,以便將模型有效地轉移到新領域。概率模型還通過提供精心校準的不確定性估計來直接支持主動學習,這些估計是對哪些實例進行標記的重要基礎。

為了確保概率模型的高性能,它們必須與深度學習表征相結合。我們研究了三個主要方向。首先,我們開發了結構化深層概率模型(SDPMs),它在無標簽的數據觀察上定義了結構化和無關聯的聯合概率分布。SDPMs提供了類似于神經的表征,在從少數標簽中學習的同時,具有與最先進的神經方法相媲美的性能。第二,我們致力于在大容量的概率模型實現高效和準確的算法,完成了對傳統概率模型的數量級改進,使我們能夠使用反映最先進神經網絡結構的模型。第三,我們開發了用于半監督和弱監督學習的深度學習模型的概率模型變體,包括用于少數鏡頭視覺分類和目標檢測的元學習方法,以及用于零鏡頭目標檢測的弱監督方法

特別地,在PLEDGES項目中我們:

  • 開發了概率模型和模型組件,以支持用較少的標簽學習。這些模型包括變異SDPMs和可操作的大容量模型
  • 開發了從大量未標記的訓練數據和少量標記的訓練數據中學習模型的方法。
  • 開發了將從通用數據集學習到的模型轉移到特定應用程序的方法,在新應用程序中使用很少的標簽。
  • 開發了推薦專家標記實例的方法。

我們使用這些概率模型和方法來支持LwLL的關鍵成分:半監督學習、模型轉移和主動學習。我們能夠在SDPM和可操作的高容量模型上取得更大的進展,我們的工作表明,這兩種方法都有很好的前景,比以前的概率模型有更高的準確性和可擴展性。我們還發現,神經模型的概率公式可以帶來重大進展。我們的簡單CNAPS方法在幾張照片的視覺分類上取得了比最先進的方法(包括CNAPS)更大的進步。簡單的CNAP也構成了各種擴展的基礎,包括一個顯示出進一步改進的transductive版本。對于主動學習,我們的基礎工作產生了一套基于數據重要性的新方法,并且我們能夠展示對基于不確定性采樣的現有方法的改進。

關鍵詞:概率模型、Scruff、結構化深度概率模型、半監督學習、模型轉移、主動學習、變異方法、可分離信念傳播

2 引言

2.1 問題描述

機器學習的在商業領域的巨大成功未能轉化為高性能的軍事應用。盡管深度學習開始在一些特定的軍事任務中展現出令人印象深刻的成果,但目前由于需要極其龐大的、有標簽的訓練集,深度學習能力還未能充分發揮。與商業應用不同,大多數重要的軍事應用都有目標對象、事件或未翻譯的單詞,而這些目標對象、事件或單詞往往是新穎的,沒有大規模的真實標簽。另外,標簽的專業知識是有限的,這就禁止了從人群中創建標簽數據集。基于軍事學習的應用需要新的無監督和半監督學習方法,以實現深度學習系統的性能,但只需要10到100個標簽。此外,學習算法必須有效地利用有限的軍事專家和訓練數據,例如,通過主動識別最具代表性和最不自信的學習實例。最后,用于識別軍事目標和活動的學習模型必須具有新的組件重用級別,以通過模型重組進行適應。機器學習應用程序因其龐大的機制而臭名昭著,這些機制很難擴展,并且無法在任務和應用程序之間推廣。解決這些挑戰需要基本的新思維來超越當前機器學習的局限性,需要在標簽高效半監督學習、模型轉移和主動學習方面進行必要的創新,以解決現實世界中的軍事學習問題。

今天,基于深度神經網絡的方法在機器學習的研究中占主導地位。盡管取得了許多成功,但神經網絡有幾個關鍵的局限性,包括數據需求量大,渴望數據,需要大量的標記數據。兩相對比,這使得概率方法非常有吸引力,它需要的標記數據要少得多。概率模型有利于標簽效率的學習,因為與需要基于標簽的誤差函數的神經網絡不同,它們可以使用任何種類的觀察,其中可以包括標簽,但不依賴于標簽。因此,概率模型對半監督學習很有用,因為它們可以從無標簽的數據中學習盡可能多的知識,并使用少量的有標簽的數據對其進行擴充。它們對模型轉移也很有用,因為它們是用有語義的組件來構造的,這些組件可以被組合和重新應用,以便將模型有效地轉移到新領域。概率模型還通過提供精心校準的不確定性估計來直接支持主動學習,這是對哪些要進行標記的實例所做知情決策的基礎。

事實上,概率模型一直是無監督和半監督學習的主要方法之一,像k-means聚類這樣的方法使用得非常廣泛。然而,正如這個例子所示,用于無監督學習和半監督學習的概率模型往往很簡單;k-means本質上是就是高斯方法的混合物。過去,概率方法的性能落后于神經網絡,主要原因是難以將推理和學習的規模擴大到海量的模型中。因此,為了達到美國防部重大應用所需的實際效果,概率模型必須與深度學習方法相結合

我們預計,我們的努力成果將在有效推斷和學習豐富概率模型的能力方面取得革命性進展,使深度概率方法最終成為在非概率深度學習在現實問題中的可行替代方法。這些進步將帶來比當前基于神經網絡的方法更好的半監督學習、模型轉移和主動學習方法。

2.2 技術方法

我們在團隊最近將概率模型與深度表示相結合的工作基礎上進行了改進。我們沿著三個平行的方向前進。

首先,我們為半監督和弱監督的學習開發了深度學習模型的概率模型變體。我們稱這些模型為結構化深度概率模型(SDPMs)。這項工作建立在最近的語言創新上,如Edward、Pyro和Probabilistic Torch,后者是由聯合創始人JanWillem van de Meent領導。這些框架使用變異方法來訓練概率模型,其中神經網絡定義了條件分布,將深度學習的靈活性與概率模型的數據效率相結合。使用這些方法的初步工作被證明是非常有效的。在每個類別只有10個標簽的情況下,我們使用概率Torch在數據集上取得了超過90%的分類準確率,例如使用美國國家標準與技術研究所(MNIST)的修改數據集進行測試。在此工程中,我們以各種方式擴展了這些方法,以獲得明顯高于其他概率變異方法的準確性。

對于第二個方向,我們為高容量概率模型尋求高效準確的算法,這些模型反映了最先進的神經網絡的結構,同時保持完全概率。該方法基于PI-Avi-Pfeffer最近的工作,該工作表明,通過使用稱為可分離信念傳播(SBP)的方法編碼有關聯合分布的信息,任何有向概率模型都可以轉換為二級模型,在該模型中,推理是按線性時間進行且準確的。深度學習的成功依賴于這樣一個事實,即大多數觀察到的數據都存在于一個可以稀疏表示的低維流形上,這為我們提供了強有力的理由,讓我們相信,對于現實世界的軍事應用來說,二級模型是很小的。因此,使用SBP的高容量概率模型可以實現與神經網絡方法類似的可操作性,同時在低標簽真實美國防部問題上擁有更好的性能。

對于第三個方向,我們對現有的非概率深度學習方法進行了概率性的重新解釋和變體。特別是,我們開發了簡單CNAPS算法,這是一種用于少數鏡頭視覺分類的元學習算法,該算法具有神經特征提取器和概率分類器,并且從具有有限標簽的數據中學習。我們還開發了一個簡單CNAPS的歸納版本,以及一個用于0-shot/any-shot物體檢測的弱監督學習方法。

我們使用在這兩個線程下開發的概率模型來提供LwLL的關鍵組成部分:半監督學習、模型轉移和主動學習。半監督學習的成功依賴于在沒有標簽的情況下學習有關領域的大部分知識,只剩下少量參數需要從標簽數據中學習。概率模型自然適合于半監督學習,因為豐富、高度結構化的模型可以單獨從未標記的數據中學習。該模型可以是一個具有多個參數的復雜網絡,這些參數可以從大量未標記數據中精確擬合,然后通過具有少量參數的薄標記層進行擴展,以從少數實例中學習。我們通過成對學習來增強這一洞察力,在這種學習中,我們比較和對比不同的數據實例,以了解它們的比較標簽,即使它們本身沒有標簽。與類標簽相比,成對比較噪音更小,信息更豐富,因此可以更好地利用稀疏標簽。在最初的工作中,我們確定,通過合并比較,我們可以在只有80個樣本的數據集上訓練和優化具有5974577個參數的神經網絡。

對于模型傳輸,概率方法允許我們組合語義上有意義的模型組件,并將其重新應用于新情況。我們在這一見解的基礎上提出了一些切實可行的想法。非參數方法通過識別不屬于任何已知類的相似實例簇,使我們能夠識別新的對象類,即使該類的標記實例為零。概率零點學習方法還使我們能夠使用輔助信息來識別沒有標記實例的類的實例。重新編程方法使我們能夠通過在應用程序之間映射概念,例如輸入、輸出和概念的內部表示,將原始模型轉移到新的應用程序。

對于主動學習,我們使用了一種基于概率模型的決策理論方法。現有的大多數主動學習工作有兩個目標:挑選最不自信的實例,以及挑選最有代表性的實例。雖然對于可以直接定義相似性度量的簡單任務,已經實現了將這些目標結合在一起,但對于大多數實際應用來說,相似性度量并不容易獲得。我們基于數據重要性的概念開發了一種新的主動學習方法,并將這些方法與SDPM相結合。

2.3 技術目標

查爾斯河分析公司(Charles River Analytics)與東北大學、不列顛哥倫比亞大學(UBC)和加利福尼亞大學歐文分校(UCI)的合作者一起,開發了概率標簽高效深度生成結構(PLEDGES),用于少標簽學習(LwLL)。我們在概率建模和深度學習的結合點上進行了開創性的研究。與需要使用基于標簽的誤差函數的神經網絡不同,概率模型可以使用任何種類的觀察,它可以包括標簽,但不依賴于標簽。我們開發了結構化深度概率模型(SDPMs),它在無標簽的數據觀測上定義了結構化和無聯系的聯合概率分布;開發了可操作的大容量概率模型,它能在大型網絡上進行快速和準確的推理;開發了概率的重新解釋和神經算法的變體。

我們對SDPMs的研究目標有三條線。首先,對于半監督學習來說,SDPM提供了類似于神經的表征,能夠在從少數標簽中學習的同時擁有與最先進的神經方法相媲美的性能。因此,SDPM是半監督學習的理想選擇,因為它們可以從未標記的數據中學習盡可能多的知識,并使用少量的標記數據來增強這些知識。第二,要把學到的知識從一個模型轉移到一個有少量標簽的新模型,SDPM也是模型轉移的理想選擇,因為它們的結構是使用有語義的組件,這些組件可以被組合和重新應用,把模型有效地轉移到新領域。第三,對于學習系統可以對數據提出問題的主動學習來說,概率模型也直接支持主動學習,因為它提供了經過良好校準的不確定性估計,這是決定對哪些實例進行標記的基礎。

2.4 相關工作

為了開發適用于大規模應用的實用概率模型,我們以最近的變異推理發展為基礎。在這一工作中,我們開發了新的攤銷變分推理方法,它訓練神經網絡使用隨機梯度下降進行推理。攤銷變分方法已經在Edward、Pyro和Probabilistic Torch等語言中得到了應用。Probabilistic Torch的設計從一開始就考慮到了半監督學習策略,并且已經被證明是非常有效的;每個類別只有10個標簽,我們在MNIST等數據集上的分類準確率已經超過90%。概率Torch還提供了一個高質量的組件庫,可以從組件中組裝出復雜的模型。例如,這使我們能夠將一個物體檢測模型嵌入到第二個識別圖像中感興趣區域的模型中,從而形成一個可以以端到端、半監督方式訓練的多目標檢測模型。我們在現有Probabilistic Torch工作的基礎上,取得了一些創新的進展,包括針對活動識別和機器翻譯等順序性問題的攤銷式順序推理,以及適應概率程序推理的技術來估計全局變量。

我們對高容量、完全概率模型的研究受到Wood開發的一種叫做推理編譯的方法的啟發,這種方法學習一個神經網絡來回答一個由概率程序定義的查詢。雖然有效,但學習的網絡不是一個聲明性的概率模型,只能回答單一種類的查詢,而不是為推理提供一個數據結構。我們的關鍵見解是,我們可以將原始的概率模型編譯成一個替代的概率模型,該模型支持原始模型的所有功能,但其中的推理是按照線性時間進行的。這使得概率模型的所有優勢都能被用于具有數百萬個參數的模型,如最先進的神經網絡。還有其他方法將概率模型編譯成支持線性時間推理的數據結構,如算術電路和和積網絡,但這些電路一般是指數級大小。相比之下,我們的數據結構在緊湊型網絡中捕捉潛在的復雜信息,類似于緊湊型神經網絡,后者代表了豐富的實際應用功能。使概率模型具有如同神經網絡一般的靈活性和性能將產生深遠的影響,這不僅關系到較少標簽的學習,同時也還包括其他很多方面。概率模型解決了神經網絡的一些基本局限,例如難以納入先驗知識,需要大量數據,以及因果關系建模困難。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

美國國防部(DOD)對充分利用機器學習(ML)算法的優化能力和建立人工智能(AI)支持的系統越來越感興趣,這些系統可以加快決策的及時性和準確性,以支持國防部任務。隨著計算資源可用性的提高,現在可以將ML算法應用于有數千個參數的模型,以及處理TB 和 PB 數據。

ML庫和現成解決方案的可用性有時給人的印象是,實施人工智能軟件系統(AI系統)很容易。然而,開發可行的、可信賴的人工智能系統,并將其部署到現場,并能在數十年內進行擴展和發展,需要大量的規劃和持續的資源投入。以下是我們**在軟件工程、網絡安全和應用人工智能方面的工作所得出的做法,是面向決策主體的人工智能工程建議。對于美國國防部的任務,來自采購和軍事行動的角度帶來了額外的考慮,將在未來的報告中討論這些問題。

軟件工程原則適用于人工智能工程

在提出以下建議的同時,請記住,人工智能系統是一個軟件密集型系統。設計和部署高質量軟件系統的既定原則適用于人工智能系統工程。團隊應該遵循現代軟件和系統工程實踐,以及國防創新委員會的軟件十誡等準則。團隊應該努力按時和高質量地交付功能,設計出具有架構意義的要求(如安全性、可用性、可靠性、性能和可擴展性),并計劃在整個生命周期內維持系統。然而,傳統軟件系統中的一些問題在人工智能系統中被夸大了,特別是包括ML組件的系統:

  • 工程團隊將需要針對其組件、數據、模型和輸出中固有的不確定性來設計人工智能系統。

  • 工程團隊將需要適應管理不同的變化節奏。人工智能系統的變化速度在整個系統中是不一致的。數據和模型可能會非常頻繁地變化,這可能意味著也可能不意味著對系統其他部分的變化。

  • 管理數據將需要更多的資源,無論是在前期還是在系統的整個生命周期。

  • 核實、驗證和保護人工智能系統將需要考慮到模糊性,以及由于頻繁變化的數據和模型的基本性質而增加的攻擊面。

11項基礎實踐準則

1.確保你有一個可以且應該由人工智能解決的問題。從一個定義明確的問題開始,了解你想完成的任務和你需要的結果,同時確保你有可用的數據來推斷這些結果。一旦你知道你有一個潛在的人工智能問題,請驗證其他更簡單的選項--可能是更好的解決方案--不存在。人工智能不是萬能的,對于其他解決方案可能已經存在的問題,人工智能往往是一個更復雜、更低效的解決方案。

2.你的軟件工程團隊中包括高度整合的主題專家、數據科學家和數據架構師。有效的人工智能工程團隊由問題領域(主題專家)、數據工程、模型選擇和細化、硬件基礎設施和軟件架構方面的專家組成,此外還有其他典型的軟件工程專業知識。這些團隊成員帶來了算法選擇、模型構建、模型定制和數據管道管理方面的必要技能,這些技能構成了人工智能系統的核心。包括那些能夠處理好設計好的工具的稀缺性和這些系統在性能、可擴展性、帶寬、資源管理和版本方面的高要求的團隊成員。

3.認真對待你的數據,防止它毀壞你的項目。數據攝取、清理、保護、監測和驗證是成功的人工智能系統工程所必需的,它們需要大量的資源、時間和注意力。確保你的過程考慮到:

  • 環境中的變化

  • 可能的偏見

  • 在整個系統的生命周期中,有可能被敵方利用

人工智能系統的輸出與用于訓練系統的數據以及訓練數據與問題和當前世界的關聯程度有著內在的聯系。數據可能會出很多問題,從格式的改變會破壞攝取功能,到惡意將數據注入訓練集,導致不正確的模型或數據泄漏,到數據缺乏多樣性或感興趣的類別的足夠例子。這些挑戰需要一個全面的數據管理策略和監督功能。自動化是管理數據的關鍵,但團隊應該平衡自動化與可觀察性和可訪問性。

4.根據你需要模型做什么來選擇算法,而不是根據它們的受歡迎程度。算法在幾個重要的維度上有所不同:它們能解決什么樣的問題,輸出的信息有多詳細,輸出和模型的可解釋性如何,以及算法對對手(通過操縱訓練數據、干擾反饋回路等)的魯棒性如何。選擇一種適合你的問題并能滿足你的業務和工程需要的算法。隨著系統需求的發展和工作環境的變化,算法也可能隨之改變。

5.通過應用高度集成的監測和緩解策略來保護人工智能系統。由于在理解其復雜模型的功能和對數據的依賴方面存在挑戰,人工智能系統的攻擊面被擴大。這些額外的攻擊面維度使傳統的硬件和軟件攻擊面的脆弱性更加復雜。通過進行持續的評估和驗證來應對這種情況--鑒于當今攻擊和防御的快速發展,這些活動尤為重要。

6.定義檢查點,以考慮到恢復、可追溯性和決策理由的潛在需求。人工智能系統對輸入數據、訓練數據和模型之間的依賴關系非常敏感。因此,任何一個的版本或特征的變化都會迅速地--有時是微妙地--影響其他的。在模型周期性變化的系統中,根據使用的時間框架對模型進行改版就足夠了。在模型經常或持續變化的系統中,仔細考慮何時和如何將輸入數據與用于評估的模型相關聯,以及如何捕獲和保留該信息。小心地管理這些依賴關系和版本。

7.結合用戶體驗和互動,不斷驗證和發展模型和架構。盡可能使用自動化方法來捕捉人類對系統輸出的反饋,并改進(即重新訓練)模型。監測用戶體驗,以盡早發現問題,如系統延遲或準確性降低等形式的性能下降。即使在低互動的系統中,也要確保人類的持續參與,以監測計算機無法編碼評估的判斷(實際的、倫理的、道德的、信任的、與風險有關的)--以及模型篡改或系統濫用的跡象。一定要考慮到用戶和管理自動化的偏差。

8.設計對輸出中固有模糊性的解釋。人工智能輸出需要比其他大多數系統更多的解釋。在某些情況下,人工智能系統所帶來的不確定性可能是任務和用戶所不能接受的。納入機器學習組件也需要對輸出的不確定性和可靠性程度進行設計,以幫助解釋和保證輸出。一些人工智能系統組件可能需要連續監測和儀表等技術。

9.實施松散耦合的解決方案,可以擴展或替換,以適應不可避免的數據和模型變化以及算法創新。由于數據的糾纏,人工智能系統各組成部分之間的界限比傳統系統中的界限惡化得更快。此外,由于未預料到的直接和間接的數據依賴性,變化的影響加劇。這些依賴性可能會引發功能、預期產出,甚至是支持系統的基礎設施的變化。在設計和維持人工智能系統時,要不斷運用工程的基本設計原則來開發松散耦合、可擴展、可升級和安全的系統。

10.投入足夠的時間和專業知識,以便在系統的生命周期內進行持續和持久的變革。團隊十有八九明顯低估了所需的資源。構建人工智能系統最初需要更多的資源,需要迅速擴大規模,并在系統的生命周期中投入大量的精力或資源。這些資源包括計算、硬件、存儲、帶寬、專業知識和時間。

11.將道德規范作為軟件設計的考慮因素和政策關注點。評估系統的每個方面的潛在道德問題。在系統的所有方面,從數據收集到決策,再到性能和有效性的驗證和監測,都要考慮到組織和社會價值。數據收集往往會引起隱私問題,在某些情況下還會觸及其他倫理問題,但數據收集并不是唯一需要關注的領域。系統如何使用(例如,自主軍用無人機)、數據表現(例如,面部識別中的種族、性別、殘疾多樣性)和模型結構(包括信貸或就業決策中的受保護特征)也可能是倫理問題。

最后的思考

唯一不變的是變化。設計、部署和維持人工智能系統需要工程實踐來管理固有的不確定性,以及不斷增加的變化節奏。人工智能系統的算法、實踐和工具在不斷發展,這些系統帶來的變化跨越了問題、技術、流程、工程和文化的界限。這些人工智能工程實踐為決策者提供了一個基礎,以駕馭這些變化,開發可行的、可信賴的和可擴展的系統。隨著我們建立和使用這些系統,我們將定義更好的編纂工程和數據管理實踐以及工具。

關于SEI

卡內基梅隆大學軟件工程研究所是聯邦資助的研究和開發中心(FFRDC),與國防和政府組織、工業界和學術界合作,推進軟件工程和網絡安全領域的技術水平,以惠及公眾利益。

作為卡內基梅隆大學的一部分,SEI是在開拓新興技術、網絡安全、軟件采購和軟件生命周期保障方面的國家資源。

付費5元查看完整內容

1. 簡介

機器學習(ML),從廣義上講,是一類自動優化參數以處理給定輸入并產生所需輸出的計算機算法。ML的一個經典例子是線性回歸,據此找到一條最適合(通過)一組點的線。最近的一個例子是分類任務,如用 "貓 "這樣的單字來標記一張百萬像素的圖像。

對于許多應用,ML完成了人類可以做得同樣好的任務。然而,ML在兩種情況下大放異彩:1)任務的數量巨大,例如數百萬;2)問題的維度超出了人類思維的理解。一個簡單的例子是同時實時監控成千上萬的安全攝像頭,尋找可疑的行為。也許一個ML方法可以發現異常事件,并只與人類觀察者分享這些視頻片段。更好的是,異常圖像可以被暫時貼上諸如 "1號入口處的蒙面入侵者 "之類的標簽,以幫助保安人員只關注相關的信息。

除了減少人類的負擔外,ML還可以將人類可能無法識別的復雜的相互聯系拼湊起來。例如,一個ML算法可以發現,在一百萬個銀行賬戶中,有五個賬戶的交易似乎是同步的,盡管它們沒有相互發送或接收資金,也沒有向共同的第三方發送或接收資金。

鑒于手持和固定設備的計算資源不斷增加,我們有必要想象一下,ML可以在哪些方面改變戰爭的打法。當然,ML已經對美國陸軍的科學研究產生了影響,但我們也可以很容易地想象到自主車輛和改進的監視等作戰應用。

本文件的主要目標是激勵美國陸軍和美國防部的人員思考ML可能帶來的結果,以及為實現這些結果,哪些研究投資可能是有成效的

5. 使用機器學習的ARL研究

在ARL的許多研究項目中,機器學習目前正在被使用,或者可以被使用。我們列出了一些使用ML或可能從ML中受益的研究項目。我們列出的與ML相關的ARL研究工作絕非完整。

6. 軍隊作戰應用

雖然從技術上講,機器學習自19世紀初高斯發明線性回歸以來就一直存在,但我們相信,ML的最新進展將以我們目前無法想象的方式影響軍隊。在本節中,我們概述了我們認為將得到加強的軍隊行動的許多領域,以及可能采用的ML方法的種類。

6.1 軍事情報

軍事情報包括信息收集和分析,因為它涉及到指揮官做出最佳決策所需的信息。由于收集的數據量越來越大,處理必須自動化。需要考慮的主要問題是數據的數量、速度、真實性和多樣性。大量的數據(又稱大數據)需要在許多計算節點上對數據進行智能分配。速度要求快速計算和網絡連接到數據流。真實性是對信息來源和異常檢測的信任問題。多樣性相當于使用許多不同的ML算法的不同訓練模型的應用。我們在本小節中概述了不同類型的數據和分析要求。

6.1.1 自然語言處理

讓計算機從從各種媒體來源收集到的大型文本數據庫中提煉出重要的概念和文本部分,有很大的好處。最近報道的另一個ML突破是不同語言之間的精確文本翻譯。 軍隊的一個獨特挑戰是翻譯不常見的語言,因此專業翻譯人員較少。在人工通用智能(AGI)領域,一些團體聲稱,自然語言處理將是類似人類認知的基礎。

6.1.2 數據挖掘

鑒于人類、傳感器和代理產生的數據的激增,一個很大的問題是,除了證明其收集的直接用途之外,這些數據還包含什么剩余價值。數據挖掘可以是統計學和機器學習的努力,以發現數據中的模式,否則人類操作者就會錯過。

6.1.3 異常檢測

傳統上,異常檢測是通過首先識別已知數據的群組和描述數據的分布來進行的。然后,當新的輸入被處理時,它們被識別為屬于或不屬于原始分布。如果它們在已知分布之外,就被認為是異常的。以下許多類型的異常檢測系統可能對軍隊有用。

  • 網絡入侵檢測:超出常規的網絡流量。McPAD和PAYL是目前使用的軟件中的2個這樣的例子,它們使用了異常檢測。

  • 生活模式異常:人們的視覺和生物統計學上的行為方式與常人不同,表明他們可能正在進行一些對抗性行動。

  • 基于條件的維護:在當前生命周期中,材料/系統在其年齡段不典型的信號。

  • 士兵異常:有理由相信士兵的生物識別技術不正常。

  • 異物檢測:在已知物資數據庫中無法識別的物體的視覺效果。

6.2 自主性

6.2.1 自動目標識別

自動目標識別(ATR)是一個非常成熟的領域,已經使用機器學習幾十年了。

1)目前深度學習的進展將在多大程度上增強ATR?

2)更復雜的算法是否需要更復雜/更耗電的機載計算?

  1. ML是否能對目標的各種欺騙性的混淆行為具有魯棒性?

  2. 強化學習在多大程度上可以用來進行實時軌跡調整?

6.2.2 機器人學

機器學習在機器人學中的應用也是一個巨大的領域。ML應用領域包括傳感、導航、運動和決策。目前,傳感將從計算機視覺的所有進展中受益。導航,除了使用標準的GPS之外,還可以從自我運動中受益,也就是基于自身感知的運動估計。運動可以被學習,而不是規劃,這不僅會導致更快的開發時間,而且還能在新的環境或受損的模式下重新適應(例如,失去四條腿中的一條)。最后,隨著機器人的數量超過人類操作員的數量,機器人將有必要自行決定如何執行其規定的任務。它將不得不做出這樣的決定:"由于電池電量不足,我是否要回到大本營?"或者 "我是否繼續前進一點,然后自我毀滅?"

6.2.3 自愈性

除了機器人技術,人們最終希望任何系統在損壞或不能滿負荷工作時能夠自我糾正。這需要在某種程度上的智能,以自主診斷缺陷和問題,并利用其可用的資源糾正這些問題。

6.2.4 倫理

在通過機器學習來學習自主權的情況下,問題將是:"自主系統將如何應對X情況?" 這里的問題是,對于一個擁有潛在致命武力的系統,我們怎么能確定它只會正確合法地使用武力?我們推測,在機器學習的算法擁有使用致命武力的實際能力之前,必須對其進行廣泛的測試,即使它與人類的環形決策相聯系。

6.3 通過玩游戲來訓練智能代理

近年來,大量的研究都在研究使用機器學習來自主地玩各種視頻游戲。在某些情況下,報告的算法現在已經超過了人類玩游戲的水平。在其他情況下,仍然存在著處理長期記憶的挑戰。對于美國空軍來說,智能代理已經成功地在以戰斗為中心的飛行模擬器上進行了訓練,這些模擬器密切模仿現實生活。陸軍的問題包括以下內容。

  • 智能代理能否附加到機器人平臺上?

  • 智能在多大程度上可以通用于處理現實生活與視頻游戲中遇到的各種情況?

  • 當我們可能不理解一個訓練有素的代理的邏輯時,我們能相信它的行動嗎?

  • 代理在多大程度上能夠與人類合作?

6.4 網絡安全

在過去的十年里,機器學習在網絡安全方面發揮了不可或缺的作用。具體來說,ML可以用于異常檢測,檢測已知威脅的特定模式,并辨別網絡行為是否可能由惡意代理產生。隨著該領域的不斷加強,問題是ML是否能使安全比對手領先一步,因為對手可能利用ML來混淆檢測。

6.5 預測和結構健康監測

一個長期的設想是,軍隊使用的每一個機械系統都有一些關于系統當前和預測健康的內部感應。相關問題如下。

  • 我們能從有限的傳感器中辨別出一個系統或系統組件的當前健康狀況嗎?

  • 機載ML能否預測一個系統或系統部件在暴露于特定環境或彈道侮辱之后的健康狀況?

6.6 健康/生物信息學

6.6.1 序列挖掘

隨著基因組序列的數量繼續呈指數級增長,比較在現場獲得的序列所需的計算工作可能變得無法管理。機器學習可以通過對序列進行不同層次的分類來減少必要的比較。

6.6.2 醫學診斷

93 近年來,機器學習已經在檢測各種組織中的惡性腫瘤方面取得了長足的進步。94 它同樣可以被用來描述創傷或創傷后應激障礙(PTSD)95,并制定治療計劃。

6.7 分析

陸軍的一個重要組成部分集中在對行動、系統、研究和測試的分析上。傳統上,分析人員使用大量的工具,包括機器學習,以多維回歸、聚類和降維的形式。隨著深度學習的出現,一套新的工具應該是可能的,可以更有效地處理需要更復雜模型的大型數據集。例如,應該有可能從測試期間拍攝的視頻流中提取特征和物理屬性,這可能超過目前的標準做法。

6.8 機器學習的其他用途

  • 自適應用戶界面(AUI)和情感計算。ML可以用來確定用戶的心理和/或情緒狀態,并提供適合這種狀態的界面。此外,可變的AUI可以服務于用戶的變化。例如,一些用戶可能喜歡音頻反饋而不是視覺反饋。

  • 推薦系統。最流行的推薦系統之一是根據以前看過的電影的評分來選擇用戶想看的下一部電影(例如,所謂的 "Netflix問題")。對于軍隊來說,可以根據以前的使用情況和庫存核算的反饋來推薦后勤補給的情況。

  • 搜索引擎/信息檢索。傳統上,搜索引擎返回文件的 "點擊率"。新的范式是以簡明的形式回答用戶的問題,而不是簡單的模式匹配。

  • 情感分析。社交媒體上的流量和對環境進行訓練的各種傳感器不僅可以檢測關鍵的關鍵詞或特定物體的存在,還可以推斷出可能的攻擊的可能性。

  • 有針對性的宣傳。傳統上,宣傳是通過散發傳單來完成的,如今,宣傳可以通過社交媒體來傳播。ML的角度是如何以最有說服力的信息向正確的人口群體進行宣傳。此外,重要的是快速檢測和顛覆來自對手針對我們自己的人員/人民的宣傳。

7. 機器學習的研究差距

本研究的目標之一是確定當前研究中的差距,這些差距可能會限制ML在軍隊研究和行動中的全部潛力。本節借用了ARL運動科學家Brian Henz博士和Tien Pham博士(未發表)的戰略規劃工作。

7.1 如何將軍隊的數據/問題納入當前的方法中

傳統上,在一個特定領域采用ML的一半戰斗是弄清楚如何適應現有的工具和算法。對于陸軍所面臨的許多問題來說,這一點更為突出,與其他學術、商業或政府用途相比,這些問題可能是獨一無二的。任何數據分析員面臨的第一個問題是使數據適應他們想要使用的統計或ML模型。并非所有的數據都使用連續變量或者是一個時間序列。離散/標簽數據的管理可能非常棘手,因為標簽可能不容易被轉換成數學上的東西。在自然語言處理中的一個例子是,單詞經常被轉換為高維的單熱向量。另一個例子可能是如何將大量的維修報告轉換為對某一特定車輛在一段時間內的表現的預測。

此外,陸軍的要求超出了典型的商業部門的使用范圍,不僅需要檢測物體和人,還需要檢測他們的意圖和姿態。這將需要開發新的模型。另一個大的要求是可解釋性,正如DARPA最近的一個項目所概述的那樣:是什么因素導致ML算法做出一個特定的決定?在一個真實的事件中,如果一個ML算法在沒有人類驗證的情況下宣布一個重要目標的存在,我們能相信這一決定嗎?

7.2 高性能計算

隨著對計算要求高的ML任務的設想,開發人員正在使用多線程、并行和異構架構(GPU、多核)來加快計算速度。ML的分布式實現遠不如GPU版本常見,因為分布式計算中的節點間通信存在固有的網絡瓶頸,而且在單精度浮點性能方面,GPU相對于CPU有很大優勢。除了目前對GPU的強烈依賴,生物啟發式神經計算旨在尋找非馮-諾伊曼架構來更有效地執行ML,并可能更快。這方面的一個例子是IBM的神經形態芯片。97 未來的研究應該關注如何分配ML處理,使節點之間的網絡通信最小化。另外,像聚類這樣的無監督學習算法在多大程度上可以被映射到神經網絡中?

其他需要考慮的事情。

  • 目前的ML軟件(特定的神經網絡)在一個小型的GPU集群中表現最好。

  • 大多數基于非神經網絡的ML算法的并行性不高,或者根本就沒有并行。

  • 另一個軍隊的具體挑戰是分析基本上沒有標記的數據集(例如,用無監督學習)。手動標注集群將是一種半監督學習的形式。

7.3 獨特的尺寸、重量、功率、時間和網絡限制因素

隨著進入偏遠地區或任何遠離基地的地區,軍隊必須限制系統的尺寸、重量和功率。此外,在 "激烈的戰斗 "中,時間是關鍵。例如,人們不能在遭到槍擊時等待作戰模擬的完成。最后,在其他商業發射器占主導地位的地區,或者在限制無線電通信以提高隱蔽性的情況下,網絡帶寬可能會受到很大限制。

在這種倍受限制的環境中,機器學習將需要有效地進行,而且往往是以一種孤立的方式進行。截然相反的條件是使用大型數據庫訓練大型神經網絡,這往往是最先進的機器學習功力的情況。商業部門正在開發自動駕駛汽車,據推測將使用低功耗的計算設備(如現場可編程門陣列、移動GPU)進行自主駕駛、道路/障礙物檢測和導航。然而,陸軍將有更多的要求,包括自主傳感器和執行器、態勢感知/理解、與人類的通信/合作,以及廣泛的戰場設備。這將需要多幾個因素的計算能力和特定算法的硬件,以實現最佳的小型化和低功耗。

7.4 用雜亂的或欺騙性的數據訓練/評估模型

在混亂的環境中,操作環境預計會有比通常密度更高的靜態和動態物體。此外,人們完全期待主動欺騙以避免被發現。我們也希望能夠開發出足夠強大的算法,至少能夠意識到欺騙,并相應地調低其確定性估計。

7.5 用小的和稀疏的數據訓練一個模型

基于CNN的目標分類的突破可以部分歸功于每個物體類別的成千上萬個例子的可用性。在軍隊場景中,某些人和物體的數據可能是有限的。人們最終將需要one-hot99或multishot分類器,其中幾個有代表性的數據條目就足以學習一個新的類別。到目前為止,最好的選擇是 "知識轉移",通過調整以前訓練的模型的所有參數的子集來學習新的類別。我們的想法是,由于需要優化的參數較少,修改這些參數所需的數據也較少。

7.6 專門針對軍隊相關目標的訓練模型

即使對于我們可以產生大量圖像的目標類別(例如,友好物體),我們也需要訓練自己的模型,以便從每個類別的潛在的數千張圖像中識別軍隊相關類別。軍隊還使用商業車輛中通常不存在的其他傳感模式(例如,熱能和雷達)。因此,需要為這些非典型的傳感設備訓練模型。從根本上說,非典型傳感設備可能需要新的神經網絡拓撲結構以達到最佳的準確性和緊湊性。

7.7 將物理學納入推理中

一個值得研究的有趣領域是將模型和模擬與機器學習相結合。有很多方法可以做到這一點。例如,ML可以用來推導出模擬的起始參數。此外,ML還可以用來處理模擬的輸出。一個耐人尋味的新領域是開發基于物理學或類似物理學的模擬,使用類似ML的模型/方程。一個這樣的應用是預測 "如果?"的情景。例如,"如果我跑過這棵樹呢?接下來會發生什么?"

7.8 軟人工智能

機器學習在傳統上被認為是人工智能的硬性(即數學)表現形式。有可能最終,所有的人工智能任務都會被簡化為數學。然而,就目前而言,一些智能任務似乎更多的是基于推理或情感。對于之前描述的方法中的任務,ML并不能充分解決以下軟性人工智能的特點。

7.8.1 類似人類的推理

人類并不總是完全按邏輯推理,但他們也有能力將不完整的信息拼湊起來,做出 "最佳猜測 "的決定。幾十年來,對這種行為進行編碼一直是一個挑戰。

7.8.2 情感

情緒似乎是驅動人類達到某些目的的動機/目標功能。例如,快樂可能會導致不活動或追求生產性的創造力。另一方面,恐懼則可能會導致忍氣吞聲。計算機是否需要情感來更有效地運作,還是說它們最好擁有100%的客觀性?這既是一個哲學問題,也是一個未來的研究方向。不過現在,毫無疑問的是,在人與代理人的團隊合作中,計算機需要準確地解釋人類的情感,以實現最佳的團體結果。

7.8.3 社會交流

與人類的互動性是陸軍研究未來的首要關注點。一個類似的問題是,不同的計算機系統之間如何進行交流,而這些系統不一定是由同一個實驗室設計的。研究的一個領域是用計算機來教那些在這方面有困難的人進行社會交流。 再一次,對于人與代理的合作,代理將需要能夠參與社會互動,并在人類的陪伴下遵守社會規范。

7.8.4 創造性

創造力通常被認為是隨機合并的想法,與新的元素相結合,由一個鑒別功能決定新創造的項目的功能和/或美學。在某些方面,創造力已經被某些計算機實驗室所證明。例如,為了設計的目的,計算機可以被賦予某些方面的創造力。

7.8.5 通用智能

人工智能的最終目標是將許多狹義的智能算法合并成一個統一的智能,就像人類的頭腦一樣。75鑒于許多狹義的人工智能任務已經比人類的某些任務要好,即使是早期的所謂人工通用智能(AGI)也可能具有一些超人的能力。AGI的一個主要目標是將目前由人類執行的某些任務自動化。

7.8.6 人工超級智能

如果不提及許多哲學家的猜測,機器學習將最終能夠改進自己的編程,導致能力的指數級提高,也許會遠遠超過人類智能,那么機器學習的研究就不完整了。這些設想既是烏托邦式的104,也是烏托邦式的105。希望超級智能能夠解決世界上的許多問題。

8.結論

在這項工作中,我們回顧了機器學習的不同類別,并描述了一些更常用的方法。然后,我們指出了一小部分關于ML在ARL中的應用的例子。最后,我們預測了ML在未來可以應用于軍隊的各個領域,并概述了為實現這一結果需要解決的一些挑戰。我們希望這份文件能夠激勵未來的研究人員和決策者繼續投資于研究和開發,以充分利用ML來幫助推動美國陸軍的發展。

付費5元查看完整內容

這項工作的目的是開發能夠成功處理復雜動態環境中順序決策的深度終身學習方法,重點是多Agent情報、監視和偵察(ISR)場景。我們為深度卷積神經網絡開發了一個新的架構,支持通過去卷積因子化的終身學習(DF-CNN),探索了通過Distral和Sobolev訓練的策略提煉的組合,并開發了一個混合控制器,將深度學習應用于ISR智能體。我們的方法在標準基準深度學習數據集、DOOM環境和ATE3模擬環境中的ISR場景中進行了評估。

我們的主要貢獻是反卷積因子卷積神經網絡(DFCNN)。DF-CNN框架調整了標準卷積神經網絡(CNN)框架,以實現任務之間的轉移。它在每個CNN層維護一個共享知識庫,并通過這個共享知識促進不同任務的CNN之間的轉移。每個具體任務的CNN模型的各個過濾層都是由這個共享知識庫重建的,隨著網絡在多個任務中的訓練,這個知識庫會隨著時間的推移而調整。DF-CNN代表了ELLA終身學習框架對深度網絡的概括。

實驗表明,DF-CNN在終身中的基準識別任務上的表現優于其他方法(包括單任務學習、低層的硬參數共享和漸進式神經網絡)。此外,該框架能夠抵抗災難性遺忘,同時仍然允許從未來的學習中反向轉移到以前學習的模型。

對于深度強化學習,我們研究了將Sobolev訓練整合到Distral多任務框架中,以努力改善轉移和訓練,探索了DF-CNN在深度RL中的應用,并開發了一個混合控制器,將本地學習的深度RL策略結合在一起,在ATE3仿真環境中完成ISR場景。

付費5元查看完整內容

摘要

本研究論文使用問題解決框架,研究了美國武器系統如何在采購生命周期的操作和支持階段陷入持續的陳舊和停滯循環,并提供了解決這種情況的方案。一些美國武器系統保持著它們最初在幾十年前投入使用時的能力。關鍵的發現,如厭惡風險的文化、系統要求低于計劃目標備忘錄的切割線、對財務指導的誤解、嚴格的維持法規、繁瑣的采購流程以及高于必要的決策,都被認為是導致根本問題的原因。這篇研究論文提出了幾個解決方案,解決了部分包容性的問題。對解決方案的整體可行性、對作戰人員的好處以及與實施相關的任何潛在風險進行了權衡。最后的建議包括鞏固和利用財務條例對作戰人員的好處,允許增加運營和維護資金的靈活性,允許在F3I重新設計中增加靈活性和性能,盡可能利用領先的商業技術,以及改變維持的心態,從保持準備狀態到保持相關性。結論強調,美國空軍在技術上落后于近似對手,高級領導人必須像對手一樣思考,以確保美國的法規不會抑制空軍比敵人更快地穿越OODA循環的能力。

引言

自朝鮮戰爭以來,美國在每次交戰中都保持著空中優勢;然而,一些跡象表明,空中優勢在未來的沖突中可能不再有保障。據報道,他們最新的S-500防空導彈系統成功擊中了近300英里外的目標。中國在過去十年中對其軍事進行了大量投資,現在已經達到了一個關鍵的自信點。

這個問題可能源于美國如何運作和資助其軍事項目。美國空軍將 "維持 "定義為維持一個武器系統的現有基線能力。任何改進武器系統超過其現有性能閾值的手段都被認為是開發工程的努力,需要從研究開發測試和評估(RDT&E)撥款中獲得資金。許多系統一旦投入使用就不會獲得RDT&E資金,通常在其生命周期的剩余時間內由運營和維護(O&M)撥款資助。由于對現行財務條例的嚴格解釋,財務經理通常會拒絕使用運營和維護資金來提高系統能力和應對不斷變化的威脅的創造性努力。這使得綜合產品小組(IPTs)沒有什么選擇,只能對他們的武器系統進行意義不大的改變,以保持它們在操作上的相關性。

美國不僅在做錯誤的財務決定,而且在做這些決定時也很緩慢。在過去的幾十年里,采購時間周期已經增加。據美國空軍高級領導人目前的估計,從授予合同到投入使用一個系統的時間超過10年。美國的對手在采購周期上的運作速度至少是其兩倍。在過去的二十年里,一些主要的國防采購項目(MDAP)已經被取消。事實上,國防部(DOD)已經在那些永遠不會投入使用的項目上花費了超過460億美元。

為了解決這個問題,新的倡議,如第804條快速采購和破解國防部5000號文件正受到相當大的關注。雖然它們不能解決撥款問題,但它們試圖縮短采購時間周期。在幾十年來成本成為采購決策的主要因素之后,速度現在被強調為主要考慮因素。使用問題/解決方案框架,本文將研究美國武器系統是如何陷入陳舊和停滯的循環中的,以及可以實施哪些解決方案來有效維持美國武器系統。

本文將首先闡明這個問題,描述綜合維持活動組(CSAG)和空軍維持中心(AFSC)內的幾個低效的供應鏈政策。然后,它將討論系統過時和對商業技術的依賴,接著是國防部緩慢的采購過程。問題部分最后將詳細分析當前的撥款限制以及美國空軍的幾個文化問題。

解決方案部分將首先定義具體的評價標準。該文件將提出幾個潛在的解決方案,以及建議的行動。然后將根據規定的標準對每個解決方案進行詳細評估,包括實施中的任何潛在風險。還將討論其他被考慮但未被推薦的解決方案。最后,本文將對問題進行快速總結,提出最終建議,以及為什么這項研究與美國空軍有關。

付費5元查看完整內容

摘要

指揮與控制(C2)的概念和實踐一直是與通信和信息技術共同發展的。最近人工智能(AI)的進步改變了信息技術世界的運行方式。這要求C2迅速適應,以充分利用人工智能的潛力。

深度學習(DL)一直處于人工智能近期發展的最前沿。作為一個例子,在計算機視覺領域,DL已經使物體檢測和分類模型的發展成為可能,在某些領域可以與人類的能力相媲美[1]。然而,DL算法通常是數據驅動的,它們需要在成千上萬的標記樣本上進行訓練。與軍事行動相關的注釋數據集可能很難得到。雖然開源數據集很容易獲得,但它們很少具備軍事行動背景下普遍存在的特征:

  • 多種傳感器模式(如可見光、紅外、熱或超光譜)。
  • 降級的圖像(噪音、模糊、低分辨率)。
  • 標記的專門軍事設備實例(不僅僅是日常普通物體)。
  • 空中視角(不僅是地面圖像)。

為了填補這一空白,有必要用數據收集活動來補充從開放源碼或盟友那里獲得的數據集。盡管數據收集本身需要大量的努力,但數據標記階段往往是創建數據集最耗費精力的步驟。它被認為是阻礙人工智能進一步應用的主要瓶頸[2]。由于時間的限制(這是一個漫長而乏味的過程)和內容專家驗證數據集質量的可用性,打標簽是一個挑戰。

在本文中,我們提出了Parakeet框架,該框架采用C2方法來建立標記數據集,為人工智能能力的發展和運作的成功創造必要的條件。這是通過確保適當利用現有資源(操作員、內容專家、時間和計算能力)來實現的。我們表明,用C2框架管理機器學習活動可以使物體檢測和分類模型的開發更快,這反過來將使C2性能更好,通過檢測、識別和跟蹤感興趣的物體和活動提供及時的情況分析。

1 引言

深度學習(DL)一直處于人工智能近期發展的最前沿。在計算機視覺領域,深度學習使得物體檢測和分類模型的發展在某些領域可以與人類的能力相媲美[1]。然而,DL算法通常是數據驅動的;它們需要在成千上萬的標記樣本上進行訓練。與軍事行動相關的注釋數據集可能很難得到。

為了填補這一空白,有必要用數據收集活動來補充從開放源碼或盟友那里獲得的數據集。盡管數據收集本身需要大量的努力,但數據標記階段往往是創建數據集最耗費精力的步驟。它被認為是阻礙人工智能進一步應用的主要瓶頸[2]。由于時間的限制(這是一個漫長而乏味的過程)和內容專家驗證數據集質量的可用性,打標簽是一個挑戰。

在這份概念文件中,我們認為人工智能能力開發過程需要以一種高效的方式組織起來,以確保效率(優化人類在數據集標簽上的努力)、信息質量保證(建立信任,確保模型的有效性和數據集的完整性)和性能(在預期的操作條件下衡量模型的性能)。

作為實現這一目標的第一步,我們提出了Parakeet框架,該框架將C2方法應用于標記數據集建設,為人工智能能力的發展和操作的成功創造必要的條件。這是通過確保適當利用現有資源(操作員、內容專家、時間和計算能力)來實現的。

最后,對C2如何從利用人工智能潛力所提供的新能力中受益的想法結束本文。

2 開發人工智能能力

2.1 AI開發策略

作為人工智能開發周期的一部分,明確定義需要開發的能力是很重要的。這可以在啟動階段完成,在這個階段應該定義模型的目的,以及量化的性能目標和預期的操作條件。這些因要執行的任務不同而會有很大的不同。在停車場統計車輛數量需要較低物的體定位精度比起跟蹤單個車輛的運動模式,盡管兩者都與傳感器反饋中的車輛檢測有關。必須考慮操作條件,因為深度學習算法對背景環境很敏感,當我們將一個在夏季條件下收集的數據集開發的模型應用到冬季環境中時,可能不會有預期的表現,因為雪的存在會影響照明條件和圖像對比度。

驗證最終結果也將是人工智能開發周期的一部分。雖然這一步通常是在最后,但在開始時就需要考慮,因為收集驗證數據可能會涉及到與訓練數據所需的相同工作量,同時進行這兩項工作會更有效率。評估最終結果的指標也應該在這個過程的早期確定,因為它們將在整個模型訓練階段使用。

在啟動和驗證階段之間,我們需要建立檢測模型并策劃訓練模型所需的數據集。這兩個步驟通常構成了整個過程中最耗費精力的部分,而我們提出的Parakeet框架旨在有效地管理這些資源。

2.2 收集數據集

與軍事行動相關的有標簽的數據集往往很難得到。雖然開源數據集很容易獲得,但它們很少呈現出軍事行動背景下普遍存在的以下特征:

  • 多種傳感器模式(如可見光、紅外、熱或高光譜)。
  • 降級的圖像(嘈雜、模糊、低分辨率)。
  • 標記的專門軍事設備的實例(不僅僅是日常普通物體)。
  • 多平臺視角(空基和地基圖像)。

上述人工智能開發周期的核心是需要適當的訓練和評估數據來開發一個模型并評估其性能。有三種方法有助于實現這一目標:

  • 挖掘: 充分利用外部資源,調整和整合注釋。
  • 收集: 從傳感器中獲取并注釋數據。
  • 增補: 應用隨機轉換,生成合成數據。

一般現有數據集的利用。然而,我們不應低估重新利用和整合這些現有數據集所需的工作量。首先,我們必須確定并獲得這些數據集。然后,為了整合它們,我們需要花時間為新的目的在語義上調整注釋和本體。

數據增強策略將使現有的數據集變得更好,然而,它們并不能取代真實的圖像。

關于數據的生成,研究界到目前為止還沒有證明在合成數據集上訓練的模型能很好地生成真實情況。在任何情況下,仍然需要一個真實世界的數據集來驗證模型在現實情況下的結果。

最后,在評估了現有的東西之后,即評估數據集的覆蓋面和偏差,應該通過執行新的收集活動來補充。收集和利用方法都可能需要大量的標注工作,以確保為數據元素分配適當的標簽。

3 應用于標注任務的C2

3.1 標注周期

從C2的角度來看,我們可以把數據集的標注周期看作是一個目標定位任務周期。事實上,為了更好地表達數據集整理和模型訓練過程中所涉及的步驟,我們可以將標注周期的步驟與聯合目標定位周期[3]的步驟相一致,如圖1所示。

圖1:Parakeet的標注周期與目標定位周期的映射。

這個周期涉及以下活動,對目標選擇過程有了解的讀者會很容易認識到。

指揮官的目標、指導和意圖:在這一點上,我們在數據集標注覆蓋面和模型性能要求方面定義了我們標注任務的預期最終目標。這些都取決于標注任務的目的。我們確定每一類感興趣的物體必須存在的最低數量,并選擇預期的標注名稱。由于這些標注與任務有關,它們在不同的任務中會有所不同,這取決于所需的細節水平,以及在探測精度和開發工作之間的選擇權衡。最后,我們設置最小可接受的置信度,以允許無監督學習,并配置模型的訓練參數。

目標開發和優先排序:我們通過清點已經掌握的標注信息來確定標注的優先級,以突出哪些是缺失的,應該首先解決的。如果有的話,我們應用現有的模型來計算未標注數據的預測。我們評估預測的置信度和對所有數據元素的人工審查要求,以產生一個優先列表。

能力分析:我們評估模型能力以無監督方式標注目標對象。我們確定人類審查員的可用性和工作量,表明在這個迭代中可以驗證的數據元素的數量。

指揮官的決策和軍力分配:我們分配有限的人力驗證資源,即把預測集分配給人類進行審查,或分配給無監督訓練集進行下一個模型再訓練階段。我們決定哪些數據元素將被留作驗證集。我們將標簽集的命令分配給人類審查員。

任務規劃和部隊執行:在這一步,內容專家進行實際驗證,并根據需要對模型進行再訓練。

戰斗評估:我們計算指標以評估模型性能和數據集標注狀態。如果沒有達到最終目標,就會重復這個循環。這也是一個步驟,我們可以評估是否需要將標注的重點重新放在某些類型的對象上,因為我們的例子很少,類似于為情報周期設置和滿足優先信息請求。

3.2 我們關于收集與數據標注的經驗

通過我們在深度學習能力方面的研發工作,我們對各種數據集進行了收集、整合和標注。2019年10月,DRDC與加拿大5e Régiment d'artillerie légère du Canada(5e RALC)合作,領導了一項數據收集活動,建立了一個以加拿大多輛裝甲車為特征的視頻數據集。超過16個傳感器被用來收集圖像,包括位于地面或空中(無人機)的增強型、可見光和紅外相機。這導致了在一天內獲得了超過2.5萬億字節的數據。給這個數據集標注是一項重大的努力。2020年2月的第二次數據收集活動,也是與5e RALC和皇家22團1營合作進行的,通過現場超過25個傳感器獲得了超過4萬億字節的數據。很明顯,需要制定一個標注這些數據集的策略。

在一個相關的項目中,DRDC在2018年11月協調了一個關于航空視頻數據集的標注會議,為期一個月。來自CFB Valcartier Personnel Awaiting Training (PAT)排的兩名全職軍人在4個星期的時間里在4萬多張圖像中識別了大約12萬個目標對象。相比之下,開源的ImageNet數據集[4]有超過120萬張標注的圖像。按照PAT Platoon的標注率,要達到與ImageNet數據集同樣大小的訓練集,所需的標注工作需要30多個月。

在開發汽車顏色標簽的原型時,我們嘗試了一種不同的方法,即利用迭代的模型訓練過程。首先,我們花了43個小時對前8000張圖片進行人工標注。然后,我們在接下來的7000張圖片上采用了半自動化的方法,這些圖片都是由模型預先標注的。此后,人工審查過程花了不到一個小時。這代表了效率的顯著提高(標注速度提高了40倍以上),這啟發了我們開發Parakeet的概念。在建立軍用車輛數據集時,我們進行了第二次同樣的練習。這一次,我們首先在8小時內給8000張圖片標注。然后,對46000多張圖像的審查過程用了不到2小時。

3.3 Parakeet概念

本節介紹了Parakeet概念及其主要組成部分,它利用主動學習策略進行數據集標注和模型訓練,并使之自動化。更具體地說,Parakeet在三個方面改進了傳統的標注方法:

  • 高效的驗證:Parakeet預測對象邊界盒的定位。人類標注人員只需驗證這些框,而不是從頭開始畫它們。
  • 無監督的學習:Parakeet自動將具有高預測置信度的目標對象自動納入訓練集。
  • 主動學習:Parakeet選擇預測置信度低的目標對象邊界框進行人類驗證。

圖2顯示了用于多模態圖像和視頻數據集的完整Parakeet概念。與視頻數據集一起工作,增加了利用幀插值的可能性。多模態數據集可以包括圖像/視頻模態的混合數據(如可見光和紅外線)。在這種情況下,我們可以利用在一種模態(可見光)上訓練的檢測模型來標記另一種模態(紅外線)的數據。此外,如果數據是由兩個不同的傳感器同步捕獲的,我們可以利用這一信息在傳感器模式之間轉移標注信息。

圖2:完整的Parakeet原型概念

在圖3中,我們可以看到組成Parakeet框架的七個主要組件。

  • 1.注釋庫:用于存儲和管理數據集信息的中心庫,包括注釋信息。
  • 2.檢測和分類模型:進行物體檢測和分類預測的模型集合。
  • 3.模型訓練模塊:一組算法,使用可用的訓練數據集訓練檢測和分類模型。
  • 4.預測模塊:使用訓練好的模型對所有可用的數據進行目標對象檢測和分類,但也利用其他預測策略,如相關模式轉移、視覺物體跟蹤和幀插值。
  • 5.人工驗證模塊:一個圖形用戶界面,允許人類操作員創建新的注釋,以及驗證和糾正提議的目標對象標注和邊界框。
  • 6.性能評估模塊:測量模型的性能和數據集標注的進展,以便在數據集標注和模型訓練過程是否令人滿意方面做出決策。
  • 7.數據分流模塊:這是負責處理標注過程中所有C2協調方面的組件。這個模塊接收來自其他模塊的信息,協調它們,并決定在哪里以及如何將數據分配給每個子集。

圖3:Parakeet框架組件。

3.4 AI對C2的影響

指揮與控制的概念和實踐一直是與通信、信息技術共同發展的。最近人工智能(AI)的進步改變了信息技術世界的執行方式。這就要求C2迅速適應,以充分利用人工智能的潛力。

在企業層面上應用C2塑造我們的人工智能方法,將決定我們能夠達到的力量倍增水平以及這些能力隨著時間的推移可能達到的程度。作為回報,新的人工智能能力將影響C2的開展。我們預計,人工智能可以通過多種方式加以利用。從傳感器饋送中更好地探測物體,可以為更精確和完整的共同作戰畫面提供信息,使及時的形勢分析有助于戰斗空間管理和認知。識別局勢變化和跟蹤局勢演變對于確保C2的反應敏捷性至關重要。人工智能有可能通過自動檢測這些情況來加速決策-行動周期。此外,還有許多小的改進領域,人工智能可以增加效率和部分自動化,導致更快的反應時間,需要更少的人力資源或允許人員將時間用于更重要的任務。

為了達到這一點,我們需要解決關于訓練數據集的關鍵信息保障,以確保我們能夠識別不一致的、過時的、不正確的信息,以及錯誤信息。這是建立對所創建的人工智能能力的信任基礎,它需要一個管理人工智能發展的戰略方法。

當然,人工智能不會提供所有的答案,但我們可以預期,那些學會如何最好地利用人工智能技術的人將會形成對對手的競爭優勢。

5 總結

在本文中,我們介紹了Parakeet框架,它利用主動學習、無監督學習和有效的預測驗證來實現更快的數據集標注和模型訓練。

我們表明,用C2框架管理機器學習活動可以使目標對象檢測和分類模型的開發更快,這反過來將使C2性能更好,通過檢測、識別和跟蹤感興趣的對象和活動提供及時的情況分析。

確保高質量的傳感器檢測反饋只是第一步。我們預計C2將塑造和運用人工智能。有必要反思我們如何才能最好地利用新的人工智能能力來支持更好的形勢認知和決策。我們需要一個靈活并能適應新問題的人工智能發展戰略。

付費5元查看完整內容

2022年3月,美國蘭德公司發布《開發嵌入人工智能應用的聯合全域指揮控制作戰概念》報告,論述了嵌入人工智能/機器學習(AI/ML)的聯合全域指揮控制(JADC2)的需求,說明了如何在JADC2中利用商業AI/ML系統和需要克服的障礙,并指出了發展路徑。報告認為,為實現嵌入人工智能應用的JADC2,需要投入人力和資源來超越如今的人力密集型指揮控制模式,用自動化和AI/ML技術改進當前的規劃過程。

報告核心觀點包括

  • 將AI/ML納入JADC2之前需要建立“信息基礎”;
  • 實現JADC2目標的關鍵是確定核心軍事任務的指揮控制需求并建立可行的軟件開發計劃;
  • 將商業AI/ML系統用于軍事任務,必須確定技術支持的作戰需求、隨后確定實現作戰任務所需的指揮控制過程,同時了解AI/ML技術的局限性;
  • 在JADC2中應用AI/ML需要克服四個障礙:軍事文化與商業文化的差異、數據不可訪問、重組軍事行動中心并培訓人員、軍事亞文化;
  • 在JADC2中應用AI/ML的目標是實現指揮控制的高效人機組隊,而不是指揮控制的完全自動化。

將人工智能(AI)和機器學習(ML)納入JADC2進行多域作戰(MDO)之前要完成一項艱巨的任務,即建立“信息基礎”。信息基礎中的數據帶有標記,能夠安全地存儲和傳輸,且易于訪問。建立信息基礎需要持續整理和保護軍方為開展指揮控制所需的跨領域、跨軍種和跨梯隊的所有信息。這些信息是AI和ML算法所需的輸入。如果沒有這樣一個信息基礎,將AI融入JADC2的工作就無法取得進展。 盡管最近AI/ML在游戲領域取得了令人鼓舞的成功,但考慮到信息不完整、數據質量差和對手行動等現實障礙,在某些指揮控制功能中使用類似的技術仍具有挑戰性。其他AI/ML技術,例如用于預測戰區內飛機狀態的應用,其成熟度更高。實現JADC2目標取決于確定核心軍事任務集的指揮控制需求,以及建立在近期和遠期都可以實現的軟件開發計劃。

1 JADC2對支撐多域作戰的必要性

現代戰爭已經超越了傳統的陸、空、海領域,軍事指揮官及其參謀人員計劃、指揮和控制部隊不能局限于這些傳統領域,還要擴展到太空、網絡和電磁頻譜領域。更復雜的是,跨領域的活動已經超出了傳統戰爭的范疇,**在還未采取公開敵對行動之前,大多數國家早已身處競爭環境。**軍隊必須能夠在戰爭和競爭中整合這些領域。今天的軍事行動已經需要靈活和安全的手段來跨梯隊、領域、組織和地理區域進行通信和共享數據。未來的全域戰爭和競爭將對獲取信息的規模和速度、對信息的理解和快速決策提出更高的要求,這些都是JADC2能力的關鍵要素。

但是,今天用于規劃、調度和執行監視軍事任務的既存系統和基礎設施不適用于現代全域作戰。鑒于多域作戰規劃日益復雜,期限縮短,而且數據要求增加,軍事規劃人員需要新的工具,包括AI/ML工具。 要想確定對AI/ML工具投入的優先級,就需要了解這些工具的能力、面臨的障礙以及它們滿足多域作戰下新興指揮控制需求的潛力。

圖1 機器學習的類型

2 如何利用商業AI/ML系統

近來,AI/ML系統在日益復雜的游戲中展現出人類所不能及的能力,再加上人們對未來高端沖突作戰需求日益加深的理解,使AI/ML變得極具吸引力。作為一種AL/ML系統,AlphaStar在即時戰略游戲《星際爭霸》中的成功**預示著監督學習和強化學習未來有可能應用于戰術級和戰役級指揮控制。**但是,將這些技術從游戲過渡到戰爭仍需要大量的研究。

隨著人工智能算法被開發用于現實、動態、多領域、大規模和快節奏的作戰,需要選擇、評估和監控重要的度量標準來衡量算法的性能、有效性和適用性。關鍵的算法度量標準包括:效率(計算所需的時間和內存)、可靠性(算法是否產生有效的結果)、最優性(算法是否為給定目標提供最佳結果)、穩健性(算法是否能夠在意外情況下平緩降級)、可解釋性(人是否能理解所產生結果的原因)和確定性(算法是否按預期運行)。

由于商業和學術AI/ML系統沒有直接應用于軍事任務,這些技術需要過渡到軍事環境才能帶來作戰優勢。為了決定采用哪些AI/ML技術,軍方**必須首先了解需要這些技術支持哪些作戰需求,如空中優勢、防空、加油機支持等。隨后作戰需求將決定****實現作戰任務所需的指揮控制過程,**如態勢感知、空域去沖突等。**了解AI/ML技術的局限性,**尤其是它們在不確定條件下進行推理時遇到的困難,也同樣重要。否則,這些技術可能會達不到預期。

圖2 AI/ML關系

3 實現AI/ML的軍事應用需要克服的障礙

實現AI/ML的軍事應用存在以下四個主要障礙。

(1)軍事文化與商業文化的差異

由于在戰爭中生命始終處于危險之中,軍事文化通常是規避風險的。但是在商業世界中,承擔大的風險可能獲得豐厚的經濟回報。這種文化差異在共享數據方面表現最為突出。軍方傾向于保護信息(只有那些“需要了解”的人才能獲取信息),而商業世界重視開放數據訪問(“廣泛共享”),以促進應用開發并獲得經濟利益。因此,將安全考慮納入軍事軟件開發和信息技術(IT)行動(稱為DevSecOps)非常重要,由此能夠挫敗試圖通過網絡手段削弱指揮控制的對手和危險份子。最大的挑戰可能是如何確保AI/ML算法適用于真實戰場。在戰場中,“戰爭迷霧”、不完整的信息和對手的行動與游戲環境截然不同。

(2)軍方內部數據不可訪問

軍方需要統一的數據管理政策和足夠先進的信息技術使指揮控制人員可以訪問大量數據,由此支持他們的人工智能輔助決策。換句話說,**必須有一個支持收集、標記、存儲、保護和共享數據的AI生態系統。**這個生態系統將依賴于通用數據標準、明確指定的權限、完整性檢查和入侵防護。**云計算和數據湖將是關鍵組成部分。**云數據湖可以用于分布式計算、冗余存儲和整個企業內的連接。考慮到現有的軍事政策、文化、權限、預算和獲取途徑,構建這樣一個環境以跨領域和跨安全級別的安全方式提供大量數據將對JADC2提出挑戰。

(3)需要重組軍事行動中心并培訓中心的人員

機器之間通信的增加和指揮控制過程的自動化,可能會帶來作戰中心硬件和人員的變化,這使人類作戰人員能夠聚焦認知任務,如評估和完善潛在的行動方案。采用AI/ML技術將創造出新的角色和職責。作戰人員需要接受培訓以便管理和運營AI生態系統,同時充當數據管理員,確保在該生態系統中捕獲和存儲的數據的質量和完整性。此外,雖然現在規劃人員和決策人員受到的培訓是要在一個領域內思考,但新的職責可能會出現,需要人們同時在多個領域內思考。

**(4)存在軍事亞文化 **

由于作戰人員之間亞文化的差異、規劃時間線的不同,以及為實現不同的作戰效果而采用的不同的權限分配方案,即使在一個軍種內,也很難跨越空中、太空和網絡領域集成AI能力。 盡管如此,對全域指揮控制的需求是急迫的,而且這種需求越來越普遍。為此,在JADC2中嵌入AI應用必須面對和克服以上所有障礙——軍事文化、網絡安全問題、用于知識質量較差的問題的算法、數據不可訪問、作戰中心重組和培訓以及軍事亞文化。

4 實現高效發展的路徑

以上障礙讓現狀看起來很嚴峻,必須立即做出改變來響應快速向前推進的迫切需求。但是,如果將實現目標的步驟分解成一個個容易解決的問題,如果軍方清楚技術的可能性和局限性,就可以取得進展。**我們的目標不應該是指揮控制的完全自動化,而是指揮控制的高效人機組隊。**實現這一目標的步驟應該包括:第一,繼續開發JADC2作戰概念并確定其優先次序;第二,在指揮控制過程中確定采用AI/ML來增強能力的需求和機會

與此同時,有必要為數據驅動的AI生態系統設置環境,這意味著要將武器系統和相關數據遷移至多域數據湖中,供有權限的人使用,同時應用“零信任”和其他安全原則來靈活且安全地管理這些數據。隨著AI軟件應用程序的開發,有必要在作戰測試環境中對這些應用程序進行實驗,將它們與指揮控制系統集成,然后將有限的能力部署到作戰中心,接著根據用戶反饋快速更新軟件應用程序。分析師和技術專家希望探索作戰概念來促進人機組隊,建立人們對AI智能算法的信任,并提高算法的可解釋性。商業需求較少的領域可能需要有針對性的軍事投資,例如用于數據稀缺領域的AI算法學習,或者用于防御針對這些算法的攻擊的AI算法。

當前的AI/ML技術需要學習用的數據。由于缺乏真實世界的數據(缺乏這類數據也是一件幸事)來為改進這些戰爭技術提供信息,軍方可以利用建模、模擬和演習來為AI/ML算法生成訓練數據。這類算法有助于武器-目標配對等。監督或強化學習算法可以支持這種指揮控制功能,類似于最近應用于商業游戲的學習算法。但是軍事算法也必須考慮到現實世界中的不確定性,這對人類和算法來說都是一個主要困難。

正如美國空軍參謀長查爾斯?布朗(Charles Brown)2020年8月所說:“要么加速變革,要么失敗。”對現代戰爭來說,及時向JADC2邁進是必要的,而且有必要“在競爭對手的防守期限內”完成。這一需求真實存在,但對AI/ML設定現實的預期很重要。現有的指揮控制流程在自動化方面還有改進的空間,在某些情況下,在AL/ML方面也有改進的空間。美國眾議院軍事委員會主席、華盛頓州民主黨眾議員亞當?史密斯(Adam Smith)于2021年9月談到JADC2時說:“目標是正確的,但不要低估實現這個目標的難度。”

來源:防務快訊

付費5元查看完整內容

引言

本文件是北約 IST-151 研究任務組 (RTG) 活動的最終報告,題為“軍事系統的網絡安全”。該 RTG 專注于研究軍事系統和平臺的網絡安全風險評估方法。 RTG 的目標如下:

? 協作評估軍事系統的網絡安全,并在 RTG 的北約成員國之間共享訪問權限;

? 在 RTG 的北約成員國之間共享風險評估方法和結果;

? 將 RTG 的北約成員國使用的評估方法整合到一個連貫的網絡安全風險評估方法中,以使北約國家受益。

軍事平臺比以往任何時候都更加計算機化、網絡化和受處理器驅動。他們大量使用數據總線,如 MIL-STD-1553A/B、CAN/MilCAN、RS-422/RS-485、AFDX 甚至普通以太網,以及戰術通信的舊標準,如 MIL-STD-188C 和 Link 16。此外,捕獲器、傳感器、執行器和許多嵌入式系統是擴展攻擊面的額外無人保護的潛在輸入。結果是增加了網絡攻擊的風險。然而,這些平臺的持續穩定運行對于軍事任務的成功和公共安全至關重要。

軍事系統和平臺是網絡攻擊的首選目標,不是因為它們像消費電子產品那樣普遍,而是因為它們潛在的戰略影響。一旦受到影響,就可以實現各種短期和長期影響,從拒絕能力到秘密降低其有效性或效率。因此,軍隊必須在各個層面解決網絡安全問題:戰略層面,同時獲取平臺和系統;作戰層面,同時規劃軍事任務和戰術。

北約國家擁有大量可能面臨網絡攻擊的軍事平臺和系統。因此,北約將受益于利用當前的流程和方法來設計更安全的系統并評估當前系統的網絡安全。

本報告介紹了針對軍事系統和平臺量身定制的網絡安全評估方法,該方法由 RTG 團隊成員合作開發,并建立在他們的經驗和專業知識之上。團隊成員已經使用的流程被共享、分析、集成和擴充,以產生本報告中描述的流程。本報告的目標受眾是愿意評估和減輕其軍事系統的網絡安全風險的決策者。

圖一:網絡安全評估過程的五個主要步驟。

報告結構

第 2 節介紹了 RTG 團隊在其存在的三年中用于開發流程的方法。第 3 節列出了可以應用該過程的系統的一些特征。最后,第 4 節描述了評估流程,而第 5 節總結本報告。

執行總結

軍事平臺比以往任何時候都更加計算機化、網絡化和受處理器驅動。這導致增加了網絡攻擊的風險。然而,這些平臺的持續穩定運行對于軍事任務和公共安全的成功至關重要。

絕對的網絡安全是不存在的。必須通過迭代風險評估持續管理網絡安全。傳統 IT 系統存在許多網絡安全風險管理框架和流程。然而,在軍事平臺和系統方面,情況遠非如此。本文檔介紹了針對軍事系統量身定制的網絡安全風險評估流程。該流程由北約 IST-151 研究任務組 (RTG) 活動的團隊成員開發,該活動名為“軍事系統的網絡安全”。該過程可以應用于傳統的 IT 和基于固件的嵌入式系統,這些系統在軍事平臺和系統中無處不在。

付費5元查看完整內容
北京阿比特科技有限公司