管理整個戰場上不斷增長的數據量和速度是作戰人員的一個關鍵問題。解決這個問題將需要從根本上改變戰場分析的方式。一種在戰場上做出決策的新方法將通過將分析能力移至數據源附近來消除數據傳輸延遲。決策周期取決于捕捉數據并將其轉化為可操作信息的速度,以便進行決策。實時態勢感知是通過將計算資產定位在戰術邊緣來實現的。
加速戰術決策過程需要利用三個技術領域的能力:(1)高性能計算(HPC),(2)機器學習(ML),以及(3)物聯網(IoT)。利用這些領域可以減少網絡流量,縮短將數據轉化為可操作信息所需的時間。更快的決策周期可能會徹底改變戰場上的行動。
本報告概述了一個人工智能(AI)系統的設計,用于在戰術作戰環境中的近實時分析,在同地的移動HPC硬件上執行。該報告包括以下幾個部分:(1)描述動機、背景和技術狀況的介紹;(2)利用HPC問題定義和用例的戰術決策過程描述;(3)HPC戰術數據分析框架設計,使數據變成決策。
戰術邊緣人工智能(AI)的方法被細分為三個主要研究領域:(1)研究延伸到戰術邊緣的移動或便攜式高性能計算(HPC)環境的硬件和架構;(2)研究機器學習(ML)算法和物聯網(IoT)架構及其與便攜式HPC的一致性;以及(3)利用邊緣HPC為戰術決策過程設計操作工作流框架。
HPC邊緣架構: 這項工作包括調查在移動和/或便攜式HPC環境中提供和支持數據科學能力所需的最先進的硬件、軟件、網絡和存儲。
ML邊緣分析: 機器學習已經通過尋找和分析大數據集的潛在特征的能力改變了數據分析。我們能否徹底改變戰場上的數據分析方式,然后建立讓ERDC解決這一類新問題的能力?
邊緣HPC:這項工作旨在將擬議的硬件能力創新與創新的分析能力結合起來,以最優化和最恰當的方式在戰術邊緣提供計算密集的決策支持分析。處理這項任務的方法將是在解決作戰需求的同時暴露出一個作戰過程。換句話說,當團隊直接為現實世界的戰場數據處理需求建立戰術邊緣分析時,為實現戰術邊緣分析所經歷的操作流程將開始定義一個可推廣的操作流程,以利用邊緣的HPC解決戰術決策分析問題。
技術創新(AI)在各行業和各國的快速發展和擴散性質正在削弱美國對國防技術應用的壟斷。獲得的優勢是暫時的,因為近似的對手能夠迅速利用這些日益普遍的能力。中國制定了一項發展計劃,到2030年成為人工智能的世界領導者,并創造一個1500億美元的產業。俄羅斯總統弗拉基米爾-普京表示,"誰成為這個領域(人工智能)的領導者,誰就會成為世界的統治者"(Gigova 2017)。美國防部(DoD)必須迅速而果斷地利用人工智能和自動化,使美國部隊能夠更有效和高效地運作。通過以戰略為重點的意圖和工作,適當地加以利用,人工智能可以成為最大的補償--或者說,如果缺乏遠見和方向,它可能會成為一個戰略赤字。
人工智能已經成為每一類企業的解決方案和問題的一個日益增長的來源。基于人工智能的技術已經融入如此多的部門,往往引起巨大的變化,從軍事或全球安全的角度來看,它不能被忽視。
潛在軍事應用的早期AI問題(通過全球安全集團的視角):
1.在近期內,人工智能的哪些軍事應用是可能的?
2.在這些應用中,哪些是對戰略威懾的穩定性有潛在影響的?人工智能是否會改變我們考慮威懾的方式?
3.人工智能輔助的軍事系統如何影響區域穩定?
4.區域穩定和戰略威懾之間有什么聯系?
5.人工智能帶來的意外后果和戰略意外的風險是什么?
目前國防界對什么是人工智能缺乏共同的模式、術語和基線。人工智能有許多應用和方法,但其中最大和最廣泛使用的是以一種形式提供價值的方式分析 "大數據"。狹義人工智能使用離散的問題解決工具來執行特定的狹義任務。通用人工智能包括旨在模仿和重現人腦功能的技術。狹義的人工智能有更多的采用,并被證明在各種領域提供價值。人工智能與商業應用的交叉,使數據豐富的領域有了預測分析的能力。大量的傳感器和相機,加上現有的以數據為中心的資源,正在推動人工智能的機會,以揭示隱藏的洞察力。
人工智能顯然有潛在的軍事潛力,但要到什么時候才能在實踐中真正顯現出來?美國防部在2018年6月建立了一個聯合人工智能中心,導致資金和研究的增加。與工業/學術界人工智能應用直接類似的軍事應用(物流、規劃、分析、運輸等)已經在整個國防和情報界迅速采用了人工智能支持的數據分析。戰爭有單獨的和不同的應用,對人工智能的采用較慢。適用于戰爭的人工智能應用的主要類別是:(1)那些主要在戰爭的戰役層面產生影響的應用;(2)那些主要在戰爭的戰略層面產生影響的應用。"在戰爭的戰役層面上的人工智能應用可能對使用通用軍事力量來實現戰術目標產生非常大的影響,從而對常規威懾的可信度產生影響。人工智能在戰略層面的應用可能會對有關戰爭規模和范圍、升級和降級的政治決策產生重大影響,進而影響戰略穩定和威懾"(Davis 2019)。
美國防部戰略的一個關鍵重點是確定關鍵的探路者,使該部能夠實現其人工智能的愿景:
繼續開展被稱為 "Maven項目 "的算法戰爭跨職能小組(AWCFT)的工作,以迅速整合和部署商業和政府開發的人工智能能力,支持反ISIS運動。
建立一個以國防部人工智能為重點的中心,在國防企業的多個領域創新和部署人工智能系統的操作原型,并確定將人工智能技術持續應用于各種用例的途徑。
在戰術邊緣提供世界級的計算能力。國防部將重新獲得嵌入式HPC的競爭優勢,以支持 "算法戰爭",重點是在運輸集裝箱中的前線部署HPC,以支持戰地戰術行動。設計利用世界一流的高功率架構來融合數以萬計的信息源。
美國國防部的人工智能目標是:
為人工智能建立跨領域的基礎。美國防部將加強跨領域的基礎,并制定法律和政策框架,以確保其能夠成功應用人工智能。它必須強調其開發的系統的互操作性,同時確保其部署的安全和保障。此外,它必須最大限度地追求國際、商業和學術伙伴關系,同時增長和培養自己的有能力的人工智能勞動力。
實現軍事技術的優勢。美國防部將集中投資并利用商業和學術投資,以便在關鍵領域實現對對手的軍事技術優勢,包括核心人工智能、機器學習、機器人、數據分析、高級計算和人類-人工智能協作。
轉變美國防部的關鍵業務職能。美國防部將通過大量利用商業AI/ML產品和投資來實現其業務運作的現代化和簡化。
建立、部署和維護基于AL/ML的能力,提供戰場上的軍事優勢。為了提高殺傷力,美國防部將投資于應用能力的開發,將新興技術與特定的軍事能力和行動概念聯系起來,快速過渡能力,并專注于關鍵的應用領域。
已經確定的(目前正在研究的)三個潛在應用的作戰目標:
無所不在和無所不知的自主車輛
高度重視人工智能的軍事應用
專注于所有級別的無人系統(陸、海、空)。
進行復雜的戰役戰術,快速調整,報告變化
大數據驅動的M&S和兵棋推演
人工智能已經在核武器系統中得到了一些應用。
對人工智能的兵棋推演方法的興趣增加,以探索和了解動態條件如何影響結果和決策。
集中的情報收集和分析
已經為戰略目標確定了四個潛在的應用(目前正在研究):
實現情報、監視和偵察(ISR)的系統體系
戰略資產的精確瞄準
有效的導彈防御
人工智能引導的網絡
這些都直接影響了戰爭的速度。"戰爭的速度已經改變,而這些變化的性質使得全球安全環境更加不可預測、危險和無情。決策空間已經崩潰,因此程序必須適應戰爭速度的發展"(Garamone 2017)。有人說,"軍隊必須最大限度地利用其決策空間,所以軍事領導人可以以戰爭的速度提出選擇"(Garamone 2017)。這可以通過 "建立一個框架,使高級領導人能夠及時做出決定"(Garamone 2017)來實現。
人工智能是實現迎戰戰爭速度變化這一總體目標的關鍵一環(圖1)。人工智能為指揮官提供了對態勢理解,并為高效和有效地處理、利用和傳播信息打開了大門,其速度是人類無法比擬的。人工智能使系統能夠學習和適應,加快作戰節奏,使士兵更聰明,并能自主操作。戰場系統需要有彈性,能夠適應不斷變化的情況。信息的增長已經超過了人類快速分析信息并將其應用于決策過程的能力。士兵和機器作為一個綜合認知系統工作,能夠大大擴展數據分析的深度和廣度。機器專注于分析低層次的細節,讓士兵將注意力集中在更高層次的戰略和規劃上。
人工智能對威懾和穩定有多種潛在影響。它也有很大的潛力通過增加感知到的突襲風險來侵蝕穩定。歪曲的數據可能導致人工智能系統采取意想不到的行動。人工智能確實會犯錯,但這些錯誤不能導致戰略不穩定或不必要的升級。人工智能的速度可能會意外地加速一些可以通過其他努力來降級的事情。當被賦予與外國和友好平臺有關的不同參數時,它也可能誤報意圖。人工智能只是跟上戰爭速度的大拼圖中的一塊。
定義邊緣
邊緣的定義是相對于事業內部的位置而言的。例如,移動網絡運營商(MNOs)認為邊緣是其無線接入網絡(RAN)的末端,是多接入邊緣計算(MEC)的一個大機會。數據中心服務提供商可能將邊緣視為部署在關鍵位置的基礎設施,以盡量減少通信延遲。HPC和邊緣服務器供應商將遠程站點的設備視為其邊緣。數據處理要求的范圍可以從邊緣的超低延遲和實時延遲,到 "近邊緣 "的中等延遲和本地數據處理,再到集中式數據中心的高延遲和高容量存儲和網絡。
人工智能邊緣計算將通過把計算帶到數據上而不是把數據移到這些強大的計算機資源上來減少網絡流量需求。這將減少從數據到決策所需的時間(圖2)。邊緣計算在將計算資源移至數據源附近時,利用了更小、更強大的設備,從而減少了網絡流量,使計算資源更接近前線(圖3)。它將分析數據所需的計算匯集到數據源;數據到決策(D2D)的時間減少了,從數據中提取的見解和信息被高度壓縮并更容易分享,更多的計算能力可以在更小的設備中得到。傳統的方法是在低層(戰術邊緣)收集數據,并將數據傳輸到高層進行處理和分析。這種方法的結果是隨著數據源的不斷增加而出現了擴展問題。它通過傳輸未處理的數據給網絡帶來了負擔。數據傳輸成為一個主要的瓶頸,影響了戰場的節奏。
目標
一個有效的指揮和控制(C2)系統必須為用戶提供作戰畫面,支持規劃過程,并能接收、處理和傳輸信息。
這項工作的目的是研究人工智能和HPC一起工作,以推進關鍵的軍事能力,如態勢感知(圖4)。邊緣的HPC加人工智能提供了對本地數據的近乎實時的利用,支持高度的自主性,計算資產被移到離數據源更近的地方,增加了數據分析的深度和廣度,減少了做決定的時間,洞察力為決策提供了依據。
本報告分為六章:
為了滿足現代戰場的需求,美陸軍必須通過將人工智能(AI)納入其系統來加強戰術指揮所。人工智能為軍團、師、旅甚至是營級指揮所提供了巨大的機會,使其在相對于潛在威脅編隊和指揮官的情況了解方面具有數量和質量上的優勢。適當開發、測試和投入使用的人工智能能力將更好地整合、優先處理和聯系信息,以加強對形勢的了解,并使決策更加有效。現代戰場上的多域作戰(MDO)要求指揮官及其參謀人員在多維的戰斗空間中作戰。這甚至會挑戰最擅長的參謀人員,而且部隊已經在處理大量的信息了。精心設計的人工智能算法和支持人工智能的應用程序將幫助美國機動部隊更好地了解他們的作戰環境,并將實現一個更強大的共同作戰圖景。
"促成決策"是信息優勢活動中的一項核心任務,執行這一核心任務將使指揮官、參謀部和編隊獲得并保持信息優勢。加強對形勢的了解是指揮官取得決策優勢的必要條件,但還不夠;加強對形勢的了解既是當務之急,也是目前可實現的技術在短期內可以實現的。人工智能與這一核心任務的整合將在不同程度上間接促進陸軍在信息優勢活動的所有核心任務中的能力。本文詳細介紹了在未來三年內將人工智能融入現有系統和網絡的具體當前需求和建議。這篇文章沒有也不打算為進一步發展或實戰化的新生能力提供詳細的建議,并有較長的時間安排。相反,作者的腳步堅定地站在當前的現實情況、眼前的需求和可用的技術上。
圖:薩拉-米勒上尉和技術員。2019年6月1日,德克薩斯州圣安東尼奧-拉克蘭聯合基地,第834網絡作戰中隊的卡洛爾-布魯斯特軍士長在拍攝空軍后備司令部任務視頻的場景時,討論應對假想網絡攻擊的方案。(Photo by Maj. Christopher Vasquez, U.S. Air Force)
在未來,由人工智能驅動的傳感器、火控系統、投送資產和算法可能會創造出令人難以置信的速度和殺傷力的戰場,人類在其中掙扎著跟上旨在為指揮官服務的機器的步伐。采集和投送資產群有一天可能會自主地執行任務,并動態地完成采集、投送和評估,同時隨著事件的發展不斷調整,做出反應。在物理領域的這些系統和事件中,隨著友好、中立和威脅系統的互動,在網絡空間領域也會有類似的人工智能能力的先進應用。這種能力目前還不能廣泛地投入使用,而且基礎的人工智能技術還不夠強大,我們不能認真考慮在不久的將來引入這種能力。同時,陸軍必須以一種可行、及時和有效的方式開始整合人工智能。
正如《2028年多領域作戰中的美國陸軍》所斷言的那樣:"融合所有領域、EMS[電磁波譜]和信息環境能力的關鍵是人工智能所帶來的大批量分析能力和傳感器到射手的鏈接,它通過自動交叉提示和目標識別使敵人的欺騙和遮蔽變得復雜。瓦解所需的情報精煉取決于五個相互關聯的系統。"1這五個系統如下:廣域監視、穿透性偵察、遠距離監視和偵察、消耗性監視和偵察以及人類網絡。這五個系統中的每一個都可以通過改善對形勢的理解,從立即開發、實驗和在戰術總部使用人工智能系統中受益。這種整合不會使決策自動化,而是使人類指揮官和參謀人員能夠更好地決策。正如《2028年多域作戰中的美國陸軍》中所述,"由人工智能和高速數據處理促成的人機界面,在速度和準確性方面都能改善人類的決策"。
作者重申將人工智能融入戰術總部,并更廣泛地融入整個機動部隊的系統,以改善人類的決策。隨著陸軍在2028年之前實現這一作戰愿景,或者根據參考的出版物,提前幾年實現這一愿景,作者發現在為即將到來的軍事事務革命創造條件而提供的理論和領導指導方面存在兩個關鍵差距。首先,陸軍缺乏評估其在實現AI-enabled MDO方面進展的手段。其次,在如何為整合人工智能系統做準備方面,還沒有向機動部隊發布實際指導。在解決了這兩個差距之后,作者還提出了一個陸軍可以利用現有技術建立的系統,以加強戰術指揮所的情況了解。
如果陸軍要將人工智能整合到MDO中,如果我們要提供一種評估人工智能準備情況的方法,我們首先需要了解什么是人工智能。在這篇文章中,作者使用了國家安全委員會人工智能委員會(NSCAI)在其最終報告中引用的定義,該定義最初由卡內基梅隆大學現任和前任高級教員發表。摩爾等人將人工智能定義為一個 "堆棧 "或技術層的集合,需要 "人才、數據、硬件、算法、應用和整合"。NSCAI的最終報告更加重視將推動人工智能系統的采用和實施的人才,以及將使其包含的算法和模型得以實現的數據。這篇文章鼓勵盡早采用相同領域的建議,因為它們與軍隊目前的能力相一致。
除了人工智能的組成部分,重要的是要了解人工智能系統為用戶提供了什么。使用專門為訓練人工智能而設計的算法,一個應用程序的人工智能組件被 "教導 "在大量的數據中識別模式,這樣它就可以對新數據進行分類或預測額外的信息。這是有意的寬泛和含糊;它是一個抽象的過程,可以應用于許多情況。它受限于對大量標記數據的需求和不斷收集更多數據的需要。標簽數據是用關于人工智能組件可以學習預測的類別或價值的識別信息充實的數據。標簽必須與所需的預測能力相關。例如,建立一個可以在衛星圖像中識別坦克的人工智能,將需要一個衛星圖像的數據集,標記為識別它們是否包含坦克。更詳細的預測將需要更詳細的標簽,這意味著如果我們想預測坦克的模型,標簽將需要包括圖像中坦克的類型。任何人工智能形式的質量都與該系統可用的高質量數據的數量直接相關。
實戰化和開發人工智能系統是一個過程,作者建議用四個階段類似地評估陸軍的人工智能準備情況。這是由卡內基梅隆大學的Eric Nyberg提出的四個階段,即一個組織如何評估其對人工智能的準備和使用。雖然這些步驟暗示了一個進展,但一個單位無法控制的情況變化可能會導致其在人工智能啟用過程中向后或向前移動。
這個過程從做好數據科學準備開始。當相關的數據源被識別、可訪問和持續管理時,一個組織就已經做好了數據科學準備。處于這一階段的陸軍單位的領導人將能夠以可靠、及時和與背景相關的方式獲取相關的人員、后勤、訓練、情報和戰術數據。關鍵是,一個機動部隊必須考慮如何在戰斗環境中做到這一點。單位將需要建立在訓練和戰斗中組織、規范和存儲信息的程序。此外,數據必須在系統和作戰功能之間進行整合。在這個階段,數據是完整的,擁有統計分析技能的士兵可以使用這些數據來更好地描述他們的環境、行動和隨后的結果。為數據科學做好準備的陸軍單位將有參與的領導,他們了解如何在其組織內收集、維護和共享數據。
一個做好數據科學準備的組織將努力成為數據科學啟用者,這是第二階段。當多個數據源之間的相關性被確定,并且從組織數據中創建的預測模型被用于改善工作流程和決策時,一個組織就具備了數據科學功能。啟用數據科學的陸軍部隊將利用他們收集、維護和獲取的數據來加強對形勢的了解,了解敵方和友方行動的背景,并預測未來行為。啟用數據科學的機動部隊將在野外訓練演習、指揮所演習和作戰訓練中心輪換期間在戰術指揮所收集、清理和組織數據。士兵們將采用在準備訓練期間開發的預測性分析方法來識別敵人的行為,并對高度動態、復雜的戰場做出更快速的反應。啟用數據科學的陸軍部隊將擁有投入的領導層,他們將大量的數據整合到軍事決策過程中,并迅速調整以適應不斷變化的條件。
圖:根據美國陸軍發展司令部的說法,"陸軍研究人員開發了一個能夠學習和理解復雜事件的人工智能架構,增強了人與機器之間的信任和協調。" (圖片說明:Rudi Petry,美國陸軍提供)。
在使用數據科學來實現更好的性能之后,各單位將追求成為人工智能準備,即第三階段。在這個階段,組織將數據科學作為操作流程的一部分,并且已經整合了軟件應用,使其工作流程現代化,以整合計算技術。將采用人工智能的領導人了解哪些流程和要求將被用來加強,他們能夠直接與人工智能工程師溝通,設計和實施相關的解決方案。陸軍單位將對人工智能作為武器系統的能力和局限性有實際了解。機動部隊將與陸軍未來司令部的單位合作,如軟件工廠或人工智能集成中心(AI2C),開發人工智能解決方案,以增強其任務準備和能力。數據將與兄弟組織共享,并在戰術和駐軍環境中進行訪問,在后方創建的軟件更新可以通過陸軍網絡推送到戰術邊緣的應用程序。為人工智能做好準備的陸軍單位將有知情的領導,他們指揮他們的數據存在,并推動未來人工智能支持的軟件和應用程序的需求過程。
最后,當一個組織部署了人工智能系統并能夠直接衡量其對任務成功的影響時,它將成為人工智能的受益者。這些單位可以在戰術環境中采用人工智能來實現流程自動化,并提供任務成功。這些系統在任務中工作,并在關鍵環境和條件下工作。對于陸軍單位來說,這些是有彈性的應用程序,可以適應動態的網絡條件,并在敵人破壞或拒絕通信網絡時提供價值。處于這一階段的組織的特點是高度彈性的流程和系統,能夠迅速適應不斷變化的情況,在多領域的戰場上取得決策主導權。這些系統及時顯示關鍵的多維數據和洞察力。隨著現代系統產生和消費大量的信息,數據收集的規模和速度將不斷增長。啟用人工智能的陸軍部隊將擁有被授權的領導層,他們利用人工智能來領導復雜的任務,并通過人機界面的互動獲得創新解決方案。
意識到機動部隊今天甚至沒有為數據科學做好準備是令人生畏的,而成為人工智能的過程將需要一個巨大的轉變。這就是像人工智能這樣革命性的技術進步的本質,它代表了小單位接受和影響軍隊中人工智能未來的一個難以置信的機會。機動部隊應該從今天開始做出實際反應,以配合陸軍和國防部領導人提供的政策和理論重點。人工智能是一種不對稱的能力,相對較小的投資可以產生巨大的影響。雖然這可能會損害大型的、行動緩慢的組織,但它也可以為個人和小型單位提供機會,對整個組織產生巨大的積極影響。通過鼓勵和支持小單位及其領導人的創新解決方案,軍隊可以對人工智能在軍事事務中的破壞性影響做出靈活的反應。鼓勵這種創新的一個早期步驟是為人工智能準備數據環境。
陸軍也有一個獨特的機會從更大的人工智能社區的錯誤中學習,特別是在涉及數據時。正如谷歌的一個人工智能工程師團隊去年所寫的那樣,缺乏對 "數據工作 "的關注是對大公司和人工智能先驅的重大損害,他們在部署人工智能系統時遭遇了明顯的失誤和誤區。通過將組織和文化變革的重點首先放在數據管理流程的現代化上,陸軍自然會對其中的一些問題產生免疫。陸軍任務的性質和與人工智能系統的錯誤相關的危險,加劇了陸軍中低估數據質量的影響。
類似于陸軍通過維護地形行走等演習指導維護活動的方式,各單位可以通過數據健康評估來準備數據環境。這是一個適合戰區司令部在下屬各師進行的評估。軍團總部在其下屬的旅級戰斗隊中進行類似的評估也可能是合適的。這些評估考慮的是各單位如何很好地管理他們所產生的和他們所獲得的數據。評估數據健康狀況,是繼人才培養之后,開始為機動部隊的人工智能系統做準備的最佳場所。
圖:"美國陸軍發展司令部稱:"明天的作戰環境將充滿了智能自主設備和平臺,它們會產生多樣化和復雜的信息特征。(圖片來源:美國陸軍/Shutterstock)
雖然評價應該是獨特的,并在對被評價單位的特別了解下進行規劃,但各單位的一般概念將是相似的。數據健康評估提出了以下問題。這個單位對駐軍和戰術環境中的日常行動的數據收集、清理和管理得如何?數據收集應該是完整的,因為它描述了單位活動的背景、環境、行動和結果。當收集工作自動化并融入所有流程時,單位將很好地收集數據。當數據的結構、類型、格式和存儲位置一致時,它就是干凈的。干凈的數據可以用于描述性分析,并且可以通過良好的文件來理解。當數據是可訪問的、持久的和可靠的時候,它就得到了良好的管理。做得好的單位會考慮如何將他們收集的數據應用于系統和流程。徹底的數據健康評估的一部分也會考慮到有多少信息是可以在員工部門和工作小組中看到的。廣泛共享的數據鼓勵合作和建立共同的理解。這種評估可以考慮的一些具體行為如下。
進行數據健康評估,首先需要對單位在這一領域的準備情況進行誠實的評估,這是所有其他優先事項中的一個。正如戰略研究所的Leonard Wong和Stephen Gerras在他們的報告中所分享的,本文的作者也可以用軼事來證實,陸軍在競爭的要求和激勵結構中掙扎,導致單位有時故意報告不準確的信息以滿足戰備要求。7人工智能系統將對這些挑戰特別敏感,因此,陸軍的數據健康評估必須包括一個機制來評估其收集的數據的真實性。這方面的一個機制可以是去除一些人為干預的因素。例如,車輛、飛機或大炮可以用傳感器來識別它是否正常運行或其系統部件是否有故障。這有一個重大的挑戰,就是增加了這些系統的復雜性。另一個符合行業最佳實踐的機制是隨機對數據點進行子抽樣來重新評估。這方面的例子包括選擇一些單位進行簡單的行動來驗證他們的設備狀況,如在155毫米榴彈炮上執行機組演習,用所有能用的車輛組成一個車隊前往訓練區的集合點,或對個別武器執行無通知的記錄鑒定。要求這些警報活動來驗證一個單位所存儲的數據的準確性,是確保我們的人工智能系統配備高質量數據的絕佳方式。陸軍領導人必須為各單位創造空間,讓他們如實報告這些信息,而不必擔心遭到報復。陸軍在人工智能多領域戰場上有效作戰的能力,取決于改變陸軍文化的這一要素。
圖:美國陸軍正在尋求智能車輛以減輕士兵在多領域作戰中的負擔。(圖片來源:美國陸軍/Shutterstock)
除了為準確的數據收集設定條件并進行評估外,各單位今天還可以采取一些步驟,為整合人工智能系統做準備。以下建議適用于所有梯隊的單位。它們以當今可用的能力為基礎,代表了為人工智能系統準備數據環境的最初步驟。這些建議將幫助各單位為數據科學做好準備。
機動部隊必須通過立即停止刪除共享文件系統中的數據來體會他們每天與之互動的數據的價值。這些 "共享驅動器 "或SharePoint系統使單位內部和跨單位的合作努力成為可能,但其中也蘊含著單位行為、訓練演習和報告的寶藏。當各單位沒有足夠的空間來維持前幾年的記錄時,這些系統上的文件往往被刪除。為了創造有效的情報,陸軍數據科學家和人工智能工程師將需要為他們開發的每一項人工智能技術獲得數以萬計的標記數據點。這代表了人工智能界相對較小的數據集,陸軍不能因為不經意地刪除舊文件而失去更多的數據。各單位應將可自由支配的支出資金用于購買外部硬盤,并對其共享文件系統進行間歇性備份;要做到這一點,各單位必須獲得具體的額外資金和要求。此外,所有官員都應該有能力從至少高于他們兩個梯隊的所有單位讀取非敏感文件。這將鼓勵合作并引入即時效率,同時將我們的數據文化轉變為共享文化。在未來接受數據科學家或人工智能工程師的支持時,這些設備應該作為背景提供給單位,以幫助創造有效的情報。
組織應該調整他們從下屬單位收集信息的方式,增加Excel等表格格式的使用。這些格式已經成為許多狀態、后勤和維修報告以及檢查文件的標準。以表格格式收集這些數據將通過在短期內強制執行數據的完整性而為各單位提供直接的好處。這樣做也將使未來基于計算機的方法能夠更容易地處理和訓練人工智能。在戰術環境中,表格格式的結構將有助于標準化文件,如情報收集、火力支援協調和行動同步矩陣。它還將為陸軍參謀部創造更有用和可復制的產品,同時為未來基于計算機的系統提供豐富的、可理解的陸軍行動數據。在實際和有效的情況下,任何單位使用的文件或工具--如上所述,但目前停留在基于文檔(微軟Word)或幻燈片(微軟PowerPoint)的格式--應立即替換成表格文件(微軟Excel)。在Excel中收集數據時,各單位應在文件中指定一致的列標題名稱和一致的數據類型(數字、時間序列或文本)。這種過渡將直接導致更強大和準確的人工智能系統,是快速做出決定的關鍵步驟。當陸軍的標準表格和文件結構更好,更容易使用,并為用戶和數據消費者提供更有用的信息時,這種過渡就得以實現。
為了指導人工智能的發展和需求的產生,各單位應該收集和記錄在駐軍和野外訓練演習中的時間。這可能是一項具有挑戰性的繁重任務,作者建議各單位可以通過兩種不同的方式來完成這項工作。第一種是收集有關在系統之間手工復制數據或依靠人類在數據源之間協調的領域或過程的軼事信息。這在戰術指揮所可能特別有用,以確定我們依靠士兵在不同的系統之間協調的領域。第二個選擇是指揮官指示首席信息官/G-6通過軍隊計算機上的擊鍵記錄器和應用程序監控設備來安裝和收集數據。數據科學家和人工智能工程師可以利用這些信息來識別低效率和耗時的計算活動,以開發出針對的系統。原始使用數據和數據效率低下的軼事可以與陸軍未來司令部的組織共享,如軟件工廠或AI2C,然后可以與各單位合作,快速開發和實施解決方案。
未來的所有陸軍系統和最近的許多系統都會產生大量的數據,這些數據必須被立即訪問。首先,對于陸軍考慮獲得的任何會產生數據的記錄程序,作者建議進行數據可及性和存儲審查。這項審查的目的是評估陸軍人員訪問該系統收集和存儲的數據的能力。除了少數幾個陸軍系統外,所有的陸軍系統都缺乏通用的應用編程接口和支持程序性系統訪問的能力,這是不可接受的。此外,這些系統所存儲的歷史數據是美國陸軍的財產,因此必須通過行業標準的方法向其士兵和軍官提供,而不需要任何民間中介機構。這些系統目前的數據環境對于開發人工智能系統來說是非常困難的。
其次,陸軍應啟動對當前未能達到這一標準的系統的審查,并重新考慮對這些項目的具體要求。通過修改采購流程和審查目前授予的合同,陸軍將在政府和私營部門組織中建立起自己的數據質量和可訪問性標準的領先地位。
在專業軍事教育課程中,美國陸軍訓練和理論司令部應立即引入數據管理和使用策略方面的適當指導。作為基礎軍官領導課程的一部分,數據教育應包括一般數據收集策略、單位和部門特定信息的組織以及現代數據可視化工具等主題。這些工具將使后勤人員能夠更好地組織單位維護數據,情報人員能夠更好地綜合不同的情報來源,而機動人員能夠更好地報告和收集數據。這種教育的核心原則必須是相關的;教導學生這如何直接適用于他們的下一個工作。在上尉職業課程中,可以在此基礎上加入如何管理多種數據來源和建立數據收集文化的教學。指揮和總參謀部學院應該開設一門數據收集選修課,以教育戰地級軍官整合權威數據源、管理共同行動圖以及支持數據收集和管理所需的基礎設施。陸軍戰爭學院應該教育高級戰地級軍官識別數據收集戰略中的戰略差距,并讓他們準備好利用計算機增強的態勢感知進行領導。此外,旅、師和軍團的指揮官和參謀長應該有機會完成AI2C的高級領導教育項目,以了解和理解如何用人工智能系統領導組織。陸軍需要調整數據收集和管理技術方面的軍官教育,以便為MDO中不斷變化的戰斗要求做好準備。
戰斗訓練中心為開發和實施戰術應用的AI-enabled系統提供了一個很好的場所。通過存儲單位輪換的標記數據,并向對方部隊提供為戰術指揮所創建的人工智能系統的早期版本,作戰訓練中心可以成為陸軍人工智能發展的核心,同時也為復雜的系統提供快速反饋,這些系統在陸軍面臨近似對手的戰斗時才會有全面測試和實施的挑戰。類似的機會也存在于由任務指揮訓練計劃進行的指揮所演習的訓練中。
雖然大型組織之間的協同作用和共同的努力路線是有價值的,但陸軍將從不同單位獨立考慮和采納這些建議中受益。隨著時間的推移,這些獨立的想法將形成一個更強大的人工智能系統的基礎,隨著人們的流動和職位的改變,自然的分享和混合想法。陸軍可以仿照開源軟件社區分享想法并迅速學習彼此的獨特方法,在MDO中創造一個人工智能環境。通過在本地開發獨特的解決方案,然后隨著時間的推移進行合作,各單位將確定共同的挑戰,同時也減少了忽視具體特征或特定任務的獨特因素的可能性。
在進行上述努力的同時,陸軍應該開發、試驗并采用最先進的技術來實現戰術總部的運作。為了實現這一目標,陸軍可以在任務指揮訓練計劃進行的指揮所演習和作戰訓練中心的訓練輪換中開始將人工智能納入訓練。這將首先記錄來自控制系統中使用的計算機的數據,參與者的聲音,以及來自作戰系統的位置數據。然后,這些數據將提供給數據科學家,讓他們從受控環境中獲取作戰數據。使用人工智能和自然語言處理,結合事件和敵對勢力行動的細節和時間,然后可以分析這些數據,以確定當前流程無法滿足戰斗需求的趨勢。然后可以進一步研究這些趨勢中具有最佳或更好性能的異常情況,以確定成功的戰術、技術和程序。這將促進對現有系統的改進,并開發更多的工具來實現作戰。一個例子是分析一個旅戰斗隊對敵方部隊的防空雷達系統啟動的反應。通過捕捉與事件相關的所有數據并了解對方部隊行動的精確細節,行動后的分析可以更有力地了解技術方法和友軍探測的細節,工作人員和友軍單位內部的溝通(包括內容和傳輸方法),采取的行動,以及目標的有效性,包括評估。在眾多單位中反復進行,這將使我們能夠準確了解陸軍單位的能力、差距和有效性。由于指揮所演習和訓練輪換中固有的事件的數量和種類,有一個巨大的和未被充分利用的可用數據山,以提高軍隊的作戰能力。
將人工智能整合到戰術總部的近期目標是為從旅到軍團的各梯隊制作一個增強的共同作戰畫面(COP)。這將減少行動和瞄準過程中的友好周期時間,同時提高指揮官的決策質量。強化的作戰圖將提供更準確和詳細的友軍信息,提供對作戰和任務變量的更多情況了解,并增強指揮官看穿戰爭迷霧的能力。這將通過整合戰術行動中心內目前不同的系統來實現,包括指揮所計算環境、高級野戰炮兵戰術數據系統、空中和導彈防御工作站、電子戰規劃和管理工具、分布式共同地面系統-軍隊和全球戰斗支持系統-軍隊。目前,這些系統并沒有在一個單一的人機界面上提供足夠的綜合COP。此外,必須優先考慮開發、實驗和實戰化的軟件和硬件,這些軟件和硬件可以攝取任務和作戰變量的數據,以分析數據并優先處理時間敏感的數據,供參謀部和指揮官分析和采取行動。
這個系統以及其他類似的系統將同步和整合陸軍數據,以便在復雜、動態的環境中做出更快的決策。這是在現代戰爭中作戰的必要進步;然而,它也將引入更多的風險。就系統的復雜性而言,人工智能組件明顯比軟件組件更復雜,并帶來額外的挑戰。沒有任何人工智能可以解釋它為什么會做出這樣的預測,而且不幸的是,表現最好的智能形式也是最不容易理解的。最先進的人工智能系統只能提供有效性和準確性的措施,以證明其使用的合理性。此外,現實世界不可能完全由人工智能工程師在進行智能訓練時使用的數據來模擬,也沒有干凈的、有標簽的數據集用于戰斗。這種數據偏差必須用道德的軟件工程和對軍隊和人工智能的深入了解來解釋。與私營部門公司類似的雄心勃勃的產品相比,目前為軍隊帶來這種技術的努力小得驚人。2022年,陸軍畢業并開始雇用20名人工智能專業人士。相比之下,谷歌在2016年雇用了大約一個滿員的軍團,41456人,只是軟件工程師。在這個數字中,有兩個師的價值,27,169人,只是專門用于研究和開發。自2016年以來,谷歌的全職員工總數已增加了一倍多。如果陸軍要通過開發和部署其在MDO中作戰所需的人工智能系統來實現其勞動力的現代化,那么它必須從今天開始準備數據環境。
(備:本文機器翻譯)
美陸軍統一網絡計劃正在推動網絡在2028年之前從一個被認為是看不見的資產變成一個支持多域作戰(MDO)方式的部隊武器系統。美陸軍的統一網絡將提供一種可生存的、安全的、端到端的能力,使陸軍在競爭、危機或沖突期間以及在所有作戰領域(海洋、陸地、太空、網絡、空中)作為聯合/聯盟部隊的一部分進行運作。
美陸軍參謀長的《陸軍向多領域作戰轉型白皮書》和到2028年擁有一支具備多域作戰能力部隊的目標,突出了對陸軍統一網絡的關鍵需求。決策主導權和超額配給能力是MDO的核心,而陸軍只有通過彈性、安全的全球網絡能力和容量才能實現這一目標。在此基礎上,美陸軍統一網絡計劃將多種復雜的網絡現代化工作調整為支持MDO所需的單一、一致的方法。
通過跨領域的努力,美陸軍統一網絡計劃為2028年的Way Point部隊提供了一個統一的網絡,然后隨著信息技術的持續快速發展而不斷進行現代化。
美陸軍統一網絡計劃與陸軍戰略的重點相一致,即建立戰備、現代化、改革陸軍以及加強聯盟和伙伴關系。現有的戰術網絡現代化戰略和實施計劃與陸軍統一網絡計劃相銜接,并保持一致。此外,陸軍統一網絡計劃在多個階段和時間范圍內與2019+陸軍戰役計劃并行,并使其得以實施。
第一階段:近期(目前-2024年)--建立統一的網絡
這一階段已經開始,同步進行綜合戰術網絡(ITN)和綜合企業網絡(IEN)的現代化。這一階段的主要工作包括:
對這一階段具有決定性意義的是建立一個基于標準的安全架構,該架構建立在零信任原則之上,最初的主要重點是SIPR網絡的現代化,然后是NIPR的關鍵能力,包括工資、后勤、合同等。
美陸軍開始實施一個整體的方法,隨著時間的推移發展統一網絡,使多種努力同步進行,并利用新興技術,如軟件定義和5G及以上的無線網絡,也符合零信任原則。
美陸軍正在追隨美國防部副部長辦公室,將無線蜂窩網絡作為戰術和企業網絡使用的一項關鍵技術。這將補充網絡整合,減少對非無線網絡的依賴。
這一階段開始時,能力加速進入云基礎設施,同時迅速剝離傳統能力和流程。關鍵是建立共同的數據標準,以實現人工智能(AI)和機器學習(ML)等新興能力。
任務伙伴環境(MPE)的持續發展將繼續進行,因為企業努力建立一個持久的能力,并消除浪費的偶發努力。
美陸軍將繼續調整部隊結構,以實施國防部信息網絡行動(DODIN Ops)的建設,在一個有爭議和擁擠的環境中運營、維護和捍衛統一網絡。
美陸軍必須完成整個企業的網絡融合,以調整單一的陸軍服務提供商,提高網絡的準備程度、標準化和互操作性;提高陸軍的網絡安全態勢;并使DCO快速響應。這種融合為統一網絡的建立創造了條件。
這一階段結束時,建立了一個標準化的綜合安全架構,為統一網絡奠定了基礎,并能在世界任何地方快速部署和立即開展行動。
第二階段:中期(2025-2027)--統一網絡的運作
這一階段從25財政年度開始,繼續融合ITN和IEN的能力。這一階段的主要工作包括:
完成DODIN行動的構建,支持部隊結構,使統一網絡在競爭和擁擠的環境中得到防御和運作。
這一階段完成了混合云能力的建立,包括加速Al/ML能力發展的戰術編隊。
美陸軍將建立一個持久的任務伙伴網絡(MPN),包括從企業到戰術邊緣的所有硬件、軟件、基礎設施和人員,包括在所有戰斗訓練中心(CTC)和任務訓練綜合體的就業。
這一階段在統一網絡完全支持2028年的MDO目標部隊時結束。
第三階段:遠期(2028年及以后)--持續實現統一網絡的現代化
這個階段從28財政年度開始,當陸軍統一網絡在操作上、技術上和組織上完全準備好支持2028年的MDO Way Point部隊。
鑒于信息技術和網絡領域快速和持續的變化速度,這個階段是沒有盡頭的--現代化演變為統一網絡的成熟。這是一個持續的過程,統一網絡沒有固定的結束狀態。
美陸軍統一網絡計劃伴隨著陸軍統一網絡的實施,這是一個美國陸軍執行令(EXORD),它將框架分解為與追求框架內的努力方向(LOE)和支持目標有關的近期和中期的關鍵任務。作為網絡整合和管理的領導者,首席信息官(CIO)和副參謀長(DCS),G-6將使用陸軍統一網絡實施計劃來同步和評估整個部隊和所有任務領域的努力,以建立統一網絡,支持2028年具有MDO能力的軍隊。
2022 年 10 月 11 日,美國陸軍發布了一份綜合數據計劃(ADP),這是一種全軍范圍內改進數據管理以確保陸軍成為以數據為中心的組織的方法。
該計劃是一項為期三年的工作,將改善整個陸軍的數據管理、數據治理和數據分析。作戰任務是陸軍數據計劃的當前重點。ADP 在該任務領域的成果是通過進行必要的更改來確保作戰人員的數據得到正確管理和使用,從而為作戰人員提供優勢。陸軍已經開始對數據管理能力、工具和模型進行原型設計,以實現這一目標。
陸軍首席信息官 Raj Iyer 博士說:“數據以及如何在所有梯隊中整合這些數據以實現真正快速、敏捷的決策,才是真正為陸軍提供其在未來戰爭中所需的競爭優勢的關鍵。”
數據和數據分析將為 2030 年的陸軍提供動力。士兵將需要在正確的時間和正確的地點獲得正確的數據,以便在每個梯隊做出更快、更好的決策——以超越任何對手的思維和步伐。
與早期的軍事行動相比,現在的戰爭范圍更大且范圍不斷擴大。作為聯合全域作戰的一部分,多域作戰是陸軍必須準備并贏得下一場戰斗的地方。這是一個數據豐富的環境。
每個領域都有自己的信息和數據流,一些信息來自開源情報,一些來自天基傳感器,還有一些來自網絡空間。今天的士兵和指揮官需要跨領域的綜合來主宰戰場。
ADP 概述了工作的組織并提供了總體戰略目標。它側重于中期努力,未來將被另一個更新所取代。
通過陸軍數據計劃實現這一決策優勢是陸軍的關鍵目標。
現代戰術戰爭需要迅速而有效的決策和行動,以便在經常是高度動態和復雜的戰區保持競爭優勢。需要考慮的因素的數量因不確定性、事件的快速發展和人為錯誤的風險而放大。自動化、人工智能和博弈論方法的潛在應用可以為作戰人員提供認知支持。這項研究以自動兵棋推演輔助決策的形式探索了這些應用。該團隊為這個未來的系統開發了一個概念設計,并將其稱為兵棋推演實時人工智能輔助決策(WRAID)能力。
頂點項目的目標是探索自動化、人工智能和博弈論的應用,作為支持未來WRAID能力的方法。該團隊為WRAID能力開發了需求、概念設計和操作概念。該小組確定并探索了可能對未來實施WRAID能力構成障礙的挑戰性領域。該小組調查了與使用人工智能來支持戰爭決策有關的倫理挑戰和影響。
本報告首先對與WRAID能力相關的主題進行文獻回顧。文獻回顧從人工智能的回顧開始,提供了一個關于人工智能如何工作以及它能夠完成什么類型任務的概述。文獻綜述探討了人機協作的方法,以支持未來指揮官和人類用戶與WRAID系統之間的互動。需要翻譯指揮官的意圖,并讓WRAID將有意義的輸出傳達給指揮官,這需要一個強大的界面。審查包括傳統的兵棋推演,以研究目前的模擬兵棋推演是如何進行的,以便深入了解,未來的WRAID能力如何能夠實時復制兵棋推演的各個方面,并認為以前的兵棋推演可以為人工智能和機器學習(ML)算法的發展提供訓練數據。ML算法的訓練需要大量的代表性數據。文獻回顧研究了人類的認知負荷,以深入了解人類大腦的認知技能和上限;并確定人類思維的極限,以顯示人工智能可能提供的支持。文獻綜述中涉及的最后一個主題是,傳統的計劃和決策,以了解目前在軍事上如何制定戰術行動方案。
該小組進行了需求分析和利益相關者分析,探索WRAID能力如何支持作戰人員。該小組在需求分析的基礎上為WRAID系統開發了一套需求。這些要求被歸類為:硬件/軟件,人機界面,和道德規范。第一階段的分析結果包括 (1)戰爭的復雜性需要發展一種未來的WRAID能力,這種能力利用自動化方法,包括人工智能、ML和博弈論,(2)WRAID能力需要大量的計算能力和復雜的軟件算法,(3)實現未來WRAID系統的挑戰將是技術和道德的。
未來WRAID系統的概念設計是基于需求分析的。概念設計被記錄在一套系統模型中,包括背景圖、系統視圖、功能工作流程圖和操作視圖。該團隊開發了一個作戰場景,以支持對WRAID能力如何在作戰中使用。
在開發WRAID的過程中,預計會有一些路障。開發WRAID系統的技術是存在的,然而,研究小組發現數據挑戰、人工智能訓練、程序限制和當前系統工程的局限性將是需要解決的障礙。數據挑戰指的是獲得足夠的數據集的能力,這些數據集代表了訓練ML算法所需的真實世界的戰術行動和兵棋推演分析。程序性挑戰包括國防部實施網絡安全、機密數據、數據庫訪問和信息分配協議的能力。系統工程方面的障礙是需要新的方法來設計安全和可靠的人工智能系統,如WRAID能力。將需要SE方法來處理不可預見的故障模式,并在系統生命周期的早期確定根本原因。
對像WRAID能力這樣的人工智能系統的倫理考慮是系統發展的一個重要因素。開發系統以取代倫理學,將使系統更有可能被部署。有幾個有道德問題的自主武器系統被拉出來作為WRAID能力的道德對話的基礎。通過一個示例場景,對道德狀況進行定性分析,以了解在部署WRAID能力時可能出現的道德問題。倫理學在未來的技術中發揮著巨大的作用;從一開始就考慮到倫理學,建立技術是很重要的。
未來的重點需要放在繼續對想象中的WRAID系統采取正規的系統工程方法。WRAID系統需要一個強大的數據集,需要收集和注釋;收集的定性兵棋推演數據越多,WRAID系統的可行性和準確性就越高。與軍事部門的合作對于最大化WRAID的利益至關重要,例如情報和偵察組織。WRAID的模擬將是完善系統要求和創建現實模型的關鍵。關于如何使用WRAID的培訓和文檔應該同時開發,所以利益相關者,特別是指揮官已經準備好,知道如何使用這個新工具。未來的研究領域包括認知工程、基于正式模型的系統工程和人機協作。
隨著目前技術進步的速度和外國的目標,人工智能將在未來的沖突和戰爭中發揮作用。自上而下的指令將需要設計和實施WRAID能力:提供大量的資源,解決操作和文化變化,重組系統工程,并確保網絡安全和收購變化。實現未來的WRAID能力并不是一個微不足道的任務。然而,它對確保現在和未來的戰斗空間優勢至關重要。
機器學習(ML),從廣義上講,是一類自動優化參數以處理給定輸入并產生所需輸出的計算機算法。ML的一個經典例子是線性回歸,據此找到一條最適合(通過)一組點的線。最近的一個例子是分類任務,如用 "貓 "這樣的單字來標記一張百萬像素的圖像。
對于許多應用,ML完成了人類可以做得同樣好的任務。然而,ML在兩種情況下大放異彩:1)任務的數量巨大,例如數百萬;2)問題的維度超出了人類思維的理解。一個簡單的例子是同時實時監控成千上萬的安全攝像頭,尋找可疑的行為。也許一個ML方法可以發現異常事件,并只與人類觀察者分享這些視頻片段。更好的是,異常圖像可以被暫時貼上諸如 "1號入口處的蒙面入侵者 "之類的標簽,以幫助保安人員只關注相關的信息。
除了減少人類的負擔外,ML還可以將人類可能無法識別的復雜的相互聯系拼湊起來。例如,一個ML算法可以發現,在一百萬個銀行賬戶中,有五個賬戶的交易似乎是同步的,盡管它們沒有相互發送或接收資金,也沒有向共同的第三方發送或接收資金。
鑒于手持和固定設備的計算資源不斷增加,我們有必要想象一下,ML可以在哪些方面改變戰爭的打法。當然,ML已經對美國陸軍的科學研究產生了影響,但我們也可以很容易地想象到自主車輛和改進的監視等作戰應用。
本文件的主要目標是激勵美國陸軍和美國防部的人員思考ML可能帶來的結果,以及為實現這些結果,哪些研究投資可能是有成效的。
在ARL的許多研究項目中,機器學習目前正在被使用,或者可以被使用。我們列出了一些使用ML或可能從ML中受益的研究項目。我們列出的與ML相關的ARL研究工作絕非完整。
雖然從技術上講,機器學習自19世紀初高斯發明線性回歸以來就一直存在,但我們相信,ML的最新進展將以我們目前無法想象的方式影響軍隊。在本節中,我們概述了我們認為將得到加強的軍隊行動的許多領域,以及可能采用的ML方法的種類。
軍事情報包括信息收集和分析,因為它涉及到指揮官做出最佳決策所需的信息。由于收集的數據量越來越大,處理必須自動化。需要考慮的主要問題是數據的數量、速度、真實性和多樣性。大量的數據(又稱大數據)需要在許多計算節點上對數據進行智能分配。速度要求快速計算和網絡連接到數據流。真實性是對信息來源和異常檢測的信任問題。多樣性相當于使用許多不同的ML算法的不同訓練模型的應用。我們在本小節中概述了不同類型的數據和分析要求。
讓計算機從從各種媒體來源收集到的大型文本數據庫中提煉出重要的概念和文本部分,有很大的好處。最近報道的另一個ML突破是不同語言之間的精確文本翻譯。 軍隊的一個獨特挑戰是翻譯不常見的語言,因此專業翻譯人員較少。在人工通用智能(AGI)領域,一些團體聲稱,自然語言處理將是類似人類認知的基礎。
鑒于人類、傳感器和代理產生的數據的激增,一個很大的問題是,除了證明其收集的直接用途之外,這些數據還包含什么剩余價值。數據挖掘可以是統計學和機器學習的努力,以發現數據中的模式,否則人類操作者就會錯過。
傳統上,異常檢測是通過首先識別已知數據的群組和描述數據的分布來進行的。然后,當新的輸入被處理時,它們被識別為屬于或不屬于原始分布。如果它們在已知分布之外,就被認為是異常的。以下許多類型的異常檢測系統可能對軍隊有用。
網絡入侵檢測:超出常規的網絡流量。McPAD和PAYL是目前使用的軟件中的2個這樣的例子,它們使用了異常檢測。
生活模式異常:人們的視覺和生物統計學上的行為方式與常人不同,表明他們可能正在進行一些對抗性行動。
基于條件的維護:在當前生命周期中,材料/系統在其年齡段不典型的信號。
士兵異常:有理由相信士兵的生物識別技術不正常。
異物檢測:在已知物資數據庫中無法識別的物體的視覺效果。
自動目標識別(ATR)是一個非常成熟的領域,已經使用機器學習幾十年了。
1)目前深度學習的進展將在多大程度上增強ATR?
2)更復雜的算法是否需要更復雜/更耗電的機載計算?
ML是否能對目標的各種欺騙性的混淆行為具有魯棒性?
強化學習在多大程度上可以用來進行實時軌跡調整?
機器學習在機器人學中的應用也是一個巨大的領域。ML應用領域包括傳感、導航、運動和決策。目前,傳感將從計算機視覺的所有進展中受益。導航,除了使用標準的GPS之外,還可以從自我運動中受益,也就是基于自身感知的運動估計。運動可以被學習,而不是規劃,這不僅會導致更快的開發時間,而且還能在新的環境或受損的模式下重新適應(例如,失去四條腿中的一條)。最后,隨著機器人的數量超過人類操作員的數量,機器人將有必要自行決定如何執行其規定的任務。它將不得不做出這樣的決定:"由于電池電量不足,我是否要回到大本營?"或者 "我是否繼續前進一點,然后自我毀滅?"
除了機器人技術,人們最終希望任何系統在損壞或不能滿負荷工作時能夠自我糾正。這需要在某種程度上的智能,以自主診斷缺陷和問題,并利用其可用的資源糾正這些問題。
在通過機器學習來學習自主權的情況下,問題將是:"自主系統將如何應對X情況?" 這里的問題是,對于一個擁有潛在致命武力的系統,我們怎么能確定它只會正確合法地使用武力?我們推測,在機器學習的算法擁有使用致命武力的實際能力之前,必須對其進行廣泛的測試,即使它與人類的環形決策相聯系。
近年來,大量的研究都在研究使用機器學習來自主地玩各種視頻游戲。在某些情況下,報告的算法現在已經超過了人類玩游戲的水平。在其他情況下,仍然存在著處理長期記憶的挑戰。對于美國空軍來說,智能代理已經成功地在以戰斗為中心的飛行模擬器上進行了訓練,這些模擬器密切模仿現實生活。陸軍的問題包括以下內容。
智能代理能否附加到機器人平臺上?
智能在多大程度上可以通用于處理現實生活與視頻游戲中遇到的各種情況?
當我們可能不理解一個訓練有素的代理的邏輯時,我們能相信它的行動嗎?
代理在多大程度上能夠與人類合作?
在過去的十年里,機器學習在網絡安全方面發揮了不可或缺的作用。具體來說,ML可以用于異常檢測,檢測已知威脅的特定模式,并辨別網絡行為是否可能由惡意代理產生。隨著該領域的不斷加強,問題是ML是否能使安全比對手領先一步,因為對手可能利用ML來混淆檢測。
一個長期的設想是,軍隊使用的每一個機械系統都有一些關于系統當前和預測健康的內部感應。相關問題如下。
我們能從有限的傳感器中辨別出一個系統或系統組件的當前健康狀況嗎?
機載ML能否預測一個系統或系統部件在暴露于特定環境或彈道侮辱之后的健康狀況?
隨著基因組序列的數量繼續呈指數級增長,比較在現場獲得的序列所需的計算工作可能變得無法管理。機器學習可以通過對序列進行不同層次的分類來減少必要的比較。
93 近年來,機器學習已經在檢測各種組織中的惡性腫瘤方面取得了長足的進步。94 它同樣可以被用來描述創傷或創傷后應激障礙(PTSD)95,并制定治療計劃。
陸軍的一個重要組成部分集中在對行動、系統、研究和測試的分析上。傳統上,分析人員使用大量的工具,包括機器學習,以多維回歸、聚類和降維的形式。隨著深度學習的出現,一套新的工具應該是可能的,可以更有效地處理需要更復雜模型的大型數據集。例如,應該有可能從測試期間拍攝的視頻流中提取特征和物理屬性,這可能超過目前的標準做法。
自適應用戶界面(AUI)和情感計算。ML可以用來確定用戶的心理和/或情緒狀態,并提供適合這種狀態的界面。此外,可變的AUI可以服務于用戶的變化。例如,一些用戶可能喜歡音頻反饋而不是視覺反饋。
推薦系統。最流行的推薦系統之一是根據以前看過的電影的評分來選擇用戶想看的下一部電影(例如,所謂的 "Netflix問題")。對于軍隊來說,可以根據以前的使用情況和庫存核算的反饋來推薦后勤補給的情況。
搜索引擎/信息檢索。傳統上,搜索引擎返回文件的 "點擊率"。新的范式是以簡明的形式回答用戶的問題,而不是簡單的模式匹配。
情感分析。社交媒體上的流量和對環境進行訓練的各種傳感器不僅可以檢測關鍵的關鍵詞或特定物體的存在,還可以推斷出可能的攻擊的可能性。
有針對性的宣傳。傳統上,宣傳是通過散發傳單來完成的,如今,宣傳可以通過社交媒體來傳播。ML的角度是如何以最有說服力的信息向正確的人口群體進行宣傳。此外,重要的是快速檢測和顛覆來自對手針對我們自己的人員/人民的宣傳。
本研究的目標之一是確定當前研究中的差距,這些差距可能會限制ML在軍隊研究和行動中的全部潛力。本節借用了ARL運動科學家Brian Henz博士和Tien Pham博士(未發表)的戰略規劃工作。
傳統上,在一個特定領域采用ML的一半戰斗是弄清楚如何適應現有的工具和算法。對于陸軍所面臨的許多問題來說,這一點更為突出,與其他學術、商業或政府用途相比,這些問題可能是獨一無二的。任何數據分析員面臨的第一個問題是使數據適應他們想要使用的統計或ML模型。并非所有的數據都使用連續變量或者是一個時間序列。離散/標簽數據的管理可能非常棘手,因為標簽可能不容易被轉換成數學上的東西。在自然語言處理中的一個例子是,單詞經常被轉換為高維的單熱向量。另一個例子可能是如何將大量的維修報告轉換為對某一特定車輛在一段時間內的表現的預測。
此外,陸軍的要求超出了典型的商業部門的使用范圍,不僅需要檢測物體和人,還需要檢測他們的意圖和姿態。這將需要開發新的模型。另一個大的要求是可解釋性,正如DARPA最近的一個項目所概述的那樣:是什么因素導致ML算法做出一個特定的決定?在一個真實的事件中,如果一個ML算法在沒有人類驗證的情況下宣布一個重要目標的存在,我們能相信這一決定嗎?
隨著對計算要求高的ML任務的設想,開發人員正在使用多線程、并行和異構架構(GPU、多核)來加快計算速度。ML的分布式實現遠不如GPU版本常見,因為分布式計算中的節點間通信存在固有的網絡瓶頸,而且在單精度浮點性能方面,GPU相對于CPU有很大優勢。除了目前對GPU的強烈依賴,生物啟發式神經計算旨在尋找非馮-諾伊曼架構來更有效地執行ML,并可能更快。這方面的一個例子是IBM的神經形態芯片。97 未來的研究應該關注如何分配ML處理,使節點之間的網絡通信最小化。另外,像聚類這樣的無監督學習算法在多大程度上可以被映射到神經網絡中?
其他需要考慮的事情。
目前的ML軟件(特定的神經網絡)在一個小型的GPU集群中表現最好。
大多數基于非神經網絡的ML算法的并行性不高,或者根本就沒有并行。
另一個軍隊的具體挑戰是分析基本上沒有標記的數據集(例如,用無監督學習)。手動標注集群將是一種半監督學習的形式。
隨著進入偏遠地區或任何遠離基地的地區,軍隊必須限制系統的尺寸、重量和功率。此外,在 "激烈的戰斗 "中,時間是關鍵。例如,人們不能在遭到槍擊時等待作戰模擬的完成。最后,在其他商業發射器占主導地位的地區,或者在限制無線電通信以提高隱蔽性的情況下,網絡帶寬可能會受到很大限制。
在這種倍受限制的環境中,機器學習將需要有效地進行,而且往往是以一種孤立的方式進行。截然相反的條件是使用大型數據庫訓練大型神經網絡,這往往是最先進的機器學習功力的情況。商業部門正在開發自動駕駛汽車,據推測將使用低功耗的計算設備(如現場可編程門陣列、移動GPU)進行自主駕駛、道路/障礙物檢測和導航。然而,陸軍將有更多的要求,包括自主傳感器和執行器、態勢感知/理解、與人類的通信/合作,以及廣泛的戰場設備。這將需要多幾個因素的計算能力和特定算法的硬件,以實現最佳的小型化和低功耗。
在混亂的環境中,操作環境預計會有比通常密度更高的靜態和動態物體。此外,人們完全期待主動欺騙以避免被發現。我們也希望能夠開發出足夠強大的算法,至少能夠意識到欺騙,并相應地調低其確定性估計。
基于CNN的目標分類的突破可以部分歸功于每個物體類別的成千上萬個例子的可用性。在軍隊場景中,某些人和物體的數據可能是有限的。人們最終將需要one-hot99或multishot分類器,其中幾個有代表性的數據條目就足以學習一個新的類別。到目前為止,最好的選擇是 "知識轉移",通過調整以前訓練的模型的所有參數的子集來學習新的類別。我們的想法是,由于需要優化的參數較少,修改這些參數所需的數據也較少。
即使對于我們可以產生大量圖像的目標類別(例如,友好物體),我們也需要訓練自己的模型,以便從每個類別的潛在的數千張圖像中識別軍隊相關類別。軍隊還使用商業車輛中通常不存在的其他傳感模式(例如,熱能和雷達)。因此,需要為這些非典型的傳感設備訓練模型。從根本上說,非典型傳感設備可能需要新的神經網絡拓撲結構以達到最佳的準確性和緊湊性。
一個值得研究的有趣領域是將模型和模擬與機器學習相結合。有很多方法可以做到這一點。例如,ML可以用來推導出模擬的起始參數。此外,ML還可以用來處理模擬的輸出。一個耐人尋味的新領域是開發基于物理學或類似物理學的模擬,使用類似ML的模型/方程。一個這樣的應用是預測 "如果?"的情景。例如,"如果我跑過這棵樹呢?接下來會發生什么?"
機器學習在傳統上被認為是人工智能的硬性(即數學)表現形式。有可能最終,所有的人工智能任務都會被簡化為數學。然而,就目前而言,一些智能任務似乎更多的是基于推理或情感。對于之前描述的方法中的任務,ML并不能充分解決以下軟性人工智能的特點。
人類并不總是完全按邏輯推理,但他們也有能力將不完整的信息拼湊起來,做出 "最佳猜測 "的決定。幾十年來,對這種行為進行編碼一直是一個挑戰。
情緒似乎是驅動人類達到某些目的的動機/目標功能。例如,快樂可能會導致不活動或追求生產性的創造力。另一方面,恐懼則可能會導致忍氣吞聲。計算機是否需要情感來更有效地運作,還是說它們最好擁有100%的客觀性?這既是一個哲學問題,也是一個未來的研究方向。不過現在,毫無疑問的是,在人與代理人的團隊合作中,計算機需要準確地解釋人類的情感,以實現最佳的團體結果。
與人類的互動性是陸軍研究未來的首要關注點。一個類似的問題是,不同的計算機系統之間如何進行交流,而這些系統不一定是由同一個實驗室設計的。研究的一個領域是用計算機來教那些在這方面有困難的人進行社會交流。 再一次,對于人與代理的合作,代理將需要能夠參與社會互動,并在人類的陪伴下遵守社會規范。
創造力通常被認為是隨機合并的想法,與新的元素相結合,由一個鑒別功能決定新創造的項目的功能和/或美學。在某些方面,創造力已經被某些計算機實驗室所證明。例如,為了設計的目的,計算機可以被賦予某些方面的創造力。
人工智能的最終目標是將許多狹義的智能算法合并成一個統一的智能,就像人類的頭腦一樣。75鑒于許多狹義的人工智能任務已經比人類的某些任務要好,即使是早期的所謂人工通用智能(AGI)也可能具有一些超人的能力。AGI的一個主要目標是將目前由人類執行的某些任務自動化。
如果不提及許多哲學家的猜測,機器學習將最終能夠改進自己的編程,導致能力的指數級提高,也許會遠遠超過人類智能,那么機器學習的研究就不完整了。這些設想既是烏托邦式的104,也是烏托邦式的105。希望超級智能能夠解決世界上的許多問題。
在這項工作中,我們回顧了機器學習的不同類別,并描述了一些更常用的方法。然后,我們指出了一小部分關于ML在ARL中的應用的例子。最后,我們預測了ML在未來可以應用于軍隊的各個領域,并概述了為實現這一結果需要解決的一些挑戰。我們希望這份文件能夠激勵未來的研究人員和決策者繼續投資于研究和開發,以充分利用ML來幫助推動美國陸軍的發展。
2022年5月9日蘭德公司發布《利用機器學習進行作戰評估》報告。作者描述了一種利用機器學習來支持軍事作戰評估的方法。他們展示了如何利用機器學習從情報報告、作戰報告以及傳統和社會媒體中的非結構化文本中快速、系統地提取與評估相關的見解。這些數據已經由作戰級別的總部收集,通常是關于當地居民、敵人和伙伴部隊的最佳可用信息來源,但很少被納入評估,因為它們的結構不容易被分析。本報告中描述的機器學習方法有助于克服這一挑戰。
本報告中描述的方法,作者利用最近結束的針對上帝抵抗軍的戰役進行了說明,使評估小組能夠向指揮官提供關于戰役的近乎實時的見解,這些見解是客觀的,與統計學相關。這種機器學習方法可能特別有利于資源有限或沒有具體評估數據的戰役,這在資源有限或被拒絕地區的戰役中很常見。這種機器學習的應用對大多數評估小組來說應該是可行的,并且可以通過公開和免費的機器學習工具來實現,這些工具已被授權在美國國防部系統上使用。
如何利用機器學習工具將現有的情報報告、作戰報告和環境數據(如社交媒體、傳統媒體)納入戰爭行動層面的評估?
準確和及時的評估--提供關于哪些是有效的,哪些是無效的,以及如何改進作戰的反饋--是所有美國軍事作戰的一個關鍵要求。對軍事作戰的評估是圍繞戰役的作戰目標進行的,評估過程的重點是確定在實現這些目標方面是否正在取得進展。評估小組--最好是與指揮小組一起--確定與每個目標相關的預期效果,然后制定有效性措施(MOE),以跟蹤實現這些目標的進展。
獲得和處理正確的數據類型對于產生相關和可辯護的評估至關重要,這也是本報告的主題。有效的評估要求數據是客觀的、縱向的、與軍事作戰希望達到的效果類型相關的、有適當的評估結構,并且有足夠的時間頻率來支持決策。
在以前的研究中,我們為特種作戰部隊(SOF)的作戰評估開發了一種標準化的方法,我們發現作戰總部已經收集的各種數據與評估有關,但很少被使用。三種類型的數據--情報報告(如來自人類情報或信號情報來源)、作戰報告(如情況報告[SITREPs])和環境數據(如社交媒體)中已有的對正在發生的事件的文字描述,往往是有關當地居民、敵人和伙伴部隊的最佳可用信息來源。然而,這些數據的結構很少能被輕易地納入評估過程。
本報告描述了一種方法,即如何利用機器學習(ML)工具將這些現有數據納入作戰評估。我們展示了一個基于ML的文本分類器如何快速整理和準備這些數據,以便使用評估小組常用的標準統計工具進行后續分析。然后,我們使用最近結束的針對上帝抵抗軍的作戰數據來說明這一方法。這種基于ML的方法對大多數評估小組來說應該是可行的,并且可以用公開和免費提供的ML工具來實施,這些工具已被預先授權用于美國國防部(DoD)的機密系統。
本報告所描述的方法使評估小組能夠準確、及時地了解一場戰役,為指揮官提供近乎實時的、客觀的、與統計學相關的結果。可以使用我們的方法分析的每一種類型的數據--情報、作戰和環境--為理解一個戰役的效果提供了一個不同的視角。在有評估特定數據(如投票)的軍事作戰中,這些新的數據來源使評估小組能夠對調查結果進行三角測量,提高評估的可靠性。然而,ML工具在評估專用數據有限或沒有的情況下特別有用--這在資源有限或在被拒絕地區的作戰中很常見。
我們的分析集中在一個具體ML評估應用上:使用 "有監督機器學習"(SML),從現有的情報、作戰和環境報告中的非結構化文本中構建一個可供評估的數據庫。SML的這種應用的直覺是相對簡單的。首先,人類分析員通過手工審查和分析可用的非結構化文本的一個子集。這第一步的輸出通常被稱為 "訓練數據"。然后,ML算法分析這個訓練數據,并試圖模仿人類分析師對所有剩余文本使用的相同分析過程。
這種方法允許評估小組系統地編輯非結構化文本中的信息--每份報告中提供的定性描述成為客觀和定量評估中的單一數據點--然后檢查這些信息如何隨時間演變。這種方法是將ML納入評估過程的最簡單方法,但它仍然是一種有效的方法,可以從這些現有數據中信息豐富的非結構化文本中獲得與評估相關的見解。
在本報告中,我們詳細說明了一個五步工作流程,并在圖S.1中進行了總結,評估小組可以按照這個流程將SML納入評估過程。
圖S.1 用于評估工作流的監督機器學習
第1步是整理大量的潛在相關報告--通常是數以千計的年度報告(或更多)--可用于大多數業務。這個整理過程包括刪除不必要的重復內容,并將數據重新組織成適合ML算法分析的格式。在我們的方法中,現有報告中的非結構化文本被分為單句,然后分析其與競選活動的相關性。
第2步是制定適合每個相關MOE的編碼標準。這些編碼標準是歸納出來的,評估小組首先審查現有的數據,以確定哪些MOE是可以用現有的數據衡量的。然后,評估小組制定具體的編碼標準--也就是一套規則,說明什么時候一份報告應該被認為與該MOE相關(或不相關)。至關重要的是,這些編碼標準要足夠清晰和詳細,以便于復制,使不同的分析員在應用這些標準時產生幾乎相同的結果。本報告為每一類數據(情報、作戰和環境)提供了常用的MOE的編碼標準樣本,盡管具體的編碼標準必須是針對作戰的。
第3步是準備訓練數據,這是SML方法中ML算法的主要輸入。這些訓練數據是整體非結構化數據的一個子集,由評估小組使用步驟2中制定的編碼標準進行審查、分析和編碼。確保編碼標準的穩健性和可復制性是開發這些訓練數據的一個關鍵組成部分,因為ML算法試圖復制人類分析員的編碼。
第4步是實現和校準一個或幾個選定的ML算法。校準過程包括審查由ML算法編碼的報告,以驗證其準確性--也就是說,即確保被識別為相關的報告確實是相關的。如果算法表現不佳,評估小組需要調整算法參數或擴大訓練數據的數量。在一個實際的活動中,這個校準過程應定期重復,以確保算法在更多的數據可用時仍然表現良好。
第5步,評估小組處理來自ML算法的輸出,以整合到評估過程中。ML算法的輸出是一個結構化的數據庫(例如,Excel),確定所有滿足步驟2中制定的編碼標準的報告。這種通用的結構化格式允許用評估小組常用的工具進行分析,并便于插入現有的態勢感知工具中。在某些情況下,可以直接分析這些數據,以產生報告在一段時間內的趨勢線,例如,以正面方式討論一個實體(如敵人或伙伴部隊)的社交媒體報告的百分比與以負面方式討論它的數量相比。在其他情況下,這些數據需要與報告中的其他信息相結合--例如,提取特定地點的信息可以使評估小組生成不斷變化的敵人作戰自由地圖。
機器學習可以成為支持作戰評估的有力工具
我們的研究確定了五個建議,這些建議將提高基于ML的評估方法的價值。
建議1:在受控演習中驗證SML方法。本報告所描述的方法是特意設計的,以使評估小組盡可能容易復制,而且該方法的設計依靠的是既免費又已被批準在許多軍事網絡上使用的工具。然而,盡管我們已經用實際作戰測試了我們的方法,但我們并沒有試圖在實時或與軍事分析員團隊一起做這件事。因此,我們建議利用實戰演習,但在受控條件下驗證各項要求--如任務前培訓、人員配置、分析工具的可用性和必要的數據訪問。
建議2:探索如何利用無監督的ML為作戰評估提供信息。無監督的ML可以提供一種工具,用于發現戰役活動和這些活動的行動目標之間的未預期模式。經過評估小組的審查,這些信息可以為指揮官提供一個寶貴的工具,用來探索未預料到的模式。考慮到我們的任務是探索如何利用ML將現有數據用于評估,我們沒有詳細研究將無監督ML納入評估的實用性或價值。
建議3:對作戰報告實施適度的標準化。SITREP和其他作戰報告往往是關于伙伴部隊活動和能力的唯一最佳歷史數據來源,而且這種報告還可以提供關于美國部隊活動的詳細歷史記錄。這些特點使作戰報告成為評估小組潛在的有力工具--特別是如果有ML(或類似的)工具可以快速提取與評估有關的信息--但這種報告在質量和細節上并不一致。我們建議對這種作戰報告進行適度的標準化。要求(簡單地)戰術部門持續討論其伙伴部隊的活動和能力。
建議4:改善歷史情報和作戰報告的歸檔、發現和提取。獲取和提取本報告所述方法所需的相關情報和作戰報告在現有系統中并不容易。對于情報報告,我們建議在現有系統中增加快速提取縱向數據(如三個月或更長時間的數據)的能力,以滿足一組特定的搜索參數(如地理、布爾邏輯),其中包括報告全文和一些關于數據的基本描述性信息(日期、來源等)。對于業務報告,我們建議業務層面的總部確保所有下屬總部的SITREPs被系統地歸檔。
建議5:擴大專業軍事教育中要求的具體評估討論。盡管承認評估對軍事行動的重要性,但在向聯合部隊提供的與評估有關的教育和培訓方面存在重大差距。因此,評估小組往往難以提供指導有效決策所需的信息,而作戰級總部的其他工作人員往往缺乏經驗。