空軍專業 (AFS) 初始技能培訓 (IST) 的最新趨勢表明,美國空軍 (USAF) 入伍人員重新分類為其他職業專業的人數近年來有所增加,并且在財政年度之間出現了穩步增長2013 年和 2017 年。職業領域重新分類可能會導致廣泛的負面結果,包括成本增加、人員配備延遲、培訓計劃挑戰和士氣下降。為了理解和解決 IST 重新分類的挑戰,作者考慮了改進流程的選項,以對 IST 的現役非在職飛行員進行分類和重新分類。在本報告中,他們概述了 2019 年一項研究的主要發現,該研究采用了定性和定量分析,包括機器學習 (ML) 模型、評估 IST 成功(和失敗)的預測因素。他們還描述了他們對優化模型的測試,該模型旨在確定修改重新分類決策的機會,以便不僅減少重新分類飛行員的數量,而且提高飛行員的工作滿意度和生產力,并提高美國空軍的保留率。
01 研究問題
02 主要發現
2.1 IST 分類旨在優化訓練成功,但不優化其他重要結果
2.2 增加相關變量的數量可以提高 ML 預測的準確性
2.3 重新分類是一個手動過程,可以進行優化以實現不同的結果
2.4 與 IST 飛行員就選定的 AFS 進行的焦點小組討論確定了促成 IST 成功和挑戰的因素,并確定了改進建議
飛行員的特征(例如,動機)和先前的經驗(例如,教育)、支持性教官和學習小組有助于 IST 的成功。
IST 挑戰涉及飛行員特征和訓練基地環境。
改進涵蓋了諸如 AFS 的先驗知識以及對 IST 的期望、課程設計、非 IST 要求和宿舍安排等領域。
03 建議
通過保留有關 IST 資格和結果的數據庫,要求新兵完成職業評估和招聘人員提供有關 IST 和 AFS 的信息,系統地收集有關工作要求的信息,開發生物數據工具,從而擴展 USAF 入伍分類中使用的預測變量集。由所有入伍新兵完成,并使用同行和教官對飛行員的個性進行評分。
通過定義和系統地測量與 IST 成功相關的結果以及通過監控專業畢業的移動平均值來擴展 USAF 入伍分類中使用的結果集。
提高數據質量、全面性和可訪問性,以便 ML 模型能夠提供準確且有用的預測。
更新分類和重新分類流程以優化 IST 的成功和工作匹配,從而提高績效和職業滿意度。
在實施任何 ML 模型之前,應對道德和隱私、ML 模型的可解釋性和模型性能等領域的挑戰。
04 報告目錄
第一章
簡介和背景
第二章
空軍分類和重新分類過程
第三章
可用于預測空軍訓練和職業成果的數據
第四章
預測成功的模型
第五章
重新分類訓練消除的優化模型
第六章
飛行員在選擇專業的初始技能培訓中的經驗
第七章
結論和建議
附錄 A
定義和衡量人員選拔的成功
附錄 B
描述性統計和分析建模結果
附錄 C
優化模型方法論
附錄 D
焦點小組方法論
在使用模擬的訓練過程中,所有信息都會被記錄下來,用于回放、可視化和詳細分析。經典的事后審查 (AAR) 工具提供了許多功能來放大特定時刻或對受訓者的選擇提供一般反饋。培訓師一般使用的素材是分數、視頻和截圖,需要自己手動豐富。
STRATEGIC研究項目提出了基于人工智能和建模與仿真的創新自動化分析工具。我們的工作側重于三個戰略支柱:
早期的結果非常有希望,以至于法國陸軍訂購了許多智能圖表;不僅用于3A和培訓課程的監督,還用于情報評估。將來它還可以用作總部的決策支持和警報系統。
美國的空中優勢是美國威懾力的基石,正受到競爭對手的挑戰。機器學習 (ML) 的普及只會加劇這種威脅。應對這一挑戰的一種潛在方法是更有效地使用自動化來實現任務規劃的新方法。
本報告展示了概念驗證人工智能 (AI) 系統的原型,以幫助開發和評估空中領域的新作戰概念。該原型平臺集成了開源深度學習框架、當代算法以及用于模擬、集成和建模的高級框架——美國國防部標準的戰斗模擬工具。目標是利用人工智能系統通過大規模回放學習、從經驗中概括和改進重復的能力,以加速和豐富作戰概念的發展。
在本報告中,作者討論了人工智能智能體在高度簡化的壓制敵方防空任務版本中精心策劃的協作行為。初步研究結果突出了強化學習 (RL) 解決復雜、協作的空中任務規劃問題的潛力,以及這種方法面臨的一些重大挑戰。
RL 可以解決復雜的規劃問題,但仍有局限性,而且這種方法仍然存在挑戰
當前的海軍作戰要求水手們根據動態作戰環境中的不確定態勢信息做出時間緊迫和高風險的決策。最近的悲慘事件導致了不必要的傷亡,海軍行動中涉及決策復雜性,并特別突出了 OODA 循環(觀察、定向、決策和評估)中的挑戰。涉及使用武器系統的殺傷鏈決策是 OODA 循環中一個特別緊張的類別——具有難以確定的意外威脅、縮短的決策反應時間和致命的后果。有效的殺傷鏈需要正確設置和使用船上傳感器;未知接觸者的識別和分類;基于運動學和智能的接觸意圖分析;環境意識;以及決策分析和資源選擇。
該項目探索了使用自動化和人工智能 (AI) 來改進海軍殺傷鏈決策。該團隊研究了海軍殺傷鏈功能,并為每個功能制定了特定的評估標準,以確定特定 AI 方法的功效。該團隊確定并研究了 AI 方法,并應用評估標準將特定的 AI 方法映射到特定的殺傷鏈功能。
圖:利用人工智能改進海軍殺傷鏈的作戰概念
當前的海軍行動通常是快節奏的、關鍵的,并且需要做出高風險的決策,這些決策有時基于非常動態的戰區中的不確定信息。許多例子強調了提高決策效率的必要性以及減輕觀察團隊負擔的必要性。缺乏上述情況的例子包括 2017 年的菲茨杰拉德號航空母艦 (DDG 62) 和 MV ACX Crystal相撞,以及 2009 年皇家港口號航空母艦 (CG 73) 的擱淺。一些根本原因是相關人員缺乏經驗、疲勞和壓力.
上述事故展示了軍事行動的難度,并展示了 OODA(觀察、定向、決策和評估)循環中的挑戰(Jones 等人,2020 年)。人為錯誤、人的認知限制和海軍作戰固有的決策復雜性導致了 OODA 循環中的挑戰,更具體地說,是殺傷鏈過程中的挑戰。
現代戰斗空間由來自常規陸地、空中和海洋等多個領域以及來自太空和網絡空間的大量數據組成。決策者需要考慮許多因素,包括交戰規則 (ROE)、要使用的武器、傳感器和意圖評估。發現、修復、跟蹤、瞄準、參與、評估 (F2T2EA) 殺傷鏈模型緩解了該過程的一些困難(參謀長聯席會議,2013 年)。人工智能 (AI) 和機器學習 (ML) 可以通過分析備選方案和使用評估標準將 AI 方法映射到殺傷鏈功能,從而幫助海軍在戰術領域做出殺傷鏈決策。這是在本報告的五個章節中分三個階段完成的。
本報告利用了數百個資源,主要利用了美海軍研究生院 AI-OODA 團隊在其 Capstone 報告(2020 年)中進行的先前研究,“利用人工智能 (AI) 進行空中和導彈防御 (AMD):以結果為導向的決策援助。”他們將他們的工作與 John Boyd 的觀察、定向、決定和行動決策框架相結合。作為他們分析的初步步驟,AI-OODA 團隊將特定的 OODA 功能明確且緊密地耦合到特定的 F2T2EA 功能。然而,本報告斷言 OODA 循環是一個決策循環,它嵌套在殺傷鏈的每個功能中,而不是在高壓力或低壓力情況下專門映射到一個或多個殺傷鏈功能。團隊基于 F2T2EA 模型開發了一組 28 個殺傷鏈功能。
在制定將 AI 方法映射到殺傷鏈的評估標準時,很難確定一個好的決策,這對于決策評估至關重要。在評估決策時,必須考慮選擇行動時的知識意識狀態以及解釋能力。使用了幾種對決策進行評分的方法,從定義和優先考慮感興趣的“武器-目標”到制定評分標準和報告評估結果,以供其他人審查。
目前,人工智能的狀態非常廣泛,必須對其進行解釋,以了解人工智能對殺傷鏈中功能的適用性。本報告討論了所選 AI 方法的高級概述,并突出顯示了部分最流行的方法。首先,沒有普遍接受的定義,這很難定義人工智能。其次,人工智能與機器學習 (ML) 存在差異。 ML 允許在準確性和可預測性方面取得增量收益; AI 接收數據并通過算法提供輸出。人工智能的歷史從 1940 年代艾倫·圖靈 (Alan Turing) 的加密機器到 1980 年代美國政府在戰略計算計劃中的使用,再到今天在聯合人工智能中心 (JAIC) 中的人工智能戰略五個支柱,從領先的人工智能人力到安全和倫理。美國國防高級研究計劃局 (DARPA) 在 3-wave 框架中描述了 AI 的發展方向,分為手工知識 (Wave 1)、統計學習 (Wave 2) 和上下文推理 (Wave 3) 在 1-4 個維度內情報參數的屬性(Launchbury 2017)。這些屬性包括感知、推理、抽象和學習。
人工智能涉及可以根據輸入值預測結果的監督學習。有幾種使用監督學習進行學習的技術。包括線性回歸和分類。此外,許多數值方法可以分析發生的學習有效性,例如 F-score 和 Accuracy score。人工智能還可以使用無監督學習,它使用算法來發現未標記數據集中的數據模式或分組。在分析未知(y)響應以揭示標記(x)數據中的模式時,無監督學習是有益的。數據分析界的一個著名例子是鳶尾花(Iris flower)數據集。僅使用標記的數據,可以看到響應聚集在一起,并且可以確定響應中存在模式(花的種類)。無監督學習的方法包括聚類和 K-means,但還有其他方法。強化學習有一個代理能夠接收來自環境的反饋并理解基本目標。此外,正如 Sutton 和 Barto 在(2018 年)中解釋的那樣,探索和開發之間存在權衡。最后,生成對抗網絡 (GAN) 利用無監督學習和強化學習,通常用于神經網絡 (NN)。神經網絡是機器學習算法的極好來源,它有大量的輸入,而這些輸入又會產生大量的計算。 NN 非常適合用于模擬、自然語言處理、博弈論和計算機視覺。 NN 只是一種將輸入映射到輸出的簡單方法,可以在此過程中進行學習。然而,NN 可以被描述為一種“黑盒”學習技術,因為很難解釋正在發生的事情,并且通常需要一種可解釋的 AI (XAI) 技術。 XAI 的三個主要組成部分是可解釋模型、解釋界面和解釋心理學(Gunning 2019)。數據安全必須與“大數據”一起考慮,“大數據”是指非結構化、復雜和大型數據集,具有五個 v 特征:數量、速度(數據量隨時間變化的增加)、多樣性、真實性和價值。其他理論包括決策理論、模糊邏輯和效用函數
使用上述文獻綜述,該團隊開發了一個框架,用于將 AI/ML 映射到 AMD(空中導彈防御)殺傷鏈。采取了四個步驟:1) 建立模型框架,2) 確定決策點,3) 應用 AI/ML 方法,以及 4) 分析結果。該團隊確定了以下用于殺傷鏈映射分析的 AI/ML 方法:線性回歸、邏輯回歸、聚類、關聯、隨機森林、神經網絡、GAN 和樸素貝葉斯。評估標準被稱為“決策點”并提出四個問題:(1)所需輸出的類型是什么,(2)所需的學習類型是什么,(3)可解釋性(XAI)是什么水平需要,以及 (4) 需要多少個預測變量?該團隊通過基于一組決策點和評分過程評估每個殺傷鏈功能的每種方法來執行映射。對于被認為非常適合某項任務的方法,得分為+1,如果該方法適合但次優,則為0,如果該方法不適合該任務,則為–1。
該團隊進行了映射分析,根據與殺傷鏈的 28 個功能中的每一個功能相關的評估標準(決策點)分析 AI 方法。該團隊使用評分方法來確定每個殺傷鏈功能的最佳整體 AI/ML 分數。團隊的映射顯示為 0。
該團隊的 AI/ML 映射到殺傷鏈功能為國防部和海軍提供了兩個關鍵好處。首先,映射本身是設計和開發支持殺傷鏈決策的人工智能戰術決策輔助工具的重要起點和基礎。其次,該團隊將 AI 方法映射到殺傷鏈的分析過程可用于了解 AI 在許多其他軍事和非軍事領域的應用。識別適當的人工智能方法、制定評估標準和評分過程以及制定過程功能以進行分析映射的過程對于支持許多不同人工智能系統的工程具有深遠的潛力。
表1:AI/ML方法到殺傷鏈的映射
幾十年來,政治科學家和國家層面的軍方政策制定者一直在戰略層面使用博弈論,但對其在作戰層面的使用幾乎沒有評論。傳統上,三個主要挑戰阻礙了規劃人員和分析人員在作戰層面使用博弈論,即復雜的作戰環境、參與者的動態交互以及大多數陸軍參謀人員不具備使用復雜數學技能。
這本專著表明,這些挑戰是可以克服的,博弈論可以在規劃過程中提供新穎的見解。美陸軍參謀部規劃人員可以在作戰層面有效地使用基本博弈論和簡單的數學來了解作戰環境、了解行動者及其動機,并在軍事決策過程中比較行動方案。本專著展示了如何避免高級博弈論用于解決理論問題的繁瑣數學程序,而是專注于使用基本博弈論在規劃過程中提供價值。它通過回顧博弈論在戰略層面的應用、教授基本博弈論和涵蓋一些基本博弈概念來展示博弈論的實用性。然后,它考察了一場歷史性的行動,以展示博弈論的使用將如何達到另一個推薦行動方案和結果,也許會改變歷史進程。最后,它通過將博弈論應用于軍事決策過程、任務分析和行動制定過程的兩個步驟的練習,提供了使用博弈論的指南。
幾十年來,戰略規劃者和政策制定者在戰略層面有效地應用了博弈論,但軍事從業者往往不在作戰層面使用它。當約翰·馮·諾依曼和奧斯卡·摩根斯坦在 1940 年代初在蘭德公司工作期間發展博弈論時,他們尋求一種數學方法來為沖突領域,特別是經濟沖突提供解決方案。他們于 1944 年發表了開創性的著作《博弈論與經濟行為》
博弈論允許通過將場景建模為簡化的博弈來分析決策。博弈論試圖定義參與者、策略——或可供他們選擇的選項——以及博弈結果的預期回報。它試圖澄清由于參與者的選擇而導致的不確定性。它的主要用途是它認識到結果是通過多個參與者的互動共同決定的,而不僅僅是一個人自己決定的結果,它允許分析對手可能會做什么。由于這些原因,政策制定者和戰略家使用博弈論來理解戰略問題,例如核對手、貿易慣例、內戰解決和裁軍以及缺乏國際合作,從而制定政策建議以幫助解決這些問題
作戰層面的規劃者是否可以有效地應用博弈論仍然是一個懸而未決的問題。在作戰層面使用博弈論的批評者強調了動態交互的復雜性。他們指出,培訓軍官了解博弈論的基本概念并將操作層面問題的復雜性提煉成基本博弈需要大量時間。
本專著認為博弈論提供了一個有價值的框架,最適用于在軍事決策過程的任務分析和行動發展步驟過程中理解環境中的參與者。博弈論旨在提供對情況的理解。這需要了解參與者及其潛在計劃或戰略動機。博弈論提供了一種理性的方法來研究行動者如何制定他們的策略和他們的動機基礎。由此,指揮官和參謀人員可以獲得理解,然后疊加其他因素,包括行動方案和潛在結果。它提供了一種合理而直接的方法來簡化復雜的問題。因此,博弈論為作戰規劃者提供了另一種工具,可用于了解作戰環境。
本專著重點介紹博弈論在戰略層面的歷史應用、當前的規劃過程學說和相關框架,以回答作戰規劃者能否在作戰層面有效地使用博弈論。這本專著主要通過囚徒困境分析博弈論在戰略層面的應用,將其應用于冷戰、國際貿易和價格戰期間的降價。 1777 年的新澤西戰役為應用博弈論和理解喬治華盛頓將軍和查爾斯康沃利斯將軍之間的競爭環境提供了一個歷史例子。最后,它演示了如何以及在何處將博弈論工具實施到美國陸軍當前使用的規劃過程中。所使用的博弈論是一種基本的應用方法,而不是過于復雜和無用的高級學術博弈論。簡單的博弈可以使復雜的操作情況變得清晰。該研究回顧了陸軍規劃學說,以專注于了解作戰環境和問題。任務分析旨在了解環境中的參與者以及他們之間沖突的根源。這 3 項研究的重點是深入了解對抗性和中立的參與者、激勵措施、潛在的行動方案和回報。該專著追溯了博弈論的戰略應用和作戰應用之間的差異,以了解哪些要素是一致的,同時說明了差異。最后,它將討論如何克服實施中的潛在挑戰。
規劃人員可以在軍事決策過程中使用博弈論工具,特別是在任務分析期間,以不同的視角理解作戰環境和行動發展過程,以檢查未發現的假設。博弈論工具不是替代軍事決策過程中現有的步驟和工具,而是對其進行補充。戰地手冊 6-0 解釋說,指揮官和參謀人員使用任務分析來更好地了解作戰環境和部隊面臨的問題。接下來,規劃人員使用任務分析來制定假設以填補知識空白。最后,考慮到博弈論理解競爭的本質,任務分析也有助于理解友軍和敵軍如何互動。行動方案制定過程提供了一種客觀的方式來看待多個潛在計劃。在上面的歷史例子中,華盛頓將軍和康沃利斯將軍需要了解他們的潛在行動以及他們認為 30 名敵方指揮官可能會做什么。在某種程度上,歷史例子中的將軍們可以在他們的行動發展過程中使用博弈論來檢查他們的假設。開發從敘述性或定性評估開始,然后轉向帶有每個計劃的加權分數的可量化評估。博弈論允許另一種觀點來評估潛在的計劃。以下思想實驗提供了一個示例,說明工作人員如何在任務規劃期間使用一些博弈論工具。
演習如下:美國討論在一個靠近對手的友好國家增加軍事存在,這旨在阻止對手入侵友好國家。軍團工作人員了解國家決策者關于在一個地區增加軍事存在的辯論。此外,他們知道如果國家領導層追求升級,軍團是升級的一個因素。工作人員致力于了解作戰環境并了解國家層面的優先事項和激勵措施,以便他們可以就選項提出更高的建議并為預期的行動方案做好準備。其次,他們努力了解敵人的動機和行動計劃。敵人還面臨著增加其在該地區的軍事存在或維持現狀的前景。兩國都擁有核武器,都不想進行全面戰爭。最后,兩個大國都可以遷移的地區的人口不希望被外國勢力占領。國家決策者面臨的戰略決策具有操作層面的影響。
如上所述,任務分析提供了對情況和問題的理解。在任務分析過程中,工作人員開始對行動者的動機和動機有所了解。戰場情報準備是任務分析的關鍵步驟。參謀人員對友軍和敵軍如何在環境中相互作用做出假設。由此,工作人員開發了每個參與者在即將到來的操作中可以使用的潛在選項。此外,情報準備步驟確定了指揮官和參謀人員的知識差距。這些差距導致了獲取信息的情報需求的發展。正如文獻回顧中所述,人們根據他們擁有的信息做出決策,并預測競爭對手的行為。這些步驟不會取代或否定軍事決策過程的任何步驟,它們只是關于如何以及在何處實施博弈論工具的建議。
鑒于這種情況,參謀人員開始制定敵人的行動方案。當應用于博弈矩陣時,這些行動方案成為敵人的策略。敵人可以用他們的一個師或軍將該地區軍事化,也可以選擇不軍事化。是否軍事化的選擇為敵人創造了兩種不同的戰略。第二步著眼于每個策略的結果。如果雙方都軍事化,那么他們將面臨戰爭。如果雙方都沒有軍事化,那么他們就維持現狀。如果一個國家軍事化而另一個國家不軍事化,那么軍事化的國家就會在沒有爭議的環境中這樣做。表11顯示了這種情況的結果。
表11:定性結果
第三步要求參謀人員查看敵人的動機,然后對他們的選擇進行定性分析。敵人想在美國不決定將該地區軍事化的情況下將該地區軍事化。這為他們創造了一個無可爭議的環境。其次,他們既不看重自己也不看重美國將該地區軍事化,這是現狀。第三個可取的結果是美國軍事化,而敵人沒有,這意味著美國擁有無可爭議的軍事化。最后,如果美國也進行軍事化,敵人不想升級為戰爭,也不想將該地區軍事化。工作人員現在可以根據偏好對敵人的行動路線進行排序。作戰和情報人員可以利用收集資產并制定收集計劃,以確定有關敵人計劃的任何指標,例如在該地區集結部隊。信息收集計劃有助于回答信息需求并協助進行有效規劃。
工作人員現在進入行動開發過程。生成選項步驟概述了指揮官和參謀人員可用的選項。工作人員制定了可以切實擊敗敵人行動方案的選項,然后確定它們的優先級。工作人員還產生了兩個廣泛的選項。他們可以軍事化,也可以不軍事化。由于每個參與者的策略,工作人員現在可以對他們的行動方案進行排序。指揮官和參謀更愿意維持現狀。如果美國采取行動將該地區軍事化,它可能會擾亂地方、國家政府和民眾。因此,美國對該地區的軍事化和一個不軍事化的敵人是次要的選擇。這種選擇意味著美國擁有無可爭議的軍事化,但正如所述,當地政府感到不安。第三,排名是美國不軍事化,但敵人軍事化,給了他們無可爭議的優勢。最后,美國不希望發生戰爭,如果美國和敵人都進行軍事化,就會發生戰爭。
接下來,工作人員將博弈發展為矩陣或戰略形式。首先,他們進行定性分析,說明每次交戰的可能結果,見表 12。然后參謀人員從每個指揮官的角度對結果進行排序,以生成定量分析和回報,如表 13 所示。該表顯示了回報敵方第一,美國第二。使用倒序排列,最低數字的收益表示排后的選項,數字越大,表示首選的選項。每個戰斗人員都是近鄰,因此參謀人員認為交戰將有利于主動一方。
表12 :定性分析
表13:定量結果
這兩種的價值在于員工進行分析以掌握對潛在未來結果的理解。它提供了一個簡潔的可交付產品,參謀計劃人員可以在一張紙上將其交給指揮官或參謀長,以供將來參考或思考,因為指揮官和參謀人員開始在軍事決策過程的未來步驟中權衡選項。這種分析為員工提供了一個思考他們正在做什么以及他們的計劃可能產生什么結果。這是舍恩所說的實踐中反思的一個例子。正如他所說,它允許人們在執行任務時思考他們正在做什么,然后塑造他們所做的事情。
下一步要求參謀人員將可用選項縮小到只有指揮官可用的可信選項。參謀部尋找指揮官永遠不會使用任何主導策略。敵方指揮官沒有任何主導策略,并且兩種策略都可供他使用。但美國永遠不會在博弈中選擇軍事化,因為無論敵人選擇什么,不軍事化都會主導博弈。表 14 以粗體突出顯示哪個選項在美國占主導地位。例如,如果敵人決定軍事化,如果它決定軍事化,美國將獲得 1 的回報,否則將獲得 2 的回報。因此,在這種情況下,美國會選擇不進行軍事化。同樣,如果敵人不軍事化,那么如果它軍事化,美國將獲得三倍的回報,如果它不軍事化,美國將獲得四倍的回報,美國將再次選擇不進行軍事化。因此,工作人員將其排除在外。
表14:以粗體突出顯示的美國的收益
既然參謀人員了解美國沒有軍事化的動機,它就可以看看敵人可能會采取什么行動作為回應。敵人知道美國不想軍事化,并尋求使其結果最大化。因此,敵人選擇軍事化,因為這比不軍事化帶來更好的回報。這達到了納什均衡,即敵人軍事化并獲得四分之二的回報,而美國不軍事化并獲得三分之二的回報。表 15 顯示了圈出的所得納什均衡。
表15:軍事化為主
但現實生活中的情況并不總是一致的。一方通常首先采取行動,迫使另一方做出決定。在上述情況下,美國正在努力應對將該地區軍事化的決定。然后他們的決定迫使敵人做出決定。下一步著眼于在順序移動游戲中情況如何展開,以及納什均衡在決策分析中是否發生變化。順序博弈見表 16。該表首先顯示了敵人的收益,其次是美國的收益。
表16:順序多次博弈
參與者對每個結果的選擇和回報保持不變。唯一的區別是美國先行動,敵人必須做出反應。工作人員必須使用子博弈分析來分析這個博弈及其結果。敵人有第二步,因此分析從他們的預期步驟開始。這兩個參與者都知道,如果美國選擇軍事化,敵人將選擇不軍事化,因為兩個人的回報比一個人要好。如果美國選擇不軍事化,敵人會想要軍事化,因為四比三好。鑒于美國的選擇,上面的表 16 通過圈出每個敵人的首選選擇來表明這種行為。既然美國知道敵人會根據美國的選擇做出哪些選擇,他們就會在兩者之間做出選擇。美國選擇軍事化,知道敵人不會軍事化,從而為美國帶來三倍的回報。美國軍事化總比不軍事化并獲得兩個回報要好,因為知道敵人會選擇軍事化。因此,納什均衡變成了美國軍事化和敵人不軍事化,敵方兩分,美國三分,見表 17。
表17:納什均衡
序列博弈導致的納什均衡與同步博弈不同,為什么?每場比賽都會導致一方軍事化,而另一方不軍事化。在同步博弈中,敵人通過軍事化獲得了最有利的回報,美國知道這一點,因此選擇不軍事化。然而,在順序博弈中,美國先決勝負。如果他們不軍事化,他們將獲得最高的回報,而敵人也選擇不軍事化。兩國都不會軍事化,因為如果美國不軍事化,敵人就有動機進行軍事化。美國意識到這一點,因此認為他們的下一個最佳選擇是軍事化,因為它知道敵人不會軍事化,因為這會迫使兩個參與者之間發生戰爭。這個游戲提供了一個先發優勢的例子。如果敵人先選擇,他們也會有軍事化的動機
序列多次博弈反映了更現實的情況。但是運行這兩種類型的博弈為工作人員了解動機和潛在行動提供了分析價值。工作人員可以看到排序操作如何改變結果。如上所述,使用這種方法的價值在于分析。工作人員可以按照矩陣形式對每個結果進行簡要說明。然后他們可以看到他們的選擇之一不是一個可行的選擇。然后,他們查看了定量評估并確定可以使用平衡結果。所進行的定性分析重申了 Thomas Schelling 的觀點,即博弈論的數學并不總能解決沖突,不應過度依賴數學。而是對問題的思考增加了價值。
博弈論提供了一種分析工具來看待競爭情況。它使分析師能夠了解潛在的行動計劃、激勵措施以及回報或結果。此外,它可以突出信息差距和需要進一步理解的領域。在 20 世紀中葉,戰略層面的規劃者用它來更好地了解美國和蘇聯之間在使用核武器和原子戰方面的競爭。國防部以外的分析師使用它來了解競爭公司之間的貿易爭端和降價。
在作戰層面,博弈論允許對潛在計劃、激勵和結果進行相同類型的分析和理解。這本專著審視了博弈論的歷史并探索了基本的博弈論,確立了博弈論在分析沖突情況方面的有用性。文獻回顧揭示了博弈論的優勢和劣勢,這為如何最好地利用它以最大限度地發揮其潛力提供了信息。檢查諸如核局勢和國際貿易等戰略層面的決策為以前的努力如何有效地應用博弈論提供了背景。博弈論在特倫頓和普林斯頓的美國獨立戰爭中的應用與指揮官們所追求的不同,展示了使用博弈論如何提供獨特的見解,這對于像康沃利斯這樣經驗豐富的將軍來說并不明顯。最后,該專著展示了軍團級別的參謀人員如何使用博弈論來理解戰略級別的決策如何影響作戰級別的行動,比較了同步博弈和序列博弈的實用性。最后一部分提供了一個基本框架,工作人員可以通過將博弈論應用于任務分析和行動開發過程來解決操作問題。
博弈論的使用不僅限于軍事決策過程。博弈論非常適合國防部和美國陸軍目前使用的現有規劃流程。規劃人員可以在聯合作戰設計過程和陸軍設計方法中使用博弈論工具。具體來說,在聯合設計期間,博弈論工具最適合理解戰略指導和理解作戰環境。在軍隊設計期間,它最適合構建作戰環境和理解問題。博弈論是參謀人員或計劃團隊的工具包中的另一個有用工具。當通過軍事決策過程或設計過程應用時,博弈論分析與其他工具很好地結合在一起,可以更好地了解作戰環境。
本報告提供了對機器學習 (ML) 技術的基本理解,并回顧了它們在國防和安全領域的應用。其目標是開發ML的內部專業知識,以支持與加拿大皇家海軍(RCN)海上信息戰(MIW)概念和愿景相一致的能力發展。本文進行了文獻回顧以收集有關在軍事和民用場景中實施和使用的 ML算法信息。結果表明,海軍必須適應和接受新技術,以便在所有 RCN的數據驅動決策中有效利用所有信息。這可以包括使用自動化、大數據分析、云計算、人工智能 (AI) 和 ML。這樣做可以減少與繁瑣任務相關的操作工作量,進而最大限度地減少人為錯誤和超負荷。這項研究表明,ML有可能提供新的或增強的能力,以支持 MIW 的概念,以及滿足使用現有和未來信息源的 RCN 的需求。這意味著開發利用這些技術的必要技能將使加拿大武裝部隊(CAF)受益。憑借這些專業知識和這些技術的適當應用,軍方將有能力在必須進行快速數據驅動決策的情況下更有效地利用其信息源。
本報告旨在就如何將人工智能和機器學習技術應用于支持加拿大皇家海軍與海上信息戰相關概念和目標,而建立基本的理解和專業知識。對這些技術及其在國防和安全領域的應用進行了回顧。
在過去的十年中,加拿大國防部 (DND) 和加拿大皇家海軍 (RCN) 引入了新的概念和方法,以幫助提升其服務水平。其中許多概念引入了新技術,旨在增強信息空間在作戰級(即作戰職能)和事業級(即管理職能)方面的防御能力。在作戰層面,這些舉措得到了一系列文件的支持,這些文件強調了信息戰的重要性及其在 RCN 內的實施和執行。
2015年,海上信息戰(MIW)的概念被引入[1]。本概念文件概述了在信息環境中運作對 RCN 及其內部可能產生的影響。這一概念的引入清楚地強調了能夠利用該領域中可用信息源的重要性。它討論了信息的影響,基于其廣泛的可用性以及 RCN 的依賴性和使用該信息支持作戰的能力。
采用新的概念和技術進行能力開發并非沒有挑戰。這需要更有效的處理技術來處理在 MIW 的功能區域內收集的大量和各種數據。此外,概念文件還討論了 MIW 與物理、虛擬和認知領域的關系,表明在戰爭中使用所有領域的信息作為 RCN 的寶貴資源的重要性。
2016 年,RCN 發布了一份信息戰戰略文件,重點關注為國家和國際部署開發 MIW 能力 [2]。該戰略文件討論的主題包括有效收集、利用和傳播信息的重要性。該戰略還認識到并傳達了信息戰是RCN可以同時采取防御和進攻行動的地方。
2017年,加拿大國防政策發布[3]。盡管它沒有直接處理信息領域,但它承認信息對 RCN 的重要性,這在 2019 年和 2020 年分別發布的 DND 數據戰略 [4] 和 RCN 數字海軍 [5] 報告中得到了回應。數字海軍支持國防政策創新目標,其中包括適應和接受新技術的能力,而數據戰略涵蓋了如何利用技術在RCN 社區中做出數據驅動的決策。這可以包括使用自動化、大數據分析、云計算、人工智能 (AI) 和機器學習 (ML)。在操作上,期望通過這些技術對更繁瑣任務的自動化實施來減少海軍團隊的日常工作量,進而最大限度地減少人為錯誤和疲勞,提高整體作戰效率。
這些文件中包含的首要主題強調了 RCN 采用新的數字能力成為一個信息組織的重要性,其中信息在戰爭環境中被使用,但也被用作工具。使用和利用信息來支持 RCN 的現代工具、技術和專業知識是能力發展的關鍵。在此之后,我們顯然需要一個強大的、知情的、由信息科學、人工智能和機器學習專家組成的科學團體。
這項工作背后的動機是在 MIW 領域內建立科學專業知識,以支持 RCN 的目標。為實現這一目標,以下報告將回顧可在防御和安全領域中使用的 AI 和 ML 技術。除了這篇綜述之外,本文還將介紹這些與 RCN運作相關的技術的應用,例如艦艇監視、目標檢測以及使用生成建模來支持運作。
這項工作的總體目標是為如何將 AI 和 ML 技術應用于 RCN 挑戰提供科學基礎和理解。建立這些新興技術的專業知識不僅是支持當前運作目標的必要條件,也是對開發和塑造未來能力的投入。這種向算法決策制定的轉變與 MIW 的概念非常吻合,因為它認識到信息在戰爭中的使用至關重要。還提出并討論了 ML 未來的工作和研究主題。
2、3、4章節簡要回顧了在計算機科學和數據分析中使用的機器學習技術。這些技術同樣適用于海上防御和安全領域中經常發現的問題。本節概述這些技術及其在這個領域的應用,特別是海上探測和監視有關的任務。此外,還將討論生成對抗ML方法的應用。需要注意的是,這些部分并不是對這個領域中已經完成的研究的全面回顧。相反,本文的目的是概述如何使用這些技術改進和開發與RCN相關的新功能。
艦艇行為分析是與海上監視和安全相關的關鍵組成部分。這種分析的結果依賴于捕獲和利用艦艇活動數據的能力。用于海上監視的數據源包括:自動識別系統 (AIS) 數據、天基 AIS、雷達數據等。這種監視形式允許分析師進行船只航跡重建、路徑預測、異常艦艇交通監視,這些在海上領域非常重要,有助于發現恐怖主義、海盜、毒品和武器走私、非法移民和非法捕魚等非法活動。
各種各樣的機器學習算法和技術可以應用于海事問題并提供有價值的見解。為了支持預測模型的開發,可以使用的技術包括:
? 聚類:無監督聚類方法已用于為海事和艦艇監視提供洞察力。這些聚類算法已應用于 AIS 數據。具體來說,已經報道了基于這些方法對艦艇運動實時預測的可靠性和準確性的研究[25]。還使用應用于基于空間的 AIS21 的 K-means 聚類算法來研究艦艇避撞,以評估航行穩定性和檢測異常行為[26]。研究人員還探索了使用聚類和 AIS 數據流來支持搜索和救援行動[27]。
? 決策樹:使用模糊粗略決策樹算法,研究探索了執行艦艇類型行為學習的能力[28]。對艦艇活動進行可靠和有效的表征可以提高海域態勢感知。這是通過使用包含運動學、靜態和環境信息等軌跡特征的概括向量來實現的,其中軌跡是通過融合 AIS、合成孔徑雷達 (SAR) 和天氣報告來創建的。
? 隨機森林:研究已使用隨機森林算法開發用于艦艇監視和跟蹤的各種目的的模型。由于多種原因,基于 AIS 的艦艇運動往往會丟失數據。例如,這些失誤可能是由于惡劣天氣造成的。為了檢測這些記錄,這些技術已被用于自動識別船只軌跡中缺失的位置記錄[29]。隨機森林也被用于創建預測船只目的地的模型。在艦艇離開特定港口后使用歷史 AIS 數據確定目的地點的能力也已被研究 [30]。這也通過比較當前和歷史軌跡數據進行了研究,以便根據相似性度量來預測最終位置[31]。
? 關聯挖掘:創建關聯規則的模型通常用于購物籃分析場景。然而,當應用于 AIS 數據源時,這種算法為艦艇運動分析提供了有用的見解。使用關聯挖掘進行的研究提供了有助于發現艦艇運動模式的洞察力。此類運動包括:軌跡預測,估計艦艇接下來最有可能訪問的港口[32],并在收到新消息時預測艦艇的位置,并計算有和沒有艦艇位置插值的關聯概率[33]。
? 支持向量機:支持向量機執行回歸和分類任務。支持向量回歸用于研究異常艦艇行為的檢測。當前檢測異常行為的方法是利用艦艇運動的突然變化。然而,與海上事故相關的導航數據可以模擬正常情況。為了解決這個問題,使用 SVR 航道模型及其路線提取方法,開發了一個模型來檢測異常艦艇行為 [34]。該研究的目的是定義“通過將導航數據分配給位置基礎來確定異常行為的可接受的最大值和最小值”[34]。除了SVR研究之外,科學家們還研究了SVM在檢測和分類異常艦艇行為方面的應用。通過從原始AIS數據中提取海上運動模式,對異常艦艇行為的識別和分類提供了新的信息[35]。
? 人工神經網絡:人工神經網絡 (ANN) 已被用于幫助預測北極的船只速度,因為該地理區域氣候變化帶來的交通量增加[36]。 AIS 數據的使用允許模型根據位置、時間、艦艇用途、大小和冰級來預測艦艇的速度。在[37]中,作者使用神經網絡作為一個基于云的web應用程序來預測未來的艦艇行為。它能夠將預測的短期和長期行為疊加到交互式地圖上。除了預測艦艇航線,人工神經網絡也被用于調查異常檢測事件。具體來說,該研究著眼于AIS轉發器中觀察到的有意和非有意的切換,因為這種活動可以用來隱藏可疑或非法活動[38]。
?卷積神經網絡:AIS、雷達、高精度攝像機和電子海圖等信息源為理解海上態勢感知提供了有用的信息。利用這些來源,CNN可以提取艦艇運動模式。在[39]中,作者通過將原始AIS數據轉換成保存艦艇運動模式信息的圖像數據結構,利用歷史AIS重建艦艇軌跡。然而,使用AIS系統的艦艇軌跡重建技術存在原始數據含有噪聲、記錄缺失和其他錯誤。許多研究在進行彎曲軌跡或高損失率的艦艇重建時面臨困難。為了克服這些障礙,[40]的作者使用了一種健壯的CNN架構,稱為“U-net”。這種架構能夠處理不同采樣率的軌跡、丟失的數據記錄和其他噪聲相關問題的軌跡。
? 循環神經網絡:艦艇監測通常依賴于存在許多問題的 AIS 數據。AIS源可以表示大量數據,除了具有不規則的時間戳和丟失的記錄外,這些數據有時可能會非常臟亂。已經進行了研究以幫助解決這些問題。研究 [41] 使用多任務深度學習框架,將 RNN 與潛在變量建模相結合,以幫助在執行軌跡重建、異常檢測和艦艇識別等任務時處理這些問題。 [29]中的作者利用隨機森林來識別丟失的記錄,并使用 LSTM 架構來重建缺少 AIS 記錄的船只軌跡。結合統計分析、數據挖掘和神經網絡方法監測內河艦艇數據[42]。具體來說,LSTM 用于艦艇軌跡修復、發動機轉速建模和燃料消耗預測。在另一項研究 [43]中,由于與設備故障、傳輸延遲和信號丟失有關的問題,需要在分析之前對 AIS 數據進行預處理。作者通過將 LSTM 與變量建模相結合來執行軌跡重建,同時考慮異常軌跡數據和艦艇航行狀態。這一努力將有助于減少艦艇碰撞的風險,并支持其他研究途徑,如艦艇類型分析、風險評估、軌跡預測和航線規劃。
監視海域中的艦艇行為對于檢測可能表明存在非法活動的異常情況至關重要。收發器用于報告 AIS 數據流,其中包含有關船只及其軌跡的信息。由于從 AIS 數據流收集的信息是自我報告的,因此可能會出現問題。有意或無意地修改此數據或打開/關閉轉發器會導致間歇性消息,這些消息可能不準確或具有誤導性。這種策略可用于掩飾海上的非法行為和活動。
在某一天,有大量船只在海上作業,人類操作員無法監控和檢測這些事件。因此,可以使用 AIS 數據流以及其他來源來訓練 ML 模型,從而為人類操作員提供自動化支持和洞察力。根據行為特征確定船只類型的能力是 ML 提供的眾多能力之一。探索艦艇類型分類的兩項研究是[28]和[44]。
在[28]中,作者開發了一個模糊粗略的決策樹模型,以根據運動學、靜態和環境信息確定艦艇類型。用于模型開發的訓練數據包含來自加拿大東海岸和美國東北部的 AIS 消息。[44]中給出的結果使用具有來自兩個不同地理區域的軌跡信息的 GANN 執行艦艇分類。第一個是歐洲數據集,其中包括來自凱爾特海、海峽和比斯開灣的海上交通。另一個是東南亞數據集,根據在新加坡附近的海峽和港口以及南中國海開放水域的海上交通中船只的預期運動模式,該數據集被分為三組。
在[44]中,作者使用以下性能指標來評估他們的模型:召回率、精度和 F1分數[45]。作者在他們的報告中使用召回指標作為他們的模型準確性。召回率表示正確識別的實際相似性部分,其中準確度是正確預測的數量與預測總數的比率。假設作者使用召回作為準確率,當將其與[28]中報告的性能進行比較時,此分析將把[44]中的召回指標視為模型準確度。兩項研究都將他們的結果與一系列其他 ML 技術進行了比較,以幫助評估性能。然而,與[44]不同的是,[28]報告了具有不確定性的準確性,從而賦予了性能結果意義,并使模糊粗略決策樹模型與其他標準技術相比更容易理解。除此之外,比較這兩篇論文的結果(沒有不確定性測量)表明,大多數機器學習模型的表現都一樣好。例如,k-最近鄰、樸素貝葉斯、隨機森林和支持向量機在[28]中的性能準確度在[44]中使用的四個數據集中的兩個數據集中的相似鄰域內。具體而言,新加坡港口和海峽周圍海上交通的準確率報告在 47% 到 64% 之間,而[28]中報告的準確率為 45% 到 69%。
[28] 中使用的多層感知器取得的結果表明,它以81.5%的整體準確度優于其他模型,略高于模糊粗略決策樹結果 (80.7%)。[44]中報告的四個不同數據集的準確率在41%到56%之間,非常差。在 [28] 中,對各種參數進行了特征選擇過程,并根據分配的加權值選擇了19個特征中的 10 個。特征及其相關權重為:ship_length (1.0)、avg_speed (0.183)、max_speed (0.183)、speed_st_dev (0.183)、course_st_dev (0.100)、heading_st_dev (0.097)、duration (0.082)、end_point lat (0.055)、start_point_lat (0.052) 和 max_lat (0.051)。[44]中使用軌跡特征來執行分類,利用 AIS 消息中包含的時間戳、經度、緯度、對地航向和對地速度。
這些研究之間選擇用于訓練的特征之間的主要區別之一是[28]中權重和影響最大的特征是ship_length,這不是[44]中使用的特征。模型的成功很大程度上取決于所用數據的質量和數量,但在很大程度上取決于特征選擇。在多層感知器模型的情況下,[44]中使用的軌跡信息特征可能不足以生成準確的艦艇類型預測。這表明了解艦艇的長度是進行此類分類的關鍵指標。在比較[28]中選擇的特征時,ship_length 被分配的權重大約是任何其他特征的五倍。這將使模型在進行分類時更加依賴此特定信息。除了特征選擇和可調超參數外,使用的訓練數據也對模型的成功有影響。數據的特征,如記錄數量、代表性內容以避免過度/不足以及數據完整性,都在成功訓練模型以提供高度性能方面發揮作用。
另一個有趣的觀察結果是,[44]中使用的GANN 報告了其分析中使用的數據集從低 80% 到高 96% 的一系列準確度,平均準確度為 87%。這些結果優于 [28]中使用模糊粗略決策樹報告的80.7% 準確度。關于為什么GANN 的表現似乎更好,有一些可能的解釋。GANN模型基于LSTM-RNN,它允許將時間依賴性構建到模型中。包括這個額外的時間維度可以提供預測洞察力,從而實現更高程度的預測準確性。此外,GANN 模型使用對抗性組件進行訓練,該對抗性組件可能迫使網絡實現更大程度的學習以執行其所需任務。
目標檢測對于防御和安全的海上環境中的監視和態勢感知都至關重要。然而,這是一項艱巨的任務,因為尺寸、方向和目標配置的變化加上環境背景噪聲和使用的各種傳感器的性能差異很大。所有這些事情只會增加這個問題的整體復雜性。傳統的檢測算法缺乏簡單性和可靠的輸出。深度學習領域的最新研究和進展表明,CNN 可以執行與檢測相關的任務,同時提供高速性能和準確性。開發這些能力正在推動促進防御和安全的技術。
目前使用 CNN 顯示出前景的能力包括:使用SAR圖像進行艦艇識別和分類以監測海洋區域[46][47]、使用探地雷達[48]進行魚類檢測、海冰SAR圖像分類以監測極地地區的變化并檢測可能威脅海上交通的流冰[49],并檢測從SAR [50][51] 和遠程傳感器[52]獲得的圖像中的船只。雖然這不是一個詳盡的應用程序列表,但它確實突出了一些與信息戰領域相關的當前 ML 應用程序。特別是,現在將討論 CNN 的兩個有趣的應用。
? 水下聲納圖像的目標識別和分類:研究[53]的研究重點是深度學習特征提取在水下聲納圖像目標識別和分類中的應用。該方法通過 CNN 使用聲納圖像提取目標特征。然后使用 SVM 進行分類。在現代海上作業期間執行自動目標識別和分類可以幫助當局檢測潛在威脅。自主系統,例如基于調查和戰術信息收集圖像的無人水下航行器,是可以利用這種技術的系統。機器學習的這種應用減少了對具有分類目標專業知識的操作員的需求。因此,隨著效率、速度和成本的提高,這個過程有可能變得更加自動化。該領域的一個活躍研究課題包括使用 ML 更好地檢測聲納數據中的類似地雷的物體[54][55]。
? 使用有限數據進行軍事目標識別和分類:CNN等深度學習算法是用于處理圖像和視頻的強大工具,可支持防御和安全功能。目標識別和分類能力對于監視和態勢感知至關重要。然而,所開發模型的成功取決于能否獲得反映被建模數據的關鍵屬性和特征的良好數據集。許多軍事場景中的訓練數據集的大小可能很少。[56]中的作者使用遷移學習和混合神經網絡層的組合來解決這個問題,以開發可以嵌入的先驗知識,以實現對高精度識別任務的特征提取的改進。這樣的發展自然會進入并改進分類過程。
自動目標識別在海上作業中發揮著重要作用。無人水下航行器使用聲學傳感器產生聲納圖像,幫助檢測水下目標和威脅,例如水雷。由于噪聲、低對比度和低分辨率,使用聲納圖像進行目標檢測很困難。ML和DL都提供了可以幫助提取特征和重要信息以進行對象檢測和分類的功能。
探討這個問題的兩篇研究論文包括Zhu等人[53]和Bouzerdoum等人[57]的工作。在[53]中,作者使用稱為AlexNet的預訓練NN來執行特征提取,然后使用SVM將檢測到的對象分為兩類:目標和非目標。然后將性能與以下兩種技術進行比較:局部二進制模式和定向梯度直方圖。在[57]中,作者遵循與[53]類似的方法,其中使用預訓練的網絡進行特征提取,并使用 SVM 對檢測到的對象進行分類。然而,在[57]中,對象被分為三個不同的類別:類水雷對象、非類水雷對象和誤報對象。該研究還開發了一個用于分類目的的小型 CNN,并使用了一個名為 ObjectNet23 的預先開發的 CNN 來執行相同的任務。所有這三種方法都在它們的整體性能方面進行了比較。
兩項研究都測試了用于特征提取的預訓練 CNN 和用于分類的 SVM 的應用。結果表明,[53]和[57]的性能準確率分別為 95.9% 和 76.2%。鑒于這些方法相似,人們不會期望這些結果會有大約 20% 的差異。兩個系統都使用預訓練的網絡進行特征提取。有趣的是,[57]考慮了不同的 CNN 架構,包括 VGG16 和 VGG19。這些網絡是基于 AlexNet 網絡的架構構建的,但經過改進。
奇怪的是,[57]中使用VGG的方法不會勝過[53]中使用 AlexNet 的技術。這樣的結果可以用許多因素來解釋。作者沒有指定用于訓練VGG網絡的數據集。用于訓練的數據質量和數量可能會影響模型的性能,從而使 AlexNet 能夠更好地提取特征。該問題也可能存在于SVM執行的分類中。用于訓練這些系統的數據可以極大地影響預測結果,因為在該領域很難獲得大量標記數據。兩項研究都進行了數據處理并使用增強技術來增加數據集的大小,這不如擁有更多“真實”數據點有效。此外,應注意分類類別的差異。[53]和[57]中檢測到的對象分別分為兩類和三類。擁有額外的類并嘗試檢測特定對象會更加復雜,并且可能會降低這些模型的整體性能準確性。
盡管這些研究使用了類似的方法來實現預訓練的 CNN 和 SVM 來執行目標檢測,但[57]也為此任務開發了一個小型 CNN。小型 CNN 的性能優于預訓練的 CNN + SVM 模型,準確率達到 98.3%。與大型 CNN 不同,較小尺寸的 CNN 需要訓練的參數顯著減少,從而在數據樣本有限時減少過度擬合的機會。這可能是小型 CNN 和預訓練 CNN 之間顯著性能差異的原因+ SVM 模型。
艦艇檢測在軍用和民用環境中發揮著重要作用,各種類型的成像傳感器用于檢測、跟蹤和分類艦艇。因此,DNN 的引入改變了軍隊執行任務的方式。生成網絡提供了生成代表歷史數據記錄的數據或樣本的能力。此功能提供了新的數據樣本,可用于在軍事場景中訓練智能系統,在這些場景中,由于可用性、安全分類和成本,數據通常難以收集。但是,其他國家也可以使用相同的過程來創建對抗性數據,這些數據有可能危及易受此類攻擊的國家系統。因此,GANN 的實現既可以用于進攻性場景,也可以用于防御性場景。這些網絡可用于訓練預測、分類和產生可靠輸出的智能系統,以發展未來的軍事能力。 GANN 還提供了執行對抗性攻擊以欺騙對手系統的能力。
GANN與國防和安全領域相關的應用包括:
? 對抗性偽裝:偽裝在軍隊中被用作一種策略,以阻止對手在視覺上檢測和分類軍事物體的能力。此類任務傳統上由人類觀察者執行。然而,戰斗空間在不斷發展,自主軍事代理和人工智能在此類任務中的使用也在增加。這一變化促使科學家們研究偽裝是否能有效對抗這些聰明的對手,或者是否有可能設計出能夠迷惑這些人工智能對手的偽裝。2019 年,對這個問題進行了調查,其中NN被訓練來區分和適當分類軍用和民用船只 [58]。這項研究的結果表明,如果 GANN 生成的模式覆蓋在軍艦的某些部分上,則針對此類圖像分類訓練的 NN 可能會混淆這些模式。這種技術被稱為對抗偽裝。進一步的研究 [59]研究了如何使用這種方法來欺騙選擇的幾個NN分類器。通過這樣做,他們能夠將分類的整體準確性降低到被認為不可靠的程度。在研究 [60]中,研究了迷彩圖案的穩健性和通用性。這些模式在研究中被稱為補丁,并且發現通過在補丁生成器的訓練中實施降級過濾器,作者表明他們能夠提高這些補丁的整體魯棒性或有效性。
? 特定發射器識別:[62]中報告了使用GANN開發的半監督特定發射器識別 (SEI)應用程序。此應用程序是針對與基于接收到的波形對發射器進行 SEI 分類相關的問題而開發的。這些波形容易受到可能導致單個發射器表示不準確的因素的影響。SEI在包括無線電和無線網絡安全在內的各種軍事應用中都很重要。
? 時空數據:2020 年,報告了與時空數據一起使用的 GANN 架構以及衡量此類模型性能的常用評估方法 [63]。這些架構已被用于執行軌跡預測和時間序列。盡管在該領域正在進行重要的研究,但執行時空數據預測的能力對研究人員來說是一個持續的挑戰。特別是對于時空應用是一個新領域的GANN。[63]中討論的最近工作強調了與數據生成相關的問題,這些問題會影響研究人員理解數據特征的能力。
對抗性偽裝用于防止軍事資產被發現和分類。傳統上,偽裝是通過使用大網或油漆來幫助隱藏人類觀察者的飛機或船只等資產來實現的。然而,隨著使用智能系統執行傳統上由人類執行的分類任務,戰場空間發生了變化。Adhikari等人[64] 和Aurdal 等人[58]進行的兩項研究,如何使用對抗偽裝來欺騙或誤導這些智能系統執行的自動對象檢測。在[64]中,基于補丁的對抗性攻擊被用來掩飾軍事資產不受無人駕駛空中監視的影響。該研究使用神經網絡創建覆蓋在軍事資產上的各種補丁,以防止自動檢測目標物體。對于這些研究,感興趣的目標對象主要是飛機。[58]中進行的工作訓練了一個可以檢測和分類軍用和民用船只的 NN。對第二個網絡進行了訓練,以生成用于防止對軍艦進行檢測和分類的補丁。
這些研究使用對抗性補丁來防止智能系統檢測或錯誤分類資產。兩項研究都表明,對抗性偽裝既可行又有效,但在現實世界中并不可行。貼片的設計可能相當復雜,因此很難將其復制到飛機或船只的外部。與[58]不同,[64]確實試圖通過將現實世界的適用性構建到損失函數中來解決這個問題。然而,這種方法是否充分并不明顯。
在比較這些作者所采取的方法時,[64] 中防止檢測的目標似乎更可行,部分原因是避免了與國際人道主義法相關的問題。相比之下,作者在 [58] 中的意圖是使用對抗性偽裝來實現將軍用船只錯誤分類為民用,顯然會陷入法律戰爭問題。然而,[64] 中采用的方法對于 [58] 中的船只可能更復雜,因為它們沒有與部署在陸地上的軍事資產相同的多樣化環境。這表明在考慮對抗性偽裝的應用時,能夠避免檢測是兩種方法中更好的方法。
此外,[58] 中使用的數據集由世界各地用戶上傳的圖像組成,這些圖像主要由艦艇輪廓組成。該數據集不太可能包含每艘船的足夠的方面數據。此外,[64] 專注于航拍圖像,而 [58] 則沒有。在海上的任何軍事場景中,用于檢測船只的數據集很可能包含空中數據。擁有完整的數據集將允許模型為這些艦艇的不同方向生成補丁,而不僅僅是輪廓補丁。為實際使用實施對抗性偽裝不僅需要此類數據,還需要適當的技術來實施。
最后,[64] 的訓練數據顯著減少,它使用稱為 YOLO26 的標準預訓練網絡進行目標檢測。該網絡是對語義對象進行分類的通用模型,并未經過專門訓練以檢測空中目標。然而,在[58]中建立并訓練了一個鑒別器網絡來專門檢測和分類艦艇。使用這種專門的鑒別器網絡的目的是提高創建補丁的網絡的整體性能。如果[64]的作者使用專門的鑒別器網絡而不是他們的預訓練網絡,他們將獲得什么性能提升,這將是一件有趣的事情。
技術進步已經并將繼續改變與現代戰爭相關的所有戰場空間。隨著機器學習、人工智能和自主代理的引入,軍方必須學會調整這些不斷發展的技術并將其整合到他們的系統中。DND和RCN都已主動引入和使用此類技術,目的是提高整體防御和安全性。本節將總結本文的內容,并討論作為文獻回顧的結果將進行的未來工作。
本報告探討了深度學習和機器學習技術,這些技術可用于開發流程以支持 RCN 實現其既定目標所需的自動化和高效率。例如,回歸是一種進行未來預測的簡單方法,無監督聚類方法通過檢查和分組具有相似特征的數據點來推斷新信息,決策樹和隨機森林允許分析師評估選項并根據準確度估計進行分類,關聯挖掘創建可以檢測行為和模式的規則集,支持向量機允許分析師根據多種核函數選擇在高維空間中進行有效的預測和分類。此外,神經網絡很重要,因為它們可用于開發支持自動化的工具。例如,感知和深度神經網絡提供了人類不容易執行的分析能力;卷積神經網絡可以輕松處理具有網格狀拓撲結構的數據,例如音頻信號、圖像和視頻;遞歸神經網絡可以處理序列數據并處理長期依賴關系;生成建模技術可以執行密度估計和樣本生成,以支持一般的訓練模型或支持防御和進攻行動。
這些學習算法和技術的應用為分析師提供了洞察力并簡化了繁重的任務。在國防和安全的背景下,它們在能力開發周期中的應用顯示出巨大的前景。具體而言,本報告重點介紹了三種此類應用,包括艦艇監視、目標檢測以及對防御和進攻行動的支持。相當多的機器學習重點是艦艇監控,特別是航跡重建、防撞、航跡預測、目的地預測等。該研究領域已經研究并報告了許多機器學習算法的應用。目標檢測對于海上環境中的監視和態勢感知都至關重要。用于物體檢測的卷積神經網絡已被用于對船只進行分類、發現水雷、檢測海冰、使用水下聲納圖像進行分類、檢測具有有限數據的軍事物體等。生成對抗神經網絡可用作支持密集操作的工具和防守。此外,在國防和安全領域,它們已用于樣本生成、生成對抗偽裝、用于支持特定發射器識別,并用于時空數據應用,包括軌跡預測和時間序列插補的事件生成。
這些技術在國防和安全領域的適當應用可以為軍方提供情報,這些情報可以在必須進行快速數據驅動決策的情況下加以利用。本文提供了對 ML 技術應用背后的基礎知識的基本理解,以幫助構建使用符合 RCN 既定目標的新技術支持和構建能力所需的內部專業知識。對發展這種專業知識的任何投資都將有助于塑造應對現代戰場所帶來的挑戰所需的未來能力。這些空間在本質上變得越來越技術化,因此,DND 和 RCN 必須學習如何適應和改變,以便在這些環境中發揮作用。對于 RCN,利用技術援助利用數據和信息對于海上信息戰概念的成功至關重要。
第 5 節中的討論涉及與 MIW 相關的防御和安全領域的各種 ML 應用。當前研究的一個共同主題是對艦艇監視的內在興趣。雖然 AIS 數據流是用于高度研究主題的重要信息來源,包括軌跡重建、路徑預測和船只異常行為識別,但文獻缺乏檢測與數據流本身相關的潛在異常。
在研究艦艇監視領域的異常檢測時,文獻傾向于將“異常”稱為可用于掩蓋非法海上活動的 AIS 應答器的有意和非有意開關。然而,研究這個數據流的特征和這個信息源中可能存在的異常是很重要的。檢測和解釋數據流中的異常有助于建立用戶對使用此信息訓練的 ML 模型的信任。模型提供準確和穩健的預測或分類的能力源于使用可靠和值得信賴的數據。因此,有必要將研究工作集中在 AIS 轉發器數據流上。
AIS數據流為各種船舶提供了大量的數據,這些船舶被法律要求在海上發送AIS信息。但是,船舶并不是操作可以產生AIS信息的AIS技術的必要條件。因此,用戶如何相信他們收到的數據是可靠、準確的,并且來自實際船只?這方面的一個例子是虛擬艦艇的存在。在這種情況下,這些船只正在將 AIS 消息傳輸到數據流中,即使它們實際上并不存在。這種類型的惡意注入可以用來迷惑和影響情報人員和決策者。這些虛擬船只的存在是海事運營中心注意到的數據流中的異常現象。因此,它們需要被識別和解釋,以支持決策過程。
在異常行為的背景下,研究虛擬艦艇的檢測是本研究中同樣重要的課題。這些研究將探索第 3 節和第 4 節中討論的機器學習技術的應用。檢測和確定識別虛擬艦艇的關鍵 AIS 信號特征的能力是這項工作的基礎。此外,從 AIS 數據流中刪除惡意注入的能力將大大有助于使信息更加可靠、準確和值得信賴。
美國軍方和情報界對開發和部署人工智能 (AI) 系統以支持情報分析表現出興趣,這既是利用新技術的機會,也是應對不斷激增的數據過剩的解決方案。然而,在國家安全背景下部署人工智能系統需要能夠衡量這些系統在其任務背景下的表現。
為了解決這個問題,作者首先介紹了人工智能系統在支持智能方面可以發揮的作用的分類法——即自動分析、收集支持、評估支持和信息優先級——并提供了對人工智能影響驅動因素的定性分析。每個類別的系統性能。
然后,作者挑選出信息優先系統,這些系統將情報分析師的注意力引導到有用的信息上,并允許他們忽略對他們無用的信息,以進行定量分析。作者開發了一個簡單的數學模型來捕捉此類系統的錯誤后果,表明它們的功效不僅取決于系統的屬性,還取決于系統的使用方式。通過這個練習,作者展示了人工智能系統的計算影響和用于預測它的指標如何用于描述系統的性能,以幫助決策者了解其對情報任務的實際價值。
報告指出,目前存在多種描述人工智能系統性能的標準方法,包括通常被稱為“精確度”、“召回率”和“準確率”等指標,但這些標準并未提及該系統對其所支持任務的影響。在準確率與情報任務成功之間沒有明確關聯的情況下,只能依據情報任務的完成水平對系統有效性作出臨時判斷。基于此,報告作者將人工智能系統在情報分析過程中可發揮的功能分為四大類,分別評估每項功能的錯誤輸出可能會對結果產生的影響,從而理解“人工智能系統性如何影響情報分析的有效性”。
按照情報周期的組織過程,報告將人工智能系統可在該過程中發揮的作用分為四大“系統功能模塊”,分別是提供評估支持、自動分析、優先信息和收集支持。報告為每個功能模塊設計了函數模型,以詳細推演其在情報過程中的作用。
通過對“從任務到系統”的追溯性推演評估,報告得出兩個一般性結論:首先,在部署人工智能系統前,制定與符合實際情況優先級的情報監測指標十分重要,這一工作應以評估系統部署的實際影響力為指導;其次,系統的有效性不僅取決于系統屬性,還取決于如何使用。
在決定是否減輕或接受網絡攻擊對武器系統的風險時,最重要的考慮因素是它如何影響作戰任務——也稱為任務影響。然而,對整個空軍的每個系統和所有任務進行全面評估是不切實際的,因為每個系統都很復雜,有大量潛在的漏洞需要檢查,每個漏洞都有自己復雜的威脅環境。
進入網絡任務線程分析框架。為了分析任務影響,作者提出了這種旨在同時實現幾個目標的新方法:足夠全面,可以在美國空軍的每個任務的規模上執行,但信息量足以指導決定接受或接受減輕特定風險。此外,該方法非常簡單,可以在不超過幾個月的時間內執行,并且可以根據需要進行更新。
該框架遵循自上而下的方法,從捕獲所有關鍵任務元素的整個任務的“線程”(映射)開始,然后是支持其執行的系統。雖然作者并未將網絡安全風險評估問題簡化為交鑰匙解決方案,但他們提出了有用的方法來分類與任務成功最相關的領域,同時將對漏洞和威脅的詳細調查限制在最關鍵的領域。他們的框架旨在大規模完成,適用于各種場景,并明確其工作方式。
00 報告研究的問題
01 主要發現
1.1 在合理的資源支出下分析大規模的任務影響是一個主要的挑戰
1.2 隨著新系統的引入、舊系統的修改以及戰術、技術和程序的發展,執行任務的方式發生了變化
1.3 網絡空間的特點之一是冗余無效
1.4 失去指揮和控制可能會在沒有任何系統或組件故障的情況下損害任務
1.5 當決策者不了解分析的工作原理時,他們通常會恢復直覺和判斷
02 建議
要大規模執行任務影響評估并節省工作量,請使用系統工程熟悉的方法和可用于分類的任務關鍵性標準組合。
定義任務時,不要包含任何系統。在分析的后期介紹特定系統的作用。
將隨著時間推移相對穩定的工作與需要在系統生命周期中更新的分析分開。
盡可能使用現有的和經過驗證的技術以保持透明,以便決策者了解分析的工作原理及其局限性,并信任它來指導決策。
應用網絡分離的概念來解決冗余問題。
在任務和系統級別合并功能流程圖,以解決對手指揮和控制分析問題。
為了全面驗證和驗證網絡任務線程分析框架,空軍應該在各種不同的任務中應用和測試它。
03 報告目錄
第一章
評估武器系統網絡安全風險的一些注意事項
第二章
評估任務影響的原型框架
第三章
框架的討論