軍事分析人員可利用公開數據庫深入了解相關國際事件的發展。然而,這些數據庫依賴于以英語為基礎、經過整理的資料來源。這可能會導致偏差,不利于分析質量,尤其是在關注英語不是主要語言的地區和行動者時更是如此。
本研究旨在利用全球事件、語言和語調數據庫(GDELT)數據集來預測影響烏克蘭戰爭的重要因素,并將使用提取的數據和機器學習技術來開發預測模型。該項目旨在實現兩個目標。首先,提供一種從大數據集合中自動提取和預處理相關事件數據的方法。其次,將不同的機器學習模型應用于提取的數據,以預測重要因素,從而識別持續沖突中的事件趨勢。
所展示的數據采購可自由擴展到不同地區、行為體或其組合。在應用程序接口(API)中配置所需的參數后,相關的 GDELT 事件將自動提取。
由于本論文的重點在于預測,因此建模技術的應用側重于時間序列和遞歸神經網絡(RNN)模型。在測試過的時間序列預測模型中,自回歸綜合移動平均(ARIMA)模型與其他候選模型和天真模型相比,顯示出良好的預測性能。應用時間序列模型預測一至三個月的中期趨勢取得了最佳結果。
為了補充時間序列模型并利用 GDELT 的短期更新間隔,我們建立了不同類型的 RNN,并測試了它們在事件數量短期預測方面的性能。簡單 RNN 與長短期記憶 (LSTM) RNN 進行了比較,結果發現,簡單 RNN 的性能不如 LSTM RNN 模型。由此得出的結論是,數據中確實存在影響模型預測能力的長期和短期效應。
除了最初的跨語言 GDELT 數據庫,RNN 模型還運行了僅基于英語來源的 GDELT 數據提取,以及來自武裝沖突地點和事件數據項目(ACLED)數據庫的數據提取。
總體而言,在幾乎所有測試的模型中,使用基于英語來源的數據集都能獲得更好的均方根誤差值。不過,這并不一定意味著模型在捕捉現實生活中的變化方面表現更好。一項補充性探索數據分析(EDA)得出結論,在以英語為基礎的報告中,一系列事件的代表性不足。這一點在烏克蘭戰爭前奏期間尤為明顯,因為西方公眾對該地區的興趣和英語報道的一致性有時會降溫。事件報道不足導致數據的可變性較低,一致性較高,從而提高了基于英語模式的績效指標。
關于 RNN 模型在 ACLED 數據庫中的性能,除了 "爆炸/遠程暴力 "和 "戰斗 "這兩種事件類型外,本研究選擇的模型無法應用于 ACLED 數據提取。造成兼容性低的原因是報告事件的數量較少,以及報告中的空白與所選模型的相關性不高。
不同數據源之間的性能比較表明,要持續產生可靠的結果,挑選合適的預測因子和對結果進行初步分析并不容易實現自動化。強烈建議每次從 GDELT 首次提取新型數據子集時都進行一次 EDA。
圖 3.1. GDELT 事件數據庫中一個數據元素的示意圖。矩形代表中心數據元素,即事件。圓圈代表屬性,屬性 "GlobalEventID "用作唯一標識符。提及和音調 "屬性是灰色的,因為它不屬于本工作的范圍。
軍事決策過程(MDMP)包括分析地形以確保任務成功的關鍵任務。然而,傳統的地形分析方法,如二維(2D)模擬地圖、PowerPoint 演示文稿和任務式指揮系統,資源密集、耗時長,而且會使決策者無所適從。因此,本研究側重于使用移動頭戴式增強現實(AR)顯示技術進行三維(3D)地形可視化,以應對這些挑戰。AR 技術可讓用戶觀察到疊加在物理環境上的虛擬物體,從而增強身臨其境的體驗。該工具允許用戶查看和操作三維地形,添加軍事資源的表示,檢查由此產生的配置,并參與 MDMP。可用性研究評估了界面的有效性、效率和用戶滿意度,重點是三維可視化任務、衍生地形信息提取以及在有爭議的潮濕空隙穿越場景中的部隊部署。結果表明,AR 地形可視化原型為決策者提供了更全面、更準確的信息,使任務規劃和執行取得了成功。這項研究凸顯了三維地形可視化和 AR 技術在改進 MDMP、讓決策者更好地了解環境并做出更明智決策方面的潛力。
本研究側重于利用增強現實(AR)技術來支持軍事決策過程(MDMP),這是任務規劃的一個重要方面。該工具可使用戶與描述地形的本地三維(3D)數據集進行交互,并允許使用一套 3D工具。因此,該工具具有增強決策過程和提高 MDMP 會議效率的潛力。
傳統上,美國陸軍在規劃任務時依賴于二維(2D)圖形信息。然而,獲取更詳細的地形信息需要大量的時間和資源,例如創建額外的二維圖形表示法。相比之下,如果地形已被捕獲并表示為三維數據集,工作人員就能獲得所有必要信息,從而參與 MDMP 并做出更明智的決策。
論文研究包括設計和開發一種增強現實(AR)可視化工具,該工具可與三維虛擬地形一起操作,并支持 MDMP,尤其強調濕間隙穿越(WGC)的任務規劃。本論文旨在通過提供虛擬地形的精確數據、允許使用三維工具和更好地做出決策,改善 MDMP 期間的人員協作。此外,這項研究還有助于理解在 MDMP 中促進小團隊合作所需的技術前提條件。
技術進步往往會超越其采用和融入現有系統和流程的速度,這是一種常見現象。例如,在軍事任務中使用 AR 和虛擬現實(VR)技術進行信息共享,可以顯著改善復雜多變行動的規劃和執行。然而,將這些技術納入現有的任務式指揮系統和程序可能具有挑戰性且耗時較長,這主要是由于軍事行動對安全性和可靠性的要求。此外,用戶可能會抵制引入他們不熟悉的新解決方案和技術。因此,盡管信息共享技術進展迅速,但其融入軍事部門的速度卻慢得多。因此,復雜多變的軍事行動仍在使用過時的協議進行規劃和執行,任務式指揮系統長期以來也只是略有改進。
美國陸軍在 MDMP 期間使用各種方法提取信息和分析地形。主要是陸軍的每個作戰職能部門使用二維地圖提取地形信息;參謀部門通過情報地形科請求獲得更詳細的信息。然后,參謀部門將從二維地圖上收集的信息和情報科提供的信息制作成 PowerPoint 演示文稿。指揮官利用這套演示文稿做出最終決定。然而,由于二維地圖的固有局限性及其表現形式(在 PowerPoint 幻燈片中展示靜態二維地圖),參謀部無法始終從地形中提取衍生信息,從而做出明智的決策。如果能以本地三維數據格式顯示地形,并使用一系列合適的三維工具,工作人員就能從地形中提取衍生信息,加強協作,并更好地理解共同行動圖(COP)。
增強現實技術在軍事領域并不新鮮,但在 MDMP 期間尚未得到廣泛應用。通過在 MDMP 期間使用 AR 可視化工具,工作人員可以獲得以前無法用于工作和協作的系統功能。通過 AR 顯示三維虛擬地形并與之互動,每個 WWF 都可以使用簡單的手勢在地形周圍導航,操作這些數據集,操縱和放大縮小地形,并提取決策所需的衍生信息。因此,WWF 可以通過對地形具體情況的透徹了解來證實他們的決策,并更好地闡明他們向指揮官推薦特定行動方案的原因。此外,因誤解二維數據集而可能產生的錯誤也會減少,甚至消除。
關注 WGC 是部署 AR 技術和使用 3D 數據表示的沃土,這是有充分理由的。對于美國陸軍人員來說,WGC 是最具挑戰性的聯合武器任務之一;由于需要投入大量資源和人力資本,這類任務的規劃非常復雜(美國陸軍聯合武器中心,2019 年)。美國陸軍中的六個 WFF 必須緊密配合,以確保 WGC 的安全進行。在 MDMP 開始時,美國陸軍的每個 WFF 都要聽取情報部門關于地形分析的簡報;這一階段稱為戰場情報準備(IPB)。IPB 代表了對部隊行動區(AO)內地形的高層次審視,并提供了有關地形預期的歷史數據(陸軍部總部,2019 年);他們的大部分決策都是基于二維地圖做出的。進行 IPB 后,WFF 根據情報科提供的信息制定行動方案 (COA)。然而,依賴二維地圖有許多固有的局限性。例如,無法從任何給定點查看地形(數據集沒有三維記錄),因此缺少富有成效的 MDMP 所需的豐富地形信息。因此,使用卓越的數據表示,最大限度地減少出錯的可能性,并投入時間有效地研究替代方案和決策,有可能為此類復雜的軍事行動帶來急需的改進和戰略優勢。
本論文探討以下研究問題:
1.有可能為聯合武器 MDMP 提供最有效支持的技術框架是什么?
2.AR 支持的 MDMP 工具能否通過提供有關地形分析的衍生信息來增強作戰職能部門對地形的理解?
3.AR 支持的 MDMP 工具能否有效協助資源管理?
4.AR 支持的 MDMP 工具能否有效協助軍事參謀人員在聯合作戰場景中開展協作?
本論文僅限于開發一種 AR 可視化工具和虛擬環境,以支持 "濕間隙穿越 "和提取 MDMP 期間每個 WWF 所需的地形衍生信息。此外,同一工具還可實現軍事參謀部門之間的人員協作和信息交流。
用于解決所有研究問題的方法包括以下步驟:
1.文獻綜述:進行文獻綜述,提供論文中使用的基本構造的背景信息。
2.任務分析:對當前開展 MDMP 的實踐進行分析,以跨越濕間隙。這包括但不限于詳細分析行動方案制定過程中不同作戰功能之間的報告和互動、當前地形可視化實踐以及團隊協作。
3.設計 AR 可視化工具: 為工具和用戶界面設計支持系統架構。此外,選擇一套支持用戶任務所需的三維對象和地形。
4.可用性研究:開展可用性研究,重點關注支持 AR 的 MDMP 工具的功能和性能。
5.數據分析:分析在可用性研究中收集的綜合數據集。
6.得出結論并提出未來工作建議。
第一章:導言。本章介紹研究空間的最關鍵要素:領域、問題、研究問題、范圍以及用于解決所有研究問題的方法。
第二章:背景和文獻綜述。本章討論美國陸軍如何開展 ADM 和 MDMP 以規劃軍事行動。本章還討論了 VR 和 AR 過去和當前的使用情況,以及在 MDMP 過程中軍事人員合作時 AR 的潛在用途。
第三章:任務分析: 當前 MDMP 實踐。本章分析了當前陸軍參謀人員在 MDMP 期間分析地形時使用的方法和工具,以及如何向指揮官推薦 COA。此外,本章還討論了向指揮官提供 2D 信息時存在的知識差距。
第四章:原型系統設計與實施。本章討論了 AR 可視化工具、系統架構、用戶界面和模擬環境的設計與開發。文中還描述了 WGC 場景和為可用性研究所需的虛擬環境而構建的 3D 模型。
第五章: 可用性研究。本章討論了使用 AR 可視化工具進行可用性研究的方法,包括制定完整的機構審查委員會文件。此外,文中還討論了虛擬環境、技術要求以及在可用性研究中收集的客觀和主觀數據集。最后,本章分析了可用性研究的結果。
第六章:結論和未來工作。本章概述了研究的要點,并對今后的工作提出了建議。
發射無線電波的電子設備激增導致射頻 (RF) 頻譜擁塞。這對美國防部(DOD)的環境構成了重大威脅,尤其是嚴重依賴衛星系統的海軍通信,因為衛星系統很容易受到電磁干擾。缺乏足夠的干擾識別和鑒定能力進一步加劇了海軍部隊面臨的作戰風險。本論文研究利用機器學習(ML)技術檢測射頻傳輸中的干擾。憑借先進的數據分析和模式識別能力,ML 算法可增強干擾檢測和緩解能力。研究人員評估了基本自動編碼器和長短期記憶(LSTM)自動編碼器這兩種架構識別數據集中異常射頻數據的能力。研究方法包括在基本傳輸路徑中生成具有不同加性白高斯噪聲(AWGN)水平的射頻數據。使用正常射頻數據訓練 ML 模型,并評估其檢測和分類有干擾和無干擾信號的能力。結果表明,基本自動編碼器和 LSTM 自動編碼器模型都能有效識別干擾。LSTM 自編碼器的成功率約為 99%,這表明它們有望成為解決干擾識別能力差距的解決方案。
這項研究的目的是定義對手作戰方案支持數據模型,以及它與自動白方(TAWC)的關系,后者是一種理論上的先進規劃輔助結構。新提出的作戰概念依賴于較小規模的集中式兵力,需要處理的信息可能更多。這種模式迫使兵力領導者依靠更直觀的決策和/或使用技術來支持傳統上由人類完成的分析功能。要使新技術為規劃做出重要而可靠的貢獻,軟件開發人員必須考慮到條令流程,如 "作戰空間情報準備"(IPB)。軍事出版物中蘊含著無數年的經驗,而將減少不確定性的條令模型映射到領先技術的文獻卻很少。本論文探討了流程如何導致發現,從而減少戰斗空間中的意外情況。
本論文的目標是為已知封閉道路網絡中的戰術車輛提供目的地預測。這些戰術車輛以輪式野戰炮兵部隊為模型。美海軍研究生院(NPS)的建模虛擬環境與仿真(MOVES)研究所在一個虛構的場景中建模并生成數據。該場景包括典型野戰炮兵部隊在部署環境中會遇到的各種地點和事件。軍事組織由兩個營組成一個團,每個營有四個炮兵連,每個炮兵連有 11 輛車。每個炮兵連有四輛發射車、四輛裝填車、兩輛支援車和一輛指揮控制(C2)車。生成的數據在團、營、炮兵連和車輛一級進行記錄。本研究以炮兵連的移動模式為中心。每個場景都被分解成較小的行程,其中只有一個先前地點和未來目的地。模型擬合中的預測變量描述了每個炮兵連的各種位置屬性。響應變量是每次行程的目的地位置。
本論文主要研究兩個問題。
1.機器學習模型能否準確預測戰術車輛的未來目的地?
2.在戰術應用中,什么是足夠的預測準確度?
本論文只能使用 MOVES 研究所生成的數據。因此,存在一些限制。第一個限制是數據缺乏測量或傳感器誤差。在實際作戰環境中收集完美的數據是不現實的。第二個限制是,生成數據的大小足以適合我們的模型。在新的作戰場景中,數據可能稀少或不可用。
為了預測這些戰術部隊的未來目的地,我們使用了兩種機器學習的監督技術:隨機森林和神經網絡。為了客觀地比較這兩種模型,我們得出了兩個標準來判斷目的地預測的成功與否。每個模型都為行程中每分鐘間隔內的每個地點擬合了一個概率。第一個標準是一半以上的正確地點分配概率超過 80%。第二個標準是,在行程的最后三分鐘內,模型分配給正確目的地的概率是否超過 80%。一個模型必須同時滿足這兩個標準才算成功。在驗證集的所有行程中,隨機森林的成功率為 38.9%,而神經網絡的成功率為 43.2%。我們使用這兩個標準考慮了真實世界的場景。每個行程被縮減到只有最初的五分鐘。在真實情況下,決策者必須在敵人完成行動之前決定行動。在這種情況下,決策者在做出決定前有五分鐘的時間窗口。隨機森林的預測準確率為 19.1%,而神經網絡的預測準確率為 33.9%。這是時間受限情況下預測準確率的上限。隨著誤差和噪聲的引入,預測準確率可能會降低。
本論文通過使用完美數據設定了目的地預測的上限。基于我們的論文,未來的研究領域如下:進一步研究預測建模、處理在不規則時間間隔內收集的帶有測量誤差的數據、使用真實世界數據建模以及多域建模。第一個領域是通過進一步的預測建模來提高預測精度。第二個領域是引入與現實生活中數據收集和匯總困難相似的誤差項。戰場傳感器并不完美,存在局限性。第三個方面是利用實戰部署和訓練中的真實數據建模。最后一個領域是將我們的研究推廣到其他作戰領域:海上、海面下和空中。運動輪廓和運動行為在這些領域中都同樣重要。戰術層面的模型可以為戰略層面的決策提供參考。
人工智能是下一個競爭領域;第一個開發出人類水平人工智能的國家將產生類似于原子彈開發的影響。為了維護美國及其人民的安全,美國國防部資助了人工智能及其應用的發展研究。本研究使用強化學習和深度強化學習方法作為當前和未來AI智能體,并評估開發中的潛在問題。在兩個游戲和一次遠足中對智能體的表現進行了比較: 分別是貨物裝載、河內塔和背包問題。據觀察,深度強化學習智能體能處理更廣泛的問題,但表現不如專門的強化學習算法。
制定量化不確定性元數據的軍事標準是解決利用人工智能/機器學習(AI/ML)軍事優勢所固有的問題。通過提供元數據,美國防部可以繼續確定使用人工智能/機器學習的最佳策略,與能力發展同步進行。這種協調將防止在解決與在作戰系統中實施AI/ML有關的困難技術問題時出現延誤。不確定性量化可以使觀察、定向、決定和行動循環的實際數字實施成為可能,解決在戰爭中使用AI/ML的道德問題,并優化研究和開發的投資。
從基礎上講,美國軍隊不需要人工智能/機器學習(AI/ML)。然而,軍隊需要能夠比對手更快、更好地觀察、定位、決定和行動(OODA),以實現軍事優勢。機器有能力以比人類更快的速度進行觀察、定位、決定和行動,從而實現這一優勢。然而,關于允許AI或ML模型 "決定 "最佳軍事行動方案是否合適的問題仍然沒有定論,因為該決定可能導致破壞和死亡。
利用AI/ML的軍事優勢的潛在隱患已經被不厭其煩地提出來。有三個問題仍然是最令人擔憂的:(1)解決賦予AI摧毀事物和人的權力的道德和倫理考慮;(2)平衡發展AI/ML能力的成本和軍事效用;以及(3)確保對機器的適當信任水平,以最佳地利用對能力發展的AI/ML部分的投資。然而,作為元數據納入軍事信息的不確定性量化(UQ)可以解決這三個隱患,同時遵守美國防部的人工智能倫理原則。
美國防部的人工智能戰略將AI/ML技術的成熟作為優先事項并加以激勵。其結果是,試圖快速實施能力的活動紛至沓來,而對能力增長的可持續性或AI/ML使用的高階影響規劃卻少之又少。正如一位國防研究人員所指出的,"當技術變革更多的是由傲慢和意識形態驅動,而不是由科學理解驅動時,傳統上調節這些力量的機構,如民主監督和法治,可能會在追求下一個虛假的黎明時被削弱。"
美國國防高級研究計劃局認為,目前的AI/ML系統 "缺乏必要的數學框架 "來提供使用保證,這阻礙了它們 "廣泛部署和采用關鍵的防御情況或能力。"保證需要信心,而信心需要最小的不確定性。使用AI/ML的系統的這種保證可以幫助解決道德方面的考慮,提供對開發成本與效用的洞察力,并允許其在戰爭中的使用責任由最低層的指揮官和操作員承擔。
通過在AI/ML系統中實施不確定性量化的軍事標準,美國防部可以確保對這些系統非常需要的信任。此外,如果美國防部將不確定性量化作為對開發者的要求,有可行的方法來應用現有的數學方法來確定和傳播不確定性。然而,當軍方將這一標準應用于信息時,它必須牢記不確定性量化的高階效應和挑戰。
為了解決上述三個陷阱,任何軍事數字系統內部和都應該要求進行不確定性量化。不確定性量化是為系統中的不完美或未知信息分配一些數字的過程,它將允許機器實時表達它的不確定性,為建立對其使用的信任增加關鍵的透明度。美國防部應實施一項軍事標準,規定對數字系統中的每個數據或信息的元數據進行不確定性的量化標記。一旦可用,這些元數據可以通過功能關系傳播到更高層次的信息使用,為AI或ML模型提供所需的信息,以始終表達它對其輸出的信心如何。
理解作為元數據的UQ需要理解計量學的基礎概念--與測量不確定度有關的權重和計量科學。也就是說,一個測量有兩個組成部分: 1)一個數值,它是對被測量量的最佳估計,以及2)一個與該估計值相關的不確定性的測量。
值得注意的是,2008年國際標準化組織(ISO)的《測量不確定性表達指南》定義了測量不確定性和測量誤差之間的區別。這些術語不是同義的:"通常在被測物[被測量的量]的報告值后面的±(加或減)符號和這個符號后面的數字量,表示與特定被測物有關的不確定性,而不是誤差。誤差是指測量值與實際值或真實值之間的差異。不確定度是許多誤差的影響"。
在軍事術語中,"測量"是在OODA循環中收集和使用的任何信息。每條信息都是由某種傳感器測量的,并且會有一些不確定性與之相關。作為元數據的不確定性量化將至少采取兩種形式:根據經驗產生的測量不確定性(基于上文概述的計量標準)和統計學上假設的不確定性(通過一些手段確定,其中有很多)。
操作員在使用具有UQ功能的系統時,可以使用系統報告的不確定性來告知他們的戰術決策。指揮官可以利用這種系統在作戰甚至戰略層面上為各種類型的軍事行動設定所需的預定義信任水平,這可以幫助操作人員在使用AI或ML模型時了解他們的權限是什么。這也將有助于采購專業人員為AI/ML能力的發展做出適當的投資決定,因為它將量化效用的各個方面。此外,在使用AI/ML的系統中提供量化的最低限度的確定性要求,可以解決上面討論的三個隱患。
就使用AI的道德和倫理問題而言,對于 "讓AI或ML模型決定將導致破壞和死亡的軍事行動方案,是否符合道德或倫理?"這個問題沒有單一的正確答案。正如所有的道德和倫理辯論一樣,以絕對的方式處理是不可能的。
因此,美國防部應將軍事行動分為三個眾所周知的機器自主性相對程度之一:機器永遠不能自己做的事情,機器有時或部分可以自己做的事情,或機器總是可以自己做的事情。然后,美國防部可以為這些類別中的每一類定義一個最低的確定性水平作為邊界條件,并且/或者可以定義具體行動所需的最低確定性水平。決策或行動的關鍵性將推動UQ邊界的確定。使用不確定性量化包含了在處理使用AI/ML的系統的道德考慮方面的細微差別和模糊性。
當涉及到平衡人工智能/機器學習的成本與使用時,美國防部的受托責任是確保對人工智能/機器學習發展的投資與它的軍事效用成正比。如果人工智能/機器學習政策禁止美國軍隊允許人工智能決定摧毀某物或殺人,那么開發和采購一營完全自主的殺手機器人就沒有任何意義。因此,預先定義的最低不確定性界限將使采購專業人員能夠確定如何最好地使用有限的資源以獲得最大的投資回報。
在能力發展過程中優化對AI/ML的信任,將需要對AI/ML采購中普遍存在的經驗不足以及機器學習中不確定性量化科學的相對稚嫩進行保障。"不確定性是機器學習領域的基礎,但它是對初學者,特別是那些來自開發者背景的人造成最困難的方面之一。" 系統開發的所有方面都應該包括不確定性量化的元數據標簽,無論系統是否打算自主使用。
這些輸出可能會被卷進更高層次的數字能力中,然后需要UQ數據來計算不確定性的傳播。例如,F-16維護者的故障代碼閱讀器應該有不確定性量化元數據標記到每個故障讀數,在源頭提供這種量化。讀碼器本身并不打算納入人工智能或機器學習模型,而且該數據可能不會立即用于人工智能/ML應用,但故障數據可能會與整個艦隊的故障數據進行匯編,并提交給預測倉庫級維護趨勢的外部ML模型。元數據將跟隨這組數字信息通過任何級別的編譯或高階使用。
要求將不確定性量化元數據作為一項軍事標準,實現了美國防部長關于人工智能道德原則的意圖,其中包括五個主要領域:
采用這些道德原則是為了確保美國防部繼續堅持最高的道德標準,同時接受人工智能這一顛覆性技術的整合。不確定性量化是實現這一目標的實用方法。
蘭德公司的一項研究發現,信任是與人工智能/ML的軍事用途有關的大多數擔憂的根本原因。國防部研究人員指出,"當涉及到組建人類和自主系統的有效團隊時,人類需要及時和準確地了解其機器伙伴的技能、經驗和可靠性,以便在動態環境中信任它們"。對于許多自主系統來說,它們 "缺乏對自身能力的認識,并且無法將其傳達給人類伙伴,從而降低了信任,破壞了團隊的有效性"。
AI/ML模型中的信任從根本上說是基于人類對信息的確定性,無論是簡單的傳感器輸出還是自主武器系統的整體能力。這一點得到了MITRE公司研究的支持: 人工智能采用者經常詢問如何增加對人工智能的信任。解決方案不是讓我們建立人們完全信任的系統,也不是讓用戶只接受從不犯錯的系統。相反,教訓指出了在證據和認知的基礎上形成良好的伙伴關系的重要性。良好的伙伴關系有助于人類理解人工智能的能力和意圖,相信人工智能會像預期的那樣工作,并在適當程度上依賴人工智能。然后,利益相關者可以校準他們的信任,并在授予人工智能適當的權力之前權衡人工智能決定的潛在后果。
通過將機器--數字或物理--視為合作伙伴,軍方可以將其與人類合作伙伴的信任建立技術進行類比。健全的伙伴關系需要有效的雙向溝通和加強合作的系統。"事實上,數字系統輸出中的不確定性措施是沒有用的,除非這種不確定性可以傳達給人類伙伴。一旦機器能夠量化不確定性,并且能夠傳達這種量化,它們也能夠對輸出進行評估并改進系統。
機器對其自身能力的認識的實時反饋,將通過提供每個循環中的不確定性的量化,增加機器的觀察、定位和決定功能的透明度。這種反饋提高了對該特定系統的信任,并通過不確定性的傳播實現了對系統中的系統的信任量化。例如,考慮遙控飛機(RPA)對一個潛在目標的視頻監控。如何確定RPA的傳感器是準確的和經過校準的,視頻流沒有被破壞,和/或操作者已經得到了關于首先將傳感器指向何處的健全的基線情報?
OODA環路的每一個組成部分都有一些相關的不確定性,這些不確定性可以而且應該被量化,從而可以用數學方法傳播到決策層面。在這種情況下,它將導致目標正確性的x%的傳播確定性,使任務指揮官對他們的態勢感知(觀察)充滿信心,并使他們能夠更好地確定方向,更快地決定是否參與。
通過量化不確定性,并將其與各類行動所需的預定信心水平結合起來使用,決策者可以圍繞那些幾乎沒有道德影響的軍事行動以及那些有嚴重道德影響的軍事行動創造邊界條件。國防部高級領導人還可以為開發和應用人工智能/ML能力的投資比例設定門檻,并可以確保投資將被用于實現最佳軍事優勢。這將通過 "量化-評估-改進-溝通 "的循環為使用人工智能/ML的系統提供保證。
不確定性量化允許設置如果-那么關系,以限制機器的可允許行動空間。在另一個簡略的例子中,一個空間領域意識任務可以使用紅外傳感器數據來識別空間飛行器。如果-那么關系可能看起來像這樣: 如果傳感器數據與目標的關聯模型的確定性大于95%,那么該目標識別信息可以在國家空間防御中心目錄中自動更新。如果傳感器數據與目標的關聯模型的確定性大于75%但小于95%,那么機器可以嘗試與確定性大于75%的信號情報(SIGINT)進行匹配,或者可以將信息發送給人類進行驗證。
因此,使用量化的不確定性使指揮官能夠將決策樹根植于人工智能/ML模型可使用的參數中,并指導如何使用這些人工智能/ML模型。在考慮機器自主性的三個相對程度時,指揮官可以預先定義每一類行動的輸入的不確定性水平,作為何時以及在何種情況下讓機器決定是有意義的指導方針,明確界定使用人工智能或ML模型的參與規則。
所有武器系統,無論是否打算納入自主性,都應在其計劃的用戶界面中提供不確定性元數據。了解所有輸入的不確定性對傳統武器系統的用戶和人工智能/ML的應用一樣有利。通過現在提供元數據,國防部高級領導人可以繼續確定使用AI/ML的最佳治理和政策,而不會放慢技術和工程發展。任何這樣的治理都可以在未來通過參考系統內組件級或輸出級的量化不確定性來實施。
將不確定性量化和傳播應用于收緊OODA循環,假定功能關系可用于定義軍事情況。函數關系是這種應用的最佳數學方法,因為一般可以證明函數值和輸入變量之間存在因果關系,而不需要具體確定關系的確切數學形式。通過假設這些函數關系的存在,可以使用一個描述不確定性傳播的一般方程式。
一個帶有不確定性條款的通用函數關系看起來像:
其中y是輸出,u(y)是該輸出的不確定性,有n個輸入變量,其相關的不確定性影響該輸出。這表明y取決于n個輸入變量,并且按照 "不精確概率論者 "的風格,y的精確值在y+u(y)到y-u(y)的區間內。
這種旨在改善醫學實驗室研究的想法的直接應用也涉及到軍事決策。"與任何測量相關的不確定性及其通過定義的函數關系的傳播可以通過微分(部分微分)和應用不確定性傳播的一般方程來評估。"這些數學方法將捕捉到在一個非常復雜的系統中許多測量物變化時不確定性的變化。這個不確定性傳播方程可以用標準的統計程序得出,最重要的是,它與函數關系的確切形式無關。
請那些更精通統計學的人將這種方法提交給進一步的案例研究,并確定在需要包括許多輸入變量時,在非常大的系統層面計算傳播的不確定性的可行性。已經表明,"問題越復雜,獲得校準的不確定性估計的成本就越高"。這種方法通過作戰級別的人工智能/ML模型(即涉及一翼或一營的交戰)可能是可行的,但更高層次的戰略不確定性傳播(即包括政治經濟或核因素的戰役級模型)可能需要不可行的計算能力來實時計算。
作為輸入數據集的一部分,通過機器學習模型傳播測量的不確定性比使用統計方法來估計模型內的不確定性要少得多。數據科學家和人工智能研究人員將熟悉大量專注于假設機器學習模型內的不確定性的研究,但許多歷史工作并沒有采取調整認識上的不確定性--ML模型的訓練數據量不足--與訓練數據集中的測量不確定性的方法。
測量的不確定性可以被認為是數據中的噪聲和/或觀察中的變異性。在數字系統中實施不確定性量化時,需要對不確定性的其他方面進行量化,如領域覆蓋的完整性,也就是輸入數據集的代表性,以及軍事問題的不完善建模,這是模型開發過程中不正確的基線假設的結果,最終植根于人類判斷的不完善。
一個更現代的傳播方法,可能計算量較小,可能是使用機器學習來假設不確定性。來自其他學科使用神經網絡的證據顯示,納入已知的輸入數據不確定性,"與不使用它們的情況相比,對做出更好的預測是有利的"。這些研究人員還建議進一步調查在貝葉斯深度學習框架中使用已知的輸入數據不確定性 "作為要得出的不確定性的初始值",這將是一種與統計學得出的不確定性協同傳播經驗不確定性的方式。
使用數學方法來傳播不確定性,將納入并考慮到不確定性的影響--無法解釋的數據的固有隨機性--以及認識上的不確定性。擬議的軍事標準應將測量不確定性的要求與傳播到高階用途的要求結合起來,如機器學習或更抽象的建模和模擬。用軍事術語來說,通過這種方法使UQ標準化,不僅要考慮基線觀測數據的不確定性,還要考慮與方向和行動有關的數據不確定性。
為了繼續與軍事戰略進行類比,功能關系描述了在OODA循環中如何獲得軍事優勢,以及不確定性如何在該過程中傳播。
在這個特意象征性的等式中,觀察和定位是恒定的活動,而決策和行動是時間上的離散事件。所期望的軍事效果的成功概率是基于循環中每個輸入變量的不確定性的傳播:操作者有多大把握(a)他們的觀察抓住了現實,(b)他們以預期的方式定向,(c)他們的決定以預期的方式執行,以及(d)他們的行動沒有被打亂。
這種方法的障礙在于它需要對不確定性的事先了解,這是目前無法獲得的元數據,因為在經驗情況下確定它的成本通常很高,而在統計情況下有許多可接受的方法來生成它。這就回到了建議的解決方案,即征收要求和標準,以提供與每個輸入變量相關的不確定性作為元數據。一旦提供,匯編觀測和定位數據的人工智能/ML系統可以使用元數據進行傳播,并向操作者或指揮官提供情況圖中的總體量化不確定性。當實時使用時,這種方法內在地捕捉了OODA循環的決策和行動步驟的各個方面。
一項分析表明,將不確定性信息傳達給無人駕駛車輛的操作員并使之可視化,有助于提高人類-AI團隊的績效。但其他人工智能研究人員也表明,"需要更多地研究如何以對用戶有意義的方式,最好地捕捉和呈現開發者的[不確定性量化]"。他們進一步指出,"讓用戶對他們不了解的方面有看似控制的感覺,有可能給人以清晰和知情控制的錯覺,造成額外的自動化偏差,或者干脆讓用戶選擇一個給他們想要的答案的選項。" 這一發現堅實地進入了決策理論和心理學的工作體系。有一些統計方法試圖用算法來定義判斷和決策,使用這些方法有風險。
一項單獨的分析提供了判斷和決策文獻中與決策中使用不確定性估計有關的結論。該研究的結論是,向利益相關者提供不確定性估計可以通過確保信任的形成來提高透明度: "即使是經過良好校準的不確定性估計值,人們也會有不準確的認識,因為(a)他們對概率和統計的理解程度不同,(b)人類對不確定性數量的認識往往受決策啟發式的影響。
作者進一步補充說,"非專業人士和專家都依賴心理捷徑或啟發式方法來解釋不確定性",這 "可能導致對不確定性的評估出現偏差,即使模型輸出是經過精心校準的"。不出所料,關于這個問題的主要啟示是,所選擇的UQ交流方法應首先與利益相關者進行測試,開發人員應滿足他們的UQ顯示和用戶界面的不同終端用戶類型。例如,向數據科學家介紹不確定性量化應該與向戰時決策的操作員介紹UQ不同。情報界在確定傳達與軍事信息相關的不確定性的最佳方法方面有著悠久的歷史,因此它對 "估計概率詞 "的約定可能是后一類終端用戶的合適出發點。
當考慮在作戰和戰略決策層面使用傳播的不確定性時,有可能使用傳播計算可能使UQ數字變得不相關和不可用,因為在非常復雜的系統中,不確定性接近100%的期望輸出。順便說一句,這是一個有趣的結論,可能指向 "戰爭迷霧 "的數學證明。進一步調查計算非常大的系統級別的傳播的不確定性可能會更好地闡明這個結論。
然而,這種高度傳播的不確定度的潛在缺陷并不足以反駁實施不確定度軍事標準的做法。包括每個級別的元數據標簽,使操作人員能夠檢查哪些因素造成了最大的不確定性,哪些因素是指揮官可以有高度信心的,這仍然是非常有用的信息。當操作員的帶寬在高壓力交戰之外可用時,這些元數據標簽允許操作員檢查功能關系中輸入變量之間的協方差和相關性。這些元數據還可以被采集專業人員用于評估和改進任務,通過識別系統性錯誤并將其消除,以及識別造成隨機錯誤的最嚴重的罪犯。
高度傳播的UQ可能是不相關的,這也強調了發展健全的軍事判斷的永久重要性。正如在任何不確定性非常高的軍事情況下,為實現軍事優勢,將需要具有敏銳性的操作員和指揮官。使用人工智能/ML來觀察、定位、決定和比對手更快地行動,只有在行動優越的情況下才會導致勝利。勝利理論的這一層面與要求、傳播和以標準化的方式交流UQ的論點不同。
最后,AI/ML要求輸入數據是感興趣領域的 "具有適當代表性的隨機觀察樣本"。重要的是,"在所有情況下,我們永遠不會有所有的觀察結果",而且在感興趣的領域內 "總會有一些未觀察到的情況"。盡管人工智能或ML算法是在一個不充分的數據集上訓練出來的,但試圖在數據抽樣中實現對該領域的全部觀察覆蓋也是不理想的。
當以較高的行動節奏將人工智能/ML應用于OODA循環時,提高領域的覆蓋率并不需要更多的抽樣,而應該通過抽樣中更多的隨機化來實現,重點是確定準確的測量不確定性。上述關于已知輸入數據的研究從理論上和經驗上證明,將數據的不確定性納入一系列機器學習模型的學習過程中,使模型對過擬合問題更有免疫力--當模型與訓練數據集擬合得過于緊密時,就會出現不可接受的ML行為,導致在負責評估未知數據時出現不準確的預測結果。
過度擬合的問題并不是機器學習所獨有的,從根本上說是由輸入數據集的缺陷造成的。"簡單地說,不確定性和相關的無序性可以通過創造一個更高更廣的更一般的概念來代表現實的直接假象來減弱"。這導致了對該領域的最大統計覆蓋,對被觀察系統的侵擾最小。它還最大限度地減少了數據和元數據集的大小,從而在高階使用中提高了UQ傳播方程的計算效率。
實施量化不確定性元數據的軍事標準,并發展傳播、評估、改進和交流該信息的能力,將為繼續追求AI/ML的軍事用途能力提供最大的靈活性。使用人工智能/ML系統的不確定性量化,通過溝通、透明和參與共同經歷來發展這種信任,使人機團隊內部能夠相互信任和團結。使用AI/ML系統實現軍事目標的保證需要量化的不確定性。
與軍事戰略的概念相聯系,這種不確定性量化的整個框架有助于一個成功的組織。通過現在提供UQ元數據,國防部高級領導人可以繼續確定使用人工智能/ML的最佳治理和政策,而不耽誤技術和工程開發。隨著作戰人員使用UQ來發展對AI/ML伙伴的信任,軍隊的觀察、定位、決定和行動的能力將比對手更快,并確保軍事優勢。
在這項研究中,提出了一種智能兵棋推演方法,以評估軍事行動方案在作戰成功和資產生存能力方面的有效性。擬議的應用是基于經典的軍事決策和規劃(MDMP)工作流程開發的,以便于在現實世界應用中實施。本研究的貢獻有三個方面:a)開發一個智能兵棋推演方法,以加速MDMP中的行動方案(COA)分析步驟,從而為軍事行動創造更多的候選COA;b)產生針對對面部隊的有效戰術,以提高作戰成功率;以及c)為未來的系統開發一個高效的、基于可視化兵棋推演的MDMP框架,這些系統需要一個小型操作團隊來監督一個自動智能體網絡。為了評估系統的能力,執行了幾個交戰場景示例,并給出了結果。此外,研究了自動智能體的兵力組成問題,并提出了具有超參數調整結構的兵力組成算法。
隨著無人系統在復雜任務中的作用越來越突出,包括情報、監視和偵察行動,最近的應用傾向于轉向異構的無人系統組合之間的合作,以執行這些行動并獲得高任務成功率[1]。為了完成復雜的任務,異質智能體之間的合作帶來了對多域作戰能力的需求,其中人工智能(AI)輔助的兵棋推演策略發揮了重要作用[2]。特定的目標,如使用人工智能來發現戰術,這可能會通過現有的軍事能力提高作戰效益,或可能為新的軍事能力提出有效的使用概念。人工智能決策最近集中在開放型游戲,即所有玩家都能看到所有的游戲狀態,或封閉游戲,即存在有限的兵棋靈活性。然而,在戰術和戰略層面上對決策策略進行建模需要有新的算法,這些算法可以在規則變化、不確定性、個人偏見和隨機性的動態環境中運行[3]。
戰術模擬是MDMP的一個重要組成部分,MDMP是軍隊制定作戰計劃、預測敵方部隊的反擊行動和評估擬議作戰計劃有效性的理論方法,因為它提供了一個安全和替代性的與武裝沖突有關的一些情況和決策動態的再現。雖然 "兵棋推演"一詞沒有統一的定義,但普遍接受的定義可以追溯到19世紀初。它被認為是通過任何手段,使用特定的規則、數據、方法和程序來模擬軍事行動[4]。因此,在進行MDMP的定義和重要性之前,必須對兵棋推演做出明確的說明。MDMP始于從上級總部收到的任務。然后,通過利用其他來源的情報進行任務分析。在下一步,處理指揮官的意圖、行動要求和可用資源,以制定行動方案(COA),包括任務組織計劃。在制定行動方案后,通過兵棋推演進行行動方案分析,重點是行動、反應、反擊和裁決過程,以重新確定行動方案和潛在決策點。
圖1 軍事決策過程總結。
在MDMP中,COA分析通常被稱為兵棋推演,它將COA的發展與COA的比較和批準聯系起來[5]。在比較步驟中,每一個COA都根據規定的標準進行評估,如簡單性、機動性、熱能、民用控制和規模性,這些標準在一個決策矩陣中被賦予了評估的權重。此外,從比較步驟中選出的COA應具有最小的風險、最大的安全性和靈活性。然后,根據COA的比較結果完成COA的審批過程,在最后一步,指令生成并與相關單元共享[6]。從總體上看,圖1給出了MDMP的整體流程。
在這項研究中,提出了開發情報、監視和偵察(ISR)和壓制敵人防空(SEAD)作戰計劃,這些計劃由上層人工智能和輔助的、分布式的決策策略支持,以評估生成的COA的成功概率、資產的生存能力和作戰效率。這個過程是在經典的MDMP方案的基礎上發展起來的,以便于在現實世界的應用中實施,它能夠在行動前或行動中提供快速評估和客觀比較COA。這個過程從接收來自MDMP第二步的任務分析結果開始。在COA開發步驟中,最初的任務分配過程是利用CBBA算法進行的,該算法能夠解決具有分布式的通信結構、異質集合和在線重新規劃要求的分配問題。在創建了幾個行動計劃(即COA)后,它們被輸入兵棋推演過程以評估其有效性。之后,這些行動方案在成功概率、生存能力和成本方面被相互比較,最有效的方案被送去審批步驟。圖2給出了重點框架的總體概況。
圖2 COA生成框架。
本研究的貢獻有三個方面:a)開發一種智能兵棋推演方法,以加速MDMP中的行動方案分析步驟,從而為軍事行動創造更多的候選COA;b)產生針對對面部隊的有效戰術,以提高作戰成功率;c)為未來的系統開發一種有效的、可視化的和強大的基于兵棋推演的MDMP框架,這些系統需要一個小型的操作團隊來監督自動智能體網絡。本研究的其余部分結構如下:在第2節,將對文獻中的相關研究進行調查。第3節描述了問題陳述,第4節給出了針對該問題的解決方案所需的背景。在第5節中,將給出在創建這項工作時遵循的方法,第6節展示了模擬研究的結果。最后,第7節是文章結尾。
兵棋推演模擬被用作不同領域的決策工具,從商業到軍事[8],從沖突場景到監視或危機演習,從軍事角度看搜索和救援任務[9] 。在Filho等人[10]中,使用兵棋推演的方法優化了無人機在超視距戰斗中的位置。考慮到兵棋推演中敵人的不確定性,研究了友軍蜂群團隊戰術編隊的有效性。Chen等人[11]提出了一個基于決策樹的城市暴雨情況下的緊急救援兵棋推演模型。在該模型中,雖然敵人的任務僅限于道路積水,但友軍團隊由試圖防止這種積水的應急車輛組成。Su等人提出了基于地理信息系統(GIS)的兵棋推演援助平臺,以防止臺灣地區的蓄水[12]。基于兵棋推演的策略的另一種使用方法是危機演習,Song等人指出,兵棋推演是一種有效的危機演習方式,成本低,方式方便[13]。
一個有效的兵棋推演策略取決于對下屬指揮官完成任務所需資產的準確和最佳分配/配置[7]。許多方法已經被開發出來,使智能體能夠根據已知行動的任務列表在他們之間分配任務。這些方法的主要思想是不僅要提高任務的有效性,而且要降低行動成本和風險。集中式任務分配,需要在智能體和中央服務器之間建立通信聯系,為整個團隊生成一個分配計劃。由于集中式系統能夠減少地面處理要求的負擔,它們能夠有效地使代理人更小、更便宜地建造。此外,據調查,在集中式任務分配系統中使用啟發式方法,如遺傳算法[14-16]和粒子群優化方法[17-19],在計算時間方面有更好的表現[20]。另一方面,由于集中式任務分配的結構,智能體和行動基地之間應保持持久的通信,以提供合作,這需要發送/接收操作更新。這種對通信系統的要求直接影響到智能體組的能力和穩健性。
與集中式應用相反,可以通過利用分布式方法來提高兵力組合的性能和穩健性,在這種方法中,需要智能體之間的通信來獲得對特定任務集的共識。這種類型的通信拓撲結構在智能體損失、通信損失和任務列表的實時更新(即添加和刪除任務)的情況下增加了兵力組合的穩健性[21]。在這種情況下,文獻中已經研究了消除對中央基地的需要的分布式規劃方法。這些方法中的大多數都假設有完美的通信,并有一定的帶寬,以確保智能體在規劃前有相同的態勢感知。然而,這在現實世界的場景中很容易被違反,包括搜索和救援任務,在這些場景中,智能體的通信范圍有限或通信渠道的帶寬有限[22]。在態勢感知不一致的情況下,分散的任務分配算法可以通過利用基于共識的算法,如基于共識的捆綁算法(CBBA)來增強,以便收斂在一個一致的解決方案上[23-25]。不僅有可以集成到分布式框架中的共識算法,文獻中也有基于部分可觀察馬爾可夫決策過程(POMDP)的方法[26]。盡管共識算法保證了信息的收斂,即達成共識,但這可能需要大量的時間,并且經常需要傳輸大量的數據,這可能導致在低帶寬環境下的高延遲,并增加了為無人系統找到最佳任務分配解決方案的處理時間[27]。也有一些關于中間層次結構的報告,即混合結構,介于集中式和分布式結構之間,用于從兩種方法的優點中獲益[28]。
盡管有許多嘗試試圖解決無人駕駛異構飛行器的任務分配問題,而且前面提到的所有研究都考察了底層自動化(以規劃和控制算法的形式)分配異構無人駕駛飛行器(UxVs)網絡的能力,但在產生COA的MDMP中整合增強/高級人工智能生成的指導和輔助決策支持是至關重要的[29]。一些初步的嘗試,如國防高級研究計劃局(DARPA)的 "拒止環境中的協作行動"(CODE)計劃和 "分布式戰斗空間管理"(DBM)的廣泛機構公告(BAA),被提出來改善人類與自動化的協作和決策,通過執行一系列自動化和自主行動來協助戰斗管理者和飛行員[30]。然而,這種具有不同任務分配方法的框架可能是脆弱的,無法對突發事件做出反應。這樣的系統可以通過人類操作者帶來他們基于知識的推理和經驗來緩解[31]。
因此,很明顯,任務規劃者和平臺內的操作者框架都應該被仔細構建。模擬和分析這種框架的最重要的平臺之一是兵棋推演,它被用來執行關于未來部隊資產、軍事能力的決策,并為許多行動做準備。兵棋推演能夠以許多不同的方式執行,從研討會的兵棋推演,到手工棋盤游戲,再到復雜的計算機輔助兵棋推演[32],其中由計算機判斷交戰的后果[33]。
關于該主題的初步研究以來,智能兵棋推演對于促進軍事決策是否有價值一直受到質疑[34]。這些系統在決策過程中的作用也在四個主要學科下進行了討論,即傳感、態勢感知、計劃生成和學習[35, 36]。在這些討論之后,隨著人工智能學科的進步和技術的發展,據報道,將人工智能應用于軍隊的MDMP具有很大的潛力,可以支持指揮中心對競爭激烈和更加復雜的戰場進行規劃,因此Schwartz等人在輔助性人工智能架構中用遺傳算法(GA)來解決這個問題[37]。Boron等人將基于人工智能的兵棋推演整合到決策過程中,他們在不同的戰斗場景中使用強化學習(RL)來評估其算法的性能[38]。Xin等人考慮了以往研究中通常被忽略的不確定性,因此他們提出了一個名為混合智能多分支兵棋推演的解決方案,通過融合基于RL的人工智能方法和人類智能來考慮不確定性[39]。最近,Tarraf等人提出了一個兵棋推演框架,其中規則和交戰統計用于商業桌面兵棋推演,以實現遠程操作和完全自主的戰斗智能體和具有AI/ML支持的態勢感知的智能體[40]。Goecks等人討論了過去和現在關于游戲和模擬器以及人工智能算法如何被調整以模擬軍事任務的某些方面的努力,以及它們如何影響未來的戰場。此外,他們研究了虛擬現實(VR)和視覺增強(VA)系統的進展如何為游戲平臺的人機界面及其軍事提供新的前沿[41]。
在MDMP的步驟2中確定了問題、任務要求、假設和評估標準后,重要的是將藍隊的軍事單位分配給合適的紅隊任務。這是通過利用基于共識的捆綁算法(CBBA)[27]來完成的,該算法支持分布式的、異構的任務和動態環境。在本節中,將給出和描述CBBA算法的細節。
CBBA是一個去中心化的基于市場的協議,它為異質智能體網絡上的多智能體多任務分配問題提供了可證明的良好近似解決方案,并通過使用去中心化的通信方法來解決協調異質自主車輛的任務分配問題[27]。這種類型的通信拓撲結構消除了對中央基地的需求,并且在智能體損失、通信損失和任務列表的實時更新(即添加和刪除任務)的情況下,它增加了任務組的穩健性。CBBA是由兩個階段交替進行的迭代組成的:第一階段是捆綁構建階段,其中每個車輛貪婪地生成一個有序的工作捆綁,第二階段是共識階段,其中相鄰的智能體之間通過本地通信找到并解決沖突的任務。圖3展示了CBBA的內部循環。
為了創建可支持、可擴展和易修改的模塊化架構,我們決定將智能任務規劃器分成四個子組。引擎模塊包括主要的引擎腳本,它包含了關鍵的方法,如任務分配、尋路、戰略、交戰和其他一些重要的方法,以便在模擬過程中前進。引擎腳本中的任務分配方法使用基于共識的捆綁算法(CBBA),該算法也在引擎模塊中。環境模塊包括腳本中的世界對象,它給出了仿真環境的邊界,也是這個環境的網格表示,并附有任務、地形、敵人存在的費用。模型包含關于模擬過程中使用的代理和任務的必要信息。為了創建異質智能體,UAV、UGV、USV和近距離防空(CAD)智能體對象被單獨創建,團隊對象被創建用于設置敵方團隊并跟蹤團隊所做的動作。視圖模塊負責以視覺角度表示結果。圖4給出了智能任務規劃器的模塊結構概要。
在模擬環境中,殺傷力熱圖在空中、地面和海上層生成,以模擬特定區域內敵對力量的火力。這些熱圖是基于內核密度估計(KDE)算法生成的,該算法用于估計地圖上某一點相對于對面部隊位置的危險等級(即對面部隊的有效等級)。在這項研究中,假定軍事單位根據范圍的致命性分布被建模為夸特函數或埃帕尼科夫函數,如公式5所示。
其中d是軍事單位與地圖上指定點(即相關六邊形的中心)之間的距離。對于在d=0時的殺傷力計算,分布的最大值被縮放為1。 圖5中給出了空中、地面和海上層的熱圖生成結果示例。這里給出了a)地面層、b)海軍層和c)空中層的紅隊單位的殺傷力熱圖。在地面層,UAV、UGV、USV和CAD單位都是對藍軍的有效威脅,在給定的自由區域。在海軍層,USV是主要威脅,但UAV、UGV和CAD也是有效的。在空中層,乍一看,似乎對藍隊沒有威脅,因為紅隊的UAV、UGV和USV對藍隊的空軍沒有效果。然而,如果CAD資產存在于該地區,它將是對藍隊的關鍵威脅,結果將是致命的。
圖 5 紅隊在 a) 地面、b) 海軍和 c) 空中層的殺傷力熱圖。
圖 6 示例案例:地面層紅隊的殺傷力熱圖
圖6給出了模擬環境的另一個例子。為了便于可視化,沒有在環境中插入CAD單元。這里給出了地面層的無人機、UGV和USV的殺傷力熱圖。在這種情況下,與地面層的USV相比,UAV和UGV的殺傷力相對較高,因為USV的射程和效率有限。這可以通過利用表1中給出的軍事單位的效率表來直接模擬。該表提供了每種類型的資產對不同層的破壞效率的信息。
表1每種資產的損害效果表。
戰斗模型對戰斗實體、它們的行為、活動和相互關系進行抽象和簡化,以回答與國防有關的研究問題。沒有一個通用的模型可以回答所有的問題,即使可以構建這樣的模型,它也會變得比現實更復雜,因為它不僅包括真實的系統,還包括想象中的系統。戰斗模型可以是隨機的,也可以是決定性的。直觀地說,一個隨機的模型假設關于某種情況的不確定或概率性的輸入,并對結果作出不確定的預測。一個確定性的模型準確地指出將會發生什么,就像沒有不確定性一樣。更正式地說,一個隨機模型需要用概率理論的術語來描述,而一個確定性的模型則不需要。
其中F, HP, L, PH, PD , PT, PW, PL分別是總火力、火力健康度、致命性、命中概率、探測概率、瞄準系統可靠性、武器可靠性和層效率。在這里,建立軍事單位的損傷矩陣也很重要,它決定了它們在交戰中對敵軍的有效性。在模擬環境中,損害矩陣被假定為表1中的內容。通過使用這些定義,每個資產的生存能力被建模為公式7和8中給出的。
其中Fk、Mk是相關團隊在時間k的火力和機動性。Fok是敵對部隊在時間k的火力。
有效的評估包括定量(基于觀察)和定性(基于意見)指標。人的判斷是評估的組成部分。任何評估的一個關鍵方面是它對人類判斷的依賴程度,以及對直接觀察和數學嚴謹性的依賴程度。嚴密性解決了不可避免的偏見,而人的判斷將嚴密性和過程集中在往往是成功關鍵的無形因素上。口頭定義是直截了當的陳述,但為了以智能方式訓練整個系統,將這些句子表示為數學指標是關鍵。從口頭到數學指標定義的過渡是一個開放式的程序,它可以通過手動選擇的方式來捕捉最佳決策[42]。
為了評估紅隊和藍隊的機動性和火力能力,制定了幾個戰斗力評估指標,如公式9和10所給出。
兵力的組成與CBBA的評分功能密切相關,具體如下。
這個函數給出了一個智能體在時間tj到達任務時從任務j中得到的分數。分數由兩部分組成,第一部分是任務的名義獎勵,Rj(aj),它是aj的函數,即分配給任務j的智能體指數,第二部分是折扣函數,它是任務j的到達時間的函數,tj。λ是一個折扣系數,用于解釋目標值隨時間的減少。這個系數包含在目標函數中,以更好地代表現實世界中的問題,即訪問目標的價值與訪問的時間成比例地減少[43]。
由于折扣系數改變了任務到達時間的影響,它需要根據世界的大小進行調整。因此,我們提出了以下結構,從圖7中可以看出,以克服選擇最佳折扣系數和兵力配置的問題。
圖7 基于λ搜索算法的兵力編碼器結構
為了跟上美國防部(DOD)人工智能(Al)戰略的步伐,美國陸軍在2018年啟動了人工智能集成中心(Al2C)。他們的任務是--與美國各地的公司和大學的人工智能社區溝通,目的是通過人工智能的整合來改善和提高軍隊的能力。
這個頂點項目盡可能地分析了當前美陸軍部(DA)對人工智能的要求狀況,以及它們對人類系統集成(HSI)的包含。該小組審查了發布在獎勵管理系統(SAM)網站上的人工智能合同機會和適用的文件,包括績效工作聲明、工作聲明或目標聲明。第一步是確定這些合同機會中包含的要求是否符合人工智能的定義,即計算機系統有能力執行通常需要人類智慧的任務。如果需求符合人工智能的這一定義,那么分析工作就會繼續進行,并側重于納入HSI,以確保為人類(即操作員、士兵、用戶等)提供便利。研究小組還采訪了主題專家(SMEs),以深入了解軍隊開發和獲取人工智能需求的過程。
在2003年至2022年期間發布到SAM的機會中,只有16%(238個中的40個)在開發過程中足夠成熟,可以考慮進行評估。在這40個被認為足夠成熟的采購開發過程中,只有16個發布的信息包含了相關的文件,可以根據團隊既定的人工智能和HSI標準進行評估。從那里,只有6個帖子符合AL的定義,4個被寬泛地判斷為包括一些對HSI或人為因素的參考。該小組的綜合評估確定,陸軍的人工智能指導還處于起步階段,需要進一步發展和完善。評價還強調,盡管國防部和陸軍指導將HSI納入所有要求,但仍然缺乏對HSI的納入。
這個頂點項目建議,所提出的結果和結論應被用來進一步制定人工智能需求的采購指南,并特別注重納入HSI。我們還建議,未來的研究應納入機密需求以及由其他交易機構通過財團管理的需求。
人工智能(AI)有可能給軍事行動的所有方面帶來重大破壞。這項研究開發了一個嚴肅游戲(SG)和評估方法,以提供參與破壞性人工智能技術所需的心態教育。該游戲名為 "Obsolescence",從人工智能和作戰當前和未來狀態的報告匯編中教授向國防部 (DoD) 推薦的戰略級概念。評估過時的教育價值的方法解決了常見的挑戰,如主觀報告、控制組、人口規模和衡量抽象或高水平的學習。游戲提議的教育價值采用前后測試的形式,與人工智能和戰略規劃領域的官方來源和專家建立的基線進行測試。評估包括基于自我報告的學習和測量參與者在游戲后對LO相關問題反應的變化這兩個指標。實驗發現,測量的學習效果和參與者自我報告的學習效果之間有很強的關聯性,這兩個指標都證實了Obsolescence實現了其教育目標。這項研究包括利用評估方法的必要步驟,并為Obsolescence和教育游戲評估領域的未來研究提出了建議。
近年來,針對工業生態系統的高級持續性威脅(APT)的復雜性急劇增加。這使得開發超越傳統解決方案的高級安全服務成為必須,輿論動力學(Opinion Dynamics)就是其中之一。這種新穎的方法提出了一個多智能體協作框架,允許跟蹤APT的整個生命周期。在本文中,我們介紹了TI&TO,這是一個攻擊者和防御者之間的雙人博弈,代表了一個現實的場景,雙方都在爭奪現代工業結構中的資源控制權。通過使用博弈論來驗證這種技術,我們證明,在大多數情況下,輿論動力學包括有效的第一項措施,以阻止和減少APT對基礎設施的影響。為了實現這一目標,攻擊者和防御者的模型都被標準化,并應用了一個公平的評分系統,后者用不同的策略和網絡配置運行了幾個模擬測試案例。
世界各地的公司面對的網絡安全攻擊數量明顯增長,導致了巨大的經濟損失[2]。當涉及到關鍵的基礎設施(即核電站、電網、運輸和制造系統)時,這種情況變得更加嚴重,其工業控制系統必須在所有條件下保持工作。在這里,我們處理的是SCADA(監督控制和數據采集)系統,幾十年來一直在與外部網絡隔離的情況下工作;反過來,如今它們正越來越多地整合新技術,如物聯網(IoT)或云計算,在削減成本的同時外包各種服務。因此,需要做出更大的努力來跟上這種進步,以應對這些系統可能帶來的最新的攻擊載體和可利用的漏洞。
近年來最關鍵的問題之一是高級持續性威脅(APTs),這是一種復雜的攻擊,特別是針對目標基礎設施,由一個資源豐富的組織實施。它們的特點是利用零日漏洞(零時差攻擊),采用隱蔽技術,使威脅在受害者網絡中長期無法被發現。Stuxnet是第一個報道的這種性質的威脅[6],但許多其他的威脅在之后被發現,通常是在攻擊完全執行后的幾個月[7]。在網絡安全方面,只是提出了一些機制來從整體上解決這個問題,超越了傳統的機制(如防火墻、入侵防御系統(IPS)、入侵檢測系統(IDS)、防病毒),這些機制只代表了在第一階段對APT的準時保護[21]。
在這些新穎的機制中,輿論動力學(Opinion Dynamics)[15]包括一個多智能體協作系統,通過分布式異常關聯,使攻擊的整個生命周期都可以被追蹤。在本文中,我們提出了一個理論但現實的方案,以證明該方法在不同類型的攻擊模式下的有效性,使用結構可控性領域[8]和博弈論[14]支持的概念。為了這個目標,我們開發了TI&TO,這是一個雙人博弈,攻擊者和防御者為控制現代工業結構中的資源而競爭。兩個玩家都有自己的動作和相關的分數,分別根據APT和基于Opinion Dynamics的檢測系統的行為。這個博弈最終在不同的模擬中運行,旨在展示算法的能力,同時也建議將該技術與其他防御方案結合起來進行最佳配置。因此,我們可以把我們的貢獻總結為:
本文的其余部分組織如下。第2節介紹了 "輿論動力學"的概念,并強調了應用博弈論來檢測網絡攻擊的建議。在第3節中,定義了博弈,包括規則以及攻擊和防御模型。然后,進行了幾次模擬,并在第4節進行了討論。最后,在第5節中提出了結論和未來的工作。