亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

摘要

航空仿真環境(葡萄牙語為Ambiente de Simula??o Aeroespacial - ASA)是一個定制的面向對象的仿真框架,主要用C++開發,能夠對軍事作戰場景進行建模和仿真,以支持巴西空軍在航空航天方面的戰術和程序開發。這項工作描述了ASA框架,帶來了其管理多個仿真機的分布式架構、用于后處理仿真數據的數據分析平臺、在仿真運行時加載模型的能力,以及同時進行多個獨立執行的批處理模式執行平臺。此外,我們還介紹了最近在空戰背景下使用ASA框架作為仿真工具的工作清單。

關鍵詞:仿真環境,分布式仿真,數據分析,軍事,作戰場景

1 引言

高級研究所(IEAv)是巴西空軍(For?a Aérea Brasileira - FAB,葡萄牙語)的一個研究組織,自2018年以來,開發了航空航天仿真環境(Ambiente de Simula??o Aeroespacial - ASA,葡萄牙語),以提供一個計算解決方案,實現作戰場景的建模和仿真,允許用戶建立戰略、參數和指揮決策,支持在航空航天背景下為國防目的制定戰術、技術和程序。

現代戰場場景的特點給建立實際的戰斗仿真帶來了新的挑戰,需要更多的綜合和靈活的解決方案,不僅要解決技術問題,還要解決組織問題[10]。仿真、集成和建模高級框架(AFSIM)是一個正在開發的框架的例子,以解決其中的一些挑戰[1];然而,它只限于少數美國合作伙伴。在這種情況下,ASA環境被設想為同時足以支持FAB的戰略規劃,滿足作戰分析的需要,并允許開發和評估新技術以加強軍事研究,將自己定位為一個靈活的解決方案,可以根據用戶需求進行調整。這種靈活性是針對客戶的不同特點,這導致了廣泛的要求,而這些要求僅靠商業現成的(COTS)仿真軟件是無法滿足的。由于開發一個全新的解決方案并不高效,ASA團隊決定研究公開可用的工具,旨在將它們整合到一個靈活、可訪問和可擴展的環境中。

擬議的解決方案使用混合現實仿真平臺(MIXR)[11]作為其仿真引擎,這是一個開源的軟件項目,旨在支持開發強大的、可擴展的、虛擬的、建設性的、獨立的和分布式的仿真應用。ASA擴展了MIXR的可能性,增加了額外的元素,創造了一個環境來優化開發者和分析者的任務。我們創建了一個管理器應用程序,作為多種資源之間的接口,作為一個樞紐來運行、存儲和分析眾多計算機上的各種仿真。此外,這個應用程序允許同時創建大量的仿真,只需根據分析員的需要改變初始條件。同時,模型和工具可以在運行時動態加載,以增加靈活性。所有仿真數據都存儲在一個專門的數據庫中,這加快了數據收集過程,促進了更強大的統計分析。此外,考慮到結果的復雜性和ASA用戶的不同技術知識,我們在系統中整合了一個專門的數據分析平臺,不僅用于規劃或可視化目的,還用于對情景產生的數據進行后期處理。

因此,這項工作的主要貢獻是為軍事目的的航空航天背景下的建模和仿真引入了一個新的環境,包含:一個管理多個仿真機的分布式架構;一個用于后處理仿真數據的增強型軍事作戰場景數據分析平臺;一個在仿真運行時加載模型的能力;一個使用不同初始參數進行多次執行的批處理模式執行。此外,我們介紹了最近使用ASA平臺作為空戰領域解決問題的仿真工具的工作清單。

本文的其余部分組織如下。第2節介紹了ASA的架構。在第3節中,我們帶來了一些使用ASA作為仿真工具的研究,這些研究與空戰分析有關,作為這個仿真框架的應用實例。最后,第4節陳述了關于ASA當前狀態的結論,并為未來的工作帶來一些想法。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

摘要

多Agent系統研究關注的是相對簡單的Agent互動所產生的系統級行為。迄今為止,多Agent系統研究主要涉及同質Agent系統,其成員Agent在物理上和行為上都是相同的。具有不同物理或行為特征的異質Agent系統可能比同質團隊更有效地完成任務,通過相互補充的Agent類型之間的合作。在這篇文章中,我們比較了同質和異質團隊在聯合武器情況下的表現。聯合武器理論提出,異質力量的集體應用可以產生遠遠大于同質力量或個別武器的連續使用所取得的效果。實驗結果表明,聯合武器的戰術可以從簡單的Agent互動中產生。

1 引言

多Agent系統研究領域試圖開發出開發單個Agent的方法和算法,以產生理想的系統行為。該領域已經產生了著名的算法,如粒子群優化(PSO)和蟻群優化(ACO),但主要集中在相同的、同質的Agent系統。最近的工作已經開始探索異質系統的潛力,或具有不同行為或物理形式的Agent系統。我們特別感興趣的是這種系統在發展和驗證聯合武器理論方面的應用。

聯合軍備的軍事理論將不同類型的軍備結合起來,以達到比同樣的軍備單獨或依次應用所能達到的效果更大(陸軍2019年)。它將互補的武器結合在一起,為了避免一種武器,敵人必須將自己暴露在另一種武器之下(軍團1997a)。因此,一支聯合武器部隊是異質的,因為它所包括的武器或制劑彼此不同。由于聯合武器部隊是一個異質的多Agent系統,對多Agent系統的研究可能會給聯合武器的軍事研究帶來成果。本文介紹了一組實驗,旨在探索聯合武器戰術在異質代理系統中的出現,即在行為或物理形式上不同的Agent。

實驗是在一個二維(2D)戰斗模擬中進行的,在這個模擬中,各Agent團隊為實現既定目標而競爭。遺傳算法被用來為每個場景演化出有效的團隊,并將每個演化出的團隊的行為與現有軍事學說中的聯合武器行為的定義進行比較。假設被證明是正確的,即聯合武器戰術可以從簡單的異質Agent的相互作用中產生。

這項工作的其余部分按主題分為幾個部分。第2節回顧了同質和異質多Agent系統的現有研究。第3節描述了實驗過程中使用的平臺和措施。第4節概述了測試場景,第5節討論了每個實驗的結果。第6節提供了結束語和對未來工作的建議。

付費5元查看完整內容

摘要

在要求嚴格的航空航天、國防和安全領域,操作和維護人員必須在保證系統運行方面表現出色。因此,遠程培訓和支持是有助于實現這一目標的關鍵活動。滿足高度標準化的程序和復雜的任務,如果以傳統的方式進行,在物流、成本、安全和環保方面會有很大的缺陷。新興技術,特別是那些促進全面互聯互通的技術,正在為解決這些問題提供創新的解決方案。這一點正由建模與仿真服務(MSaaS)范式來解決,而諸如虛擬、增強和混合現實(VR/AR/MR)等新興技術提供了革命性的方法,能夠大幅降低成本并提高性能。在這種情況下,在聯盟正在進行的數字化轉型中,本文為遠程培訓和支持開發創新的解決方案,通過開發一個集成的協作數字平臺,使客戶在操作中得到充分的幫助,與專家進行遠程連接,并訪問所有相關文件,在云端安全地存儲和參考。然而,這種專用平臺的成功實施和運行是以全面連接、數據攝取和處理、云計算和網絡安全、人工智能等因素為前提的。

關鍵詞:建模與仿真、云計算、擴展現實、連接、培訓即服務、遠程培訓和支持。

1.0 引言

在過去的十年里,世界和工業已經進入了被定義為第四次工業革命的階段。它的特點是創新技術和工藝的出現,如超連接性、人工智能、機器人、物聯網、自動駕駛汽車、增材制造、納米技術、生物技術、材料科學、能源儲存、量子計算等等[1]。人們過去的操作和合作方式發生的最劇烈的轉變之一是平臺技術的崛起,特別是由數字化促成的平臺技術。事實上,大多數相關行業目前正處于現在眾所周知的數字轉型之中。雖然很少使用 "革命 "一詞,但包括北約在內的全球防務領域肯定正在許多(如果不是所有)部門中沖浪,進行數字化轉型。

軍隊需要有能力在復雜的現實環境中為部隊做準備,包括威脅和作戰環境(OE)不斷變化的靈活場景,以確保訓練有素的預備人員能夠在整個軍事行動范圍內執行任務。利用新興技術,軍隊現在比以往任何時候都更注重創造全方位的作戰環境(OE)能力和學習經驗,以訓練和準備部隊應對未來的作戰情況,而這些情況是由動蕩、不確定、復雜和模糊的全球安全所決定的。使用數字技術的創新為軍事領域注入了越來越多的能力。在很大程度上,根據北約建模與仿真總體規劃,未來的軍事能力(即理論、訓練、行動等)將由建模與仿真(M&S)來開發和支持[2,3]。為了強調這一重要性,北約STO內的北約M&S小組(NMSG)已經建立了一個方案,以建議、促進和協調聯盟機構、北約成員國和伙伴國之間的合作,最大限度地有效利用M&S解決方案。根據他們的設想,M&S服務和工具必須盡可能方便地被大量用戶使用,從而實現 "作為一種服務 "的方法,以提供更具成本效益的 "按需 "產品、數據和流程的可用性[4] 。

為了實現這一點,許多國防部隊被吸引到現場、虛擬和建設性(LVC)環境中進行訓練。這種方法確實突破了傳統訓練方法的限制,因為它提供了一個安全、更真實和身臨其境的體驗。它還提供了一個無限的空間來進行訓練,以及為增加真實感所需的所有可變威脅。M&S即服務(MSaaS)在NATO STO技術文件MSG-131[5]中已經被定義。"M&S即服務(MSaaS)是一種向客戶提供價值的手段,以實現或支持建模和仿真(M&S)用戶的應用和能力,并按需求提供相關數據,而不需要擁有具體的成本和風險"。這種 "作為一種服務 "的方法正在推動全球社區開發與這一理念相匹配的最新技術的產品,其目的是不僅在產品方面,而且在其相關的商業模式及其對行業與采購部門關系的影響方面獲得重大的現代化。萊昂納多作為國際陸軍、海軍、航空航天、國防和安全領域的領導者,一直在根據這些概念開發最先進的解決方案。

本文描述和討論了一些解決方案,主要集中在創新的培訓目的上,這大大顛覆了傳統方法。更具體地說,描述了用于提供服務的云平臺OCEAN,以及相關的合成環境(RIAce)和M&S中心之間的安全網絡基礎設施(SHORE)。此外,還介紹了專門為培訓目的設計的擴展現實工具。

付費5元查看完整內容

現代綜合防空系統(IADS)所帶來的日益復雜的反介入區域拒止(A2AD)威脅,加上高端隱形平臺所提供的日益強大的優勢,促使美國空軍高級領導人投資于徹底改變2030年及以后的空中力量。這一新設想的一個突出因素是蜂群武器,其目的是通過用大量低成本、可損耗的航空資產來壓倒國際航空運輸系統,并通過自主能力來解決這一挑戰。這項研究提出了一個框架,按照三個獨立的維度對不同級別的自主能力進行分類,即單獨行動的能力、合作能力和適應能力。使用模擬、集成和建模高級框架(AFSIM)構建了一個虛擬作戰模型,模擬以有人駕駛的穿透式轟炸機和自主巡航導彈群為特征的友軍空襲包與以A2AD角色行動的敵軍IADS之間的交戰。通過使用自主性框架作為設計實驗的基礎,評估了不同水平的自主性對攻擊包性能的影響。對實驗結果的分析揭示了哪些方面和什么級別的自主性對促進這一模擬場景的生存能力和殺傷力最有影響。

1. 引言

1.1 動機和背景

戰爭的技術性質正在迅速發展,人們越來越重視對大量數據的收集、處理和決策。隨著指揮與控制(C2)決策空間的復雜性增加,指揮系統根據現有信息采取行動的速度越來越成為一個限制性因素。具有不同程度的人與系統互動的自主系統為緩解這一不足提供了機會。美國2018年國防戰略(NDS)[18]明確要求國防部(DoD)"廣泛投資于自主性的軍事應用",作為促進大國競爭優勢的一項關鍵能力。

參與大國競爭的一個自然后果是反介入區域拒止(A2AD)環境在聯合沖突的所有方面擴散。從美國空軍(USAF)的角度來看,現代綜合防空系統(IADS)構成了卓越的A2AD威脅,這嚴重抑制了通過常規手段建立空中優勢的前景[2, 20]。這一挑戰促使部隊結構的優先事項發生了變化,因為將能力集中在相對較少的高端系統中的感知風險越來越大。美國空軍科學和技術戰略[26]設想,數量龐大的低成本、易受攻擊的航空資產將很快發揮曾經由數量有限的高價值資產完成的作用。這種大規模的蜂群的任務規劃和空戰管理(ABM)工作的規模可能很快超過人類的認知能力,這使得它成為非常適合自主性研究和開發的應用領域。

1.2 問題陳述

本研究試圖評估幾種自主巡航導彈群的行為對A2AD環境中藍方(友方)空中性能的影響。具體來說,所研究的A2AD場景考慮了紅方(對手)的IADS被藍方聯網的自主巡航導彈群吸引,以促進穿透式轟炸機的后續打擊。在任務規劃時沒有考慮到的突然出現的威脅,可能會進入該場景以增加紅色IADS的力量。蜂群必須在沒有外部反彈道導彈的幫助下,檢測并應對這些突發威脅以及任何其他對抗性任務參數的變化。A2AD場景的建模是使用模擬、集成和建模高級框架(AFSIM)完成的。

1.3 研究問題

為了解決問題陳述,本研究將對以下問題提供答案:

1.具有自主反彈道導彈能力的巡航導彈蜂群能在多大程度上提高藍方空襲包在A2AD環境下的生存能力(即避免被紅方IADS發現和摧毀的能力)?

2.具有自主反彈道導彈能力的巡航導彈群能在多大程度上提高A2AD環境下藍方空襲包的殺傷力(即探測和摧毀紅方IADS元素的能力)?

1.4 論文的組織

本論文的其余部分包含四章,組織如下:第二章對包括自主性、A2AD環境、基于代理的建模和仿真(ABMS)以及實驗設計(DOE)等主題的參考材料進行了回顧。第三章建立了A2AD場景、AFSIM模型實現和實驗設計的結構,作為本研究的框架。第四章介紹了實驗模擬運行的結果和附帶的分析。最后,第五章討論了從這項研究中得出的結論,以及對未來研究方向的建議。

付費5元查看完整內容

摘要

兵棋模擬是一種決策工具,可以為利益相關者分析的場景提供定量數據。它們被廣泛用于制定軍事方面的戰術和理論。最近,無人駕駛飛行器(UAVs)已經成為這些模擬中的一個相關元素,因為它們在當代沖突、監視任務以及搜索和救援任務中發揮了突出的作用。例如,容許戰術編隊中的飛機損失,有利于一個中隊在特定戰斗場景中勝利。考慮到無人機的分布可能是這種情況下的決定性因素,無人機在超視距(BVR)作戰中的位置優化在文獻中引起了關注。這項工作旨在考慮敵人的不確定性,如射擊距離和位置,使用六種元啟發法和高保真模擬器來優化無人機的戰術編隊。為紅軍蜂群選擇了一種空軍經常采用的戰術編隊,稱為line abreast,作為案例研究。優化的目的是獲得一個藍軍蜂群戰術編隊,以贏得對紅軍蜂群的BVR戰斗。采用了一個確認優化的穩健性程序,將紅軍蜂群的每個無人機的位置從其初始配置上改變到8公里,并使用兵棋方法。進行了戰術分析以確認優化中發現的編隊是否適用。

索引詞:優化方法,計算機模擬,無人駕駛飛行器(UAV),自主智能體,決策支持系統,計算智能。

I. 引言

兵棋是在戰術、作戰或戰略層面上模擬戰爭的分析性游戲,用于分析作戰概念,訓練和準備指揮官和下屬,探索情景,并評估規劃如何影響結果。這些模擬對于制定戰術、戰略和理論解決方案非常有用,為參與者提供了對決策過程和壓力管理的洞察力[1]。

最近,無人駕駛飛行器(UAVs)作為一種新的高科技力量出現了。利用它們來實現空中優勢可能會導致深刻的軍事變革[2]。因此,它們的有效性經常在兵棋中被測試和評估。

由于具有一些性能上的優勢,如增加敏捷性、增加過載耐久性和增加隱身能力,無人機已經逐漸發展起來,并在許多空中任務中取代了有人系統[3]。然而,由于戰斗的動態性質,在視覺范圍之外的空戰中用無人系統取代有人平臺是具有挑戰性的。在空戰中,無人機可以被遠程控制,但由于無人機飛行員對形勢的認識有限,它將在與有人平臺的對抗中處于劣勢。然而,這種限制可以通過自動戰斗機動[4]和戰術編隊的優化來克服。此外,使用無人機可以允許一些戰術編隊和戰略,而這些戰術編隊和戰略在有人駕駛的飛機上是不會被考慮的,例如允許中隊的飛機被擊落,如果它有助于團隊贏得戰斗。文獻中最早的一篇旨在優化超視距(BVR)作戰中的飛機戰術編隊的文章[5]表明,空戰戰術是用遺傳算法(GA)進行優化的候選方案。該實施方案采用分層概念,從小型常規作戰單位建立大型編隊戰術,并從兩架飛機的編隊開始,然后是四架飛機,最后是這些飛機的倍數。在模擬中沒有對導彈發射進行建模。當一架飛機將其對手置于武器交戰區(WEZ)的高殺傷概率(Pkill)區域內一段特定時間,簡化的交戰模擬器就宣布傷亡。事實證明,所提出的方法的應用是有效的,它消除了團隊中所有沒有優化編隊的飛機,并為整個優化編隊的飛機團隊提供了生存空間。

Keshi等人[6]使用了與[5]相同的分層概念,從由兩架飛機組成的元素中構建大型戰術編隊。模擬退火遺傳算法(SAGA)被用來優化編隊,使其能夠克服對局部最優解的收斂。對16架飛機的編隊進行了優化,提出的最優解表明SAGA比基本的GA更有效。最后,為了探索一個穩健的SAGA,對不同的馬爾科夫鏈進行了比較,事實證明自調整馬爾科夫電流更適合所提出的問題。

Junior等人[7]提出使用計算機模擬作為一種解決方案,以確定BVR空戰的最佳戰術,使擊落敵機的概率最大化。在低分辨率下使用通用參數對飛機和導彈進行建模,并改編了名為COMPASS的模擬優化算法,模擬了兩架飛機對一架飛機的BVR戰斗。低分辨率模型假定在水平面的二維空間內有一個均勻的直線運動。使用優化的戰術表明,擊落敵機的平均成功率從16.69%提高到76.85%。 Yang等人[8]提出了一種方法來優化飛機對一組目標的最佳攻擊位置和最佳路徑。該工作考慮到飛機能夠同時為每個目標發射導彈,并將飛機與目標有關的攻擊性和脆弱性因素作為評價攻擊位置的指標。一個高保真模擬被用來模擬每個導彈的飛機、雷達、導彈和WEZ的動態特性。這項工作并沒有解決在BVR戰斗場景中優化一組飛機對另一組飛機的編隊問題。

Li等人[9]提出了一種基于指揮員主觀認識的編隊優化方法,即在空戰中目標設備信息不確定的情況下選擇飛機編隊的問題。首先,計算戰斗機的戰斗力,這是通過指揮員的主觀認識評估目標戰斗力的基礎。戰斗機的戰斗力以能力的形式表現出來,包括攻擊、探測、生存能力、通信、電子戰、預警系統等。因此,通過采用前景理論和綜合模糊評估來優化空戰訓練。最后,一個應用實例證明了該方法在小規模空戰中的可行性。作者聲稱,利用戰斗力評估戰斗情況的能力為優化空戰訓練提供了一種新的方法。

?zpala等人[10]提出了一種在兩個對立小組中使用多個無人駕駛戰斗飛行器(UCAVs)進行空戰的決策方法。首先,確定兩隊中每個智能體的優勢地位。優勢狀態包括角度、距離和速度優勢的加權和。在一個團隊中的每個智能體與對方團隊中的每個智能體進行比較后,每個航空飛行器被分配到一個目標,以獲得其團隊的優勢而不是自己的優勢。為一對對立的團隊實施了一個零和博弈。對許多智能體參與時的混合納什均衡策略提出了一種還原方法。該解決方案基于博弈論方法;因此,該方法在一個數字案例上進行了測試,并證明了其有效性。

Huang等人[11]開發了新的方法來處理UCAV編隊對抗多目標的合作目標分配和路徑規劃(CTAPPP)問題。UCAV的編隊是基于合作決策和控制的。在完成目標偵察后,訓練指揮中心根據戰場環境和作戰任務向每架UCAV快速傳輸任務分配指令。UCAV機動到由其火控系統計算出的最佳位置,發射武器裝備。合作目標分配(CTAP)問題通過增強型粒子群優化(IPSO)、蟻群算法(ACA)和遺傳算法(GA)來解決,并在歸因、精度和搜索速度等方面進行了比較分析。在進化算法的基礎上發展了UCAV多目標編隊的合作路徑規劃(CPPP)問題,其中提供并重新定義了獨特的染色體編碼方法、交叉算子和突變算子,并考慮燃料成本、威脅成本、風險成本和剩余時間成本來規劃合作路徑。

Ma等人[12]開展的工作解決了在BVR作戰場景中優化兩組(R和B)無人機對手之間的優勢地位問題。一個無人機ri∈R對一個無人機bj∈B的優勢是通過ri和bj之間的距離、ri的導彈發射距離的下限和上限、ri的高度和bj的高度之差以及ri的最佳發射高度來估計的。決定性的變量是無人機在兩組中的空間分布和每架飛機在這些組中的目標分配。無人機在三維作戰空間BVR中的可能位置被簡化(離散化),通過立方體的中心位置來表示。每個無人機組都有一組立方體。優化問題被建模為一個零和博弈,并被解決以獲得納什均衡。

Ma等人[12]提出的工作沒有使用高保真模擬來分析無人機空間分布的選擇和分配給它們的目標對BVR作戰的影響。高保真模擬對飛機、雷達、導彈及其導彈的WEZ的動態特性進行建模。這些動態特性也影響到BVR作戰時每架飛機的行動觸發,因此也影響到最終的結果。例如,如果在兩組無人機之間第一次沖突后的時間窗口內考慮高保真BVR作戰模擬,新的沖突可能會發生,直到模擬結束。因此,每個在交戰中幸存的無人機將能夠選擇一個新的目標,這取決于可用目標的優勢值。在[12]中沒有考慮與無人機行為有關的不確定性。有關敵方無人機在戰術編隊中的確切位置及其導彈發射距離的信息是行為不確定性的例子。這兩個信息和上面描述的其他信息在BVR戰斗中是相關的:它們直接影響飛機之間的交戰結果。

在這項研究中,我們試圖解決文獻中發現的一些局限性,如低分辨率模擬、與敵人有關的不確定性的處理以及缺乏對優化解決方案的穩健性的確認,旨在提高兵棋結果的質量。我們的目標是驗證哪些藍色蜂群的戰術編隊可以在BVR戰斗中戰勝紅色蜂群。作為一個案例研究,RED蜂群使用了空軍經常采用的戰術編隊,稱為line abreast[13]。為了評估BLUE蜂群解決方案的穩健性,我們解決了新的問題,改變了RED蜂群每架飛機的位置,目的是估計新的RED蜂群編隊對BLUE蜂群的優化戰術編隊的效率的影響。

我們使用自主智能體和高保真計算機模擬來優化BVR戰斗中的無人機戰術編隊,考慮與敵人相關的不確定性,如戰術編隊中的位置誤差和導彈發射距離。統一行為框架(UBF)被采納為創建自主智能體的基礎。飛機和導彈在三維環境中用六個自由度(DoFs)建模。

該程序將在接下來的章節中進一步討論。

付費5元查看完整內容

蘭德公司發布《2035年后的新興技術:基于典型場景的未來軍事突發事件技術評估》(Emerging Technology Beyond 2035: Scenario-Based Technology Assessment for Future Military Contingencies)報告,該報告介紹了美國陸軍未來司令部(Army Futures Command)發起的“2035年后新興技術趨勢的影響”(Impact of Emerging Technology Trends Beyond 2035)項目的實施情況。該項目的目標是確定2035年以后潛在的新興技術趨勢,評估將這些新興技術應用于軍事行動的可行性,并描述這些技術在整個競爭連續體中的軍事影響。該報告側重于基于情景的技術評估,并為此詳細制定了5個說明性情景:愛迪生在海外(Edison Abroad)、北極深處之戰(Battle of the Arctic Depths)、戰爭機器之霧(Fog of War Machines)、托馬斯·謝林在朝鮮(Thomas Schelling in the DPRK)、第三次海灣戰爭(Gulf War Ⅲ)。該報告對“北極深處之戰”情景中確定的候選技術進行更詳細的評估,包括潤滑油、量子、太空運輸、飛行器、自主武器系統(AWS)、生物技術等技術領域,并提出美國陸軍應發展關鍵伙伴關系、為未來突發事件做好準備、考慮未來技術評估的預期結果、解決現代化優先事項和需求差距等建議。

未來是高度不確定的,然而,陸軍必須努力預測未來的全球發展和技術變化。這項預測工作的目標是協助美國陸軍為不斷變化的作戰環境做好準備,包括過去不曾面臨的環境,例如氣候變化導致的極端天氣條件。在這些和其他作戰條件下,新興技術可能有助于陸軍在關鍵任務中取得成功,并維護美國的利益。預測還可以幫助陸軍更好地理解和預測其可能面臨的沖突類型,關鍵對手的特征,以及可能面臨的作戰層面挑戰。在資源稀缺、預算緊張的環境下,為未來的突發事件做好準備和規劃尤為重要,軍隊今天已經需要就如何分配資源做出艱難的決定。

本報告介紹了技術路線圖進程的發展和實施,以幫助陸軍了解對2035年至2050年陸軍任務可能很重要的關鍵新興技術的影響。目標是協助陸軍為作戰環境的轉變做好準備,包括過去可能沒有廣泛面對的情況,如面對氣候變化驅動的極端天氣條件的行動。在這些和其他操作條件下,新興技術可能有助于陸軍成功完成關鍵任務并促進美國的利益。

研究成果

這項工作的具體方法側重于基于場景的技術評估

  • 未來世界的關鍵驅動因素是那些被認為與調節未來作戰環境和對手最相關的因素,軍隊可能面臨的挑戰類型,具有軍事影響的未來技術種類,以及諸如軍隊現代化的優先事項和關于技術投資和整合的決定等行動。

  • 五個說明性的場景被詳細地制定出來。在這五個場景中,北極深度之戰的場景被用來演示技術評估的實施。

  • 在這項工作中開發的技術評估過程提供了結構化的步驟,將情景轉化為任務概述和關鍵挑戰,為挑戰確定候選技術,并最終評估軍隊現代化的優先事項與候選技術解決方案和挑戰的一致性。

  • 對這些場景進行技術評估,需要考慮具有高度不確定性的技術。

對于北極深度場景,分析了潤滑劑、量子、空間運輸、飛行器、自主武器系統(AWS)和生物技術等技術領域

  • 評估發現,許多陸軍現代化的優先事項與陸軍在該情景中面臨的關鍵挑戰相一致--特別是AWS、生物技術和量子技術。

  • 然而,目前陸軍的一些現代化優先事項與北極深度場景中確定的挑戰表現出錯位或不一致--特別是圍繞潤滑油和垂直起飛和降落能力的錯位。

  • 對北極深度之戰的評估發現,陸軍的優先事項和點對點的空間運輸的潛在需求之間并不一致。

研究建議

  • 美國陸軍應在私營部門(例如,與能源、空間運輸等行業的領導者)和多國伙伴(例如,北約內部的主要盟友)發展關鍵的伙伴關系,以確保其需要的技術的可用性和整合性,特別是通過技術評估確定為關鍵需求的技術。這些伙伴關系可以通過建立和資助卓越中心來支持。

  • 在技術發展和陸軍現代化優先事項不一致的地方,領導層應考慮投入資源,更新理論,并實施替代戰略,以利用被確定為關鍵需求的技術。

  • 如果需要對基于情景的技術評估進行比較,為了提供一個更平衡的視角,美國陸軍未來司令部應進一步發展這個情景組合,以包括技術進步具有進化性質的情景。這一步將使陸軍利益相關者從技術評估中提供一個更廣泛的視角,跨越技術發展的外生不確定性。

  • 美國陸軍應該為未來廣泛的突發事件和世界狀態做好準備,在這些情況下,技術是分散的,而美國并不具有技術優勢。為了支持這一點,陸軍應該進一步發展技術評估活動中考慮的情景組合。

  • 美國陸軍應考慮未來技術評估的預期結果,以確保適當的技術概念得到應用。

  • 美國陸軍應利用技術評估方法來解決現代化的優先事項和需求差距。

報告目錄

第一章 介紹

第二章 未來世界的不確定性

第三章 未來不確定性的技術評估

第四章 見解和建議

附錄A 優先場景描述

附錄B 樣本評估活動:技術匹配

附錄C 北極深海之戰技術研究

付費5元查看完整內容

軍事防御現代化規劃通常涉及復雜的系統,必須了解這些系統,以便為設計、規劃、實施和采購決策提供信息。為了獲得對系統的基本了解并確定關鍵的初始參數,仿真實驗可以用來在一個大型參數空間內有效地生成數據。雖然機器學習模型可用于模擬后的分析,以確定關鍵參數,但當目的是為決策者提供支持時,其可解釋性和黑盒性質會帶來挑戰。在本文中,應用了一種可解釋機器學習預測的模型診斷方法,稱為沙普利加和解釋(SHapley Additive exPlanations,SHAP),用于從基于Agent的模擬中獲得數據,該模擬是一個軍事作戰場景。該場景是由加拿大陸軍對其情報、監視和偵察資產進行現代化的舉措所激發的,并對其進行了抽象化,以盡量減少建模系統的復雜性并驗證SHAP的結論

關鍵詞:基于Agent的仿真,數據耕耘,可解釋機器學習。

1 引言

軍事防御現代化計劃通常涉及復雜的系統,必須了解這些系統,以便為設計、規劃、實施和采購決策提供信息--這些決策通常與數百萬到數十億美元的預算相聯系。例如,加拿大政府為實現加拿大武裝部隊(CAF)和國防部的密碼能力現代化,撥款范圍在2000萬到4900萬美元之間,為實現CAF輕型和重型后勤車輛能力的現代化,撥款范圍在10億到49.9億美元之間(加拿大政府2020)。

仿真實驗可以幫助對系統的基本了解,找到穩健的決策或方案,并比較不同決策或方案的優劣(Kleijnen等人,2005)。數據耕耘是指利用仿真實驗在一個大的參數空間內有效地增長數據,以支持決策。它是一個跨學科的協作過程,使用快速原型設計、仿真建模、實驗設計、高性能計算以及數據分析和可視化;詳細概述見Horne等人(2014)。數據耕耘過程可以幫助操作仿真模型,學習仿真模型的行為,并確定關鍵信息,包括輸入和輸出之間的因果關系(Sanchez 2015)。實驗設計應該是靈活的,以考慮不同的元模型、數據挖掘和圖形分析技術,因為通常一種單一的方法將不適合全面評估模擬輸出(Sanchez 2015)。

數據耕耘過程最早在20世紀90年代末提出(Horne 1999),此后被應用于海洋領域(Cheang 2016, Dobias and Eisler 2017, Morgan et al. 2018, Kesler 2019)、陸地領域(Kallfass and Schlaak 2012)、網絡領域(Horne and Robinson 2016)和多領域(Huber and Kallfass 2015, Gordon 2019)等各種軍事應用。數據耕耘已被用于研究各種類型的軍事行動,包括戰斗(Kallfass和Schlaak 2012)、人群控制(Kryza等人2012)、傷員疏散(Featherstone 2009)、空襲(Huber和Kallfass 2015)和國土安全,如關鍵基礎設施的保護行動、海洋環境中部隊保護的非致命武器選擇,以及城市恐怖襲擊的應急響應(Lucas等人2007)。

數據耕耘的挑戰之一是模擬后的分析和可視化。這一步的重點是突出有用的信息,提取結論,并支持決策,這需要高度有效的分析技術,以充分利用可能產生的大量數據(Horne等人,2014)。鑒于機器學習模型處理和評估大數據的能力,它們很適合這項任務。然而,許多機器學習模型的黑箱性質可能具有挑戰性,因為主要目標不是預測而是理解模擬。在以前的數據耕耘的軍事應用中,模擬后的分析往往側重于描述性統計(Huber和Kallfass 2015,Horne和Robinson 2016,Dobias和Eisler 2017)或描述性統計和可解釋性模型的組合,如逐步回歸和分區樹(Featherstone 2009,Kallfass和Schlaak 2012,Cheang 2016,Gordon 2019,Kesler 2019)。

與可解釋的模型相比,在黑箱模型中,如神經網絡或隨機森林,不可能直接有意義地檢查其組成部分并獲得洞察力(Ribeiro, Singh, and Guestrin 2016)。然而,這些更復雜的黑箱模型可以實現更高的預測準確性,在可解釋性和準確性之間形成了一種權衡(Lundberg和Lee 2017)。為了應對這種權衡,已經開發了模型診斷方法來解釋任何機器學習模型的預測。在最近的一個數據耕耘的軍事應用中,Amyot-Bourgeois、Serré和Dobias(2021年)對隨機森林模型的輸出應用了互換特征重要性,這是一種模型無關的方法。特征重要性措施表明每個特征,或數據耕耘背景下的模擬參數,在預測感興趣的結果方面的有用程度。識別重要參數有助于簡化決策過程,但除非能夠理解重要參數和感興趣的結果之間的關系,否則價值有限。SHapley Additive exPlanations(SHAP)提供了一種替代包絡特征重要性的方法,也可用于研究特征的價值與對感興趣的結果的影響之間的關系(Molnar 2021)。根植于博弈論的Shapley值,SHAP的計算要求是NP-Hard;然而,基于樹的機器學習模型有一個低階多項式時間算法,也可用于研究特征的相互作用(Lundberg等人,2020)。

本文擴展了Amyot-Bourgeois、Serré和Dobias(2021)的工作,將SHAP作為模擬后分析的一部分,以評估它是否能對一個模擬的軍事作戰場景提供有意義的解釋。在加拿大陸軍(CA)對其情報、監視和偵察(ISR)資產進行現代化的倡議的激勵下,模擬場景也對ISR支持穩定行動進行了模擬,但考慮了兩種ISR資產定位方案,并納入了一種額外的ISR資產類型。該場景在新西蘭國防技術局開發的基于Agent的模擬環境中實施,該環境被稱為地圖感知非統一自動機(MANA)。選擇MANA的部分原因是它的數據耕作能力,可以利用它在廣泛的參數選項空間內運行模擬。該方案在第2節有更全面的描述。關于模擬參數、實驗設計、指標和模擬后分析方法的細節將在第3節介紹。第4節介紹了仿真實驗和SHAP分析的結果。最后,在第5節中提供了一些結論性意見

2 場景

仿真場景是一個簡化的小插曲,它是為了證明利用ISR能力來支持加拿大軍隊的各種任務(加拿大公共工程和政府服務部2020)。它代表了一種情況,即加拿大軍隊將與一個多邊伙伴,如北大西洋公約組織(NATO),領導或促進國際和平行動和穩定任務,這是加拿大國防政策 "強大、安全和參與 "的核心任務之一(加拿大政府2017年)。地點是北約的一個成員國受到一個鄰國,一個非北約近鄰對手的入侵威脅。因此,受到威脅的北約成員國援引了北約第5條,并成立了一個北約聯盟來協助受到威脅的國家。北約聯盟(藍軍,BF)監視邊界,并與任何越境的紅軍(RF)交戰。

下面的表1列出了情景中包括的所有小隊,以及每個小隊的地形和初始位置的表述。紅軍試圖到達藍軍總部(藍軍 HQ)。當紅軍向藍軍總部推進時,它進入了藍軍邊境傳感器的探測和分類范圍。在MANA中,探測是指在某一位置感知到特工的存在,而分類是指將探測到的特工的忠誠度分為友軍(藍軍)或敵軍(紅軍)的行為。一旦探測到并被歸類為敵方,邊界傳感器就會將探測到的特工的忠誠度和位置傳達給邊界總部,后者則提示4、5和6小隊(列于表1)向確定的RF位置移動。4號和5號小隊的任務是與紅軍交戰,而由無人駕駛飛行器(UAV)組成的6號小隊的任務是持續跟蹤紅軍并提示藍軍總部進行間接火力支援。如果所有的紅軍都失去了能力,或者達到了最大的時間限制,模擬就會結束。

表1: 基于Agent的模型中每個小隊的描述和初始位置。

3 方法

3.1 場景參數和實驗設計

選擇用于參數化的自變量是藍軍邊界傳感器的數量、藍軍邊界傳感器的探測和分類范圍(稱為傳感器范圍)、藍軍邊界傳感器探測到的特工被正確分類為紅軍或藍軍的概率(稱為分類概率)、藍軍邊界傳感器對RF傳感器的隱蔽程度(稱為傳感器隱蔽性),以及藍軍無人機的數量。實驗設計遵循網格狀結構,每個設計點重復進行一百次迭代。表2顯示了參數的范圍。

仿真實驗首先進行,同時保持藍軍邊界傳感器的固定位置,如表1所示為雙傳感器情況,而對于單傳感器情況,則位于兩個傳感器之間的中點。然后重復模擬實驗,將兩個傳感器和單個傳感器隨機放置在與兩個固定的藍軍邊界傳感器之間的距離相對應的方框內(同時在雙傳感器情況下保持20個網格的最小分離距離)。在分析部分,這兩種配置的傳感器部署被稱為固定或隨機的傳感器位置。

表2:變量的參數化范圍。

3.2 衡量標準

仿真實驗的目的是評估傳感器組合(即給不同傳感器的配置參數,如表2所列)在情景中的性能。已經提出并監測了幾個指標來評估ISR資產的系統,如第一個探測步驟、所有紅軍坦克的平均探測步驟和探測范圍、探測到的紅軍坦克的比例,以及一些藍軍的生存能力和致命性指標(Amyot-Bourgeois, Serré, and Dobias 2021)。在本研究中,在監測到的指標中選擇了兩個衡量有效性(MOEs)的例子進行更徹底的分析:第一個檢測步驟和檢測到的RF坦克的比例。第一個檢測步驟是指從模擬開始到藍軍傳感器第一次檢測到紅軍坦克并將其分類的延遲時間(以用戶定義的時間步長為1到10,000步,后者是模擬的最大分配時間)。檢測到的RF坦克的比例是指至少被藍軍 ISR資產之一檢測到并分類的RF坦克與RF坦克總數的比率,在整個實驗過程中,該比率保持為10。

3.3 仿真實施

該場景使用MANA實現,MANA是一種對抽象表示有用的提煉工具(Anderson 2013)。MANA擁有數據耕耘能力,但可同時變化的參數數量限制在兩個,而且只能與相同的固定小隊相關聯。這使得我們無法使用MANA內部的數據耕作能力來生成各種設計點。然而,方案文件被保存為XML文件,不同的相關參數可以使用XML編輯器直接修改。整套設計點是用Python的ElementTree軟件包生成的,并保存為XML文件。仿真是使用高性能計算進行的,因為總的迭代次數上升到接近200萬次,而且事實證明并行化對減少計算時間很有用。然后用Python腳本處理所有迭代的輸出文件,以提取感興趣的MOEs,并將實驗結果整理成便于模擬后分析的格式。

3.4 模擬仿真后的分析方法

在機器學習中,主要目標是根據一組特征變量來預測結果或目標變量。在數據農業的背景下,場景參數被視為特征變量,MOE被視為目標變量。根據目標變量是分類的還是定量的,機器學習問題被分別稱為分類問題或回歸問題。隨機森林是一種常見的機器學習模型,本研究之所以選擇它,部分原因是它被發現通常表現良好,只需要很少的模型調整(Hastie, Tibshirani, and Friedman 2009, 590)。隨機森林最早是由Brieman(2001)提出的,它由一大組通過引導訓練數據建立的決策樹組成。每次在樹中考慮拆分時,只有一個隨機的特征變量子樣本被認為是拆分的候選人。正是這個特征抽樣過程使樹去掉了相關性,導致這組樹的平均值比單樹模型的變量更少,更可靠(Gareth等人,2017,320)。然后,隨機森林通過多數票或樹的預測平均值對測試觀測值進行分類或預測。

本研究中關注的兩個MOE,即第一個檢測步驟和檢測到的RF罐的比例,是定量的目標變量。耕耘模擬數據以70/30的比例被隨機分成訓練和測試集。然后使用Python的Scikit-Learn軟件包的0.24.1版本(Pedregosa等人,2011)對隨機森林回歸器進行訓練和測試。使用隨機森林回歸器的默認設置,除了將分裂內部節點所需的最小樣本數增加到30,將葉子節點所需的最小樣本數增加到10,并將最大深度設置為10以限制單個樹的大小。在尋找最佳分割時,確定最大特征數的方法也從默認的使用總特征數改為使用特征數的(近似)平方根。在構建隨機森林時通常選擇平方根法(Gareth等人,2017,319)。為了評估隨機森林的回歸者,使用了決定系數(R2)。R2表示擬合度,是衡量未見過的觀察結果被模型預測的程度(Scikit-Learn, n.d., chap 3.3)。它的最佳分值是1,而0分表示一個恒定的模型(即一個模型總是預測預期的目標值,而忽略特征變量)。它也可以是負數,因為一個模型有可能比恒定模型的表現更差。

SHAP方法計算Shapley值,它基于聯盟博弈理論,代表了一個特征值與數據集的平均預測值相比對模型預測的貢獻(Molnar 2021)。SHAP值是局部解釋(即針對單個數據點),可以匯總起來解釋一個模型的全局行為(Lundberg等人,2020)。作為SHAP值的延伸,Lundberg、Erion和Lee(2019)提出了同樣基于博弈論的SHAP交互值,以直接捕捉成對的交互效應。由于隨機森林是一個基于樹的模型,使用Python的SHAP包中的TreeExplainer可以獲得計算SHAP值和SHAP交互值的高速精確算法(Lundberg等人,2020)。0.38.1版的SHAP包提供了一系列的圖形總結,包括SHAP特征重要性。為便于比較,還提供了互換特征重要性,它是用Python的ELI5軟件包0.11.0版本的算法計算的(ELI5, n.d.)。互換特征重要性類似于Brieman(2001)首次提出的用于隨機森林的方法。它通過確定當一個特征不可用時對模型性能(在本研究中用R2衡量)的影響來衡量其重要性。變量的去除是通過在測試集中用自身的隨機置換來完成的。

4 分析

表3總結了每個MOE以及固定和隨機傳感器位置的隨機森林回歸器的性能。在所有情況下,隨機森林模型都明顯優于常數模型,后者的R2為零。對于第一個檢測步驟,固定和隨機傳感器位置的特征變量解釋了MOE中80%以上的變異。對于檢測到的紅軍坦克的比例,擬合度沒有那么強,固定傳感器位置的特征變量解釋了MOE中略高于60%的變異,隨機傳感器位置的特征變量解釋了MOE中略低于60%的變異。

圖1和圖2分別列出了第一個檢測步驟的排列特征重要性和SHAP特征重要性,以及檢測到的RF坦克的比例。這些方法在識別最重要的特征方面基本一致,盡管在某些情況下確切的排序有所不同,特別是在不太重要的特征中。在圖1(a)中,傳感器范圍是預測第一個檢測步驟的最重要特征。對于固定和隨機的傳感器位置,如果將傳感器范圍從隨機森林模型中刪除,R2將下降到零以下,表明性能比恒定模型差。在圖1(b)中,傳感器范圍也是最重要的特征。對模型輸出的幅度(即預測的第一個檢測步驟)的平均影響由SHAP值的絕對值的平均值給出。尺度與目標,即第一個檢測步驟的單位相同。在圖2(a)中,有兩個特征對預測探測到的紅軍坦克的比例很重要:無人機的數量和傳感器的范圍。請注意,這兩個特征的重要性順序對于固定和隨機的傳感器位置是不同的。在圖2(b)中,同樣的兩個特征被SHAP方法確定為最重要。請注意,在這種情況下,無人機的數量對于固定和隨機的傳感器位置都是排在第一位的。

表3:隨機森林模型的性能得分。

圖1:第一個檢測步驟的特征重要性總結

圖2:檢測到的紅軍坦克比例的特征重要性總結

雖然標準的特征重要性柱狀圖提供了關于一個特征的相對重要性的見解,但正如Lundberg、Erion和Lee(2019)所述,"它們并不代表該特征對模型輸出的影響范圍和分布,以及該特征的價值與影響的關系"。他們提出了SHAP總結圖作為替代方案,圖3顯示了第一個檢測步驟,圖4顯示了檢測到的紅軍坦克的比例。每個點代表一個設計點的SHAP值,并以相應的單個特征的值來著色,藍色代表低值,紅色代表高值。這些特征按其整體影響(即SHAP值的絕對值之和)排序。正(或負)的SHAP值表示與數據集的平均預測值相比,對預測(模型的輸出)有正(或負)的貢獻。

在圖3(a)和圖3(b)中,傳感器范圍的顏色的平滑漸變表明,隨著傳感器范圍的縮小,模型的輸出(預測的第一個檢測步驟)平滑增加。這種行為在模擬中是可以預期的:第一次檢測一般由邊界傳感器完成,當它們的范圍較大時,它們會更早地進行第一次檢測。當傳感器位置固定時,圖3(a)顯示,當有一個邊界傳感器(藍點)時,與有兩個邊界傳感器(紅點)時相比,第一個檢測步驟比平均時間早(負SHAP值)。對模擬的檢查也證實了這一結果:單個固定傳感器的位置傾向于與穿越邊界的紅軍坦克的路徑一致,使單傳感器的情況比雙傳感器的情況有優勢。在圖3(b)中,SHAP值的模式在傳感器的數量上幾乎完全顛倒。當邊界傳感器的位置在每次迭代中被隨機分配時,在固定傳感器配置中,單傳感器情況比雙傳感器情況的優勢被消除了。因此,在這種配置下,從單傳感器到雙傳感器情況下,傳感器區域覆蓋的增加更加有效,紅軍坦克路徑有更大的機會穿過兩個傳感器覆蓋的區域,而不是一個傳感器覆蓋的區域。

圖3:第一個檢測步驟的SHAP總結圖。

圖4顯示了探測到的紅軍坦克比例的SHAP匯總圖。無人機的數量是對全球影響最大的特征。對于這個特征,藍點代表沒有藍軍無人機的設計點,這降低了模型的輸出(預測檢測到的RF坦克的比例)。這種行為在模擬中是預料之中的:一旦藍軍無人機被觸發,它們就會被送到第一個探測到的RF坦克的位置,在跟蹤它的同時,可以探測到其他RF坦克。因此,擁有一些無人機與沒有無人機相比,可以增加探測到的紅軍坦克的比例。同樣,低傳感器范圍也會降低檢測到的紅軍坦克的比例。如圖3所示,較低的傳感器范圍與較晚的第一次檢測步驟有關,無人機在第一次檢測之前不會被觸發。雖然固定和隨機傳感器位置的三個不太重要的特征的排序不同,但傳感器隱身性的右尾巴長,但左尾巴短,表明在這兩種配置中,高傳感器隱身性可以明顯增加探測到的紅軍坦克的比例,但低傳感器隱身性并沒有明顯減少探測到的紅軍坦克的比例。這可以解釋為隱身性更強的邊境傳感器的生存能力更強,導致使用時間更長,有更多機會進行多次探測。

圖4:探測到的RF坦克比例的SHAP總結圖。

SHAP值側重于特征效應,而SHAP交互作用值則可以將特征效應分解為主效應和交互作用。與SHAP值一樣,SHAP交互值的全球影響也可以通過對單個SHAP交互值的絕對值進行總結。圖5和圖6分別列出了第一個檢測步驟和檢測到的紅軍坦克比例的這些總結。每個圖中的比例代表了特征交互作用的相對全球影響。在圖5中,對于固定的和隨機的傳感器位置,傳感器范圍和傳感器數量、傳感器隱蔽性和分類概率之間的相互作用影響最大。在圖6中,對于固定和隨機的傳感器位置,只有一種交互作用的全局影響遠遠大于其他交互作用:傳感器范圍和無人機數量的交互作用。基本的互動模式可以用依賴圖來進一步研究。為了說明這一點,圖7顯示了傳感器范圍和無人機數量的SHAP交互值。兩種傳感器配置的模式相似,并顯示了在可能的傳感器范圍內檢測到的紅軍坦克比例的明顯轉變。對于低于50的傳感器范圍,相對于沒有無人機,至少有一個無人機增加了檢測到的RF坦克的比例。然而,一旦傳感器范圍至少達到50,這種模式就會逆轉。這可以追溯到模擬中的行為:在另一個藍軍小隊或特工(即邊境傳感器或總部)檢測到至少一輛RF坦克之前,無人機不會參與。一旦邊境傳感器的探測范圍足夠大,無人機的額外探測能力對探測到的紅軍坦克比例的影響就會減少。

圖5:第一個探測步驟的SHAP交互值摘要

圖6:檢測到的RF坦克比例的SHAP交互作用值的匯總。

圖7:探測到的RF坦克比例的傳感器范圍和無人機數量之間的SHAP交互效應的依賴圖。

5 結論

本文的目的是評估SHAP在基于Agent的模擬中的數據養殖上的使用,以改善軍事行動場景的模擬后分析。雖然機器學習模型,如隨機森林,非常適合于大數據,但當分析的主要目標是獲得對系統的基本了解以告知決策者時,其黑箱性質構成了挑戰。SHAP是一種與模型無關的方法,用于解釋任何機器學習模型的預測結果。TreeExplainer的作者Lundberg等人(2020年)提出,結合許多局部解釋(即SHAP值)可以保留 "對模型的局部忠實性,同時仍然捕捉到全局模式,從而對模型的行為有更豐富、更準確的表述"。

提出了標準的特征重要性柱狀圖,使用基于排列組合的算法和SHAP值進行計算,強調這些圖對模型行為的洞察力有限。雖然這兩種計算特征重要性的方法在確定預測兩個感興趣的MOE的前一或兩個特征方面基本一致,但SHAP總結圖、交互值和依賴圖對隨機森林模型的行為提供了更多的了解。SHAP總結圖顯示了模型的預測對不同特征值的變化(例如,隨著傳感器范圍的縮小,預測的第一個探測步驟平穩增加),并確定了極端值的影響(例如,高傳感器的隱蔽性可以大大增加探測到的紅軍坦克的比例)。SHAP的交互值和依賴性圖提供了進一步的洞察力,以了解所發現的兩個最重要的特征對探測到的紅軍坦克比例的綜合影響。SHAP還成功地識別了固定和隨機傳感器位置之間的關鍵差異,證實了在確定傳感器組合時,位置,而不僅僅是傳感器的數量,是一個重要的考慮。使用SHAP可以驗證所發現的見解,因為模擬場景被有意抽象化,以盡量減少其復雜性并保持對戰場動態的直觀理解。這意味著可以根據對實施的直接了解或通過在MANA中交互運行模擬來查看Agent的行為來確認這些見解。

雖然SHAP在改進模擬后的分析方面表現出了顯著的前景,但它解釋了在養殖數據上訓練的機器學習模型的預測。因此,它不是對模擬場景的直接解釋,在機器學習模型性能不強的情況下,可能產生誤導性的結果。對機器學習模型的適當訓練和測試仍然是模擬后分析的關鍵步驟。盡管如此,這項研究仍然可以用來向決策者展示數據農業的潛力,以及它如何利用抽象的模擬實驗幫助人們對一個復雜的系統有基本的了解。這在軍事現代化項目的早期階段可能特別有幫助;研究結果可以用來確定參數或選項,以便進行更詳細的研究。未來的研究將考慮更復雜的場景和更廣泛的機器學習模型。

作者

LYNNE SERRé于2013年首次加入加拿大國防部,在軍事人員研究和分析總干事手下擔任國防科學家,專門從事軍事人員的建模和分析。2019年,她加入了加拿大國防研究與發展部作戰研究與分析中心,目前為位于渥太華的加拿大軍隊總部提供支持。她在加拿大滑鐵盧大學獲得了計算數學的碩士學位。她的電子郵件地址是:[email protected]

MAUDE AMYOT-BOURGEOIS是加拿大國防研究與發展部作戰研究與分析中心的初級國防科學家。自2019年以來,她與加拿大陸軍作戰研究和分析小組的同事合作進行各種作戰模擬研究。Maude Amyot-Bourgeois在加拿大渥太華大學獲得物理學碩士學位。她的電子郵件地址是:[email protected]

BRITTANY ASTLES自2021年1月起擔任加拿大國防研究與發展部作戰研究與分析中心的學生國防科學家。她之前的工作是利用機器學習研究全球恐怖襲擊趨勢和U型分形事件。她目前是地理學碩士的候選人,專業是數據科學。她的電子郵件是:[email protected]

付費5元查看完整內容

  • 本研究由美國陸軍研究實驗室贊助,根據合作協議號W911NF-21-2-0227完成。

?在日益復雜的軍事行動環境中,下一代兵棋推演平臺可以減少風險,降低作戰成本,并改善整體結果。基于具有多模態交互和可視化能力軟件平臺的新型人工智能(AI)兵棋推演方法,對于提供滿足當前和新興戰爭現實所需的決策靈活性和適應性至關重要。我們強調了未來作戰人-機器交互的三個發展領域:由人工智能引導的決策指導,高計算力下的決策過程,以及決策空間的真實呈現。這些領域的進展將使有效的人機協作決策得以發展,以滿足當今戰斗空間日益增長的規模和復雜性。

關鍵詞:決策、交互、兵棋推演、人工智能、增強/混合現實、可視化

1 引言

在傳統的兵棋推演中,指揮官利用一個共同的基于地圖的作戰地形,并在軍事決策過程(MDMP,方框1)中模擬各種因素的組合如何產生行動方案(COA)、可能的反擊行動、資源使用估計和預測結果(美國陸軍,1997年,2014年,2015年)。在幾天或幾周的時間里,MDMP過程導致了一套精煉的COAs,它對作戰環境做出了一定的假設,包括地形、天氣以及戰區資產的可用性和能力(即塑造支持主要作戰行動的活動)。

方框1. 軍事決策過程(MDMP)
MDMP是美國陸軍解決問題的理論方法,從接到任務開始,到生成作戰命令結束。MDMP被用作一種工具,幫助指揮人員審查眾多的友軍和敵軍的作戰行動。MDMP的7個步驟在規劃新任務、擴展行動和執行訓練演習所需的決策過程中灌輸徹底、清晰、合理的判斷、邏輯和專業知識(美陸軍,1997年,2015年)。
指揮官在接到任務后啟動了MDMP。在MDMP的第1步中,所有的工作人員和關鍵的任務參與者都被告知任務和待定的規劃要求,包括進行MDMP的可用時間量。確定進行任務分析所需的工具,并收集與任務和作戰區有關的文件。步驟2,執行任務分析,建立對任務的全面理解,包括關鍵的事實和假設,形成擬議的任務說明和任務分析簡報,為制定COA做準備。
MDMP的第3至第6步著重于制定COA以進行分析和比較。這些步驟包括:第3步,制定COA;第4步,COA分析(兵棋推演);第5步,COA比較;第6步,COA批準。COA是對一個已確定的問題的潛在解決方案。每個COA都要使用篩選標準來檢查其有效性,如在既定的時間框架、空間和資源限制內完成任務。COA的選擇過程通常涉及到兵棋推演,它試圖在考慮到友軍力量和敵人能力的情況下,將行動的順序流程可視化,同時考慮到行動區域內平民的影響和要求(美陸軍,2014)。戰術模擬(兵棋推演)方法的好處是突出了作戰行動的優勢和劣勢。這往往是一個反復的過程,對作戰行動方案進行評估,然后根據需要進行修改,直到出現一個或多個具有最高成功概率的作戰行動方案來完成任務目標。
在一個具體的行動方案得到指揮部的批準后,MDMP的最后一步是制作行動指令,這是一份給下屬和鄰近單位的指令,旨在協調所有參與任務的組織的活動。這一步驟涉及到所有受命令傳播影響的組織之間的積極合作,并建立起對局勢的共同理解。

盡管MDMP幫助指揮官了解作戰環境和考慮作戰方法,但這個過程有很多局限性,如時間密集、假設僵化、跨場景訓練的機會有限,以及將人工智能(AI)指導納入決策過程的機會很少。傳統上,一項任務的成功與指揮部執行MDMP的能力直接相關。然而,鑒于當今多域作戰(MDO)的復雜性增加(Feickert,2021年),有大量的任務指揮系統和流程,與行動相關的所有活動的整合和同步變得越來越困難,甚至到了人為無法完成的地步。由于MDMP的缺陷而導致的規劃專業知識的缺乏,可能會導致不同步和不協調的行動,從而最終導致士兵的生命損失。

MDMP中沒有具體描述戰斗空間的可視化能力,但它顯然在決策過程中發揮著重要作用。最近,集成了先進可視化能力的新系統和新技術已經被開發出來,它們可以提高態勢感知,從而增強決策過程。美陸軍的例子包括Nett Warrior(Gilmore,2015),它使下馬戰士能夠直觀地看到附近的友軍和敵軍,同時根據當地的地形協同規劃戰術任務。盡管這項技術將無線電和數字地圖擴展到了下馬戰士,但它缺乏一個底層的人工智能引擎來提供決策幫助。戰斗空間可視化和交互平臺(BVI,前身為增強現實沙盤,ARES)是陸軍技術的另一個例子,它能夠為任務規劃提供分布式協作,具有從任意視角和廣泛選擇設備的共同作戰畫面的二維和三維可視化能力(Su等人,2021)。BVI架構的制定是為了拉入外部計算服務,如分析管道、模型和人工智能引擎。美陸軍研究實驗室正在努力將這些類型的服務納入BVI,包括用于加強決策支持的人工智能。

目前,MDMP并沒有將人工智能指導納入整體任務規劃方法中。美陸軍的自動規劃框架(APF)(Bailey,2017)開始通過將自主技術插入MDMP工作流程來解決人工智能輔助決策問題。指揮人員可以通過APF的數字規劃呈現、規劃創建和規劃監控工具,在任務規劃和COA開發期間獲得背景援助。任務執行和估計能力通過監測任務的規劃和實際進展,為改進決策跟蹤和支持活動提供自動協助。盡管APF為MDMP引入了基本的自動化水平,但它缺乏Nett Warrior和BVI所提供的先進的可視化和用戶互動能力。

提供地面部隊自動化和用戶可視化能力的是美陸軍最知名的兵棋推演平臺--半自動化部隊(OneSAF),為計算機生成的地面部隊提供建模和模擬能力(PEO_STRI, 2022)。OneSAF提供了半自動和全自動的軍事實體(即士兵、坦克、直升機和綜合單位)的建模,在類似真實世界的戰斗空間中以不同的保真度來支持特定的應用和場景。OneSAF主要用于訓練,并與目前的任務指揮系統具有互操作性。它可以使用多分辨率的地形和詳細的實體相關數據庫來模擬廣泛的作戰環境。然而,OneSAF對地形和實體系統的高保真建模的優勢使得它的設置和運行成本很高。它受到老化系統的限制,而且眾所周知,士兵需要大量的培訓來學習如何操作模擬,使用起來很困難(Ballanco,2019)。OneSAF的復雜功能并不適合開發人工智能能力,以實現快速和敏捷的戰士-機器決策。

除了MDMP和上面提到的陸軍平臺外,最近將人工智能納入決策過程的工作包括一些方法(Goecks等人,2021a),在模擬人類決策過程方面取得了一些成功。一般來說,人工智能在決策變量有限的問題上取得了一些成功,如資源分配(Surdu等人,1999)、飛行模擬器(Drubin,2020)和更簡單的場景。正在進行的挑戰包括需要提高人工智能的能力,以解決有多個行為者、不完整和可能沖突的信息、不斷變化的單位行動和環境屬性的復雜決策,以及需要將這些決策的后果在許多空間和時間尺度和領域內可視化。

以下各節描述了對MDMP的潛在改進。"未來軍事決策過程所需的進步"一節概述了支持MDO決策的三個研究領域,并以圖表形式描述了這些研究領域與軍事理論決策方法之間的關系。"未來軍事決策過程所需的進步 "一節中的小節對每個研究領域進行了更深入的討論。"展望推進人-人工智能團隊決策的交互技術 "一節概述了未來的作戰人員-機器接口(WMI)的發展方向,重點是與決策有關的人-人工智能團隊的跨學科研究。

2 未來軍事決策過程所需的進步

軍事決策過程在支持MDO復雜決策方面的局限性,突出了在三個研究領域的改進需要。首先,有必要將人工智能產生的指導和輔助決策支持納入MDMP。這既包括進一步開發和整合人工智能到戰斗空間決策規劃,也包括進一步改善人工智能決策過程的可解釋性和透明度(Chen等人,2018)。第二,有必要在戰略層面以及戰術邊緣,盡可能地將決策分析與高性能計算(HPC)的力量結合起來。這將能夠利用HPC系統的力量來支持建模、分析和計算時間,同時整合和同步來自所有戰區領域的信息。最后,有必要利用先進的可視化技術,如混合現實技術,對決策空間進行更準確和互動表述。不是簡單地在一個固定的時間尺度上顯示地形的二維渲染,而是需要可視化不同領域的決策是如何相互作用的,并利用混合現實技術來提高理解的吞吐量,并產生平面顯示不可能的洞察力。

除了MDMP之外,其他更廣泛適用的支持戰斗性問題解決的軍事理論包括:DOTMLPF[例如,學說、組織、訓練、物資、領導、人員和設施;(美陸軍,2018年)],這是一個確定差距并為當前和未來作戰要求提出設計解決方案的框架;以及METT-TC[例如,任務、敵人、地形和天氣、部隊、可用時間和民事考慮;(美陸軍,2019年)],這是一個結構化框架,用于捕捉任務相關因素的狀態,以便在軍事行動期間進行共享評估。這些理論定義了MDO戰場的信息背景,構成了應用于上述三個研究領域的軍事決策的核心基礎。如圖1所示,在為人類和人工智能指揮開發復雜軍事決策空間的新表述時,研究進展和MDO相關理論相互借鑒、相互啟發、相互加強(美陸軍,2010)。

圖1. 新型作戰人員-機器交互(WMIs)和人工智能輔助決策所需的三個研究發展領域,以支持和加強基本的MDO理論[右下圖來源:Lebsack(2021)]。

2.1 人工智能導向的決策指導

需要新的人工智能支持的WMI,以利用人工智能決策方面正在取得的進展,并為復雜的適應性決策的人工智能學習作出貢獻。在簡化的戰斗空間中測試人工智能決策輔助工具是開發過程中重要的第一步,也是將人工智能納入更成熟的戰斗空間平臺(即BVI、OneSAF)的前奏。開發用于決策輔助實驗的人工智能測試平臺可以在MDO中產生能力越來越強的潛在COA建議。圖2顯示了陸軍開發的兩個人工智能測試平臺的例子。

圖2. 兩個ARL人工智能測試平臺的例子。左邊:ARL Battlespace(Hare等人,2021)( //github.com/USArmyResearchLab/ARL_Battlespace )。右邊:ARL的Simple Yeho測試平臺。圖片由C. Hung制作。

人工智能測試平臺能夠開發出匯集所有領域信息的AI,并計算出人類和AI智能體的風險和預期回報。圖2的左側顯示了ARL戰斗空間測試平臺(Hare等人,2021年),它是從頭開始開發復雜決策的新型人工智能的理想場所。它對戰斗空間的抽象強調了軍隊相關場景下的核心推理原則,在這種情況下,用蜜罐進行網絡欺騙。較小的網格空間使人工智能的學習和發展能夠集中在不確定性下的復雜推理,有多個友好和敵對的agent。圖2的右側顯示了ARL的Simple Yeho測試平臺,它提供了將人工智能開發與更多真實世界場景中的默契推理結合起來的能力,有多個基于地形的海拔高度、視線范圍、障礙物、樹葉(隱蔽)、道路和城市區域。紅色陰影和黑色線條表示任務的起點和終點、左右邊界以及人工智能建議的路線。這種額外的真實性使其能夠與MDO理論相結合,包括DOTMLPF和METT-TC,并使人工智能與自然的、機會主義的士兵行為共同發展。這兩個人工智能測試平臺都可以擴展為傳統和沉浸式混合現實WMI開發平臺。

使用漸進式和可擴展的人工智能測試平臺,可以調查現有人工智能的幾個基本限制,特別是對于具有不確定性的復雜和適應性決策,以及人類和AI智能體的協作和對抗。對多智能體的協作和對抗性決策進行建模可能特別復雜,因為其遞歸性質,其他智能體是模型的一部分(Goldman,1973;Grüning和Krueger,2021),需要對決策特征、個性化的價值、風險規避、記憶和注意力進行動態和不斷發展的估計。這些具有高度不確定性、復雜性和動態性的情況是人類擅長的領域,適當設計的交互界面和人工智能測試平臺的人機協作可以提供加速和更有效的決策。對于有效的團隊合作,新穎的WMI應該幫助作戰人員篩選復雜的信息,并幫助人工智能發現決策的隱含規則。下面,我們提供了關于人機協作如何有效的案例。

多域兵棋推演中需要的復雜決策是開發有效人工智能決策輔助工具的直接挑戰。最近人工智能在圍棋、國際象棋、Minecraft和大富翁等游戲中的成功(Silver等人,2017;Goecks等人,2021b;Haliem等人,2021)是基于對世界現有狀態有完整了解的游戲(即 "開放 "游戲),而兵棋推演平臺通常包括關于作戰環境的不完整(如星際爭霸)、不確定或欺騙性信息(Vinyals等人,2019)。不確定性也可能來自變化的物理學或其他環境規則,正如在《憤怒的小鳥》中所探索的那樣(Gamage等人,2021)。由于世界狀態、不同行動者的狀態以及所采取的行動不確定性,知識的缺乏使得人工智能agent難以計算未來行動的風險回報情況(Cassenti和Kaplan,2021)。不確定性也限制了人工智能估計其他行為者的風險回報概況的能力,而這是計算有效的博弈論策略所需要的。人工智能被可能的最優和近似最優選擇的廣度所淹沒(Lavine,2019),即由于信息有限而選擇錯誤的選項,這種情況并不罕見,因為人類在制定有效探索隱藏信息的策略時,采用啟發式方法進行有效的選擇和預測(Gardner,2019)。為了幫助發展人工智能的隱性知識和探索能力,新型的WMI需要有效地解釋和展示決策景觀,以使作戰人員能夠快速和自然地瀏覽可能的選擇,同時使人工智能能夠在不施加認知負擔的情況下從人類的決策中機會主義地學習(Lance等人,2020)。這種機會主義學習可以包括:例如,凝視跟蹤,以捕捉吸引人類興趣和意圖的視覺區域和未標記的目標。它們還可以包括建立在自然的士兵選擇行為基礎上的行動者批評方法,以改善人工智能對人類專家在不確定、不完全信息和欺騙的情況下如何優先考慮某些選擇的學習,這取決于任務相關的背景。

開發人工智能的WMI的另一個基本挑戰是如何有效地整合和顯示MDO中所有五個領域的信息,特別是空間和網絡,因為這些領域的信息具有不同的時空尺度(Gil等人,2018)。對于網絡,決策的規模和速度可能比人類處理和理解的能力更快,需要人類的輸入來指導半自動化的決策,以及實施進攻和防御性欺騙策略的人工智能。WMI需要能夠以這樣的方式顯示決策圖景,即可以解釋一小部分最優和接近最優的決策策略(例如,圖3中的決策樹)。這應該包括對關鍵agent在不確定情況下的未來狀態和風險回報情況的估計(Hare等人,2020),以使有效的博弈論決策能夠被共同開發和相互理解。

圖3. 在頂部,是BVI網絡戰術規劃器應用程序中友軍與敵軍戰爭場景的三維視圖。三維視圖提供了一個比二維視圖更真實的決策視角,例如,顯示友軍(藍色)和敵軍(紅色)機載預警系統(AEWs)和周圍地形的海拔。這使得快速審查可能的視線和相對于周圍地形的感應。下面是人工智能的導航決策樹,為人工智能計算的幾個關鍵選擇的風險/回報概況以及它們如何映射到地形上提供透明度。這種抽象的決策空間還可以整合非空間決策,例如網絡欺騙。虛線表示與友方AEW的通信聯系和對敵方AEW的可能干擾。圖片由C. Hung制作。

這些挑戰為有效的WMIs設計提供了參考。也就是說,我們需要有能力從不同的來源(包括從其他國家的決策輔助工具)提取信息,以及一個能夠承載整合這些信息的計算能力的架構,同時還要處理基礎的人工智能計算(用于學習和部署)。我們還需要共同開發一個界面和算法設計,以適時地利用人類和人工智能agent的優勢并減少其局限性。

2.2 高計算能力下的決策過程

在復雜的決策過程中,需要大量的計算能力來處理和記錄所有組件、實體和狀態空間。從積累的動態狀態空間的數據集中建立過去、現在和預測模型,需要利用HPC資源來產生分析性的見解,并在決策背景下創建有用的表述。

實施HPC分析工作流程的一種方法是使用持久性服務框架(PSF)。PSF是一個最近可用的分布式虛擬化解決方案,它可以通過一個基于網絡的前端實現對HPC服務的非傳統訪問,而不像傳統的HPC環境,計算節點在特定的時間段內以批處理模式分配給用戶。此外,PSF提供對數據、數據庫、容器化工具集和其他托管平臺的分布式連續訪問(Su等人,2021)。

在一個PSF方法的例子中,一個模擬引擎連接到PSF,用于記錄人類和人工智能做出的所有決定。這允許分析在任務規劃和COA開發過程中發生的決策行為,以及識別決策模式和戰略,以開發競爭性和現實的兵棋推演場景。一個戰斗空間可視化平臺可以托管在PSF上,并使用消息傳遞協議來更新所有連接的設備接口。來自模擬引擎的狀態信息可用于生成戰斗空間和參與作戰單位的圖形表示。

使用PSF方法并利用HPC資源,可以實施人工智能輔助決策機制,利用大數據攝取和分析,同時可供地理分布的用戶用于協作決策工作和 "永遠在線 "的個性化培訓和紅色團隊。連接到PSF托管服務器的各種混合現實顯示模式可以支持一系列作戰場景,從戰略層面的指揮和控制到作戰邊緣的更多移動戰術使用。

2.3 決策空間的真實呈現

用圖形表示各級行動的軍事決策戰略需要新的可視化方法,這些方法可以應用于以規則變化、認知狀態、不確定性以及個人偏見和啟發式方法為特征的動態環境(Dennison等人,2020;Hung等人,2020;Raglin等人,2020)。戰斗空間的視覺表現應該在技術上盡可能準確和逼真,但又保持在人類可以理解和解釋的認知水平(Kase等人,2020;Larkin等人,2020;Hung等人,2021)。融合了混合現實技術的先進可視化方法有可能更好地表現多領域戰爭的變化特征及其不斷變化的威脅和動態環境。隨著最近混合現實可視化設備的技術進步,成本降低,硬件的可靠性和實用性顯著提高,混合二維和三維可視化方法現在已經成為可能。

由多個二維顯示器組成的混合現實方法增強了更先進的三維可視化能力,可以為指揮人員提供理解復雜的兵棋推演狀態空間所需的洞察力(Su等人,2021)。當需要一個共享的戰斗空間表示時,可以通過在不同的可視化模式上實現多個協調的視圖來實現協作的戰略規劃模式,以根據分布式指揮人員的輸入進行互動更新。

BVI(Garneau等人,2018)平臺表示地理空間地形信息和地圖圖像,允許指揮人員建立和修改戰術任務規劃和COA。作為一個數據服務器,BVI將地形和作戰數據分發給支持多種可視化模式的客戶端應用程序,包括頭戴式顯示器設備、基于網絡的界面、移動安卓平板設備和混合現實設備(例如,HoloLens 2、Oculus Quest)。

例如,圖3(頂部)顯示了位于加利福尼亞州圣貝納迪諾縣歐文堡國家訓練中心的高分辨率地形上的友軍與敵軍的兵棋推演場景(Wikipedia, 2021)。與MDMP期間經常使用的傳統2D地圖顯示相比,戰斗空間的3D視圖可以從多個觀察角度提供更豐富的用戶體驗。三維視圖,在BVI的網絡戰術計劃器(WTP)中,將地形和人工特征的空間信息以及由MIL-STD 2525C符號描繪的單位位置可視化(美國防部,2014)。可以想象,地理空間視角,如BVI提供的視角,支持決策者對動態戰斗空間環境的理解。與可導航的人工智能增強的決策空間(圖3,底部)搭配,組合的視角可以使人們更好地理解視覺空間依賴性、影響和因果關系、估計的風險和價值、不確定性以及復雜決策的欺騙性。將這種以地理空間和決策為中心的視角與人工智能相結合,可以提供必要的廣度,以協調物理行動與網絡和其他非空間領域的行動,跨越多個時間尺度,并具有快速適應變化的任務目標的靈活性。

3 人-人工智能團隊決策的交互技術展望

人工智能和人-人工智能團隊的快速發展需要WMI同步發展。隨著新型人工智能對有價值的COA產生更好的預測,并能更好地處理復雜的決策,它們也必須利用人類的專業知識,學習如何處理具有高度不確定性、欺騙、隱性知識和博弈論的決策。相反,人工智能的推理必須既抽象又能與兵棋推演環境相聯系,以實現透明和信任,同時又不造成過度的認知負擔。基于三維混合現實的WMI可以利用和增強人類固有的三維認知和預測能力(Welchman等人,2005;Kamitani和Tong,2006;Kim等人,2014;Boyce等人,2019;Krokos等人,2019),如果設計得當,其交互將感覺自然,同時擴大顯示多個領域的信息的能力,同時使AI能夠適時地從用戶的決策中學習。

我們強調了三個關鍵的發展領域,即人工智能引導的決策指導,支持這種指導的計算基礎設施,以及決策透明度的混合現實表現的發展。這些領域的進步需要跨越許多不同學科的專業知識。新的人工智能發展需要融合神經科學、心理學和數學的思想,以克服復雜決策中長期存在的問題的瓶頸。這包括跨時間尺度的學習和變化環境下的災難性遺忘,以及更具體的兵棋推演問題,如具有不確定性、欺騙和博弈論的多Agent決策。計算基礎設施也需要發展,因為計算能力和數據框架對于在戰術邊緣產生人-人工智能團隊的共同操作圖來說都是必不可少的。為了有效地開發,應該通過一個共同的框架來抽象出專有的限制和軟件的依賴性,并為使用和故障排除提供清晰的文檔,以使學術界、政府和工業界更好地專注于解決人與人工智能的合作問題。這個通用框架應該包括有效的信息傳遞,同時提供靈活性和適應性,以滿足人工智能開發和人類用戶在訓練和實際使用環境中的需求。最后,交互技術的開發本身需要跨學科的協同專業技術。一個基礎性的問題是如何壓縮信息使之被用戶有效地理解,以及如何最好地利用用戶的互動來進行機會主義學習。人類的大腦并不處理所有的感官信息,而是對世界進行預測和假設,以便在信息不完整的環境下節約計算。一個有效的WMI應該同時預測潛在的決策結果以及個人用戶的期望和假設。此外,人工智能決策輔助工具必須估計用戶的默契,使其能夠提供最相關的信息和最有希望的選擇,這些信息來自整個作戰領域。

結論

信息作戰和指揮與控制(C2)是美國陸軍可以向盟友和伙伴提供的兩種能力。在未來的作戰環境中,不僅要為動能作戰做準備,而且要為混合作戰和以信息為重點的戰爭做準備。這需要在復雜和默契推理的人工智能能力方面取得進展,在能夠提供持續訓練、分布式混合決策和大數據分析系統方面取得進展,以及在人與人工智能協作決策和機會主義學習方面取得進展,以實現人工智能的持續進步和人與人工智能的共同適應。這些進展中的每一項都需要跨學科的計劃性努力,以克服復雜的技術挑戰,創造新的決策原則、理論和理論方法,包括持續開發綜合測試平臺和技術,以實現政府、學術界和工業界的合作和協同發展。

付費5元查看完整內容

當前的海軍作戰要求水手們根據動態作戰環境中的不確定態勢信息做出時間緊迫和高風險的決策。最近的悲慘事件導致了不必要的傷亡,海軍行動中涉及決策復雜性,并特別突出了 OODA 循環(觀察、定向、決策和評估)中的挑戰。涉及使用武器系統的殺傷鏈決策是 OODA 循環中一個特別緊張的類別——具有難以確定的意外威脅、縮短的決策反應時間和致命的后果。有效的殺傷鏈需要正確設置和使用船上傳感器;未知接觸者的識別和分類;基于運動學和智能的接觸意圖分析;環境意識;以及決策分析和資源選擇。

該項目探索了使用自動化和人工智能 (AI) 來改進海軍殺傷鏈決策。該團隊研究了海軍殺傷鏈功能,并為每個功能制定了特定的評估標準,以確定特定 AI 方法的功效。該團隊確定并研究了 AI 方法,并應用評估標準將特定的 AI 方法映射到特定的殺傷鏈功能

圖:利用人工智能改進海軍殺傷鏈的作戰概念

總結

當前的海軍行動通常是快節奏的、關鍵的,并且需要做出高風險的決策,這些決策有時基于非常動態的戰區中的不確定信息。許多例子強調了提高決策效率的必要性以及減輕觀察團隊負擔的必要性。缺乏上述情況的例子包括 2017 年的菲茨杰拉德號航空母艦 (DDG 62) 和 MV ACX Crystal相撞,以及 2009 年皇家港口號航空母艦 (CG 73) 的擱淺。一些根本原因是相關人員缺乏經驗、疲勞和壓力.

上述事故展示了軍事行動的難度,并展示了 OODA(觀察、定向、決策和評估)循環中的挑戰(Jones 等人,2020 年)。人為錯誤、人的認知限制和海軍作戰固有的決策復雜性導致了 OODA 循環中的挑戰,更具體地說,是殺傷鏈過程中的挑戰。

現代戰斗空間由來自常規陸地、空中和海洋等多個領域以及來自太空和網絡空間的大量數據組成。決策者需要考慮許多因素,包括交戰規則 (ROE)、要使用的武器、傳感器和意圖評估。發現、修復、跟蹤、瞄準、參與、評估 (F2T2EA) 殺傷鏈模型緩解了該過程的一些困難(參謀長聯席會議,2013 年)。人工智能 (AI) 和機器學習 (ML) 可以通過分析備選方案和使用評估標準將 AI 方法映射到殺傷鏈功能,從而幫助海軍在戰術領域做出殺傷鏈決策。這是在本報告的五個章節中分三個階段完成的。

本報告利用了數百個資源,主要利用了美海軍研究生院 AI-OODA 團隊在其 Capstone 報告(2020 年)中進行的先前研究,“利用人工智能 (AI) 進行空中和導彈防御 (AMD):以結果為導向的決策援助。”他們將他們的工作與 John Boyd 的觀察、定向、決定和行動決策框架相結合。作為他們分析的初步步驟,AI-OODA 團隊將特定的 OODA 功能明確且緊密地耦合到特定的 F2T2EA 功能。然而,本報告斷言 OODA 循環是一個決策循環,它嵌套在殺傷鏈的每個功能中,而不是在高壓力或低壓力情況下專門映射到一個或多個殺傷鏈功能。團隊基于 F2T2EA 模型開發了一組 28 個殺傷鏈功能。

在制定將 AI 方法映射到殺傷鏈的評估標準時,很難確定一個好的決策,這對于決策評估至關重要。在評估決策時,必須考慮選擇行動時的知識意識狀態以及解釋能力。使用了幾種對決策進行評分的方法,從定義和優先考慮感興趣的“武器-目標”到制定評分標準和報告評估結果,以供其他人審查。

目前,人工智能的狀態非常廣泛,必須對其進行解釋,以了解人工智能對殺傷鏈中功能的適用性。本報告討論了所選 AI 方法的高級概述,并突出顯示了部分最流行的方法。首先,沒有普遍接受的定義,這很難定義人工智能。其次,人工智能與機器學習 (ML) 存在差異。 ML 允許在準確性和可預測性方面取得增量收益; AI 接收數據并通過算法提供輸出。人工智能的歷史從 1940 年代艾倫·圖靈 (Alan Turing) 的加密機器到 1980 年代美國政府在戰略計算計劃中的使用,再到今天在聯合人工智能中心 (JAIC) 中的人工智能戰略五個支柱,從領先的人工智能人力到安全和倫理。美國國防高級研究計劃局 (DARPA) 在 3-wave 框架中描述了 AI 的發展方向,分為手工知識 (Wave 1)、統計學習 (Wave 2) 和上下文推理 (Wave 3) 在 1-4 個維度內情報參數的屬性(Launchbury 2017)。這些屬性包括感知、推理、抽象和學習。

人工智能涉及可以根據輸入值預測結果的監督學習。有幾種使用監督學習進行學習的技術。包括線性回歸和分類。此外,許多數值方法可以分析發生的學習有效性,例如 F-score 和 Accuracy score。人工智能還可以使用無監督學習,它使用算法來發現未標記數據集中的數據模式或分組。在分析未知(y)響應以揭示標記(x)數據中的模式時,無監督學習是有益的。數據分析界的一個著名例子是鳶尾花(Iris flower)數據集。僅使用標記的數據,可以看到響應聚集在一起,并且可以確定響應中存在模式(花的種類)。無監督學習的方法包括聚類和 K-means,但還有其他方法。強化學習有一個代理能夠接收來自環境的反饋并理解基本目標。此外,正如 Sutton 和 Barto 在(2018 年)中解釋的那樣,探索和開發之間存在權衡。最后,生成對抗網絡 (GAN) 利用無監督學習和強化學習,通常用于神經網絡 (NN)。神經網絡是機器學習算法的極好來源,它有大量的輸入,而這些輸入又會產生大量的計算。 NN 非常適合用于模擬、自然語言處理、博弈論和計算機視覺。 NN 只是一種將輸入映射到輸出的簡單方法,可以在此過程中進行學習。然而,NN 可以被描述為一種“黑盒”學習技術,因為很難解釋正在發生的事情,并且通常需要一種可解釋的 AI (XAI) 技術。 XAI 的三個主要組成部分是可解釋模型、解釋界面和解釋心理學(Gunning 2019)。數據安全必須與“大數據”一起考慮,“大數據”是指非結構化、復雜和大型數據集,具有五個 v 特征:數量、速度(數據量隨時間變化的增加)、多樣性、真實性和價值。其他理論包括決策理論、模糊邏輯和效用函數

使用上述文獻綜述,該團隊開發了一個框架,用于將 AI/ML 映射到 AMD(空中導彈防御)殺傷鏈。采取了四個步驟:1) 建立模型框架,2) 確定決策點,3) 應用 AI/ML 方法,以及 4) 分析結果。該團隊確定了以下用于殺傷鏈映射分析的 AI/ML 方法:線性回歸、邏輯回歸、聚類、關聯、隨機森林、神經網絡、GAN 和樸素貝葉斯。評估標準被稱為“決策點”并提出四個問題:(1)所需輸出的類型是什么,(2)所需的學習類型是什么,(3)可解釋性(XAI)是什么水平需要,以及 (4) 需要多少個預測變量?該團隊通過基于一組決策點和評分過程評估每個殺傷鏈功能的每種方法來執行映射。對于被認為非常適合某項任務的方法,得分為+1,如果該方法適合但次優,則為0,如果該方法不適合該任務,則為–1。

該團隊進行了映射分析,根據與殺傷鏈的 28 個功能中的每一個功能相關的評估標準(決策點)分析 AI 方法。該團隊使用評分方法來確定每個殺傷鏈功能的最佳整體 AI/ML 分數。團隊的映射顯示為 0。

該團隊的 AI/ML 映射到殺傷鏈功能為國防部和海軍提供了兩個關鍵好處。首先,映射本身是設計和開發支持殺傷鏈決策的人工智能戰術決策輔助工具的重要起點和基礎。其次,該團隊將 AI 方法映射到殺傷鏈的分析過程可用于了解 AI 在許多其他軍事和非軍事領域的應用。識別適當的人工智能方法、制定評估標準和評分過程以及制定過程功能以進行分析映射的過程對于支持許多不同人工智能系統的工程具有深遠的潛力。

表1:AI/ML方法到殺傷鏈的映射

付費5元查看完整內容

【引 言】

軍事領導人利用戰場情報和環境信息及時做出戰略和戰術決策,以推進他們的作戰目標,同時試圖否認對手的行動。基于計算機的兵棋推演模擬程序對戰場空間事件進行建模,以幫助決策制定,因此領導者可以從眾多選項中選擇一個更優化的選項,以有效地完成目標。

戰爭是一個充滿不確定性的領域,戰爭中的決策因素籠罩在各種不確定性的迷霧之中。因此,戰爭迷霧是軍事行動參與者所經歷的態勢感知的不確定性。其目標是定義霧的存在位置,并允許分析師在AFSIM等虛擬兵棋推演框架中操縱霧效果。

圖1. 信息環境:該圖展示了應用信息相關能力來實現影響力

這項研究探討了戰爭場景中不確定性的領域,以尋找霧源,這可能會阻礙決策過程,這些過程記錄在三篇提交的期刊文章中。

文章[1] “使用并行搜索算法導航敵方競爭區域(Navigating an Enemy Contested Area with a Parallel Search Algorithm)" 通過在地圖上找到敵方單位位置的配置來探索霧,這會導致并行搜索算法的最大加速。算法優于并行算法,這些結果表明敵方位置的霧可用于破壞搜索和任務分配過程。

文章[2] “AFSIM 中的戰爭霧效果建模(Modeling Fog of War Eects in AFSIM)”[2] 創建了霧識別和操作方法 (FIMM)將霧引入傳感器和通信,并開發霧分析工具 (FAT) 以將 FIMM 實施到用于驗證的高級仿真、集成和建模框架 (AFSIM)。傳感器和通信有助于指揮官感知戰場上的敵軍。霧會扭曲指揮官對形勢的感知,這會扭曲決策過程并導致任務失敗。

文章[3] “將霧分析工具應用于AFSIM 多域 CLASS 場景(Applying Fog Analysis Tool to AFSIM Multi-Domain CLASS scenarios)”利用 FAT 研究霧效應在多個作戰域中的影響,并使用趨勢來支持 FAT 在多域操作中有效且有用的想法FAT 在多個領域的有效性鞏固了這樣一種觀點,即識別和操縱傳感器和通信中的霧對于為軍事模擬分析人員提供選擇以改善兵棋推演中的決策是有效的。

【問題與動機】

軍事領導人必須考慮跨多個作戰領域的大量信息,以便及時做出決策并推進任務。模擬模型試圖真實地模擬戰爭場景以分析行動方案并選擇最佳路徑。在戰爭模擬中提供用于查看不確定性級別或霧的選項的方法可以進一步提高戰爭模擬的真實性。該方法需要對霧源的一般定義以及如何操縱源進行模擬分析。多域分析方法的實現驗證了該方法在查看對未來場景的影響方面的有效性。

問題源于需要為多域作戰的軍事領導人創建決策輔助工具。美國空軍正在研究一種直觀的傳感網格概念,該概念使用來自多個平臺的融合傳感器數據為決策者提供有關競爭環境的信息。傳感網格為戰略和戰術層面的領導者提供了獲得和保持對抗對手的決策優勢。網格假設傳感器收集信息并通過通信鏈路將其傳輸到集中處理實體。領導人希望盡可能準確地描述環境,因此霧源的識別以及霧如何影響決策過程允許軍事分析人員在處理信息并將數據發送給決策者時考慮霧。

決策代理與傳感網格概念相似,但代理提供決策能力,而不是為人類決策者提供決策輔助。在基于環境信息收集、處理和形成決策時,決策代理可以將霧合并到行動過程 (COA) 分析中。在 COA 中考慮霧可能會改變哪個選項被認為是最佳的。對多個域的霧的識別和操作允許一種更現實的方法來形成決策和決策輔助。

【研究路線圖】

以下路線圖提供了總體研究目標

1. 識別兵棋推演場景中影響指揮官決策過程的不確定性來源

2. 創建一種方法來識別和操縱兵棋推演中的不確定性,使用傳感器進行數據收集和數據傳輸通信

3. 為現有兵棋推演模擬開發工具,以實施該方法并驗證其影響

4. 分析多域場景,以驗證該工具在擾亂所有作戰域的決策過程中的有效性

該路線圖側重于霧效應的識別和處理。并行搜索文章側重于尋找兵棋推演場景中的不確定性來源。介紹FIMM和FAT的論文針對的是第二項和第三項。上一篇文章提供了支持第四項的結果。本文介紹的每篇文章都以期刊格式顯示。

【結 論】

當決策者沒有關于環境的完整信息時,兵棋推演中的戰爭迷霧就會出現。霧源于對敵人、敵人意圖和敵軍缺乏了解。霧也可能來自自然環境和友軍的行為。例如,一個在整個地圖上搜索目標的單元可能在多次搜索后變得筋疲力盡。搜索目標的多個單元可能會劃分搜索時間。霧識別和操縱方法(FIMM)提供了一種在與傳感器和通信鏈路相關的兵棋推演中操縱霧效應的新方法。霧分析工具 (FAT) 在高級模擬、集成和建模框架 (AFSIM) 中提供了 FIMM 的實現。將霧引入傳感器和通信鏈路會影響指揮官從信息收集平臺接收的信息,并將其傳播到效應生成平臺。霧的引入和操縱可能會導致指揮官失敗。較高水平的霧效應往往會導致較高的故障率。在分析各種多域場景時也會出現這種趨勢。

【未來工作】

與順序算法相比,搜索算法的測試套件將收集更多結果來分析地圖配置如何影響并行算法的加速。測試套件需要地圖生成器來隨機排列地圖上的圖塊,同時保持假設有序。

FAT 是 AFSIM 分析人員為模擬運行更改不同級別的霧的便捷工具。但是,FAT 的使用是高度手動的。該過程可以轉換為測試套件,其中該工具自動采用 AFSIM 場景并找到傳感器對象和通信對象,以不同的霧級別和運行次數模擬每個對象,并提供有關成功/失敗的統計報告率。該測試套件可以消除尋找使用 FAT 的標準化方法的需要,并且可以對每個場景進行唯一處理。

將 FAT 集成到 Warlock 應用程序將允許實時分析霧效果。分析師將能夠實時更改霧效果值并查看它如何影響場景的成功。具有實時分析的 FAT 可用于細粒度的戰術策略測試。

付費5元查看完整內容
北京阿比特科技有限公司