本文考慮使用衛星上的傳感器將觀察結果分配到一個離散網格化地理區域的情況。重要的是,至少要在所有網格單元瀏覽一次,以看到整個行動區域;因此,我們希望獲得最大的覆蓋范圍。其次,我們希望通過任何額外的觀察來重新審視高優先級的網格單元。傳感器產生一個二維帶,在每次經過地理區域時,它可以尋找網格單元,我們將其稱為 "掃描"。我們用來觀察網格單元的分辨率決定了觀察的有效性。我們可以選擇使用高分辨率,使我們在更細的細節上有更少的觀察,或者使用低分辨率,使我們在粗略的細節上有更多的觀察。這使我們可以選擇準確地觀察少數地方,或不準確地觀察許多地方。
這篇論文是在與作為五角大樓聯合參謀部一部分的J8局的密切協作下產生和發展的。J8在部隊結構、資源和評估方面向參謀長聯席會議主席(CJCS)提供建議。這個問題已被提煉為一般的情報、監視和偵察(ISR)問題,但延伸到J8在名為STORM的戰區級戰役模型中遇到的真正問題。STORM使用一種啟發式方法來確定哪些網格單元接受觀察。STORM的啟發式方法往往會產生不理想的結果,即大面積的興趣區域被忽略。我們希望改進搜索資產能夠執行的網格單元覆蓋率。
在這篇論文中,我們制定了一個新穎的、大規模的、混合整數的優化模型,以超越STORM的啟發式搜索ISR的表現。該模型被稱為SOM,使用間隙指數對自上次查看每個網格單元以來的掃描次數進行懲罰。我們希望避免收集這些懲罰,這促使我們重新訪問網格單元。目標函數最小化了這種產生間隙的懲罰。我們使用幾個約束條件來維護、重置和跟蹤間隙計數器,一個訪問所有網格單元的軟約束條件,以及一個對網格單元施加最小分辨率的約束條件。SOM的一個獨特的特點是它是事件驅動的,在戰斗空間上掠過,不以時間為基礎。SOM使用實際的STORM數據,有1300多行代碼,包括在R中收集數據,在Pyomo中處理和實現模型。
我們在STORM中未分類的Punic21場景上實現了這個模型。在這個場景中,有兩個戰斗人員。紅方和藍方。我們可以從任何一個角度來實現SOM,每個戰斗人員都產生他們自己的變量和約束。為了說明SOM的大規模,在Punic21中,紅方搜索藍方的網格單元,并在92個區域內進行優化,這相當于48小時的時間,我們有超過2500萬個變量和1500萬個約束。
案例研究以計算和操作結果為中心。計算結果表明,我們可以通過在國際商業機器ILOG CPLEX Optimization Studio(CPLEX)的算法中實施不同的選項來減少運行時間。最重要的選項是提供一個熱啟動,使用沒有外觀發生的最壞可能的解決方案。例如,當我們用默認的CPLEX選項在一個有超過200萬個變量和100萬個約束條件的單處理器上運行SOM時,它需要超過1400分鐘,而且沒有產生一個解決方案。我們確定了定制的CPLEX選項,減少了運行時間,并在不到5分鐘內解決了這個實例。這使我們能夠將問題的規模增加到超過2200萬個變量和1100萬個約束條件,并在不到50分鐘的時間內實現11%的優化差距。業務案例研究結果顯示,與STORM相比,SOM提供了平均54.6%和中位數22.8%的覆蓋率。額外的選項,是SOM原生的,在STORM中不具備的,確保SOM將超過STORM,快速達到最大的覆蓋率,隨后集中精力將目光分配到最重要的網格單元。
我們看到,根據操作結果,優化模型優于STORM的啟發式,并允許我們平衡所有單元的搜索,而啟發式則傾向于集中在重要的單元。與STORM的啟發式方法重復搜索相同的網格單元相比,SOM指導衛星在哪里尋找,以允許訪問每個網格單元并避免大的重訪間隙。
聯合國馬里特派團(MINUSMA)開創了維和情報工作的先河,建立了一個直接為部隊指揮官提供情報的職能,旨在改善作戰規劃。2015年至2019年期間,瑞典武裝部隊通過向馬里穩定團部署一支情報、監視和偵察(ISR)工作組參與了這一發展。本報告探討了工作組開展的活動如何與保護平民和部隊建立相關性。研究發現,這兩個主題確實存在于瑞典的整個ISR經驗中。然而,對于哪種類型的情報能夠最好地滿足這些優先需求的解釋在不同的輪換中大不相同。由于馬里穩定團能夠在營地外開展行動的部隊數量有限,任務組有時會接受嚴格的ISR組合之外的任務。不過,即使在這些場合,ISR資產也為他們的行動提供了便利。事實證明,讓情報穿越特派團并加強其他單位的部隊保護或業務活動更為復雜。
反叛戰爭的經典和現代理論強調了資源能力的作用。我們證明,在確定叛軍如何對裝備較好的政府軍發動復雜攻擊的具體細節方面,由這些資源提供的情報收集發揮了關鍵作用。我們利用關于阿富汗叛軍攻擊、叛亂分子領導的間諜網絡和反叛亂行動的高度詳細的數據來檢驗理論模型。利用鴉片適宜性的準隨機變化,我們發現,叛軍能力的提高與(1)額外的反偵察,(2)叛亂行動的增加,(3)通過技術創新、增加復雜性和攻擊集群改進戰場戰術,以及(4)提高對安全部隊的有效性,特別是對更難對付的目標。這些結果表明,獲得資本,再加上情報收集,對叛軍的作戰方式和地點產生了有意義的影響。
國內沖突已經取代了國家間的戰爭,成為人員損失和人口遷移的主要來源。一般來說,人們都知道,資源能力決定了叛軍如何招募、保留和部署他們的戰士(Weinstein,2007)。叛軍持有的經濟資源的波動影響了叛軍活動的規模(Dube和Vargas,2013年),他們對戰略領土的控制(Kalyvas,2006年),以及他們如何對待平民(Wood,2014年)。這些因素反過來又影響到平民是與叛軍勾結還是與政府軍合作(Condra和Shapiro,2012)以及政府參與發展和重建的能力(Sexton,2016)。
在這篇文章中,我們從更細微的層面來解讀資源可用性對作戰策略的影響。在我們的非正規戰爭模型中,叛軍收集有關目標脆弱性的信息,并根據這些信息選擇攻擊模式。積極的經濟沖擊使叛軍能夠獲得相對高質量的情報,他們的攻擊變得更加復雜,涉及更復雜的武器,并聚集在一組最脆弱的目標上。從技術上講,我們的模型是Blotto上校博弈的一個新版本,這是一個標準的兩方沖突的一般模型(Blackett, 1958; Powell, 2007; Kovenock and Roberson, 2012)。我們為攻擊方增加了收集有關目標脆弱性的額外信息的可能性:在政府分配了其防御資源后,每個可能的目標都要進行脆弱性測試,叛軍對目標的選擇依賴于這些測試的結果。在均衡狀態下,不同目標的最佳攻擊分配要考慮到這些額外的信息;這在信息的精確性和攻擊的分配之間建立了聯系。
我們使用美國政府提供的解密軍事數據來測試我們模型的含義,這些數據記錄了在 "持久自由行動 "期間阿富汗的數十萬次戰斗。這些數據在范圍和規模上都是獨一無二的;它們包含了原本無法觀察到的戰斗行動細節,如叛亂分子監視行動的地點、叛亂分子的戰場創新、叛亂分子的單位滲透以及欺騙性武器技術的使用。我們將這些細化的記錄與微觀層面的鴉片生產地點和強度信息以及影響鴉片生產力的外生農藝條件的衛星測量相結合。我們利用這些高分辨率、高頻率的農業投入措施來構建一個新的外源性鴉片適宜性措施。我們還收集了一系列有關農業價格區、基礎設施項目、灌溉技術和使用脅迫性威脅來操縱當地生產的額外信息,以評估反叛能力的沖擊如何影響政治暴力。
我們發現一致的證據表明,對反叛組織的正面經濟沖擊導致了暴力的增加和反叛分子產生暴力的方式的改變。特別是,我們發現反叛者能力的提高與反叛者更多的技術創新有關,更多的攻擊涉及對政府部隊的復雜滲透,更多的使用欺騙性武器技術,以及更復雜的多目標作戰行動。我們還發現,隨著叛亂分子獲得資本的增加,他們在時間和空間上都參與了更多的集群攻擊。重要的是,由于我們的作戰記錄還包括叛軍的監視信息,我們可以檢驗我們理論模型的核心猜想:獲得有關政府漏洞的更精確的信息使叛軍可以將資本轉化為更復雜的攻擊。在我們的樣本開始時,叛亂分子能夠在阿富汗398個地區中的70個地區進行監視行動,我們在圖1中對其進行了可視化。我們發現了這一機制的廣泛證據:在戰役早期叛亂分子開展監視行動的地區,暴力和攻擊的復雜性對資源能力的反應特別強烈。
圖 1:叛軍領導的在阿富汗進行的監視行動。
注釋:叛亂分子間諜行動的數據來自SIGACTS軍事記錄。交叉模式表明叛亂分子在2006年期間至少進行了一次被發現的監視行動,這也是我們樣本的第一年。地區邊界取自ESOC阿富汗地圖(398個地區)。
利用現代計量經濟學推理方法對戰斗策略進行的研究仍然很少,這些研究利用了細化的軍事記錄。正如伯爾曼和馬塔諾克(2015)所指出的,在我們對叛軍何時和如何參與武裝斗爭的理解之間存在一個有意義的差距。我們的論文有助于解決這一差距。更廣泛地說,我們的論文提供了對叛亂基本機制的見解。國家能力是沖突的經濟理論的核心(Besley和Persson,2011;Powell,2013)。然而,國家競爭者可用的資源也影響著沖突何時出現,內部戰爭如何進行,以及是否以撤軍結束。
我們的理論模型和實證測試還關注沖突中一個新的但經常被忽視的動態:所有各方都收集信息。之前關于反叛亂的工作主要是研究戰斗的動態,包括對平民的傷害,如何影響政府軍的情報收集(Condra和Shapiro,2012)。這部分是由于很難觀察到非國家行為者如何以及何時參與監視并管理有關戰斗活動和目標脆弱性的信息流。然而,Kalyvas(2006)和其他人使用各種人種學、歷史和檔案方法指出,在沖突期間,特別是不對稱戰爭期間,信息對各方都很重要。我們的理論模型強調了這一機制,認為情報收集決定了叛亂分子在哪里、如何以及以何種方式制造暴力。我們還對這一機制進行了廣泛的定量探討,并對政治暴力的豐富定性描述進行了探討,這些描述將信息置于國內沖突的中心。
最后,我們的研究是第一個估計資源能力對戰場有效性影響的研究,特別是涉及車輛和武器系統損壞以及士兵傷亡的攻擊。我們發現,這些有效攻擊隨著鴉片適宜性的正向沖擊而大幅增加,特別是針對硬目標的攻擊。與我們的主要結果一致,我們還發現,這些沖擊對叛軍能力的影響是由情報收集機制介導的:在叛軍能夠獲得監視資產的地區,戰斗力的提高最為明顯。
本文的其余部分組織如下。第2節介紹了我們的理論模型。第3節簡要介紹了制度背景。第4節詳細介紹了實證策略。第5節介紹主要結果和穩健性檢驗。最后一節是結論。
本報告著重于2025年混合部隊的任務工程過程。來自OPNAV N9I的最新任務強調了關注使用成本保守的無人系統的必要性。具體來說,重點放在近鄰的競爭對手大國以及在南海的反介入/區域拒止(A2/AD)情況下可能出現的問題。海軍水面作戰中心的任務工程方法被用來確定擬議的替代艦隊架構的具體事件,然后使用作戰模擬和優化模型進行分析。對目前的無人系統,特別是那些正在開發的高技術準備水平無人系統的性能特征和成本的研究進行了匯編。提議的無人系統架構是作為A2/AD問題的解決方案而開發的。然后,無人系統架構通過優化模型運行,以最大限度地提高系統性能,同時最小化成本。然后,架構優化的結果被輸入到建模和仿真中。然后比較每個架構的整體有效性,以找到最有效的解決方案。對結果進行了分析,以顯示預期的任務有效性和利用擬議解決方案的無人架構的擬議成本。最有效的架構包括搜索、反蜂群、運送和攻擊系統。
系統工程分析31組由美海軍作戰司令部戰爭整合處(OPNAV N9I)負責確定一個解決方案,以彌補與大國在2025年的預期能力差距(Boensel 2021)。該解決方案系統必須具有成本效益并能在2025年之前交付。SEA團隊利用任務工程過程來確定候選的未來艦隊架構來解決問題(工程副主任辦公室2020)。
到2025年,如何才能有效地對抗近鄰對手的反介入和區域拒止能力?
以具有成本效益的方式調整目前的能力,并創建一個未來的架構,以加強美國海軍的作戰能力,包括存在、欺騙、ISR以及在反介入和區域拒止環境中的防御和進攻能力。
利用任務工程流程,總體情景被設定在2025年的南海。大國已執行了其九段線的領土要求,并建立了一個反介入/區域拒止(A2/AD)區。大國不斷擴大的艦隊、對人造島嶼的使用、遠距離ASCMs以及對無人系統的擴大使用使美國的水面作戰艦艇處于高風險之中。總體任務是美國海軍DDG通過提高其殺傷力和生存能力,在A2/AD區域內進行FONOPS。在整個方案中,有三個小場景被開發出來。OTH ISR、目標選擇和交戰,威脅無人機蜂群,以及提供目標選擇的威脅無人機ISR資產。
衡量任務成功與否的總體標準是美國海軍部隊在近乎同行的反介入區域拒止環境中的作戰能力。有助于衡量成功的有效性的措施是DDG的生存能力和殺傷力的提高程度與解決方案系統的成本相結合。
為了分析擬議的系統解決方案(SoS)是否能達到既定的成功標準,設計了一個價值體系。利用通用的海軍任務列表,項目組確定了擬議的系統解決方案需要完成的三個二級任務,以完成任務(海軍部,2008)。
對三個選定任務下的后續任務進行了評估,以確定擬議系統需要完成的具體功能。通過這次審查,確定了候選無人系統需要完成的四項高級功能。這些功能是交付、搜索、通信中繼和打擊。為每項功能選擇了性能措施,以用于多屬性價值分析。
多屬性價值分析被用來比較完成四個功能中一個或多個功能的候選系統。一個系統的價值是根據每個性能指標對完成一個特定功能的重要性,給每個性能指標分配一個權重而得出的。權重從1到5不等,其中5表示最重要的MOP。計算MOP和權重的乘積,并將每個乘積相加,以獲得系統的價值。
為了確定可行的候選系統,項目組成員各自研究了一個不同的無人系統,并收集了每個候選系統的性能衡量標準。如果一個特定的無人系統的MOP值不知道,則推斷其值與一個類似的系統相同。如果不存在這樣的類似系統,則使用啟發式方法估計該值。對于每項功能,至少有一個系統符合技術成熟度,可考慮用于2025年的混合部隊。
為了實現所有四個功能,候選系統的組合被排列組合成16個系統簇。每個備選方案的系統價值和成本都被計算出來。系統價值的計算方法是將每個備選方案中的每個系統的價值相加。
為了產生用于比較的替代方案,該團隊使用整數線性規劃生成了架構。這是用Pyomo的優化功能完成的。線性規劃被創建、約束以更好地表示現實,并被解決以生成分別針對性能、預算和替代合約選項進行優化的替代架構。
現代導彈戰可以使用炮擊作戰模型進行評估。這個模型被用來計算每個小場景中的每個SoS備選方案的有效性。結果顯示了超視距ISR平臺的重要性,一個獨立的武器系統來對付敵人的無人機,目前IAMD作戰系統的有限防御能力,以及超視距搜索和瞄準能力。
“大國”和美國都擁有深入的綜合空中和導彈防御。為了證明這種互動,在微軟Excel中使用反二項式函數對不同的交戰進行了建模。每一個擬議的艦隊架構都被輸入到三個小插曲的戰斗模擬中。為了獲得隨機的結果,試驗的數量被設定為300次,每個概率都有一個可能的值范圍。該模型中的自變量可分為防御性或進攻性變量。防御性變量是每個單位的綜合防空和導彈防御武器的殺傷數量和殺傷概率。PLAN的進攻性變量是YJ-18 ASCM和Harpy無人機的命中數。美國海軍的進攻性變量是海上攻擊戰斧、ASCM和特定攻擊無人機的進攻性命中數量。
模擬的結果顯示了擊中敵方水面平臺或美國海軍水面部隊的數量。通過比較建議的系統與基線的命中率,可以得出變化的百分比。在我們的分析中,進攻和防御的有效性被平均加權,允許將進攻和防御百分比變化的高值相加,以計算出高低變化的總百分比。
基于智能體的建模和仿真(ABMS)被用來驗證每個設想的系統架構與所需的MOE。ABMS旨在通過對智能體之間的相互作用進行建模,來捕捉戰爭交戰的隨機性,但又很復雜。進行了蒙特卡洛分析,以收集每個系統性能的個體層面的數據。隨后的統計分析提供了一個途徑,以確定和量化每個擬議的系統架構所實現的改進。為此目的,指揮部:現代行動(CMO),是一個跨領域的現代兵棋推演計算機軟件,旨在模擬戰術到作戰水平的行動,被用作仿真引擎。CMO模擬的是基于規則的智能體,它們相互之間以及與環境之間的互動,包括感興趣的場景中的武器系統(Coyote, YJ-18, Chaff)和平臺(例如PLAN DDG, Luyang)。與多屬性價值分析方法相比,CMO允許對定量的系統MOP進行建模,并在模擬結果中觀察其相對差異。
電子表格戰斗模型模擬的第一個結果是解放軍DDG在三個不同的迭代中對美國海軍DDG的命中率,即只用YJ-18攻擊,只用哈比攻擊,以及YJ-18和哈比同時攻擊。同時使用YJ-18和Harpy的命中率被作為防御性MOE的基線值。接下來,兩種不同的防御性無人機系統被分別加入到作戰模型中。對只有哈比的攻擊和YJ-18與哈比的同時攻擊進行了重復模擬。每個系統的防御性百分比變化是用前面描述的公式計算的。
接下來的結果是美國海軍DDG在三次不同的迭代中擊中PLAN DDG的次數。模擬了僅用MST攻擊、僅用ASUW無人機攻擊以及MST和ASUW同時攻擊的結果。只用MST攻擊的命中率作為進攻性MOE的基線值。接下來,七個不同的運載系統被分別加入到作戰模型中。對僅有ASUW無人機攻擊和同時進行的MST和ASUW無人機攻擊進行了重復模擬。每個投送系統的進攻百分比變化被計算出來。
將同等權重的進攻和防守百分比變化相加,計算出高和低的總變化百分比。根據該模型,期望值是這樣的:在0.95的置信度下,增加SoS將使水面部隊的有效性增加一個介于高值和低值之間的百分比。
總的來說,從ABMS觀察到的性能與從電子表格模型觀察到的性能MOE相關。在所有提議的架構中,都觀察到了防御和進攻MOE的明顯改善。這是預料之中的,因為在DDG上增加任何防御性武器系統應該減少艦隊DDG的直接命中數量。同樣,增加一個具有增強OTH感知能力的進攻性武器系統會增加對目標直接作用的武器數量。
對防御性和進攻性MOE與每一方所消耗的平均武器數量的比率的進一步分析顯示,由于美國海軍DDG上增加了反群武器系統,防御性MOE得到了改善。這種增加被證明是對所有架構的一種有效的廣泛改進。三種提議的架構之間最明顯的差異來自于進攻性MOE(%),其中性能系統優于其他架構。與發射的武器總數相比,預計一個性能更好的系統會向目標發射更少的武器,同時造成更多的命中。
這項工作證明了低成本的無人駕駛威脅系統給傳統水面戰艦帶來的危險,這些系統可以在幾乎沒有警告的情況下進行協調和攻擊,并為船員提供很少的反應時間。為了避免強制增加對峙距離以提高生存能力,有必要使用增程傳感器系統和反無人機系統來彌補預期的能力差距并提供進入被拒絕區域的機會。為了使這些系統可行和安全,高帶寬的通信系統將是必需的。
為了滿足這些需求,建議的解決方案系統利用Dive-LD來運送Coyote無人機平臺。搜索和通信中繼將由兩個VBAT無人機平臺提供。這種平臺組合為每一美元的系統成本提供了最高的進攻和防御能力的提高。叢林狼 "無人機也將作為一個蜂群來防御威脅性無人機群和威脅性無人機ISR資產。增加解決方案系統的采購將提高艦隊的生存能力和殺傷力,并允許在其他艦隊優先領域進行額外投資。
建議通過為無人機平臺配備額外的無源傳感器來改進該系統,以利用電磁頻譜的所有部分,從而提高在所有天氣和戰斗條件下探測敵方威脅的能力。此外,擬議的解決方案系統可以擴展到許多其他領域和任務區,如港口防御和反對出口。
在過去的幾年里,大西洋上的敵對潛艇活動一直在穩步加強。此外,戰略對手已經開發了復雜和隱蔽的潛艇,使它們更難被定位。活動的加劇加上先進的平臺,使美國的對手能夠挑戰其在水下領域的主導地位。盡管已經對使用貝葉斯搜索方法的優化搜索策略進行了廣泛的研究,但公開文獻中的大多數方法都側重于搜索靜止的物體,而不是搜索由Blue潛艇進行的移動的Red潛艇。因此,我們開發了一個敵方潛艇的模型,其目標是避免被發現。隨著搜索努力的消耗,根據負面搜索結果計算出敵方潛艇位置的后驗概率分布。我們提出了一種尋找搜索模式的方法,該模式試圖在貝葉斯框架內利用馬爾科夫特性使探測的概率最大化。具體來說,我們研究了三種不同的運行窗口方法:一個簡單的網絡優化模型,一個在每個時間段后執行更新的網絡優化模型,該模型正在規劃整個路線,以及一個只提前兩個時間段的動態程序。
近年來,戰略對手在水下領域的進展,加上在大西洋的更多部署,給美國海軍(USN)帶來了新的挑戰。更加隱蔽的潛艇在聲學上與弗吉尼亞級SSNs相當,這使得美國海軍更加難以定位和跟蹤這些潛艇。這些挑戰已經確定需要完善可用來尋找敵對潛艇的工具。
在這篇論文中,討論了為潛艇上的決策者提供一個完善的搜索工具的需求,以幫助他們搜索敵對潛艇。我們研究了基本搜索算法的不同方法,該算法能夠進一步發展并在潛艇上實施。
我們首先介紹了我們為Red的運動建模的方法。我們假設Red最初位于一個大小為200乘200海里的搜索區域(SR)內,該區域被描述為一個劃分為400個10乘10海里單元的網格。然后,我們定義一個離散時間馬爾可夫鏈來模擬Red在SR中的運動,鏈中的一個狀態是Red潛艇的單元位置,過渡概率管理Red從一個單元到另一個單元的運動。為了決定單元之間的過渡概率,我們假設有關于Red任務的可用情報,這些情報以概率方式決定了Red的運行方式。
接下來,我們研究了三種算法,以幫助潛艇指揮官對Red潛艇進行搜索的能力。對于我們考慮的所有三種算法,重要的是要明確,搜索計劃是在進行任何搜索之前產生的。我們首先考慮簡單的網絡算法(NA)算法,其中生成的搜索計劃使在搜索時間范圍內未發現Red的概率最小。在優化方面,這相當于找到Red的概率最大化,而且它不考慮搜索時間范圍內的任何搜索結果;它是在搜索開始前計算的,不會改變。然后,我們通過利用貝葉斯定理來修改這個帶有更新的算法(稱為帶有更新的網絡算法(NAU)),在假設被搜索的單元格不包含Red的情況下,更新Red位置的概率分布。利用每個時間段的更新概率分布,網絡優化算法在Blue花費搜索精力的每個剩余時間段重新運行,這給了Blue一條新的搜索路線。盡管NAU算法的結果是為剩余時間段提供了一條搜索路線,但只使用了下一個要搜索的單元。接下來,我們開發了一種動態編程(DP)算法,以最大化在下一個時間段或下一個時間段找到Red的概率。該算法還利用貝葉斯定理來進行Red位置分布的更新,假設Red從未在Blue搜索的單元中出現過。所有三種算法的完整搜索路徑都是在搜索開始前計算出來的。
在我們的Blue搜索算法中,我們做了幾個假設。首先,我們假設Blue概率地知道Red的起始位置和Red運動的過渡矩陣。這些信息的來源是Blue搜索者外部的傳感器對Red的初始探測以及關于Red任務的情報。我們還假設Blue搜索者有完美的傳感器;也就是說,如果Blue和Red同時出現在同一個小區,Blue將以100%的概率探測到Red。此外,我們假設Red和Blue在每個時間段只能移動一個單元,這本質上意味著兩艘潛艇以相同的速度行駛。在我們的方案中,我們假設Blue在SR中最北面的任何一行開始搜索,如果Red離開SR,它就不會返回。如果Red在離開SR之前沒有被發現,或者在搜索期間沒有被發現,則搜索失敗。最后,我們假設Red有一個固定的過渡矩陣;也就是說,Red對Blue的存在沒有反應,在搜索期間,Red在單元格之間過渡的概率保持不變。
為了研究算法的表現,我們運行了多種方案,在這些方案中,我們改變了Red的起始特征,如起始單元和Red可能開始的不同單元的數量。然而,Red的過渡矩陣在每個場景中保持不變。對于每個場景,Blue的搜索路徑在每種算法中都被計算一次。同樣,對于每個場景,Red的路線被模擬了10,000次,使用假設的可能的起始單元集,每個單元都以相同的概率選擇,以及每個場景的相應過渡矩陣。確定Red被Blue檢測到的復制比例,如果被檢測到,檢測發生在哪個時間段。模擬的輸出是檢測到Red的估計概率,以及相應的95%置信區間和每種算法的經驗CDFs。經驗CDF是指在每個時間段或之前檢測到Red的概率。CDF顯示了每種算法在搜索工作中的表現。我們還計算了計算時間,以CPU周期衡量,以確定每種算法的計算成本。
我們的結果表明,三種算法產生了類似的結果;然而,NAU和DP算法的表現一直優于簡單的NA算法。對于NAU和DP算法來說,計算出的檢測概率的95%置信區間是重疊的;因此,NAU和DP算法的真實檢測概率都在彼此的誤差范圍之內。在我們考慮的前五種情況中,最高的估計檢測概率接近20%,最差的也達到8%左右。探測概率低的原因有三種可能的解釋。首先,在我們考慮的場景中,Red很有可能在Blue可能探測到Red之前離開SR。另外,因為我們假設Red在單元之間的轉換概率是均勻的,所以Red的路線存在高度的不確定性。最后,Blue在指定的有限時間內進行搜索。
我們還運行了一個方案,將Red的起始位置固定在一個單元中,并改變過渡矩陣中的概率,以代表Red很有可能過渡到西北方向的單元的情況。這種情況表示Red向指定方向移動的確定性更高。很明顯,隨著Red向某些單元的過渡概率增加,檢測到Red的概率也會增加。通過這種情況,我們也表明貝葉斯更新是有效的,因為在NAU和DP算法中,如果Red不在最初最有可能出現的地方,Blue會繼續找到Red;然而,使用NA算法,如果Red在有可能探測到Red的第一個時間段內不在最有可能出現的地方,那么Blue就無法探測到Red。這個結果是合理的,因為如果當Blue第一次可以探測到Red時,Red不在它最有可能出現的小區里,那么Red就沒有遵循最可能的路線;Blue使用這一信息來更新NAU和DP算法中Red位置的概率分布,但對NA算法則沒有。
就計算成本而言,DP算法的求解效率比其他算法高得多,需要的CPU周期比NAU算法少三個數量級。然而,我們表明,對于NAU和DP算法,計算成本隨著Blue可能檢測到Red的時間段的增加而增加。由于NA算法不執行更新,它的成本在整個場景中保持不變。
我們的研究結果表明,DP算法是最適合未來發展的。它的性能始終與NAU算法相似,而計算成本卻大大降低。當充分發展后,這種算法可以在潛艇上使用,并在操作員可用的任務規劃工具中實施。
融合項目(PC)是一項美國陸軍學習活動,旨在整合和推進他們對聯合部隊(陸軍、海軍、空軍和海軍陸戰隊)的貢獻。根據研究和分析中心(TRAC)-蒙特雷的說法,"PC確保陸軍作為聯合戰斗的一部分,能夠快速和持續地整合或'融合'所有領域的效果--空中、陸地、海上、太空和網絡空間,以便在競爭和沖突中戰勝對手"(研究和分析中心[TRAC]2020)。目標是評估在PC21上展示的新的創新系統(SoS)技術是否滿足為聯合部隊提供必要的速度、范圍和融合所需的作戰能力,以產生未來的決策主導權和大國競爭的超能力。然而,鑒于PC期間各種現代技術的注入,TRAC-蒙特雷目前缺乏一種方法來衡量作戰效果以及作為軍隊和聯合部隊的融合是否正在實現。因此,本項目的重點是制定一個概念性的評估框架,以確定在PC21演習中測試的多域作戰(MDO)任務中SoS的作戰有效性。這個框架將集中在那些被證明可以減少傳感器到射手(S2S)時間的技術的行動有效性,以便在聯合MDO任務中消滅一個固定的目標。
該小組確定,對某一特定能力的功能分解,結合用于開發MOE的Langford綜合框架的修改版,將產生描述該特定能力的行動有效性的良好措施。為了將衡量標準轉化為價值分數,團隊使用了構建價值尺度的理想范圍方法,該方法為每個衡量標準建立了一個從最好到最壞的情況,使其具有適應任何能力的靈活性。帕內爾的搖擺加權法被用來量化利益相關者對每個蘭福衍生的MOE的重要性,以確定能力的每個MOE的加權價值分數(WVS)。WVS相加得出總分,這就提供了對運營有效性的最終評估。然后,該團隊產生了一個行動有效性量表,向利益相關者說明他們的能力在這個量表中的得分情況。
該項目最后針對概念評估框架應用了PC21用例,以衡量其在生成與用例中的能力最相關的MOE以及單一行動有效性分數方面的穩健性。該模型的最終驗證將在目前計劃于2021年10月開始的PC21期間進行。
總之,該團隊使用系統工程流程建立了一個概念性評估框架系統,該系統將使TRAC-Monterey有能力評估PC21期間展示的新的創新SoS技術的作戰能力。該團隊開發了一個利益相關者分析,一個由利益相關者衍生的目標層次,一個功能分解,以及一個創建良好措施的過程,將這些措施轉化為價值分數,量化措施的重要性,并將產生的價值匯總為一個單一的、行動有效性分數。該框架將為利益相關者提供信息,使他們能夠就進一步的技術開發做出明智的決定。TRAC-Monterey還可以將本研究中制定的衡量標準作為指南,在整個PC21和未來的PC活動中收集相關信息。
建議 TRAC 在 PC21 期間對照 S2S 用例 1-1 驗證概念性評估框架。還應采用其他用例來測試框架的靈活性和可用性。還建議進一步研究行動效率的認知方面,以及如何利用這些信息來擴大本評估框架的范圍。TRAC和JMC向團隊表示,PC的努力將有助于改寫聯合行動的理論。
美國海軍的無人作戰框架和智能自主系統(IAS)戰略解析了美國海軍的愿景,即如何通過迭代實驗來發展無人平臺,重點是發展新的作戰概念和實現這些想法的關鍵技術。美國海軍需要制定一個作戰概念(CONOPS),將無人水面和水下航行器(USV/UUV)納入現有情報、監視和偵察(ISR)流程。無人平臺(UV)面臨著操作和續航方面的挑戰,這將使它們在情報周期的處理和開發功能中成為獨特的難點。本文討論僅限于兩個具有顯著續航能力和收集能力的無人平臺,這兩項能力使無人平臺對作戰具有重大影響。這項工作回顧了關于超大型UUV(XLUUV)和中型USV(MUSV)能力和預期任務的非機密文獻,并與MQ-4C海神偵察機的發展進行了比較。確定了海軍在開發CONOPs時應該考慮的幾個因素和解決方案,如何在戰役層面將XLUUV和MUSV集成到ISR中。
“無人平臺在我們未來的艦隊中發揮著重要作用。成功地整合無人平臺——在海面下、在海面上和海面上空——為我們的指揮官提供了更好的選擇,以便在有爭議的空間里作戰和獲勝。它們將擴大我們的情報、監視和偵察優勢......”--美國海軍作戰司令部,2021年航行計劃
美國海軍目前正在開發一系列無人的空中、水面和水下航行器,以滿足其未來部隊需求。海軍的無人作戰框架和智能自主系統(IAS)戰略解析了海軍的愿景,即如何通過反復實驗來開發這些新平臺,重點是發展新的作戰理念和實現這些理念的關鍵技術。無人平臺將支持海軍的目標,即建立一支更加分散的部隊,能夠在通信退化的環境中作戰,同時在受到反介入和區域拒絕威脅的挑戰時能夠應對。雖然海軍的無人平臺仍處于不同的發展階段,但有足夠的數據表明它們的能力,可以提出新作戰概念,將這些新平臺與海軍長期以來的優先事項相結合。
美國海軍需要制定一個作戰概念(CONOPS),將無人水面和水下航行器(USV/UUV)納入現有情報、監視和偵察(ISR)流程中,無論是在戰斗期間還是在日常的非戰斗行動中。這種CONOPs將支持智能自主系統中至少兩個子類——分布式和持久性傳感器,以及戰斗空間的擴展、清晰化和精確化。無人平臺(UV)雖然有潛在的強大的收集能力,但面臨著操作和續航方面的挑戰,這將使它們在情報周期的處理和開發功能方面成為獨特的麻煩。海軍使用無人平臺作為ISR資產的概念將需要納入這些平臺獨特的適合完成的作戰目標,并且應該在這些平臺能力正在形成和實戰化的時候就開始制定。
為了把重點放在戰爭的戰役層面上,討論將限于兩個具有重要續航能力和收集能力的無人平臺,使它們具有實質性的作戰影響。這項工作回顧了關于超大型UUV(XLUUV)和中型USV(MUSV)能力和預期任務的非機密文獻,并與MQ-4C Triton(一種大型海上無人駕駛飛行器)的發展相比較。它確定了海軍在制定將XLUUV和MUSV整合到作戰層面的ISR的CONOP時,應該考慮的幾個因素和解決方案。分析的重點是在以海洋為中心的戰場上使用這些平臺,對手是在海面下、水面、空中和太空領域使用軍事力量的近鄰或同級對手。提到作戰指揮官時,設想了一個戰區聯合部隊海上分指揮官(JFMCC)和情報人員,在岸上或海上作戰中心(MOC)內運作。
美國海軍的分布式海上作戰(DMO)概念是為了在反介入、區域拒止(A2AD)戰場上擊敗競爭對手,它依賴于分布式、網絡化的ISR平臺。ISR資產將定位對手并為武器使用平臺提供目標支持。無人平臺與多域作戰(DMO)概念極其相關,因為DMO設想在對手的對峙或反介入武器的交戰區域內使用海軍資產。海軍23財年的長期海軍建設計劃指出,海軍預計在45財年擁有89-145個無人平臺,并提到更詳細的信息,可在機密的能力發展計劃中獲得。22財年的建設計劃明確指出,海軍正在尋求59-89艘USV和18-51艘UUV。海軍的資金優先級和迭代式無人平臺開發支持CNO將無人平臺作為分布式作戰的一個重要組成部分。
情報、監視和偵察是三個獨立但密切相關的功能,對于軍事行動至關重要。廣義上講,情報是收集和分析與決策有關的信息。監視是使用收集資產來監測一個地點的相關活動,而偵察是將收集資產部署到一個確定的區域,以定位或確認沒有相關活動。當無人平臺用于ISR功能時,將主要作為收集資產來監視或偵察特定區域,尋找相關活動。這些平臺的 "無人"性質,使平臺本身更具有成本效益,不容易被置于危險之中,但卻使其作為ISR資產的有效性變得復雜。采集行動必須以足夠嚴格的方式進行預規劃,以滿足指揮官在不可能重新分配任務的通信環境中繼續生存。此外,收集到的數據必須傳送給有能力將信息開發成情報的分析人員,以便為作戰決策提供依據。
MQ-4C "海神"是由RQ-4 "全球鷹 "改裝的大型無人機,用于提供持久的海上ISR。"海神"的開發是為了滿足海軍對持久性ISR的需求,最終被確定為廣域海上監視(BAMS),用于A2AD環境。"海神"在一次任務中可以飛行超過24小時,作戰范圍為8,200海里。為了滿足海軍的要求,對RQ-4進行了具體的修改,最明顯的是要求在惡劣的海上天氣下下降和上升,以便目視識別通過電子信號定位的水面航行器。這一要求需要增加除冰能力、防雷和其他強化措施。
2020年1月,海軍對 "海神 "進行了首次早期作戰能力(EOC)部署,向關島的安徒生機場派出了兩架飛機。該飛機作為CTF-72的一部分,向在INDO-PACOM責任區作戰的聯合部隊提供海上巡邏和偵察,這是ISR的一個方面。在飛行行動中,"海神 "由四名飛行員組成的機組控制,他們在地面控制點進行操作。這些操作員駕駛飛機,不進行情報開發,情報開發由一個單獨的專家小組提供。2020年派往關島的機體并不具備整套預期的收集能力,只有光電/紅外(EO/IR)視頻流和一個海上雷達。海軍目前正在測試 "海神 "的升級版、多智能改進版,它增加了信號情報收集能力,是打算取代有人駕駛的EP-3E Aeries II飛機的平臺。
盡管還沒有完全投入使用,但 "海神 "號的早期使用提供了一些經驗,應該為大型無人水面和水下船只的發展提供參考。首先,"海神"和其他無人平臺所收集的信息將需要傳送給人類分析人員進行開發。雖然存在識別感興趣的信號的自動化程序,但它們還不能將這些信息置于當前友軍和敵軍行動的背景下,并告知決策者。其次,大型無人駕駛系統依賴于岸上的維持和維護。像 "海神 "一樣,任何大型的平臺都需要返回基地或港口進行維修、加油和卸載收集的數據。這些岸上的設施是平臺操作的關鍵要求,可能會受到干擾或攻擊。第三,在建造無人平臺時,應了解任務和有效載荷在未來可能發生變化。為平靜的海況和適度的溫度而建造的無人平臺,在大海里、惡劣的天氣或極端的水溫下,可能不那么有效或無法操作。
5個“虎鯨”超大型無人潛航器(XLUUV) 中的第一個,在19財年得到資助。其基于波音公司的Echo Voyager XLUUV進行開發,預計在22財年作為一個測試平臺,用于開發作戰概念和關鍵的使能技術。XLUUV幾乎肯定不會有能力以載人潛艇的保真度來探測、跟蹤和分類聲音。這主要是因為UUV缺乏訓練有素和有經驗的船上潛艇人員的專業知識,而且XLUUV是一個比載人潛艇小得多的平臺,限制了任何船上聲納陣列的能力。然而,XLUUV的模塊化性質擴大了其潛在的收集能力,包括船上攜帶的任何可部署的系統,以及船體安裝或牽引的聲納陣列。下面將討論基于有機傳感器或XLUUV攜帶的有效載荷進行數據收集。
將XLUUV作為ISR資產使用的最重大挑戰是缺乏與地面控制點的頻繁通信。現有的能力并沒有確定XLUUV是否有能力升起一個通信桅桿或浮標來傳輸數據和接收修訂的指令。這樣做會削弱使用水下航行器作為ISR資產的主要優勢,即它的隱蔽性。這為作戰計劃者確定了三種可能的行動方案。第一,XLUUV在其行動期間不能發送或接收任何數據。這將限制XLUUV只執行預先計劃的行動,并剝奪行動指揮官重新分配資產的任何能力。第二,XLUUV可以部署一個僅有接收能力的通信天線。這將允許指揮官重新分配XLUUV的任務,但不允許該資產廣播接收指令,這使得操作人員不確定新的指導是否正在執行。用來傳達這種新指導的廣播有可能揭示UUV或潛艇的行動區域。第三,XLUUV可以采用一個同時具有發射和接收能力的通信浮標。這將使指揮官能夠發布新的指令,并確認XLUUV已經收到并將執行新的任務,但也有可能將UUV的位置暴露給對手。每種方案都是在安全和作戰指揮官的靈活性之間做出的折衷。
繼隱身之后,UUV作為ISR資產的第二個主要優勢是其收集聲學數據的能力。聲學情報,即對這些數據的處理和利用,是一門極富挑戰性的學科。聲學數據需要分析人員花費數年甚至數十年的訓練和經驗來進行分析。由于這門學科的挑戰,海軍應該尋求現有的聲學情報卓越中心來分析XLUUV收集的數據。海軍在弗吉尼亞和華盛頓有兩個海軍海洋處理設施(NOPFs),由聲學和情報專家共同管理。這些設施作為綜合海底監視系統(IUSS)的一部分運作,并對來自海上采集資產的聲學數據進行持續分析使用。對于ISR功能,海軍應考慮將XLUUV作為IUSS資產,并利用NOPFs的常駐聲學情報專家來處理和分析收集的數據。
需記錄的聲學信息通常也會產生大量的數據,覆蓋較長的時間段。可能需要幾周或幾個月的時間來充分開發XLUUV任務的所有記錄數據。當考慮到前面討論的通信挑戰時,使用XLUUV作為ISR資產將需要對XLUUV支持的確切行動目標進行詳細規劃。這種規劃應導致對UUV的反應進行預先規劃,以滿足指揮官意圖的具體檢測。操作員應考慮三種反應,即立即反應、暫時延遲反應,或決定繼續執行任務并在回港后分析數據。
一旦XLUUV檢測到特定的標準,例如特定對手潛艇的聲學特征,它的反應應該由作戰指揮官仔細預先確定。在這種情況下,XLUUV有三種可能的行動。第一,停止其任務,并通過通信桅桿或非系留的單向傳輸浮標,立即向作戰指揮官發出通知,說它已經探測到對手的潛艇。如果敵方潛艇對指揮官的部隊構成危險,并且需要時間敏感的定位信息來使反潛戰(ASW)資產加入戰斗,這種反應可能是適當的。二,XLUUV可以釋放一個單向的通信浮標,在延遲后將探測結果廣播給作戰指揮官。這種折中的反應將為指揮官提供最近的定位數據,并提高他的態勢感知,但也允許UUV離開該地區,繼續執行其任務而不暴露其位置。如果指揮官希望在近乎沖突的時期提高態勢感知,但又不試圖主動瞄準對手的潛艇,這種反應可能是合適的。第三,XLUUV可以簡單地繼續記錄聲學數據,對探測進行日志記錄,并繼續執行其任務。日志記錄將有助于回港后的開發。這種反應在非沖突時期和XLUUV執行一般監視任務或收集作業環境信息時可能是合適的。這些反應選項中的每一個都利用了當今可用的技術,并為作戰指揮官提供了靈活性,以根據作戰需要指揮所需的反應。
波音公司公開的Echo Voyager XLUUV的數據顯示,它的航程為6500海里(NM),最大速度為8.0節,最佳速度為2.5-3.0節。從關島阿普拉港到俄羅斯太平洋艦隊所在地阿瓦查灣約2450海里,到中國南部戰區海軍駐地亞龍灣約2050海里。如果Orca XLUUV的能力與Echo Voyager的能力相近,這將使最有可能收集情報的地點處于部署在關島的XLUUV的行動范圍之內。然而,在離母港很遠的地方使用XLUUV可能會導致在接收和利用收集的數據方面出現重大延誤。根據2.5-8.0節的前進速度,從阿瓦查灣返回關島大約需要13至40天。該平臺漫長的旅行時間,加上分析所收集的數據所需的大量時間,促使XLUUV在ISR中最有可能的用途是對作戰環境的一般性收集,或有可能實施監視任務,將該平臺的長耐久性與前面描述的即時或延遲傳輸通信方法相結合。
作為一個無人平臺,XLUUV在維持和維護方面也將面臨獨特的挑戰,這將影響其作為ISR資產的使用。XLUUV被設想為一種可部署或遠征的能力。對這種能力的討論似乎僅限于單個或少量的船體,然而DMO概念和海軍造船計劃設想了幾十個平臺,所有這些平臺都將需要運輸、地面支持和碼頭空間來運作。任何降低或拒絕完成任務的物質缺陷都需要長時間返回港口或可能返回位于對手威脅范圍之外的水面艦艇。維護和保養的現實需要被納入任何利用無人武器作為ISR資產的作戰計劃中,這可能導致它們主要被用于非戰斗性的情報準備任務,在這些任務中,故障的影響比戰斗行動中要小。
美國海軍的MUSV目前正在基于最初的原型平臺Sea Hunter(SH1)和Seahawk(SH2)的基礎上進行開發。MUSV的具體目的是發揮ISR的作用,提供一個集成到海軍戰術網格中的無人傳感器和電子戰平臺。MUSV計劃目前在平臺能力方面的定義不如XLUUV,但其發展足以考慮具體的ISR功能和作戰概念。將MUSV作為ISR資產使用的關鍵決定是確定它們是作為獨立的收集器還是作為從屬于有人駕駛的水面艦艇的資產。
無論是哪種使用方式,MUSV都將以類似的方式發揮作用--收集現有的電子數據,進行初步的開發和處理,并將收集的結果轉發給岸上和海上的分析人員和系統。區別在于船上的收集系統在尋找什么信號,以及向誰和如何轉發收集的信息。當MUSV作為載人艦艇的支持力量運行時,它的收集系統應集中于探測和跟蹤來襲的威脅,并為被支持的艦艇提供目標定位的幫助。傳感器包應能同時識別和跟蹤反艦巡航導彈、彈道導彈、高超音速導彈、水面艦艇、有人和小型無人駕駛飛機,并提供潛望鏡探測能力。MUSV應該能夠將其收集的結果直接提供給被支持的艦艇,而不依靠干預的地面站或衛星,然后協助選擇和確定防御措施或反擊的目標。
如果作為一個獨立的收集器運行,MUSV最好配備能夠超越基線追蹤多個空中和地面目標的傳感器,并自動將這些追蹤與已知或可疑的對手平臺聯系起來。這些數據應該被轉發給作戰指揮官,以建立共同作戰圖(COP)。這兩項任務,直接支持載人艦艇或提供COP發展的獨立行動,包含了監視和偵察任務的要素。然而,最佳的傳感器和通信能力在不同的任務之間是不同的,這需要在進一步發展MUSV時予以考慮。
作為主要的電子情報(ELINT)收集器,MUSV將需要依靠現有的ELINT分析員來分析所收集的數據。海軍水面艦艇上一般都有可以進行這種分析的密碼學人員,盡管他們目前的任務是操作和利用其艦艇的有機收集能力。如果MUSV上有足夠的通信能力,那么收集到的數據可以被發送到岸上的分析人員進行利用。在這種情況下,海軍信息戰指揮部(NIOCs)是數據利用的合理地點。將需要開發基礎設施和信息技術,以便將MUSV收集的ELINT納入現有的處理系統。此外,水面艦艇和岸上設施的密碼人員配置將需要反映出增加了一個新的收集平臺,提供多個需要分析的數據流。
像“虎鯨”和MUSV這樣的大型無人平臺被設想為未來技術的一個組成部分,它將實現海軍的DMO概念。這一設想聲稱,從無人平臺收集的數據將通過海軍戰術網格和聯合全域指揮與控制(JADC2)網絡傳達給作戰級指揮官。CNO的NAVPLAN 2021指出,建立一個強大的海軍作戰架構(NOA),這將支持將無人平臺收集的數據納入JADC2,是僅次于調整海上戰略威懾力量的第二大發展重點。目前的ISR平臺開發正在將重點從人力密集型部隊轉向自動化能力,以在有爭議的環境中擊敗同行的對手。AI/ML的使用將導致收集的數據處理和利用的速度呈指數級增長,大大增強作戰指揮官的態勢感知,并減少從檢測到對手到使用武器的時間。對收集到的數據進行網絡化、自動化的利用,將是分布式作戰的一個重要推動因素。
網絡化通信和AI/ML的發展必然會導致無人平臺的有效使用,這有三個原因。第一,作戰藝術取決于對作戰環境、敵方和友方部隊以及作戰目標的深入分析和理解。無論提供何種工具,這種理解和部隊的有效使用將始終取決于一個有能力的作戰指揮官。作為一種ISR資產,無人平臺將依賴于指揮官和情報人員的明確行動任務。第二,目前人工智能/ML工具在情報分析中的狀態是有希望的,但離開始復制人類分析的能力可能還有很長的路要走。人工智能/ML工具只能復制人類思維和行動所形成的模式,而且幾乎可以肯定的是,無論開發何種算法,都會錯過與作戰藝術相關的新趨勢和異常數據。海軍在培訓和保留AI/ML專業知識方面也面臨挑戰。第三,大型UV目前正處于迭代實驗階段,在設計平臺能力的同時,現在就需要制定作戰概念。等到無人平臺達到最終的生產狀態,再為這些新的收集資產制定ISR CONOPs,將使海軍情報專家無法在開發過程中告知滿足作戰意圖所需的傳感器和能力。
美國海軍情報界需要充分投資于大型無人平臺的發展,特別是發展將這些平臺用于ISR角色所需的能力和概念。海軍在將無人平臺納入ISR過程中的經驗將為利用無人水面和海底艦艇提供參考,但不能直接轉化為利用無人平臺。在通信惡化或被拒絕的環境中運行的無人平臺可能需要大量的岸邊基礎設施來處理和利用收集的數據,對這種基礎設施和人力的投資應該與平臺的開發同時進行。從無人平臺收集的數據可能需要大量的時間來處理和利用,減少了它們在指示和警告(I&W)任務中的作用,并可能引導最佳傳感器套件來支持作戰環境的收集。由于在處理和利用收集的數據方面的挑戰,無人平臺不會取代現有的載人飛機、水面和水下航行器以及國家高空收集的ISR功能,但如果開發和使用正確的能力和作戰概念組合,無人平臺可能會成為發展指揮官態勢感知的有力工具。
前沿作戰基地(FOB)防御是一項人力密集型任務,需要占用作戰任務的寶貴資源。雖然能力越來越強的無人駕駛飛行器(UAV)具備執行許多任務的能力,但目前的理論并沒有充分考慮將其納入。特別是,如果操作人員與飛行器的比例為一比一時,并沒有考慮提高無人機的自主性。本論文描述了使用先進機器人系統工程實驗室(ARSENL)蜂群系統開發和測試自主FOB防御能力。開發工作利用了基于任務的蜂群可組合性結構(MASC),以任務為中心、自上而下的方式開發復雜的蜂群行為。這種方法使我們能夠開發出一種基于理論的基地防御戰術,在這種戰術中,固定翼和四旋翼無人機的任意組合能夠自主分配并執行所有必要的FOB防御角色:周邊監視、關鍵區域搜索、接觸調查和威脅響應。該戰術在軟件模擬環境中進行了廣泛的測試,并在現場飛行演習中進行了演示。實驗結果將使用本研究過程中制定的有效性措施和性能措施進行討論。
2019年,美國海軍陸戰隊司令大衛-H-伯杰將軍發布了他的規劃指南,作為塑造未來四年的部隊的一種方式。他在其中指出:"我們今天做得很好,我們明天將需要做得更好,以保持我們的作戰優勢"[1]。這句話摘自海軍陸戰隊司令大衛-H-伯杰將軍的《2019年司令員規劃指南》(CPG),呼吁采取集中行動,以應對海軍陸戰隊在未來戰爭中預計將面臨的不斷變化的挑戰。在為海軍陸戰隊確定未來四年的優先事項和方向的CPG中的其他指導,呼吁建立一個 "適合偵察、監視和提供致命和非致命效果的強大的無人駕駛系統系列"[1]。伯杰將軍進一步呼吁利用新技術來支持遠征前沿基地作戰(EABO)。EABO將需要靈活的系統,既能進行有效的進攻行動,又能進行獨立和可持續的防御行動。簡而言之,實現EABO將需要最大限度地利用每個系統和海軍陸戰隊。
從本質上講,伯杰將軍正在呼吁改變無人駕駛飛行器的使用方式。通過使用大型的合作自主無人飛行器系統,或稱蜂群,將有助于實現這一目標。無人飛行器蜂群提供了在人力需求和后勤負擔增加最少的情況下成倍提高戰場能力的機會。正如伯杰將軍所提到的 "下一個戰場",海軍陸戰隊將必須利用各種技術,最大限度地利用自主性和每個作戰人員在戰場上的影響。
目前的無人系統使用理論是以很少或沒有自主性的系統為中心。另外,目前的系統依賴于單個飛行器的遠程駕駛;也就是說,每輛飛行器有一個操作員。部隊中缺乏自主系統,這在監視和直接行動的作戰能力方面造成了差距。此外,側重于一對一操作員-飛行器管理的無人系統理論要求操作員的數量與車輛的數量成線性比例。這對于 "下一個戰場 "來說是不夠的。相反,海軍陸戰隊將需要能夠讓操作員擺脫束縛或提高他們同時控制多個飛行器的能力系統[2]。
考慮到這些目標,美國海軍研究生院(NPS)的先進機器人系統工程實驗室(ARSENL)已經開發并演示了一個用于控制大型、自主、多飛行器的系統,該系統利用了分布式計算的優勢,并將駕駛的認知要求降到最低。ARSENL在現場實驗中證明了其系統的功效,在該實驗中,50個自主無人駕駛飛行器(UAV)被成功發射,同時由一個操作員控制,并安全回收[3]。
這項研究的主要目標是證明使用無人機蜂群來支持前沿作戰基地(FOB)的防御。特別是,這需要自主生成、分配和執行有效的、符合理論的基地防御所需的子任務。這部分研究的重點是開發基于狀態的監視、調查和威脅響應任務的描述;實施支持多飛行器任務分配的決策機制;以及任務執行期間的多飛行器控制。
輔助研究目標包括展示基于任務的蜂群可組合性結構(MASC)過程,以自上而下、以任務為中心的方式開發復雜的蜂群行為,探索自主蜂群控制和決策的分布式方法,以及實施一般的蜂群算法,并證明了對廣泛的潛在蜂群戰術有用。總的來說,這些目標是主要目標的一部分,是實現主要目標的手段。
基地防御戰術的制定始于對現有基地防御理論的審查。這一審查是確定該行為所要完成的基本任務和子任務的基礎。然后,我們審查了目前海軍陸戰隊使用無人機的理論,以確定這些系統在基地防御任務中的使用情況。
在確定了任務要求的特征后,我們為基地防御的整體任務制定了一個高層次的狀態圖。子任務級別的狀態圖等同于MASC層次結構中的角色。
ARSENL代碼庫中現有的算法和游戲以及在研究過程中開發的新算法和游戲被用來在ARSENL系統中實現子任務級的狀態圖。最后,根據高層次的狀態圖將這些游戲組合起來,完成基地防御戰術的實施。
在游戲和戰術開發之后,設計了基于理論的有效性措施(MOE)和性能措施(MOPs)。通過在循環軟件(SITL)模擬環境中的廣泛實驗,這些措施被用來評估基地防御戰術。在加利福尼亞州羅伯茨營進行的實戰飛行實驗中,也展示了該戰術和游戲。
最終,本研究成功地實現了其主要目標,并展示了一種包含周邊監視、關鍵區域搜索、接觸調查和威脅響應的基地防御戰術。此外,開發工作在很大程度上依賴于MASC層次結構,以此來制定任務要求,并將這些要求分解成可在ARSENL蜂群系統上實施的可管理任務。這一戰術在實戰飛行和模擬環境中進行了測試,并使用以任務為中心的MOP和MOE進行了評估。最后的結果是令人滿意的,在本研究過程中開發的戰術被評估為有效的概念證明。
本論文共分六章。第1章提供了這項研究的動機,描述了這個概念驗證所要彌補的能力差距,并提供了ARSENL的簡短背景和所追求的研究目標。
第2章討論了海軍陸戰隊和聯合出版物中描述的當前海軍陸戰隊后方作戰的理論。還概述了目前海軍陸戰隊內無人機的使用情況,并描述了目前各種系統所能達到的自主性水平。
第3章概述了以前自主系統基于行為的架構工作,ARSENL多車輛無人駕駛航空系統(UAS)和MASC層次結構。
第4章對基地防御戰術的整體設計以及高層戰術所依賴的游戲進行了基于狀態的描述。本章還詳細介紹了用于創建、測試和評估這一概念驗證的方法。在此過程中,重點是對每一戰術和戰術所針對的MOP和MOE進行評估。
第5章詳細介紹了所進行的實戰飛行和模擬實驗,并討論了與相關MOPs和MOEs有關的測試結果。
最后,第6章介紹了這個概念驗證的結論。本章還提供了與基地防御戰術本身以及更廣泛的自主蜂群能力和控制有關的未來工作建議。
?在日益復雜的軍事行動環境中,下一代兵棋推演平臺可以減少風險,降低作戰成本,并改善整體結果。基于具有多模態交互和可視化能力軟件平臺的新型人工智能(AI)兵棋推演方法,對于提供滿足當前和新興戰爭現實所需的決策靈活性和適應性至關重要。我們強調了未來作戰人-機器交互的三個發展領域:由人工智能引導的決策指導,高計算力下的決策過程,以及決策空間的真實呈現。這些領域的進展將使有效的人機協作決策得以發展,以滿足當今戰斗空間日益增長的規模和復雜性。
關鍵詞:決策、交互、兵棋推演、人工智能、增強/混合現實、可視化
在傳統的兵棋推演中,指揮官利用一個共同的基于地圖的作戰地形,并在軍事決策過程(MDMP,方框1)中模擬各種因素的組合如何產生行動方案(COA)、可能的反擊行動、資源使用估計和預測結果(美國陸軍,1997年,2014年,2015年)。在幾天或幾周的時間里,MDMP過程導致了一套精煉的COAs,它對作戰環境做出了一定的假設,包括地形、天氣以及戰區資產的可用性和能力(即塑造支持主要作戰行動的活動)。
方框1. 軍事決策過程(MDMP) | |
---|---|
MDMP是美國陸軍解決問題的理論方法,從接到任務開始,到生成作戰命令結束。MDMP被用作一種工具,幫助指揮人員審查眾多的友軍和敵軍的作戰行動。MDMP的7個步驟在規劃新任務、擴展行動和執行訓練演習所需的決策過程中灌輸徹底、清晰、合理的判斷、邏輯和專業知識(美陸軍,1997年,2015年)。 | |
指揮官在接到任務后啟動了MDMP。在MDMP的第1步中,所有的工作人員和關鍵的任務參與者都被告知任務和待定的規劃要求,包括進行MDMP的可用時間量。確定進行任務分析所需的工具,并收集與任務和作戰區有關的文件。步驟2,執行任務分析,建立對任務的全面理解,包括關鍵的事實和假設,形成擬議的任務說明和任務分析簡報,為制定COA做準備。 | |
MDMP的第3至第6步著重于制定COA以進行分析和比較。這些步驟包括:第3步,制定COA;第4步,COA分析(兵棋推演);第5步,COA比較;第6步,COA批準。COA是對一個已確定的問題的潛在解決方案。每個COA都要使用篩選標準來檢查其有效性,如在既定的時間框架、空間和資源限制內完成任務。COA的選擇過程通常涉及到兵棋推演,它試圖在考慮到友軍力量和敵人能力的情況下,將行動的順序流程可視化,同時考慮到行動區域內平民的影響和要求(美陸軍,2014)。戰術模擬(兵棋推演)方法的好處是突出了作戰行動的優勢和劣勢。這往往是一個反復的過程,對作戰行動方案進行評估,然后根據需要進行修改,直到出現一個或多個具有最高成功概率的作戰行動方案來完成任務目標。 | |
在一個具體的行動方案得到指揮部的批準后,MDMP的最后一步是制作行動指令,這是一份給下屬和鄰近單位的指令,旨在協調所有參與任務的組織的活動。這一步驟涉及到所有受命令傳播影響的組織之間的積極合作,并建立起對局勢的共同理解。 |
盡管MDMP幫助指揮官了解作戰環境和考慮作戰方法,但這個過程有很多局限性,如時間密集、假設僵化、跨場景訓練的機會有限,以及將人工智能(AI)指導納入決策過程的機會很少。傳統上,一項任務的成功與指揮部執行MDMP的能力直接相關。然而,鑒于當今多域作戰(MDO)的復雜性增加(Feickert,2021年),有大量的任務指揮系統和流程,與行動相關的所有活動的整合和同步變得越來越困難,甚至到了人為無法完成的地步。由于MDMP的缺陷而導致的規劃專業知識的缺乏,可能會導致不同步和不協調的行動,從而最終導致士兵的生命損失。
MDMP中沒有具體描述戰斗空間的可視化能力,但它顯然在決策過程中發揮著重要作用。最近,集成了先進可視化能力的新系統和新技術已經被開發出來,它們可以提高態勢感知,從而增強決策過程。美陸軍的例子包括Nett Warrior(Gilmore,2015),它使下馬戰士能夠直觀地看到附近的友軍和敵軍,同時根據當地的地形協同規劃戰術任務。盡管這項技術將無線電和數字地圖擴展到了下馬戰士,但它缺乏一個底層的人工智能引擎來提供決策幫助。戰斗空間可視化和交互平臺(BVI,前身為增強現實沙盤,ARES)是陸軍技術的另一個例子,它能夠為任務規劃提供分布式協作,具有從任意視角和廣泛選擇設備的共同作戰畫面的二維和三維可視化能力(Su等人,2021)。BVI架構的制定是為了拉入外部計算服務,如分析管道、模型和人工智能引擎。美陸軍研究實驗室正在努力將這些類型的服務納入BVI,包括用于加強決策支持的人工智能。
目前,MDMP并沒有將人工智能指導納入整體任務規劃方法中。美陸軍的自動規劃框架(APF)(Bailey,2017)開始通過將自主技術插入MDMP工作流程來解決人工智能輔助決策問題。指揮人員可以通過APF的數字規劃呈現、規劃創建和規劃監控工具,在任務規劃和COA開發期間獲得背景援助。任務執行和估計能力通過監測任務的規劃和實際進展,為改進決策跟蹤和支持活動提供自動協助。盡管APF為MDMP引入了基本的自動化水平,但它缺乏Nett Warrior和BVI所提供的先進的可視化和用戶互動能力。
提供地面部隊自動化和用戶可視化能力的是美陸軍最知名的兵棋推演平臺--半自動化部隊(OneSAF),為計算機生成的地面部隊提供建模和模擬能力(PEO_STRI, 2022)。OneSAF提供了半自動和全自動的軍事實體(即士兵、坦克、直升機和綜合單位)的建模,在類似真實世界的戰斗空間中以不同的保真度來支持特定的應用和場景。OneSAF主要用于訓練,并與目前的任務指揮系統具有互操作性。它可以使用多分辨率的地形和詳細的實體相關數據庫來模擬廣泛的作戰環境。然而,OneSAF對地形和實體系統的高保真建模的優勢使得它的設置和運行成本很高。它受到老化系統的限制,而且眾所周知,士兵需要大量的培訓來學習如何操作模擬,使用起來很困難(Ballanco,2019)。OneSAF的復雜功能并不適合開發人工智能能力,以實現快速和敏捷的戰士-機器決策。
除了MDMP和上面提到的陸軍平臺外,最近將人工智能納入決策過程的工作包括一些方法(Goecks等人,2021a),在模擬人類決策過程方面取得了一些成功。一般來說,人工智能在決策變量有限的問題上取得了一些成功,如資源分配(Surdu等人,1999)、飛行模擬器(Drubin,2020)和更簡單的場景。正在進行的挑戰包括需要提高人工智能的能力,以解決有多個行為者、不完整和可能沖突的信息、不斷變化的單位行動和環境屬性的復雜決策,以及需要將這些決策的后果在許多空間和時間尺度和領域內可視化。
以下各節描述了對MDMP的潛在改進。"未來軍事決策過程所需的進步"一節概述了支持MDO決策的三個研究領域,并以圖表形式描述了這些研究領域與軍事理論決策方法之間的關系。"未來軍事決策過程所需的進步 "一節中的小節對每個研究領域進行了更深入的討論。"展望推進人-人工智能團隊決策的交互技術 "一節概述了未來的作戰人員-機器接口(WMI)的發展方向,重點是與決策有關的人-人工智能團隊的跨學科研究。
軍事決策過程在支持MDO復雜決策方面的局限性,突出了在三個研究領域的改進需要。首先,有必要將人工智能產生的指導和輔助決策支持納入MDMP。這既包括進一步開發和整合人工智能到戰斗空間決策規劃,也包括進一步改善人工智能決策過程的可解釋性和透明度(Chen等人,2018)。第二,有必要在戰略層面以及戰術邊緣,盡可能地將決策分析與高性能計算(HPC)的力量結合起來。這將能夠利用HPC系統的力量來支持建模、分析和計算時間,同時整合和同步來自所有戰區領域的信息。最后,有必要利用先進的可視化技術,如混合現實技術,對決策空間進行更準確和互動表述。不是簡單地在一個固定的時間尺度上顯示地形的二維渲染,而是需要可視化不同領域的決策是如何相互作用的,并利用混合現實技術來提高理解的吞吐量,并產生平面顯示不可能的洞察力。
除了MDMP之外,其他更廣泛適用的支持戰斗性問題解決的軍事理論包括:DOTMLPF[例如,學說、組織、訓練、物資、領導、人員和設施;(美陸軍,2018年)],這是一個確定差距并為當前和未來作戰要求提出設計解決方案的框架;以及METT-TC[例如,任務、敵人、地形和天氣、部隊、可用時間和民事考慮;(美陸軍,2019年)],這是一個結構化框架,用于捕捉任務相關因素的狀態,以便在軍事行動期間進行共享評估。這些理論定義了MDO戰場的信息背景,構成了應用于上述三個研究領域的軍事決策的核心基礎。如圖1所示,在為人類和人工智能指揮開發復雜軍事決策空間的新表述時,研究進展和MDO相關理論相互借鑒、相互啟發、相互加強(美陸軍,2010)。
圖1. 新型作戰人員-機器交互(WMIs)和人工智能輔助決策所需的三個研究發展領域,以支持和加強基本的MDO理論[右下圖來源:Lebsack(2021)]。
需要新的人工智能支持的WMI,以利用人工智能決策方面正在取得的進展,并為復雜的適應性決策的人工智能學習作出貢獻。在簡化的戰斗空間中測試人工智能決策輔助工具是開發過程中重要的第一步,也是將人工智能納入更成熟的戰斗空間平臺(即BVI、OneSAF)的前奏。開發用于決策輔助實驗的人工智能測試平臺可以在MDO中產生能力越來越強的潛在COA建議。圖2顯示了陸軍開發的兩個人工智能測試平臺的例子。
圖2. 兩個ARL人工智能測試平臺的例子。左邊:ARL Battlespace(Hare等人,2021)( //github.com/USArmyResearchLab/ARL_Battlespace )。右邊:ARL的Simple Yeho測試平臺。圖片由C. Hung制作。
人工智能測試平臺能夠開發出匯集所有領域信息的AI,并計算出人類和AI智能體的風險和預期回報。圖2的左側顯示了ARL戰斗空間測試平臺(Hare等人,2021年),它是從頭開始開發復雜決策的新型人工智能的理想場所。它對戰斗空間的抽象強調了軍隊相關場景下的核心推理原則,在這種情況下,用蜜罐進行網絡欺騙。較小的網格空間使人工智能的學習和發展能夠集中在不確定性下的復雜推理,有多個友好和敵對的agent。圖2的右側顯示了ARL的Simple Yeho測試平臺,它提供了將人工智能開發與更多真實世界場景中的默契推理結合起來的能力,有多個基于地形的海拔高度、視線范圍、障礙物、樹葉(隱蔽)、道路和城市區域。紅色陰影和黑色線條表示任務的起點和終點、左右邊界以及人工智能建議的路線。這種額外的真實性使其能夠與MDO理論相結合,包括DOTMLPF和METT-TC,并使人工智能與自然的、機會主義的士兵行為共同發展。這兩個人工智能測試平臺都可以擴展為傳統和沉浸式混合現實WMI開發平臺。
使用漸進式和可擴展的人工智能測試平臺,可以調查現有人工智能的幾個基本限制,特別是對于具有不確定性的復雜和適應性決策,以及人類和AI智能體的協作和對抗。對多智能體的協作和對抗性決策進行建模可能特別復雜,因為其遞歸性質,其他智能體是模型的一部分(Goldman,1973;Grüning和Krueger,2021),需要對決策特征、個性化的價值、風險規避、記憶和注意力進行動態和不斷發展的估計。這些具有高度不確定性、復雜性和動態性的情況是人類擅長的領域,適當設計的交互界面和人工智能測試平臺的人機協作可以提供加速和更有效的決策。對于有效的團隊合作,新穎的WMI應該幫助作戰人員篩選復雜的信息,并幫助人工智能發現決策的隱含規則。下面,我們提供了關于人機協作如何有效的案例。
多域兵棋推演中需要的復雜決策是開發有效人工智能決策輔助工具的直接挑戰。最近人工智能在圍棋、國際象棋、Minecraft和大富翁等游戲中的成功(Silver等人,2017;Goecks等人,2021b;Haliem等人,2021)是基于對世界現有狀態有完整了解的游戲(即 "開放 "游戲),而兵棋推演平臺通常包括關于作戰環境的不完整(如星際爭霸)、不確定或欺騙性信息(Vinyals等人,2019)。不確定性也可能來自變化的物理學或其他環境規則,正如在《憤怒的小鳥》中所探索的那樣(Gamage等人,2021)。由于世界狀態、不同行動者的狀態以及所采取的行動不確定性,知識的缺乏使得人工智能agent難以計算未來行動的風險回報情況(Cassenti和Kaplan,2021)。不確定性也限制了人工智能估計其他行為者的風險回報概況的能力,而這是計算有效的博弈論策略所需要的。人工智能被可能的最優和近似最優選擇的廣度所淹沒(Lavine,2019),即由于信息有限而選擇錯誤的選項,這種情況并不罕見,因為人類在制定有效探索隱藏信息的策略時,采用啟發式方法進行有效的選擇和預測(Gardner,2019)。為了幫助發展人工智能的隱性知識和探索能力,新型的WMI需要有效地解釋和展示決策景觀,以使作戰人員能夠快速和自然地瀏覽可能的選擇,同時使人工智能能夠在不施加認知負擔的情況下從人類的決策中機會主義地學習(Lance等人,2020)。這種機會主義學習可以包括:例如,凝視跟蹤,以捕捉吸引人類興趣和意圖的視覺區域和未標記的目標。它們還可以包括建立在自然的士兵選擇行為基礎上的行動者批評方法,以改善人工智能對人類專家在不確定、不完全信息和欺騙的情況下如何優先考慮某些選擇的學習,這取決于任務相關的背景。
開發人工智能的WMI的另一個基本挑戰是如何有效地整合和顯示MDO中所有五個領域的信息,特別是空間和網絡,因為這些領域的信息具有不同的時空尺度(Gil等人,2018)。對于網絡,決策的規模和速度可能比人類處理和理解的能力更快,需要人類的輸入來指導半自動化的決策,以及實施進攻和防御性欺騙策略的人工智能。WMI需要能夠以這樣的方式顯示決策圖景,即可以解釋一小部分最優和接近最優的決策策略(例如,圖3中的決策樹)。這應該包括對關鍵agent在不確定情況下的未來狀態和風險回報情況的估計(Hare等人,2020),以使有效的博弈論決策能夠被共同開發和相互理解。
圖3. 在頂部,是BVI網絡戰術規劃器應用程序中友軍與敵軍戰爭場景的三維視圖。三維視圖提供了一個比二維視圖更真實的決策視角,例如,顯示友軍(藍色)和敵軍(紅色)機載預警系統(AEWs)和周圍地形的海拔。這使得快速審查可能的視線和相對于周圍地形的感應。下面是人工智能的導航決策樹,為人工智能計算的幾個關鍵選擇的風險/回報概況以及它們如何映射到地形上提供透明度。這種抽象的決策空間還可以整合非空間決策,例如網絡欺騙。虛線表示與友方AEW的通信聯系和對敵方AEW的可能干擾。圖片由C. Hung制作。
這些挑戰為有效的WMIs設計提供了參考。也就是說,我們需要有能力從不同的來源(包括從其他國家的決策輔助工具)提取信息,以及一個能夠承載整合這些信息的計算能力的架構,同時還要處理基礎的人工智能計算(用于學習和部署)。我們還需要共同開發一個界面和算法設計,以適時地利用人類和人工智能agent的優勢并減少其局限性。
在復雜的決策過程中,需要大量的計算能力來處理和記錄所有組件、實體和狀態空間。從積累的動態狀態空間的數據集中建立過去、現在和預測模型,需要利用HPC資源來產生分析性的見解,并在決策背景下創建有用的表述。
實施HPC分析工作流程的一種方法是使用持久性服務框架(PSF)。PSF是一個最近可用的分布式虛擬化解決方案,它可以通過一個基于網絡的前端實現對HPC服務的非傳統訪問,而不像傳統的HPC環境,計算節點在特定的時間段內以批處理模式分配給用戶。此外,PSF提供對數據、數據庫、容器化工具集和其他托管平臺的分布式連續訪問(Su等人,2021)。
在一個PSF方法的例子中,一個模擬引擎連接到PSF,用于記錄人類和人工智能做出的所有決定。這允許分析在任務規劃和COA開發過程中發生的決策行為,以及識別決策模式和戰略,以開發競爭性和現實的兵棋推演場景。一個戰斗空間可視化平臺可以托管在PSF上,并使用消息傳遞協議來更新所有連接的設備接口。來自模擬引擎的狀態信息可用于生成戰斗空間和參與作戰單位的圖形表示。
使用PSF方法并利用HPC資源,可以實施人工智能輔助決策機制,利用大數據攝取和分析,同時可供地理分布的用戶用于協作決策工作和 "永遠在線 "的個性化培訓和紅色團隊。連接到PSF托管服務器的各種混合現實顯示模式可以支持一系列作戰場景,從戰略層面的指揮和控制到作戰邊緣的更多移動戰術使用。
用圖形表示各級行動的軍事決策戰略需要新的可視化方法,這些方法可以應用于以規則變化、認知狀態、不確定性以及個人偏見和啟發式方法為特征的動態環境(Dennison等人,2020;Hung等人,2020;Raglin等人,2020)。戰斗空間的視覺表現應該在技術上盡可能準確和逼真,但又保持在人類可以理解和解釋的認知水平(Kase等人,2020;Larkin等人,2020;Hung等人,2021)。融合了混合現實技術的先進可視化方法有可能更好地表現多領域戰爭的變化特征及其不斷變化的威脅和動態環境。隨著最近混合現實可視化設備的技術進步,成本降低,硬件的可靠性和實用性顯著提高,混合二維和三維可視化方法現在已經成為可能。
由多個二維顯示器組成的混合現實方法增強了更先進的三維可視化能力,可以為指揮人員提供理解復雜的兵棋推演狀態空間所需的洞察力(Su等人,2021)。當需要一個共享的戰斗空間表示時,可以通過在不同的可視化模式上實現多個協調的視圖來實現協作的戰略規劃模式,以根據分布式指揮人員的輸入進行互動更新。
BVI(Garneau等人,2018)平臺表示地理空間地形信息和地圖圖像,允許指揮人員建立和修改戰術任務規劃和COA。作為一個數據服務器,BVI將地形和作戰數據分發給支持多種可視化模式的客戶端應用程序,包括頭戴式顯示器設備、基于網絡的界面、移動安卓平板設備和混合現實設備(例如,HoloLens 2、Oculus Quest)。
例如,圖3(頂部)顯示了位于加利福尼亞州圣貝納迪諾縣歐文堡國家訓練中心的高分辨率地形上的友軍與敵軍的兵棋推演場景(Wikipedia, 2021)。與MDMP期間經常使用的傳統2D地圖顯示相比,戰斗空間的3D視圖可以從多個觀察角度提供更豐富的用戶體驗。三維視圖,在BVI的網絡戰術計劃器(WTP)中,將地形和人工特征的空間信息以及由MIL-STD 2525C符號描繪的單位位置可視化(美國防部,2014)。可以想象,地理空間視角,如BVI提供的視角,支持決策者對動態戰斗空間環境的理解。與可導航的人工智能增強的決策空間(圖3,底部)搭配,組合的視角可以使人們更好地理解視覺空間依賴性、影響和因果關系、估計的風險和價值、不確定性以及復雜決策的欺騙性。將這種以地理空間和決策為中心的視角與人工智能相結合,可以提供必要的廣度,以協調物理行動與網絡和其他非空間領域的行動,跨越多個時間尺度,并具有快速適應變化的任務目標的靈活性。
人工智能和人-人工智能團隊的快速發展需要WMI同步發展。隨著新型人工智能對有價值的COA產生更好的預測,并能更好地處理復雜的決策,它們也必須利用人類的專業知識,學習如何處理具有高度不確定性、欺騙、隱性知識和博弈論的決策。相反,人工智能的推理必須既抽象又能與兵棋推演環境相聯系,以實現透明和信任,同時又不造成過度的認知負擔。基于三維混合現實的WMI可以利用和增強人類固有的三維認知和預測能力(Welchman等人,2005;Kamitani和Tong,2006;Kim等人,2014;Boyce等人,2019;Krokos等人,2019),如果設計得當,其交互將感覺自然,同時擴大顯示多個領域的信息的能力,同時使AI能夠適時地從用戶的決策中學習。
我們強調了三個關鍵的發展領域,即人工智能引導的決策指導,支持這種指導的計算基礎設施,以及決策透明度的混合現實表現的發展。這些領域的進步需要跨越許多不同學科的專業知識。新的人工智能發展需要融合神經科學、心理學和數學的思想,以克服復雜決策中長期存在的問題的瓶頸。這包括跨時間尺度的學習和變化環境下的災難性遺忘,以及更具體的兵棋推演問題,如具有不確定性、欺騙和博弈論的多Agent決策。計算基礎設施也需要發展,因為計算能力和數據框架對于在戰術邊緣產生人-人工智能團隊的共同操作圖來說都是必不可少的。為了有效地開發,應該通過一個共同的框架來抽象出專有的限制和軟件的依賴性,并為使用和故障排除提供清晰的文檔,以使學術界、政府和工業界更好地專注于解決人與人工智能的合作問題。這個通用框架應該包括有效的信息傳遞,同時提供靈活性和適應性,以滿足人工智能開發和人類用戶在訓練和實際使用環境中的需求。最后,交互技術的開發本身需要跨學科的協同專業技術。一個基礎性的問題是如何壓縮信息使之被用戶有效地理解,以及如何最好地利用用戶的互動來進行機會主義學習。人類的大腦并不處理所有的感官信息,而是對世界進行預測和假設,以便在信息不完整的環境下節約計算。一個有效的WMI應該同時預測潛在的決策結果以及個人用戶的期望和假設。此外,人工智能決策輔助工具必須估計用戶的默契,使其能夠提供最相關的信息和最有希望的選擇,這些信息來自整個作戰領域。
信息作戰和指揮與控制(C2)是美國陸軍可以向盟友和伙伴提供的兩種能力。在未來的作戰環境中,不僅要為動能作戰做準備,而且要為混合作戰和以信息為重點的戰爭做準備。這需要在復雜和默契推理的人工智能能力方面取得進展,在能夠提供持續訓練、分布式混合決策和大數據分析系統方面取得進展,以及在人與人工智能協作決策和機會主義學習方面取得進展,以實現人工智能的持續進步和人與人工智能的共同適應。這些進展中的每一項都需要跨學科的計劃性努力,以克服復雜的技術挑戰,創造新的決策原則、理論和理論方法,包括持續開發綜合測試平臺和技術,以實現政府、學術界和工業界的合作和協同發展。
當前的海軍作戰要求水手們根據動態作戰環境中的不確定態勢信息做出時間緊迫和高風險的決策。最近的悲慘事件導致了不必要的傷亡,海軍行動中涉及決策復雜性,并特別突出了 OODA 循環(觀察、定向、決策和評估)中的挑戰。涉及使用武器系統的殺傷鏈決策是 OODA 循環中一個特別緊張的類別——具有難以確定的意外威脅、縮短的決策反應時間和致命的后果。有效的殺傷鏈需要正確設置和使用船上傳感器;未知接觸者的識別和分類;基于運動學和智能的接觸意圖分析;環境意識;以及決策分析和資源選擇。
該項目探索了使用自動化和人工智能 (AI) 來改進海軍殺傷鏈決策。該團隊研究了海軍殺傷鏈功能,并為每個功能制定了特定的評估標準,以確定特定 AI 方法的功效。該團隊確定并研究了 AI 方法,并應用評估標準將特定的 AI 方法映射到特定的殺傷鏈功能。
圖:利用人工智能改進海軍殺傷鏈的作戰概念
當前的海軍行動通常是快節奏的、關鍵的,并且需要做出高風險的決策,這些決策有時基于非常動態的戰區中的不確定信息。許多例子強調了提高決策效率的必要性以及減輕觀察團隊負擔的必要性。缺乏上述情況的例子包括 2017 年的菲茨杰拉德號航空母艦 (DDG 62) 和 MV ACX Crystal相撞,以及 2009 年皇家港口號航空母艦 (CG 73) 的擱淺。一些根本原因是相關人員缺乏經驗、疲勞和壓力.
上述事故展示了軍事行動的難度,并展示了 OODA(觀察、定向、決策和評估)循環中的挑戰(Jones 等人,2020 年)。人為錯誤、人的認知限制和海軍作戰固有的決策復雜性導致了 OODA 循環中的挑戰,更具體地說,是殺傷鏈過程中的挑戰。
現代戰斗空間由來自常規陸地、空中和海洋等多個領域以及來自太空和網絡空間的大量數據組成。決策者需要考慮許多因素,包括交戰規則 (ROE)、要使用的武器、傳感器和意圖評估。發現、修復、跟蹤、瞄準、參與、評估 (F2T2EA) 殺傷鏈模型緩解了該過程的一些困難(參謀長聯席會議,2013 年)。人工智能 (AI) 和機器學習 (ML) 可以通過分析備選方案和使用評估標準將 AI 方法映射到殺傷鏈功能,從而幫助海軍在戰術領域做出殺傷鏈決策。這是在本報告的五個章節中分三個階段完成的。
本報告利用了數百個資源,主要利用了美海軍研究生院 AI-OODA 團隊在其 Capstone 報告(2020 年)中進行的先前研究,“利用人工智能 (AI) 進行空中和導彈防御 (AMD):以結果為導向的決策援助。”他們將他們的工作與 John Boyd 的觀察、定向、決定和行動決策框架相結合。作為他們分析的初步步驟,AI-OODA 團隊將特定的 OODA 功能明確且緊密地耦合到特定的 F2T2EA 功能。然而,本報告斷言 OODA 循環是一個決策循環,它嵌套在殺傷鏈的每個功能中,而不是在高壓力或低壓力情況下專門映射到一個或多個殺傷鏈功能。團隊基于 F2T2EA 模型開發了一組 28 個殺傷鏈功能。
在制定將 AI 方法映射到殺傷鏈的評估標準時,很難確定一個好的決策,這對于決策評估至關重要。在評估決策時,必須考慮選擇行動時的知識意識狀態以及解釋能力。使用了幾種對決策進行評分的方法,從定義和優先考慮感興趣的“武器-目標”到制定評分標準和報告評估結果,以供其他人審查。
目前,人工智能的狀態非常廣泛,必須對其進行解釋,以了解人工智能對殺傷鏈中功能的適用性。本報告討論了所選 AI 方法的高級概述,并突出顯示了部分最流行的方法。首先,沒有普遍接受的定義,這很難定義人工智能。其次,人工智能與機器學習 (ML) 存在差異。 ML 允許在準確性和可預測性方面取得增量收益; AI 接收數據并通過算法提供輸出。人工智能的歷史從 1940 年代艾倫·圖靈 (Alan Turing) 的加密機器到 1980 年代美國政府在戰略計算計劃中的使用,再到今天在聯合人工智能中心 (JAIC) 中的人工智能戰略五個支柱,從領先的人工智能人力到安全和倫理。美國國防高級研究計劃局 (DARPA) 在 3-wave 框架中描述了 AI 的發展方向,分為手工知識 (Wave 1)、統計學習 (Wave 2) 和上下文推理 (Wave 3) 在 1-4 個維度內情報參數的屬性(Launchbury 2017)。這些屬性包括感知、推理、抽象和學習。
人工智能涉及可以根據輸入值預測結果的監督學習。有幾種使用監督學習進行學習的技術。包括線性回歸和分類。此外,許多數值方法可以分析發生的學習有效性,例如 F-score 和 Accuracy score。人工智能還可以使用無監督學習,它使用算法來發現未標記數據集中的數據模式或分組。在分析未知(y)響應以揭示標記(x)數據中的模式時,無監督學習是有益的。數據分析界的一個著名例子是鳶尾花(Iris flower)數據集。僅使用標記的數據,可以看到響應聚集在一起,并且可以確定響應中存在模式(花的種類)。無監督學習的方法包括聚類和 K-means,但還有其他方法。強化學習有一個代理能夠接收來自環境的反饋并理解基本目標。此外,正如 Sutton 和 Barto 在(2018 年)中解釋的那樣,探索和開發之間存在權衡。最后,生成對抗網絡 (GAN) 利用無監督學習和強化學習,通常用于神經網絡 (NN)。神經網絡是機器學習算法的極好來源,它有大量的輸入,而這些輸入又會產生大量的計算。 NN 非常適合用于模擬、自然語言處理、博弈論和計算機視覺。 NN 只是一種將輸入映射到輸出的簡單方法,可以在此過程中進行學習。然而,NN 可以被描述為一種“黑盒”學習技術,因為很難解釋正在發生的事情,并且通常需要一種可解釋的 AI (XAI) 技術。 XAI 的三個主要組成部分是可解釋模型、解釋界面和解釋心理學(Gunning 2019)。數據安全必須與“大數據”一起考慮,“大數據”是指非結構化、復雜和大型數據集,具有五個 v 特征:數量、速度(數據量隨時間變化的增加)、多樣性、真實性和價值。其他理論包括決策理論、模糊邏輯和效用函數
使用上述文獻綜述,該團隊開發了一個框架,用于將 AI/ML 映射到 AMD(空中導彈防御)殺傷鏈。采取了四個步驟:1) 建立模型框架,2) 確定決策點,3) 應用 AI/ML 方法,以及 4) 分析結果。該團隊確定了以下用于殺傷鏈映射分析的 AI/ML 方法:線性回歸、邏輯回歸、聚類、關聯、隨機森林、神經網絡、GAN 和樸素貝葉斯。評估標準被稱為“決策點”并提出四個問題:(1)所需輸出的類型是什么,(2)所需的學習類型是什么,(3)可解釋性(XAI)是什么水平需要,以及 (4) 需要多少個預測變量?該團隊通過基于一組決策點和評分過程評估每個殺傷鏈功能的每種方法來執行映射。對于被認為非常適合某項任務的方法,得分為+1,如果該方法適合但次優,則為0,如果該方法不適合該任務,則為–1。
該團隊進行了映射分析,根據與殺傷鏈的 28 個功能中的每一個功能相關的評估標準(決策點)分析 AI 方法。該團隊使用評分方法來確定每個殺傷鏈功能的最佳整體 AI/ML 分數。團隊的映射顯示為 0。
該團隊的 AI/ML 映射到殺傷鏈功能為國防部和海軍提供了兩個關鍵好處。首先,映射本身是設計和開發支持殺傷鏈決策的人工智能戰術決策輔助工具的重要起點和基礎。其次,該團隊將 AI 方法映射到殺傷鏈的分析過程可用于了解 AI 在許多其他軍事和非軍事領域的應用。識別適當的人工智能方法、制定評估標準和評分過程以及制定過程功能以進行分析映射的過程對于支持許多不同人工智能系統的工程具有深遠的潛力。
表1:AI/ML方法到殺傷鏈的映射
【報告標題】
Human Factors and ISR Concept Development and Evaluation 人為因素和情報、監視、偵察 (ISR) 概念開發和評估
【報告來源】
北約技術報告
【出版時間】
2022年2月
【研究問題】
情報、監視和偵察 (ISR) 行動是關于收集信息并向操作員提供信息,而操作員又需要就其戰區的各種行動方案做出具體決策。可以肯定的是,ISR 行動是技術密集型的。然而,與此同時,ISR 行動是一個非常以人為本的過程。盡管如此,ISR 概念開發和評估 (CD&E) 過程中幾乎沒有人為因素 (HF) 研究。通過研究新的ISR技術和概念對不同操作環境下操作員性能的影響,研究人員可以提供更科學的建議,為高層政策和決策者提供關于所有ISR環境下未來ISR技術和能力的信息:包括空中、海面、地下和空間。就這一點而言,HF 研究方法應成為任何 ISR CD&E 過程的組成部分,為 ISR 指揮鏈各級的政策和決策者提供信息和建議。
【研究目的】
北大西洋公約組織 (NATO) 研究和技術組織 (RTO) 人為因素和醫學 (HFM) 小組任務組 (RTG) 276 (NATO RTG HFM-276) 題為“人為因素和 ISR 概念開發和評估”,旨在識別和理解對有效 ISR 操作至關重要的 HF 問題。更準確地說,這項開創性工作的目標是:
1 確定有效 ISR 行動的關鍵 HF 問題(例如,態勢感知、工作量、組織結構、協調和協調機制、可視化、信任、信息共享和管理、領導力以及做決定);
2 使用行為理論模型來發展我們的研究方法并理解我們的發現;
3 就 ISR CD&E 操作中 HF 研究的使用和實施提出建議。
【結果、意義、影響】
北約 HFM-276 任務組使用組織有效性模型開發了一組調查,以識別和了解對有效 ISR 行動至關重要的 HF 問題。該模型的核心是由任務、收集、處理、利用和傳播 (TCPED) 組成的 JISR 流程。源自該模型以及其他來源的數據收集計劃著眼于 ISR 行動中的一些 HF 問題的作用:基本 HF 知識、情況評估、工作量、組織結構、信任、信息共享、信息管理、領導力、文化、組織過程、組織靈活性、共享意識和責任、協調和協調機制、決策、能力、情報請求管理(IRM)、通信、元數據和應用系統。所有這些 HF 因素都會影響 ISR 操作概念并影響操作員的績效。此外,該報告總結了一些改進北約和非北約行動的 ISR CD&E 過程的實際影響,重點是開發應包含在 ISR CD&E 過程中的 HF 研究方法。這種 HF 方法將像技術和程序 ISR 概念開發的質量控制組件一樣工作。預計研究結果將有助于為 ISR 指揮鏈各級的政策和決策者提供信息和建議,以增強北約 ISR 規劃、任務執行和能力發展中的信息和決策優勢。它還有望幫助告知 ISR 與其他聯合流程的整合,例如在確定當前與 ISR 相關的 HF 差距以及與其他流程整合方面的聯合目標。