亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

未來涉及全域聯合指揮與控制(JADC2)的沖突將需要在多域(空間/空中/地面/海上)殺傷鏈中對傳感、C2和目標資產進行整合和控制,并由自主、數據融合和人工智能等技術實現。為了支持關于在何處以及如何應用這些技術的決策,BAE系統公司開發了一個系統數字試驗臺,以實現對與基于模型的系統工程(MBSE)工具相結合的多領域系統的任務級分析。它提供了高保真性能分析模擬所缺乏的任務靈活性,同時允許納入高級算法能力(如自主性、AI/ML),這在高水平的活動模擬或行動分析工具中是不可能的。該測試平臺利用美國空軍仿真、集成和建模高級框架(AFSIM)以及波西米亞互動的VBS4游戲引擎來模擬場景。信息管理框架使用通過VBS4模擬SDK提取的信息來模擬傳感器、效應器和C2信息處理以及通過殺傷鏈的信息流。仿真套件符合DIS/HLA標準,允許納入其他仿真以進一步提高逼真度,還提供了一個信息傳遞網關,允許以標準的C2和信息傳遞格式(如OMS/UCI)交換信息。至關重要的是,信息管理層也允許靈活地納入技術,以實現信息管理的自動化并增強C2過程。在本文中,我們描述了JADC2所帶來的挑戰,以及系統分析對先進算法技術應用的極端重要性。我們討論了系統數字試驗臺的原理和結構、所采用的技術以及系統分析的方法。我們將介紹評估這些技術對改善任務級指標的系統貢獻的結果,如延遲、可擴展性和殺傷鏈反應的穩健性。

1 引言

1.1 聯合全域作戰(JADO)

聯合全域作戰是美國(US)國防部(DoD)的聯合作戰概念,其目標是將所有軍種和領域(空間、空中、海上、陸地、網絡和電磁頻譜)的能力統一起來,以更有效、高效和快速地應對先進技術威脅。JADO包括全域聯合指揮與控制(JADC2)[1],它將使所有軍種和所有級別的作戰人員能夠利用所有可用的信息 "感知、判斷、行動"。為了實現這一愿景,來自各自領域的部隊必須作為一個協同小組行動,獲得相同的數據和協調其目標的能力。美國部隊在有限的演習和具體的行動中顯示出有能力協調各部門和各領域的行動以實現目標,但目前這些行動需要廣泛的高級協調。未來的沖突將要求這種協調以 "速度和規模 "發生,即足夠快的速度來應對快速出現或變化的威脅,并同時針對數百或數千的目標。

雖然這個問題有很多因素,而且必須在從戰術到戰略的各個層面加以解決,但JADO/JADC2的基本挑戰可以概括為傳感器到射手的殺傷鏈,[2]也被稱為 "戰斗網絡"。[3] 我們所說的 "殺傷鏈 "是指一個系統鏈,它接收和處理有關單個威脅的信息("感知"),分享和解釋信息以評估完整的威脅情況及其潛在影響("感知"),并計劃和執行針對威脅的效果("行動")。值得注意的是,效果可能包括綜合使用傳統的動能武器來摧毀或破壞敵方資產,干擾等電磁干擾來破壞敵方傳感器或通信,網絡行動來破壞敵方信息系統,或者在某些情況下,信息行動來欺騙或誤導敵方人員。這里介紹的工作并不直接涉及信息作戰或網絡作戰,但正如我們在第4節討論的那樣,它有可能擴展到這些領域。

1.2 高級算法在JADO場景中的應用/部署

人工智能、機器學習和其他先進的算法技術在JADO和JADC2[4]中發揮著關鍵的使能作用。"感知、判斷和行動 "都涉及到在非常快速的時間尺度上處理大量的數據,需要在殺傷鏈的多個點上進行算法處理,以達到與擁有龐大、裝備精良和敏捷的軍事力量的對手發生沖突所需的速度和規模。此外,根據預先確定的要求設計并使用傳統技術驗證的傳統算法無法解決涉及適應性威脅的沖突情況。在下面的小節中,我們提出了三個代表美軍在JADO中所面臨的挑戰的概念性場景,說明了能夠在速度和規模上實現殺傷鏈的先進算法。雖然有許多方法可以對這些算法進行分類,但為了評估它們在JADO殺傷鏈中的效用,考慮將它們按 "感覺"、"判斷"和 "行動 "進行細分是有意義的。重要的是要注意,在幾乎所有情況下,人類作戰人員將保持 "循環",監督算法組件的運行,在某些情況下,"循環 "中,在交戰前需要人類確認目標身份。

需要指出的另一個關鍵點是,"感知、判斷、行動 "的結構,與美國和其他軍隊普遍使用的相關 "觀察、定向、決定、行動"(OODA)結構一樣,代表了一個決策循環,在兩個方面具有內在的層次性。首先,不同級別的指揮部將在更高級別指揮部的決策循環的時間周期內進行他們的決策循環嵌套。對于這里的例子來說,更重要的是,循環中的 "Make Sense "或 "Orient "元素往往需要采取行動來增進理解或收集更多信息。一個常見的例子是重新定位一個傳感器平臺或改變一個傳感器的配置。這反過來又需要一個二階決策/行動循環來為 "感知 "功能服務。我們在下面的三個方案中看到了這樣的例子,我們把這些步驟看作是 判斷"的元素。我們已經在第2節中描述的系統數字試驗臺中實現了所有三個場景,我們在第3節中介紹了第一個場景的系統分析的初步結果。

1.3 空中/海上防衛性反擊(DCA)

在這種情況下,由一艘航空母艦和多艘導彈驅逐艦組成的友軍航母打擊群(CSG),在敵方海岸附近的國際水域作戰。CSG包括專用的空戰管理(ABM)飛機,如美國海軍的E-2D鷹眼,以及一翼的戰斗機,如F/A-18或F-35。CSG還得到一架高空長航時(HALE)飛機的支持,該飛機能夠在受威脅地區上空長時間運行,并能有限地接觸到威脅的防空系統。CSG受到敵方轟炸機的威脅,能夠發射巡航導彈,破壞或摧毀CSG的資產,并由戰斗機護送保護。下面的圖1強調了由先進算法實現的幾種一般能力,下面將討論這些能力,使CSG能夠 "感知(SENSE)"、"判斷(MAKE SENSE)"和 "行動(ACT)",以迅速和自信地關閉殺傷鏈。

SENSE:傳感器資源管理(SRM)使用自主控制算法,可能由基于ML的技術實現,動態管理和控制平臺傳感器的配置,以優化傳感器處理,確保在具有挑戰性的環境中探測和識別威脅。在有大量目標的情況下,或者在物理或電磁環境影響傳感器處理的情況下,如雷達傳感器受到干擾的情況下,主動SRM可以大大改善探測和識別威脅的能力。

MAKE SENSE:自動化團隊共同作戰圖(COP)編隊在車輛之間共享信息,并將來自多個來源的信息進行關聯和融合,以產生所有車輛的共同圖像。這確保了所有車輛的決策,包括人工和自動決策,都在相同的信息下進行。團隊COP的形成包括兩個獨立的算法元素。首先,信息傳播算法必須決定在團隊成員之間分享什么信息。這一點很關鍵,因為在沖突環境中,干擾和干涉將限制共享信息的能力,因此,殺傷鏈的每個元素必須根據信息在整個團隊中形成一致的COP的價值,選擇并優先考慮與同伴共享的信息。其次,每個殺傷鏈元素的傳感器融合[5]算法將來自本地傳感器源和其他團隊成員的信息進行關聯和融合,以確保每個平臺 "看到 "相同數量的威脅,并對每個威脅應用相同的識別器。

MAKE SENSE:傳感器重新定位算法為機載傳感器,包括反彈道導彈和戰斗機推薦更新的路線,以提供更快速的目標定位和識別的細化。這些 "自動路由 "算法利用傳感器、平臺和威脅的已知特征來優化觀察角度或感應基線。如上所述,傳感器平臺的這種重新定位是一種 "ACT"形式,但由于它是為改進COP服務的,所以我們認為它是 "MAKE SENSE"的步驟。

ACT:武器選擇和任務分配算法審查威脅、任務目標和可用的資產,并推薦可供交戰的威脅,同時分配資產和武器。經人類批準,他們向武器提供任務,并監督武器的飛行和交戰。在這種情況下,交戰決定包括確定哪些敵機需要交戰--在這種情況下只需要交戰轟炸機以確保對CSG的保護,以及哪種友好資產應該進行交戰--在這種情況下是導彈驅逐艦。在更復雜的情況下,武器選擇和任務分配算法可能需要在多個不同的指揮結構中進行調解,以找到合適的資產,通常使用 "拍賣 "技術,其中每個潛在的交戰能力提供者對交戰進行 "出價"。[6]

圖1. 在DCA場景中,先進的算法協助人類作戰人員感知:優化傳感器性能以探測、定位和識別威脅;感知:分享信息和定位資產以確保整個團隊有一個一致的 "共同作戰圖"(COP);以及行動:選擇和分配適當的武器來對付即將到來的威脅。

1.4 空中/地面部隊保護場景

美國陸軍正在為未來的空中/地面行動開發一個概念,涉及部署一系列空中發射效應(ALE)系統[9],這些無人機系統(UAS)可以從較大的有人或無人飛機上發射,例如陸軍用于戰場情報、監視和偵察(ISR)的灰鷹UAS。ALE以小組形式運作,不受人類控制,執行一系列的偵察和攻擊任務,以支持陸軍的空中和地面行動。ALE小組執行這些任務的能力的核心是使用基于人工智能的算法來認識和了解情況,評估和分配ALE任務的目標,以及團隊行動或集群來完成共享任務。

圖2所示的許多功能與空/海場景中的功能相似,但由于系統的性質和任務,面臨著獨特的挑戰:

  • ALE系統的目的是在陸軍航空兵目前運作的近地面空間內運作。陸軍航空兵在沖突情況下的生存取決于避免被敵軍發現和瞄準,這就促使其盡可能地靠近地形作戰。由于地形的遮擋和視角的迥異,近地面作戰增加了整個ALE小組觀察信息的差異。

  • ALE系統的目的是在戰斗的前緣作戰,那里的電磁環境最有可能是有爭議的,導致可靠地和大量地交換信息的能力有限。低概率攔截(LPI)通信也更有可能被地形和其他障礙物打斷,進一步降低了可靠地分享信息的能力。

這些因素既意味著ALE小組必須采用不依賴于每個平臺上相同信息的算法,以有效地聯合執行任務。

圖2. 美國陸軍空中發射效應(ALE)飛機與較大的有人和無人直升機合作,執行偵察和打擊任務。

1.5 導彈防御場景

美國正在開發使用遠程超視距雷達(OTHR)的概念,用于預警和提示防御系統,以保護美國大陸免受巡航導彈等威脅。在導彈防御方案中(圖3),東北部的地面指揮和控制(C2)站由馬薩諸塞州和弗吉尼亞州海岸的地面雷達(TR)以及位于加利福尼亞州安大略省和北卡羅來納州的OTHR支持。C2站還得到了該地區的天基紅外監視(SBIRS)衛星的支持。在這個場景中,一架敵方轟炸機正在北大西洋上空飛行,并部署了兩枚高超音速巡航導彈。同時,一艘潛艇就在近海浮出水面,并發射了兩枚標準巡航導彈。這四枚導彈中的每一枚都被協調起來,瞄準一個陸地目標。地面站能夠根據從SBIRS衛星上收到的線索,為其TR和OTHR傳感器分配任務。地面站收到的所有數據都被處理成一個集中的共同軌跡圖(CTP),以便更快做出決定。如果一個來襲的威脅接近東海岸,并被SBIRs、OTHR和本地TRs感應到,那么在它通過每個傳感器的視場(FOV)時,可以保持威脅的存在,從而能夠更快地識別和響應。當CTP實現了對來襲目標的識別和信任時,地面站就能發射攔截器,在來襲威脅到達預定目標前將其消滅。

圖3. 美國陸軍空中發射效應(ALE)飛機與較大的有人和無人直升機合作,執行偵察和打擊任務。

這一場景涉及與其他設想類似的傳感器管理、數據融合和威脅應對能力,但值得注意的是,它提出了一個分層傳感架構,其中不同類型和不同能力的多個傳感器以互補的方式被采用。這種分層傳感架構的想法是許多現代防御概念的核心,但需要進行復雜的分析,以確定最佳的架構(傳感器的類型、傳感器的安排以及每種類型的數量和能力)來應對一系列威脅。

1.6 系統簇、任務和信息內容分析

雖然人工智能、機器學習或自主性的算法可以為復雜的系統中的系統(如JADO殺傷鏈)的運行增加重要價值,但其應用需要充分了解使用這些算法的好處、成本和風險。我們的工作是以這樣的評估為前提的:為了優化這些算法在此類應用中的應用,有必要進行三種相互關聯的分析: 系統分析、任務分析和信息流分析。每種分析都對我們正在建立的系統數字試驗臺的建模和分析能力提出了一些獨特的要求(第2節)。

我們的觀察是對建模和仿真工作的補充,這些工作討論了不同層次的仿真,反映在網絡安全和信息系統信息分析中心(CSAIC)最近發表的一篇文章中[10]。這項工作討論了四個層次的模擬,具有不同的復雜程度和時間尺度。這些模擬水平與我們的分析水平相吻合,如表1所示。

表1. 我們建議的分析水平與建模和仿真界討論的仿真水平一致。

系統簇分析評估系統簇的結構--構成系統的元素,它們的相互聯系,以及信息處理能力在該結構中的位置。系統分析要求對這些物理和信息流要素進行明確的建模,并要求能夠輕易地改變這些要素,例如探索不同的連接架構或能力放置的策略。例如,在導彈防御方案中,探測和擊敗來襲威脅的總體能力是單個傳感器性能和基于所有傳感器信息的C2能力的復雜功能,定義最佳架構需要對所有這些要素進行建模。

任務分析是根據任務級別的指標來評估系統的性能。我們的工作參考了新興的任務工程學科,如國防部在2020年向公眾發布的任務工程指南[11]。我們的工作反映了任務工程的兩個核心要素: 行動概念(CONOPS)分析和任務級指標。

作戰概念分析反映了系統元素在任務中的不同作用。例如,在空中/地面場景中,我們必須模擬這樣一個事實,即交戰決策需要人類戰士的批準,因此與交戰決策有關的信息流必須始終包括有人駕駛的地面平臺。

任務級指標要求評估整體任務的有效性,而不是單個平臺的有效性或性能。例如,在導彈防御方案中,我們可能希望了解增加地面雷達的范圍或精度的相對好處。雖然在局部層面上,這肯定會增加TRs探測目標的范圍,但雷達是分層傳感結構的一部分,這意味著單個雷達性能的變化可能不會對任務結果產生相應的變化。我們的測試平臺必須能夠對一系列不同的能力及其相互依賴性進行建模,并計算整體任務的有效性,如實現目標的時間,而不是簡單地評估局部性能。

信息內容分析評估存在于系統的每個元素的信息,以及它們之間的信息流,以評估系統的能力的性能。信息內容分析在高級算法的分析中特別重要,因為這些算法對其可用的信息有強烈的依賴性。算法的發展、完善和評估取決于以高保真度對驅動不同平臺信息的因素進行建模,因為這些因素很可能與任務執行相關聯,而這是不容易從信息交流的簡單統計或參數建模中預測到的。

例如,在空中/地面方案中,算法不是集中和同步執行的,而是將在ALE團隊的所有平臺上運行不同的數據,并且在可能無法可靠交換信息的條件下運行。因此,團隊的行為,以及整個團隊的有效性,將嚴重依賴于團隊之間的信息差異,因為對戰斗空間的觀察不同,團隊成員之間交流信息的能力不完整。為了評估先進算法對ALE任務的價值,我們必須對每個節點所產生的信息(如來自傳感器或機載導航系統)、節點間交換的信息以及算法執行所產生的信息進行明確建模。

2 系統簇數字測試平臺

2.1 基本原理

了解全域作戰的任務有效性歷來都是通過桌面模擬,最近則是基于計算機的模擬。戰役級和任務級模擬器(如OneSAF、STORM等)對作戰計劃(OPLANS)和行動方案(COA)進行多對多的情景分析,以研究、分析和訓練決策者。在大多數基于計算機的戰役模擬器中,有兩種主要方法來管理封閉性(即為玩家引入戰爭迷霧)以及行動事件結果:

1)傳感器的簡單邏輯決定了對手實體和狀態的可觀察性,包括對一個實體存在的知識、該實體的數量或這些實體所處的行動/狀態的估計。

2)基于啟發式的概率估計,以確定事件的可能結果(包括探測、擊中和殺死的概率)。

雖然這些工具和方法已被成功地用于進行兵棋推演、分析戰略和培訓決策者,但它們有兩個基本的限制。首先,基于啟發式的評估在調整和估計系統性能方面的能力有限(例如,可以實施射程、速度和殺傷力的改變來研究效果,但更復雜的系統增強,如數據融合和自主性,不能用啟發式數據來評估)。其次,這些多對多的模擬估計了實體或實體組層面的有效性,不能估計像鑲嵌式戰爭[12]和JADC2這樣的概念的性能或有效性。相反,我們需要的能力是能夠對平臺、傳感器和效應器進行足夠保真的建模,以便在系統層面對性能進行量化評估,根據這些模型模擬處理、共享和行動,并且能夠擴展到戰役級別的規模。

2.2 架構

JADO框架采用了真正的基于模型的系統工程(MBSE)方法,將基于物理的模擬和標準的SysML建模與一個共同的數據層相結合,以支持數字模型分析。該框架既能實現靜態的、可追蹤的系統工程,將數據元素(需求和規格)跨數字模型連接起來,也能實現動態的、可執行的系統分析。對于靜態評估,在方案開始時使用腳本直接鏈接數據,因此,架構和要求的變化會驅動對平臺/傳感器/武器模型的更新,這些模型是由其他組件模擬的。例如,改變SysML中的需求參數(如平臺的最大速度或傳感器的精度)將導致這些組件中的模型更新,直接影響其模擬性能,以評估該變化對任務有效性的貢獻。對于動態評估,測試平臺使用谷歌協議緩沖區(protobuf)格式來表示測試平臺內部的數據。Protobuf是一種快速和簡單的標準格式,允許快速擴展以適應額外的數據字段或消息類型。測試平臺利用Apache的ActiveMQ和Kafka作為消息代理,以發布和訂閱(pub/sub)的架構在測試平臺上移動數據。該架構通過使用API直接從Cameo SysML事件序列塊發送和接收消息而被整合到Cameo系統建模器中。這種方法允許代表系統功能的動態可執行架構在實時模擬中發揮直接作用,這些模擬延伸到物理虛擬模擬以及數據層。額外的軟件系統、應用程序或模擬器可以通過軟件和應用程序的墊片插入架構中。這種數據架構允許在需要時迅速增加額外的模擬器,在可用時整合數字模型,并促進實時數據共享,而不是使用不同組件對復雜的系統進行建模的傳統的、離線的串行分析。這種MBSE方法還有一個好處,就是能夠在架構內的相關位置(平臺或任務系統)應用和交易先進的算法(如數據融合、自動路由AI)操作模擬數據。

2.3 建模和仿真組件

如圖4所示,該測試平臺有四個主要的組件分組: 1)模擬主干,實時連接各種平臺/傳感器模擬器,為場景中的平臺建模;2)Cameo系統建模器,為系統的靜態和動態表示定義SysML表示;3)數據/網絡層,允許表示戰術數據和模擬通信,以促進實體之間的數據移動;4)算法層,整合和交易實時AI算法(如數據融合、自動傳感器任務、自動路由等),優化系統的性能。

仿真骨干網利用IEEE標準的分布式交互仿真(DIS)協議來連接測試平臺內的多個實時仿真器。當系統評估需要系統加速時,則采用自定義的比實時更快的(FTRT)協議。仿真管理器用于處理每個仿真器之間的場景和數據同步,以及與系統其他部分的同步。目前,AFRL的AFSIM和Bohemia Interactive Simulations Virtual Battlespace 4 (VBS4)被用來模擬海陸空平臺的組合,所有這些平臺都能在VBS4的基于游戲的三維渲染引擎中得到可視化。此外,我們對這些模擬器進行了擴展,允許基于物理學的傳感器建模(包括雷達、ESM、EO/IR),以實時生成真實的傳感器報告,作為場景的藍色可觀察狀態(一個部分可觀察的游戲問題)。

采用Cameo系統建模器,使用SysML建模語言提供場景內關鍵部件的系統級表示。使用這種基于模型的系統工程(MBSE)方法,我們實現了兩件事。首先,通過可追蹤的系統工程,對系統組件屬性/要求的更新對仿真空間內的平臺/傳感器性能有直接影響。例如,調整對平臺的要求,使其飛行速度提高2倍,或使傳感器看得更遠2倍,對仿真空間內的這些能力產生直接影響。

Vignette指標是通過Elastic的堆棧(Elasticsearch、Logstash和Kibana)生成和顯示的,它提供了一堆工具和庫來存儲數據,對其進行搜索,并將其可視化。度量儀表盤可用于實時和取證的目的:運行中的Kibana儀表盤顯示隨著運行的進展而更新的度量,取證儀表盤用于比較多個運行的性能。

當Vignettes運行時,場景的狀態在基于NASA WorldWind的C2顯示器中被可視化。該用戶界面主要顯示 "任務層 "的細節,即實體實際認為他們看到的東西,這取決于正在使用的模型,可能與 "現實 "有出入。這使得人們能夠更深入地了解不同實體所看到的東西,并根據他們所掌握的信息來考慮。

第二,復雜、關鍵的系統可以使用事件序列圖進行動態建模,以模擬需要自動或半自動決策的系統內的延遲和不確定性。例如,我們對 "宙斯盾 "武器系統進行建模,以動態地執行接收遠程交戰跟蹤請求的系統行為,通過決定使用可用的、有能力的導彈系統來起訴該目標。

圖4. JADO測試平臺組件和架構在任務、系統/子系統和算法層面的仿真橋接

對于數據層,我們實現了谷歌Protobuf模式,以表示戰術戰斗管理指揮和控制(BMC2)信息(例如,軌道更新、任務請求、傳感器報告),并通過消息排隊服務將該信息路由到訂閱各種消息類型的組件。然后,我們整合了NRL的可擴展移動特設網絡仿真器(EMANE)框架來模擬場景內各節點之間的網絡,使用仿真集成和建模高級框架(AFSIM)和VBS4實時更新來模擬節點位置/移動,同時在EMANE內定義天線性能和網絡模型。這種技術使我們能夠準確地模擬節點在場景中發送/接收信息的吞吐量和延遲效應(包括干擾考慮)。

在算法層,我們創建了人工智能組件,這些組件可以作為自主處理能力附加在場景內的平臺/系統上,利用先進的人工智能技術來交換系統和系統的性能。其中一個組件是之前提到的CONSENSUS能力,我們在不同的節點內實施數據融合工程師,然后采用InfoBroker來優化整個EMANE網絡模擬的信息流。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

集群是一項顛覆性的、改變游戲規則的技術,其基礎是協調使用在多個領域(空中、地面、海上、太空)運作的多個無人駕駛系統。新的微電子技術、制導和導航技術、傳感器和人工智能技術的發展使得低成本、微型無人機器人能夠執行具有挑戰性的任務。當與新的決策、目標跟蹤、通信技術和算法相結合時,蜂群可以在戰場上產生非常顛覆性的影響,其應用范圍包括持續的和未被發現的監測,以及提供關鍵的防御能力,如游蕩彈藥。本文介紹了歐洲在蜂群方面的活動,并就其對國防和民用部門可能產生的改變游戲規則的影響提出了見解。

關鍵詞:無人系統(UxV),自主性,決策,目標跟蹤,引導和控制,傳感器融合,情報、監視和偵察(ISR),無人交通管理(UTM)。

1 引言

無人系統集群(UxVs)由大量異質無人車(空中、陸地、海上)組成,作為自主 "系統"的智能群體運作,具有決策、目標跟蹤、制導和控制、傳感器融合和指揮能力,作為單一智能群(自主系統)運作。如果利用機器人、人工智能(AI)、通信、制導和控制、傳感器融合、航空航天和無人交通管理(UTM)等領域的發展,將無人系統群設計成蜂群或鳥群,使其具有必要的智能和自主性,就能為國防部門創造顛覆性的、改變游戲規則的能力,將數量和智能、智慧技術的優勢相結合。無人系統群可以創造出前所未有的能力,可以提高歐洲的安全和國防能力,同時對其他非國防部門產生顛覆性影響,如城市交通、UTM、自動駕駛或機器人技術。在國防方面,無人駕駛車輛的聯合使用可以限制人類在危險環境中的風險/暴露,允許枯燥和骯臟的軍事行動發生,如對大面積地區(如地中海、歐洲邊界)的持續監測,甚至可以在未來的軍事場景中用來迷惑和壓倒對手。圖1顯示了一個多領域(空-空-地-海-空)的無人系統群概念,用于保護和提供對高價值資產(如軍營/駐地)的持續監視,這是在2016年EDA研發試點項目EuroSWARM中首次提出。

圖1:多域蜂群概念(空-空-地-地)。

2 集群技術

無人系統(UV)集群是由自主或半自主的飛行器組成的群體,它們相互協作以達到共同的目的。無人系統群體可以在國防應用中用于各種任務,如偵察、監視、目標獲取和打擊行動。本節探討了用于國防應用的集群的三個主要特征:(1)總結了使高效集群發展的最關鍵的能力和技術,(2)設計集群時使用的主要架構模式,以及(3)一些經常結合起來描述集群國防應用任務的作戰類型。談到集群設計,有四個主要的技術模塊必須考慮國防應用[1]。每個模塊對集群的性能和穩健性起著非常重要的作用,從感知能力到集群通信協議[2]和路由[3]。

1.感知: 感知能力對于無人系統群的成功至關重要。感知能力使集群能夠感知和了解它所處的環境,探測障礙物,識別目標,并保持態勢感知。有效的感知能力使集群能夠在復雜和動態的環境中運行,并以極高的效率執行廣泛的復雜任務。機器學習和人工智能技術可以增強這些能力,通過傳感器融合,集群可以在以前不可能的水平上實現態勢感知。

2.任務分配和決策: 任務分配和獨立決策對于集群的成功至關重要。有效的任務分配確保每個機器人被分配到與其能力相符的具體任務,從而優化可用資源的使用。集群可以彌補一個或多個機器人的失敗,而任務分配有助于分配決策,使集群能夠快速適應不斷變化的環境。任務分配也有利于適應性、可擴展性和更快的決策,使集群在動態和不確定的環境中更加有效。集群能夠通過集群的機器人之間的無縫數據交換做出更好的決定。這使得資源得到有效利用,提高了魯棒性和容錯性,改善了適應性,大大增強了可擴展性。

3.路徑規劃和消除沖突: 當涉及到集群時,預計會有大量的機器人。這使得路徑規劃和解除沖突的方法對高效和安全的集群操縱至關重要。集群中路徑規劃的目標是為每個機器人找到一條到達目的地的最佳路徑,同時避開障礙物,并使所需的時間和能量最小化。解除沖突確保機器人不會相互碰撞,使每個機器人都能成功完成其任務。例如,在監視任務中,路徑規劃可以優化機器人的路線,以盡量減少重疊,增加覆蓋面積。路徑規劃和消除沖突可以通過各種技術實現,包括集中式和分散式方法。集中式方法包括由一個實體來規劃和協調集群中所有機器人的路徑。另一方面,分散式方法涉及每個機器人根據本地信息做出自己的路徑規劃決定。

4.通信: 當機器人之間的通信是無縫和強大的時候,集群的運行是最理想的。通過傳感器融合,集群可以提供具有更高確定性和分辨率的信息。有效的通信協議使機器人能夠共享信息,如他們的位置、狀態和任務分配,而路由將負責尋找信息在機器人之間傳播的最佳路徑。這使得集群能夠團結一致地運作,協調行動,并實時分享信息。通信協議和路由可以通過各種技術來實現,如特設網絡、網狀網絡和多跳路由。特設網絡允許機器人直接相互通信而不需要固定的基礎設施,而網狀網絡使機器人形成一個具有冗余路徑的網絡進行通信。多跳路由涉及將信息從一個機器人傳遞到另一個機器人,直到它到達目的地,從而實現更遠距離的通信。

無人系統群是利用通信協議來交換信息的,而協議是由任務的具體要求以及車群的特點決定的[4]。有三種主要的架構方法可用于設計國防應用的無人系統群,包括:

1.集中式架構:在這種方法中,集群中所有無人系統的運行都由一個中央實體協調,如地面控制站。中央實體與集群的代理進行通信,收集數據,處理數據,并作出明智的決定。這種方法適用于小規模的集群和簡單的任務。

2.分布式結構:在這種方法中,沒有中央實體,集群中的每個無人系統都獨立運作,根據本地信息做出決定,并將其信息與鄰近的車輛進行交流。這種方法適用于大規模集群和復雜任務。

3.混合結構:這種方法結合了集中式和非集中式結構的優點。在這種方法中,有一個中央實體向無人系統提供高級指導,而每個無人系統都配備了本地決策能力。

無人系統群呈現出大量的軍事應用,能夠執行各種不同的任務。這里確定了自主集群的一些關鍵操作類型的例子。提出的操作可以組合成一系列的任務。

1.區域覆蓋: 在區域覆蓋操作中,集群的任務是利用機器人配備的傳感器掃描一個特定的領域。在大多數情況下,希望區域覆蓋是全面的,必須對該區域進行全面掃描。多無人系統區域覆蓋問題的常見方法包括使用分解技術將感興趣的區域劃分為一組子區域,并將每個子區域分配給一個機器人。對于異質群,在區域分解過程中必須考慮到傳感器的范圍、機器人的流動性和電池的自主性,以提高系統的效率[5]。在每個機器人被分配到一個子區域后,機器人在其區域內獨立規劃其路徑。在[6]中介紹了覆蓋路徑規劃方法的調查,總結了二維、三維和多機器人區域覆蓋的最常用方法。

2.全面和持久的區域覆蓋:全面和持久的區域覆蓋要求集群的部署方式能夠在整個任務期間提供整個給定區域的傳感器覆蓋。集群的機器人應考慮其傳感器的范圍和可能的環境特征(例如,障礙物或遮擋區域),創建一個編隊。機器人以靜態隊形部署,或以動態隊形部署,以防區域特征或所需監測的區域隨時間變化[5]。主要目標是設計一種編隊模式,以最小的機器人數量實現全面的靜態覆蓋。

3.區域搜索: 在區域搜索行動中,機器人群的任務通常是在一個感興趣的區域內尋找特定目標。在這種操作中,不需要對該地區進行完全或全面覆蓋。機器人群必須探索該區域,目的是在最短的時間內識別目標。機器人必須在任務期間進行合作,它們使用在線決策和路徑規劃技術,根據它們對環境的感知和機器人群中其他機器人的行為改善系統的性能。區域搜索算法可以被調整以考慮目標分布的概率。生物啟發的集群算法已經引起了科學界對區域搜索行動的興趣[7], [8]。

4.區域監視: 區域監視行動要求機器人群持續地監視一個給定的區域。區域監控通常用于巡邏、監測、探測突發或動態威脅以及邊境安全。目標通常被定義為在長時間內最小化區域的最大年齡(即自上次訪問以來所經過的時間)[9]。

5.目標跟蹤: 通常情況下,目標追蹤行動涉及一個目標和一個機器人。機器人的范圍是根據其感官數據和對目標位置的估計,以及在某些情況下對目標的預測行為或未來位置的估計,在線規劃其路徑[10]。機器人必須引導自己不斷跟隨目標。隨著機器人群功能的引入,目標跟蹤問題可以被增強為一個多機器人問題,跟蹤單個[11]或多個目標[12]。

總的來說,為國防應用設計機器人群需要仔細考慮幾個因素,包括任務要求、機器人群規模、通信能力和計算資源。

3 集群項目和應用

3.1 EUROSWARM

EuroSWARM[13]項目(為國防應用中的無人機蜂群開發技術)是歐洲防務局的一個項目,該項目于2016年11月-2017年11月舉行,聯合體由來自希臘、英國、法國和瑞典的4個合作伙伴組成。該項目的關鍵技術,包括靜態傳感器網絡設計、移動傳感器任務分配和信息融合,能夠開發出用于商用無人駕駛車輛的新型算法。這些算法具有低計算能力要求、靈活性和可重新配置性。在圖2中,介紹了項目的結構和使用的模塊。基于貪婪地排除技術的任務分配算法確保了實時的接近最優的任務分配,允許在快速變化的環境中進行有效的蜂群控制。通過無人機的空中傳感、自主行為監測的一般框架和軌跡分析工具,實現了增強的態勢感知。傳感器融合技術和分散的跟蹤算法支持自動目標檢測和跟蹤,增加了系統的可靠性和容錯性。為移動車輛設計了一個反應式和分布式合作制導法,解決了任務和安全目標,以及車輛和靜態傳感器網絡之間的相互作用。這些蜂群技術在戶外環境中的實際演示驗證了這些算法和技術在軍事和執法應用中持續監測的有效性。

實際演示結合了前面幾節介紹的所有集群技術,在一個按比例的戶外環境中進行了模擬和驗證。由于時間和預算的限制,測試區域的大小是有限的,用于形成機器人群的無人平臺是基于市場上的COTS系統。實際演示的主要目的是建立演示環境、通信網絡,并測試持續監測場景下的蜂群功能。實施了代理、車輛類型和目標數量的多種組合,以評估同質(同一類型的車輛/傳感器)和異質車輛(光學/紅外傳感器、固定翼/四旋翼無人機)。

3.2 低可觀察性戰術無人機系統--Lotus

LOTUS項目(低可觀測戰術無人機系統)是一個EDIDP項目,財團由來自希臘和塞浦路斯的9個合作伙伴以及來自西班牙和荷蘭的另外兩個合作伙伴組成。該項目于2020年12月啟動,持續時間為45個月,由Intracom防御公司領導。通過LOTUS項目,一個最先進的無人駕駛飛行器(UAV)系統被設計用于戰術空中偵察和監視任務。它擁有幾個關鍵特征,包括躲避敵軍的隱身特性、對峙作戰能力、適航性和基于北約標準的互操作性,以及考慮到網絡安全的可靠通信。此外,該系統還廣泛采用了人工智能,確保其能夠高度準確地執行復雜的任務。該母艦配備了多個ISR傳感器,設計為低可觀察性和高續航能力,并加入了自我保護系統,以應對敵人的威脅。它可以部署四個管狀發射的可折疊翼無人機,這些無人機具有先進的自主功能,使它們能夠執行復雜的ISR任務。母艦和無人機共同組成了一個強大的蜂群,可以無縫運行,為地面的決策者提供關鍵的情報和監視數據。在圖3中,地面目標的智能任務分配(左)和合作覆蓋(右)是通過帕特雷大學開發的蜂群算法執行的。

3.3 自主的、可重新配置的無人駕駛車輛群在國防方面的應用 - ACHILLES

ACHILLES項目(用于國防應用的自主、可重新配置的無人駕駛車輛群)是一個EDA項目,其財團包括希臘和德國的工業和大學。

該項目于2023年1月啟動,由佩特雷大學牽頭,涉及工業界(ATOS、DroniQ、Scytalys、Intracom Defense)和學術界(佩特雷大學、英戈爾施塔特技術學院和雅典大學)。該項目旨在通過提高自主的、可重新配置的無人駕駛車輛群的TRL來推動無人駕駛車輛群在國防領域的發展和使用,并展示無人駕駛車輛群在國防領域持續監測的能力和準備水平。無人駕駛車輛群的多種好處和潛在應用已被認可,并成為ACHILLES項目的靈感來源。最近的科學和技術進步使無人駕駛車輛能夠自主地收集關鍵數據,以提高對形勢的認識。可擴展的、自主的和可重新配置的蜂群可以實現高效的代理協調,并且對故障事件(例如,代理的損失)有很強的適應性。項目的預期成果和創新包括形成新的蜂群能力,以及以安全和高效的方式將無人機納入軍事和民用空域的方法。預計產生的能力將支持基于無人機群的系統和技術的成熟和驗證。

3.4 使用有人-無人系統的車隊行動--COMMANDS

COMMANDS項目(有人無人系統車隊行動)是EDF的一個項目,由來自10個成員國的21個合作伙伴組成的聯合體。該項目于2022年12月啟動,由Sener航空航天和防務公司領導,執行時間為3年,并得到了七個國防部的支持,提供了共同的要求。COMMANDS項目旨在為敏捷、智能和合作的有人和無人系統開發全壽命能力(TLC)。幾個模塊系統將成為這個項目的一部分,通過無縫的功能服務和數據交換實現群集能力。載人和無人地面車輛以及無人機將是該系統的一部分。該項目將消除風險并利用技術來解決自力更生的歐盟國防TLC可持續發展的路線圖。這些成果將升級目前的地面車輛,并被整合到未來的車輛中。技術演示計劃包括一個實驗室和一個真實場景的移動演示器,重點是具有部隊保護的最后一公里再補給車隊。

3.5 無人駕駛交通管理: 歐洲無人機和大都市2

集群技術正被用于民用領域,包括自動駕駛、無人交通管理(UTM)和城市流動。EuroDRONE和Metropolis 2是歐盟SESAR資助的活動,已經證明了集群/自主技術在民用空域安全運行的成功實踐,在物流、安全、醫療貨運和精準農業方面有重要的商業應用[14]。EuroDRONE是歐洲首批UTM測試中心之一,由帕特雷大學開發和協調(2019-2021)。

4 影響

集群技術使大量的無人機變得高度互聯,有能力有效地計劃和分配任務目標,做出協調的戰術決策,并在最小的監督下對動態環境做出協作反應,同時向人類操作員提出建議。隨著蜂群技術的成熟,蜂群軍事技術的使用是不可避免的。許多人認為,蜂群的發展可與精確制導武器的發展相提并論,后者在20世紀70年代和80年代進行了測試和改進,但在20世紀90年代初的第一次海灣戰爭中才開始發揮其作用。蜂群的使用可以使載人防御系統在簡單的、低/中水平的、監測、監視防御場景/任務中的使用變得過時,并對攻擊系統進行補充,以分散或限制敵方部隊。在未來的幾十年里,遠程操作的單體無人飛行器,如無人機,將逐漸變得過時,因為空中、地面、海上的無人系統將能夠部署多個飛行器并作為蜂群操作,從而擴大各種防御任務的范圍、監視、ISTAR和攻擊能力。

在國防方面的顛覆性影響 大量(10-100s)的異質無人系統群作為智能單元運行,可用于執行骯臟、危險和枯燥的任務(持續監測)或擾亂對手(攻擊敵方戰略地點/資產),同時減少人類風險和成本。無人系統群可以成為一種獨特的防御能力,這種能力目前還不存在,處于低技術準備水平(<3)。
激進的愿景 無人系統群是一個縮影或激進的愿景,使歐洲新的防御能力,并為無人駕駛/自主系統和防御創造一個新的范式。無人系統群利用歐盟/北約以前在UTM、機器人、傳感器、自主性、無人駕駛飛機等領域的國防研發(EUROSWARM、ACHILLES、COMMANDS)和H2020活動(EuroDRONE)來創造一個高風險/高收益能力(無人系統群)。
突破性的技術目標 未來在空中、陸地或海上使用數以百計的無人系統群將創造一種新穎的、雄心勃勃的能力,并取得突破。正如在中東和烏克蘭已經顯示的那樣,使用協調的多倍的無人機智能體可以擾亂軍事理論和行動。
軍事意義 集群可以成為歐洲主導的史無前例的防御能力。作為一個智能單元運作的多個UxVs將能夠執行破壞性任務,從持續的大面積監測(執行枯燥、危險、乏味的任務)到在利基行動中壓倒對手,最大限度地減少人員風險、任務成本和提高態勢感知能力。

表1:集群的創新和影響

集群可以在多個具有社會和經濟利益的領域做出重大貢獻,如無人駕駛交通管理、自動駕駛和城市交通,所有這些都利用了集群技術。圖3顯示,根據知名金融機構的預測,到2030年,集群系統的綜合市場領域可以達到近9000億歐元,對民用領域有明顯影響。

5 結論

北約的多個防務機構已經宣布打算將集群技術應用于現有的武器系統,如F-35戰斗機/攻擊機、英國的Tempest下一代戰斗機和三方(法國、德國、西班牙)的FCAS飛機/無人機系統。顯然,集群技術正在被整合到世界各地的軍事能力中,并開始影響國防能力。集群是一項關鍵的防御技術,它將使多個技術領域得到直接改善,如嵌入式集群、自動化和自主系統的人工智能技術、在非結構化、快速變化、受限和有爭議的環境中執行的防御系統合作行動的安全性、效率和有效性。正如在烏克蘭和中東沖突地區所顯示的那樣,蜂群正在通過使用無人機群和閑置彈藥來改變戰爭。因此,為歐洲的國防、安全和繁榮開發自主集群系統是非常重要的,并且可以將關鍵技術轉到民用部門,如運輸、機器人和人工智能。

付費5元查看完整內容

本文提出了一個海軍作戰管理系統(CMS)架構,考慮到電子戰(EW)與人工智能(AI),以應對現代高超音速和低觀測能力的威脅,其中反應時間可能很短,需要自動化。它使用一個反制措施案例研究作為數據要求,拍賣傳感器任務,人工智能過程,以及認知復合感應的數據融合。該文件還強調了已經公布的關鍵認知電子戰能力,以證明該架構的合理性。該架構的方向是用高反應時間的自動化人工智能驅動的認知DM來取代人類決策者(DM)。

引言

當把人工智能(AI)應用于電子戰(EW)時,它不僅要幫助決策者(DM)進行態勢感知(SA),還要滿足點、區域和區域防御以及反目標活動的需要。電磁波譜是密集的,有許多通信和雷達發射器。因此,挑戰在于如何將人工智能應用于能夠滿足管理部門需求的EW系統。因此,它必須能夠整理出感興趣的信號(SoI)[1],如部隊的信號和與指定任務無關的信號。這項工作的基礎是 "常規戰爭 "中的反導彈反應,以便與傳統的交戰進行更直接的比較。影響反艦導彈(ASM)成功的一些主要因素是雷達橫截面(RCS)、紅外橫截面(IRCS)、視覺和紫外線(UV)特征。因此,目標艦的特征是決定被動軟殺傷[2]反措施(也叫伎倆)性能的一個基本因素。然而,反坦克導彈也可以使用主動雷達尋的方式進行瞄準和跟蹤。因此,射頻(RF)和微波(MW)的截面特征是重要的,同時還有光輻射量子(或光子)、方位角和機動中的方位率,以及它們的戰術影響。因此,現代操作環境在處理電磁波譜方面存在挑戰,人工智能的自動化和自主性是解決這一挑戰的理想選擇。

A. 動機、方法和限制

本文描述了一個架構,其中包括用糠和干擾器進行軟殺傷;用導彈、火炮和火控系統進行硬殺傷;以及一個跟蹤目標并協調軟殺傷和硬殺傷反應的指揮和控制系統。本文僅限于假設反坦克導彈是使用射頻主動雷達尋的目標和跟蹤的海上滑行。因此,這項工作的中心是簽名管理、大型目標船的規避動作、船上被動型誘餌系統(如金屬箔片和反射器)的操作性能,涉及反坦克導彈的跟蹤方案和交戰環境,包括風速和風向。擊敗導彈威脅的一個基本因素是反應時間;隨著高超音速的出現,時間因素成為反應殺傷鏈的決定性因素。潛在導彈平臺的識別標準是最基本的;它們將允許更精確的SA,迅速讓DM消除發射平臺。鑒于反導鏈反應的時間很短,人的頭腦無法計算巨大的信息量,并在短時間內決定反應的類型,要么是硬殺傷,要么是軟殺傷,要么是兩者兼而有之;那么人工智能就成為反導系統中的基礎[3] [4]。因此,人類的DM理論不能用于遙遠的未來,因為它要求對形勢的分析速度、識別能力、對威脅的立即反應,以及在人類思維的指揮鏈中進行計算和決定,因此不能提供所需的反應時間。本文的最后部分介紹了幫助平臺保護速度的架構,朝著定義CMS中的設備連接方向發展,同時還介紹了一些已經發表的關鍵技術。

B. 論文的結構

第1節是介紹、動機、方法和論文結構。第2節提供了一個常規條令性例子戰術和反擊方法,用于在架構中需要支持的硬殺和軟殺。同時,在第2節中,還介紹了軟殺傷反擊方法的主動、被動和綜合方法。此外,第3節是一個使用飛毛腿和機動性的交戰例子,展示了所需的關鍵數據。第4節介紹了所提出的AI/EW技術的架構。最后,第5節是結論。

AI/EW技術的架構

人工智能應用于電子戰時,不僅要保證DM(決策者)的SA(態勢感知),而且還必須滿足點和區防御以及反目標活動的需要。電磁波譜因無線電和雷達發射器而加劇,一個挑戰是將人工智能應用于能夠滿足DM需求的EW系統,因此它必須能夠分出感興趣的信號,例如其海軍部隊的信號。另外,哪些信號對指定的任務沒有影響。

一個陸軍師的基本 "有機 "通信和電子設備,在一個典型的70公里乘45公里的地區作戰,是超過10,700個單獨的發射器。一個支持性的空中遠征部隊(AEF)會帶來另外1400個,而一個典型的海軍航母戰斗群會帶來另外2400個發射器[20]。比如說: 在沙漠盾牌/沙漠風暴中,六個陸軍師和一個海軍陸戰隊師都占據了相同的地理和電磁波譜空間,還有許多其他聯軍和指揮控制網絡[21]。鑒于這種信息密度,認知型EW也必須與人工智能概念和認知循環階段的相關挑戰相一致。

A. EW活動和AI對應的術語

為幫助EW和AI的受眾,我們提供了一個AI和EW術語的表格,在表1中,這些術語有一些對應關系。

表1 等效AI和EW術語

B. EW核心概念

電子戰被正式定義為三個部分:

  • ES(電子支持):了解誰在使用頻譜,出于什么目的。使用寬窄帶探測和攔截過程,它定位、識別、辨認、轉錄、分析可能的意圖,并評估致命性、敵對性和忠誠度。現代形式包括多層次的情報產品,如網絡電磁活動(CEMA),從地理到人物網絡。
  • EA(電子攻擊):利用頻譜,以EW效應爭奪該頻譜對自己的優勢。
  • EP(電子保護):是為保護和抵制干擾等攻擊而采取的行動。反干擾也可能包括抵抗ES、EA和CEMA產品的措施。

C. 查找、定位、追蹤、瞄準、攻擊、評估

在圖10中,Haigh和Andrusenko[15]提出了一個EW和AI的組合架構,它跨越了殺傷鏈階段,將AI的特征和分類輸入一個融合引擎,以建立一個意圖,這個意圖是由因果關系和異常檢測階段推斷出來的。

圖10 與EW功能相關的EW和AI能力[15]。

Haigh和Andrusenko的論文與EA之前的ES的數據融合觀點一致,同時保持EP。因此,人工智能方法被應用于特定發射器的分析、特征描述和分類,作為數據融合之前的模式匹配工作。然后,這些方法被用于異常檢測和因果關系搜索,以實現意圖識別。這是一個信息漏斗,在EA/EP方面,這些方法更多的是優化適應性,而不是智能,這貫穿于整個殺傷鏈,并應用于任務管理的決策援助和與電子戰令(EOB)和網絡管理有關的人為因素。不難看出,AI態勢評估、DM和機器學習(ML)能力與所有EW功能相關。每個認知型EW系統的第一步是電子支持(ES),以了解射頻頻譜。在人工智能界被稱為情況評估,ES確定誰在使用頻譜,他們在哪里和何時使用,以及是否有可以 "利用 "的模式。AI/ML技術可以使用特征估計、發射器特征和分類、數據融合、異常檢測和意圖識別。圖11顯示了任務前準備和任務后分析與任務中需求的重疊。

圖11 任務中、任務前和任務后的重疊部分

ES對環境進行分析,并創造出驅動決策者(DM)的觀測數據。日益復雜的情況將頻譜態勢感知(SSA)定義為 "收集有關頻譜使用的不同信息并處理這些信息以產生一個融合的頻譜圖"[15]。SSA收集、組織和處理EW所需的頻譜數據。SSA必須以近實時(NRT)的方式進行,以滿足任務中的決策者的需要,SSA必須結合各種支持技術,包括傳統的和認知的。然而,一個挑戰在于相關技術的整合和展示,其中只有少數是認知的,以減少脆性和處理新的發射器。人工智能和ML能力可以在每個層面上改善SSA,這是在其他相關SSA技術背景下對這些AI/ML技術的看法。一個完整的EW系統必須有多層面的SSA。未來的SSA系統可以用深度學習模型來生成潛在的特征,用經典的ML模型來進行任務中的更新,以及用混合模型來抵消有限的數據。此外,SSA不一定要完全依賴射頻數據: 它可以與非射頻數據融合,如視頻和靜態圖像、自由空間光學、或開源、戰術或作戰情報。跨越多個異質來源的分布式數據融合必須創建一個在空間、時間和頻率上都準確的連貫的戰地頻譜共同作戰圖。異常檢測、因果推理和意圖推理使作戰圖更加完整,以了解事件的影響并支持管理部門。

D. 影響范圍

Rudd-Orthner等人[14]用圖12中的 "影響范圍 "概念[18]擴展了這一概念,并增加了一個 "保護洋蔥 "框架,以根據數據需要選擇對策。

圖12 影響范圍

他們指出,威脅武器系統有變得更加復雜的趨勢,這種復雜性的增加至少可以部分歸因于:戰術的演變、技術發展的速度和數字化的現代化,但也有一種趨勢,即隨著人類決策和反應時間的減少,威脅的作用也在擴大;隨著自主系統的效力和使用的增加,這種情況也許更加明顯。自主系統的崛起在所有領域都在發展: 陸地、空中、海上、太空和網絡。自主系統的規模各不相同,從無人值守的槍支系統到自主空中平臺。這些自主平臺運作的作用也在不斷擴大,因此在打擊它們時,可能需要在綜合防御輔助系統中匹配復雜性,作為打擊復雜威脅系統的戰略。這些復雜平臺的作用和能力的增加,可能導致單一平臺的作用不大,并為其他平臺提供 "保護投射 "的要求。與此相結合,利益相關者群體也更加多樣化,科學家/工程師、機組人員和任務生產程序員之間的溝通機制也是挑戰,這樣他們都可能做出有意義的貢獻,并與他們的利益相關者群體的價值互補,正如Rudd-Orthner等人所說。

E. 拒止、降級、擾亂、欺騙、毀壞

圖12中的維恩圖顯示了數據可用性的 "影響范圍":保護平臺/部隊、威脅或武器系統和防御限制與反措施設計考慮相疊加。Rudd-Orthner等人指出,這些不同的反措施考慮加上不同的可用數據,可能對反措施戰術設計形成影響范圍。

F. 保護洋蔥的映射

Rudd-Orthner等人在[14]和[19]中應用了多視角威脅分析圖解技術,該技術基于判別器、操作視角、系統視角以及對策設計考慮和影響范圍的維恩圖,適用于保護的洋蔥。他們在維恩圖中描述了反措施的設計考慮,將反措施的設計意圖描繪成一種規范,而不是ECM干擾器技術設施。在這種情況下,反措施設計考慮表示戰術的反意圖。論文[14]和[19]還建立了一個保護洋蔥的概念,利用反措施設計的影響因素和組織成洋蔥層的數據源,將揭示的數據分層管理。其中這些層級建議的對策方法也是與該威脅殺傷鏈階段的威脅意圖直接相反的,使得它也是一個測量的反應和保護數據模型在所揭示的數據。表2顯示的是保護洋蔥的層級(第1層是最外層)和反措施設計考慮,影響范圍與威脅系統的殺傷鏈意圖的映射。表2提供了保護洋蔥的六個層次。

表2 保護洋蔥

洋蔥層/影響范圍/CM設計考慮因素 注釋
第1層發現/受保護的平臺/減少的可探測性 對抗早期預警、空中搜索或地面控制攔截雷達的探測或行為,使被保護平臺脫穎而出。該戰術針對的是殺傷鏈的意圖,并不顯眼,是利用對自身平臺數據的了解。
第2層定位/受保護的平臺/降低可探測性 誘餌和欺騙 具有欺騙性和誘騙性的反目標獲取或高度查找雷達可用于降低信息或反擊某個范圍或高度。
第三層識別/保護平臺 武器系統/降低可探測性 誘餌和欺騙 分散注意力 拒絕破壞 用旨在造成混亂的措施來對抗識別,以延遲對你的分類或身份的評估,識別可以基于行為或使用特殊雷達模式,如NCI。
第4層跟蹤/保護平臺武器系統/降低可探測性 誘餌和欺騙性分散注意力 用干擾、分散注意力和拒絕的方式來對抗威脅,可以是目標獲取雷達或更高數據率的搜索模式,如窄掃描軌道,同時掃描模式。
第5層 交戰/防御限制 武器系統保護平臺/降低可探測性 誘餌和欺騙 分散注意力 拒絕 破壞 破壞 使用所有可用的能力擊敗威脅,硬殺和軟殺取決于ROE,是傳統的平臺自我保護。可以使用破鎖和信號處理以及跟蹤目標的戰術。
第6層 處置和效應/防御性限制 武器系統保護平臺/減少可探測性 誘餌和欺騙 分散注意力 拒絕 破壞 毀滅 使用所有可用的軟硬殺傷能力擊敗威脅,是傳統的平臺自我保護。可能使用破鎖和信號與跟蹤處理的目標戰術,并可能同時采用針對尋的器和雷達的技術。

G. 認知電子戰系統

認知型電子戰系統的設計必須提供態勢感知、決策和學習能力。一般來說,系統要求推動了一系列關于哪些問題和它可能需要回答的問題的決定。決策可能是反復的,要么是集中的,要么是隨部隊效應范圍分布的。他們將一個問題表示為規格,并受制于AI代理的拍賣。就我們如何定義和調整優化函數而言,利用領域的物理學與參與的進展可能會減少狀態和交易空間。問題來自于像干擾這樣的設計結果所需的緊迫性和缺失的數據。因此,選擇對策和感覺的C4L參數、'while'或'if'條款都是數據要求,可能形成問題對話鏈或問題樹,在殺傷鏈的不同處置路線中需要。因此,這些對話鏈或問題樹就像專家系統的規則庫格式。因此,所需的數據就以拍賣的方式給投標的傳感器。這樣一來,邏輯路線總是有目的性的結果,而DM和傳感器的使用也是如此。另外,隨機森林[22]可以減少熵,增加信息增益。

雖然具有高度的適應性,但先進的雷達和軟件定義無線電(SDR)架構通常依賴于定制的API,單獨暴露每個參數。這種方法不適合EW系統中的近實時認知控制,因為緊密的耦合意味著人工智能不能做出全局性的決定。組成模塊必須是高度模塊化和可組合的,以消除這一障礙。通用接口允許模塊暴露其參數和依賴關系,從而實現全局優化和跨多個處理器的計算負載平衡。通常,由RESM(雷達電子支持措施)攔截的發射物是通過發射物數據庫識別的。發射者被識別出來,并在本地認可的海上圖像(LRMP)中得到體現。當通過數據庫確認為一種威脅時,它可以接受DM的詢問和拍賣:

  • RECM C4L反措施規范可能需要威脅、獲取類型、速度、仰視距離和威脅的各種電子反措施(ECCMs)邏輯;
  • DLS(誘餌發射系統)可能需要C4L數據并計算出發射角度和時間;
  • CMS可能會要求C4L說明采取的最佳路線(避免武器系統的盲弧)。

為此,我們需要一個中間代理,提供一個模塊化的結構組件,允許不同的技術提供不同的服務,并確保信息/控制的一致流動,與John Boyd的OODA循環[23]一致,但適用于數據處理和DM。

圖13 模塊化架構

軟件架構的一個例子是ADROIT。自適應動態無線電開源智能團隊(ADROIT):用中間代理認知控制SDR節點之間的協作。ADROIT項目正在建立一個開源的軟件定義的數據無線電,旨在由認知應用程序控制。模塊暴露了它的參數和它們的屬性(特別是讀/寫)。當一個模塊發生變化時(例如,增加一個新的參數),它只需揭示新的參數,并在一個發布-訂閱機制中公開參數(名稱、屬性),而不是為該新參數增加一個新的API函數;這也可以擴展為一個組播目的地,給后來仍需要定義的模塊。ADROIT用圖14所示的模塊實例化了中間代理。

圖14 ADROIT體系結構支持認知代理

處理不同的或變化的傳感器的一種可擴展的方式是,如果所有的設備可以減少不確定性或提供額外的數據來回答一個殺戮鏈階段的問題,就將它們定義為傳感器。因此,這些傳感器可以成為拍賣算法的參與者,以其回答問題的能力來競標。在不同的操作環境下,拍賣算法中的分數可以改變,因此,不同的傳感器選擇提供較低的可觀察性或與當前的ROE、受限的EMCON或當前的傳感器利用相一致。通過這種方式,形成了一個問答循環,完善了對情況的理解,同時在提問的基礎上做出增量決定,并使環境情況有利于他們的部隊使用保護洋蔥的一個版本。此外,同樣的拍賣優化可以與反措施一起執行,其概念是,如果一切都能影響當地的殺戮鏈決策或導致結論或問題發生在受害者身上,那么它就是一個影響者。由此可見,C4L提供了一種以標準形式指定反措施行動和傳感規格的方法;這些規格可以一起拍賣,以便在一個可適應的模型中獲得最佳效果和傳感,然后該模型將優化殺戮鏈的進展,為跟蹤的對手的殺戮鏈進展提供優勢。在圖15中,本文展示了EW系統如何在拍賣優化的基礎上與具有認知DM的作戰管理系統(CMS)集成。威脅的檢測/識別/鑒定/分類被轉移到不同的數據庫中,但這些過程和數據庫的不確定性導致了傳感器的重新任務。這些都是拍賣,根據傳感器解決情況的不確定性的能力來分配任務,并根據緊急程度來確定優先次序;這使用了從保護的角度預測威脅的殺傷鏈意圖。這些過程越可靠,立即識別和反應的概率就越高。為了進一步提高這一結果,管理部門必須考慮機器學習中的其他參數,以適應當地環境的傳感任務和對策效果的拍賣。

圖15 數據布局EWS與CMS集成

有些參數可能不為人所知,也可能沒有方法或傳感器來提供這些參數;因此,Rudd-Orthner等人[24]的專家系統的神經網絡形式作為數據庫的疊加,在這些情況下提供一個估計值。它還可以提供一個由貝葉斯網絡進一步引導的值,該網絡可以將從環境中收集的傳感器事實與來自其規則的知識結合起來,使其不容易被收集的事實所欺騙。此外,在圖16中,也是在人工智能的背景下,所提出的架構將EW系統與CMS結合起來。它通過一個反饋回路支持 "態勢感知",根據威脅殺傷鏈的位置重新安排傳感器的任務,以快速解決識別和確認的不確定性,更新跟蹤的準確性,并為CMS和EW系統資源提供戰術清單作為選擇。

圖16 ID標準交互模型

在圖16中,DM能力因此積極主動地利用感知能力直接處置威脅,并為反制措施/部署制定了時間表。這些反措施/部署應按照RuddOrthner等人的保護理念,利用推斷出的威脅的殺傷鏈位置階段,直接對抗威脅的意圖。因此,傳感要求可以在拍賣算法中與可供選擇的策略/反措施交錯安排。同樣,在威脅分析和處置的關鍵時刻,一些所需信息可能無法在DM中獲得,但可以使用RuddOrthner論文中提出的神經符號-AI專家系統方法的代數專家系統部分進行估計。可控的可觀察數據可能來自人工智能環境中的數學或認知學習發展過程。我們可以認為這些有助于識別目標的元素是可觀察的,這些元素在DM中是可控的。

圖17 CMS和EW CM系統中的威脅數據路徑

在圖17中,本文展示了一個威脅發射器從EW系統進入CMS部分的順序。從EW系統的庫或數據庫中識別截獲的發射器;該數據庫包含物理雷達特征: PRI、頻率、PW、振幅、掃描類型、掃描周期平臺等級和威脅名稱;采集類型的特征,ECCM,如原點干擾(HOJ)Chaffs辨別,紅外,雙導射頻和紅外。如果發射物未被識別為威脅,則在本地識別的海上圖像中直接代表發行者。如果被確認為威脅,它將遵循不同的路徑,如前所述。導彈的獲取和ECCM的類型在反應鏈中具有巨大的價值。如果它有HOJ能力,最好是通過C4L中捕獲的特定計算直接干預硬殺傷和誘餌發射;該選定的C4L規格是由保護的洋蔥頭選擇的,它與頻譜中的感應計劃一起安排。該規格將誘餌定位在C4L所確定的與發射船的一定距離和特定的β值。除了在CMS上表示威脅的到達方向外,EW系統還將C4L搜索數據和傳感規范發送到多功能雷達(MFR)和火控雷達(FCR)作為即時硬殺傷系統。本文在圖18中畫出了由人工智能支持的戰斗管理系統(CMS)的架構基礎。在標準環境塊中,還有四個相互關聯的組件:

1.傳感器管理,提供設備監視器(資源管理器)的管理,傳感器信息的收集和軌道管理;在這個塊中,所有的相關數據都匯聚到機載傳感器,如雷達、聲納、ESM雷達、通信ESM、導航輔助設備和氣象數據。在這個架構中,一個傳感器的任務和它的優先權來自于它的成熟度和殺傷鏈。在這方面,關于Rudd-Orthner等人,威脅意圖的成熟度被評估為使用保護洋蔥的反意圖對策,并嵌入到Haigh和Andrusenko的殺傷鏈階段,其中的整合是通過ADROIT架構的發布和訂閱機制,這允許快速和靈活的整合和擴展。

2.在架構的第二塊,有信息管理,其中本地軌道與來自鏈接網絡的軌道相關聯,根據識別標準識別目標的追蹤,管理技術決策輔助工具和信息,共享共同的操作畫面,該畫面中的不確定性和異常情況引起了傳感器的任務。

3.第三塊代表戰斗管理,它提供了對威脅的評估計劃和武器優先權的分配--演習的計算和艦隊內與戰斗有關的信息交流。

4.最后一個區塊是資產管理,使用C4L規范和序列,允許艦艇同時協調幾個進攻和確定的目標。

圖18 AI應用于CMS結構

在DM處理環境之外,人工智能也同樣適用于智能處理環境,類似的技術疊加數據庫和ML提取,走向專家系統規則捕獲[25]。在人工智能輔助的CMS中,數據流入信息管理數據融合,使計算機系統在沒有明確編程的情況下利用歷史數據進行預測或做出一些決定。機器學習使用從IMDF(信息管理數據融合)獲得的大量結構化和半結構化的數據,這樣機器學習模型就能產生準確的結果,或根據這些數據提供預測。

付費5元查看完整內容

北約成員國面臨的日益復雜和技術先進的威脅環境繼續增加,特別是爆炸裝置和武器所帶來的威脅。北約對手選擇的這些武器繼續主導著現代戰爭,它們造成的傷害可能是復雜和災難性的。通過一個綜合的計算模型框架,對潛在的威脅及其可能的緩解和/或醫療進行端到端的表述,將為北約成員提供更好的作戰能力,這也是本RTG的范圍。

在過去的25年中,計算模型對爆炸威脅的預測和防護設備及系統的性能產生了重大影響。這些仿真結果表明,全面的、全人類的爆炸效應建模能力可以為北約國家提供應對快速出現的爆炸威脅的能力,并為訓練和戰斗場景創造更安全的環境。為了解決這些方面的建模與仿真問題,北約人因和醫學小組成立了北約HFM-270研究任務組(RTG),"爆炸相關威脅造成的人類死亡、傷害和損害的建模與仿真框架"。HFM-270研究工作組由來自10個國家的22名指定成員組成。該小組代表了醫療、作戰和物資開發界,以及不同的學科,包括工程、生物科學和醫學。

RTG的首要目標是利用參與國以前的、正在進行的和計劃中的爆炸傷害生物醫學研究和計算模型工作,開發一個概念化的計算模型框架,能夠提供威脅到結果的模型和仿真爆炸對人類的影響,以支持快速開發、測試和為軍人提供有效的保護設備。

這個RTG的第一項任務是對建模與仿真進行深入審查。研究人員處理的關鍵特征被記錄下來,并確定了開發基于模擬方法的局限性。注意到的三個主要缺陷是:a)模擬模型中缺乏端到端的連接和連續性,以解決利用技術的戰斗傷害;b)對這種模擬至關重要的材料模型不充分和不完整;以及c)基于必要的實驗數據的模型驗證有限。在本報告中,這些發現被用來創建一個端到端--從威脅到臨床診斷--的建模和仿真框架,并以實例說明北約成員如何在實踐中實施這樣一個框架。這個框架可以被北約成員國零散地或整體地應用于確定研究需求和執行項目,以提高科學和技術能力,從而使北約對其對手具有優勢。該框架還可以被用來評估新的威脅、新的科技工具和新的保護系統,以確定其有效性。最后,該框架還可以支持北約成員國未來爆炸相關研究的計劃性發展的科學和技術需求。

1 引言

1.1 背景

隨著北約的對手開發和使用越來越復雜的武器和戰術,軍事威脅環境正在迅速演變并變得更加復雜。然而,這種日益復雜和技術先進的威脅環境并沒有削弱爆炸裝置和武器所構成的長期和持久的威脅,這些武器的復雜程度從低到高,因此很可能是對手的首選武器。爆炸裝置和武器繼續主導著現代戰爭,它們造成的傷害可能是復雜和災難性的。

爆炸裝置造成的傷害的復雜性和嚴重性帶來了重大的傷害預防、治療和康復挑戰。在 "與爆炸有關的傷害 "或 "爆炸傷害 "的總標題下所包含的傷害類型、損傷和病理結果是多樣和廣泛的,從穿透性碎片和創傷性截肢造成的出血到爆炸超壓造成的內臟傷害,再到鈍性沖擊傷害和燒傷。此外,有證據表明,爆炸暴露與其他病理結果,如輕度創傷性腦損傷之間可能存在關聯,這需要進一步研究。克服這些挑戰需要不同的醫學界和非醫學界,以及同樣不同的科學、醫學、工程和操作學科的協調努力。

應對快速發展的爆炸威脅環境,需要一個靈活和精簡的方法來設計、測試和部署北約部隊成員在騎兵和非騎兵行動中的爆炸防護設備。計算模型工具可以支持這種敏捷和簡化的方法,提供預測人類對新出現的爆炸威脅的反應的能力,并在虛擬環境中快速設計和測試新的保護概念,從而增加有希望的概念的數量,減少需要昂貴和耗時的開發和實彈測試的原型的數量。最終,這些計算建模工具有可能極大地加速向軍人提供有效的防爆設備。

認識到計算建模的價值,以及全面的、整體的人體爆炸效應建模能力對北約國家應對快速出現的爆炸威脅的能力的潛在影響,北約人因和醫學小組成立了北約HFM-270研究任務組(RTG),題為 "爆炸相關威脅造成的人類死亡、傷害和損傷的建模和模擬框架"。HFM-270工作組由來自10個國家的22名指定成員組成。加拿大、法國、德國、荷蘭、以色列、南非、瑞典、土耳其、英國和美國。這些RTG成員代表了不同的醫療、作戰和物資開發團體,以及不同的學科,包括工程、生物科學和醫學。

RTG的首要目標是利用參與國以前的、正在進行的和計劃中的爆炸傷害生物醫學研究和計算模型工作,開發一個概念化的組件計算模型框架,能夠提供爆炸對人體影響的威脅到結果的模型和模擬,以支持快速開發、測試和為軍人提供有效的爆炸防護設備。

本報告描述了RTG在其三年任期內的活動,并記錄了RTG的方法、結論和建議。

1.2 北約以前的活動

本RTG的工作是2011年HFM-207專題討論會 "在整個軍事科學領域對爆炸傷害的調查 "和2013-2016年HFM-234 RTG "爆炸暴露的環境毒理學 "的邏輯后續。傷害指標、建模、方法和標準"。以前的這些活動認識到采用多學科方法解決爆炸傷害問題的重要性,并強調了生物醫學上有效的爆炸傷害計算模型的潛在價值,這些模型在解決爆炸傷害、預防和治療方面的挑戰時,包含了生物力學和生理學反應。

HFM-207研討會的主要建議之一是探索爆炸、人類生理學、生物力學和毒理學的計算模型的相關性和價值,使用經典的毒理學問題解決方法來解決爆炸傷害問題,其中傷害的病因需要了解劑量、劑量的傳遞機制和劑量反應終點。換句話說,利用計算模型來描述爆炸威脅、威脅與保護系統的相互作用、保護系統與人的相互作用、人的最終爆炸負荷或爆炸劑量,以及人對所受劑量的反應范圍,從損傷到傷害,再到死亡。

同樣,HFM-234RTG認識到了計算模型的潛在力量,并在最后的技術報告中用了整整一章來討論使用計算模型來解決理解爆炸傷害機制方面的挑戰。該小組強調了制定爆炸傷害緩解戰略的迫切需要,并建議計算模型可以提供一個框架,以了解傷害機制,指導實驗測試,解釋數據,并促進有效保護設備和治療方法的發展。

1.3 概念與范疇

1.3.1 定義“計算建模框架”

RTG的第一項任務是在成員之間建立對 "計算建模框架 "這個術語的共同理解,這個術語可能有些模糊和混亂。為了更好地概念化這個術語,小組同意用普遍理解的 "黑盒"的概念來比喻這個框架。使用黑匣子的比喻,計算模型框架將描述騎兵和非騎兵作戰環境中的威脅情景的輸入數據轉換為有意義的致命性、傷害和損傷的輸出預測。這些預測可能對許多社區具有重要價值,用于各種目的。例如,醫學界可以使用這些預測來進行武器系統的健康危害評估,以確定和減輕或消除對使用武器系統的軍人的潛在健康風險。物資開發界可以使用這些預測來指導新的爆炸防護設備的設計和測試,包括個人防護設備和戰斗平臺乘員防護系統。而且,測試和評估團體可以使用這些預測來評估戰斗平臺,如車輛、船舶和飛機的虛擬生存能力測試中的乘員生存能力。這個框架的 "黑盒"比喻如圖1-1所示。

圖 1-1:框架“黑盒”性。

繼續黑盒的概念,RTG成員認識到,沒有一個計算模型可能執行所有必要的功能來實現歸屬于黑盒的能力。更有可能的是,該框架將包含許多類型的交互模型,其中一個模型的輸出作為另一個模型的輸入。回到黑盒的比喻,各個模型和模型之間的相互作用可以通過揭開黑盒“蓋子”來實現,如圖1-2所示。

圖 1-2:取下蓋子的“黑盒”。

圖1-2說明了兩個重要的概念。首先,它強調了為提供該框架的綜合建模能力所需的模型的多樣性。需要的模型類型包括描述生物力學、病理生理學、特定器官損傷、身體負荷和身體姿勢等,僅舉幾例。第二個同樣重要的概念是確定一些關鍵模型不存在。這個概念在圖中以包含問號的齒輪來說明。RTG成員同意,如果要實現框架的最終能力,確定現有的模型以納入框架與確定必須填補的空白同樣重要。RTG主席在每次RTG會議開始時都會回顧這個黑盒子的比喻,以幫助維持RTG成員之間的共同理解和關注。

1.3.2 確定框架的能力范圍

在對計算模型框架及其所需能力達成共識后,RTG成員的下一個任務是對該框架所要解決的爆炸傷害的范圍達成共識。成員們同意使用美國國防部(DoD)指令6025.21E中的 "爆炸傷害 "的定義,2006年7月5日,主題為 預防、減輕和治療爆炸傷害的醫學研究,該指令是將醫學研究協調責任分配給國防部爆炸傷害研究執行機構的管理指令。如圖1-3所示,這個定義包括了因暴露于威脅性爆炸武器以及北約成員國使用的產生爆炸的武器系統而可能導致的廣泛的傷害,并被分為五類:初級、二級、三級、四級和五級。第2章描述了爆炸產生的可能造成傷害的物理現象。RTG成員同意,該框架必須能夠處理圖1-3中描述的整個爆炸機制和傷害。為了與RTG的總體目標保持一致,成員們還認為該框架必須能夠預測人類對爆炸威脅的全部反應,包括所有類型的爆炸威脅情況下的致命性、傷害和損傷。

圖1-3:爆炸裝置造成的傷害分類法,改編自美國防部指令(DoDD)6025.21E。

1.4 RTG目標、工作計劃和可交付成果

1.4.1 目標

2016年10月5-6日,RTG成員在法國巴黎塞納河畔諾伊夫的北約科技組織(STO)合作支持辦公室(CSO)舉行了首次會議。啟動會議的目的是審查技術活動說明(TAD),并制定工作計劃(PoW),指導RTG在其三年任期內的工作。

技術活動說明指出,RTG的目標是利用以前的、正在進行的和計劃中的爆炸傷害生物醫學研究和計算建模工作,在參與國之間建立一個框架,將科學信息轉化為能力,對與爆炸有關的各種威脅的人類致命性、傷害和損傷的機制進行建模。TAD進一步指出,擬議的RTG還將制定框架,以建立和評估有效的系統,防止這些與爆炸有關的威脅。

在RTG的三年任期內,TAD中所述的總體目標變得更加完善和集中。成員們重申的目標是開發一個具有組件計算模型的概念化框架,能夠在所有爆炸威脅環境中提供從威脅到結果的建模與仿真(M&S)。該框架將使M&S能力成為可能,通過在虛擬環境中快速開發和測試新的爆炸防護概念來應對預期和新出現的爆炸威脅。這種能力可以大大減少開發、建造和實彈測試爆炸傷害防護設備原型所需的時間和成本,并加速向北約成員國提供有效的爆炸防護設備。此外,它還可用于戰爭演習,通過預測傷亡人數和類型來評估爆炸威脅,從而滿足部署醫療資產的要求。RTG成員還承認并強調了所設想的框架的獨特性,因為它反映了RTG成員所代表的不同社區和學科的知識、觀點和需求。

1.4.2 工作計劃

在對RTG的目標達成共識后,RTG成員制定了一個有5個具體目標的工作計劃(PoW):

  1. 確定計算模型框架的要素。

  2. 確定現有的、正在進行的和計劃中的模型、數據庫,以及每個要素的傷害標準。

  3. 制定評估標準,將模型納入該框架。

  4. 找出沒有合適模型的空白點。

  5. 制定框架(模型的整合)。

1.4.3 可交付成果

在確立了RTG的目標之后,成員們制定了七個具體的可交付成果,這些成果是小組在整個三年任期內的工作重點。這些成果包括:

1)計算建模能力的框架,可以預測所有作戰場景中所有爆炸威脅對人類的致命性、傷害和損害。

  1. 參與國中與該框架相關的現有模型和建模能力的動態庫。

  2. 實現該框架全部能力所需的建模能力的差距。

  3. 建立在HFM-234 RTG中創建的爆炸傷害研究術語綜合詞典基礎上的建模和仿真術語綜合詞典。

  4. 新的HFM RTG的TAP,它將建立在HFM-270的基礎上,為實施該框架制定標準化和驗證標準和方法。

  5. 在同行評議的文獻中發表關于HFM-270 RTG工作的出版物。

  6. 北約的最終技術報告,描述框架、現有模型和建模能力的動態資料庫、建模能力的差距、建議,以及作為附錄的綜合字典和TAP。

1.5 方法

1.5.1 會議時間表

認識到這個RTG的雄心勃勃的目標,RTG成員認識到有必要每12個月舉行三次面對面的會議,以促進完成PoW和發展可交付成果。一些成員自愿主辦會議,但他們需要與各自的組織協調,以確認他們對主辦會議的承諾。成員們同意,會議一般將持續三天。鑒于RTG的多學科組成,成員們一致認為每次會議都應該包括主題專家(SMEs)的發言,以使RTG成員對計算建模、生物醫學研究和醫學中與本團隊整體工作相關的關鍵概念建立共識。RTG成員一致認為,中小企業將被邀請作報告,但不會了解RTG成員之間的后續討論。RTG成員還同意,主辦會議的國家將負責中小企業的旅行費用。如果主辦國提出要求,北約科技組織CSO將提供資金支持中小企業的旅行;然而,沒有任何成員國行使這一選擇權。除了面對面的會議,成員們同意在每次面對面的會議中間通過WebEx或電話會議舉行一次虛擬會議。不幸的是,時區差異和成員的可用性使這些虛擬的中間會議很難持續舉行。成員們還同意最大限度地利用 "科學連接 "網站進行信息共享和文件開發。在啟動會議上商定的會議時間表見表1-1。

表1-1: 工作計劃、時間表和里程碑。

1.5.2 會議形式

每次會議開始時,RTG主席都會回顧RTG的目標和成果。他回顧了美國國防部指令6025.21E中對爆炸傷害的定義,指出該框架應考慮與爆炸有關的傷害和傷害機制的整個范圍。他回顧了黑匣子的比喻,認為計算模型的框架能夠預測所有爆炸威脅在所有威脅環境下的人體致死率、傷害和損傷情況。他強調,RTG的主要目標是制定框架,確定和評估現有的計算模型以納入該框架,并確定不存在必要模型的差距。

在主席的介紹之后,RTG成員回顧了上次會議的行動項目的狀況,然后開始著手處理PoW中會議時間表中描述的具體任務。會議還包括由東道國安排的相關中小企業的介紹。此外,每次會議通常包括參觀東道國的爆炸傷害研究設施,以幫助RTG成員對每個國家的研究興趣和能力達成共識。最后,每次會議結束時都會對分配的任務以及下次會議的計劃和目標進行審查。

1.5.3 工作組

RTG成員成立了三個工作組(WG),專注于PoW中描述的具體交付成果。詞典工作組的任務是在HFM-234 RTG開發的爆炸傷害研究術語綜合詞典的基礎上,開發常用計算建模和模擬術語的綜合詞典;出版物工作組的任務是確定并指導RTG的工作在適當的同行評審期刊上發表;以及TAP工作組的任務是為HFM-270后續RTG起草一個TAP,為該框架制定標準化和驗證標準及方法。

1.5.4 完成目標的方法路徑

以下段落簡要介紹了RTG為完成PoW中所述的五個目標所采取的邏輯和方法。以下各章將詳細描述這一方法。

1.5.4.1 識別計算建模框架的元素

RTG成員認識到,開發計算模型框架的首要任務是確定框架的基本要素。為此,成員們定義了一個事件鏈,定義了該框架的總體能力的邊界,以提供所有爆炸威脅環境中人類致命性、傷害和損傷的威脅到結果的建模和仿真(M&S)。事件鏈從爆炸威脅情景開始,最后以描述人類反應的結果參數結束。成員們利用這個事件鏈和HFM-234 RTG開發的爆炸傷害毒理學框架,開發了一個包含計算模型框架元素的矩陣,然后應用一個簡單的爆炸場景例子來測試這些元素的邏輯性和完整性。

進一步的討論導致將各個元素歸類為相互作用的模塊,其中一個模塊的輸出可作為另一個模塊的輸入,對一個模塊的改變可調制或改變另一個模塊的輸出。

第五章詳細討論了該框架的元素和模塊。

1.5.4.2 確定現有的、正在進行的和計劃中的模型、數據庫,以及每個要素的傷害標準

RTG 的下一個任務是對參與國進行調查,以確定與該框架相關的現有模型和建模能力。為了完成這項任務,RTG 開發了一個全面的調查工具,每個成員都用來調查他們國家的模型和建模能力。第四章詳細討論了RTG為識別現有模型和建模能力所做的努力。

1.5.4.3 制定將模型納入框架的評估標準

在確定了現有的模型和建模能力后,RTG 制定了評估這些模型和能力與框架相關性的標準。專家組成員不厭其煩地回顧和總結了描述所確定的模型和建模能力的相關發表的論文,然后使用評估標準來確定模型在矩陣中的位置。這些總結將作為模型和建模能力動態庫的基礎。

1.5.4.4 找出沒有合適模型存在的差距

基于對建模和仿真的深入審查,我們注意到了三個主要的缺陷。第一個限制是模擬模型中缺乏端到端的連接和連續性,無法利用這些模型和模擬技術進行損傷預測并提出臨床治療方案。第二是這種模擬所必需的材料模型的不充分和不完整。第三,所有的模型都只提供了有限的實驗數據驗證,因此表明還需要做更多的工作,以利用這些模型對傷害和臨床治療的新威脅進行鏈接、端到端的預測。

1.6 結論

一個全面的、對人類健康影響和后果的威脅的計算模型能力可以支持一個靈活和簡化的方法來設計、測試和為北約成員國提供爆炸防護設備;然而,這種能力目前并不存在。這個RTG的三年努力產生了一個計算模型框架,為發展這種能力奠定了基礎。該框架提供了一個全面的邏輯結構,在這個結構中,各個模型可以相互作用,以產生所需的威脅到結果的建模能力。該框架是獨特的,因為它反映了RTG成員所代表的不同社區和學科的知識、觀點和需求,并提供了一個端到端的威脅模型與人體和防護設備模型、傷害模型和臨床診斷和治療模型及知識庫的連接。

1.7 建議

每個國家在規劃未來計算建模工作的投資時,都應考慮本RTG所確定的差距。應該指定一個國家和組織來維護和更新參與國中與該框架相關的現有模型和建模能力的動態資料庫。

RTG建議,每個北約國家在規劃未來的計算建模工作投資時,應考慮本RTG所確定的差距。另外,每個國家以及像北約這樣的組織可以指定資源來維護和更新與框架相關的現有模型和模擬能力的動態庫。該框架和儲存庫可以成為高級研究、基于軟件和硬件的產品開發的資源,推動相關領域的科學發展,并更好地減輕參與國的作戰人員的爆炸傷害。使用有充分記錄的實驗結果的數據來驗證這些模型,應該是未來研究的一個關鍵期望,以便這些模型能夠被納入這里提出的框架中。

付費5元查看完整內容

最近小型無人駕駛飛行器(UAV)技術的進步重新激發了對民用和軍用廣域搜索(WAS)算法的額外研究需求。但由于無人機環境和設計的差異性極大,利用數字工程(DE)來減少推進這項技術所需的時間、成本和精力。數字工程還允許快速設計和評估利用和支持WAS算法的自主系統。現代WAS算法可以大致分為基于決策的算法、統計算法和人工智能(AI)/機器學習(ML)算法。這項研究繼續了Hatzinger和Gertsman的工作,創建了一個基于決策的算法,該算法將搜索區域細分為被稱為單元的子區域,決定一個最佳的下一個單元進行搜索,并將搜索結果分配給其他合作搜索資產。每個合作搜索資產將存儲以下四個關鍵數組,以決定搜索哪個單元:每個單元的當前估計目標密度;一個單元中的當前資產數量;每個合作資產的下一個搜索單元;以及任何資產在一個單元中的總時間。一個基于軟件的模擬環境,即模擬、集成和建模高級框架(AFSIM),被用來完成驗證過程,創建測試環境和被測系統(SUT)。此外,該算法針對各種分布的威脅進行了測試,以模擬目標的集群。最后,從人工智能和ML中引入了新的有效性措施(MOEs),包括精確度、召回率和F分數。使用方差分析(ANOVA)和協方差矩陣對Hatzinger和Gertsman的新的和原始的MOEs進行了分析。這項研究的結果顯示,該算法對原始MOEs或新MOEs沒有明顯的影響,這可能是由于與Hatzinger和Gertsman相比,網絡化協作自主彈藥(NCAM)的傳播情況相似。該結果與目標分布標準差的減少即目標聚類呈負相關。這第二個結果更令人驚訝,因為更緊密的目標分布可能會導致更少的搜索區域,但NCAM繼續分布它們的位置,而不管確定的集群。

付費5元查看完整內容

根據合同FA8750-19-C-0092制定本報告:利用符號表示進行安全和可靠的學習。這項研究工作的目標是開發新的工具、算法和方法,以提高自主的、可學習的網絡物理系統(LE-CPSs)的安全性。這些系統由于更高的自主性以及網絡組件和物理環境之間的相互作用而表現出一系列豐富的行為。這項工作總結了在符號系統測試、模型提取、異常檢測、學習未知動力學和形式化方法方面的進展,以驗證這些系統。這些工作被整合到控制系統分析框架中,并應用于高保真F16模型。

報告總結

可靠自主性(AA)計劃是由美國國防部高級研究計劃局(DARPA)委托進行的,目的是推動持續可靠技術的發展,以跟上安全關鍵系統日益復雜和自主的步伐。該計劃的目標是學習型(LE)網絡物理系統(CPS)(LECPSs);由于更高水平的自主性,以及網絡組件和物理環境之間的互動,這些系統表現出豐富的行為集合。由于這些系統經常被部署在安全關鍵環境中,其故障可能導致金錢和人命的損失,因此其持續的保證是最重要的。

為了加速LE-CPS的采用,保證學習團隊采用了一種多方面的方法,為保證幾個層次的自主性提供解決方案,包括規范、設計、培訓、設計時間測試和運行時間保證。圖1所示的海報中總結了保證學習團隊的方法。

圖1 可靠學習小組

1.1 可靠學習挑戰問題

該團隊將F-16飛行控制系統[75]確定為美國防部(DoD)可靠自主性計劃的相關基準。這支持了該計劃第二階段挑戰問題2.5 "避免地面碰撞 "和第三階段挑戰問題3.2 "避免空中碰撞"。我們開發了控制系統分析框架(CSAF),這是一個集成的工具鏈,以證明團隊開發的技術和工具的有效性。我們使用DevOps風格的自動化來推動LE-CPS的持續集成和目標定向測試。最后,我們展示了運行時可靠(RTA)的可行性,以保護系統免受LECPS故障的影響。

1.2 控制系統分析框架

Galois開發了控制系統分析框架,這是一個用于建模、測試和正式驗證LE-CPS的綜合工具鏈。CSAF將最先進的分析工具引入數字工程框架,由DevOps風格的持續集成支持,以加速安全關鍵系統的數字設計。CSAF通過對學習型組件進行嚴格的自動測試來實現持續驗證。圖2說明了CSAF如何與現有的和新興的工具相結合,在持續集成/持續部署(CI/CD)環境中提供自動化、目標定向測試、運行時間可靠驗證。

圖2 控制系統分析框架概述

2 引言

在過去的十年中,將機器學習技術應用于網絡物理系統方面取得了巨大的進步,導致了支持學習的自主網絡物理系統的發展;這些系統已經在空中、地面和深海環境中得到了初步的部署。機器學習使圖像處理、決策和控制的強大和適應性方法成為可能。然而,由于這些系統的操作行為缺乏強有力的保證,以及許多訓練方法需要大量的數據,這些系統的廣泛采用和更廣泛的接受受到了阻礙。

2.1 符號系統測試

這一工作的第一階段探討了如何將為傳統軟件系統開發的形式化驗證和原則性測試技術重新用于驗證、安全和改善學習型系統的訓練時間。具體來說,我們將這些技術用于現實世界中復雜的異質系統(F-16模型),該系統由傳統算法、自適應控制和學習型組件混合組成。我們的技術將相關領域的知識作為模型生成的一部分,在第二階段我們進行了高覆蓋率的系統級測試。這種方法為部署的機器學習模型的安全性提供了高度的保證,即使是在面對意外的環境干擾時。第一階段的初步結果成功地證明了使用正式模型來有效地指導學習,改善訓練時間,提高性能,并使數據得到更有效的利用。因此,我們預計這將大大擴展深度學習方法可以應用的系統組件的范圍。

我們將上述對學習型系統的正式驗證和測試與運行時保護方法的工作相結合,以確保學習型控制器(LEC)算法的正確性。我們利用先進的機器學習(ML)異常檢測方法來評估LEC輸出的質量。我們提供了替代的、確定性的程序,這些程序既可以用來引導LEC的不良行為,也可以提供適合形式化驗證的LEC行為的替代抽象。最后,我們提供了利用我們的測試結果來提高我們重新訓練的LEC的效率和穩健性的方法。

雖然通過學習來適應控制法則對實現更靈活的車輛系統很重要,但對動態變化的適應也同樣重要,例如,由于部件的退化或平臺的損壞。第一階段推進了先前的工作,開發了新的系統動力學學習方法,利用基礎系統物理學知識,提供更可靠和有效的結果。

2.2 可靠學習挑戰問題

Galois在Aditya Zutshi博士的領導下,開始收集基準挑戰問題,包括波音公司的TAXINET/X-Plane模擬器、汽車學習行動(CARLA),以及控制理論研究中使用的學術基準。F-16 AeroBench基準[76]的選擇是為了使我們的工作與空域挑戰問題集和正在進行的波音公司TAXINET/X-plane的感知工作相一致,使用基于感知的學習技術。第一階段的高潮是將我們的工具和技術早期整合到一個模塊化的學習型控制器測試線束中,使用F-16模型來演示F-16地面防撞系統(GCAS)機動的保證學習。作為第一階段挑戰問題2.5的一部分,我們成功演示了GCAS機動。

在第二階段,團隊繼續開發控制系統分析框架和其他工具,重點是F-16空中防撞(ACA)挑戰問題。在第二階段,我們演示了單人和多人的F-16空中防撞,作為該計劃挑戰問題3.2的一部分。

2.3 CPS系統的訓練、魯棒性和形式驗證的方法

普渡大學團隊在Suresh Jagannathan博士和Ananth Grama博士的領導下,致力于保證學習型控制器的六個核心部分:

(i) 下一代高效的學習模型的訓練程序。

(ii) 在強化學習(RL)控制器中使用新的訓練程序。

(iii) 保證控制器性能和物理設備安全的正式方法。

(iv) 應用于CPS系統的穩健性技術。

(v) 控制器的可擴展驗證;以及。

(vi) 新的規范形式和編譯技術,用于高保證的多智能體自主系統。

2.4 OSU的異常檢測調查

俄勒岡州立大學(OSU)團隊在Tom Dietterich和Alan Fern博士的領導下,對跨越許多應用領域的兩類數據的異常檢測(AD)進行了調查。研究異常檢測的動機是,保證機器學習系統的自主性必須能夠檢測到與訓練系統相比,系統何時處于新的 "運行狀態"。

第一個AD調查研究了深度圖像分類的開放類別檢測問題。這個問題涉及到開發一些方法,以確定一個經過訓練的深度圖像分類器在部署后遇到的輸入圖像,相對于訓練數據中的類別而言,是否屬于一個新類別。我們的工作重點是使用 "神諭技術 "來分析這個問題的深度表征和異常檢測方法的互動。結果表明,改進的表征與基于這些表征的改進的異常檢測信號相比,有相對的改進空間。

第二個AD調查研究了分布外動態(OODD)檢測的問題。這個問題涉及到確定何時一個時間過程,例如一個部署的學習控制系統,正在經歷與它被訓練的動態不同的動態。這是一個在深度強化學習(DRL)文獻中很少受到關注的問題,盡管它具有實際的重要性。我們的第一個貢獻是設計和開發了第一套基于常用DRL領域的ODD基準和度量。我們的第二個貢獻是設計、開發和評估了一個強大的基線OODD方法,它提供了非微不足道的性能,但也為基準留下了改進空間。這為OODD檢測的未來進展奠定了基礎。

2.5 實時學習系統動力學(物理感知學習)

由Ufuk Topcu博士領導的德克薩斯大學(UT)奧斯汀團隊的工作重點是開發數據驅動的算法,用于在非常嚴重的數據限制下對未知動態系統進行可達性分析和控制。這項工作是由系統動態發生重大和意想不到的變化的情景所激發的。在保證學習計劃中,這些工作被應用于F16模型被置于需要快速傾斜系統動力學的場景中,因為在操作條件、故障和極端的地面防撞場景中,傳統方法無法提供保證。

2.6 學習程序性政策的強化學習方法

由Swarat Chaudhuri博士領導的UT Austin團隊(最初在萊斯大學)開發了模仿-預測程序化強化學習(PROPEL),這是一種強化學習方法,用于學習可以用預定義符號語言表達的程序化策略(關于這項工作的論文《模仿-預測程序化強化學習》發表在2019年NeurIPS大會上)[48]。符號化策略是一個決策程序,例如 "如果(道路暢通)加速,否則減速",可以想象它是由人類工程師編寫。相對于傳統的深度強化學習,其中學習的策略是不透明的神經網絡,程序化的策略是可審計的,并簡化了正式的正確性驗證。這個政策學習問題是用鏡像下降法解決的,該方法保持了一個神經和程序化政策的加法組合,使用歸納程序合成和基于梯度的優化的混合方法迭代更新這兩個部分(更多內容見第3.5節)。該方法在一個模擬駕駛任務以及一系列經典控制任務上進行了評估。實證結果表明,該方法發現了人類可理解的策略,而沒有明顯影響性能。

該團隊還開發了一種強化學習的方法,在探索過程中構建的每一個中間策略都得到了正式的驗證,并在2020年的NeurIPS上展示了 "具有正式驗證的探索的神經符號強化學習"(REVEL)。在算法上,REVEL學習神經策略,這些策略由確保每一個行動都是安全的盾牌來保護。該學習算法使用一種鏡像下降的形式來迭代更新策略的防護罩和神經組件,同時保持安全,而不需要直接的神經網絡驗證。該方法在控制和機器人學的幾個基準上進行了評估,這些基準類似于簡化的自動駕駛應用。結果表明,REVEL可以在學習過程中保證最壞情況下的安全,而其他最先進的強化學習方法在學習過程中經常違反安全約束。

在項目的最后階段,該團隊探索了學習符號策略的機制,這些策略在被視為像素的場景中運作。在這里,一個神經網絡被用來識別一個場景中有趣的實體。然后,這些實體被視為命名的變量,一個以這些變量為程序的程序被自動發現。

付費5元查看完整內容

本報告詳細介紹了萊斯大學與美國陸軍作戰能力發展司令部(DEVCOM)陸軍研究實驗室(ARL)之間的合作協議的關于網絡軌道上進行的第二年研究工作。這個項目的驅動力是開發自主網絡,以支持分布式多域作戰,同時對近距離的對手具有強大的彈性。這些尖端的網絡必須具有能源和頻譜效率,能夠自適應不同的作戰條件,并且在設計上能夠安全地應對新一類基于學習的威脅。第二年的一個亮點是DEVCOM ARL和萊斯大學的研究人員在整體參與和出版物方面的重要合作。

圖 用于估計場景幾何的示例網絡拓撲。盟軍節點之間正在進行的數據傳輸被解碼并重新用于對坦克進行成像。

1 引言

本項目的最終目標是設計新一代的自主無線網絡,以支持分布式多域作戰(MDO),同時對近乎同行的對手具有強大的彈性。本報告總結了本項目第二年取得的進展,并為未來幾年制定了明確的研究方向。

自主網絡對于使軍隊能夠比對手更快地進行MDO演習至關重要。此外,這些也將促進整個戰斗空間(陸地、空中、海上、太空、網絡空間、頻譜、信息環境)和各種作戰功能(情報、任務指揮、火力、維持、保護、運動和機動)的融合和利用跨領域的協同作用。

為了開發新一代的網絡,該項目已被組織成三個相互關聯的研究方向:

  • 從毫米波到太赫茲的安全網絡。材料的創新使人們能夠并且將繼續能夠獲得從低GHz到THz的廣泛頻譜。然而,新的能力帶來了新的挑戰,因為在更高的頻段,通信越來越具有方向性。在這個方向上,我們正在開發新的方法,以利用新興設備的特殊性能,這些設備可以在GHz到THz的頻段上進行傳輸,由萊斯大學的多個實驗室和部署的測試平臺支持。

  • 人工智能(AI)驅動的自適應網絡管理。通信能力的最新進展為網絡管理和優化提供了一系列豐富的調整旋鈕。然而,網絡戰是依賴于場景的,并與信道和流量條件以及設備能力緊密相連。在這個主旨中,我們利用人工智能來了解作戰環境,并將網絡的作戰點引導到最佳狀態,甚至在惡劣的條件下。

  • 保護網絡免受基于人工智能的威脅。基于學習的攻擊已經打開了一個新的威脅載體,被動的對手可以從聆聽正在進行的傳輸中學習,甚至從加密的網絡中潛在地提取關鍵信息。我們正在開發創新,使對手更難提取信息,創新范圍包括新的天線和新的高層方法。

2 第二年的主要成就

第5、6和7節詳細描述了在這三個方向上取得的進展。作為一個總結性的預演,我們在此提供一份第二年期間每個方向的主要成就清單。

從毫米波到太赫茲的安全網絡

  • 實現了一種保護太赫茲鏈路的方法,該鏈路表現出角色散,表明可以同時實現大帶寬和安全。

  • 實驗證明了來自 "中間元表面 "攻擊的威脅,其中一個強大的對手試圖截獲高度定向的通信而不被發現。

  • 展示了基于多面漏波天線(LWA)架構的強大的移動高定向鏈路的基礎,該鏈路跨度為100GHz至1THz。

人工智能驅動的自適應網絡管理

  • 結合圖神經網絡的表達能力和算法展開的靈活性,為多輸入多輸出(MIMO)系統和能量受限的場景設計了可學習的功率分配機制。

  • 為聯合學習提出了一個可證明的接近最優的功率分配策略,其中包含了學習系統的特定約束。

  • 開發了一種基于圖機器學習的可訓練和可擴展的鏈路調度方法,增強了現有的方法并達到了最先進的性能。

  • 設計了一個訪問控制的學習方案,可以在現有協議之間進行切換和調整,以使預先指定的效用最大化。

保護網絡免受基于人工智能的威脅

  • 開發了一個無監督的 "無線日記 "框架,無需事先訓練就能識別無線節點的數量。

  • 開發了一個框架,在存在錯誤測量的情況下,從一個竊聽者那里估計鏈接率。

  • 開發了一種方法,被動地利用空氣中的無線能量來估計場景的地理位置。

支撐的硬件框架

付費5元查看完整內容

美國海軍的無人作戰框架和智能自主系統(IAS)戰略解析了美國海軍的愿景,即如何通過迭代實驗來發展無人平臺,重點是發展新的作戰概念和實現這些想法的關鍵技術。美國海軍需要制定一個作戰概念(CONOPS),將無人水面和水下航行器(USV/UUV)納入現有情報、監視和偵察(ISR)流程。無人平臺(UV)面臨著操作和續航方面的挑戰,這將使它們在情報周期的處理和開發功能中成為獨特的難點。本文討論僅限于兩個具有顯著續航能力和收集能力的無人平臺,這兩項能力使無人平臺對作戰具有重大影響。這項工作回顧了關于超大型UUV(XLUUV)和中型USV(MUSV)能力和預期任務的非機密文獻,并與MQ-4C海神偵察機的發展進行了比較。確定了海軍在開發CONOPs時應該考慮的幾個因素和解決方案,如何在戰役層面將XLUUV和MUSV集成到ISR中。

1 簡介

“無人平臺在我們未來的艦隊中發揮著重要作用。成功地整合無人平臺——在海面下、在海面上和海面上空——為我們的指揮官提供了更好的選擇,以便在有爭議的空間里作戰和獲勝。它們將擴大我們的情報、監視和偵察優勢......”--美國海軍作戰司令部,2021年航行計劃

美國海軍目前正在開發一系列無人的空中、水面和水下航行器,以滿足其未來部隊需求。海軍的無人作戰框架和智能自主系統(IAS)戰略解析了海軍的愿景,即如何通過反復實驗來開發這些新平臺,重點是發展新的作戰理念和實現這些理念的關鍵技術。無人平臺將支持海軍的目標,即建立一支更加分散的部隊,能夠在通信退化的環境中作戰,同時在受到反介入和區域拒絕威脅的挑戰時能夠應對。雖然海軍的無人平臺仍處于不同的發展階段,但有足夠的數據表明它們的能力,可以提出新作戰概念,將這些新平臺與海軍長期以來的優先事項相結合。

美國海軍需要制定一個作戰概念(CONOPS),將無人水面和水下航行器(USV/UUV)納入現有情報、監視和偵察(ISR)流程中,無論是在戰斗期間還是在日常的非戰斗行動中。這種CONOPs將支持智能自主系統中至少兩個子類——分布式和持久性傳感器,以及戰斗空間的擴展、清晰化和精確化。無人平臺(UV)雖然有潛在的強大的收集能力,但面臨著操作和續航方面的挑戰,這將使它們在情報周期的處理和開發功能方面成為獨特的麻煩。海軍使用無人平臺作為ISR資產的概念將需要納入這些平臺獨特的適合完成的作戰目標,并且應該在這些平臺能力正在形成和實戰化的時候就開始制定。

為了把重點放在戰爭的戰役層面上,討論將限于兩個具有重要續航能力和收集能力的無人平臺,使它們具有實質性的作戰影響。這項工作回顧了關于超大型UUV(XLUUV)和中型USV(MUSV)能力和預期任務的非機密文獻,并與MQ-4C Triton(一種大型海上無人駕駛飛行器)的發展相比較。它確定了海軍在制定將XLUUV和MUSV整合到作戰層面的ISR的CONOP時,應該考慮的幾個因素和解決方案。分析的重點是在以海洋為中心的戰場上使用這些平臺,對手是在海面下、水面、空中和太空領域使用軍事力量的近鄰或同級對手。提到作戰指揮官時,設想了一個戰區聯合部隊海上分指揮官(JFMCC)和情報人員,在岸上或海上作戰中心(MOC)內運作。

2 背景介紹

美國海軍的分布式海上作戰(DMO)概念是為了在反介入、區域拒止(A2AD)戰場上擊敗競爭對手,它依賴于分布式、網絡化的ISR平臺。ISR資產將定位對手并為武器使用平臺提供目標支持。無人平臺與多域作戰(DMO)概念極其相關,因為DMO設想在對手的對峙或反介入武器的交戰區域內使用海軍資產。海軍23財年的長期海軍建設計劃指出,海軍預計在45財年擁有89-145個無人平臺,并提到更詳細的信息,可在機密的能力發展計劃中獲得。22財年的建設計劃明確指出,海軍正在尋求59-89艘USV和18-51艘UUV。海軍的資金優先級和迭代式無人平臺開發支持CNO將無人平臺作為分布式作戰的一個重要組成部分。

情報、監視和偵察是三個獨立但密切相關的功能,對于軍事行動至關重要。廣義上講,情報是收集和分析與決策有關的信息。監視是使用收集資產來監測一個地點的相關活動,而偵察是將收集資產部署到一個確定的區域,以定位或確認沒有相關活動。當無人平臺用于ISR功能時,將主要作為收集資產來監視或偵察特定區域,尋找相關活動。這些平臺的 "無人"性質,使平臺本身更具有成本效益,不容易被置于危險之中,但卻使其作為ISR資產的有效性變得復雜。采集行動必須以足夠嚴格的方式進行預規劃,以滿足指揮官在不可能重新分配任務的通信環境中繼續生存。此外,收集到的數據必須傳送給有能力將信息開發成情報的分析人員,以便為作戰決策提供依據。

3 MQ-4C "海神"偵察機

MQ-4C "海神"是由RQ-4 "全球鷹 "改裝的大型無人機,用于提供持久的海上ISR。"海神"的開發是為了滿足海軍對持久性ISR的需求,最終被確定為廣域海上監視(BAMS),用于A2AD環境。"海神"在一次任務中可以飛行超過24小時,作戰范圍為8,200海里。為了滿足海軍的要求,對RQ-4進行了具體的修改,最明顯的是要求在惡劣的海上天氣下下降和上升,以便目視識別通過電子信號定位的水面航行器。這一要求需要增加除冰能力、防雷和其他強化措施。

2020年1月,海軍對 "海神 "進行了首次早期作戰能力(EOC)部署,向關島的安徒生機場派出了兩架飛機。該飛機作為CTF-72的一部分,向在INDO-PACOM責任區作戰的聯合部隊提供海上巡邏和偵察,這是ISR的一個方面。在飛行行動中,"海神 "由四名飛行員組成的機組控制,他們在地面控制點進行操作。這些操作員駕駛飛機,不進行情報開發,情報開發由一個單獨的專家小組提供。2020年派往關島的機體并不具備整套預期的收集能力,只有光電/紅外(EO/IR)視頻流和一個海上雷達。海軍目前正在測試 "海神 "的升級版、多智能改進版,它增加了信號情報收集能力,是打算取代有人駕駛的EP-3E Aeries II飛機的平臺。

盡管還沒有完全投入使用,但 "海神 "號的早期使用提供了一些經驗,應該為大型無人水面和水下船只的發展提供參考。首先,"海神"和其他無人平臺所收集的信息將需要傳送給人類分析人員進行開發。雖然存在識別感興趣的信號的自動化程序,但它們還不能將這些信息置于當前友軍和敵軍行動的背景下,并告知決策者。其次,大型無人駕駛系統依賴于岸上的維持和維護。像 "海神 "一樣,任何大型的平臺都需要返回基地或港口進行維修、加油和卸載收集的數據。這些岸上的設施是平臺操作的關鍵要求,可能會受到干擾或攻擊。第三,在建造無人平臺時,應了解任務和有效載荷在未來可能發生變化。為平靜的海況和適度的溫度而建造的無人平臺,在大海里、惡劣的天氣或極端的水溫下,可能不那么有效或無法操作。

4 “虎鯨”超大型無人潛航器(XLUUV)

5個“虎鯨”超大型無人潛航器(XLUUV) 中的第一個,在19財年得到資助。其基于波音公司的Echo Voyager XLUUV進行開發,預計在22財年作為一個測試平臺,用于開發作戰概念和關鍵的使能技術。XLUUV幾乎肯定不會有能力以載人潛艇的保真度來探測、跟蹤和分類聲音。這主要是因為UUV缺乏訓練有素和有經驗的船上潛艇人員的專業知識,而且XLUUV是一個比載人潛艇小得多的平臺,限制了任何船上聲納陣列的能力。然而,XLUUV的模塊化性質擴大了其潛在的收集能力,包括船上攜帶的任何可部署的系統,以及船體安裝或牽引的聲納陣列。下面將討論基于有機傳感器或XLUUV攜帶的有效載荷進行數據收集。

將XLUUV作為ISR資產使用的最重大挑戰是缺乏與地面控制點的頻繁通信。現有的能力并沒有確定XLUUV是否有能力升起一個通信桅桿或浮標來傳輸數據和接收修訂的指令。這樣做會削弱使用水下航行器作為ISR資產的主要優勢,即它的隱蔽性。這為作戰計劃者確定了三種可能的行動方案。第一,XLUUV在其行動期間不能發送或接收任何數據。這將限制XLUUV只執行預先計劃的行動,并剝奪行動指揮官重新分配資產的任何能力。第二,XLUUV可以部署一個僅有接收能力的通信天線。這將允許指揮官重新分配XLUUV的任務,但不允許該資產廣播接收指令,這使得操作人員不確定新的指導是否正在執行。用來傳達這種新指導的廣播有可能揭示UUV或潛艇的行動區域。第三,XLUUV可以采用一個同時具有發射和接收能力的通信浮標。這將使指揮官能夠發布新的指令,并確認XLUUV已經收到并將執行新的任務,但也有可能將UUV的位置暴露給對手。每種方案都是在安全和作戰指揮官的靈活性之間做出的折衷。

繼隱身之后,UUV作為ISR資產的第二個主要優勢是其收集聲學數據的能力。聲學情報,即對這些數據的處理和利用,是一門極富挑戰性的學科。聲學數據需要分析人員花費數年甚至數十年的訓練和經驗來進行分析。由于這門學科的挑戰,海軍應該尋求現有的聲學情報卓越中心來分析XLUUV收集的數據。海軍在弗吉尼亞和華盛頓有兩個海軍海洋處理設施(NOPFs),由聲學和情報專家共同管理。這些設施作為綜合海底監視系統(IUSS)的一部分運作,并對來自海上采集資產的聲學數據進行持續分析使用。對于ISR功能,海軍應考慮將XLUUV作為IUSS資產,并利用NOPFs的常駐聲學情報專家來處理和分析收集的數據。

需記錄的聲學信息通常也會產生大量的數據,覆蓋較長的時間段。可能需要幾周或幾個月的時間來充分開發XLUUV任務的所有記錄數據。當考慮到前面討論的通信挑戰時,使用XLUUV作為ISR資產將需要對XLUUV支持的確切行動目標進行詳細規劃。這種規劃應導致對UUV的反應進行預先規劃,以滿足指揮官意圖的具體檢測。操作員應考慮三種反應,即立即反應、暫時延遲反應,或決定繼續執行任務并在回港后分析數據。

一旦XLUUV檢測到特定的標準,例如特定對手潛艇的聲學特征,它的反應應該由作戰指揮官仔細預先確定。在這種情況下,XLUUV有三種可能的行動。第一,停止其任務,并通過通信桅桿或非系留的單向傳輸浮標,立即向作戰指揮官發出通知,說它已經探測到對手的潛艇。如果敵方潛艇對指揮官的部隊構成危險,并且需要時間敏感的定位信息來使反潛戰(ASW)資產加入戰斗,這種反應可能是適當的。二,XLUUV可以釋放一個單向的通信浮標,在延遲后將探測結果廣播給作戰指揮官。這種折中的反應將為指揮官提供最近的定位數據,并提高他的態勢感知,但也允許UUV離開該地區,繼續執行其任務而不暴露其位置。如果指揮官希望在近乎沖突的時期提高態勢感知,但又不試圖主動瞄準對手的潛艇,這種反應可能是合適的。第三,XLUUV可以簡單地繼續記錄聲學數據,對探測進行日志記錄,并繼續執行其任務。日志記錄將有助于回港后的開發。這種反應在非沖突時期和XLUUV執行一般監視任務或收集作業環境信息時可能是合適的。這些反應選項中的每一個都利用了當今可用的技術,并為作戰指揮官提供了靈活性,以根據作戰需要指揮所需的反應。

波音公司公開的Echo Voyager XLUUV的數據顯示,它的航程為6500海里(NM),最大速度為8.0節,最佳速度為2.5-3.0節。從關島阿普拉港到俄羅斯太平洋艦隊所在地阿瓦查灣約2450海里,到中國南部戰區海軍駐地亞龍灣約2050海里。如果Orca XLUUV的能力與Echo Voyager的能力相近,這將使最有可能收集情報的地點處于部署在關島的XLUUV的行動范圍之內。然而,在離母港很遠的地方使用XLUUV可能會導致在接收和利用收集的數據方面出現重大延誤。根據2.5-8.0節的前進速度,從阿瓦查灣返回關島大約需要13至40天。該平臺漫長的旅行時間,加上分析所收集的數據所需的大量時間,促使XLUUV在ISR中最有可能的用途是對作戰環境的一般性收集,或有可能實施監視任務,將該平臺的長耐久性與前面描述的即時或延遲傳輸通信方法相結合。

作為一個無人平臺,XLUUV在維持和維護方面也將面臨獨特的挑戰,這將影響其作為ISR資產的使用。XLUUV被設想為一種可部署或遠征的能力。對這種能力的討論似乎僅限于單個或少量的船體,然而DMO概念和海軍造船計劃設想了幾十個平臺,所有這些平臺都將需要運輸、地面支持和碼頭空間來運作。任何降低或拒絕完成任務的物質缺陷都需要長時間返回港口或可能返回位于對手威脅范圍之外的水面艦艇。維護和保養的現實需要被納入任何利用無人武器作為ISR資產的作戰計劃中,這可能導致它們主要被用于非戰斗性的情報準備任務,在這些任務中,故障的影響比戰斗行動中要小。

5 中型無人水面艦艇(MUSV)

美國海軍的MUSV目前正在基于最初的原型平臺Sea Hunter(SH1)和Seahawk(SH2)的基礎上進行開發。MUSV的具體目的是發揮ISR的作用,提供一個集成到海軍戰術網格中的無人傳感器和電子戰平臺。MUSV計劃目前在平臺能力方面的定義不如XLUUV,但其發展足以考慮具體的ISR功能和作戰概念。將MUSV作為ISR資產使用的關鍵決定是確定它們是作為獨立的收集器還是作為從屬于有人駕駛的水面艦艇的資產。

無論是哪種使用方式,MUSV都將以類似的方式發揮作用--收集現有的電子數據,進行初步的開發和處理,并將收集的結果轉發給岸上和海上的分析人員和系統。區別在于船上的收集系統在尋找什么信號,以及向誰和如何轉發收集的信息。當MUSV作為載人艦艇的支持力量運行時,它的收集系統應集中于探測和跟蹤來襲的威脅,并為被支持的艦艇提供目標定位的幫助。傳感器包應能同時識別和跟蹤反艦巡航導彈、彈道導彈、高超音速導彈、水面艦艇、有人和小型無人駕駛飛機,并提供潛望鏡探測能力。MUSV應該能夠將其收集的結果直接提供給被支持的艦艇,而不依靠干預的地面站或衛星,然后協助選擇和確定防御措施或反擊的目標。

如果作為一個獨立的收集器運行,MUSV最好配備能夠超越基線追蹤多個空中和地面目標的傳感器,并自動將這些追蹤與已知或可疑的對手平臺聯系起來。這些數據應該被轉發給作戰指揮官,以建立共同作戰圖(COP)。這兩項任務,直接支持載人艦艇或提供COP發展的獨立行動,包含了監視和偵察任務的要素。然而,最佳的傳感器和通信能力在不同的任務之間是不同的,這需要在進一步發展MUSV時予以考慮。

作為主要的電子情報(ELINT)收集器,MUSV將需要依靠現有的ELINT分析員來分析所收集的數據。海軍水面艦艇上一般都有可以進行這種分析的密碼學人員,盡管他們目前的任務是操作和利用其艦艇的有機收集能力。如果MUSV上有足夠的通信能力,那么收集到的數據可以被發送到岸上的分析人員進行利用。在這種情況下,海軍信息戰指揮部(NIOCs)是數據利用的合理地點。將需要開發基礎設施和信息技術,以便將MUSV收集的ELINT納入現有的處理系統。此外,水面艦艇和岸上設施的密碼人員配置將需要反映出增加了一個新的收集平臺,提供多個需要分析的數據流。

6 反論點

像“虎鯨”和MUSV這樣的大型無人平臺被設想為未來技術的一個組成部分,它將實現海軍的DMO概念。這一設想聲稱,從無人平臺收集的數據將通過海軍戰術網格和聯合全域指揮與控制(JADC2)網絡傳達給作戰級指揮官。CNO的NAVPLAN 2021指出,建立一個強大的海軍作戰架構(NOA),這將支持將無人平臺收集的數據納入JADC2,是僅次于調整海上戰略威懾力量的第二大發展重點。目前的ISR平臺開發正在將重點從人力密集型部隊轉向自動化能力,以在有爭議的環境中擊敗同行的對手。AI/ML的使用將導致收集的數據處理和利用的速度呈指數級增長,大大增強作戰指揮官的態勢感知,并減少從檢測到對手到使用武器的時間。對收集到的數據進行網絡化、自動化的利用,將是分布式作戰的一個重要推動因素。

7 辯證

網絡化通信和AI/ML的發展必然會導致無人平臺的有效使用,這有三個原因。第一,作戰藝術取決于對作戰環境、敵方和友方部隊以及作戰目標的深入分析和理解。無論提供何種工具,這種理解和部隊的有效使用將始終取決于一個有能力的作戰指揮官。作為一種ISR資產,無人平臺將依賴于指揮官和情報人員的明確行動任務。第二,目前人工智能/ML工具在情報分析中的狀態是有希望的,但離開始復制人類分析的能力可能還有很長的路要走。人工智能/ML工具只能復制人類思維和行動所形成的模式,而且幾乎可以肯定的是,無論開發何種算法,都會錯過與作戰藝術相關的新趨勢和異常數據。海軍在培訓和保留AI/ML專業知識方面也面臨挑戰。第三,大型UV目前正處于迭代實驗階段,在設計平臺能力的同時,現在就需要制定作戰概念。等到無人平臺達到最終的生產狀態,再為這些新的收集資產制定ISR CONOPs,將使海軍情報專家無法在開發過程中告知滿足作戰意圖所需的傳感器和能力。

8 結論

美國海軍情報界需要充分投資于大型無人平臺的發展,特別是發展將這些平臺用于ISR角色所需的能力和概念。海軍在將無人平臺納入ISR過程中的經驗將為利用無人水面和海底艦艇提供參考,但不能直接轉化為利用無人平臺。在通信惡化或被拒絕的環境中運行的無人平臺可能需要大量的岸邊基礎設施來處理和利用收集的數據,對這種基礎設施和人力的投資應該與平臺的開發同時進行。從無人平臺收集的數據可能需要大量的時間來處理和利用,減少了它們在指示和警告(I&W)任務中的作用,并可能引導最佳傳感器套件來支持作戰環境的收集。由于在處理和利用收集的數據方面的挑戰,無人平臺不會取代現有的載人飛機、水面和水下航行器以及國家高空收集的ISR功能,但如果開發和使用正確的能力和作戰概念組合,無人平臺可能會成為發展指揮官態勢感知的有力工具。

付費5元查看完整內容

本報告描述了2021財年美國陸軍作戰能力發展司令部(DEVCOM)陸軍研究實驗室(ARL)未來風險項目 "決策動力學、欺騙和博弈論"的研究工作。為了提高指揮和控制多域作戰的決策輔助工具的有效性,有必要開發能夠協助復雜決策的人工智能(AI)工具。該項目開發了一個人工智能測試平臺--ARL戰斗空間(ARL Battlespace),用于創建和研究復雜推理的人工智能決策輔助工具。ARL Battlespace是一個由友好和敵對的人類和人工智能Agent組成的多人網絡兵棋推演工具。分層貝葉斯模型的初步結果說明,在具有不確定性、欺騙和博弈論的情況下,具有復雜推理功能的人工智能多學科發展框架具有潛力。該項目還開始開發一個基于與戰場可視化和交互平臺以及高性能計算持久服務框架的潛在集成的人機協作決策框架。這些成果為改善人-人工智能團隊的復雜決策和協作能力開啟了研究的大門

1. 簡介

作為美國防部人工智能(AI)戰略的一部分,美國陸軍作戰能力發展司令部(DEVCOM)陸軍研究實驗室(ARL)正在開發基于人類系統適應戰略的研究項目和技術,包括開發基于人-AI團隊決策和相互適應的超人能力的目標。這些新能力對于解決陸軍的多域作戰(MDO)戰略是必要的,特別是其滲透和分解階段,在此期間,人工智能輔助決策可以增強指揮官處理高速和大量信息以及地面、海上、空中、太空和網絡領域的復雜動態的能力。一個關鍵的挑戰是,現有的人工智能算法,對于復雜的決策來說是遠遠不夠的,而且對MDO相關場景的概括能力有限。另一個挑戰是,現有的陸軍理論和決策支持程序沒有將人工智能納入軍事決策過程(MDMP),而陸軍的自動規劃框架(APF)剛剛開始解決這一差距。此外,現有的人-人工智能編隊決策理論和技術僅限于簡單的決策,為復雜的深度決策在提供人工智能透明度方面非常有限,在這種情況下,多種依賴性、不確定性以及信息領域和行為者與復雜的人類、物資和環境動態相交。它們與人類專家的隱性推理協同工作的能力也很有限。發展這些能力需要一個綜合的、多學科的研究方法,包括為新的人工智能研究和人類與人工智能的編隊協作開發人工智能試驗基地。

對于兵棋推演,有必要開發能夠模擬包括戰術和戰略層面在內的多個梯隊的決策測試平臺。現有的兵棋推演決策工具,如Opsim、AFSIM和OneSAF,可以在多個規模上對許多因素進行建模和模擬,以預測基于戰略、物資能力和資源的結果,但它們受到老化系統的限制,有經驗的士兵可能難以學習,也不太適合開發人工智能和人類+人工智能編隊協作的能力。最近,人工智能能力的快速上升為開發和納入新型人工智能作為兵棋推演的決策輔助工具打開了研究的大門。最近人工智能推理的改進(例如,基于深度強化學習)是基于環境狀態完全已知的“開放”游戲(例如,跳棋、國際象棋和圍棋),它們是基于有限的合作性或欺騙性。即使在有額外復雜性的情況下,如環境的不確定性(憤怒的小鳥、雅達利),決策的復雜性、靈活性和對多人兵棋推演的可轉移性也是有限的(如撲克、Minecraft、星際爭霸[圖1])。盡管這些模型可以深入探索決策,但它們只限于選擇結果的潛在價值可以很容易測量和量化的條件。兵棋推演環境給人工智能學習帶來了困難和未解決的挑戰,因為有許多信息不確定性的來源,不僅來自環境,也來自人類和人工智能Agent。人工智能需要適應不斷變化的規則和戰略,迅速減輕出乎意料的敵方能力,并利用新的機會和友好的能力。人工智能還需要與他們的人類隊友相互適應,他們需要有默契的推理能力來與人類專家協同工作,并補償個人的偏見和啟發式方法以及變化的認知狀態。與博弈論等經典方法不同的是,未來狀態的預期效用可以根據合作或不合作的選擇對有限的行動集進行明確的量化,兵棋推演提出了跨環境和社會動態(包括合作性和欺騙性)以及跨多個時空尺度和領域的相互作用的可能性,這使人工智能學習決策如何與未來狀態價值相聯系的能力受到影響。

圖1 ARL在更廣泛的人工智能研究戰略中的Battlespace平臺

解決這一差距需要持續的基礎研究工作,實驗的重點是為決策中的具體問題發現原則和開發新的算法,并有能力將這些原則和算法與MDO的兵棋推演聯系起來。例如,在具有不完善的知識和不確定性的復雜情況下,提供接近最佳解決方案的人工智能可能比提供單一的"最佳"解決方案更有幫助。這種解決問題的方式與人工智能的透明度也需要探討。對近乎最優和不確定性等條件進行實驗,并采用新的作戰人員機器界面(WMIs),可以產生新的算法、通用工具和原則,更好地協同人類和人工智能對復雜決策的探索。

1.1 軍隊的相關性和問題領域

陸軍戰略科技(S&T)計劃的一部分是為 "超人類"的決策和行動開發能力。對于科技計劃中的"人-系統適應"部分,預期的結果是將人類特有的能力和機器的新興能力結合起來,最大限度地提高速度和選擇,以有效應對2035年及以后的社會技術環境的復雜性、智能化和動態性。預計這些研究工作將為人類引導的機器適應、訓練精通技術的士兵、混合人機思維、以及下一代人類系統集成和系統級分析創造新的能力。由于戰爭正在快速變化,包括不斷的技術變化,實現這樣的能力需要制定一個研究計劃,以推進人工智能、人類與人工智能的合作,專門用于復雜的決策。

作為DEVCOM陸軍研究實驗室未來風險投資(DFV)計劃的一部分,這個項目的目標是開發一個跨學科的計劃,以解決人工智能決策的復雜性和人類-人工智能團隊決策中的差距。這包括開發一個人工智能研究測試平臺--ARL戰斗空間,將復雜的兵棋推演決策抽象為關鍵要素,以便人工智能和人類-人工智能團隊的發展可以專門關注復雜的決策過程本身,同時避免物理現實主義和當今材料和理論的計算和概念限制。這也包括為如何發展人類-人工智能協作決策創造新的概念,了解如何塑造信息流以實現人類-人工智能決策的相互透明,以及在人類和人工智能都難以篩選出不確定性和欺騙的條件下實現相互適應性學習。顯性和隱性的決策框架都需要通過這個抽象的兵棋推演測試平臺來實現,以便人工智能可以在多個推理層次上學習和接受挑戰。還需要一個適當的抽象水平,以使多種類型的研究,包括神經科學、人工智能和決策理論交叉的學術研究,以提高人工智能決策的能力和復雜性,并改善其在軍事方面的轉化。

1.2 長期目標

根據設想,在2035年及以后的陸軍中,指揮與控制(C2)決策將由決策輔助系統來激活,該系統利用分布在多個梯隊的人工智能能力,并以復雜和快速的方式攝取所有領域的數據,這將使沒有輔助的士兵感到不知所措。啟用人工智能的決策輔助工具將能夠對戰斗空間進行前沿模擬和分布式訓練;在MDO的滲透和解除整合階段,能夠對條件、友軍和敵軍戰略以及能力變化的可能影響進行調整和前瞻預測;并能夠對關鍵決策進行事后審查。人工智能將為其決策提供透明度,使真實和抽象的決策空間互動可視化,并根據陸軍理論和未來理論的要求,對士兵的個體化和情境進行優化。相反,人工智能將與士兵共同適應,學習如何在信息不足、沖突或欺騙的情況下做出復雜的決定,并為有效的團隊決策重新塑造、完善和展示信息。有了人工智能Agent作為數據有效轉化和行動化以及利用顯性和隱性知識的合作伙伴,預計分布式C2指揮官將能夠在MDO的許多時空尺度和維度上共同制定和協調行動方案,并且戰術和戰略的跨領域互動將被向前模擬,對環境、人和戰略的動態有更強的彈性。除了增加復雜決策的能力外,預計決策過程本身將通過消除繁瑣的計算和其他延遲而加速,從而使計劃和戰略能夠比實時更快適應不斷變化的戰場和外部(如外交、經濟)因素。

為了實現這一未來,為復雜決策開發新型人工智能的計劃的長期目標是利用多個學科的持續進步。用于推理的"核心人工智能"的發展,在為簡單決策迅速取得進展的同時,需要持續的協同創新,以及來自神經科學和心理學等領域的研究,以便在獎勵難以分配給具體事件或行動的條件下(例如,因為不清楚以何種程度的確定性將獎勵的原因歸于誰、什么、何時、何地或為何),為強化學習開發新型理論。需要機械層面的理論(例如,神經膠質網絡如何支持將不同的事件與獎勵聯系起來)和更高層次的理論(例如,社會規則如何塑造學習)來彌補目前核心人工智能的有限能力和C2決策的需求之間的差距。還需要協同創新和研究,將人工智能的發展與士兵的隱性推理過程相結合,以實現元學習和元推理的決策互動。

1.3 DFV項目的目標

ARL DFV項目是一種機制,旨在促進跨學科基礎和應用研究的新方向,解決研究差距,并為軍隊的任務創造新的能力。DEVCOM ARL研究員認為分析科學是一個需要能力的領域,具有高回報的潛力,需要對現有項目進行重新規劃和擴展,并需要新的項目來建立新的核心能力和建立內部的專業知識。

為了創造這些能力,這個DFV項目的主要目標是建立一個新的研究項目,為C2決策輔助工具的復雜推理開發新型人工智能。這包括開發一個人工智能測試平臺:ARL Battlespace,以便靈活地開發專門用于MDO C2決策的復雜推理的新型人工智能。現有的兵棋推演人工智能測試平臺往往局限于較簡單的決策,更注重于戰術性的地面行動。例如,正在進行的人工智能測試平臺開發工作,如ARL Simple Yeho人工智能測試平臺,側重于環境的真實性,有多個地圖層,包括道路、樹葉和海拔高度,向排長推薦決策,如路線規劃和士兵重新分配任務。由于對當地地形環境的關注,在該環境中開發的人工智能推理將集中在精細的社會和生態動態上,對協作和敵對決策動態進行深入訓練的機會比較稀少。這些稀少和復雜的問題("微小的、骯臟的、動態的和欺騙性的數據")迷惑了發展人工智能的經典方法,尤其是復雜推理。相反,這個DFV項目的ARL戰斗空間人工智能測試平臺抽象了當地地形的元素,將人工智能的學習和推理更具體地集中在復雜的MDO相關的C2深度推理上(多個決策步驟,包括更頻繁的合作和欺騙的機會)。這使得在C2兵棋推演的背景下,更有針對性地發展人工智能對復雜的多Agent(人、人工智能和人+人工智能團隊)的決策能力。

第二個目標是通過開發一個有效的WMI來研究和開發如何呈現人工智能的理解和預測以及如何利用人類的理解和預測,為復雜決策的有效人類-人工智能團隊合作創造條件。這項工作包括利用和開發高性能計算(HPC)資源進行計算支持,同時開發用于決策的商業二維交互和混合現實交互的定制軟件(例如,基于增強現實沙盤[ARES]平臺的戰斗空間可視化和互動(BVI)平臺)。通過開發多種WMI方法,我們期望這些平臺能夠實現復雜決策的快速原型研究,并能夠將我們的新型AI與更成熟的兵棋推演訓練和模擬框架與團隊進行整合。

我們預計,在新型人工智能開發、HPC計算支持和用于決策空間現實表現的WMI開發方面的這些努力將為人類-人工智能團隊的發展創造一個新的范例,為未來多個陸軍理論(MDMP、DOTMLPF、27 METT-TC28)的進步和現代化鋪平道路(圖2)。

圖2 在更廣泛的人類-Agent團隊決策研究戰略中的新型人工智能開發

這個項目開發了兩個研究框架 。首先,它開發了一個人工智能測試平臺,被稱為ARL戰斗空間,用于創建和調查人工智能的復雜協作和敵對決策。其次,它認識到目前軍事決策過程中的局限性,構思了一個用于人與人工智能協作的復雜決策的WMI,利用軍隊和商業開發的戰斗空間可視化平臺,與非傳統的HPC資源進行潛在的連接,實現人工智能增強的兵棋推演平臺。

2. ARL戰斗空間人工智能測試平臺

這里,我們描述了我們開發ARL Battlespace的方法,這是一個開源的靈活的兵棋推演平臺,將促進開發基于強化學習算法的新決策輔助工具。特別是,我們關注的是有三個或更多合作和敵對玩家的博弈論的理論和算法能力的差距。雖然博弈論的概念,如囚徒困境和Brinksmanship("吃雞"),對于兩個玩家已經發展得很好,但它們還沒有擴展到三個或更多的玩家,由于鞍點和局部最小值的存在,決策環境可能很復雜,這可能混淆了強化學習的作用。在戰爭中可能出現的情況下,理解和預測三個或更多的合作和敵對玩家的納什均衡,需要一個靈活的兵棋推演平臺,允許跨學科地探索這種決策空間。該兵棋推演平臺還需要能夠開發、理解和發現玩家和人工智能之間的新型互動和協同作用,使人類能夠利用人工智能快速找到最佳和接近最佳的解決方案。這些解決方案將使人工智能能夠從人類的決策模式中學習,以及如何優化其對決策空間的搜索。

2.1 框架

為了實現這些解決方案,我們開發了一個類似于國際象棋的棋盤游戲,由兩支隊伍組成,一支紅色部隊和一支藍色部隊,每支隊伍可以有多個聯盟(玩家)。游戲是在一個共同的戰斗空間上進行的,這個戰斗空間目前被設計為MDO每個領域的一套棋盤。圖3顯示了一組游戲棋盤的例子,我們考慮了一個"空中"和一個"陸地"棋盤。每個棋盤都被劃分為一組單元格,"空中"棋盤被放在"陸地"棋盤上,形成一個共同的戰斗空間。在這個例子中,我們選擇了創建方形網格,并且只考慮兩個領域。然而,在一般情況下,棋盤格可以采取任何形狀,并且可以任意縮小,而棋盤的數量可以靈活處理MDO中的每一個域。例如,"空中"盤可以由多個代表不同海拔高度的板組成。這種提法提供了一個通用的應用編程接口(API),允許在兵棋推演中取得基本的研究進展,因為它可以被定制以適應任何兵棋推演的場景。

圖3 用于復雜決策的ARL戰斗空間AI測試平臺

每個聯盟都被假定有一組部件,我們稱之為單位。目前,我們假設有四個地面單位和一個空中單位。地面單位由士兵、坦克、卡車和旗幟組成,而空中單位是飛機。每個地面單位目前都有相同的能力(即,相同的行動和視圖集)。然而,API的設計是為了使聯盟的每個單位都有定制的能力,從而使設計特定場景變得容易。

目前各單位的規則和行動如下。士兵、坦克和卡車都有一個目標,描述他們的導向。他們的行動包括 "什么都不做(doNothing)"、"轉向(turnH)"、"前進1(advance1)"、"射擊(shoot)"和"沖撞(ram)"。"doNothing"意味著該單位停留在他們的位置,不改變他們的狀態。"turnH"將單位的方向旋轉H度,其中H∈{-135,-90,- 45,45,90,135,180}。"advance1 "使其方向上向前移動一個單元。"shoot"向單位的方向射出一個彈丸,彈丸繼續向前推進一個單元,直到它與另一個單位相撞或在游戲盤外飛行。最后,"ram"行動使單位在其方向上向前推進一格,同時進行攻擊。與 "advance1"行動相比,"ram"行動總是有利的,因為攻擊可以消滅敵方單位。

飛機單位的規則和行動與士兵、坦克和卡車相似。這些行動是"什么都不做(doNothing)"、"轉向(turnH)"、"前進X、Y(advanceX,Y)"、"射擊(shoot)"和 "轟炸(ram)"。“doNothing”、“turnH”和“shoot”的動作與地面單位相同。行動“advanceX,Y”允許該單位沿東西軸線移動X單元,沿南北軸線移動Y單元。飛機也可以 "上升(ascend)"和 "下降(descend)"來起飛和降落。最后,"炸彈(bomb)"行動在飛機的正下方射出一個彈丸到陸地游戲盤上。旗幟單位無法移動,如果被俘,則被清除。

目前游戲玩法的實施很簡單。最初,每個聯盟(玩家)將其單位放在游戲盤的各自區域。當每隊有多個聯盟時,各隊的游戲板部分被平均分配給各聯盟。請注意,每個單位的位置對所有其他聯盟都是未知的。然后,每個單位觀察其可見范圍內是否有其他單位,提供一個戰爭迷霧的場景。我們將每個單位的觀察范圍定義為從該單位的當前位置開始的一個方塊;然而,可視范圍可以根據場景和單位的情況進行定制。一旦每個單位觀察到了,同一團隊的聯盟就會合作確定他們想為每個單位采取的行動集。這允許每個聯盟觀察其隊友的單位位置,并進行溝通以協調他們的計劃。接下來,每個聯盟為每個單位選擇一個行動。請注意,所選擇的行動只有屬于同一團隊的聯盟才知道。在選擇了行動后,游戲決議被應用,根據他們選擇的行動移動單位,并解決是否有任何單位被攻擊或與另一個單位相撞。如果一個單位被攻擊或與另一個單位相撞,它將被從棋盤上移走。這個過程不斷重復,直到游戲結束。

完成游戲取決于游戲的基本規則,這些規則可以根據具體場景進行定制。在這里,我們研究了兩種類型的游戲:(1)奪旗和(2)殲滅。奪旗游戲的目標是操縱地面部隊進入敵方領土以奪取對方的旗幟,旗幟的位置是未知的,必須通過探索才能發現。一旦所有的敵方旗幟被占領,游戲就會終止。殲滅戰的目標是發現并攻擊所有敵人的地面單位。在這里,一旦發現并消滅了所有敵人的地面單位,游戲就終止了。每種游戲的基本規則都是相同的,但實現每個目標的最佳策略是不同的。在這兩種類型的游戲中,由于敵方單位和旗幟的能見度有限,存在著高度的不確定性。

2.2 分層貝葉斯模型的試點實驗

接下來,我們報告了我們在開發基于模仿學習思想的人工智能Agent方面的初步結果,模仿學習使用的是由人類演示構建的分層貝葉斯模型。我們從討論數據收集過程開始,對數據進行分析,最后用啟發式方法使一個簡單的人工智能Agent勝過一個隨機Agent。

2.2.1 實驗設計

為了學習人類的策略,我們讓五個人類受試者組合在一起,針對第2.1節中討論的兩類游戲(即奪旗和殲滅),與兩個隨機Agent進行ARL戰斗空間游戲。在每個回合中,每個隨機Agent根據一個固定的分類分布為每個單位??選擇一個行動,其中采取一個行動的概率 取決于單位??可以采取的行動數。回顧一下,每個單位的行動在第2.1節中有描述。

每個游戲由一對人類受試者對兩個隨機Agent組成,在每個游戲開始時,人類受試者合作討論他們對該游戲類型的整體策略。這導致了20場游戲的收集,其中奪旗和殲滅戰各10場。一旦所有的游戲都進行了,就對游戲數據進行分析以確定人類的策略。

2.2.2 游戲數據結果和分析

分析游戲數據的第一個方法是研究人類玩家的行動頻率。行動頻率被定義為 ,其中D代表奪旗或殲滅的游戲數據。 是指在所有游戲中,單位??采取的行動次數,而??(??)是所有游戲中的總回合數。

圖4顯示了地面單位(即士兵、坦克和卡車)的行動頻率,圖5顯示了空中單位(即飛機)的行動概率。游戲的總體目標決定了所選擇的行動,使我們能夠確定所玩游戲的類型。如圖4所示,奪旗游戲的地面單位更有可能選擇前進和攻擊的方式,用 "沖撞"的動作來尋找旗子。此外,"什么也不做"的行動也被更頻繁地選擇。這是因為一旦團隊找到旗子,離旗子最近的單位就會采取行動去搶奪旗子,而其余單位則什么都不做。對于空中單位,人類受試者更傾向于選擇 "advance0,-2 "的行動,即把單位推進到敵人的領土上尋找國旗。

圖4 從人類游戲中產生的所有地面單位,以游戲類型為條件的行動概率

圖5 從人類游戲中產生的空中單位,以游戲類型為條件的行動概率

在 "殲滅"游戲中,人類Agent更傾向于選擇攻擊行動來消滅敵人的目標(即對地面單位采取 "射擊",對空中單位采取 "射擊"和 "轟炸")。為了進一步驗證這一策略,圖6顯示了每回合平均射彈數量的累積總和。顯然,"殲滅"游戲的射彈數量比"奪旗"游戲要多。

圖6 每一回合中射彈總數的平均累積總和

兩種游戲的另一個區別是,奪旗游戲的總回合數要比殲滅游戲少得多。這是因為人類Agent找到旗子的速度比他們找到敵方單位并消滅它們的速度要快。

基于對人類Agent如何與隨機Agent玩游戲的簡單理解,我們可以按照類似的方法來學習策略,為簡單的人工智能Agent開發啟發式方法。

2.2.3 從人類演示中學習的簡單人工智能Agent的性能

一個簡單的人工智能Agent的算法如下。最初,Agent隨機地將他們的單位放置在棋盤的指定區域。然后,每個Agent確定每個單位的狀態。考慮到狀態和游戲的目標,Agent從預定的概率分布中為每個單位抽取一個行動。

這個過程在每個回合中都會重復,直到游戲結束。預定的概率分布遵循一個分層貝葉斯模型。為了便于表述,我們在附錄中提供了相關理論。對于最簡單的情況,我們認為單位在每個回合中可能處于兩種狀態,。然后,概率分布根據附錄中的公式A-1定義,與圖4和圖5中的行動頻率類似。然后我們將這個分布實現在兩個簡單的人工智能Agent中,并與兩個隨機Agent進行比賽。作為一個基線性能,我們與兩個隨機Agent進行了比較。在這兩種情況下,都進行了1000場比賽,并計算了獲勝百分比。通過使用雙狀態概率分布,簡單的人工智能Agent能夠在奪旗游戲中贏得84.5%的時間,在殲滅游戲中贏得76.9%的時間。

接下來,我們為每個單位i考慮了一個更大的九態狀態空間,定義為,其中??r0和??r1分別表示一個友好單位是否被i單位觀察。??0和??1分別表示i單位是否觀察到敵方單位;以及??l0和??l1分別為團隊是否看到敵方旗幟。同樣,概率分布然后根據附錄中的公式A-1定義,并落實到兩個簡單的人工智能Agent。在奪旗游戲中,簡單人工智能Agent對兩個隨機Agent的獲勝比例為89.4%,在殲滅游戲中為82.3%。

結果摘要見圖7。有趣的是,在兩種形式的概率分布(即雙狀態分布和九狀態分布)中,奪旗策略都優于殲滅策略。這是因為 "消滅 "游戲中的Agent更有可能選擇 "射擊 "行動,由于隨機的初始位置,這將導致更多的友好射擊。因此,作為一個簡單的人工智能Agent,采取先攻后守的方法更有利。此外,當我們考慮到單位的額外狀態時,獲勝的百分比會增加。未來工作的一個可能方向是開發深度強化學習策略,以學習最大化獲勝比例所需的狀態定義和數量,即使是面對人類Agent,也要為MDO中的C2提供建議。

圖7 簡單AI Agent的獲勝比例

3. 復雜決策的實例場景

ARL戰斗空間測試平臺的關鍵優勢在于其靈活性和適應MDO任務規劃的變化需求。它的抽象性使關鍵的決策過程及其互動和動態被壓縮到一個較小的游戲盤中,并有更多可量化的人與人工智能的互動,用于開發人與人工智能的團隊合作。這使得人工智能的開發能夠集中于復雜決策的獎勵塑造,同時減少由于滋擾因素(如時空縮放)造成的學習障礙,這些因素使決策在時間和空間上變得稀疏,因此,更多的努力(人工智能以及人工智能開發者的部分)可以被用于在各種時空尺度的不確定性和欺騙下的學習。它還將兵棋推演互動中可能不容易被整合到人與人工智能團隊中的特質(例如,人類心理學的某些方面,如個人關系)放在一邊,以利于在人工智能推理發展方面取得更切實的進展。在下面一節中,我們介紹了幾個挑戰和發展人工智能進行復雜推理的例子。這些例子包括博弈論、元推理和網絡欺騙,涉及到現有人工智能算法尚未處理或解決的各種復雜決策。由于人工智能的C2決策輔助工具將有望超過人類水平的決策,不僅在速度上,而且在復雜性上,我們設想這樣的C2決策輔助工具需要能夠解決大多數(如果不是所有)的情景。

3.1 突破情景和重新想象博弈論

我們首先關注博弈論和兵棋推演之間的差距,在一個簡單的突破場景中,這是兵棋推演中經常遇到的一個經典問題(例如,在橋梁交叉口、地雷區和山口[圖8])。在經典的博弈論概念Brinksmanship("吃雞")中,友好的藍色和綠色坦克被激勵著越過缺口到達另一邊。通常情況下,這些坦克會協調他們的行動,但如果藍、綠坦克之間的通信被破壞,一個單位(如藍坦克)的行動可能會因為與另一個單位(綠坦克)的碰撞或友好射擊而導致低回報。如果還包括囚徒困境的元素,那么這個場景就迅速超越了經典的博弈論,因為可能需要綠色和藍色坦克一起穿越,共同攻擊更強大的紅色坦克,這需要仔細協調。額外單位的存在(例如,綠色飛機對敵對單位提供觀察、轟炸或干擾,如黃色士兵提供可能的增援)能夠進一步操縱動態和環境對決策的限制或機會。飛機也可能發現第二個缺口,或者 "墻"可以滲透,以創造缺口(例如,清除地雷或建立額外的橋梁交叉點)。

在粗略尺度(如10×10板)和背景下學到的行為可以通過獎勵塑造逐步推廣到更細的尺度和其他背景下。額外的地圖層也可以被添加到諸如快速地下運輸等領域,以繞過地面層中的墻壁。環境因素,如天氣,也可以包括在內,以改變機動性。因此,即使是一個看似簡單的場景,也可以提供豐富的機會來操縱影響決策動態和結果的因素,并探索不同類型的不確定性之間的相互作用如何改變決策景觀,以創建鞍點和局部最小值,從而混淆強化學習的作用。在戰爭中可能出現的情況下,理解和預測三個或更多的合作和敵對玩家的納什均衡,需要一個靈活的兵棋推演平臺,允許跨學科地探索這種決策空間。兵棋推演平臺還需要能夠開發、理解和發現玩家和人工智能之間的新型互動和協同作用,使人類能夠利用人工智能快速找到最佳和接近最佳的解決方案。這些解決方案將使人工智能能夠從人類的決策模式中學習,以及如何優化其對決策空間的搜索。

圖8 帶有豐富博弈論條件的場景

3.2 元推理場景、任務背景和戰略

在ARL戰斗空間游戲中,每個玩家都有一面彩色的旗幟,游戲可以通過殲滅所有對方的地面單位或奪取對方的所有旗幟來獲得勝利(現實生活中的一個等價物是奪取所有關鍵的橋梁或指揮中心)。根據游戲的狀態,指揮官可以決定改變整體策略(殲滅戰與奪旗戰),以更快地取得勝利。例如,如果一輛坦克已經接近一面旗幟,那么將剩余的單位轉到其他地方尋找剩余的旗幟可能是有利的(圖9)。相反,如果一支敵對部隊守衛著第一面旗幟,那么優先奪取這面旗幟可能會更好,這樣搜索第二面旗幟的效率會更高。這種未闡明的推理,或稱 "默契推理",往往在自然的人類決策中根深蒂固,這是一種需要開發的人工智能能力,以便人工智能能夠有效地參與人類-人工智能團隊的決策,使人工智能的發展能夠開始有工具來獲得人類決策的創造性。

圖9 帶有隱性推理和任務重新分配的元推理標志方案

對于人工智能的發展,這就需要一個額外的更高級別的推理Agent不斷地監測游戲的狀態,以做出切換策略的選擇,并將此傳達給控制各個單位的Agent。元推理包括監測推理所涉及的步驟,以及平衡影響活動結果的標準。此外,元推理結合了不同信息的不確定性,以產生更有意義的、符合背景的決策建議。納入元推理可以使約束條件和各種決策方法得到權衡,為行動方案提供不同的選擇。例如,基于元推理的替代選擇可以決定是否優先考慮探索與攻擊已知敵方單位與防御,部署哪種機動戰略,或者考慮到敵方部隊的可觀察位置如何重新分配任務。由于ARL戰斗空間環境的網格大小較小,游戲可以快速進行,導致經常有機會使用元推理,并使人工智能有機會學習結合和預測多種類型的元推理方法的相互作用。由于抽象環境增加了人工智能學習戰略如何交互的頻率,這將使人工智能學習更高級的戰略,例如需要平衡不同戰略、能力和任務要求之間的交互,保持選擇的自由,并產生戰略模糊性以迷惑對手。總的來說,這種方法的好處是通過增加控制和監測機制來改善決策,這些機制包括一個平衡行動和環境約束的元推理Agent。

3.3 簡單的欺騙和人工智能的心智理論

對抗性決策的一個關鍵方面,特別是在戰爭中,就是欺騙。欺騙可以發生在多個層面,包括戰略、可觀察的信息、單位能力和位置。在ARL戰斗空間中,單位的可觀察性有限,這自然為欺騙創造了機會,而飛機在敵方空間深處的探索能力也為揭開單位位置的欺騙提供了機會。圖10展示了一個簡單的欺騙場景的例子,在這個場景中,友軍的藍色和綠色部隊試圖穿越到另一邊。左下方的友軍士兵開始通過左邊的缺口發射導彈,因為他們的Agent推斷(通過對方Agent的人工智能心智理論),看到導彈后,敵方Agent會推斷出友軍正準備通過該缺口進行攻擊。這種欺騙,通過將敵方Agent的注意力和計劃集中到左邊的缺口,使他們偏離右邊的缺口,為藍綠坦克從右邊進入創造機會。通過設計有兩個缺口的情景,該情景建立在經典心理學的兩個替代性強迫選擇任務的基礎上,能夠應用敏感的心理學工具進行決策分析,并開發動物模型,從神經生理學和行為學上剖析支配欺騙的情境依賴性學習和決策的基本細胞和分子機制。例如,人們可以引入一些因素,使友好或敵對的決策出現偏差(例如,通過操縱傳感器的噪音或操縱總部的命令),或應用光遺傳學和化學遺傳學工具等方法,了解他人的認知、信念或策略的神經表征(例如,在前扣帶回和眶額皮層中)對決策計算的貢獻(在前額皮層中)。這種調查還可以發現決定一意孤行、啟發式方法和隱性偏見與對其他假設的開放性的因素,這可以幫助確定在特定條件下如何最好地重新分配任務(例如,當一個人對等級指揮結構有偏見時,他可能不太愿意追求與總部的命令相矛盾的傳感器信息)。這種固有的偏見、啟發式方法和默契的推理是人類推理的自然組成部分,在我們與他人的互動中會被預期到;人工智能的心智理論包括這種偏見補償,對優化人類+人工智能的團隊合作可能是有益的。

圖 10 需要人工智能心智理論的簡單欺騙場景

3.4 網絡欺騙、多領域整合和可信度

在人類的決策中,來自不同領域的信息可以結合起來,產生意想不到的效果。心理上的McGurk效應是指口型"ga"和聽覺上的音節"ba"在時間上有很強的同步性,從而產生幻覺"da"。雖然多感官整合似乎沒有在C2決策中得到探索,但MDO中多個領域的匯合,特別是其在穿透和分解整合階段的高容量和高速度,可能會產生意想不到的非線性跨領域的相互作用(這可能有助于"戰爭迷霧")。圖11說明了一個例子,在這個例子中,實際跡象(導彈)和坦克誘餌(由中間人[MITM]網絡攻擊產生)的組合可以協同作用,迫使敵方單位向左側缺口移動。為網絡欺騙創造趨同的跡象線是一種普遍的策略,然而特定的欺騙模式可能比其他模式更有效。例如,人們認為大腦會將相似或相關的跡象分組,以進行有效的處理(如格式塔分組),這樣就可以克服信息瓶頸(如處理七個以上的名義項目,從而減少單個項目的影響)。如果進行每一次網絡攻擊都會產生一定的成本或風險,那么了解如何將這些成本分配到不同的線索特征中,以便以最小的風險提供最有效的影響可能是有益的(例如,如果MITM攻擊產生導彈誘餌,那么它的效果可能會降低,甚至是反作用)。了解不同的線索組合如何被不同的士兵所感知,也可能是有意義的。具有不同偏見或處于不同角色或梯隊的指揮官可能對相同的跡象組合有不同的感知、解釋或行動(例如,一個誘餌的有效性可能取決于它與目標指揮官的距離以及與他的決策過程的相關性)。更高級的策略可能包括主動防御(例如,通過 "蜜罐 "策略[圖12]),以提高網絡欺騙的有效性。為了給MDO提供超人的能力,人工智能決策輔助工具可能需要根據即時可用的跡象在多個領域協助生成可信的誘餌,以網絡的速度迅速調整這些展示,并保持虛擬和現實世界之間的一致性,以保持幻覺的有效性。

圖11 帶有中間人攻擊的網絡場景

圖12 帶有蜜罐的網絡場景

4. 人與人工智能編隊協作的復雜決策

上一節所述的ARL戰斗空間人工智能測試平臺通過將戰斗空間地形抽象為一個沒有現實表現的網格狀環境,提供了人工智能開發和測試所需的靈活性。例如,圖8顯示了一個類似于墻的障礙物,它被表示為幾個網格塊,與單位互動時應用的環境約束條件有關。人類團隊和AI都在共同的雙級網格化戰斗空間內進行游戲。人類玩家通過在控制臺窗口中輸入基于文本的編碼命令與ARL戰斗空間互動。這種命令行的交互和顯示加速了人工智能算法的開發過程,并為人工智能兵棋推演所需的大規模實時計算建立了與計算資源的潛在聯系。為人工智能兵棋推演測試平臺(如ARL Battlespace)構思一個用戶界面,并建立通往外部計算服務的管道,構成了DFV第二個目標的基本組成部分--開發一個用于復雜決策的WMI。

一個跨梯隊和作戰級別的軍事決策過程模型構成了為人類和人工智能兵棋推演開發一個有效的WMI的基礎。在傳統的兵棋推演中,指揮官利用一個共同的基于地圖的作戰地形,并模擬MDMP中各種因素的組合如何產生行動方案(COAs)、可能的反擊行動、資源使用估計和預測結果。在幾天或幾周內,MDMP過程形成一套精煉的COAs,對作戰環境做出某些假設,包括地形、天氣和設置戰場的單位的可用性和能力(即為支持主要作戰行動而塑造活動)。

盡管MDMP幫助指揮人員了解作戰環境和考慮作戰方法,但這個過程有許多局限性,如時間密集性、假設的僵硬性、跨場景變化的訓練機會有限,以及很少有機會將人工智能指導納入決策過程。傳統上,一項任務的成功與指揮部執行MDMP的能力直接相關。然而,鑒于MDO的復雜性增加,有大量的任務指揮系統和流程,與行動相關的所有活動的整合和同步變得越來越困難,甚至到了人力無法完成的地步。缺少MDMP所導致的規劃專業知識的缺乏會導致行動的不同步和不協調,并最終導致士兵的生命損失。

MDMP中沒有具體描述戰斗空間的可視化能力,但它顯然在決策過程中發揮著重要作用。最近,整合了先進可視化能力的新系統和技術已經被開發出來,這些系統和技術可以提高對局勢的認識,從而加強決策過程。陸軍的例子包括Nett Warrior,它使下馬的戰士能夠直觀地看到附近的友軍和敵軍,同時根據當地的地形協作規劃戰術任務。盡管這項技術將無線電和數字地圖擴展到了下馬戰士,但它缺乏一個提供決策幫助的基礎人工智能引擎。BVI是陸軍技術的另一個例子,它能夠為任務規劃提供分布式協作,具有從任意視角和廣泛選擇的設備對共同作戰圖進行2D和3D可視化的能力。BVI架構可以被制定,以拉入外部計算服務,如分析管道、模型和AI引擎。

目前,MDMP并沒有將人工智能指導納入整體任務規劃方法中。陸軍的APF開始通過將自主技術插入MDMP工作流程來解決人工智能輔助決策的問題。指揮人員可以通過APF的數字規劃顯示、規劃創建者和規劃監控工具,在任務規劃和COA開發過程中獲得背景援助。任務執行和估計能力通過監測任務的規劃和實際進展,為改進決策跟蹤和支持活動提供自動協助。盡管APF在MDMP中引入了基本的自動化水平,但它缺乏Nett Warrior和BVI所提供的高級可視化和用戶交互能力。

除了MDMP之外,最近將人工智能納入決策過程的努力包括了一些方法,在模擬人類決策過程方面取得了一些成功。一般來說,對于決策變量有限的問題,如資源分配、飛行模擬器和較簡單的場景,人工智能取得了一些成功。目前面臨的挑戰包括:需要提高人工智能的能力,以解決有多個行動者、不完整和可能相互沖突或欺騙的信息、不斷變化的單位行動和環境屬性的復雜決策,以及需要將這些決策的后果在許多空間和時間尺度上可視化。

4.1 未來MDMP需要的進步

MDMP在支持MDO復雜決策方面的局限性,突出表明需要在三個方面進行改進。首先,有必要將人工智能生成的指導和輔助決策支持納入MDMP。這包括進一步發展和整合人工智能到戰斗空間決策規劃,以及進一步改善人工智能決策過程的可解釋性和透明度。第二,有必要在可能的情況下,將決策分析與戰略層面以及戰術邊緣的HPC的力量結合起來。這將能夠利用HPC系統的力量來改善建模、分析和計算時間,同時整合和同步來自所有戰區領域的信息。最后,有必要利用先進的可視化技術,如混合現實技術,對決策空間進行更準確和互動的展現。不是簡單地在一個固定的時間尺度上顯示地形的二維渲染,而是需要可視化不同領域的決策是如何互動的,并利用混合現實技術來提高理解的吞吐量和深度,并實現平面顯示不可能的洞察力。

MDMP是陸軍設計方法的核心,用于應用批判性和創造性思維來理解、可視化和描述問題以及解決這些問題的方法。作為解決問題的行之有效的分析過程,必須克服前面描述的MDMP的局限性,以便快速制定一個靈活的、戰術上合理的、完全整合的、同步的規劃,以最小的傷亡增加任務成功的可能性。下面的小節描述了對MDMP的潛在改進,以支持人類與人工智能的合作決策。

4.1.1 人工智能引導的決策指導

需要新的人工智能支持的WMI,以利用人工智能決策的持續進步,并為復雜的適應性決策的人工智能學習做出貢獻。通過匯集所有領域的信息,計算人類和人工智能Agent的風險和預期回報,人工智能決策輔助工具的發展將提供能力越來越強的COA建議。現有的人工智能有幾個局限性,特別是對于有不確定性的復雜和適應性決策,以及人類和人工智能Agent的協作和對抗。對多Agent的協作和對抗性決策進行建模可能特別復雜,因為它的遞歸性質,其他Agent是模型的一部分,需要對決策特征、個性化的價值、風險規避、記憶和注意力進行動態和不斷發展的估計。這些具有高度不確定性、復雜性和動態性的情況是人類擅長的領域,適當設計的人機協作交互可以提供加速和更有效的決策。為了實現有效的團隊合作,新穎的WMI應該幫助作戰人員篩選復雜的信息,幫助人工智能發現決策的隱含規則。在此,我們提供了關于人機協作如何有效的案例。

多域兵棋推演中需要的復雜決策是開發有效的人工智能決策輔助工具的直接挑戰。最近人工智能在圍棋和國際象棋等游戲中的成功是基于對世界現有狀態的完全了解(即 "開放"游戲),而兵棋推演通常包括關于作戰環境的不完整(如星際爭霸)、不確定和/或欺騙性的信息。由于世界狀態、不同行動者的狀態以及所采取的行動影響的不確定性,知識的缺乏使得人工智能Agent難以計算未來行動的風險回報情況。不確定性也限制了人工智能估計其他行為者的風險回報概況的能力,而這是計算有效博弈論策略所需要的。人工智能被可能的最優和近似最優選擇的廣度所淹沒(即由于信息有限而選擇錯誤)的情況并不少見,因為人類在制定有效探索隱藏信息的策略時,會采用啟發式方法來進行有效的選擇和預測。為了幫助發展人工智能的隱性知識和探索能力,新型的WMI需要有效地解釋和展示決策圖,以使作戰人員能夠快速和自然地瀏覽可能的選擇,同時使人工智能能夠適時地從人類的決策中學習,而不施加認知負荷。

開發人工智能的WMI的另一個基本挑戰是如何有效地整合和顯示MDO中所有五個領域的信息,特別是空間和網絡,因為這些領域的信息具有不同的時空尺度。對于網絡,決策的規模和速度可能比人類處理和理解的能力更快,需要人類的輸入來指導半自動的決策,以及一個實施進攻和防御欺騙策略的人工智能。WMI需要能夠以這樣的方式顯示決策圖,即一小部分最優和接近最優的決策策略清單是可以解釋的(例如,通過決策樹)。這應該包括對關鍵Agent在不確定情況下的未來狀態和風險回報情況的估計,以使有效的博弈論決策能夠被共同開發和相互理解。

這些挑戰為有效的WMIs的可能設計提供了參考。也就是說,我們需要有能力從不同的來源(包括從其他國家的決策輔助工具)攝取信息,以及一個能夠承載整合這些信息的計算能力架構,同時還要處理基礎的人工智能計算(包括學習和部署)。我們還需要共同開發一個交互和算法設計,以適時地利用人類和人工智能Agent的優勢并減少其局限性。

4.1.2 高計算能力下的決策過程

在MDO兵棋推演的復雜決策過程中,需要大量的計算能力來處理和記錄所有組件、實體和狀態空間。從動態狀態空間的累積數據集中建立過去、現在和預測模型,需要利用HPC資源來產生分析見解,并創建在復雜決策背景下有用的表示。

實施HPC分析工作流程的一種方法是使用持久性服務框架(PSF)。PSF是一個最近可用的分布式虛擬化解決方案,它可以通過一個基于網絡的前端實現對高性能計算服務的非傳統訪問,而不像傳統的HPC環境那樣,計算節點在特定時期內以批處理模式分配給用戶。此外,PSF可以提供對數據、數據庫、容器化工具集和其他托管平臺的分布式持續訪問。

在一個PSF方法的例子中,一個模擬引擎連接到PSF,用于記錄人類和人工智能做出的所有決策。這允許分析在任務規劃和COA開發過程中發生的決策行為,以及識別決策模式和戰略,以開發競爭和現實的兵棋推演場景。一個戰斗空間可視化平臺可以托管在PSF上,并使用信息傳遞協議來更新所有連接的設備接口。來自模擬引擎的狀態信息可用于生成戰斗空間和參與作戰單位的圖形表示。

使用PSF方法并利用HPC資源,可以實現利用大數據攝取和分析的人工智能輔助決策機制,同時可供地理分布的用戶用于協作決策工作。連接到PSF托管服務器的各種混合現實顯示模式可以支持從戰略層面的C2到作戰邊緣的更多移動戰術使用等一系列作戰場景。

4.1.3 決策空間的逼真呈現

用圖形表示各級行動的軍事決策戰略需要新的可視化方法,這些方法可以應用于以規則變化、認知狀態、不確定性以及個人偏見和啟發式方法為特征的動態環境。

戰斗空間的視覺表現應該在技術上盡可能準確和逼真,但又保持在人類可以理解和解釋的認知水平。融合了混合現實技術的先進可視化方法有可能更好地表現多領域戰爭的變化特征及其不斷變化的威脅和動態環境。隨著最近混合現實可視化設備的技術進步,成本降低,硬件的可靠性和實用性顯著提高,混合二維和三維可視化方法現在已經成為可能。

由多個二維顯示器組成的混合現實方法增強了更先進的三維可視化能力,可以為指揮人員提供了解復雜的戰爭游戲狀態空間所需的洞察力。例如,BVI平臺可以使用多種可視化模式的組合,真實地呈現地理空間的地形。作為一個數據服務器,BVI向支持多種可視化模式的客戶端應用程序分發地形、作戰和Agent行為數據,包括頭戴式顯示器設備、基于網絡的界面、移動安卓平板設備和混合現實設備(例如,HoloLens 2、Oculus Quest)。

圖13(頂部)顯示了位于加利福尼亞州圣貝納迪諾縣歐文堡國家訓練中心的高分辨率地形上的友軍與敵軍的兵棋推演場景。與MDMP期間經常使用的傳統2D地圖顯示相比,戰斗空間的3D視圖可以從多個觀察角度提供更豐富的用戶體驗。三維視圖,在BVI的網絡戰術計劃器(WTP)中,將地形和人工特征的空間信息以及由MIL-STD 2525C符號描繪的單位位置可視化。

可以想象,地理空間視角,如BVI提供的視角,支持決策者對動態戰斗空間環境的理解。與可導航的人工智能增強的決策空間(圖13,底部)搭配,組合的視角可以使人們更好地理解視覺空間依賴性、影響和因果關系、估計的風險和價值、不確定性以及復雜決策的欺騙性。將這種以地理空間和決策為中心的視角與人工智能相結合,可以提供必要的廣度,以協調物理行動與網絡和其他非空間領域的行動,跨越多個時間尺度,并具有快速適應變化的任務目標的靈活性

圖13 BVI網絡戰術規劃器中的兵棋推演場景的三維視圖(上)與人工智能決策樹的概念(下)。

5. 討論

人工智能對人類自然決策行為的機會性學習,以及學習環境的適當結構和順序,使人工智能被訓練過程有效地塑造,是已經建立起來的提高人工智能快速學習困難挑戰能力的框架。要進一步提高人工智能在兵棋推演中的復雜決策能力,需要提高人工智能在具有高度不確定性的MDO背景下處理決策的能力、欺騙性和博弈論,這些都是人工智能發展過程中獎勵分配的挑戰。克服這些挑戰需要利用多學科的進展,從了解大腦的決策、獎勵和計算的神經生物學進展到專業知識、隱性知識、心智理論、博弈論和元推理在復雜決策過程中如何應用的心理學進展。

人工智能如何能夠最好地學習人類的復雜決策仍然是一個開放的問題。盡管對復雜決策進行獎勵塑造的確切機制還沒有被發現,但這個項目已經產生了如何通過一個新的人工智能測試平臺和WMIs來發現這種機制的設想。ARL戰斗空間人工智能測試平臺和場景將人類和人工智能置于與MDO相關的決策環境中,使人工智能能夠學習不同的決策和因素如何相互作用,以及人類如何通過這種復雜的決策樹進行合作和對抗。一個關鍵的進展是,測試平臺和場景提供了一個豐富的環境,通過抽象化那些會使決策要領稀疏化和阻礙學習的因素,有效地開發人工智能心智理論和與MDO相關的元推理,以進行復雜的決策。

另一個進展是開發高性能計算框架,以實現人工智能決策支持的連續分布式訓練。這將使人工智能決策輔助系統能夠托管在ARL的持久性服務框架上,因此,將來士兵可以隨時隨地以人類和人工智能混合團隊的形式,針對人工智能兵棋推演Agent進行單獨或協作訓練。

這個項目的第三個進展是開發了一種可視化人工智能決策過程的方法,以實現人工智能的透明度和信任,以及人類與人工智能團隊的合作決策。人工智能的推理必須既抽象又與兵棋推演環境相關,這樣人類就可以理解人工智能對不同決策結果的評價,并有效地瀏覽人工智能的決策樹,而不會造成過度的認知負擔。我們已經向人工智能增強的WMI邁出了第一步,它基于三維混合現實,利用和增強人類固有的三維認知和預測的能力。隨著進一步的設計,我們設想它的界面將給人以自然的感覺,同時擴大顯示多個領域的信息,并使人工智能能夠適時地從用戶的決策中學習。這種自然的、直觀的人工智能輔助決策系統,是為了支持MDO C2決策而開發的,包括隱性推理,以及協作和對抗推理,對于人類在復雜決策中信任人工智能對COA結果的估計至關重要。

5.1 進一步發展人工智能測試平臺和人工智能Agent的潛力

雖然最近在游戲中對深度強化學習算法的利用顯示出巨大的前景,但這種成功的前提是與一個相對簡單、結構良好的游戲合作。真正的挑戰出現了,因為環境越來越依賴于稀疏的觀察數據、復雜和動態的Agent策略。完全在內部開發平臺與在現有的開放源碼庫上建立平臺相比,有幾個權衡因素--主要是限制因素的最小化和環境開發的純粹工作量。創建一個全新的定制平臺可以完全定制與游戲相關的錯綜復雜的問題,盡管變得非常耗時。相反,在使用現有的庫,如StarCraft2LearningEnvironment(SC2LE)時,會出現各種不可逾越的限制,但投入游戲開發的工作量會減少十倍。我們正在進行的ARL戰斗空間人工智能測試平臺的第二代開發,名為Simple Yeho(圖14),是建立在天平兩端的平衡上的,OpenAI Gym是一個用于開發強化學習算法的工具包,對輸入的Agent和環境結構不做任何假設。顯然必須遵循一個基本的框架,但OpenAI Gym除了提供大量的文件和例子供客戶參考外,還提供了完全的設計自由。從游戲開發的角度來看,并沒有立即需要解決的問題,但它確實需要成為未來一個更優先的事項。

圖14 簡單的Yeho人工智能測試平臺

未來的問題并不局限于游戲環境,因為它們將不可避免地延伸到理論上的強化學習挑戰,如無縫的多Agent通信、任務協調和固定的策略。更多需要關注的實際問題包括算法效率(限制計算密集型任務以及內存分配的心態),一種新穎的去中心化強化學習算法,以及跨多個領域的數據泛化。過度消耗硬件資源是人工智能所有分支中的一個共同瓶頸。從軟件的角度來看,ARL Battlespace AI測試平臺對資源消耗很少,該環境仍然專注于AI發展的研究問題,而不是全面的MDO實施,這就是為什么計算效率還不是一個緊迫的問題。歸納游戲狀態信息的潛在解決方案,特別是在動態環境中,包括時差變異自動編碼器和分布式時差強化學習,因為它們除了在數據點之間提供一個平滑的潛在空間外,還允許對未來的幾個狀態有明確的信念(這在元推理方面起作用)。我們的新型強化學習算法應該解決的其他主要問題是安全/認證、Agent決策透明度和Agent間的實時通信。將區塊鏈整合到DEVCOM ARL框架中,將確保節點之間的安全通信線路,提供一個不可改變的分布式賬本,以揭示Agent的低級決策,并向Agent引入民主投票系統,以促進團體合作,同時仍然保持個人的自私性。

5.2 進一步發展人類-人工智能協作交互的潛力

目前軍事決策過程中的局限性確定了一個多學科的研究方法,用于開發復雜決策的人類和人工智能WMI。作為基礎層的決策空間的現實表示,包括具有地理空間精確性的自然和人工制作的戰斗空間地形。一個先進而直觀的用戶交互允許混合現實視角的戰斗空間,使決策者能夠根據作戰因素探索COA的替代方案。這兩個要求指導了對陸軍和商業開發的戰斗空間交互系統BVI的選擇,作為ARL戰斗空間人工智能測試平臺中實現的人工智能和人類-人工智能團隊發展的潛在過渡媒介。

過渡的第一步是將ARL戰斗空間的網格狀環境疊加到BVI真實世界的作戰地形上,并將現有的BVI多模態用戶交互調整為兵棋推演。圖15顯示了使用BVI的網絡戰術規劃器3D視角在歐文堡地形上疊加的擴展網格的一個部分,其中友軍和敵軍單位位于兵棋推演會話的開始。在瀏覽器窗口中,可以使用戰術規劃工具欄的鼠標、觸控板或觸摸屏互動來放置和操作單位。BVI提供了添加單位的功能;路線點、戰術符號和圖形;以及繪制線條、多邊形和文本框等特征。

圖15 BVI網絡戰術規劃器中帶有網格覆蓋的兵棋推演場景的三維視圖

一個尚未解決的問題是,如何最好地利用BVI的混合現實(XR)可視化功能來進行協作決策(例如,在兵棋推演期間,通過加強決策者對地形的地理空間因素的理解)。加載不同的地形和創建定制的訓練場景可能來自于多維數據,并以各種身臨其境的形式觀看,這超過了陸軍其他系統的可視化能力。根據這些三維地形的廣度和細節,當決策者使用一系列強大的交互方式在大面積的地形上進行操作時,界面如何顯示這些信息可能會造成大量的信息過載或混亂。一個有效的界面需要被設計成不僅要選擇傳達哪些環境和決策空間信息,而且要選擇如何從用戶的有利位置呈現這些信息。

如果不可能有開發時間和精力,BVI的API提供了機會,以標記、標簽和定位在地形之上的場景適應性網格的形式嵌入視覺輔助,作為決策者的空間管理干預措施。例如,圖15中描述的網格的行和列可以被標記或編碼,以快速定位實時事件和人工智能產生的活動。多維網格結構和編碼方案可以將兵棋推演提升到以MDO為特征的復雜水平,同時減輕一些基于地形的空間管理問題。

在空間和時間領域的數據分析中協調戰斗空間的多個視圖,可視化提供了額外的方法,促進兵棋推演期間的復雜決策。當需要一個共享的MDO戰斗空間呈現時,可以通過在不同的可視化模式上實施多個協調視圖來實現協作戰略規劃模式,根據分布式指揮人員的輸入進行互動更新。指揮人員的輸入也可以指導視覺過濾器對協調視圖的應用,從而減少不必要的復雜性,突出場景或任務關鍵的戰斗空間信息。

圖16顯示了SyncVis視覺分析系統,該系統旨在顯示多個協調的數據分析視圖,支持數據探索和理解。SyncVis通過用戶互動將每個視圖中顯示的信息與其他視圖聯系起來,從而產生多種數據可視化。這個例子顯示了SyncVis在四個協調視圖中對COVID分類人群數據分析的二維界面。變量選擇器(選擇六個屬性)、地圖/地形、相互信息圖和每個選定變量的疊加區域圖。

圖16 SyncVis二維界面顯示COVID數據分析的多種協調的可視化效果

SyncVis的可視化功能可以與使用PSF的HPC分析工作流程后端集成。PSF服務器可以向BVI和SyncVis流傳作戰和Agent行為數據,創造一個統一的戰斗空間探索體驗。基于用戶按需輸入和過濾的協調戰斗空間視圖的好處有待研究。

一個靈活的兵棋推演環境似乎是關鍵,因為每個訓練場景、COA和任務計劃都是在MDMP和相關軍事理論的約束下制定的,但又是獨一無二的,并取決于戰斗空間及其操作變量。一個HPC PSF數據分析處理管道為WMI提供動力,士兵或指揮官按需協調戰斗空間的BVI和SyncVis可視化,將徹底改變現有的兵棋推演范式,并觸及MDO固有的復雜程度,以及贏得勝利所需的人類和AI指導的決策水平。

6.結論

我們強調了三個關鍵的發展領域,即人工智能引導的決策指導,支持這種指導的計算基礎設施,以及決策透明度的混合現實表現的發展。這些領域的進步需要跨越許多不同學科的專業知識。新的人工智能發展需要融合神經科學、心理學和數學的思想,以克服復雜決策中長期存在的問題的瓶頸。這包括跨時間尺度的學習和變化環境下的災難性遺忘,以及更具體的兵棋推演問題,如具有不確定性、欺騙和博弈論的多Agent決策。計算基礎設施也需要發展,因為計算能力和數據框架對于在戰術邊緣產生人-人工智能團隊的共同操作圖來說都是必不可少的。為了有效地開發,應該通過一個共同的框架來抽象出專有的限制和軟件的依賴性,并為使用和故障排除提供清晰的文檔,以使學術界、政府和工業界更好地專注于解決人與人工智能的合作問題。這個通用框架應該包括有效的信息傳遞,同時提供靈活性和適應性,以滿足人工智能開發和人類用戶在訓練和實際使用環境中的需求。最后,交互技術的開發本身需要跨學科的協同專業技術。一個基礎性的問題是如何壓縮信息使之被用戶有效地理解,以及如何最好地利用用戶的互動來進行機會主義學習。人類的大腦并不處理所有的感官信息,而是對世界進行預測和假設,以便在信息不完整的環境下節約計算。一個有效的WMI應該同時預測潛在的決策結果以及個人用戶的期望和假設。此外,人工智能決策輔助工具必須估計用戶的默契,使其能夠提供最相關的信息和最有希望的選擇,這些信息來自整個作戰領域。

付費5元查看完整內容
北京阿比特科技有限公司