鑒于對手軍事能力的威脅和擴散的增加,這項研究試圖開發合理準確和可計算的模型,以最佳方式操縱航空器攔截巡航導彈攻擊。該研究利用數學編程對問題進行建模,并以代表(時間)差分方程系統的約束條件為依據。研究首先比較了六個模型,這些模型對速度和加速度約束有不同的表述,同時分析了靜止目標的情況。多航空器、多固定目標交戰問題與箱體約束條件(MAMSTEP-BC)模型產生了卓越的整體性能,并通過替代數學編程模型的增強進行了進一步分析,以便在利用有效的機動序列方面創建可行的飛行輪廓。最后,對MAMSTEP-BC模型進行了修改,以操縱飛機來對付移動目標。
在優化交戰所需時間時,該模型被證明對多架航空器和多個目標有效。MAMSTEP-BC通過考慮航空器和飛行員的局限性,能夠保持高水平的顆粒度,同時設法為靜止和移動的目標快速生成最佳解決方案。
本論文的其余部分組織如下。第二章討論了與國防、飛行器路由問題和涉及差分方程的數學編程公式有關的文獻,以操縱或路由實體。下面的研究分三個不同階段進行。第三章介紹了第一階段所研究的工作,該階段開發并測試了操縱多架航空器來對付靜止目標的替代模型。在第四章中提出,第二階段的研究探討了替代的數學編程模型的增強,以創建研究第一階段的可行的飛行輪廓。在第五章中,介紹了第三階段研究的工作,其中開發和測試了一個最終模型,以操縱多架航空器來對付移動目標。第六章以工作的主要成果對論文進行了總結,并介紹了未來關于時空網絡路由模型主題的可能研究途徑。
戰爭結果很少只以單個作戰部隊要素的數量和質量為特征。通過有效的指揮和控制(C2)來調動和適應各部隊要素的能力可以使較小或較弱的部隊戰勝擁有更多資源和火力的對手。在本文中,我們將經典的蘭徹斯特(Lanchester)作戰模型與網絡上相位振蕩器Sakaguchi-Kuramoto模型結合起來,創建了一個靈活的網絡化蘭徹斯特式C2模型來表示軍事交戰。因此,該數學模型統一了軍事作戰的三個 "功能":火力、機動和C2。我們考慮了三個說明性的用例,并表明對一個簡化模型的分析處理可以描述整個系統中的全球效應。對于不同類的兵力,我們觀察到,在內部組織耦合、資源機動性和甚至較弱的殺傷力之間有適當的平衡,部隊可以適應性地克服最初較強的對手。
自從有組織的戰爭開始以來,擁有戰略和戰術可使指揮官能夠擊敗數量上占優勢的敵人。特別是,與純粹的消耗戰相比,超越對手力量的能力可以為取得更加決定性的結果提供機會。我們建議通過耦合微分方程對這些動態進行數學建模,整合戰斗、機動和指揮與控制(C2)。
拿破侖可以說是最著名的,也是最具代表性的例子,在戰役層面上,他能夠以分布式和集中式方式轉換指揮他的部隊,然后在一個決定性的點上,同步化他勝利的關鍵因素。也有一些更局部的例子,即一支巧妙分散、敏捷和反應迅速的部隊能夠擊敗數量上占優勢的對手。在公元前197年的Cynoscephalae戰役中(Polybius,1927年),操縱戰術分隊的卓越機動性和可控性使羅馬人戰勝了馬其頓方陣和重騎兵。在1346年的Cr′ecy戰役(Reid,2007年)中,隨著英國長弓的引入,戰術上得以有效地擾亂(通常是毀滅性的)重騎兵的沖鋒,從而使英國人擊敗了數量上占優勢的法國軍隊。二戰中德國國防軍的閃電戰和第一次海灣戰爭中的聯軍都再次證明了機動性思想。
我們提出的模型建立在蘭徹斯特方陣(定向火力)模型的基礎上(蘭徹斯特,1916),
其中,αRB、αBR分別給出紅方和藍方部隊的戰斗力或致死率,pR、pB分別為紅方和藍方的資源數量。作為一個常數系數的線性常微分方程系統,等式(1)中的守恒量是可以分析解決的,這意味著致死率和初始資源決定了戰斗的結果。
請注意,其他模型缺乏連續的戰斗動態,如Blotto上校博弈(Roberson,2006),或海戰Hughes salvo模型(Hughes,1995)。蘭徹斯特模型已經被擴展到適合不同歷史背景下的經驗數據(Bracken,1995)(也見(Fricker,1998)和(Lucas & Turkes,2004)),被(MacKay,2009)和(Kress等人,2018)擴展到最近的混合部隊變體,被用于人工智能玩實時戰略游戲Starcraft(Stanescu等人,2015)和不對稱游擊戰(Deitchman,1962)和(Schaffer,1968)。
在所有這些中,指揮和機動的功能被埋沒在戰斗力常數中。當對兩支部隊在漫長的交戰中戰略不變的數據進行擬合時,這是合理的,但即使是簡單的社會動物也很少如此,正如(Adams & Mesterton-Gibbons, 2003)和(Plowes & Adams, 2005)中討論的那樣。也很難先驗地估計一支部隊的戰斗力,或評估戰斗力對組織變化的穩定性。更重要的是,信息和通信技術在組織不同的(例如,來自不同軍種的)部隊成員的作用,使得網絡范式對當代和未來的戰爭具有強大的作用。這導致了近幾十年來被稱為 "網絡中心戰"(Alberts等人,1999年)的主張,將網絡連接、部隊要素的自我同步化和有效的軍事成果聯系起來。盡管蘭徹斯特模型被視為網絡化賽博攻擊和防御的抽象模型(Liu等人,2013年),但只有在(Kalloniatis等人,2020a)中通過概括MacKay(MacKay,2009年)的混合部隊模型提出了一個具有明確網絡結構的模型。在這里,網絡優化形成了對戰爭機動理論中的概念識別。
在本文中,我們使用Kuramoto-Sakaguchi(Sakaguchi & Kuramoto,1986)的相位振蕩器模型(建立在(Kuramoto,1984)的基礎上)將C2引入(Kalloniatis等人,2020a)的表述中,從而在一個數學模型中統一了三個關鍵的作戰功能:C2、機動和火力。對于一般網絡,如(Acebr′on等人,2005)、(Arenas等人,2008)、(D¨orfler和Bullo,2014)和(Rodrigues等人,2016)開發的模型是
對于C2的應用(Kalloniatis等人,2020b),階段代表單個代理的決策周期,自然頻率代表代理的決策速度,耦合強度代表代理之間關系的緊密程度(或對決策狀態變化的反應能力),網絡代表正式和非正式的組織C2結構,挫敗代表代理尋求與其他代理相比領先多少。公式(2)的相同框架可以擴展到兩個(或更多(Zuparic等人,2021))相互競爭的部隊或種群。這里用數學方法量化的兩個要素,作為決策和組織的定性屬性被很好地記錄下來:認知心理學的感知-行動循環(Neisser,1976)或軍事和商業戰略的觀察-判斷-行動(OODA)循環中個人決策的周期性(Osinga,2006);以及(Weick,1976)、(Perrow,2011)和(Hollenbeck & Spitzmueller,2012)闡述的組織中松緊耦合的作用。因此,該模型將組織理論中長期闡述的觀點納入了一個動態的數學模型。
為了更具體地說明這些想法,在我們引入的變量方面,考慮θi的前N個分量代表藍方C2系統或網絡中單個藍方成員的OODA循環的連續版本中的決策狀態。剩下的M個分量代表紅方代理在他們自己相應的C2系統中的(OODA)決策狀態。根據博伊德思想,藍方和紅方中的每一方都將尋求在對方之前穩定其決策狀態,φi>φj,其中i,j可能代表藍方或紅方。因此,每一方的目標是比對方提前鎖定階段。藍方相對于紅方為ΦBR,紅方相對于藍方為ΦRB;為了簡單起見,我們在每一組中,藍方或紅方的挫折值都是同質的。這些挫折值代表每一方的目標狀態。他們是否實現了這一目標,取決于公式2所代表的動態,受制于他們的耦合、他們的連通性和他們個體的快速決策能力。
到目前為止,提到的 "決策"都是抽象的。在本文中,我們將其與C2在軍事力量中要完成的任務聯系起來。因此,我們建立了這樣的模型:如果藍方或紅方的一個階段θi領先于另一個階段θj,他們將在蘭徹斯特動態中獲得優勢。因此,我們提出了一個數學模型,使用多層網絡表述,自然地統一了戰斗、機動和C2作戰功能(Boccaletti等人,2014)。該模型比(McLemore等人,2016)另一種基于方程的當代方法更緊湊,注意到他們在空間上嵌入了部隊元素,并省略了C2。
對于同類兵力,我們的統一模型可以簡化為全局形式,我們開始用它來說明結構,并以Kuramoto-Sakaguchi模型(Kalloniatis & Zuparic, 2016)的經驗為基礎,建立一個用例。雖然無法解決,但全局模型允許相當大的降維和洞察力。當兵力不均勻性較高時,全局模型的局限性較大,但全局模型展示了適應性動態,其中一種力量,例如藍方,必須改變其資源分配,以適應更強大的紅方力量。最后,通過一個虛構的復雜網絡,我們說明了完整的模型是如何在經典的運籌學意義上使用的,以研究火力或C2系統投資之間的權衡。
在下文中,我們通過展示C2和戰斗動力學如何在一個統一的Lanchester-Kuramoto-Sakaguchi模型中結合起來來介紹該模型的原理。我們只研究這個模型,因為它建立了一個可以應用于完整模型的直覺和近似方案。然后,我們制定了完全網絡化的Lanchester-Kuramoto-Sakaguchi模型,并考慮了它的前兩個用例,接著是一個復雜的網絡,以顯示網絡化模型在作戰研究中的效用。我們得出結論并討論了未來的發展。進一步的分析計算細節和對一個用例的研究被歸入附錄中。
現代安全威脅的特點是隨機的、動態的、部分可觀察的和模糊的作戰環境。這項研究解決了在這種復雜安全威脅的作戰規劃、分析和評估中的不確定性決策問題。首先,對不確定性建模、決策和不確定性下的優化的文獻進行了回顧,重點是模糊性建模和優化實踐方面的最新進展。這一回顧為后續的方法論和應用研究提供了一個框架,并對文獻中不確定性下的決策和優化的當代應用進行了全面回顧。接下來,對軍事評估的不確定性模型的調查涉及定性和混合方法,以補充文獻回顧中討論的定量模型。這項調查為實踐者提供了一個基于研究的指南,以便將定性但嚴格的不確定性模型應用于實際評估問題。
在對現有文獻和實踐的回顧之后,本研究開發了一種在推理環境下的不確定性決策的新方法。穩健的序貫推理方法解決了一類普遍的隊列問題,其中內部排隊系統是不可觀察的,出發和到達時間是隨機的和部分可觀察的。這項工作提高了決策者在不確定環境中分析隊列的能力,使用的原則性方法可證明收斂于真實參數值,并具有強大的經驗性能。
接下來,這項研究從推理過渡到序貫決策,采用了一種原始的表述和解決方法,用于在動態、部分可觀察和模糊的環境中進行穩健的信息收集。該解決方法具有理想的理論凸性和收斂特性。一個計算實驗表明,與現有方法相比,文獻中的一組經典問題的性能得到了改善。此外,對一個網絡安全檢測問題的詳細應用說明了新的表述和解決方法的功效。
最后,針對動態的、隨機的和部分可觀察的多Agent環境,提出了解決大規模的、具有不完美信息的廣義形式游戲的最佳和近似技術的新應用。這項工作為多領域網絡和防空問題的最優和近似公式提供了明確的細節,產生了接近最優的策略,描述了近似解決方案的最優性差距,并分析了結果對關鍵問題參數的敏感性。此外,對穩健對手利用的擴展包含了有界理性和模型模糊性。穩健的表述同時解決了問題的網絡物理性質和對手的不確定性。經驗證據表明,當對手以有界理性進行游戲時,穩健方法是有效的。
總的來說,這些當代調查、方法上的進步和新的應用提供了一套數學工具和計算算法,用于解決挑戰性環境下不確定性的復雜決策問題。這項研究通過把握技術和實踐的現狀,以及將現有的算法擴展到模糊和部分可觀察的環境,提高了決策和優化的能力。
美國空軍未來作戰概念(2015a)設想了2035年的挑戰性安全環境。敵方可能有能力以達到不成比例的破壞性效果的方式進行完全一體化的多領域行動。考慮到不僅要威懾和應對彈道導彈攻擊,而且要威懾和應對綜合信息活動和網絡滲透的難度增加。這種聯合作戰的演變所產生的協同效應使得作戰藝術和作戰科學都必須得到改進。
正如2018年國防戰略(Mattis,2018年)所強調的那樣,多領域攻擊小品中引入的關切延伸到更廣泛的安全界。安全環境正經歷著快速的技術革新,并變得越來越復雜和不確定。復雜的環境和適應性強的對手對預測未來結果的能力造成了根本的限制,尤其是在戰略層面。然而,在許多規劃和評估問題中,行動環境是復雜的,但還沒有復雜到完全缺乏決策信息的程度。環境也很少被清楚地定義和理解,以至于不確定性可以忽略不計。決策者面對的是一個動態的環境,其特點是有思想的對手和不同程度的不確定性、模糊性和部分可觀察性。決策者應該如何應對這樣一個具有挑戰性的環境?
在快速的技術變革帶來安全挑戰的同時,它也帶來了新的機遇。不斷提高的計算能力補充了統計、模擬和優化算法的基礎性改進,提高了決策問題的定量方法的能力。運籌學方法和來自應用數學、統計學、計算機科學、機器學習和人工智能的密切相關技術現在可以在實際規模上解決不確定性下的復雜決策問題。雖然一些最重要和最困難的安全問題仍然不在定量算法的范圍內,但利用新興的解決技術來擴大現代運籌學方法可解決的問題類別,是一種戰略上的需要。
這些方法的最新進展集中在利用各種復雜環境中的部分知識。很少有操作環境是完全已知或完全未知的情況。相反,由于部分可觀察的狀態和獎勵、模糊的過渡動態和智能對手,決策者會遇到不確定性。利用有關作戰環境的部分信息使決策者能夠通過接受不確定性和開發對快速發展的環境和對手具有魯棒性的解決方案來改進決策。這篇論文的重點是解決以靜態、動態和多Agent環境中的隨機、部分可觀察和模糊環境為特征的決策問題。
本學位論文的結構是一系列獨立的學術文章,討論作戰規劃、分析和評估中不確定性下的決策這一主題。
第二章回顧了不確定性下的決策和優化的文獻,重點是模糊性模型和優化實踐的最新進展。
第三章對第二章中定量文獻的理論回顧進行了補充,對定性的不確定性和軍事評估實踐的應用進行了調查。第四章、第五章和第六章在第二章和第三章的基礎文獻的基礎上,分別探討了靜態、動態和多Agent環境下的不確定性決策。
第四章開發了一種新的方法,用于對部分可觀察的、隨機的到達和離開時間進行穩健的隊列推理。這個一般的方法適用于任意的隊列,但具體的動機是網絡安全和恐怖主義的應用。
第五章開發了一種在動態的、部分可觀察的和模糊的環境中進行穩健信息收集的新方法,并擴展應用于網絡安全檢測問題。
第六章介紹了一個新的應用,即利用最優和近似技術解決具有不完善信息的廣義形式游戲的多域網絡和防空問題。
特別是第二章,為后面幾章的方法論和應用研究提供了理論基礎的回顧。決策方面的最新進展是將風險和模糊性納入決策模型和優化方法中。這些方法實現了各種來自概率論和非概率論基礎的不確定性表示,包括傳統的概率論、不確定性集、模糊性集、可能性理論、證據理論、模糊度量和不精確概率。不確定性表示法的選擇影響了決策模型的可表達性和可操作性。本章調查了最近在決策和優化中表示不確定性的方法,以澄清替代表示法之間的權衡。對穩健和分布穩健的優化進行了調查,并特別關注標準形式的模糊性集合。不確定性和決策模型的應用也被回顧,重點是最近的優化應用。
第三章補充了第二章的定量工作,重點調查了軍事評估中的不確定性模型。評估理論為軍事行動評估的實踐提供了一個嚴格的基礎。政府和工業界的評估人員已經利用評估理論在廣泛的領域內提高了評估的有效性。本章重點討論評價理論與軍事評估之間的關系。本章簡要地調查了主要的評估方法,重點是將理論模型與實際的、與安全有關的應用聯系起來。這些評估方法包括專家導向、方案導向、決策導向和參與導向模式。在這些方法的總體框架內,詳細考慮了替代的監測和評估設計,包括描述性設計(如案例研究、橫斷面、時間序列)、準實驗性設計(如中斷的時間序列、比較組、案例研究)和實驗性設計(如僅后測、前測)。然后,本章討論了用于分析和報告每種設計方案的不確定性的定量和定性方法,重點是混合方法。在整個章節中,應用實例明確了評價理論和運行評估實踐之間的關系。
第四章開發了一種新的穩健隊列推斷方法。在一些軍事和競爭性商業應用中,隊列的內部結構和參數是完全不可觀察的。此外,到達和離開的時間可能是可觀察的,但由于在對抗環境中的測量誤差,會有很大的不確定性。本分析使用基于訂單的方法估計內部不可觀察的、先到先得的G/G/c隊列中的服務器數量。這種新方法提供了一個下限,并在概率上收斂到了正確的值。與標準的方差最小化方法相比,基于秩序的方法對小樣本的性能有所提高。基于訂單的算法對到達和離開時間測量中的噪聲具有魯棒性,而方差最小化方法在有噪聲的數據中表現出較差的性能。我們還考慮了對 "后到先得 "的G/G/C隊列的擴展。基于順序的后到先得的方法也提供了一個下限,該下限在概率上收斂到正確的服務器數量。
第五章為部分可觀察的馬爾科夫決策過程(POMDPs)的穩健解決方案開發了一種新的表述和方法,該過程具有模糊的過渡和信仰獎勵。本章介紹了穩健的信念獎勵部分可觀察馬爾可夫決策過程,作為馬爾可夫決策過程的一個概括,它允許狀態的不確定性、模型的不確定性和依賴信念的獎勵。在許多實際應用中,POMDP的過渡和觀測參數很難估計。這項研究表明,傳統的POMDP求解技術對模型的錯誤指定非常敏感,特別是在信仰-獎勵的設置中。為了應對這一挑戰,我們開發了一種穩健的信念獎勵算法,它擴展了基于點的價值迭代,同時保留了理想的靈活性和收斂特性。除了基礎理論屬性外,一項實證調查顯示,穩健的求解技術在幾個不同的問題類別中提供了對模型錯誤指定的保護。為了說明解決模型錯誤指定對信息獲取問題的重要性,本章還介紹了穩健的信念-回報POMDP公式在網絡安全問題上的應用,它顯示了在最壞情況下的性能改進。
第六章介紹了最優和近似廣義形式求解技術在信息不完善的綜合網絡和防空問題上的新應用。新興的多領域威脅需要一個綜合防御戰略。本章開發了多領域安全游戲,以解決對國家人口中心的網絡-物理綜合威脅。這項研究使用零和、廣義形式的博弈來模擬物理和網絡空間中的攻擊者和防御者,借鑒網絡安全和彈道導彈防御的文獻來告知博弈結構。為了確定最佳的防御者策略,我們開發了一個多領域的安全博弈,并對問題進行了重新表述,以使用一個有效的序列形式的線性程序找到納什均衡。本章還開發了一個近似的反事實遺憾最小化算法在這個問題上的應用,并描述了最優性差距。此外,這項研究還量化了網絡領域中改進的態勢感知的價值,并提出了對強大的對手利用的擴展。
這部著作中的文獻綜述、方法論進展和應用,對整個運籌學領域,特別是對軍事和安全運籌學實踐做出了貢獻。關于不確定性下的決策和優化的文獻綜述(第二章)將關于理論不確定性模型、決策模型和優化模型的不同文獻組織成一個連貫的結構,并確定了這三個研究領域之間的關系。此外,對軍事評估中的不確定性模型的調查(第三章)為實踐者提供了一個基于研究的指南,以便將定性但嚴格的不確定性模型應用于評估問題,從而對軍事行動研究實踐做出了貢獻。
在這些現有文獻的基礎上,一種新的穩健隊列推斷方法通過提高決策者在不確定環境中分析隊列的能力,對該領域做出了貢獻(第四章)。這種服務器估計方法對一大類一般隊列有效,對隊列結構的了解有限,到達和離開的樣本小而嘈雜。這項研究證明,該方法產生的估計值具有理論上的收斂性和下限保證。它還提出了在廣泛的參數設置中與現有方法相比性能提高的經驗證據。
延伸序貫決策,一個原始的穩健的信念-回報POMDP公式和一個新開發的解決算法為該領域提供了工具,以解決模型模糊下的一類新的信息收集問題(第五章)。這項研究證明了該求解技術具有理論上的凸性和收斂性,使其與成熟的近似技術系列兼容。它還提出了經驗證據,證明與現有方法相比,文獻中的一組經典問題和模糊環境下的實際網絡安全檢測問題的性能有所提高。
最后,在一個多領域的網絡和防空問題上,反事實遺憾最小化的應用通過用快速、接近最優的技術解決一個當代的操作問題,為文獻做出了貢獻(第六章)。這個新的應用提供了該問題的最優和近似公式的明確細節,并描述了多域安全環境下的最優性差距和對關鍵問題參數的敏感性,這與最近的其他應用有很大不同。它還提出了一個原創的穩健公式,解決了問題的網絡物理性質和對抗性的不確定性。經驗證據表明,當對手以有界理性進行游戲時,穩健方法是有效的。
除了通過發表調查、方法、應用和結果對文獻做出貢獻外,本論文還為所有方法提供了開源軟件實現,并公布了所有結果的原始數據。這些代碼和數據產品都可以在//github.com/ajkeith,并提供測試、基準測試和文檔。
本報告著重于2025年混合部隊的任務工程過程。來自OPNAV N9I的最新任務強調了關注使用成本保守的無人系統的必要性。具體來說,重點放在近鄰的競爭對手大國以及在南海的反介入/區域拒止(A2/AD)情況下可能出現的問題。海軍水面作戰中心的任務工程方法被用來確定擬議的替代艦隊架構的具體事件,然后使用作戰模擬和優化模型進行分析。對目前的無人系統,特別是那些正在開發的高技術準備水平無人系統的性能特征和成本的研究進行了匯編。提議的無人系統架構是作為A2/AD問題的解決方案而開發的。然后,無人系統架構通過優化模型運行,以最大限度地提高系統性能,同時最小化成本。然后,架構優化的結果被輸入到建模和仿真中。然后比較每個架構的整體有效性,以找到最有效的解決方案。對結果進行了分析,以顯示預期的任務有效性和利用擬議解決方案的無人架構的擬議成本。最有效的架構包括搜索、反蜂群、運送和攻擊系統。
系統工程分析31組由美海軍作戰司令部戰爭整合處(OPNAV N9I)負責確定一個解決方案,以彌補與大國在2025年的預期能力差距(Boensel 2021)。該解決方案系統必須具有成本效益并能在2025年之前交付。SEA團隊利用任務工程過程來確定候選的未來艦隊架構來解決問題(工程副主任辦公室2020)。
到2025年,如何才能有效地對抗近鄰對手的反介入和區域拒止能力?
以具有成本效益的方式調整目前的能力,并創建一個未來的架構,以加強美國海軍的作戰能力,包括存在、欺騙、ISR以及在反介入和區域拒止環境中的防御和進攻能力。
利用任務工程流程,總體情景被設定在2025年的南海。大國已執行了其九段線的領土要求,并建立了一個反介入/區域拒止(A2/AD)區。大國不斷擴大的艦隊、對人造島嶼的使用、遠距離ASCMs以及對無人系統的擴大使用使美國的水面作戰艦艇處于高風險之中。總體任務是美國海軍DDG通過提高其殺傷力和生存能力,在A2/AD區域內進行FONOPS。在整個方案中,有三個小場景被開發出來。OTH ISR、目標選擇和交戰,威脅無人機蜂群,以及提供目標選擇的威脅無人機ISR資產。
衡量任務成功與否的總體標準是美國海軍部隊在近乎同行的反介入區域拒止環境中的作戰能力。有助于衡量成功的有效性的措施是DDG的生存能力和殺傷力的提高程度與解決方案系統的成本相結合。
為了分析擬議的系統解決方案(SoS)是否能達到既定的成功標準,設計了一個價值體系。利用通用的海軍任務列表,項目組確定了擬議的系統解決方案需要完成的三個二級任務,以完成任務(海軍部,2008)。
對三個選定任務下的后續任務進行了評估,以確定擬議系統需要完成的具體功能。通過這次審查,確定了候選無人系統需要完成的四項高級功能。這些功能是交付、搜索、通信中繼和打擊。為每項功能選擇了性能措施,以用于多屬性價值分析。
多屬性價值分析被用來比較完成四個功能中一個或多個功能的候選系統。一個系統的價值是根據每個性能指標對完成一個特定功能的重要性,給每個性能指標分配一個權重而得出的。權重從1到5不等,其中5表示最重要的MOP。計算MOP和權重的乘積,并將每個乘積相加,以獲得系統的價值。
為了確定可行的候選系統,項目組成員各自研究了一個不同的無人系統,并收集了每個候選系統的性能衡量標準。如果一個特定的無人系統的MOP值不知道,則推斷其值與一個類似的系統相同。如果不存在這樣的類似系統,則使用啟發式方法估計該值。對于每項功能,至少有一個系統符合技術成熟度,可考慮用于2025年的混合部隊。
為了實現所有四個功能,候選系統的組合被排列組合成16個系統簇。每個備選方案的系統價值和成本都被計算出來。系統價值的計算方法是將每個備選方案中的每個系統的價值相加。
為了產生用于比較的替代方案,該團隊使用整數線性規劃生成了架構。這是用Pyomo的優化功能完成的。線性規劃被創建、約束以更好地表示現實,并被解決以生成分別針對性能、預算和替代合約選項進行優化的替代架構。
現代導彈戰可以使用炮擊作戰模型進行評估。這個模型被用來計算每個小場景中的每個SoS備選方案的有效性。結果顯示了超視距ISR平臺的重要性,一個獨立的武器系統來對付敵人的無人機,目前IAMD作戰系統的有限防御能力,以及超視距搜索和瞄準能力。
“大國”和美國都擁有深入的綜合空中和導彈防御。為了證明這種互動,在微軟Excel中使用反二項式函數對不同的交戰進行了建模。每一個擬議的艦隊架構都被輸入到三個小插曲的戰斗模擬中。為了獲得隨機的結果,試驗的數量被設定為300次,每個概率都有一個可能的值范圍。該模型中的自變量可分為防御性或進攻性變量。防御性變量是每個單位的綜合防空和導彈防御武器的殺傷數量和殺傷概率。PLAN的進攻性變量是YJ-18 ASCM和Harpy無人機的命中數。美國海軍的進攻性變量是海上攻擊戰斧、ASCM和特定攻擊無人機的進攻性命中數量。
模擬的結果顯示了擊中敵方水面平臺或美國海軍水面部隊的數量。通過比較建議的系統與基線的命中率,可以得出變化的百分比。在我們的分析中,進攻和防御的有效性被平均加權,允許將進攻和防御百分比變化的高值相加,以計算出高低變化的總百分比。
基于智能體的建模和仿真(ABMS)被用來驗證每個設想的系統架構與所需的MOE。ABMS旨在通過對智能體之間的相互作用進行建模,來捕捉戰爭交戰的隨機性,但又很復雜。進行了蒙特卡洛分析,以收集每個系統性能的個體層面的數據。隨后的統計分析提供了一個途徑,以確定和量化每個擬議的系統架構所實現的改進。為此目的,指揮部:現代行動(CMO),是一個跨領域的現代兵棋推演計算機軟件,旨在模擬戰術到作戰水平的行動,被用作仿真引擎。CMO模擬的是基于規則的智能體,它們相互之間以及與環境之間的互動,包括感興趣的場景中的武器系統(Coyote, YJ-18, Chaff)和平臺(例如PLAN DDG, Luyang)。與多屬性價值分析方法相比,CMO允許對定量的系統MOP進行建模,并在模擬結果中觀察其相對差異。
電子表格戰斗模型模擬的第一個結果是解放軍DDG在三個不同的迭代中對美國海軍DDG的命中率,即只用YJ-18攻擊,只用哈比攻擊,以及YJ-18和哈比同時攻擊。同時使用YJ-18和Harpy的命中率被作為防御性MOE的基線值。接下來,兩種不同的防御性無人機系統被分別加入到作戰模型中。對只有哈比的攻擊和YJ-18與哈比的同時攻擊進行了重復模擬。每個系統的防御性百分比變化是用前面描述的公式計算的。
接下來的結果是美國海軍DDG在三次不同的迭代中擊中PLAN DDG的次數。模擬了僅用MST攻擊、僅用ASUW無人機攻擊以及MST和ASUW同時攻擊的結果。只用MST攻擊的命中率作為進攻性MOE的基線值。接下來,七個不同的運載系統被分別加入到作戰模型中。對僅有ASUW無人機攻擊和同時進行的MST和ASUW無人機攻擊進行了重復模擬。每個投送系統的進攻百分比變化被計算出來。
將同等權重的進攻和防守百分比變化相加,計算出高和低的總變化百分比。根據該模型,期望值是這樣的:在0.95的置信度下,增加SoS將使水面部隊的有效性增加一個介于高值和低值之間的百分比。
總的來說,從ABMS觀察到的性能與從電子表格模型觀察到的性能MOE相關。在所有提議的架構中,都觀察到了防御和進攻MOE的明顯改善。這是預料之中的,因為在DDG上增加任何防御性武器系統應該減少艦隊DDG的直接命中數量。同樣,增加一個具有增強OTH感知能力的進攻性武器系統會增加對目標直接作用的武器數量。
對防御性和進攻性MOE與每一方所消耗的平均武器數量的比率的進一步分析顯示,由于美國海軍DDG上增加了反群武器系統,防御性MOE得到了改善。這種增加被證明是對所有架構的一種有效的廣泛改進。三種提議的架構之間最明顯的差異來自于進攻性MOE(%),其中性能系統優于其他架構。與發射的武器總數相比,預計一個性能更好的系統會向目標發射更少的武器,同時造成更多的命中。
這項工作證明了低成本的無人駕駛威脅系統給傳統水面戰艦帶來的危險,這些系統可以在幾乎沒有警告的情況下進行協調和攻擊,并為船員提供很少的反應時間。為了避免強制增加對峙距離以提高生存能力,有必要使用增程傳感器系統和反無人機系統來彌補預期的能力差距并提供進入被拒絕區域的機會。為了使這些系統可行和安全,高帶寬的通信系統將是必需的。
為了滿足這些需求,建議的解決方案系統利用Dive-LD來運送Coyote無人機平臺。搜索和通信中繼將由兩個VBAT無人機平臺提供。這種平臺組合為每一美元的系統成本提供了最高的進攻和防御能力的提高。叢林狼 "無人機也將作為一個蜂群來防御威脅性無人機群和威脅性無人機ISR資產。增加解決方案系統的采購將提高艦隊的生存能力和殺傷力,并允許在其他艦隊優先領域進行額外投資。
建議通過為無人機平臺配備額外的無源傳感器來改進該系統,以利用電磁頻譜的所有部分,從而提高在所有天氣和戰斗條件下探測敵方威脅的能力。此外,擬議的解決方案系統可以擴展到許多其他領域和任務區,如港口防御和反對出口。
美國軍隊繼續在日益復雜的安全環境中作戰,不能再期望在每個領域都有無爭議的或主導性的優勢。由特種作戰部隊(SOF)操作的飛機需要改進防御能力,以支持在非許可環境下的任務。將自動化和人機協作納入現有的防御能力,可以減少威脅的反應時間,提高有人和無人飛機配置的防御機動的有效性。這篇論文研究了作為威脅反應一部分的飛機機動的價值,以確定人類干預對時間和準確性產生負面影響的情況。它還考慮了復制Merlin實驗室的飛行自動化方法和將能夠進行防御性機動的機器訓練系統納入現有飛機的機會。分析表明,飛機的機動性對于有效的威脅反應至關重要,自動選擇操作者的行動可以提高對某些地對空威脅的生存能力。這篇論文建議重新關注特種部隊飛機的防御能力,并贊同將機載自主系統整合到傳統的載人平臺上,以提高防御性威脅反應。它還主張繼續研究在SOF任務中使用可選的載人飛機,以完善其操作效用,并在各種任務平臺上擴大能力。
美國軍隊繼續在日益復雜的安全環境中運作,不能再期望在每個領域都有無爭議的或主導性的優勢。由于地對空威脅已經擴散到在世界各地活動的敵對行為者,未來的作戰環境將以有爭議的空域為特征,這將對有人和無人駕駛飛機的操作構成挑戰。由特種作戰部隊(SOF)操作的飛機需要改進防御能力,以便在這些有爭議的地區進行機動,同時支持傳統SOF任務。這篇論文研究了商業能力的進步,以減少威脅的反應時間,提高有人和無人駕駛飛機配置的防御性機動的有效性。
通過與位于波士頓的飛行自動化初創公司Merlin實驗室合作,本分析探討了防御性機動的潛在自動化。飛機機動是對威脅作出有效反應的一個關鍵方面,自動選擇操作者的行動可以提高對某些地對空威脅的生存能力。通過確定AC-130J威脅反應中人為干預影響飛機操縱時機和準確性的步驟,這項分析揭示了復制梅林實驗室的飛行自動化方法和將能夠執行防御性操縱的機器訓練系統納入現有飛機的機會。
在威脅反應過程中確定的關鍵步驟包括威脅指示、威脅作戰識別和威脅反應配對。目前,機組人員手動執行這些步驟來完成防御性威脅機動。然而,這些步驟中的每一個都可以從自動化和人機協作中受益,通過三種明顯的方式提高整體性能。首先,生成簡化的視覺和聽覺威脅指示,確保及時通知威脅的存在。其次,自動識別過程以準確識別威脅的變體,減少了反應時間和人類識別錯誤的可能性。最后,將威脅識別與適當的飛機反應同步配對,減少了不必要的延誤,并提高了威脅操縱的準確性。
這篇論文建議重新關注SOF飛機的防御能力,并贊同將機載自主系統整合到傳統的載人平臺上,以改善防御性威脅反應。將人機協作和自主能力納入飛機防御系統,可以使防御機動性能優于傳統系統,并允許在更廣泛的環境中作戰。除了改善防御性機動,梅林實驗室的自動飛行甲板在各種不同的飛機和任務中提供了潛在的用途。繼續研究應該調查在SOF任務中使用可選擇的載人飛機,以完善其操作效用,并在各種任務平臺上擴大能力。最后,在整個特種部隊中采用梅林系統將顛覆既定的操作慣例,需要個人和組織行為的改變。為了緩解過渡期并提高采用率,AFSOC應采取步驟,盡量減少利益相關者的行為變化,同時最大限度地提高系統的操作效益。培養對人工智能、機器學習和自動化的理解,將使這些行為者為軍事技術的快速變化和戰爭特征的變化做好準備。
圖 9. AC-130 防御性威脅反應圖。
本文考慮使用衛星上的傳感器將觀察結果分配到一個離散網格化地理區域的情況。重要的是,至少要在所有網格單元瀏覽一次,以看到整個行動區域;因此,我們希望獲得最大的覆蓋范圍。其次,我們希望通過任何額外的觀察來重新審視高優先級的網格單元。傳感器產生一個二維帶,在每次經過地理區域時,它可以尋找網格單元,我們將其稱為 "掃描"。我們用來觀察網格單元的分辨率決定了觀察的有效性。我們可以選擇使用高分辨率,使我們在更細的細節上有更少的觀察,或者使用低分辨率,使我們在粗略的細節上有更多的觀察。這使我們可以選擇準確地觀察少數地方,或不準確地觀察許多地方。
這篇論文是在與作為五角大樓聯合參謀部一部分的J8局的密切協作下產生和發展的。J8在部隊結構、資源和評估方面向參謀長聯席會議主席(CJCS)提供建議。這個問題已被提煉為一般的情報、監視和偵察(ISR)問題,但延伸到J8在名為STORM的戰區級戰役模型中遇到的真正問題。STORM使用一種啟發式方法來確定哪些網格單元接受觀察。STORM的啟發式方法往往會產生不理想的結果,即大面積的興趣區域被忽略。我們希望改進搜索資產能夠執行的網格單元覆蓋率。
在這篇論文中,我們制定了一個新穎的、大規模的、混合整數的優化模型,以超越STORM的啟發式搜索ISR的表現。該模型被稱為SOM,使用間隙指數對自上次查看每個網格單元以來的掃描次數進行懲罰。我們希望避免收集這些懲罰,這促使我們重新訪問網格單元。目標函數最小化了這種產生間隙的懲罰。我們使用幾個約束條件來維護、重置和跟蹤間隙計數器,一個訪問所有網格單元的軟約束條件,以及一個對網格單元施加最小分辨率的約束條件。SOM的一個獨特的特點是它是事件驅動的,在戰斗空間上掠過,不以時間為基礎。SOM使用實際的STORM數據,有1300多行代碼,包括在R中收集數據,在Pyomo中處理和實現模型。
我們在STORM中未分類的Punic21場景上實現了這個模型。在這個場景中,有兩個戰斗人員。紅方和藍方。我們可以從任何一個角度來實現SOM,每個戰斗人員都產生他們自己的變量和約束。為了說明SOM的大規模,在Punic21中,紅方搜索藍方的網格單元,并在92個區域內進行優化,這相當于48小時的時間,我們有超過2500萬個變量和1500萬個約束。
案例研究以計算和操作結果為中心。計算結果表明,我們可以通過在國際商業機器ILOG CPLEX Optimization Studio(CPLEX)的算法中實施不同的選項來減少運行時間。最重要的選項是提供一個熱啟動,使用沒有外觀發生的最壞可能的解決方案。例如,當我們用默認的CPLEX選項在一個有超過200萬個變量和100萬個約束條件的單處理器上運行SOM時,它需要超過1400分鐘,而且沒有產生一個解決方案。我們確定了定制的CPLEX選項,減少了運行時間,并在不到5分鐘內解決了這個實例。這使我們能夠將問題的規模增加到超過2200萬個變量和1100萬個約束條件,并在不到50分鐘的時間內實現11%的優化差距。業務案例研究結果顯示,與STORM相比,SOM提供了平均54.6%和中位數22.8%的覆蓋率。額外的選項,是SOM原生的,在STORM中不具備的,確保SOM將超過STORM,快速達到最大的覆蓋率,隨后集中精力將目光分配到最重要的網格單元。
我們看到,根據操作結果,優化模型優于STORM的啟發式,并允許我們平衡所有單元的搜索,而啟發式則傾向于集中在重要的單元。與STORM的啟發式方法重復搜索相同的網格單元相比,SOM指導衛星在哪里尋找,以允許訪問每個網格單元并避免大的重訪間隙。
現代戰術戰爭需要迅速而有效的決策和行動,以便在經常是高度動態和復雜的戰區保持競爭優勢。需要考慮的因素的數量因不確定性、事件的快速發展和人為錯誤的風險而放大。自動化、人工智能和博弈論方法的潛在應用可以為作戰人員提供認知支持。這項研究以自動兵棋推演輔助決策的形式探索了這些應用。該團隊為這個未來的系統開發了一個概念設計,并將其稱為兵棋推演實時人工智能輔助決策(WRAID)能力。
頂點項目的目標是探索自動化、人工智能和博弈論的應用,作為支持未來WRAID能力的方法。該團隊為WRAID能力開發了需求、概念設計和操作概念。該小組確定并探索了可能對未來實施WRAID能力構成障礙的挑戰性領域。該小組調查了與使用人工智能來支持戰爭決策有關的倫理挑戰和影響。
本報告首先對與WRAID能力相關的主題進行文獻回顧。文獻回顧從人工智能的回顧開始,提供了一個關于人工智能如何工作以及它能夠完成什么類型任務的概述。文獻綜述探討了人機協作的方法,以支持未來指揮官和人類用戶與WRAID系統之間的互動。需要翻譯指揮官的意圖,并讓WRAID將有意義的輸出傳達給指揮官,這需要一個強大的界面。審查包括傳統的兵棋推演,以研究目前的模擬兵棋推演是如何進行的,以便深入了解,未來的WRAID能力如何能夠實時復制兵棋推演的各個方面,并認為以前的兵棋推演可以為人工智能和機器學習(ML)算法的發展提供訓練數據。ML算法的訓練需要大量的代表性數據。文獻回顧研究了人類的認知負荷,以深入了解人類大腦的認知技能和上限;并確定人類思維的極限,以顯示人工智能可能提供的支持。文獻綜述中涉及的最后一個主題是,傳統的計劃和決策,以了解目前在軍事上如何制定戰術行動方案。
該小組進行了需求分析和利益相關者分析,探索WRAID能力如何支持作戰人員。該小組在需求分析的基礎上為WRAID系統開發了一套需求。這些要求被歸類為:硬件/軟件,人機界面,和道德規范。第一階段的分析結果包括 (1)戰爭的復雜性需要發展一種未來的WRAID能力,這種能力利用自動化方法,包括人工智能、ML和博弈論,(2)WRAID能力需要大量的計算能力和復雜的軟件算法,(3)實現未來WRAID系統的挑戰將是技術和道德的。
未來WRAID系統的概念設計是基于需求分析的。概念設計被記錄在一套系統模型中,包括背景圖、系統視圖、功能工作流程圖和操作視圖。該團隊開發了一個作戰場景,以支持對WRAID能力如何在作戰中使用。
在開發WRAID的過程中,預計會有一些路障。開發WRAID系統的技術是存在的,然而,研究小組發現數據挑戰、人工智能訓練、程序限制和當前系統工程的局限性將是需要解決的障礙。數據挑戰指的是獲得足夠的數據集的能力,這些數據集代表了訓練ML算法所需的真實世界的戰術行動和兵棋推演分析。程序性挑戰包括國防部實施網絡安全、機密數據、數據庫訪問和信息分配協議的能力。系統工程方面的障礙是需要新的方法來設計安全和可靠的人工智能系統,如WRAID能力。將需要SE方法來處理不可預見的故障模式,并在系統生命周期的早期確定根本原因。
對像WRAID能力這樣的人工智能系統的倫理考慮是系統發展的一個重要因素。開發系統以取代倫理學,將使系統更有可能被部署。有幾個有道德問題的自主武器系統被拉出來作為WRAID能力的道德對話的基礎。通過一個示例場景,對道德狀況進行定性分析,以了解在部署WRAID能力時可能出現的道德問題。倫理學在未來的技術中發揮著巨大的作用;從一開始就考慮到倫理學,建立技術是很重要的。
未來的重點需要放在繼續對想象中的WRAID系統采取正規的系統工程方法。WRAID系統需要一個強大的數據集,需要收集和注釋;收集的定性兵棋推演數據越多,WRAID系統的可行性和準確性就越高。與軍事部門的合作對于最大化WRAID的利益至關重要,例如情報和偵察組織。WRAID的模擬將是完善系統要求和創建現實模型的關鍵。關于如何使用WRAID的培訓和文檔應該同時開發,所以利益相關者,特別是指揮官已經準備好,知道如何使用這個新工具。未來的研究領域包括認知工程、基于正式模型的系統工程和人機協作。
隨著目前技術進步的速度和外國的目標,人工智能將在未來的沖突和戰爭中發揮作用。自上而下的指令將需要設計和實施WRAID能力:提供大量的資源,解決操作和文化變化,重組系統工程,并確保網絡安全和收購變化。實現未來的WRAID能力并不是一個微不足道的任務。然而,它對確保現在和未來的戰斗空間優勢至關重要。
隨著當前海軍戰爭的趨勢轉向自動化作戰武器系統,美國海軍正將其戰略重點放在人工智能(AI)能力上,以減少作戰人員行動時間。這個系統工程(SE)項目使用約翰-博伊德的觀察、定向、決策和行動(OODA)概念和海軍陸戰隊規劃過程(MCPP)(Angerman 2004;美國海軍部2016)來代表人類-人工智能決策過程。空中和導彈防御(AMD)的殺傷鏈是通過簡化聯合目標定位理論“JP 3-60”(參謀長聯席會議2018)來體現的。殺傷鏈過程中提高操作動化水平被證明可以大大減少執行時間,如果進一步發展和實戰化,將為海員和海軍陸戰隊提供防空的戰術優勢。通過使用專家系統和人工智能加速殺傷鏈將大大縮短交戰時間,有效地擴大戰斗空間。
該項目開發了用于防空和導彈防御的人工智能(AI-AMD)架構,該架構旨在通過對威脅進行優先排序并在人類用戶的最小介入下采取行動來改善作戰決策。該項目專注于理解和評估空空導彈防御(AMD)的殺傷鏈,通過確定使用AI-AMD可以更快地執行行動。項目組確定并評估了與應用于殺傷鏈過程中各個步驟的AI-AMD自動化水平相關的風險。該小組進行了建模和模擬(M&S)分析,以比較低水平自動化("無 "人工智能)的殺傷鏈和高水平自動化("有 "人工智能)的殺傷鏈,根據節省的時間來評估改進。
該團隊在M&S分析的基礎上開發了高度自動化的AI-AMD決策輔助作戰能力的概念,并確定了有可能應用于未來AI-AMD架構的現有和未來人工智能方法。該團隊按照美國防部的架構框架(DODAF)進行了架構分析,以確定AI-AMD的操作過程。該小組采用基于模型的系統工程(MBSE)方法,使用SE工具Innoslate來開發概念架構。架構分析結合了藍軍(BLUFOR)防空傳感器、武器裝備和聯合網絡,創建了一個OV- 5b/6c行動圖,描述了AI-AMD決策輔助輸出與JP 3-60聯合目標定位程序步驟協同應用,以消除敵人的威脅(參謀長聯席會議2018)。為了完成其任務,BLUFOR系統(SoS)執行36項業務活動:AI-AMD內部的17個決策點和外部系統的19個功能(包括傳感器行動和網絡通信)。該團隊使用實驗設計(DOE)、離散事件和隨機模擬分析了架構分析的結果,發現在目標定位過程中高壓力的AMD場景需要完全自動化水平,而低壓力的AMD場景需要最低水平的自動化。該團隊開發了一個決策風險矩陣,顯示出高壓力情況下的風險可以通過完全的自動化水平來降低。目標定位過程中17個步驟中的每個步驟的風險評估都被分為四類:低、中低、中和高。團隊制定了一個相關的風險值來進行風險評估確定。團隊利用Parasuraman的自動化水平(1-10級)來進行風險評估,將決策風險與目標定位過程中各個步驟的自動化水平聯系起來(Parasuraman, Sheridan, and Wickens 2000)。該小組開發并使用了一條效用曲線來幫助確定每個自動化水平所節省的時間。自動化程度越高,節省的時間就越多。
該項目側重于單一威脅的交戰,以了解殺傷鏈過程中AI-AMD的時機。該小組進行了M&S分析,以證明AI-AMD架構的能力。該小組使用Innoslate MBSE工具和Microsoft Excel進行了離散事件模擬。在大量投資于行動圖之前,團隊使用Excel來評估元模型。仿真的主要重點是建立AI-AMD在不同壓力水平下的時間性能,如低、中、高。次要目標是將該模型發展為可交付的設計工具,在NPS用于未來研究。該小組從公開來源的威脅數據中選擇了三個有代表性的交戰:低壓力情景(時間軸為58.65分鐘),中度壓力情景(時間軸為9.72分鐘),以及高壓力情景(時間軸為1.51分鐘)。該小組的M&S分析結果顯示,在低壓力情景下,僅由人類做出的決策(自動化水平1)導致對飛入時間為58分鐘或以上的敵方威脅的AMD殺傷率達到100%。對于中度威脅情景(代表AI-AMD對每個作戰活動決策節點的不同自動化水平(如6到10)),1000次隨機運行的數據結果顯示所有交戰的平均完成時間為8.08分鐘。當AI-AMD系統被設置為較高的自動化水平時,該系統在中等威脅情況下成功地進行了AMD防御。高壓力場景的分解時間線允許每個作戰活動決策節點有0.09分鐘。該小組將人工智能-AMD系統設置為在高壓力情景下僅由人工智能進行決策(自動化水平10)。高壓力場景的結果表明,在自動化程度為10級的情況下,有可能成功應對敵人的威脅。該小組進行了敏感性分析,以探索替代的基本代表分布(基線、對稱變量擴散和高度傾斜)的影響。雖然分布形狀的變化確實影響了結果,但在每一種情況下,只有在人工智能支持的節約率超過97%的情況下,才會在高壓力場景中取得成功。
該項目研究了人工智能方法如何應用于AMD決策,以提高自動化水平,減少人類-人工智能團隊的執行時間(人工智能輔助決策)。該團隊自上而下地分析了AMD殺傷鏈:從OODA到尋找、固定、跟蹤、目標、參與和評估(F2T2EA)。該小組確定了17個關鍵決策點,在這些決策點上,提高自動化水平可以提高AMD的決策速度。潛在的自動化水平與每個不同步驟相關的風險進行了平衡。該小組使用M&S來評估人工智能-AMD系統在低水平的自動化("無 "人工智能)到高水平的自動化("有 "人工智能)下的決策的及時性。由此產生的AI-AMD概念架構的高層次能力被記錄下來,隨著系統技術的成熟,建議利益相關者考慮。該團隊確定了現有和未來的人工智能方法及其在AMD殺傷鏈中的潛在應用。該小組已經確定了未來人工智能-AMD的迭代需求,以研究整個戰場上具有多種威脅和參與的更復雜的情況。
?在日益復雜的軍事行動環境中,下一代兵棋推演平臺可以減少風險,降低作戰成本,并改善整體結果。基于具有多模態交互和可視化能力軟件平臺的新型人工智能(AI)兵棋推演方法,對于提供滿足當前和新興戰爭現實所需的決策靈活性和適應性至關重要。我們強調了未來作戰人-機器交互的三個發展領域:由人工智能引導的決策指導,高計算力下的決策過程,以及決策空間的真實呈現。這些領域的進展將使有效的人機協作決策得以發展,以滿足當今戰斗空間日益增長的規模和復雜性。
關鍵詞:決策、交互、兵棋推演、人工智能、增強/混合現實、可視化
在傳統的兵棋推演中,指揮官利用一個共同的基于地圖的作戰地形,并在軍事決策過程(MDMP,方框1)中模擬各種因素的組合如何產生行動方案(COA)、可能的反擊行動、資源使用估計和預測結果(美國陸軍,1997年,2014年,2015年)。在幾天或幾周的時間里,MDMP過程導致了一套精煉的COAs,它對作戰環境做出了一定的假設,包括地形、天氣以及戰區資產的可用性和能力(即塑造支持主要作戰行動的活動)。
方框1. 軍事決策過程(MDMP) | |
---|---|
MDMP是美國陸軍解決問題的理論方法,從接到任務開始,到生成作戰命令結束。MDMP被用作一種工具,幫助指揮人員審查眾多的友軍和敵軍的作戰行動。MDMP的7個步驟在規劃新任務、擴展行動和執行訓練演習所需的決策過程中灌輸徹底、清晰、合理的判斷、邏輯和專業知識(美陸軍,1997年,2015年)。 | |
指揮官在接到任務后啟動了MDMP。在MDMP的第1步中,所有的工作人員和關鍵的任務參與者都被告知任務和待定的規劃要求,包括進行MDMP的可用時間量。確定進行任務分析所需的工具,并收集與任務和作戰區有關的文件。步驟2,執行任務分析,建立對任務的全面理解,包括關鍵的事實和假設,形成擬議的任務說明和任務分析簡報,為制定COA做準備。 | |
MDMP的第3至第6步著重于制定COA以進行分析和比較。這些步驟包括:第3步,制定COA;第4步,COA分析(兵棋推演);第5步,COA比較;第6步,COA批準。COA是對一個已確定的問題的潛在解決方案。每個COA都要使用篩選標準來檢查其有效性,如在既定的時間框架、空間和資源限制內完成任務。COA的選擇過程通常涉及到兵棋推演,它試圖在考慮到友軍力量和敵人能力的情況下,將行動的順序流程可視化,同時考慮到行動區域內平民的影響和要求(美陸軍,2014)。戰術模擬(兵棋推演)方法的好處是突出了作戰行動的優勢和劣勢。這往往是一個反復的過程,對作戰行動方案進行評估,然后根據需要進行修改,直到出現一個或多個具有最高成功概率的作戰行動方案來完成任務目標。 | |
在一個具體的行動方案得到指揮部的批準后,MDMP的最后一步是制作行動指令,這是一份給下屬和鄰近單位的指令,旨在協調所有參與任務的組織的活動。這一步驟涉及到所有受命令傳播影響的組織之間的積極合作,并建立起對局勢的共同理解。 |
盡管MDMP幫助指揮官了解作戰環境和考慮作戰方法,但這個過程有很多局限性,如時間密集、假設僵化、跨場景訓練的機會有限,以及將人工智能(AI)指導納入決策過程的機會很少。傳統上,一項任務的成功與指揮部執行MDMP的能力直接相關。然而,鑒于當今多域作戰(MDO)的復雜性增加(Feickert,2021年),有大量的任務指揮系統和流程,與行動相關的所有活動的整合和同步變得越來越困難,甚至到了人為無法完成的地步。由于MDMP的缺陷而導致的規劃專業知識的缺乏,可能會導致不同步和不協調的行動,從而最終導致士兵的生命損失。
MDMP中沒有具體描述戰斗空間的可視化能力,但它顯然在決策過程中發揮著重要作用。最近,集成了先進可視化能力的新系統和新技術已經被開發出來,它們可以提高態勢感知,從而增強決策過程。美陸軍的例子包括Nett Warrior(Gilmore,2015),它使下馬戰士能夠直觀地看到附近的友軍和敵軍,同時根據當地的地形協同規劃戰術任務。盡管這項技術將無線電和數字地圖擴展到了下馬戰士,但它缺乏一個底層的人工智能引擎來提供決策幫助。戰斗空間可視化和交互平臺(BVI,前身為增強現實沙盤,ARES)是陸軍技術的另一個例子,它能夠為任務規劃提供分布式協作,具有從任意視角和廣泛選擇設備的共同作戰畫面的二維和三維可視化能力(Su等人,2021)。BVI架構的制定是為了拉入外部計算服務,如分析管道、模型和人工智能引擎。美陸軍研究實驗室正在努力將這些類型的服務納入BVI,包括用于加強決策支持的人工智能。
目前,MDMP并沒有將人工智能指導納入整體任務規劃方法中。美陸軍的自動規劃框架(APF)(Bailey,2017)開始通過將自主技術插入MDMP工作流程來解決人工智能輔助決策問題。指揮人員可以通過APF的數字規劃呈現、規劃創建和規劃監控工具,在任務規劃和COA開發期間獲得背景援助。任務執行和估計能力通過監測任務的規劃和實際進展,為改進決策跟蹤和支持活動提供自動協助。盡管APF為MDMP引入了基本的自動化水平,但它缺乏Nett Warrior和BVI所提供的先進的可視化和用戶互動能力。
提供地面部隊自動化和用戶可視化能力的是美陸軍最知名的兵棋推演平臺--半自動化部隊(OneSAF),為計算機生成的地面部隊提供建模和模擬能力(PEO_STRI, 2022)。OneSAF提供了半自動和全自動的軍事實體(即士兵、坦克、直升機和綜合單位)的建模,在類似真實世界的戰斗空間中以不同的保真度來支持特定的應用和場景。OneSAF主要用于訓練,并與目前的任務指揮系統具有互操作性。它可以使用多分辨率的地形和詳細的實體相關數據庫來模擬廣泛的作戰環境。然而,OneSAF對地形和實體系統的高保真建模的優勢使得它的設置和運行成本很高。它受到老化系統的限制,而且眾所周知,士兵需要大量的培訓來學習如何操作模擬,使用起來很困難(Ballanco,2019)。OneSAF的復雜功能并不適合開發人工智能能力,以實現快速和敏捷的戰士-機器決策。
除了MDMP和上面提到的陸軍平臺外,最近將人工智能納入決策過程的工作包括一些方法(Goecks等人,2021a),在模擬人類決策過程方面取得了一些成功。一般來說,人工智能在決策變量有限的問題上取得了一些成功,如資源分配(Surdu等人,1999)、飛行模擬器(Drubin,2020)和更簡單的場景。正在進行的挑戰包括需要提高人工智能的能力,以解決有多個行為者、不完整和可能沖突的信息、不斷變化的單位行動和環境屬性的復雜決策,以及需要將這些決策的后果在許多空間和時間尺度和領域內可視化。
以下各節描述了對MDMP的潛在改進。"未來軍事決策過程所需的進步"一節概述了支持MDO決策的三個研究領域,并以圖表形式描述了這些研究領域與軍事理論決策方法之間的關系。"未來軍事決策過程所需的進步 "一節中的小節對每個研究領域進行了更深入的討論。"展望推進人-人工智能團隊決策的交互技術 "一節概述了未來的作戰人員-機器接口(WMI)的發展方向,重點是與決策有關的人-人工智能團隊的跨學科研究。
軍事決策過程在支持MDO復雜決策方面的局限性,突出了在三個研究領域的改進需要。首先,有必要將人工智能產生的指導和輔助決策支持納入MDMP。這既包括進一步開發和整合人工智能到戰斗空間決策規劃,也包括進一步改善人工智能決策過程的可解釋性和透明度(Chen等人,2018)。第二,有必要在戰略層面以及戰術邊緣,盡可能地將決策分析與高性能計算(HPC)的力量結合起來。這將能夠利用HPC系統的力量來支持建模、分析和計算時間,同時整合和同步來自所有戰區領域的信息。最后,有必要利用先進的可視化技術,如混合現實技術,對決策空間進行更準確和互動表述。不是簡單地在一個固定的時間尺度上顯示地形的二維渲染,而是需要可視化不同領域的決策是如何相互作用的,并利用混合現實技術來提高理解的吞吐量,并產生平面顯示不可能的洞察力。
除了MDMP之外,其他更廣泛適用的支持戰斗性問題解決的軍事理論包括:DOTMLPF[例如,學說、組織、訓練、物資、領導、人員和設施;(美陸軍,2018年)],這是一個確定差距并為當前和未來作戰要求提出設計解決方案的框架;以及METT-TC[例如,任務、敵人、地形和天氣、部隊、可用時間和民事考慮;(美陸軍,2019年)],這是一個結構化框架,用于捕捉任務相關因素的狀態,以便在軍事行動期間進行共享評估。這些理論定義了MDO戰場的信息背景,構成了應用于上述三個研究領域的軍事決策的核心基礎。如圖1所示,在為人類和人工智能指揮開發復雜軍事決策空間的新表述時,研究進展和MDO相關理論相互借鑒、相互啟發、相互加強(美陸軍,2010)。
圖1. 新型作戰人員-機器交互(WMIs)和人工智能輔助決策所需的三個研究發展領域,以支持和加強基本的MDO理論[右下圖來源:Lebsack(2021)]。
需要新的人工智能支持的WMI,以利用人工智能決策方面正在取得的進展,并為復雜的適應性決策的人工智能學習作出貢獻。在簡化的戰斗空間中測試人工智能決策輔助工具是開發過程中重要的第一步,也是將人工智能納入更成熟的戰斗空間平臺(即BVI、OneSAF)的前奏。開發用于決策輔助實驗的人工智能測試平臺可以在MDO中產生能力越來越強的潛在COA建議。圖2顯示了陸軍開發的兩個人工智能測試平臺的例子。
圖2. 兩個ARL人工智能測試平臺的例子。左邊:ARL Battlespace(Hare等人,2021)( //github.com/USArmyResearchLab/ARL_Battlespace )。右邊:ARL的Simple Yeho測試平臺。圖片由C. Hung制作。
人工智能測試平臺能夠開發出匯集所有領域信息的AI,并計算出人類和AI智能體的風險和預期回報。圖2的左側顯示了ARL戰斗空間測試平臺(Hare等人,2021年),它是從頭開始開發復雜決策的新型人工智能的理想場所。它對戰斗空間的抽象強調了軍隊相關場景下的核心推理原則,在這種情況下,用蜜罐進行網絡欺騙。較小的網格空間使人工智能的學習和發展能夠集中在不確定性下的復雜推理,有多個友好和敵對的agent。圖2的右側顯示了ARL的Simple Yeho測試平臺,它提供了將人工智能開發與更多真實世界場景中的默契推理結合起來的能力,有多個基于地形的海拔高度、視線范圍、障礙物、樹葉(隱蔽)、道路和城市區域。紅色陰影和黑色線條表示任務的起點和終點、左右邊界以及人工智能建議的路線。這種額外的真實性使其能夠與MDO理論相結合,包括DOTMLPF和METT-TC,并使人工智能與自然的、機會主義的士兵行為共同發展。這兩個人工智能測試平臺都可以擴展為傳統和沉浸式混合現實WMI開發平臺。
使用漸進式和可擴展的人工智能測試平臺,可以調查現有人工智能的幾個基本限制,特別是對于具有不確定性的復雜和適應性決策,以及人類和AI智能體的協作和對抗。對多智能體的協作和對抗性決策進行建模可能特別復雜,因為其遞歸性質,其他智能體是模型的一部分(Goldman,1973;Grüning和Krueger,2021),需要對決策特征、個性化的價值、風險規避、記憶和注意力進行動態和不斷發展的估計。這些具有高度不確定性、復雜性和動態性的情況是人類擅長的領域,適當設計的交互界面和人工智能測試平臺的人機協作可以提供加速和更有效的決策。對于有效的團隊合作,新穎的WMI應該幫助作戰人員篩選復雜的信息,并幫助人工智能發現決策的隱含規則。下面,我們提供了關于人機協作如何有效的案例。
多域兵棋推演中需要的復雜決策是開發有效人工智能決策輔助工具的直接挑戰。最近人工智能在圍棋、國際象棋、Minecraft和大富翁等游戲中的成功(Silver等人,2017;Goecks等人,2021b;Haliem等人,2021)是基于對世界現有狀態有完整了解的游戲(即 "開放 "游戲),而兵棋推演平臺通常包括關于作戰環境的不完整(如星際爭霸)、不確定或欺騙性信息(Vinyals等人,2019)。不確定性也可能來自變化的物理學或其他環境規則,正如在《憤怒的小鳥》中所探索的那樣(Gamage等人,2021)。由于世界狀態、不同行動者的狀態以及所采取的行動不確定性,知識的缺乏使得人工智能agent難以計算未來行動的風險回報情況(Cassenti和Kaplan,2021)。不確定性也限制了人工智能估計其他行為者的風險回報概況的能力,而這是計算有效的博弈論策略所需要的。人工智能被可能的最優和近似最優選擇的廣度所淹沒(Lavine,2019),即由于信息有限而選擇錯誤的選項,這種情況并不罕見,因為人類在制定有效探索隱藏信息的策略時,采用啟發式方法進行有效的選擇和預測(Gardner,2019)。為了幫助發展人工智能的隱性知識和探索能力,新型的WMI需要有效地解釋和展示決策景觀,以使作戰人員能夠快速和自然地瀏覽可能的選擇,同時使人工智能能夠在不施加認知負擔的情況下從人類的決策中機會主義地學習(Lance等人,2020)。這種機會主義學習可以包括:例如,凝視跟蹤,以捕捉吸引人類興趣和意圖的視覺區域和未標記的目標。它們還可以包括建立在自然的士兵選擇行為基礎上的行動者批評方法,以改善人工智能對人類專家在不確定、不完全信息和欺騙的情況下如何優先考慮某些選擇的學習,這取決于任務相關的背景。
開發人工智能的WMI的另一個基本挑戰是如何有效地整合和顯示MDO中所有五個領域的信息,特別是空間和網絡,因為這些領域的信息具有不同的時空尺度(Gil等人,2018)。對于網絡,決策的規模和速度可能比人類處理和理解的能力更快,需要人類的輸入來指導半自動化的決策,以及實施進攻和防御性欺騙策略的人工智能。WMI需要能夠以這樣的方式顯示決策圖景,即可以解釋一小部分最優和接近最優的決策策略(例如,圖3中的決策樹)。這應該包括對關鍵agent在不確定情況下的未來狀態和風險回報情況的估計(Hare等人,2020),以使有效的博弈論決策能夠被共同開發和相互理解。
圖3. 在頂部,是BVI網絡戰術規劃器應用程序中友軍與敵軍戰爭場景的三維視圖。三維視圖提供了一個比二維視圖更真實的決策視角,例如,顯示友軍(藍色)和敵軍(紅色)機載預警系統(AEWs)和周圍地形的海拔。這使得快速審查可能的視線和相對于周圍地形的感應。下面是人工智能的導航決策樹,為人工智能計算的幾個關鍵選擇的風險/回報概況以及它們如何映射到地形上提供透明度。這種抽象的決策空間還可以整合非空間決策,例如網絡欺騙。虛線表示與友方AEW的通信聯系和對敵方AEW的可能干擾。圖片由C. Hung制作。
這些挑戰為有效的WMIs設計提供了參考。也就是說,我們需要有能力從不同的來源(包括從其他國家的決策輔助工具)提取信息,以及一個能夠承載整合這些信息的計算能力的架構,同時還要處理基礎的人工智能計算(用于學習和部署)。我們還需要共同開發一個界面和算法設計,以適時地利用人類和人工智能agent的優勢并減少其局限性。
在復雜的決策過程中,需要大量的計算能力來處理和記錄所有組件、實體和狀態空間。從積累的動態狀態空間的數據集中建立過去、現在和預測模型,需要利用HPC資源來產生分析性的見解,并在決策背景下創建有用的表述。
實施HPC分析工作流程的一種方法是使用持久性服務框架(PSF)。PSF是一個最近可用的分布式虛擬化解決方案,它可以通過一個基于網絡的前端實現對HPC服務的非傳統訪問,而不像傳統的HPC環境,計算節點在特定的時間段內以批處理模式分配給用戶。此外,PSF提供對數據、數據庫、容器化工具集和其他托管平臺的分布式連續訪問(Su等人,2021)。
在一個PSF方法的例子中,一個模擬引擎連接到PSF,用于記錄人類和人工智能做出的所有決定。這允許分析在任務規劃和COA開發過程中發生的決策行為,以及識別決策模式和戰略,以開發競爭性和現實的兵棋推演場景。一個戰斗空間可視化平臺可以托管在PSF上,并使用消息傳遞協議來更新所有連接的設備接口。來自模擬引擎的狀態信息可用于生成戰斗空間和參與作戰單位的圖形表示。
使用PSF方法并利用HPC資源,可以實施人工智能輔助決策機制,利用大數據攝取和分析,同時可供地理分布的用戶用于協作決策工作和 "永遠在線 "的個性化培訓和紅色團隊。連接到PSF托管服務器的各種混合現實顯示模式可以支持一系列作戰場景,從戰略層面的指揮和控制到作戰邊緣的更多移動戰術使用。
用圖形表示各級行動的軍事決策戰略需要新的可視化方法,這些方法可以應用于以規則變化、認知狀態、不確定性以及個人偏見和啟發式方法為特征的動態環境(Dennison等人,2020;Hung等人,2020;Raglin等人,2020)。戰斗空間的視覺表現應該在技術上盡可能準確和逼真,但又保持在人類可以理解和解釋的認知水平(Kase等人,2020;Larkin等人,2020;Hung等人,2021)。融合了混合現實技術的先進可視化方法有可能更好地表現多領域戰爭的變化特征及其不斷變化的威脅和動態環境。隨著最近混合現實可視化設備的技術進步,成本降低,硬件的可靠性和實用性顯著提高,混合二維和三維可視化方法現在已經成為可能。
由多個二維顯示器組成的混合現實方法增強了更先進的三維可視化能力,可以為指揮人員提供理解復雜的兵棋推演狀態空間所需的洞察力(Su等人,2021)。當需要一個共享的戰斗空間表示時,可以通過在不同的可視化模式上實現多個協調的視圖來實現協作的戰略規劃模式,以根據分布式指揮人員的輸入進行互動更新。
BVI(Garneau等人,2018)平臺表示地理空間地形信息和地圖圖像,允許指揮人員建立和修改戰術任務規劃和COA。作為一個數據服務器,BVI將地形和作戰數據分發給支持多種可視化模式的客戶端應用程序,包括頭戴式顯示器設備、基于網絡的界面、移動安卓平板設備和混合現實設備(例如,HoloLens 2、Oculus Quest)。
例如,圖3(頂部)顯示了位于加利福尼亞州圣貝納迪諾縣歐文堡國家訓練中心的高分辨率地形上的友軍與敵軍的兵棋推演場景(Wikipedia, 2021)。與MDMP期間經常使用的傳統2D地圖顯示相比,戰斗空間的3D視圖可以從多個觀察角度提供更豐富的用戶體驗。三維視圖,在BVI的網絡戰術計劃器(WTP)中,將地形和人工特征的空間信息以及由MIL-STD 2525C符號描繪的單位位置可視化(美國防部,2014)。可以想象,地理空間視角,如BVI提供的視角,支持決策者對動態戰斗空間環境的理解。與可導航的人工智能增強的決策空間(圖3,底部)搭配,組合的視角可以使人們更好地理解視覺空間依賴性、影響和因果關系、估計的風險和價值、不確定性以及復雜決策的欺騙性。將這種以地理空間和決策為中心的視角與人工智能相結合,可以提供必要的廣度,以協調物理行動與網絡和其他非空間領域的行動,跨越多個時間尺度,并具有快速適應變化的任務目標的靈活性。
人工智能和人-人工智能團隊的快速發展需要WMI同步發展。隨著新型人工智能對有價值的COA產生更好的預測,并能更好地處理復雜的決策,它們也必須利用人類的專業知識,學習如何處理具有高度不確定性、欺騙、隱性知識和博弈論的決策。相反,人工智能的推理必須既抽象又能與兵棋推演環境相聯系,以實現透明和信任,同時又不造成過度的認知負擔。基于三維混合現實的WMI可以利用和增強人類固有的三維認知和預測能力(Welchman等人,2005;Kamitani和Tong,2006;Kim等人,2014;Boyce等人,2019;Krokos等人,2019),如果設計得當,其交互將感覺自然,同時擴大顯示多個領域的信息的能力,同時使AI能夠適時地從用戶的決策中學習。
我們強調了三個關鍵的發展領域,即人工智能引導的決策指導,支持這種指導的計算基礎設施,以及決策透明度的混合現實表現的發展。這些領域的進步需要跨越許多不同學科的專業知識。新的人工智能發展需要融合神經科學、心理學和數學的思想,以克服復雜決策中長期存在的問題的瓶頸。這包括跨時間尺度的學習和變化環境下的災難性遺忘,以及更具體的兵棋推演問題,如具有不確定性、欺騙和博弈論的多Agent決策。計算基礎設施也需要發展,因為計算能力和數據框架對于在戰術邊緣產生人-人工智能團隊的共同操作圖來說都是必不可少的。為了有效地開發,應該通過一個共同的框架來抽象出專有的限制和軟件的依賴性,并為使用和故障排除提供清晰的文檔,以使學術界、政府和工業界更好地專注于解決人與人工智能的合作問題。這個通用框架應該包括有效的信息傳遞,同時提供靈活性和適應性,以滿足人工智能開發和人類用戶在訓練和實際使用環境中的需求。最后,交互技術的開發本身需要跨學科的協同專業技術。一個基礎性的問題是如何壓縮信息使之被用戶有效地理解,以及如何最好地利用用戶的互動來進行機會主義學習。人類的大腦并不處理所有的感官信息,而是對世界進行預測和假設,以便在信息不完整的環境下節約計算。一個有效的WMI應該同時預測潛在的決策結果以及個人用戶的期望和假設。此外,人工智能決策輔助工具必須估計用戶的默契,使其能夠提供最相關的信息和最有希望的選擇,這些信息來自整個作戰領域。
信息作戰和指揮與控制(C2)是美國陸軍可以向盟友和伙伴提供的兩種能力。在未來的作戰環境中,不僅要為動能作戰做準備,而且要為混合作戰和以信息為重點的戰爭做準備。這需要在復雜和默契推理的人工智能能力方面取得進展,在能夠提供持續訓練、分布式混合決策和大數據分析系統方面取得進展,以及在人與人工智能協作決策和機會主義學習方面取得進展,以實現人工智能的持續進步和人與人工智能的共同適應。這些進展中的每一項都需要跨學科的計劃性努力,以克服復雜的技術挑戰,創造新的決策原則、理論和理論方法,包括持續開發綜合測試平臺和技術,以實現政府、學術界和工業界的合作和協同發展。