在未來部隊結構的發展和評估過程中,兵棋推演是深入了解其優勢和劣勢的一項關鍵活動。十多年來,挪威國防研究機構(FFI)在不同程度的計算機支持下,開發支持挪威軍隊進行能力規劃的兵棋。在此期間,這些已經從可被描述為計算機輔助的兵棋發展為更逼真的仿真支持的兵棋。此外,為了更密切地了解部隊結構的威懾效果(這在實際游戲中可能無法觀察到),我們的重點也轉向了更恰當地復制規劃過程--特別是監測對方部隊的規劃過程。例如,研究特定的結構元素在多大程度上阻止了對方部隊采取某些行動,這一點很重要。在這篇文章中,我們描述了我們開發的仿真支持的兵棋推演方法,其中包括一個準備階段;一個執行階段,含有一個聯合行動規劃過程;以及一個分析階段。此外,我們還討論了我們能夠從兵棋推演中提取什么類型的數據和結果,并提出了一套我們發現的關于如何成功進行仿真支持兵棋的最佳實踐。
關鍵詞:兵棋推演;建模與仿真;實驗;國防結構;能力分析;國防規劃
在發展和評估未來的部隊結構時,兵棋推演是深入了解和更好地理解部隊結構的優勢和劣勢的關鍵活動。今天,基于計算機的仿真系統使我們能夠創造出高度復制真實世界物理特性的合成環境。此外,人工智能(AI)和行為模型的進步給我們提供了更真實的計算機生成部隊(CGF),可以高度逼真地執行戰斗演習和低級戰術。兵棋可以從這些進展中受益。然而,在指揮系統的較高層次上,人工智能還不能與人類決策者相提并論,在兵棋中規劃和實施仿真行動需要人類官員的參與。
十多年來,挪威國防研究機構(FFI)一直支持挪威軍隊在不同程度的計算機支持下開發能力規劃的兵棋。在此期間,這些已經從可被描述為計算機輔助的兵棋發展為更逼真的仿真支持的兵棋。此外,為了更密切地了解部隊結構的威懾效果(這在實際游戲中可能無法觀察到),我們的重點也轉向了更恰當地復制規劃過程,特別是監測對方部隊的規劃過程。例如,研究特定的結構要素在多大程度上阻止了對方部隊采取某些行動--或者換句話說,正在推演的概念有怎樣的戰爭預防或維護和平效果,這一點很重要。
能力規劃過程和高調的兵棋總是會涉及或吸引利益者--例如高級軍官、政治家、官僚和國防工業領導人--的利益沖突。一般來說,參與的利益者有可能想把兵棋框定在一個有利于他們利益的背景下(Evensen等人,2019)。重要的是要意識到這個問題,而且關鍵是要避免兵棋成為利益者利益的戰場。本文所描述的方法和最佳實踐試圖通過使用基于計算機裁決的仿真,以及通過提高對元游戲的認識,或對兵棋所有階段的沖突,從準備到執行,再到分析和報告,來減少這個問題。
本文的組織結構如下。首先,我們簡要地描述了這項工作的背景。接下來,我們描述了我們開發的仿真支持的兵棋推演方法,其中包括準備階段;執行階段,包括聯合行動規劃過程;以及分析階段。之后,我們討論了我們能夠從兵棋推演中提取的數據和結果類型。最后,我們提出了一套我們發現的關于如何成功進行仿真支持的兵棋推演的最佳實踐。
雖然各種形式的兵棋推演已經在FFI進行了數十年,但當FFI的研究人員開始合作研究單個仿真支持的系統評估方案時,首次出現了實施仿真支持的部隊結構評估的想法(Martinussen等人,2008)。
2010年,FFI首次將使用半自動部隊(SAF)的互動式旅級仿真系統作為兵棋推演的基礎。在 "未來陸軍 "項目中,通過一系列計算機輔助的兵棋推演,對五種基本不同的陸軍結構的性能進行了評估(霍夫等人,2012;霍夫等人,2013)。其目的是根據這些結構的相對性能進行排名。此外,兵棋推演揭示了被評估結構中固有的一些優勢和劣勢。雖然我們使用的仿真工具相當簡單,但它對于跟蹤部隊的運動和計算決斗和間接火力攻擊的結果很有用。
在此之后,FFI支持挪威陸軍進行了幾次仿真支持的能力規劃系列兵棋推演。這些兵棋推演是雙面的(藍方/友方和紅方/敵方),封閉的(可用信息有限),在戰術和戰役層面進行。
玩家總數在10到100人之間,兵棋推演的時間從一天到兩周不等。圖1顯示的是2014年FFI的一次仿真支持的兵棋推演會議的照片。
圖1 2014年FFI的仿真支持的兵棋推演會議。
自2010年以來,我們的兵棋推演逐漸從計算機輔助的兵棋推演(使用非常簡單的仿真模型),向使用更詳細和更真實的仿真模型的兵棋推演演變。此外,為了更密切地了解部隊結構的威懾效果(這在實際游戲中可能無法觀察到),我們的重點也轉向了更恰當地復制規劃過程,特別是監測紅方部隊的規劃過程。圖2說明了我們兵棋推演的演變過程。
圖2 我們的兵棋推演的演變過程。
使用基于計算機的仿真來支持兵棋推演的價值首先在于有一個系統來自動跟蹤部隊,計算其傳感器的探測情況,并評估決斗情況和間接火力攻擊的結果。此外,基于計算機的仿真非常適用于通過在地面實況上添加過濾器來真實地表現不確定性和戰爭迷霧。
戰術仿真是開發、測試和分析新的部隊結構的一個重要工具。通過兵棋推演,可以深入了解一個部隊結構對特定場景的適合程度,并揭示該結構的優勢和劣勢。然而,擁有一個好的執行計劃對于成功地進行兵棋推演實驗和從活動中獲得有用的數據是至關重要的。在本節中,我們將介紹我們的仿真支持的兵棋推演方法,該方法是通過我們在過去10年中對兵棋推演實驗的規劃、執行和分析的經驗發展而來的。我們還將討論兵棋推演的背景,以及規劃和組織兵棋推演活動的過程,這可以被視為一種元游戲。
一般來說,有幾本關于兵棋推演的書和指南可以參考(Perla,1990;Appleget等人,2020;Burns,2015;英國國防部[UK MoD],2017)。本節描述的方法是專門為支持未來部隊結構發展的分析性兵棋推演而定制的。通常情況下,我們使用這種方法來評估和比較不同部隊結構備選方案的性能,這些方案可能在物資和裝備的構成、戰術組織或作戰概念方面有所不同。
我們的兵棋推演實驗方法包括三個主要階段:
1.準備階段
2.規劃和執行階段
3.分析階段
這些階段將在下文中詳細描述。圖3說明了它們之間的關系,其中規劃過程和兵棋推演的執行階段構成了實驗的核心。
圖3 兵棋推演實驗的方法說明。
小國在發展兵力結構以威懾擁有更多兵力要素的敵人時面臨著兩難境地。敵人可能會觀察到防御結構中的變化,并可能在運用軍事力量時從集合中選擇其他更合適的元素。例如,如果小國的部隊結構是專業化的,為了對付預期的敵人行動方案(COA),敵人可能會從庫中選擇完全不同的東西,敵人的COA可能會發生巨大變化。
對所有國家來說,發展部隊結構是一個緩慢而公開的過程。從現有的、龐大的部隊要素庫中選擇部隊并創造新的行動方案是一個快速和隱蔽的過程。對于一個小國來說,在這種情況下實現威懾似乎是一項不可能完成的任務,但我們已經在幾個案例中觀察到,對部隊結構的低成本改變是如何對敵人的COA選擇產生巨大影響的(Daltveit等人,2016;Daltveit等人,2017;Haande等人,2017)。1988年為圣戰者引入手持防空導彈后,蘇聯在阿富汗的戰術發生了變化(Grau, 1996),這就是我們在兵棋推演中看到的紅方(對手)小組規劃過程中產生影響的一個很好示例。據觀察,存在感和姿態也有威懾作用。此外,社會、景觀和氣候也影響了紅方的規劃過程。這一切都歸結于敵方在規劃和制定作戰行動期間的風險評估。
為了研究部隊結構變化的威懾作用,有必要讓分析人員在兵棋推演前觀察紅方的規劃過程,而不僅僅是在仿真戰斗中。阻止敵人進攻是任何部隊結構發展的意圖,而觀察威懾效果的唯一方法是在敵人的規劃期間。
在決策理論中,風險是一個必須考慮的因素,以便能夠做出理性的選擇。馮-諾伊曼-摩根斯坦(vNM)決策理論的基礎是行為者通過考慮給定概率和結果的彩票來評估選擇(von Neumann & Morgenstern, 1944)。風險因素也需要存在于規劃過程中。如果一方的規劃過程被參與兵棋推演的其他任何一方知道,那么一部分風險因素就會消失。這將使規劃過程減少到只是評估一個已知的敵人COA,而不是評估一系列可能的COA及其概率。因此,重要的是,場景定義不能限制敵人的規劃過程,所有的規劃過程都要受到監控--特別是敵人的規劃過程。
盡管兵棋推演在最終開始時有規則,但在選擇兵棋的類型和周圍環境的過程中,并沒有明確的規則。因此,策劃和組織一場兵棋推演活動的過程可以被看作是一種元游戲--一種可以在對抗分析的規則中進行分析的游戲(Curry & Young, 2018)。例如,聯合層面的兵棋推演將包括傳統上的資金競爭對手的參與者。來自空軍、海軍和陸軍的參與者,在涉及到應該如何制定場景、應該對未來技術做出什么樣的假設、應該如何評估戰斗效果等方面,可能有不同的利益。每個領域內的分支也是如此。因此,存在著一種危險,即元游戲對部隊結構分析結果的影響可能比實際兵棋推演的影響更大。元游戲并不局限于兵棋的執行。分析和事后的報告也會受到與準備期間相同類型的沖突影響。在圖4中,存在于核心方法論之外的元游戲層就說明了這一點。
圖4 圍繞兵棋推演實驗方法的元游戲圖解。
能力規劃過程總是會涉及或吸引利益沖突的利益者,國防規劃和兵棋推演包含許多利益者爭奪地盤的例子(Evensen等人,2019;Perla,1990)。這在兵棋推演的準備階段尤其明顯。應對這種情況的一個可能的方法是,適當地將擁有發明改變部隊結構的權力角色與擁有評估和接受改變的權力角色分開。當這些角色沒有被分開時,利益者會試圖影響什么是兵棋的目標,以及使用什么類型或風格的兵棋。在最壞的情況下,我們可能會有有限數量的利益者提出新的部隊結構,然后讓同樣的利益者通過基于場景的討論來驗證他們自己的想法是否良好。如果被評估的是利益者所珍視的想法,這就特別容易出問題。
聯合需求監督委員會(JROC)是一個很好的例子,該機構以健全的決策結構處理地盤戰(參謀長聯席會議主席[CJCS],2018)。美國軍方將思想的發明者與審查其有用性的權力進行分開,這完全符合孟德斯鳩的分權原則。在挪威進行國防規劃和兵棋推演的方式,在許多情況下,人們會發現行為者既產生了對未來部隊結構的想法,又通過參與基于場景的討論來評估相同的結構。基于場景的討論如果不包括專門的紅方小組,就不是兵棋推演。引入 "紅方小組 "成員,以及對方的自由和無阻礙的規劃,消除了一些濫用權力的可能性。沒有對提議的部隊結構進行適當兵棋推演的一個特殊結果是,建議采用次優化的部隊結構來打擊固定的假設敵方作戰行動。由于沒有對這種部隊結構進行適當的推演,結構改革的支持者成功地擊敗了他們喜歡的敵人COA,但卻沒有挑戰他們自己的想法。
準備階段包括在兵棋推演執行階段開始前需要做的一切。最重要的準備工作是:
建立對兵棋推演實驗目標的共同理解。
確定總體方案,包括外部條件、假設和限制。
選擇一個或多個仿真系統,并對仿真模型進行校準。
確定藍方(友軍)和紅方(敵軍)的作戰順序(OOB)。
規劃和執行階段包括兩個獨立的活動:(1)雙方的聯合行動規劃過程,以及(2)仿真支持的兵棋推演。
在這項活動中,由軍事主題專家(SME)和軍官組成的藍方和紅方小組,根據總體方案和受控的情報信息流,分別制定他們的初步行動計劃。根據偏好,這些計劃不是整體方案的一部分,雙方都可以自由制定自己的計劃。這也意味著,對立雙方制定的計劃對另一方來說仍然是未知的。
原則上,聯合行動規劃過程可以按照與現實中基本相同的方式進行,不做任何簡化。這是一項應該與仿真支持的兵棋推演一樣優先考慮的活動,在人員配置方面也是如此。
在規劃過程中,參與者必須討論不同的選擇,并根據所感知的對方部隊結構的優勢和劣勢來制定一個COA。觀察雙方的規劃過程并揭示決定COA的根本原因,可以提供有關部隊結構的寶貴信息,而這些信息在執行兵棋推演本身時可能無法觀察到威懾效果。
兵棋推演本身是作為仿真支持的兩方(藍方和紅方)兵棋推演進行的,其中行動是在一個具有SAF的建設性仿真系統中仿真的。在博弈論中,這種類型的兵棋推演可以被歸類為非合作性的、不對稱的、不完全信息的連續博弈。
兵棋的參與者是兩組對立的玩家和一個公斷人或裁決人的小組。重要的是要記住,一個兵棋的好壞取決于它的玩家。玩家是軍事主題專家和軍官。要想有一個平衡的兵棋,關鍵是不要忽視紅色單元。如果做得好,這種類型的兵棋,由適應性強且思維不受限制的對手主導,往往會變得高度動態、對抗性和競爭性。
對于分析性兵棋推演來說,現實的仿真對于加強結果的有效性和可信度非常重要。軍事行動,尤其是陸軍行動,本質上是復雜的,對這種行動的仿真,要有足夠的真實性,是非常具有挑戰性的(Evensen & Bentsen, 2016)。此外,仿真系統可能包含錯誤,人類操作員可能會犯一些在現實生活中不會犯的錯誤。因此,重要的是要有經驗豐富的裁判員來監控仿真,并在必要時對結果進行適當的人工調整。
在某種程度上,在仿真支持的兵棋中,元游戲也會發揮作用。曾經有這樣的例子,利益者將有能力的官員從兵棋推演中撤出,只是用不太熟練的人員取代他們,很可能是為了降低利益者不希望成功的兵棋可信度。其他的例子是公斷人與參觀兵棋的更高等級利益者的干預作斗爭。歷史上有很多類似的例子(Perla,1990),挪威也不例外(Evensen等人,2019)。這里所描述的清晰的方法,意在抵制以往兵棋推演實驗的一些缺陷。
除了從仿真支持的兵棋本身的執行中收集的觀察和數據外,分析還基于規劃過程中的觀察和數據。
在規劃過程中,密切監測和記錄討論情況是很重要的。由于國防軍的主要目的--至少在挪威是這樣--是為了防止戰爭,因此在規劃過程中的考慮可能是整個兵棋中最重要的結果。只有當敵人在兵棋開始前考慮到這些因素時,才能觀察到部隊結構和態勢的預防特性。在規劃階段,通常會考慮幾個備選的作戰行動和機動性。其中許多被放棄,有些被保留,原因各異,必須記錄下來。為什么紅方決定某個行動方案不可行,可能是由于某些結構要素或來自藍方的預期策略。如果紅方由于藍方的OOB要素而不得不放棄一個計劃,那么這些要素已經證明了對藍方的價值--即使這些要素在接下來的仿真行動中最終沒有對紅方部隊造成任何直接傷害。
在仿真支持的兵棋中可能會記錄大量的數據。很容易把各種結構元素的損失交換率等數據看得很重。在實際的兵棋推演中,也許更應該注意的是雙方指揮官的決定。如果其中一方出現了機會,這是為什么?該方是如何利用這樣的機會的?是否有什么方法可以讓他們考慮利用這個機會,但不知為何卻無法利用或執行?如果有,為什么?為了收集這樣的信息,指揮官們公開討論他們的選擇是很重要的。重要的不僅僅是告知積極選擇的原因;往往可能同樣重要的是為什么沒有做出其他選擇。
確定部隊結構的主要優勢和劣勢及其利用是分析階段的一個重要部分。考察雙方在規劃階段和推演階段的考慮,是做到這一點的最好方法。這不是一門精確的科學,因為這種數據具有定性的性質。通過觀察參與者的考慮和決策,比單純看哪些武器系統摧毀了哪些敵人的系統,可以更好地確定使用某種COA的關鍵因素,或者是允許敵人有更好選擇的缺失能力。分析階段的結果是對測試的部隊結構進行評估。
分析階段也可能會在商定的兵棋推演方法范圍之外發生爭吵。甚至在事件發生后的報告撰寫中也可能受到影響,當角色沒有被很好地分開,利益者被允許過度地影響這個過程時。
一般來說,我們努力從兵棋推演環節中獲取盡可能多的數據。根據用于支持兵棋推演的仿真系統,可以記錄各種輸出數據。例如,通常可以記錄各個單位移動了多遠,他們使用了多少彈藥和燃料,以及其他后勤數據。通常,殺傷力矩陣--基本上是顯示一方的哪些單位殺死了另一方的哪些單位的矩陣--也會被記錄。其他許多定量數據也可以被記錄下來。除此以外,還有定性的數據。如前所述,這包括對規劃過程的觀察,以及與參與規劃過程的參與者的討論。此外,它還包括對兵棋推演期間所做決策的觀察,以及在兵棋推演期間或之后與玩家的討論。
人們往往傾向于把大量的注意力放在定量數據上,如殺傷力矩陣,而對定性數據的關注可能較少。定量數據更容易分析,而且通常被認為比定性數據(如隊員的決策和考慮)更客觀。但重要的是要記住,定量數據取決于雙方玩家的決策,以及對模型的輸入數據。玩家認為各種單位應該如何運用,對殺傷力矩陣有相當大的影響。因此,盡管這些數據是定量的,但它們并不比定性數據更客觀。
諸如殺傷力矩陣這樣的數據也忽略了重要的信息。雖然人們可以看到哪些部隊殺死了哪些敵方部隊,但卻失去了原因;其他部隊雖然沒有直接摧毀敵方部隊,但卻可能在為其他部隊創造有效條件方面起到了關鍵作用。雖然某些部隊可能只消滅了很少的敵人,但他們在戰場上的存在可能對阻止敵人進行某些行動至關重要。例如,雖然近距離防空可能不直接負責消滅敵人的直升機,但它可能阻止了敵人像其他情況下那樣積極地使用直升機。因此,在分析一個兵棋時,對于只看殺傷力矩陣這樣的量化數據應該謹慎。必須考慮到整體情況。
理想情況下,在比較不同的部隊結構時,應該對每個部隊結構進行幾次推演,并允許敵人在每次戰役中改變其行為。自己的部隊應該找到在特定情況下使用其結構的 "最佳 "方式,而敵人應該找到反擊這一策略的 "最佳 "方式。只有這樣,人們才能真正比較不同部隊結構的兵棋推演結果,并得出哪種部隊結構最適合給定場景的結論。然后,當然,確實有廣泛的潛在場景需要考慮。因此,雖然這也許是應該進行兵力結構比較的方式,但在這方面,時間和資源通常對大量的兵棋推演是不夠的。
所有模型都有局限性。它們可能是為某一特定目的而設計的,并適合于此,但不太適合于其他事情。在考慮哪些問題可以通過兵棋推演來回答,哪些問題應該用其他工具來調查時,必須記住這一點。從兵棋推演中到底可以推導出什么,將取決于所使用的模型--但一般來說,應該把重點放在實驗所要回答的那些問題上。如果在實驗中出現了其他的結果,就應該對其有效性進行檢查,而且這些結果往往需要在專門為調查這些新出現的問題而設計的實驗中進行評估。
兵棋推演是比較兩個(或更多)部隊結構在特定情況下的表現的一個重要工具。然而,兵棋推演并不能對任何給定的部隊結構的有效性給出任何精確的衡量,但適合于確定主要的優勢和劣勢。與具體單位有關的參數的效果,如它們的火力和裝甲,應在單獨的研究中進一步考察。這些因素雖然很重要,但它們的層次太細,無法通過我們這里討論的兵棋類型來研究它們對結果的影響。彼得-佩拉強調,"兵棋只是研究和學習國防問題所需的工具之一"(佩拉,1990,第11頁)。其他工具應被用來補充兵棋和研究這些因素的重要性。
兵棋推演通常是實質性的活動,涉及大量的人,并需要大量的時間。因此,我們通常被限制在有限的數量上--通常對于我們所分析的每個部隊結構只有一個。重要的是要記住,一個單一的兵棋推演的結果只是:特定情況下的一個可能的結果。雙方玩家可以采取不同的做法,事件的發展也可能不同。細微的變化可能會影響到對整體結果至關重要事件的結果。
在本節中,我們將列出我們發現的進行仿真支持的分析性兵棋的最佳做法,以評估部隊結構。我們發現的一些最佳實踐與處理元游戲的需要有關,或者與兵棋的沖突有關。這些最佳實踐的用處可能僅限于其他尚未將發明權與測試部隊結構的權力分開的小國。其他的最佳實踐來自于提供仿真支持和取代基于場景的討論以發展防御結構的需要。
在準備階段,必須盡早明確兵棋推演實驗的目的,這將是實驗設計的基礎。
擁有一個帶有SAF的交互式仿真系統,對玩家來說易于操作,并且需要相對較少的操作人員,這就減少了進行仿真支持的兵棋推演所需的資源,從而也降低了門檻。
一個好的紅方小組是發現自己的部隊結構、計劃和程序中弱點的關鍵。紅色小組的成員也應該對預期對手的理論有很好的了解。我們觀察到,一個好的紅色小組能迅速地阻止我們自己的規劃人員對可能的敵人行動進行集體思考的傾向。
自己部隊結構的變化也必須允許對方部隊結構的變化。部隊結構的改變是一個緩慢的過程,肯定會被預期的對手觀察到。
盡可能地復制現實生活中的規劃過程。
觀察規劃過程,以便更全面地了解部隊結構的優勢和劣勢。為了記錄藍軍部隊結構的威懾效果,觀察對方部隊的規劃過程尤為重要。據觀察,自己的部隊結構中的幾個要素對對方部隊的行動有威懾作用,存在和姿態也是如此。此外,我們還觀察到,社會、地形和氣候也會影響對方部隊的規劃。
在部隊相互靠近的情況下開始一場兵棋推演,可能會使它變成一場簡單的消耗戰。發展良好的兵棋推演,在提供了空間和時間的情況下,就像武術比賽中的對手互相周旋,評估對方的弱點,并尋找攻擊的機會。評估避免遭遇的能力可能與評估戰斗的能力一樣重要。
建立對正在發生的事情的了解需要時間,是領導軍事行動的一個自然組成部分。只有當不確定性得到適當體現時,部隊結構中某些要素的真正價值才會顯現。例如,存在的力量的影響可能是巨大的。當戰術形勢不是所有人都能看到的,而且戰斗的結果被認為是非決定性的,以至于現實是隨機的,那么不確定性就得到了最好的體現
讓參與者為兵棋推演的目的做好準備。當使用指揮和參謀訓練器作為支持兵棋推演的仿真系統時,一些參與者傾向于按照程序行事,就好像這是一場演習。如果兵棋推演的目的是探索新的部隊結構要素、作戰行動或戰術、技術和程序(TTPs),則需要鼓勵參與者在執行任務時發揮創造性。
讓與兵棋推演無關的人員遠離它,特別是高級軍官,是很重要的。在人在回路(HITL)仿真中,人類玩家是整個仿真的一部分,來訪的高級軍官(或其他人)將對人類玩家的互動方式和他們如何進行規劃產生影響。限制來訪人員也減少了外部影響結果的機會(Hoppe, 2017)。
十多年來,FFI支持挪威陸軍為能力規劃開發仿真支持的兵棋。本文介紹了我們進行仿真支持的兵棋推演的方法,并提供了一套進行仿真支持的兵棋推演的最佳實踐。該方法和最佳實踐特別針對分析性兵棋以支持能力規劃。
該方法由準備階段、規劃和執行階段以及分析階段組成。在過去的10年中,該方法通過使用更詳細和更現實的仿真模型,以及在仿真行動前復制和監測規劃過程,以更深入地了解測試的部隊結構的威懾效果,而逐漸發展起來。
我們進行仿真支持的兵棋推演的最佳做法包括:為兵棋推演實驗確定一個明確的目標,使用一個便于玩家操作的仿真系統,擁有一個良好的紅方小組,不受太多限制,提供空間和時間,使戰爭不會立即開始,并提供一個不確定性和信息收集的現實表現。最后,為了更全面地了解一個部隊結構的優勢和劣勢,分析小組必須同時觀察規劃過程和兵棋推演本身。
將擁有發明部隊結構變化的權力角色和擁有測試、評估和接受這種變化的權力角色正式分開,將解決我們在國防規劃中看到的許多問題。我們已經發現,組織兵棋推演活動的過程可以被看作是一個元游戲。當用建模、仿真和分析來支持兵棋推演時,元游戲被看作是發生在各個層面的東西,其中一些我們可能沒有任何影響力。希望這篇文章能有助于提高對這些挑戰的認識,并能對我們能影響的那部分元游戲提供一些調整。
我們介紹了四場兵棋推演,旨在提高我們分析挪威軍事行動中聯盟方面的能力。我們討論了目標、配置和經驗教訓。實踐證明,兵棋推演對于發現我們在特定類型的軍事行動和系統方面的知識差距非常有幫助,并指出了場景組合的不足之處。它們還強調了更普遍的方法論,如明確說明基本前提的重要性。我們認為,兵棋是評估知識、挑戰當前觀點和改進分析方法的有用工具。
關鍵詞:兵棋推演、軍事行動、作戰研究、場景肥西、國防規劃
評估一個人的知識是很困難的。心理學警告我們一些現象,比如鄧寧-克魯格效應,描述那些缺乏知識或能力的人缺乏洞察力的現象。但是,即使人們認識到知識不足的可能性,識別錯誤概念和知識差距或缺失信息的問題仍然存在。最自然的做法是向其他專家尋求建議和意見。然而,自我評估的方法仍然是有價值的,原因有很多,包括以下幾點:
主題可能非常復雜,難以確定所需的所有專業領域。
要回答的問題需要對分析過程的具體細節非常熟悉,外部專家不容易得到全貌。
至少目前還沒有相關的專家。
該主題是保密的,限制了可能的資訊庫。
此外,一般來說,在尋求外部幫助之前,最好能盡可能多地整理出錯誤。
挪威國防研究機構(FFI)提供分析,以支持長期的戰略防御發展和聯合總部的作戰規劃。我們使用基于場景和能力的方法來描述未來的軍事防御要求,并評估擬議的防御計劃是否能滿足相關的威脅。我們不斷地尋求改進我們的方法,并重新審視以前的論點和結論。
在本文中,我們分享了利用一系列兵棋作為工具來評估和開發我們對挪威軍事行動聯盟方面的知識經驗,這對分析工作特別重要。雖然我們很清楚,這一層面在以前的分析中沒有得到應有的重視,但我們發現很難確切地知道不足是什么。出于上述所有原因,我們發現在邀請專家參與之前進行自我評估至關重要。
利用兵棋推演,發現了我們對軍事系統和行動的知識不足之處,并暴露了以前想當然的錯誤觀念和有問題的結論。我們現在正在擴大我們的場景組合,以涵蓋以前被忽視的情況。我們還改進了展示我們分析結果的方式。特別是,我們更清楚地認識到明確基本前提的重要性,以及對我們可以從分析性兵棋推演中得出的結果有一個清醒的估計。作為一個副產品,我們也大大提高了我們進行動態兵棋推演的能力,這在以后的分析中會有較大益處。
這并不是試圖推動兵棋的科學發展。我們寫這篇文章的目的是為了激勵同行們欣賞兵棋推演的潛力,將其作為一種工具來發現他們不知道的東西。這一系列的兵棋推演是在2022年2月俄羅斯入侵烏克蘭之前進行的。
本文描述的活動涉及我們為挪威軍事和政治防務領導提供分析支持的工作。這項工作的主要困難來源是其固有的不確定性。在合理的時間范圍內,相關的威脅是什么?沖突將如何發展?未來的軍事系統是否會有預期的表現?通過使用場景組合作為可能的部隊結構和防御概念的試驗場,我們可以探索這種不確定性。我們利用這些情景來確定未來防御的能力需求,并為其他作戰分析提供背景。
除了國家軍事和民防能力外,北約成員資格和我們與盟國的雙邊關系是挪威國防和安全戰略的基石。挪威武裝部隊的最佳發展取決于對未來盟國在挪威和挪威附近可能采取的行動性質的洞察。然而,我們的分析傳統上是基于描述對挪威的直接攻擊的情景,并且在大多數情況下關注的是挪威武裝部隊在沒有主要盟國支持的情況下或在其參與之前應該執行的任務。因此,在過去幾年中,重新審視國防分析的聯盟方面是很重要的。
我們還注意到,我們的情景分析在本質上有一種靜態的傾向。這對于已經使用了幾年的情景來說尤其如此:隨著時間的推移,分析家們傾向于把以前的結論視為理所當然。本文介紹的活動是我們努力的一部分,目的是振興我們運行更多動態戰爭游戲的能力,作為桌面地圖討論的替代。這暴露了我們以前分析中的薄弱論點和結論,有助于結果的驗證。
通過這一系列旨在研究盟軍可能的行動路線的戰爭游戲,我們實現了一個雙重目標。我們發現并填補了我們在挪威國防的聯盟方面的許多知識空白,同時我們也大大改進了我們的戰爭游戲技術。
不同種類的戰爭演習是我們分析的一個重要工具。它們提供了定性和指示性的答案,而我們使用其他形式的建模和仿真來獲得定量的結果。這些方法可以結合起來,反復使用,形成一個綜合分析和實驗運動計劃。
兵棋從根本上說是一種溝通行為--專家之間的結構化對話。根據Pournelle(2017)的說法,進行兵棋推演有三個目的:知識創造、知識轉移和娛樂。正如英國國防部的《兵棋推演手冊》(DCDC,2017)所指出的那樣,雖然兵棋可能會使從業者在超出其設計目的的方面獲益,但建議將兵棋推演指向一個特定的目的。Pournelle區分了兩類適合創造知識的游戲。它們是探索游戲和分析游戲。探索游戲通常用于解決非結構化的問題,而分析游戲則適用于更多的結構化問題(Pournelle, 2017)。在我們的系列中,我們同時應用了探索性和分析性的兵棋推演。
盡管 "兵棋推演"這個術語被廣泛使用,但并沒有一個共同認可的定義。我們可以在文獻中找到不同的定義;例如,Perla(1990)將兵棋推演定義為 "不涉及實際部隊行動的戰爭模型或模擬,其中事件的過程影響并受代表敵對雙方的玩家在這些事件過程中做出的決定影響"。美國海軍戰爭學院(USNWC,2020)將兵棋推演的基本組成部分確定為 "人們在競爭或沖突的背景下(與自己、其他人或環境)做出決策",而英國國防部的《兵棋推演手冊》(DCDC,2017)將兵棋推演描述為一種決策技術,使用 "基于場景的戰爭模型,其中事件的結果和順序影響到玩家的決策,并受到其影響"。
這些定義的共同點是,兵棋推演是關于不同角色競爭的沖突情況,對戰略和作戰方案(CoA)做出決策,以實現目標,并對其他玩家的決策做出回應。兵棋推演適合讓參與者沉浸在一個由場景描述的環境中,在那里他們會面臨各種不可避免的挑戰(Perla,1990;DCDC,2017),它們具有動態的性質,形成事件進程或路線,這取決于參與行動者的決策。
兵棋可以按照它們的全面性和嚴格性進行分類。在本文中,我們區分了三種主要類型的兵棋:研討會游戲、矩陣游戲和Kriegsspiel。這與Pournelle(2017)討論的兵棋風格相一致。
研討會游戲 | 研討會游戲是人們在一個共同的背景/場景下進行的討論。通常情況下: 他們有一個自由的形式。它們是探索性的。他們有開放的信息。研討會游戲對于支持創造力和探索特別有用。裁決通常不那么嚴格,但足以推動事件的發展進程。裁決可以由裁判員進行,也可以由玩家之間達成共識。 | |
矩陣游戲 | 矩陣游戲比研討會游戲有更強的角色扮演功能,通常使用更正式的裁決規則。在一個典型的矩陣游戲中,不同的角色將制定和提出他們喜歡的CoA,并為其提供支持性論據。其他角色將試圖提出反駁的論點。裁決由裁判員進行,他們評估論點的利弊,并決定CoA的成功概率。結果是由擲骰子決定的。矩陣游戲適合于在一個場景背景下探索不同的事件進程. | |
Kriegsspiel | Kriegsspiel是更正式的兵棋,與研討會和矩陣游戲相比,它的細節和嚴格程度有所提高。它們通常對沖突有一個更真實的表述,有更詳細的場景和環境表述。 |
為了決定最適合于分析的游戲形式,應該考慮信息要求、所需的詳細程度、以及準備和游戲執行的時間和資源等因素。不同類型的兵棋適合于支持分析過程的不同階段(Malerud & Fridheim, 2021)。不太正式的(探索)游戲,如研討會和矩陣游戲,特別適合于支持分析的初始階段--例如,問題的結構化和對不同決策選擇的探索。如果需要深入研究更多的細節,更正式和結構化的兵棋在后期階段會很有用。
在開始我們的游戲系列之前,我們考慮了上面討論的不同類型的兵棋,并得出結論,我們需要從游戲1開始,這是一個不太正式的游戲,以提高我們對在挪威境內或附近的盟軍行動背景下的主題理解,并獲得關于如何設計以下游戲的想法。因此,游戲1可以被看作是對真正游戲的測試。在我們的游戲2-4中,我們對目標和分析要求有了更好的理解,并改進了我們的兵棋推演技術。因此,我們很自然地收緊了游戲格式,并以更明確的矩陣游戲的設置來進行這最后三場游戲。在下面的描述中,我們將指出第一場游戲的設置與后來的游戲的不同之處。
在實踐中,我們遵循英國國防部《兵棋推演手冊》(DCDC,2017)中描述的兵棋推演過程或周期,以確保游戲適合目的,并利用新的知識和經驗教訓來完善新游戲的設計。在這個過程中,我們還考慮了各種限制因素,如參與者、可用時間和預算。這個過程將在下文中詳細描述。
如上所述,我們的兵棋推演的首要目標是探索盟軍的行動如何在挪威和大西洋北部地區進行,并找出錯誤的觀念和缺乏的知識。我們的觀點是,我們對盟軍在挪威境內或附近的行動可能是什么樣子的認識不足,而且為了分析挪威的防御能力,我們需要提高我們對這種行動的認識。但究竟什么是我們不了解的,甚至哪些領域和主題是我們應該追求的,都不清楚。
因此,我們從一個非常松散的游戲1開始,通過這個游戲,我們旨在確定我們可以在后續游戲和分析中研究的問題。隨著我們進行一系列兵棋推演,增加了知識,提高了進行兵棋推演的技術能力,使我們能夠把注意力更多地放在行動者作戰方案的細節和現實上。因此,游戲2-4更直接地關注于研究紅方和藍方在相關場景中可能的作戰方案。
在我們開始開發系列游戲之前,我們確定了一些限制和要求。
關于設置:
執行游戲(包括向玩家介紹情況)的可用時間為一天。
參與者不一定是軍事或政治專家。
應該有裁判員裁決。
游戲應該考慮到行動者之間的動態關系。
我們應該能夠在最小的技術支持下運行游戲。
關于內容:
由此產生的CoA應該涉及軍事戰斗。
盟軍被迫參與到沖突中來。
紅藍雙方在團隊規模和背景方面不應過于不平衡。
游戲中的每個角色都由一個小組來扮演。白方小組由一名主持人和一到兩名記錄員組成。這個小組還充當裁判員。
在游戲開始前,向玩家們介紹了以下內容:
對局勢的總體描述進行總結的場景,在整個游戲2-4中大致相同,而游戲1開始于當地沖突的后期階段。
戰略前提(這部分在游戲1中不夠精確,見下文)。
對現有部隊結構的描述(作戰順序)。
一組政治/軍事目標或玩家在游戲中要達到的目標。雖然這些目標是松散的現實的,但它們是有目的的沖突,以便玩家在追求解決方案時訴諸暴力(在游戲1中,玩家可以自由地追求他們為自己制定的任何目標)。
作為游戲2-4的起點,各小組的任務是制定一個簡化的行動設計,并根據他們的目標確定他們的首選最終狀態。這由白方小組收集并用于分析。每個游戲在7-8小時的時間范圍內包括三到五個回合。
在游戲1中,各小組被要求決定一系列的行動和步驟,這些行動和步驟在全體會議上口頭提出,并在包括白方小組在內的所有參與者中討論。每次全體會議后,白方小組根據他們對事件進程的主觀意見和想法對沖突進行裁決。
在第2-4輪游戲中,玩家的任務是寫下他們的行動或舉動,并解釋為什么會成功,這符合矩陣游戲方法。在這次分組討論中,各小組被允許使用"外交手段 "進行互動。這些行動和舉動通過電子郵件發送給白方小組,然后在全體會議上按照預定的順序提出。支持和反對這些行動成功的論點在全體會議上提出并討論。戰斗行動員的動作需要裁決,并在全體會議結束時寫下來供白方小組評估。白方小組裁判員確定了可能的結果及其概率。然后通過擲骰子對結果進行裁決。每次全體會議后,主持人都會更新一張大的態勢圖,并提交給各小組。
由于兵棋推演的目的是探索在挪威境內或附近的盟軍行動,我們需要代表挪威、挪威的盟軍和俄羅斯的角色或行動者,作為未來可能對挪威造成威脅的一個相關例子。
所扮演的角色是挪威、美國、北約(不包括挪威和美國)、戰略級俄羅斯、俄羅斯北方艦隊,以及瑞典和芬蘭的組合。在第一場游戲中,俄羅斯只代表一個角色,而瑞典和芬蘭則沒有代表(見下文)。北方艦隊是一個獨立的角色,因為他們并不被迫聽從戰略級俄羅斯的命令。我們使用了兩個俄羅斯角色,試圖平衡對立雙方。見圖1。
在游戲期間,我們收集了選手的意見,記錄了裁決,并討論了由此產生的CoA。作為總結的一部分,收集了經驗教訓并確定了知識差距(見下文)。每場比賽都有一份單獨的報告。
在我們的游戲中,我們使用了不同的場景,其中沖突起源于世界的其他地方,并橫向升級到高北地區。在游戲1中,對場景和角色的目標進行了松散的描述。游戲者開始時的情況是,俄羅斯試圖保護他們的第二打擊能力--位于科拉的彈道核潛艇--并攻擊挪威領土,以便在他們的防御位置上創造更多的深度。由于定義松散的場景和缺乏關于基本前提的信息,這個游戲很難玩。比起盟軍的行動,我們更了解我們在設計戰爭游戲方面的不足。我們將在下面討論在這樣的游戲中正確定義基本前提的重要性。游戲1的主要目的是確定需要進一步調查的問題和議題;從這個意義上說,這個游戲是成功的。
在游戲2-4中,我們使用了一個俄羅斯和北約在黑海地區進行戰斗行動的場景。俄羅斯正在尋求減少土耳其對敘利亞的壓力,沖突可能會橫向升級到波羅的海地區和北部高地。這些游戲有明確的目標和相關角色的戰斗命令,以及關于使用核武器、瑞典和芬蘭的立場和其他參數的基本前提。
在這些游戲中,人們反復觀察到,玩家的行動很少引發軍事戰斗行動。由于我們的目標是關注盟軍在高緯度地區沖突中的軍事作戰方案和能力需求,這是一個問題。沖突雙方的玩家都動員起來,把部隊移到北方的潛在沖突地區附近,但有幾個玩家試圖避免在該地區發生全面戰爭。
為了引發沖突,白方通過不同方式引入潛艇事件進行干預。在其中兩場比賽中,一方的 "流氓 "潛艇在另一方的大本營附近被發現,這使沖突按主持人的意愿升級。在第四場比賽中,場景從一開始就稍有改變,有一艘失蹤的潛艇,并修改了目標,試圖引發一場沖突。有點令人驚訝的是,這把游戲變成了一個危機管理游戲,所謂的敵人為了找到潛艇而合作。同時,雙方都調動了自己的力量,為可能的升級做準備。
在游戲中,挪威的陸地領土只在很小的程度上受到影響。用于向其他地區投射力量的空軍和海軍基地是個例外,這些基地受到了遠程精確武器的攻擊。另一方面,該地區的島嶼是有吸引力的目標,兩個主要政黨的陸軍在兩個不同的游戲中分別控制了冰島和斯瓦爾巴群島。無論如何,大部分活動是在海上進行的,包括海面以下和海面以上,有海上和空中力量。除此之外,雙方都強調在網絡領域的攻擊,并對對方后方的后勤和基礎設施進行破壞。雖然我們對可能的行動方案有了一些想法,但在量化能力需求方面,我們仍有很長的路要走。然而,我們已經發現并隨后填補了一些知識空白,并且更接近于讓正確的主題專家參與進來,并接近于我們改進對聯盟相關能力需求分析的最終目標。
同樣重要的是要意識到,我們只是從非常多的作戰方案中扮演了幾個樣本,而且我們顯然不能用我們的觀察來預測真實場景會如何發展(見下文)。請注意,這種預測并不是我們進行場景分析的目的;我們的最終目標是確定對場景變化具有穩健性的能力需求。
清楚地傳達游戲的目的和目標是很重要的,而我們在讓玩家與我們的意圖保持一致方面做了很多努力。這可能是因為一些參與者沒有軍事行動的場景分析經驗,但有危機管理游戲的經驗。一些參與者試圖避免升級和使用軍事力量,盡管這是白宮明確表示的意圖。
關于這個問題,我們在作戰和戰略層面的混合游戲中并沒有幫助。這種混合的好處是,主要在戰略層面思考的玩家有軍事行動工具可以使用。這讓選手們對這兩個層面都有了有益的了解。問題是,游戲參與者的任務是實現政治性的目標,同時被期望采用相當詳細的作戰順序。目標和手段之間的矛盾可能使白軍更難實現他們的意圖。許多玩家對作戰順序所提供的詳細程度感到不舒服。在某種程度上,詳細的作戰順序也將人們的注意力引向了詳細的戰術層面,玩家可以更多地考慮整體的CoA。由于總的意圖是學習軍事行動方案,玩家的目標可以用軍事行動術語而不是政治層面來給出。
在兵棋推演系列的過程中,我們學到了很多關于如何引入場景,以使玩家適當地參與到場景中。然而,即使是在第四場比賽,即該系列的最后一場,事件也出現了意想不到的轉折,因為白方小組引入了本應是沖突的觸發器,使游戲變成了合作式的搜救游戲。對于如何介紹這個場景,以使玩家與白方小組的意圖保持一致,我們沒有任何方法,只知道要注意這些困難。
在我們對挪威長期防御規劃過程的支持中,我們使用了通過形態分析開發的場景組合。通過我們上面描述的兵棋類別,我們可以改進我們的方法--從對定義場景組合的參數和組合的更好理解到確定場景中的作戰方案和能力需求。我們既發現了可能的新參數組合,也發現了已經定義的參數組合中缺失的場景。
例如,在我們的系列兵棋推演中研究的大國之間的沖突類型中,挪威和挪威的國防可能對大局沒有什么影響。然而,這樣的場景對挪威部隊的發展會有重要影響。我們從游戲中得到的經驗是,我們需要開發更多的場景,使挪威卷入這種并非由任何對挪威領土或挪威部隊的攻擊所引發的、我們的聯盟與對手之間的沖突。我們現在已經開發了一些技術,將這類場景納入我們的場景組合中。
我們發現的另一個重要問題是,場景中的時間線難以確定。聯盟需要多長時間才能到達?他們將到達哪里?以及用什么力量?對于挪威武裝部隊的能力需求,不同的答案可能會導致非常不同的結論。這一點可以通過敏感性分析來探討,在新的或現有的情況下,改變一些關于時間、地理和部隊的參數。
在第一場游戲中,我們想確定在方法論開發和分析工作中必須解決的盟軍行動的各個方面。基本問題很簡單:"關于盟軍行動,我們不知道的是什么?" 這導致我們以一種非常松散的 "看看發生了什么 "的方法來進行游戲,這導致了關于參數將影響盟軍在北方的行動的方式討論。場景中有許多隱藏的條件,我們預計這些條件是明確的或不重要的,但結果卻是模糊的和至關重要的。由于存在未定義的戰略因素,玩家們無法確定最佳作戰方案。因此,主要結果是對基本前提的重要性有了更好的理解。
在第一場比賽中,缺少基本前提的一個例子是瑞典和芬蘭的角色和態度。進入瑞典和芬蘭的領土和領空將大大增加盟軍的選擇,但這將取決于瑞典和芬蘭的合作。沒有代表這些國家的玩家,我們也沒有確定他們在劇情中的位置。這一疏忽可能是由于白宮的一個隱含假設,即這些國家將站在挪威及其盟國一邊。然而,在現實世界的未來局勢中,他們的立場將取決于他們對嚴重卷入一場他們可以避免的沖突的恐懼,以及他們如何重視與挪威和挪威盟友的良好關系。
因此,在第一場游戲之后,我們建立了一個戰略因素清單,我們需要在接下來的游戲中明確這些因素。這些因素包括每個參與者的明確目標、技術因素、公眾輿論以及當地游戲場外的事件(特別是玩家是否需要在其他場域的沖突中平衡其軍事努力)。
非明確的基本前提的問題比兵棋推演的背景要普遍得多。當決策者評估有關他們選擇的現有信息時,他們依賴于陳述的清晰性和透明度。行動員有責任知道并傳達結論和建議所依據的假設。這表明了它們的有效性。決策者的責任是判斷這些方案是否對基本假設的變化有足夠的把握。這是一種風險判斷。
全面記錄所有的基本假設是不可行的。有一些假設是非常確定的,以至于把它們繪制成圖表是沒有意義的。也會有一些不太確定的假設,在這些假設中,失敗的后果不足以證明需要付出的努力。我們必須確定那些有影響的、很可能會失敗的假設。
我們永遠不可能知道是否還有一些我們尚未明確的重要假設。但對這一問題的關注應能提高分析的深度和適用性。
因此,我們看到,第一場比賽的經驗告訴我們,在分析中要更小心地避免隱含前提。我們認為,這對任何參與武裝部隊發展的人來說都是重要的一課,從國防教育課程畢業的軍官應該習慣性地以關注基本假設的方式來迎接任何分析。此外,我們認為,兵棋推演的形式,即玩家被迫根據現有的信息來選擇他們的行動,暴露并強調了這種關注的重要性。
正如導言中所討論的,無論是個人還是團體,都很難評估自己的知識。盡管一個人可能認為自己了解盟軍的軍事行動,但當他的知識受到考驗時,錯誤的觀念和缺乏的信息會浮現出來。在安全的兵棋推演環境中發現這些知識差距,比在聯合總部尖銳的計劃情況下發現這些差距,或者在基于錯誤建議的決策產生不良結果時發現這些差距要好。
在我們的兵棋推演系列中,一個重要的例子是,參與者,其中大部分是民間分析家,并沒有真正理解涉及航空母艦和航母編隊的行動。我們的分析員通常研究挪威軍隊,對他們來說,航空母艦的能力有點異乎尋常。然而,正如我們的游戲所顯示的,如果我們想了解挪威部隊可能參與的未來盟軍行動,盟軍將這種能力部署到我們的地區作為當地情景的一部分是一種可能性,我們需要考慮到這一點。
另一個在兵棋推演中更明顯知識差距的例子是,從敵人手中奪回土地的行動性質將涉及兩棲攻擊。此外,多種技術性質的未知因素也影響了我們的兵棋推演。這方面的例子包括不同類型飛機的作戰范圍,以及導彈攻擊以地基防空系統防御的空軍基地的效果。
這種知識差距有兩種情況。一方面,有一些導致我們從外部來源尋求更多的信息。它們與 "X是如何工作的 "這一問題有關。在這種情況下,X可能是一個軍事系統(例如一個航空母艦群),也可能是一個一般的作戰概念,如兩棲作戰。另一方面,有一些知識差距導致我們以諸如建模或模擬更詳細的小插曲式子場景的形式進行進一步分析。
在我們的系列兵棋推演中,我們利用每場游戲的觀察結果,建立了進一步調查的議題清單,直到下一場游戲。我們通過查閱文獻和創建簡單的事實表來解決其中一些問題。對于一些概念性的議題,我們在下一次游戲前舉行了簡報會,由我們小組中指定的事實核查員,或邀請的專家來進行。此外,我們還確定了一些戰術小故事,我們計劃對其進行更詳細的研究,以改進我們基于能力的分析。
了解自己的洞察力的局限性是很重要的。對于軍官來說,一個尖銳的計劃情況可能會包含與以前的行動和演習不同的因素。我們已經看到,我們的兵棋推演成為識別我們知識差距的工具,否則這些差距可能會被忽視。這導致了知識的發展,使我們的工作有了更堅實的基礎。當然,一個人不可能填補所有的知識空白--但兵棋推演作為一種評估自己知識的方法,應該引起官員們的興趣。
根據定義,基于場景的分析與不確定性有關。從一些確定的初始條件出發,情況的發展可能會有巨大的變化。像我們在這里討論的那些兵棋推演,每次只能探究其中的一種延續。因此,兵棋推演的結果只代表一個樣本結果。更嚴格的結果,如果可以得到的話,需要隨機模擬和仔細建模。
基于兵棋推演的信息的有效性可能會被高估,除非清楚地了解游戲中的作戰方案在多大程度上代表了可能的情況。從兵棋推演中過度歸納的危險很大;觀察到的結果可能在很大程度上取決于玩家的任意選擇、隨機裁決或玩家的個性和偏好。在我們的游戲中,我們確實觀察到某些玩家更愿意進行先發制人的進攻,而其他玩家則更注意不要升級。由于游戲之間的隊伍被洗牌,這對事件的進程產生了重大影響。
由于兵棋推演可以揭示出在真實情況下應該避免的風險和其他弱點,因此它們可能更適合于發現事情不應該發生的方式,而不是它們會如何發生。
提供決策支持的分析人員必須意識到這些問題--但決策者也有必要認識到這些問題。有了從這種兵棋推演中獲得的第一手經驗,人們可能就不太相信兵棋推演可以為真實情況的發展提供明確的答案。
支持國防事務決策的分析工作往往非常復雜。這樣的工作必然涉及到許多人,其中沒有一個人對整個主題有深入的了解。首先,參與者必須對自己的責任領域有深刻的了解。然后,他們需要充分了解他們的同事的情況,以便相信結果,并理解其對自己工作的影響。
國防分析中的兵棋推演的一個優點是,它是一種讓人們參與其中的方式。因此,需要注意的是,雖然主題知識,特別是軍官的主題知識,在FFI的工作中至關重要,但可能很難有效地獲得這些知識。主題專家(SMEs)和分析員必須有一個共同的參考框架,以便相互理解。兵棋推演提供了一個集中討論的舞臺,在這里,適當的背景和規則是被迫的。
我們的兵棋推演提供了一個機會,作為一個由作戰分析員、軍官、安全政策專家和技術專家組成的小組,共同探討各種場景。兵棋推演的形式為討論提供了一個共同的參考框架,并幫助我們理解整個分析拼圖,而不僅僅是我們自己的碎片。
基于場景的分析經常受到那些沒有參與分析過程的人的懷疑。兵棋推演提供了一個讓利益相關者和結果使用者參與的舞臺,幫助他們信任和理解游戲中產生的分析結果。作為一個積極的參與者,他們將更好地理解結果的影響和局限。
一系列兵棋推演讓我們學到了很多關于如何改進我們對聯合總部的長期防御計劃和作戰計劃的分析支持。我們利用兵棋推演發現了我們對軍事系統和行動的知識不足之處,并揭露了以前想當然的錯誤觀念和結論。我們也已經能夠改善我們的場景組合應對對軍事威脅環境。此外,我們現在更好地理解了如何描述決定基于場景分析結果有效性的一些因素。
雖然我們還沒有修訂未來的能力要求,但我們現在能夠更好地邀請外部專家和利益相關者參與兵棋推演,為導致修訂要求的分析活動作出貢獻。因此,整個內部系列可以被看作是測試更有影響的游戲的一種方式。
兵棋推演不僅僅是讓有知識的人參與進來和探索場景中的可能性的絕佳方式。它是了解計劃中風險和弱點的好工具。但應該注意的是,我們所使用的這種形式的矩陣游戲不一定適合于預測或獲得關于場景如何發展的確定信息:自由度實在太多。對于分析人員和依賴分析支持的決策者來說,理解這些限制是很重要的。
特別是,我們認為,在使用基于場景進行分析的官員需要接受培訓,以識別基本假設和結果的有效性是否得到充分的描述。對兵棋推演的親身體驗可以讓人更好地理解這一重要性。
兵棋推演提供了一個通過實驗學習的機會,探索可能性,發現知識的差距和局限性,挑戰當前的觀點,并理解不確定性。
現代戰術戰爭需要迅速而有效的決策和行動,以便在經常是高度動態和復雜的戰區保持競爭優勢。需要考慮的因素的數量因不確定性、事件的快速發展和人為錯誤的風險而放大。自動化、人工智能和博弈論方法的潛在應用可以為作戰人員提供認知支持。這項研究以自動兵棋推演輔助決策的形式探索了這些應用。該團隊為這個未來的系統開發了一個概念設計,并將其稱為兵棋推演實時人工智能輔助決策(WRAID)能力。
頂點項目的目標是探索自動化、人工智能和博弈論的應用,作為支持未來WRAID能力的方法。該團隊為WRAID能力開發了需求、概念設計和操作概念。該小組確定并探索了可能對未來實施WRAID能力構成障礙的挑戰性領域。該小組調查了與使用人工智能來支持戰爭決策有關的倫理挑戰和影響。
本報告首先對與WRAID能力相關的主題進行文獻回顧。文獻回顧從人工智能的回顧開始,提供了一個關于人工智能如何工作以及它能夠完成什么類型任務的概述。文獻綜述探討了人機協作的方法,以支持未來指揮官和人類用戶與WRAID系統之間的互動。需要翻譯指揮官的意圖,并讓WRAID將有意義的輸出傳達給指揮官,這需要一個強大的界面。審查包括傳統的兵棋推演,以研究目前的模擬兵棋推演是如何進行的,以便深入了解,未來的WRAID能力如何能夠實時復制兵棋推演的各個方面,并認為以前的兵棋推演可以為人工智能和機器學習(ML)算法的發展提供訓練數據。ML算法的訓練需要大量的代表性數據。文獻回顧研究了人類的認知負荷,以深入了解人類大腦的認知技能和上限;并確定人類思維的極限,以顯示人工智能可能提供的支持。文獻綜述中涉及的最后一個主題是,傳統的計劃和決策,以了解目前在軍事上如何制定戰術行動方案。
該小組進行了需求分析和利益相關者分析,探索WRAID能力如何支持作戰人員。該小組在需求分析的基礎上為WRAID系統開發了一套需求。這些要求被歸類為:硬件/軟件,人機界面,和道德規范。第一階段的分析結果包括 (1)戰爭的復雜性需要發展一種未來的WRAID能力,這種能力利用自動化方法,包括人工智能、ML和博弈論,(2)WRAID能力需要大量的計算能力和復雜的軟件算法,(3)實現未來WRAID系統的挑戰將是技術和道德的。
未來WRAID系統的概念設計是基于需求分析的。概念設計被記錄在一套系統模型中,包括背景圖、系統視圖、功能工作流程圖和操作視圖。該團隊開發了一個作戰場景,以支持對WRAID能力如何在作戰中使用。
在開發WRAID的過程中,預計會有一些路障。開發WRAID系統的技術是存在的,然而,研究小組發現數據挑戰、人工智能訓練、程序限制和當前系統工程的局限性將是需要解決的障礙。數據挑戰指的是獲得足夠的數據集的能力,這些數據集代表了訓練ML算法所需的真實世界的戰術行動和兵棋推演分析。程序性挑戰包括國防部實施網絡安全、機密數據、數據庫訪問和信息分配協議的能力。系統工程方面的障礙是需要新的方法來設計安全和可靠的人工智能系統,如WRAID能力。將需要SE方法來處理不可預見的故障模式,并在系統生命周期的早期確定根本原因。
對像WRAID能力這樣的人工智能系統的倫理考慮是系統發展的一個重要因素。開發系統以取代倫理學,將使系統更有可能被部署。有幾個有道德問題的自主武器系統被拉出來作為WRAID能力的道德對話的基礎。通過一個示例場景,對道德狀況進行定性分析,以了解在部署WRAID能力時可能出現的道德問題。倫理學在未來的技術中發揮著巨大的作用;從一開始就考慮到倫理學,建立技術是很重要的。
未來的重點需要放在繼續對想象中的WRAID系統采取正規的系統工程方法。WRAID系統需要一個強大的數據集,需要收集和注釋;收集的定性兵棋推演數據越多,WRAID系統的可行性和準確性就越高。與軍事部門的合作對于最大化WRAID的利益至關重要,例如情報和偵察組織。WRAID的模擬將是完善系統要求和創建現實模型的關鍵。關于如何使用WRAID的培訓和文檔應該同時開發,所以利益相關者,特別是指揮官已經準備好,知道如何使用這個新工具。未來的研究領域包括認知工程、基于正式模型的系統工程和人機協作。
隨著目前技術進步的速度和外國的目標,人工智能將在未來的沖突和戰爭中發揮作用。自上而下的指令將需要設計和實施WRAID能力:提供大量的資源,解決操作和文化變化,重組系統工程,并確保網絡安全和收購變化。實現未來的WRAID能力并不是一個微不足道的任務。然而,它對確保現在和未來的戰斗空間優勢至關重要。
軍事防御現代化規劃通常涉及復雜的系統,必須了解這些系統,以便為設計、規劃、實施和采購決策提供信息。為了獲得對系統的基本了解并確定關鍵的初始參數,仿真實驗可以用來在一個大型參數空間內有效地生成數據。雖然機器學習模型可用于模擬后的分析,以確定關鍵參數,但當目的是為決策者提供支持時,其可解釋性和黑盒性質會帶來挑戰。在本文中,應用了一種可解釋機器學習預測的模型診斷方法,稱為沙普利加和解釋(SHapley Additive exPlanations,SHAP),用于從基于Agent的模擬中獲得數據,該模擬是一個軍事作戰場景。該場景是由加拿大陸軍對其情報、監視和偵察資產進行現代化的舉措所激發的,并對其進行了抽象化,以盡量減少建模系統的復雜性并驗證SHAP的結論。
關鍵詞:基于Agent的仿真,數據耕耘,可解釋機器學習。
軍事防御現代化計劃通常涉及復雜的系統,必須了解這些系統,以便為設計、規劃、實施和采購決策提供信息--這些決策通常與數百萬到數十億美元的預算相聯系。例如,加拿大政府為實現加拿大武裝部隊(CAF)和國防部的密碼能力現代化,撥款范圍在2000萬到4900萬美元之間,為實現CAF輕型和重型后勤車輛能力的現代化,撥款范圍在10億到49.9億美元之間(加拿大政府2020)。
仿真實驗可以幫助對系統的基本了解,找到穩健的決策或方案,并比較不同決策或方案的優劣(Kleijnen等人,2005)。數據耕耘是指利用仿真實驗在一個大的參數空間內有效地增長數據,以支持決策。它是一個跨學科的協作過程,使用快速原型設計、仿真建模、實驗設計、高性能計算以及數據分析和可視化;詳細概述見Horne等人(2014)。數據耕耘過程可以幫助操作仿真模型,學習仿真模型的行為,并確定關鍵信息,包括輸入和輸出之間的因果關系(Sanchez 2015)。實驗設計應該是靈活的,以考慮不同的元模型、數據挖掘和圖形分析技術,因為通常一種單一的方法將不適合全面評估模擬輸出(Sanchez 2015)。
數據耕耘過程最早在20世紀90年代末提出(Horne 1999),此后被應用于海洋領域(Cheang 2016, Dobias and Eisler 2017, Morgan et al. 2018, Kesler 2019)、陸地領域(Kallfass and Schlaak 2012)、網絡領域(Horne and Robinson 2016)和多領域(Huber and Kallfass 2015, Gordon 2019)等各種軍事應用。數據耕耘已被用于研究各種類型的軍事行動,包括戰斗(Kallfass和Schlaak 2012)、人群控制(Kryza等人2012)、傷員疏散(Featherstone 2009)、空襲(Huber和Kallfass 2015)和國土安全,如關鍵基礎設施的保護行動、海洋環境中部隊保護的非致命武器選擇,以及城市恐怖襲擊的應急響應(Lucas等人2007)。
數據耕耘的挑戰之一是模擬后的分析和可視化。這一步的重點是突出有用的信息,提取結論,并支持決策,這需要高度有效的分析技術,以充分利用可能產生的大量數據(Horne等人,2014)。鑒于機器學習模型處理和評估大數據的能力,它們很適合這項任務。然而,許多機器學習模型的黑箱性質可能具有挑戰性,因為主要目標不是預測而是理解模擬。在以前的數據耕耘的軍事應用中,模擬后的分析往往側重于描述性統計(Huber和Kallfass 2015,Horne和Robinson 2016,Dobias和Eisler 2017)或描述性統計和可解釋性模型的組合,如逐步回歸和分區樹(Featherstone 2009,Kallfass和Schlaak 2012,Cheang 2016,Gordon 2019,Kesler 2019)。
與可解釋的模型相比,在黑箱模型中,如神經網絡或隨機森林,不可能直接有意義地檢查其組成部分并獲得洞察力(Ribeiro, Singh, and Guestrin 2016)。然而,這些更復雜的黑箱模型可以實現更高的預測準確性,在可解釋性和準確性之間形成了一種權衡(Lundberg和Lee 2017)。為了應對這種權衡,已經開發了模型診斷方法來解釋任何機器學習模型的預測。在最近的一個數據耕耘的軍事應用中,Amyot-Bourgeois、Serré和Dobias(2021年)對隨機森林模型的輸出應用了互換特征重要性,這是一種模型無關的方法。特征重要性措施表明每個特征,或數據耕耘背景下的模擬參數,在預測感興趣的結果方面的有用程度。識別重要參數有助于簡化決策過程,但除非能夠理解重要參數和感興趣的結果之間的關系,否則價值有限。SHapley Additive exPlanations(SHAP)提供了一種替代包絡特征重要性的方法,也可用于研究特征的價值與對感興趣的結果的影響之間的關系(Molnar 2021)。根植于博弈論的Shapley值,SHAP的計算要求是NP-Hard;然而,基于樹的機器學習模型有一個低階多項式時間算法,也可用于研究特征的相互作用(Lundberg等人,2020)。
本文擴展了Amyot-Bourgeois、Serré和Dobias(2021)的工作,將SHAP作為模擬后分析的一部分,以評估它是否能對一個模擬的軍事作戰場景提供有意義的解釋。在加拿大陸軍(CA)對其情報、監視和偵察(ISR)資產進行現代化的倡議的激勵下,模擬場景也對ISR支持穩定行動進行了模擬,但考慮了兩種ISR資產定位方案,并納入了一種額外的ISR資產類型。該場景在新西蘭國防技術局開發的基于Agent的模擬環境中實施,該環境被稱為地圖感知非統一自動機(MANA)。選擇MANA的部分原因是它的數據耕作能力,可以利用它在廣泛的參數選項空間內運行模擬。該方案在第2節有更全面的描述。關于模擬參數、實驗設計、指標和模擬后分析方法的細節將在第3節介紹。第4節介紹了仿真實驗和SHAP分析的結果。最后,在第5節中提供了一些結論性意見。
仿真場景是一個簡化的小插曲,它是為了證明利用ISR能力來支持加拿大軍隊的各種任務(加拿大公共工程和政府服務部2020)。它代表了一種情況,即加拿大軍隊將與一個多邊伙伴,如北大西洋公約組織(NATO),領導或促進國際和平行動和穩定任務,這是加拿大國防政策 "強大、安全和參與 "的核心任務之一(加拿大政府2017年)。地點是北約的一個成員國受到一個鄰國,一個非北約近鄰對手的入侵威脅。因此,受到威脅的北約成員國援引了北約第5條,并成立了一個北約聯盟來協助受到威脅的國家。北約聯盟(藍軍,BF)監視邊界,并與任何越境的紅軍(RF)交戰。
下面的表1列出了情景中包括的所有小隊,以及每個小隊的地形和初始位置的表述。紅軍試圖到達藍軍總部(藍軍 HQ)。當紅軍向藍軍總部推進時,它進入了藍軍邊境傳感器的探測和分類范圍。在MANA中,探測是指在某一位置感知到特工的存在,而分類是指將探測到的特工的忠誠度分為友軍(藍軍)或敵軍(紅軍)的行為。一旦探測到并被歸類為敵方,邊界傳感器就會將探測到的特工的忠誠度和位置傳達給邊界總部,后者則提示4、5和6小隊(列于表1)向確定的RF位置移動。4號和5號小隊的任務是與紅軍交戰,而由無人駕駛飛行器(UAV)組成的6號小隊的任務是持續跟蹤紅軍并提示藍軍總部進行間接火力支援。如果所有的紅軍都失去了能力,或者達到了最大的時間限制,模擬就會結束。
表1: 基于Agent的模型中每個小隊的描述和初始位置。
選擇用于參數化的自變量是藍軍邊界傳感器的數量、藍軍邊界傳感器的探測和分類范圍(稱為傳感器范圍)、藍軍邊界傳感器探測到的特工被正確分類為紅軍或藍軍的概率(稱為分類概率)、藍軍邊界傳感器對RF傳感器的隱蔽程度(稱為傳感器隱蔽性),以及藍軍無人機的數量。實驗設計遵循網格狀結構,每個設計點重復進行一百次迭代。表2顯示了參數的范圍。
仿真實驗首先進行,同時保持藍軍邊界傳感器的固定位置,如表1所示為雙傳感器情況,而對于單傳感器情況,則位于兩個傳感器之間的中點。然后重復模擬實驗,將兩個傳感器和單個傳感器隨機放置在與兩個固定的藍軍邊界傳感器之間的距離相對應的方框內(同時在雙傳感器情況下保持20個網格的最小分離距離)。在分析部分,這兩種配置的傳感器部署被稱為固定或隨機的傳感器位置。
表2:變量的參數化范圍。
仿真實驗的目的是評估傳感器組合(即給不同傳感器的配置參數,如表2所列)在情景中的性能。已經提出并監測了幾個指標來評估ISR資產的系統,如第一個探測步驟、所有紅軍坦克的平均探測步驟和探測范圍、探測到的紅軍坦克的比例,以及一些藍軍的生存能力和致命性指標(Amyot-Bourgeois, Serré, and Dobias 2021)。在本研究中,在監測到的指標中選擇了兩個衡量有效性(MOEs)的例子進行更徹底的分析:第一個檢測步驟和檢測到的RF坦克的比例。第一個檢測步驟是指從模擬開始到藍軍傳感器第一次檢測到紅軍坦克并將其分類的延遲時間(以用戶定義的時間步長為1到10,000步,后者是模擬的最大分配時間)。檢測到的RF坦克的比例是指至少被藍軍 ISR資產之一檢測到并分類的RF坦克與RF坦克總數的比率,在整個實驗過程中,該比率保持為10。
該場景使用MANA實現,MANA是一種對抽象表示有用的提煉工具(Anderson 2013)。MANA擁有數據耕耘能力,但可同時變化的參數數量限制在兩個,而且只能與相同的固定小隊相關聯。這使得我們無法使用MANA內部的數據耕作能力來生成各種設計點。然而,方案文件被保存為XML文件,不同的相關參數可以使用XML編輯器直接修改。整套設計點是用Python的ElementTree軟件包生成的,并保存為XML文件。仿真是使用高性能計算進行的,因為總的迭代次數上升到接近200萬次,而且事實證明并行化對減少計算時間很有用。然后用Python腳本處理所有迭代的輸出文件,以提取感興趣的MOEs,并將實驗結果整理成便于模擬后分析的格式。
在機器學習中,主要目標是根據一組特征變量來預測結果或目標變量。在數據農業的背景下,場景參數被視為特征變量,MOE被視為目標變量。根據目標變量是分類的還是定量的,機器學習問題被分別稱為分類問題或回歸問題。隨機森林是一種常見的機器學習模型,本研究之所以選擇它,部分原因是它被發現通常表現良好,只需要很少的模型調整(Hastie, Tibshirani, and Friedman 2009, 590)。隨機森林最早是由Brieman(2001)提出的,它由一大組通過引導訓練數據建立的決策樹組成。每次在樹中考慮拆分時,只有一個隨機的特征變量子樣本被認為是拆分的候選人。正是這個特征抽樣過程使樹去掉了相關性,導致這組樹的平均值比單樹模型的變量更少,更可靠(Gareth等人,2017,320)。然后,隨機森林通過多數票或樹的預測平均值對測試觀測值進行分類或預測。
本研究中關注的兩個MOE,即第一個檢測步驟和檢測到的RF罐的比例,是定量的目標變量。耕耘模擬數據以70/30的比例被隨機分成訓練和測試集。然后使用Python的Scikit-Learn軟件包的0.24.1版本(Pedregosa等人,2011)對隨機森林回歸器進行訓練和測試。使用隨機森林回歸器的默認設置,除了將分裂內部節點所需的最小樣本數增加到30,將葉子節點所需的最小樣本數增加到10,并將最大深度設置為10以限制單個樹的大小。在尋找最佳分割時,確定最大特征數的方法也從默認的使用總特征數改為使用特征數的(近似)平方根。在構建隨機森林時通常選擇平方根法(Gareth等人,2017,319)。為了評估隨機森林的回歸者,使用了決定系數(R2)。R2表示擬合度,是衡量未見過的觀察結果被模型預測的程度(Scikit-Learn, n.d., chap 3.3)。它的最佳分值是1,而0分表示一個恒定的模型(即一個模型總是預測預期的目標值,而忽略特征變量)。它也可以是負數,因為一個模型有可能比恒定模型的表現更差。
SHAP方法計算Shapley值,它基于聯盟博弈理論,代表了一個特征值與數據集的平均預測值相比對模型預測的貢獻(Molnar 2021)。SHAP值是局部解釋(即針對單個數據點),可以匯總起來解釋一個模型的全局行為(Lundberg等人,2020)。作為SHAP值的延伸,Lundberg、Erion和Lee(2019)提出了同樣基于博弈論的SHAP交互值,以直接捕捉成對的交互效應。由于隨機森林是一個基于樹的模型,使用Python的SHAP包中的TreeExplainer可以獲得計算SHAP值和SHAP交互值的高速精確算法(Lundberg等人,2020)。0.38.1版的SHAP包提供了一系列的圖形總結,包括SHAP特征重要性。為便于比較,還提供了互換特征重要性,它是用Python的ELI5軟件包0.11.0版本的算法計算的(ELI5, n.d.)。互換特征重要性類似于Brieman(2001)首次提出的用于隨機森林的方法。它通過確定當一個特征不可用時對模型性能(在本研究中用R2衡量)的影響來衡量其重要性。變量的去除是通過在測試集中用自身的隨機置換來完成的。
表3總結了每個MOE以及固定和隨機傳感器位置的隨機森林回歸器的性能。在所有情況下,隨機森林模型都明顯優于常數模型,后者的R2為零。對于第一個檢測步驟,固定和隨機傳感器位置的特征變量解釋了MOE中80%以上的變異。對于檢測到的紅軍坦克的比例,擬合度沒有那么強,固定傳感器位置的特征變量解釋了MOE中略高于60%的變異,隨機傳感器位置的特征變量解釋了MOE中略低于60%的變異。
圖1和圖2分別列出了第一個檢測步驟的排列特征重要性和SHAP特征重要性,以及檢測到的RF坦克的比例。這些方法在識別最重要的特征方面基本一致,盡管在某些情況下確切的排序有所不同,特別是在不太重要的特征中。在圖1(a)中,傳感器范圍是預測第一個檢測步驟的最重要特征。對于固定和隨機的傳感器位置,如果將傳感器范圍從隨機森林模型中刪除,R2將下降到零以下,表明性能比恒定模型差。在圖1(b)中,傳感器范圍也是最重要的特征。對模型輸出的幅度(即預測的第一個檢測步驟)的平均影響由SHAP值的絕對值的平均值給出。尺度與目標,即第一個檢測步驟的單位相同。在圖2(a)中,有兩個特征對預測探測到的紅軍坦克的比例很重要:無人機的數量和傳感器的范圍。請注意,這兩個特征的重要性順序對于固定和隨機的傳感器位置是不同的。在圖2(b)中,同樣的兩個特征被SHAP方法確定為最重要。請注意,在這種情況下,無人機的數量對于固定和隨機的傳感器位置都是排在第一位的。
表3:隨機森林模型的性能得分。
圖1:第一個檢測步驟的特征重要性總結
圖2:檢測到的紅軍坦克比例的特征重要性總結
雖然標準的特征重要性柱狀圖提供了關于一個特征的相對重要性的見解,但正如Lundberg、Erion和Lee(2019)所述,"它們并不代表該特征對模型輸出的影響范圍和分布,以及該特征的價值與影響的關系"。他們提出了SHAP總結圖作為替代方案,圖3顯示了第一個檢測步驟,圖4顯示了檢測到的紅軍坦克的比例。每個點代表一個設計點的SHAP值,并以相應的單個特征的值來著色,藍色代表低值,紅色代表高值。這些特征按其整體影響(即SHAP值的絕對值之和)排序。正(或負)的SHAP值表示與數據集的平均預測值相比,對預測(模型的輸出)有正(或負)的貢獻。
在圖3(a)和圖3(b)中,傳感器范圍的顏色的平滑漸變表明,隨著傳感器范圍的縮小,模型的輸出(預測的第一個檢測步驟)平滑增加。這種行為在模擬中是可以預期的:第一次檢測一般由邊界傳感器完成,當它們的范圍較大時,它們會更早地進行第一次檢測。當傳感器位置固定時,圖3(a)顯示,當有一個邊界傳感器(藍點)時,與有兩個邊界傳感器(紅點)時相比,第一個檢測步驟比平均時間早(負SHAP值)。對模擬的檢查也證實了這一結果:單個固定傳感器的位置傾向于與穿越邊界的紅軍坦克的路徑一致,使單傳感器的情況比雙傳感器的情況有優勢。在圖3(b)中,SHAP值的模式在傳感器的數量上幾乎完全顛倒。當邊界傳感器的位置在每次迭代中被隨機分配時,在固定傳感器配置中,單傳感器情況比雙傳感器情況的優勢被消除了。因此,在這種配置下,從單傳感器到雙傳感器情況下,傳感器區域覆蓋的增加更加有效,紅軍坦克路徑有更大的機會穿過兩個傳感器覆蓋的區域,而不是一個傳感器覆蓋的區域。
圖3:第一個檢測步驟的SHAP總結圖。
圖4顯示了探測到的紅軍坦克比例的SHAP匯總圖。無人機的數量是對全球影響最大的特征。對于這個特征,藍點代表沒有藍軍無人機的設計點,這降低了模型的輸出(預測檢測到的RF坦克的比例)。這種行為在模擬中是預料之中的:一旦藍軍無人機被觸發,它們就會被送到第一個探測到的RF坦克的位置,在跟蹤它的同時,可以探測到其他RF坦克。因此,擁有一些無人機與沒有無人機相比,可以增加探測到的紅軍坦克的比例。同樣,低傳感器范圍也會降低檢測到的紅軍坦克的比例。如圖3所示,較低的傳感器范圍與較晚的第一次檢測步驟有關,無人機在第一次檢測之前不會被觸發。雖然固定和隨機傳感器位置的三個不太重要的特征的排序不同,但傳感器隱身性的右尾巴長,但左尾巴短,表明在這兩種配置中,高傳感器隱身性可以明顯增加探測到的紅軍坦克的比例,但低傳感器隱身性并沒有明顯減少探測到的紅軍坦克的比例。這可以解釋為隱身性更強的邊境傳感器的生存能力更強,導致使用時間更長,有更多機會進行多次探測。
圖4:探測到的RF坦克比例的SHAP總結圖。
SHAP值側重于特征效應,而SHAP交互作用值則可以將特征效應分解為主效應和交互作用。與SHAP值一樣,SHAP交互值的全球影響也可以通過對單個SHAP交互值的絕對值進行總結。圖5和圖6分別列出了第一個檢測步驟和檢測到的紅軍坦克比例的這些總結。每個圖中的比例代表了特征交互作用的相對全球影響。在圖5中,對于固定的和隨機的傳感器位置,傳感器范圍和傳感器數量、傳感器隱蔽性和分類概率之間的相互作用影響最大。在圖6中,對于固定和隨機的傳感器位置,只有一種交互作用的全局影響遠遠大于其他交互作用:傳感器范圍和無人機數量的交互作用。基本的互動模式可以用依賴圖來進一步研究。為了說明這一點,圖7顯示了傳感器范圍和無人機數量的SHAP交互值。兩種傳感器配置的模式相似,并顯示了在可能的傳感器范圍內檢測到的紅軍坦克比例的明顯轉變。對于低于50的傳感器范圍,相對于沒有無人機,至少有一個無人機增加了檢測到的RF坦克的比例。然而,一旦傳感器范圍至少達到50,這種模式就會逆轉。這可以追溯到模擬中的行為:在另一個藍軍小隊或特工(即邊境傳感器或總部)檢測到至少一輛RF坦克之前,無人機不會參與。一旦邊境傳感器的探測范圍足夠大,無人機的額外探測能力對探測到的紅軍坦克比例的影響就會減少。
圖5:第一個探測步驟的SHAP交互值摘要
圖6:檢測到的RF坦克比例的SHAP交互作用值的匯總。
圖7:探測到的RF坦克比例的傳感器范圍和無人機數量之間的SHAP交互效應的依賴圖。
本文的目的是評估SHAP在基于Agent的模擬中的數據養殖上的使用,以改善軍事行動場景的模擬后分析。雖然機器學習模型,如隨機森林,非常適合于大數據,但當分析的主要目標是獲得對系統的基本了解以告知決策者時,其黑箱性質構成了挑戰。SHAP是一種與模型無關的方法,用于解釋任何機器學習模型的預測結果。TreeExplainer的作者Lundberg等人(2020年)提出,結合許多局部解釋(即SHAP值)可以保留 "對模型的局部忠實性,同時仍然捕捉到全局模式,從而對模型的行為有更豐富、更準確的表述"。
提出了標準的特征重要性柱狀圖,使用基于排列組合的算法和SHAP值進行計算,強調這些圖對模型行為的洞察力有限。雖然這兩種計算特征重要性的方法在確定預測兩個感興趣的MOE的前一或兩個特征方面基本一致,但SHAP總結圖、交互值和依賴圖對隨機森林模型的行為提供了更多的了解。SHAP總結圖顯示了模型的預測對不同特征值的變化(例如,隨著傳感器范圍的縮小,預測的第一個探測步驟平穩增加),并確定了極端值的影響(例如,高傳感器的隱蔽性可以大大增加探測到的紅軍坦克的比例)。SHAP的交互值和依賴性圖提供了進一步的洞察力,以了解所發現的兩個最重要的特征對探測到的紅軍坦克比例的綜合影響。SHAP還成功地識別了固定和隨機傳感器位置之間的關鍵差異,證實了在確定傳感器組合時,位置,而不僅僅是傳感器的數量,是一個重要的考慮。使用SHAP可以驗證所發現的見解,因為模擬場景被有意抽象化,以盡量減少其復雜性并保持對戰場動態的直觀理解。這意味著可以根據對實施的直接了解或通過在MANA中交互運行模擬來查看Agent的行為來確認這些見解。
雖然SHAP在改進模擬后的分析方面表現出了顯著的前景,但它解釋了在養殖數據上訓練的機器學習模型的預測。因此,它不是對模擬場景的直接解釋,在機器學習模型性能不強的情況下,可能產生誤導性的結果。對機器學習模型的適當訓練和測試仍然是模擬后分析的關鍵步驟。盡管如此,這項研究仍然可以用來向決策者展示數據農業的潛力,以及它如何利用抽象的模擬實驗幫助人們對一個復雜的系統有基本的了解。這在軍事現代化項目的早期階段可能特別有幫助;研究結果可以用來確定參數或選項,以便進行更詳細的研究。未來的研究將考慮更復雜的場景和更廣泛的機器學習模型。
MAUDE AMYOT-BOURGEOIS是加拿大國防研究與發展部作戰研究與分析中心的初級國防科學家。自2019年以來,她與加拿大陸軍作戰研究和分析小組的同事合作進行各種作戰模擬研究。Maude Amyot-Bourgeois在加拿大渥太華大學獲得物理學碩士學位。她的電子郵件地址是:[email protected]。
BRITTANY ASTLES自2021年1月起擔任加拿大國防研究與發展部作戰研究與分析中心的學生國防科學家。她之前的工作是利用機器學習研究全球恐怖襲擊趨勢和U型分形事件。她目前是地理學碩士的候選人,專業是數據科學。她的電子郵件是:[email protected]
多年來,加拿大國防研究與發展部(DRDC)一直通過一系列的研討會與軍事人員接觸,評估新興技術對概念、能力和投資的可能影響。本文概述了影響評估框架,該框架已被設計并用于調查一些新興技術的影響。該框架包括定量和定性的措施,以及支持任務所需能力要素的正式清單。該框架的應用通過幾個新興技術領域對加拿大陸軍能力要素的評估結果來說明。被評估的新興技術領域包括量子技術、超材料、人工智能、印刷電子學、人體性能增強、合成生物學、增材制造和其他許多領域。結果提供了關于哪些軍事能力領域和作戰功能將受到所審查技術的最大影響的見解。這種方法為部隊開發人員提供了額外的證據,并支持對能力發展計劃和技術路線圖的審查。
對技術、戰爭、政治和經濟之間關系的研究已經多次提出,未來必須在高度不確定的情況下做出決定。偏見塑造了國家和文化對如何預測未來的偏好。正如W.Chin所指出的,未來戰爭方面的文獻往往過度依賴明顯具有決定性軍事技術的簡單化概述[1]。
國防和安全的作戰環境不斷被競爭和沖突所塑造。雖然軍隊在評估未來作戰環境(FOE)的基礎上發展未來部隊,但它也需要評估趨勢和發展對能力的可能影響[2]。盡管大多數官方的FOE出版物包括對軍事力量的關鍵推論和高層影響,但仍然很少有既定的框架來評估新興技術在能力和概念發展方面的可能影響。
2017年,加拿大陸軍委員會批準將近距離接觸[3]作為未來軍隊(AoT)的頂點作戰概念。AoT是一個不斷發展的概念模型,說明加拿大軍隊在未來15年內應該如何配置、裝備和訓練。理想的AoT將被要求更加連接、敏捷、靈活、整合和強大。正如 "親密接觸"所指示的那樣,需要對政治、環境和技術變化進行持續的地平線掃描和觀察,以便對破壞性變化提供更好的預警[5]。作為風險管理戰略的一部分,部隊組建者需要了解技術發展以評估和利用潛在的機會。他們還需要預測和減輕他們在FOE中可能面臨的潛在風險、威脅和作戰挑戰。技術前瞻性和組織敏捷性是機構復原力的關鍵推動因素。技術優勢當然是任務成功的助推器,但創新文化和靈活的系統將是未來陸軍在作戰中成功的游戲規則。
一些軍隊已經采用了著名的基于能力的規劃(CBP)框架,該框架最初由Paul K. Davis[4]開發,用于支持能力和系統的長期戰略計劃。在加拿大,CBP于2005年被加拿大武裝部隊(CAF)采用。CBP是一種系統的部隊發展方法,旨在為最合適的部隊結構選擇提供建議,以滿足政府的優先事項。CBP過程評估了通過情景分析得出的能力目標。然后,通過對當前和計劃中的能力進行分析,確定并驗證能力的不足和過剩。它支持首選部隊結構的發展。CBP是一個使用場景的過程,這些場景松散地位于FOE中,以評估現有能力在多大程度上可以保持運作,并在不同場景下對任務的成功做出貢獻。CBP過程的主要結果是識別和記錄可能威脅到任務成功的能力差距和缺陷。CBP是關于評估現有軍事能力的準備程度、生存能力和維持能力。
傳統上,新興技術的趨勢是作為FOE的一部分來考慮的,從FOE中推導出一些情景來 "測試 "現有的軍事能力。評估新興技術的綜合方法需要考慮三種不同的應用背景。
機會:新興技術能否被塑造來解決差距和不足,提供新的能力或新的手段來實現效果?
風險:新興技術能否代表新的威脅,需要出口控制或技術保護計劃,加速我們自己技術的淘汰,或降低我們的能力?
環境:新興技術將如何塑造作戰環境?鑒于全球都能獲得新技術,我們在未來的物理和數字環境中會面臨什么?
CBP是在未來部隊結構的設計中創造機會和減少風險的藝術。
文獻中描述了在國防背景下評估新興技術的幾種方法。
顛覆性技術評估游戲(DTAG)是一種方法,最初由北約SAS-062和SAS-082任務組開發[6-8]。DTAG最適合于探索新興技術在軍事場景中的使用如何可能改變行動方案和結果。DTAG使用系統理念(IoS)卡,將幾種技術整合到一個新概念中。DTAG會議通過在軍事背景下進行基于場景的桌面兵棋推演演習,探索IoS的潛在好處。
從能力發展的角度來看,文獻中沒有證據表明,擬議的IoS卡得到了現有技術路線圖或技術趨勢分析的支持,這將有助于能力開發者估計一個新的 "系統 "在可預見的未來何時可以現實地出現和部署。DTAG會議的結果產生了新的技術應用概念,但它們缺乏技術趨勢分析和路線圖的支持,使能力開發者獲得的可操作信息有限。
澳大利亞陸軍采用了由國防科技集團(DST)的科學家開發的威脅、機會、弱點和優勢(TOWS)方法來評估新興技術對陸軍通用功能的可能影響。TOWS技術的描述見[9, 10]。TOWS技術將外部威脅和機會與一個組織的內部弱點和優勢進行比較。結果被用來定義一套行動,以保護組織免受威脅,并使其能夠利用機會。TOWS是專門為推斷行動和戰略而設計的。
表1:技術領域對軍隊一般職能的影響[10]
加拿大國防研究與發展部(DRDC)用于識別和評估新興技術的一些工具和技術已經在2015年的北約IST系列講座中進行了描述[11, 12]。目前,DRDC的計劃將這些工具和技術整合到科技(S&T)展望和風險評估的綜合方法中。圖1說明了從前景掃描活動到提供戰略建議的主要組成部分和邏輯流程。新興技術影響評估研討會每年進行一次,以評估新興技術對國防和安全能力、利益相關者和政策制定者的影響。
圖1:DRDC的科技(S&T)展望和風險評估計劃。
DRDC的科技展望和風險評估計劃的所有活動都是按照四步程序進行的,首先是進行前景掃描活動,以確定新出現的利益趨勢,然后收集和分析信息,以發展關于這些利益趨勢的技術情報。然后評估新出現的技術趨勢對國防、安全、政策和立法的可能影響。評估的結果被用來為計劃、能力和伙伴關系方面的決策提供信息。
在所有的未來情況下,任務的成功和有效性依賴于執行任務所需能力的可用性、準備性、穩健性和彈性。新興技術的潛在影響需要在所有作戰功能中進行評估,以確定哪些能力可能從中受益,哪些可能面臨風險。加拿大陸軍使用五個核心作戰功能:指揮、感知、行動、防護和維持
指揮 - 建立共同的意圖和管理指揮的必要結構和程序。作為一項作戰功能,指揮部是其他四項作戰功能的紐帶。指揮部是將所有作戰功能整合到一個全面的戰略、作戰或戰術層面的概念的作戰功能。
指揮部的運作功能由一些關鍵能力支持,包括:
表1:支持指揮職能的能力。
指揮與控制網絡 | 安全、穩健、多級和移動通信系統,允許在所有適當級別進行網絡化指揮。 |
規劃和決策支持系統 | 態勢感知(SA);協作規劃工具;建模與仿真 |
JIMP連接性 | 聯合、機構間、多國和公共 (JIMP) 連接 |
感知 - 一個單一的綜合實體,收集、整理、分析和顯示各級數據、信息和知識。戰術、行動和戰略資產被整合為一個單一的連續體。感知是為指揮官提供知識的操作功能。感知功能包含了所有收集和處理數據的能力。
“感知” 的操作功能由一些關鍵能力支持,包括:
表2:支持感知功能的能力。
地面傳感器網絡 | 雷達;光學 |
空中和戰略傳感器網絡 | 無人機;衛星;網絡 |
情報系統 | 圖像;信號;社會文化;地理空間;人類;開放源 |
行動 - 使用一種能力來影響整個沖突范圍內物質和道德領域的事件。行動反映了對各種來源的能力的整合--戰術、行動或戰略。行動是整合了機動、火力和信息戰的作戰功能,以達到預期效果。它是聯合火力和影響活動的結合,通過機動和對作戰環境的管理而同步和協調。
該法案的運作功能由一些關鍵的能力支持,包括:
表3:支持行動功能的能力。
火力 | 直接火力武器;間接火力武器;遠距離火力;聯合火力;定向能武器 |
機動 | 裝甲車;輕型車輛;自主系統;戰術空運;沿岸船只 |
信息作戰 | 電子戰;心理作戰;計算機網絡作戰(防御、攻擊、利用)。 |
防護 - 為促進任務成功而采取的部隊保護措施,通過管理風險和盡量減少人員、信息、物資、設施和活動在所有威脅下的脆弱性,維護行動自由和行動效率。防護是保護部隊、其能力和行動自由的業務職能。防護功能可以保護部隊免受常規和不對稱的威脅,適用于國內、大陸和國際行動。
防護作戰功能由一些關鍵能力支持,包括:
表4:支持盾牌功能的能力。
火災防護 | 保護基礎設施部隊、個人、車輛、武器、設備和物資免受直接和間接火災的傷害;戰斗識別(反自相殘殺) |
GBAMD | 地基防空和彈藥防御 |
避免爆炸性危險 | 簡易爆炸裝置(IED);誘殺裝置;地雷 |
化學、生物、輻射防御 | 防范化學、生物、輻射、核威脅;環境和職業健康與安全 |
保護免受心理威脅 | 反心理學行動 |
維持--產生、部署、使用和重新部署一支部隊所需的所有功能的組合。"維持"是支持行動的再生和維持能力的操作功能。
"維持"行動功能由一些關鍵能力支持,包括:
表5:支持維持功能的能力。
陸地設備系統 | 維修設施;前方維修;回收 |
材料和分配系統 | 總資產可見度;倉儲;供應;食品服務;陸路運輸;空運;集裝箱化 |
行政系統 | 財務服務;人事管理;停尸服務;牧師;法律服務;郵政服務;娛樂設施 |
衛生服務系統 | 醫療設施;傷員后送;醫療和牙科治療;醫療用品;健康報告;預防醫學(身體和精神)。 |
除了作戰功能外,還考慮了部隊生成能力。一些新興技術可能會影響到部隊生成的各個方面。例如,增強現實和虛擬現實技術正被越來越多地用于加速訓練。它們還為平臺的現場維護和修理提供了新的手段。在CA的背景下,部隊組建得到了一些關鍵能力的支持,包括:
表6:支持部隊組建的能力。
組織力量產生的結構 | 單位;旅;師;訓練機構;靶場和訓練區;總部 |
兵力投送 | 國家維持基地;戰略交通線;戰區維持(包括工程支持);空運;海運;APODs/SPODs |
通常情況下,新興技術影響評估研討會以一個或多個主題專家(SME)的展望簡報開始。中小企業有責任介紹該技術領域并描述其潛在的應用。他們還提供有關被審查的新興技術領域的新興趨勢和主要領導人的有用信息,以及對該技術目前的成熟度、限制、局限性和科學界面臨的挑戰的概述。
圖2:研討會過程。
根據中小企業提供的信息和個人的專業知識,研討會參與者被要求使用簡單的李克特量表評估新興技術領域對陸軍能力的潛在影響,從0(無影響)到7(非常大的影響)。評級過程確保參與者考慮到每個作戰功能的所有能力領域的影響。通常情況下,在考慮一項新興技術的潛在影響時,參與者已經想到了一個具體的能力領域。使用一個系統的能力評級過程,可以確保"不太明顯"的影響領域也在研討會上得到考慮和討論。
圖3:評級過程和尺度。
在研討會上,"影響"的定義是:解決現有的差距和缺陷;解決持久的問題(如士兵的負擔);改善現有的能力;引入新的概念和能力;破壞或否定現有的能力;使任務面臨風險(多種風險類別)。
在第一輪個人評估后,將結果提交給研討會參與者,以激發小組討論和辯論。小組討論提供了機會,以交流對新興技術的看法,要求中小企業提供額外的技術細節和清晰度,挑戰假設,并試圖填補 "高不確定性所固有的知識空白"。小組討論后,再進行第二輪評估。這種方法有助于衡量和減輕 "群體思維"的影響。
在研討會上收集的數據用兩種不同的方法進行分析。第一種是依靠DRDC的科學家在2006年開發的統計工具來進行多標準分析和排名共識(MARCUS)。MARCUS[14, 15]是一個產生共識結果的有用工具。MARCUS的特點之一是它能正確處理排名中的并列關系,能容忍不完整的排名,并在必要時允許單個排名在確定共識排名時具有不同的權重。
下面的例子顯示了小組討論前后評估的微小差異。在這個特殊的案例中,在小組討論之前,評估認為情報系統(5)將受到人工智能(AI)發展的最大影響。在小組討論后,與會者評估說,規劃和決策支持系統(2)將受到最大影響。
圖4:小組討論前后,MARCUS對人工智能應用在20種軍隊能力上的排名
用于分析數據的第二種定量方法是對所有參與者對每個能力領域的評分應用一個簡單的平均函數,如圖5所示。此外,在研討會期間還收集了參與者的定性評估,以便為個人評級提供額外的理由和背景。結果被用來確定哪些能力領域和作戰功能將受到所考慮的新興技術的最大影響(技術觀點),并確定哪些新興技術將有助于塑造整個作戰功能的未來能力(操作功能觀點)。自2014年以來,CA一直在舉辦一系列的研討會,以評估幾個新興技術領域的潛在影響。
如圖5所示,累積結果表明,支持指揮功能的能力將受到人工智能(AI)應用、人類性能優化和修改(HPO、HPM)發展以及量子科學(QS)應用的顯著影響。量子技術有望提供下一代的加密能力,可以提高指揮和控制(C2)網絡的安全性。
圖5:新興技術領域對CA運行功能的影響程度
結果還表明,在未來15年以上的時間里,支持理智功能的能力將受到幾種新興技術的顯著影響。人工智能(AI)的快速發展,以及量子科學(QS)、超材料(MM)和印刷電子(PE)的發展,將有助于塑造未來的感知能力。
對于支持行為功能的能力,結果表明它們將受到人工智能、文化行為模型(CBM)以及培訓、教育和演習5(TEE)新模式的影響。機動能力將大大受益于人工智能的發展,特別是在機器人、自主車輛和蜂群的應用領域,但也可以通過人工智能的增強現實技術為下崗士兵服務。量子傳感器的發展將提供更精確的定位、導航和定時(PNT)系統,以提高在GPS缺失環境下的機動能力。
支持防護功能的能力也將受到幾個技術領域的重大影響。材料科學和個人防護設備(PPE)設計的發展顯然將塑造未來的防火能力。化學和生物檢測和保護(CB DP)的進步將有助于增強或新的CBRN防御能力,同時合成生物學(SB)和人體性能優化(HPO)的發展也將有助于增強或新的CBRN防御能力。量子科學(QS)預計將提供新的傳感器,以實現對爆炸性危險的遠距離探測和規避。
在支持 "維持"功能的所有能力領域中,衛生服務系統是未來15年內變化最大的領域。合成生物學(SB)、人體性能優化(HPO)和改造(HPM)的發展,以及個人防護裝備、化學和生物檢測和保護(CB DP)的發展,培訓、教育和鍛煉的新模式,以及來自印刷電子(PE)的可穿戴和植入式傳感器,預計將對未來的衛生服務系統產生重大影響,前提是有適當的政策和立法。
年度新興技術影響評估研討會是支持能力發展和實施國防創新計劃的關鍵。它們匯集了科學家、學者、工程師、政策制定者、項目管理人員、法律顧問和軍事人員的專業知識。自2014年成立以來,新興技術影響評估研討會為國防能力、科技合作計劃和伙伴關系的戰略投資決策提供了信息。例子包括。
采用部門的量子科技戰略。
加拿大軍隊人工智能概念文件和技術路線圖。
提交給國防部(DND)"創新促進國防卓越和安全"(IDEaS)計劃的新的創新挑戰。
在新興技術領域的新FVEY活動,如超高分子量聚乙烯(UHMWPE)。
幾個國防和安全政策問題簡報。
對敏感技術和出口控制的系統性審查6。
任務的成功和有效性取決于用于實現效果的能力的可用性、準備性、穩健性和復原力。長期的戰略能力發展計劃需要識別和評估新興技術對所有作戰功能的潛在影響,以了解哪些能力可能受益于這些技術,哪些可能面臨風險。為了支持這種評估,我們設計了一個框架,其中包括定量和定性的措施以及支持任務所需的能力要素的正式清單。通過對加拿大陸軍能力要素的幾個新興技術領域的評估結果,說明了該框架的應用。自2014年第一次迭代影響評估研討會以來,累積的結果提供了寶貴的見解,即在未來15年內,哪些軍事能力領域和作戰功能將受到審查技術的最大影響。
表A-1: CA評估的新興技術領域
[1] Chin, Warren, “Technology, war and the state: past, present and future” International Affairs 95: 4, 2019
[2] Sullivan et al. Mad Scientist: Disruption and the Future Operational Environment Final Conference Report 25 July 2019
[3] Kaduck Anthony (LCol), Ron Bell (LCol), Peter Gizewski, Close Engagement. Land Power in an Age of Uncertainty, Kingston, 2017.
[4] Davis, Paul K., Analytic Architecture for Capabilities-Based Planning, Mission-System Analysis, and Transformation. RAND MR-1513
[5] Chapman B. and Gisewski P., Army 2040 Seminar. A Methodology to Address Capability Development in an Uncertain Future. 30th International Symposium on Military Operational Research (ISMOR), 2013
[6] NATO-SAS-082, Disruptive Technology Assessment Game. Evolution and Validation, RTO Technical Report TR-SAS-082, 2012.
[7] H. And?s, B. Damsgaard, G. Kindvall, E. R?nnberg, S. O. Solheim and M. Suojanen, Emerging Technology Concepts and Defence Planning in the Nordic Countries, FFI-NOTAT Eksternnotat 16/00336, 2016.
[8] G. Kindvall, A. Lindberg, C. Trané and J. Westman, Exploring Future Technology Development, FOI- R- -4196--SE, 2017.
[9] Pincombe B. and Dexter P., The Possible Effects of Potential Key Technological Developments on the Force Structure of the Australian Army in 2040. DSTO-GD-0862. 2014
[10] Dexter P. and Krysiak, K. “Assessing the impact of emerging technologies on the Australian Army”. 20th International Congress on Modelling and Simulation, Adelaide, Australia, 1–6 December 2013
[11] Auger, A. Emerging and Disruptive Technologies Impact Assessment. NATO IST 135 Lecture Series. STO-EN-IST-135. 2015
[12] Auger, A. Identification of Emerging Scientific and Technical Trends Using Scientometric Analysis. NATO IST 135 Lecture Series. STO-EN-IST-135. 2015
[13] Holland-Smith, D.J. On the Risk from High-Impact, High-Uncertainty Technologies. NATO IST 135 Lecture Series. STO-EN-IST-135. 2015
[14] Emond, E. J., Developments in the Analysis of Rankings in Operational Research. DRDC CORA TR 2006-37; Defence R&D Canada, December 2006
[15] Tania Yazbeck and E. J. Emond. Multi-Criteria Analysis and Ranking Consensus Unified Solution (MARCUS) -User Guide DOR(CORP) Research Note RN 2004/13. 2004
[16] Auger, A. Emerging and Disruptive Technologies Impact Assessment Workshop. Results from 2015, DRDC-RDDC-2016-L328, Ottawa, Oct 2016.
[17] Auger, A. Impact of Selected Emerging Technologies on Canadian Army Capabilities. Results from Emerging and Disruptive Technologies Workshop, Dec. 2017 DRDC-RDDC-2018-R152. May 2018
[18] Gunashekar S., et al. Oversight of science and technology. Learning from past and present efforts around the world. RAND Europe report, 2019. RR-2921
全域作戰 (ADO) 是美國軍事聯合概念的演變,旨在應對戰略對手,他們希望利用戰爭的新興特征來破壞和克服美國在日益復雜和全球戰場上的優勢。ADO作為一個概念很重要,因為它同時認識到作戰環境的復雜性以及對手打算如何在其中實現戰略優勢。這個概念描述了美國陸軍如何在鞏固成果的同時,使聯合部隊能夠防止、拒絕和利用對手。隨著多域作戰環境的出現和美國陸軍尋求在未來獲得并保持持久的優勢,繼續發展ADO概念將至關重要。
兵棋推演繼續作為軍事組織的一項關鍵職能和工具。兵棋推演工具根據玩家的決定,以不同程度的現實和抽象來模擬過程和后果。兵棋推演理論對美國陸軍領導力的開發至關重要,因為它提供了一個過程,通過抽象的機制將關鍵的決策還原成一個反復的過程,使人們能夠探索失敗并獎勵學習,以做出更合適的決策。兵棋推演是測試ADO概念的關鍵因素,也是培訓和教育未來領導力的關鍵方法。
ADO的關鍵是發展理解概念和作戰環境的能力。ADO推演允許領導者和軍事理論家學習和探索作戰環境,包括對手與美國和盟軍在作戰環境中的能力。設計一個關于ADO作戰概念的兵棋推演工具,可以創造一個框架,在這個框架內,領導者可以練習規劃、執行和反思關鍵因素。這篇論文提出了一個概念證明,即通過教育和培訓,重點關注陸軍的ADO規劃和執行的作戰方法,以促進未來的領導力開發。
戰爭是永遠存在的。在某種不同程度上,行為者總是為沖突做準備或參與沖突。戰爭的特征和現代戰爭的概念在時間上無情地向前推進。美國的戰爭專家和政策制定者主要認為,全域作戰(ADO)是未來的戰爭概念。全域作戰代表了美國軍隊在2020年和不久將來的現代聯合作戰概念和方法。這一概念將空中、陸地、海洋、網絡空間、電磁和太空領域整合在一起,進行跨時空的規劃和同步執行。ADO固有的復雜性要求領導者對跨領域的能力、規劃和執行有一定的了解。
從戰術層面開始的領導力開發路徑限制了聯合和作戰經驗。對ADO的理解和更好的執行需要領導者在經驗發展的早期學習規劃和實施新生的概念。到目前為止,真實世界的親身體驗是最好的,但很難復制,在聯合作戰中更是如此。兵棋推演提供了一個補充教育和培訓的工具,利用機械原理來幫助對問題和決策過程的理解框架。一個全面的兵棋推演工具對于ADO中未來作戰領導力的開發是至關重要的。
本報告的目的是展示兵棋推演如何為美國陸軍在ADO中的角色開發和領導力培養提供方法。該研究旨在為對ADO感興趣的領導人提供一個基礎,并通過兵棋推演進行開發和教育。本報告展示了兵棋推演如何模擬ADO的概念,以指導和促進教育。兵棋推演的目的包括跨越時間和空間,通過所有領域來規劃和管理軍事行動,同時在與ADO相關的各個階段納入作戰藝術和科學元素。兵棋推演模型應能適應任何場景,并采用模塊化設計,允許根據需要強調背景。設計者根據現有的作戰框架,通過在至少兩個主要對手之間的偶發階段來開發兵棋推演工具,從而實現反思和討論。本報告提供了一個概念證明,即作為進一步開發的基線Theatrum Belli,并解決了陸軍理論中關于兵棋推演的一個重要空白。
在陸軍兵棋推演中,ADO的概念和理論存在一個重大的空白。很少有現有的模型能以現代的方式將所有的五個戰爭領域都納入其中,以適當地呈現ADO的要素。此外,美國陸軍缺乏一個模擬的、標準化的模型來最好地描述從師到戰區陸軍在作戰層面執行 ADO。美國空軍和美國海軍目前正在開發一個以ADO為導向的兵棋推演,但仍然沒有納入大量的地面部隊。本報告提出了一種兵棋推演的設計,能夠在作戰層面上對ADO的規劃和執行的領導力進行教育和開發。鑒于該兵棋推演的主要目標,設計者必須承認該模型和研究的局限性。
第一手和真實世界的經驗是最好的學習環境。然而,在作戰層面為ADO創造一個真實世界的訓練環境,在時間、物質和人員上的成本可能是令人望而卻步的。兵棋推演是一個有明確目標的模型,它準確地描述了至少兩個對立面之間的一些戰爭要素。為了實現這個明確的目標,必須對設計的因素進行優先排序。該模型只模擬了現實和戰爭的某些部分,優先用于實現兵棋推演的目標。設計的細節越精確、越全面,它就越復雜。兵棋推演通常會犧牲不同程度的精確性來實現簡單性,以減輕參與者所需的時間和精力成本。設計的目的是在ADO上進行指導,這也帶來了其他的限制。兵棋推演可以通過多次迭代來教授類似的學習目標,但對現實的每一次抽象都意味著模型的應用在任何時候都只能解決這么多問題。
兵棋推演的獲取和可用性是對擬議的兵棋推演的關鍵限制。兵棋推演中的任何機密材料都會大大降低大多數專業軍事教育(PME)項目的準入門檻。由于缺乏機密材料,該設計不可避免地掩蓋了ADO固有的某些方面。這使得一個用于訓練和教育目的的模型能夠得到更廣泛的傳播,甚至可能包括盟軍部隊。此外,該模型的擴大傳播鼓勵了PME之外更廣泛的參與,這可以進一步創新和調整未來的迭代。除了所討論的本報告的局限性外,設計過程的范圍更好地定義了設計方法。
本報告的兵棋推演設計范圍提出了一個課堂環境的概念說明,以補充ADO的學習。因此,重點支持實現具體的學習目標,只需要教師和學生的必要時間和努力。一個兵棋推演如果吸收了太多的時間,無論是學習操作還是執行本身,對任何有時間安排的人來說都會成為一種負擔。為了解決參與者的注意力問題,兵棋推演的模式必須是高效和簡短的,但仍然包括促進學習目標的機制。教員通過兵棋推演來管理學生的注意力,并需要利用剩余的時間來發揮綜合作用,而不是讓學生筋疲力盡。為了補充高級軍事研究項目(AMSP)的課程,設計應該以研討會的環境為基線。這種形式可以擴展到旅以上梯隊的工作人員,在幾個小時內執行迭代,而不是全天的事務。設計的迭代性質適合于情節性的場景,參與者可以用默認的標準跳入和跳出場景,或者在不同的情節之間進行進展,以實現持續的連續性。這是對兵棋推演范圍的一般性介紹,本報告將在后面對其設計背后的理論作進一步的詳細說明。
本報告的引言闡述了論文和主要目的,確定了重大差距,以及兵棋推演設計的局限性和范圍。下一節涵蓋了所研究的文獻、理論、概念和以前的兵棋推演,以及它們對擬議設計方法的應用。
圖4. 在MDO框架中強調的軍事問題。
我們的同行競爭者,利用科學、技術和信息環境的新興趨勢,已經投資于挑戰美國和重塑全球秩序的戰略和能力。他們采用創新的方法來挑戰美國和盟國在所有領域、電磁波譜和信息環境中的利益。他們經常尋求通過在武裝沖突門檻以下采取模糊的行動來實現其目標。在武裝沖突中,武器技術、傳感器、通信和信息處理方面的進步使這些對手能夠形成對峙能力,以在時間、空間和功能上將聯合部隊分開。為了應對這些挑戰,履行美國陸軍在保護國家和確保其重要利益方面的陸軍職責,陸軍正在調整其組織、訓練、教育、人員和裝備的方式,以應對這些圍繞多域作戰(MDO)概念的未來威脅。
陸軍的情報工作本質上是多領域的,因為它從多個領域收集情報,而且可以接觸到合作伙伴,彌補陸軍信息收集能力的不足。在競爭中,陸軍情報能力作為掌握作戰環境和了解威脅能力和脆弱性的一個關鍵因素。在整個競爭過程中,陸軍情報部門為每個梯隊的指揮官和參謀人員提供所需的態勢感知,以便在所有領域、電磁頻譜和信息環境中可視化和指揮戰斗,并在決策空間匯集內外部能力。
這個概念描述了關鍵的挑戰、解決方案和所需的支持能力,以使陸軍情報部門能夠在整個競爭過程中支持MDO,以完成戰役目標并保護美國國家利益。它是陸軍情報部隊、組織和能力現代化活動的基礎。這個概念還確定了對其他支持和輔助功能的影響。它將為其他概念的發展、實驗、能力發展活動和其他未來的部隊現代化努力提供信息,以實現MDO AimPoint部隊。
陸軍未來司令部的情報概念為陸軍情報部隊的現代化活動提供了一個規劃,以支持陸軍2035年的MDO AimPoint部隊在整個競爭過程中與同行競爭對手進行多域作戰。它提供了支持2035年以后MDO AimPoint部隊的見解。這個概念是對2017年美國陸軍情報功能概念中概述想法的修改:情報作為一個單位在所有領域的運作,有廣泛的合作伙伴投入。這個概念擴展了這些想法,以解決陸軍在進行大規模作戰行動中的頭號差距:支持遠距離精確射擊的深度傳感。領導陸軍情報現代化的舉措是組織上的變化,以提供旅級戰斗隊以上梯隊的能力,以及支持深層探測問題的四個物資解決方案。
支持MDO AimPoint Force 2035的組織變化使戰區陸軍、軍團和師級指揮官能夠以遠程精確火力和其他效果塑造深度機動和火力區域。在戰區層面,軍事情報旅的能力得到提高,新的多域特遣部隊擁有軍事情報能力。遠征軍的軍事情報旅被重新利用和組織,以支持軍團和師的指揮官,而不是最大限度地向下支持旅級戰斗隊。
支持MDO AimPoint Force 2035的物資變化,即將所有的傳感器、所有的火力、所有的指揮和控制節點與適當的局面融合在一起,對威脅進行近乎實時的瞄準定位。多域傳感系統提供了一個未來的空中情報、監視和偵察系統系列,從非常低的高度到低地球軌道,它支持戰術和作戰層面的目標定位,促進遠距離地對地射擊。地面層系統整合了選定的信號情報、電子戰和網絡空間能力,使指揮官能夠在網絡空間和電磁頻譜中競爭并獲勝。戰術情報定位接入節點利用空間、高空、空中和地面傳感器,直接向火力系統提供目標,并為支持指揮和控制的目標定位和形勢理解提供多學科情報支持。最后,通過分布式共同地面系統,陸軍提高了情報周期的速度、精度和準確性。
伴隨著這些舉措的是士兵培訓和人才管理方法,旨在最大限度地提高對目標定位和決策的情報支持。從2028年MDO AimPoint部隊開始,陸軍情報部門將繼續改進軍事情報隊伍,以支持2035年及以后的MDO AimPoint部隊。
這一概念確定了陸軍情報部門將如何轉型,以支持陸軍和聯合部隊在整個競爭過程中與同行競爭者抗衡。
圖1 邏輯圖
拒絕和欺騙(D&D)技術利用錯誤信息和對手的認知偏差,長期以來一直是混合作戰的一部分。這種戰術給傳統上由人類分析員制作的情報、監視和偵察(ISR)產品帶來了不確定性和懷疑。在一個由人工智能(AI)擴散主導的未來戰斗空間中,算法生成的ISR產品數量可能會增加。因此,D&D戰術將越來越多地被顛覆人類而非機器推理的需要所驅動。對抗性機器學習(AML)的發展,即對欺騙性人工智能的研究,對未來混合作戰空間中的實踐狀態有重大影響。**本文回顧了對抗性機器學習技術之間的關鍵區別,以及它們對敵方對作戰人工智能的了解和訪問做出的假設。然后,我們總結了我們團隊最近與混合作戰有關的幾個對抗機器學習研究方向:對成像系統的物理對抗性攻擊,數據中毒攻擊,以及AML與設計強大的人工智能系統的相關性。
混合戰爭指的是使用顛覆性的、非軍事的手段來推進民族國家的利益,特別是俄羅斯近年來采用的技術,在不訴諸公開的、常規的軍事行動的情況下占領領土并影響各國的政治和政策[1]。所采用的混合戰術包括網絡攻擊、動員智能體團體采取行動、施加經濟影響以及其他秘密措施。由于混合作戰存在于常規軍事沖突和平民生活之間的 "灰色地帶",因此戰術上采用了拒絕和欺騙(D&D),通過利用民眾或敵對勢力的認知偏差來迷惑、威懾或影響理想的行為。D&D戰術在常規戰場上的歷史使用是有據可查的[3]。有效的D&D技術通過對依賴人類專家分析的軍事情報、監視和偵察(ISR)產品產生懷疑而獲得成功。在混合軍事行動中,情況不一定如此,在混合軍事行動中,D&D也可能試圖影響平民的看法。此外,隨著人工智能(AI)成為國家軍事投資戰略的重點(如[4]和[5]),以及商業信息技術部門越來越多地采用人工智能[6],人工智能在未來的 "灰色地帶 "可能會無處不在。因此,我們必須考慮在未來由人工智能的使用主導的混合戰斗空間中可能存在的D&D威脅。
當前的人工智能能力是由機器學習的進步所帶來的,特別是在深度學習這個子領域,在過去的10年里。機器學習(ML)涉及將系統的輸入映射到預測結果的問題,例如,將車輛的圖像映射到一個類別的標簽。通常情況下,這是在大型數據集中通過統計模式識別實現的。深度學習具體涉及到多層神經網絡的使用,它是具有數百萬自由參數的高度非線性回歸模型,作為模式識別的統計模型。雖然深度網絡在各種任務上的表現優于人類(最著名的是圖像分類[7]),但在諸如[8]和[9]等作品中觀察到它們容易被愚弄之后,對抗性機器學習(AML)領域作為一個活躍的研究領域出現了。許多作者指出,ML算法所犯的錯誤可能會在民用領域產生嚴重后果[10]-[15]。我們也認為必須提出類似的擔憂,即軍事人工智能系統在常規戰場和混合戰斗空間中的脆弱性。
本文的其余部分組織如下:第2.0節將提供關于對抗性機器學習的進一步背景介紹,以及我們認為目前在解決其與混合軍事行動的相關性方面存在的差距。在第3.0節中,我們描述了約翰霍普金斯大學應用物理實驗室(JHU/APL)目前正在進行的三項研究工作,以解決這些知識差距。最后,我們在第4.0節中做了總結性發言,并總結了我們到目前為止的發現。
圖 6. AI 開發周期(圓形流程圖)和采用機器學習的典型算法步驟(橙色大框)。
今天介紹的是美國蘭德公司、耶魯大學聯合發表于The Journal of Defense Modeling and Simulation: Applications, Methodology, Technology(國防建模與仿真學報:應用、方法、技術)期刊的論文“Artificial intelligence for wargaming and modeling”。
摘要:
在本文中,討論了如何將人工智能 (AI) 用于與擁有大規模殺傷性武器和其他涉及太空、網絡空間和遠程精確度的高端能力的國家發生沖突的政治軍事建模、模擬和兵棋推演武器。人工智能應該幫助兵棋推演的參與者和模擬中的代理人了解在不確定性和錯誤印象下作戰的對手的可能觀點、看法和計算。人工智能的內容應該認識到升級的風險,導致沒有贏家的災難,但也有可能產生有意義的贏家和輸家的結果。我們討論了對設計和發展的影響使用多種類型的 AI 功能的模型、模擬和兵棋推演。我們還討論了使用模擬、歷史和早期兵棋推演的理論和探索性工作為兵棋推演決策輔助工具,無論有無人工智能。
關鍵詞:
人工智能,兵棋推演,建模與仿真,認知建模,決策,深度不確定性下的決策,海量場景生成,探索性分析與建模