2021年4月13-15日,北約系統分析研究-151(SAS-151)工作組在陸基場景中基于兵棋推演了中間部隊能力(IFC)。IFC為任務規劃者和作戰者提供了在政治不順利的情況下,在無所作為和使用致命武力之間的響應能力。雖然IFC在概念上類似于非致命性武器(NLW),但它們實際上是在更廣泛的戰略和理論背景下進行的。它們旨在實現有效的升級/降級控制,并在戰術/戰役層面產生最大的影響。
這次推演特別重要,它是SAS-151用來評估IFC對影響任務成功的一系列推演中的第二次。第一次推演涉及北約海軍特遣部隊在一個封閉和有爭議的水道中受到的威脅,并模擬了IFC在海上特遣部隊行動中的使用。本次兵棋推演以海上兵棋推演的成功為基礎,探討中間部隊能力是否可以促進北約特遣部隊指揮官在陸基情景中應對復雜混合威脅的能力。
兵棋推演所使用的場景被設定為北約特遣部隊位于一個負責培訓安全部隊的東道國。四支隊伍(紅色紫色 Vs 藍色綠色盟友)在戰術層面進行兵棋推演。所考慮的戰術情況是藍(北約)/綠(東道國)聯合護行車隊的行動,涉及到敵對叛亂部隊在一個集市上的秘密伏擊,以及當地部隊阻止市民進出綠/藍聯合基地(見圖1)。
圖1.部隊、基地和集市的初始地理分布情況
在這個場景中,紅軍和紫軍使用了各種非常有能力的欺騙和秘密/灰色地帶戰術來阻礙和破壞北約特遣部隊的直升機、基地和車隊行動。這些能力和戰術使叛亂武裝具有明顯的優勢,被用于挑戰北約特遣部隊指揮官的決策。
兵棋推演還考慮了反人員(有目標的個人和人群)和反物資(主要是反無人機系統(c-UAS)和射頻(RF)車輛攔截器)的能力,評估了它們對實現戰術目標的能力影響,同時不影響作戰和戰略目標。
4月13-15日的兵棋最初是作為桌面兵棋進行的。然而,由于各國政府為應對冠狀病毒-19(COVID-19)而實施的旅行限制,決定使用WebexTM視頻和GoogleTM文檔/幻燈片(GoogleTM文檔用于團隊文本聊天,GoogleTM幻燈片用于地圖和游戲,并使用演講者筆記捕捉玩家的動作)的組合來設計和執行虛擬在線兵棋。利用這種虛擬環境,在4月13-15日期間進行了兩次陸上兵棋推演,并考慮了兩種IFC能力選項:選項A基準(無IFC)和選項B近未來IFC(預計未來五年的技術)。
第一場兵棋推演以方案A為基準,北約特遣部隊沒有任何IFC,只有一些傳統的NLW,如CS氣體(催淚瓦斯)和FN-303低致命性壓縮空氣防暴槍。
這些系統包括:主動拒絕系統(ADS);射頻車輛攔截器;手持式和安裝式無人機系統;增強型通用遙控武器(CROW)站(包括:激光炫目器、聲學呼救裝置和亮白燈);以及安裝式遠程聲學裝置(LRAD)。 這些IFC能力不僅可以用來騷擾和警告,還可以在對峙距離內攔截和削弱潛在的威脅。預計這將使北約部隊有更多的選擇來控制(升級/降級)局勢并控制戰略主動權。
總體而言,與海上兵棋推演一致,在使用和不使用 IFC 時,博弈動態存在明顯差異。兵棋推演系列的結果表明,IFC對戰術層面的游戲以及戰略層面的結果都有影響。在兵棋推演期間進行觀察的具體領域包括:升級控制;戰術決策的時間和空間;系統移動性;傳統的 NLW;獲得戰略主動權。
然而,有了IFC,藍軍有能力挑戰紅軍和紫軍造成的戰術困境(即,什么都不做或使用致命武力)。藍軍能夠校準其武力的使用,從而能夠控制事件的升級/降級。
有了更多的決策時間和空間,戰術指揮官就有了關鍵的決策時間和空間來選擇行動方案,以減少附帶損害和平民傷亡。IFC還創造了一種情況,即藍方可以壓制(通常用激光炫目器)紅方的行動,和/或隔離并識別紅方目標,以便進一步進行致命的交戰。
移動和分布式的IFC系統,如ADS(游戲中最通用和最有效的IFC系統),可以消除在幾次藍軍-紅軍交戰中使用致命武力的需要。消除或減少使用致命武力的需要可以減輕武力升級和平民傷亡事件,這兩種情況對特遣部隊在游戲中的努力非常不利。
遺留的無法律約束力武器難題:據觀察,遺留的無法律約束力武器和低致命性武器(如CS氣體)在兵棋推演中表現不佳。除了有限的人群控制做法外,它們的使用對實現控制升級和減少使用武力的總體任務目標沒有什么幫助(CS氣體尤其如此)。
IFC和戰略舉措:IFC的存在使北約和東道國部隊能夠壓制/削弱紅軍的行動,并在較小的即時/保守壓力下有選擇地使用武力。因此,對手在將無害的事件轉化為深刻和重要的信息戰方面不太成功。
綜上所述,北約部隊能夠在戰術層面上將主動權轉移到他們身上。IFC的存在為北約特遣部隊指揮官提供了更多的時間和空間來做出決策。有效使用IFC挑戰了對手的規劃,并減輕了武力事件的升級,特別是那些涉及附帶損害和平民傷亡的事件。
在這樣的環境中,對手(包括國家和非國家)將試圖利用戰爭與和平之間的作戰空間,并通過試圖將交戰保持在常規沖突的門檻以下來模糊軍事和非軍事行動之間的界限,在無所作為或使用致命武力之間有一類反應選擇是可取的。這一點更加重要,因為目前的應對方案在政治上可能不討人喜歡,使對手能夠掌握主動權并保持道德高地。
然而,正如SAS-151系列兵棋推演所顯示的那樣,發展使盟軍和聯軍(以及加拿大軍隊)能夠在沒有武裝對抗的情況下應對復雜的混合威脅的能力正變得越來越重要和必要。
展望未來,SAS-151系列兵棋推演的結果將被用來為北約IFC概念的發展提供信息,這是盟軍司令部轉型的一項優先概念發展活動。最重要的是,兵棋推演的結果將為未來的IFC兵棋迭代提供信息,其中已經計劃進行綜合建模和模擬,以幫助驗證IFC在復雜的多領域環境中的效果和概念。預計聯合作戰場景(已經開發)將被用于概念的完善和驗證,同時可以幫助驗證IFC在其他領域的有效性,如網絡和電子戰在多個領域。
Kyle D.Christensen是加拿大渥太華加拿大國防研究發展部作戰研究和分析中心(DRDC CORA)的戰略分析員,他目前為加拿大聯合行動司令部(CJOC)提供戰略分析建議。他以前的研究崗位包括葡萄牙里斯本的北約聯合分析和經驗教訓中心(JALLC)、加拿大渥太華加拿大聯合戰爭中心(CIWC)以及加拿大渥太華國防總部的海洋戰略局(DMS)。
這張照片被認為是公共領域,并已被批準發布。聯合非致命武器局(JNLWD)的主動拒絕系統(ADS)在進行反人員演示前被擺放好。圖片來源:Andrew Huff 來源:美國國防部聯合中級部隊能力辦公室(JIFCO),非致命性武器項目 //inlwp.defense.gov/Press-Room/Multimedia/Images/igphoto/2001730427/
這張照片被認為是公共領域的,并已被批準發布。長距離眼球干擾器(LROI)"激光炫目器 "在3000米的距離上提供警告效果,在2000米的距離上增加輻照度,以提供對目標的視覺壓制。圖片來源:Todd Getz 來源:美國國防部聯合中級部隊能力辦公室(JIFCO),非致命性武器項目
這張照片被認為是公共領域,已被批準發布。長距離眼球干擾器(LROI)"激光炫目器 "在3000米的距離上產生警告效果,在2000米的距離上增加輻照度,對目標進行視覺抑制。圖片來源:Todd Getz 來源:美國國防部聯合中級部隊能力辦公室(JIFCO),非致命性武器項目
這張照片被認為是公共領域,已被批準發布。聲呼裝置(AHD)將可理解的語音投射到更遠的距離。除了為警告或指導目的遠距離投射語音外,該裝置還能夠發射響亮的音調,以分散或阻止人員接近位置或船只。資料來源:美國國防部聯合中級部隊能力辦公室(JIFCO),非致命性武器計劃
本文是挪威國防大學學院更廣泛的研究和開發項目的一部分,該項目旨在探索各種兵棋推演和軍事演習的效用和潛力。這篇文章旨在激發對兵棋的使用和問題進行討論,并激發產生新的和更好的建議。因此,本文包含意見和學術思考。本文討論了兵棋推演、其多種不同類型、它們的實際用途,以及在使用兵棋以產生有用結果時出現的一些危險或陷阱。本文的目的是促進辯論,而不是給出任何明確的結論。
"兵棋推演"這個詞對不同的人意味著許多不同的含義。在某些情況下,存在著截然不同的解釋,從與軍事決策過程(MDMP;見CALL,2015)中的特定階段有關的極其狹窄的定義,到記者和大部分公眾傾向于將戰爭之外的所有軍事努力,包括現場訓練和計算機模擬,視為兵棋推演。這個詞有許多不同的使用方式,并帶有許多情感成見,這取決于相關人員的經歷。問題的一部分在于"'兵棋推演'沒有單一的、普遍接受的定義"(英國國防部,2020)。
即使是那些在專業基礎上參與兵棋推演的人,也很難接受現有的眾多定義,這些定義在定性技術和對更多分析性產出的定量要求之間可能有所不同。對于是否應該包括計算機模擬,或者 "兵棋推演"是否僅指人工技術,也存在分歧。有些人甚至不認可寫成 "war gaming"或"wargaming"。
與許多軍官一樣,我不關心學術定義的細枝末節,而更關心與我所承擔的任務有關的特定技術的有效性。我認為,任何 "兵棋推演"的定義都只能與兵棋推演所支持的具體任務和目的相關,而不是任何全面的概括。我還認為,試圖給"兵棋推演"下一個萬能的定義,不僅是徒勞的,而且實際上對更廣泛地采用這種技術來解決國防需求是有害的。因此,針對本文目的,我將以最廣泛的定義來使用 "兵棋推演",包括所有涉及人類決策者的教育、培訓和分析目的,但不包括實際戰斗。
兵棋推演是一種決策技術,它提供了結構化的、但在智力上是自由的、可以避免失敗的環境,以幫助探索什么是有效的(勝利/成功),什么是無效的(損失/失敗),通常成本比較低。兵棋推演是一個對抗性挑戰和創造性的過程,以結構化的形式提供,通常有裁判或裁決。兵棋推演是由玩家決策驅動的動態事件。除了敵對的行動者,它們還應該包括所有抵制計劃的 "反對 "因素。兵棋推演的核心是:
玩家。
他們做出的決策。
他們創造的敘事。
他們的共同經歷;以及
他們所獲得的教訓"。(英國國防部, 2020)
兵棋推演涵蓋了廣泛的方法和技術,旨在優化其與目標相關的產出,從那些旨在利用想象力、創造力和原創思維的方法和技術,到那些旨在支持軍事決策過程的方法和技術,以及那些旨在產生定量數據以支持采購和部隊開發的方法和技術。
由于這是一篇以實踐為導向的文章,關注的是兵棋推演在現實生活中的實際應用,以支持特定的任務和目的,因此也許值得花一些時間來闡述我自己作為一個兵棋玩家的實踐以及我過去在軍隊中舉辦訓練活動的經驗。我是1979年在桑德赫斯特皇家軍事學院開始接觸兵棋推演的,當時是在帕迪-格里菲斯(已故)的指導下,他是一位軍事歷史學家、兵棋家和多產的軍事歷史和戰術作者。在接下來的幾年里,我參與并幫助組織了許多大規模的兵棋推演活動,這些活動都是利用桑赫斯特的設施,由帕迪-格里菲斯和其他人負責。
有幾個不同的,往往是重疊的,你可能希望進行兵棋推演的原因。根據30年的經驗,我提供了一個主要原因的簡短清單,如下:
了解系統能力。
有效地了解態勢。
教育。
訓練。
當前部隊戰略或戰術。
未來部隊發展(包括作為采購過程的一部分)。
軍事決策過程的一部分。
了解團隊。
預測可能的未來。
了解系統能力。
2015年,我應邀在中國長沙的國防科技大學講授仿真和建模。作為一系列講座的一部分,我被邀請向軍校學生演示一個簡單的 "自由兵棋(free-kriegsspiel)"(一種很少或沒有書面規則的兵棋,裁決是基于一個高級裁判的經驗,而不是復雜的規則和程序)。這是在大學體育館進行的,由模擬學生充當裁判員(之前接受過技術培訓),同時進行25場10人的同一游戲。
我觀察到,中國學生傾向于尋找 "答案",而不是探索學習或自己思考,所以當一個學生質疑為什么有人會進行兵棋推演時,我選擇指導他們玩游戲,然后告訴我他們認為游戲的目的是什么。
在比賽中,關于戰術的討論非常少(以至于一個玩家在得知有炮火支援時,建議連續轟炸敵人的陣地,直到敵人死亡)。大部分的問題和討論都與武器的能力和效果有關。有人向我提問,如 "某個武器系統的有效射程是多少?",我回答說,作為解放軍的軍官,他們應該知道這些信息。這導致了許多討論、信息共享和對軍事手冊的研究。會議結束時,學生們一致認為,與死記硬背相比,這是一種非常高效和有效的信息教學方式。大多數人還同意,這顯然是進行這樣一個兵棋推演的主要原因。我并不反對。
與上述見解相聯系的是,約翰-康普頓博士3在2018年的 "連接美國 "專業兵棋推演會議上討論說,兵棋推演是向參與者介紹軍事態勢的一種極其高效和有效的方式。這是因為信息的呈現方式與它所處的環境直接相關,而且,由于它通常是通過發現學習的過程獲得的,所以它往往更容易在解決問題時發揮作用(Alfieri等人,2011)。這與我在英國常設聯合部隊總部工作時,在俄羅斯吞并克里米亞后,就波羅的海局勢進行的兵棋推演的經驗相吻合。
最終,我為總部的辦公人員就波羅的海局勢進行了四小時的矩陣游戲。游戲結束后,大家一致認為,游戲使參與者迅速掌握了不同的要素和關于當前局勢的重要背景。一位玩家說:"我現在知道了我所知道的,并理解了我不知道的,以及我需要研究的東西。一位J2的工作人員對此提出質疑,他指出這些信息已經以電子郵件簡報的形式提供,并指著一疊至少300毫米高的紙質打印件。大多數工作人員的回答是 "太長了--沒看"。
兵棋推演在教育中特別有效,正如上面提到的發現學習的背景。"我聽了就忘,我看了就記,我做了就懂"(Seok,2011)。然而,與所有基于游戲的學習一樣,也有一些注意事項,那就是需要仔細管理,所選擇的游戲類型應該是有重點的,并且與預期的學習結果相關(以及在現有的時間內可以實現)。也有很好的證據表明,試圖讓不熟悉或不習慣這種方法的教師強制使用基于游戲的學習,可能弊大于利(Whitney等人,2014)。
將游戲用于教育目的需要考慮的其他因素是,游戲不一定要玩到最后(避免得出 "我輸了,所以游戲不好 "或 "我贏了,所以游戲好 "的結論--這兩種結論對教育理解都是有害的),以及游戲不一定要完美地表現現實--游戲的簡易性和學生的參與性更為重要。事實上,如果游戲是不完美的,教員邀請學生就如何改進游戲提出建議,可以產生比游戲本身更多的洞察力和智能對話。因此,在一節基于游戲的學習之后,進行適當的匯報是非常重要的,以確保游戲與要達到的學習結果相聯系。
兵棋推演可以在培訓中發揮作用,因為兵棋推演往往比其他培訓方法更容易獲得,更容易接觸,而且成本更低(允許有更多的機會進行練習--刻意練習比天賦更重要;見Ericsson等人,1993)。就像上面的評論一樣,游戲是在一個特定的環境中進行的,這有助于信息的保留,并有助于理解游戲中描述的情況。
然而,與教育游戲不同的是,特別重要的是,游戲機制和裁決要根據對現實世界表現的期望進行驗證,以防止對游戲的價值失去信心或從體驗游戲中獲得錯誤的教訓。
2019年,駐扎在蘇格蘭愛丁堡的3號步兵營(一個輕型步兵營)的指揮官要求我協助開展一些戰斗小組級別的兵棋推演。該部隊將從輕步兵重新定位,成為一個機械化營,配備輕型裝甲的偵察車、支援車和運兵車。其目的是為了獲得一些洞察力和理解,以適應裝備這些車輛所需的戰術和程序的變化。
很快就可以看出,作為在阿富汗使用的 "緊急行動需求 "而購買的車輛,完全不適合機械化營所期望的更廣泛的作用。當把它放在一個特定的兵棋推演場景中,試圖在不同的地形中使用不同的車輛,并對付另一種更常規的敵軍時,很明顯,如果按照最初的設想使用這些車輛,會有很大的缺點。用于偵察的車輛雖然裝甲較輕,但缺乏對乘員的保護,特別容易受到炮彈碎片和敵人裝備的大炮的偵察。運兵車雖然在阿富汗的地形上對簡易爆炸裝置有很好的防護作用,但完全不適合在另一種地形上越野行駛。
事實上,所有這些因素都被暴露出來,在場景的操作背景下,在所有相關的利益相關者在場的情況下一起工作,這使得什么可能有效,什么不可能有效變得很明顯。這導致了對如何改變戰術以減少這些風險,或對部隊可以承擔的任務和角色進行限制的清晰理解。
當考慮將未來部隊的發展作為兵棋推演的目的之一時,這分為兩個主要領域:兵棋推演作為分析過程的一部分,以確定未來采購的數量和性能;以及兵棋推演,以確定這些新能力在特定場景下的最佳應用。前者最有可能由研究機構進行,后者則由軍事單位和編隊進行。
應該注意的是,在用于分析目的的兵棋推演中,游戲規則、數據和程序必須盡可能準確,以確保游戲產生的數據同樣準確;游戲的簡易性和玩家的參與是次要的(與教育戰爭游戲相反)。
可以說,兵棋推演是軍事決策過程中最關鍵的部分之一,因為它將指揮官的計劃從概念變成了細節,并使部隊的戰斗力同步于行動。這通常是軍事人員最熟悉的戰爭演習類型,也是由于對如何正確執行戰爭演習的誤解,以及缺乏分配給這一職能的時間和專業知識而通常做得不好的類型(CALL, 2020)。
戰術演練應該被用來評估作戰方案(COA)完成任務的潛力,以應對不同對手COA的預見性反擊,以及識別和糾正不足之處。然而,真正的價值在于它能夠允許指揮官和參謀部將行動的開展可視化,并深入了解對手的能力和行動,以及作戰環境的狀況(AJP-5,2019)。
基本要素是在作戰的背景下了解計劃,以及敵人可能采取的作戰方針。
托馬斯-謝林是美國經濟學家,馬里蘭大學學院公園公共政策學院的外交政策、國家安全、核戰略和軍備控制教授。他因 "通過博弈論分析提高了我們對沖突和合作的理解 "而被授予2005年諾貝爾經濟科學紀念獎。他還根據自己在戰略層面上的博弈經驗,在美國和俄羅斯之間建立了核熱線(Miller, 2021, pp.176-191)。
在蘭德公司的論文《27年后的危機兵棋推演》(Levine et al., 1991)中,Schelling寫道:"最大的好處是他們(參與者)與一些他們將來可能有機會合作或依賴的人變得親密無間,或者至少是隨意地熟悉起來。" 這被明確為兵棋推演的一個重要副產品,以及我所說的場景理解和系統能力。
"兵棋推演不是預測性的。兵棋推演說明了可能的結果,所以有可能從兵棋推演的一次運行中發現錯誤的教訓。兵棋推演可以說明某些事情是合理的,但不能明確地預測它是可能的。(英國國防部, 2020) "
許多作者,包括支持使用兵棋推演的作者和批評兵棋推演方法的作者,都對兵棋推演的預測能力提出了可怕的警告。人們總是對兵棋推演的失敗提出批評,從未能預測1899-1902年布爾戰爭的心理或經濟方面的決定性因素(Caffrey,2019),到商業兵棋推演 "遙遠的平原"(關于阿富汗戰爭)的設計者無法預測2021年8月阿富汗軍隊出現災難性崩潰的可能性(BGG,2021)。
如果兵棋推演在過去的122年里都不能預測未來,盡管有些作者聲稱它們可以(Dupuy, 1985),那么它們在這個領域有什么用處呢?
答案在于它們能夠在關鍵的利益相關者在場的情況下,暴露出一個計劃的多面性,同時面對克勞塞維茨式的摩擦(Watts,2004)和敵人行動所能帶來的所有對抗性因素。這種方法,如果執行得當,有一種獨特的能力,可以暴露任何未來計劃的弱點,排除那些根本行不通的行動和意圖,并完善可能結果的未來錐(Voros, 2017),突出預測的、合理的和可能的未來,并允許更好地理解與之相關的風險。
兵棋推演可能無法預測實際的未來,但它們善于排除那些根本行不通的未來計劃,并允許更好地理解在執行一項行動時可能發生的一系列結果。
在簡要討論了你可能希望進行兵棋推演的一些原因之后,重要的是要介紹一下為專業目的進行兵棋推演所涉及的陷阱和危險。
然而,在開始之前,有必要參考一下關于這個特定主題的開創性工作:"兵棋推演的病癥"(Weuve, et al, 2004)一文。我所做的任何評論只是反映了對我所進行的兵棋推演影響最大的問題,由于我在職業生涯的后半段是一名 "教育者",這影響了我的思維,也意味著在兵棋推演的某些領域(訓練和分析),我的經驗比較有限。
以色列軍方堅定地認為,任何具有虛構背景的訓練活動,包含專門為該活動創建的數據,不僅是一種浪費,而且浪費了對真實世界的理解和洞察的機會 - 他們是絕對正確的。你永遠不應該使用假的場景。
除非你必須這樣做。
在某些情況下,對運行有關真實潛在敵人的游戲存在政治敏感性。大多數情況下,這些都是誤導,實際上對活動的價值有害。在真實的潛在情況下進行游戲的行為不僅本身非常有價值,而且如果消息傳到反對派那里,那就更好了,因為這將產生威懾作用。更不用說,如果一般公眾認為我們是在 "瞎編",他們會認為我們不認真對待這種情況,是瘋了。畢竟,20世紀20年代的 "紅色戰爭計劃 "是美國針對英國和加拿大的一套真實的計劃方案,是由一個剛剛在歐洲作為英國的盟友之一打了一場大仗的國家設計的(Major, 1998, pp.12-15)。
如果你被迫擁有一個虛構的場景,基本上有三種選擇:從頭開始生成場景,增加一個額外的國家,以及改變名稱。
從頭開始構建場景是最糟糕的選擇。所需的工作是巨大的,根據游戲的層級,你可能需要創建整個大陸、國家和其他社會政治集團。你可能需要繪制地圖,以及關于友軍和敵軍作戰命令的深層背景數據,這可能是非常耗時的。
添加一個額外的國家是一個稍好的選擇,因為地緣政治環境是真實的世界,但在危機地區插入了一兩個虛構的國家。這減少了準備工作的負擔,通常允許使用真實的地形(重新劃定一些邊界),并有一個可否認的外衣。
改變名稱是最好的選擇。它允許所有相關人員使用現實世界的情況,并將變化降到最低,而我們決定費盡心思改變名稱的事實表明,我們不希望冒犯他人,同時顯然允許在真實的地緣政治情況下進行訓練。然而,不要搞錯了--"僅僅改變名稱 "本身就可能是一項巨大的努力。我曾參與過一次軍團級的演習,我們要使用西德的地理環境,我們只是把它重新命名為 "紅土"。準備工作已經到了高級階段,當參加演習的德國師級人員震驚地發現,只有國名改變了,但城鎮、地區或河流的名稱都沒有改變。例如,將下薩克森州作為 "敵人的領土",這在政治上被認為是不可接受的,而且,由于計算機模擬無法在現有的時間內進行修改,因此不得不完全重寫設定,使用英國的地理環境,因為這是當時唯一存在的替代模擬地形。
人們經常表示擔心,如果使用真實世界的數據,場景將不得不成為機密;增加的費用和努力是一個數量級的。有幾件事情需要考慮:
用真實的數據進行訓練是更好、更現實的。它將吸引在現實生活中處理情況的個人更高水平的參與,并提供一個機會在事件中檢查數據的有效性和背后的假設。在大多數情況下,在高分類的情況下,實際需要的數據非常少,但額外的成本可能非常高。
根本不需要使用分類數據。完全可以使用通常用于 "訓練 "或公共領域的數據,以較低的分類來設計事件,將其設置在現實世界中。與從完全 "編造 "的數據中得出的那種教訓相比,認為這可能會產生 "錯誤的教訓 "的論點顯然是可笑的。
在過去,這不是一個問題,因為人們普遍認為戰爭與和平之間有一條分界線。這意味著,與手頭的軍事任務相比,對地緣政治局勢、當地政治或宗教的詳細了解被置于次要地位。然而,在當前的不對稱威脅環境中,這種復雜性變得極為重要,因此,為了解決這個問題,場景模擬變得越來越復雜了。
當一位高級軍官說他希望通過一個特定的兵棋推演來 "證明我們需要更多的[某種]導彈 "時,我實際上也在場。他沒有按照兵棋推演的原意使用兵棋,而是為了研究一個問題,以收集有助于為辯論提供信息的見解,他已經決定了答案,只是想通過兵棋推演來證實他的偏見。
這種行為比你想象的要多,不一定像上面的例子那樣明目張膽地發生,但在減少兵棋推演的范圍時,表面上是出于預算或編程的原因,所以被審查的場景被迫處理如此少的替代方案,結果是預先注定的。
英國皇家海軍進行了一次兵棋推演,研究格陵蘭島、冰島和英國之間的差距,這是大西洋北部的一個區域,在這三個陸地之間形成了一個海軍扼制點。其目的是確定是否可以有效地發現俄羅斯北方艦隊的潛艇運動進入北大西洋。一些憤世嫉俗的分析家認為,這場戰爭的目的是為了 "證明 "皇家海軍沒有足夠的潛艇來發揮效力。他們感到驚訝的是,這個假設在游戲開始時就被假定了,而實際的問題是調查如果這種情況被證明是真的,最具有成本效益的替代方案。
最后,顯然需要更多的潛艇才能有效地對付更現代化的俄羅斯潛艇,但除了試圖采購更昂貴的潛艇外,還有一些具有成本效益的替代方案:衛星監視、與盟國加強合作以及海上空中巡邏。當然,海軍兵棋準備建議為皇家空軍海上航空隊提供額外的資金,這一事實在分析上,特別是在政治上都是令人信服的,并且保證了結果被廣泛分享和采取行動。一個提出正確問題的例子。
重要的不是兵棋推演確定了某一系統或戰略存在嚴重的不足,而是玩家做了什么來克服這一不足,以及這是否能夠成功。
兵棋推演,至少以我在英國的經驗來看,一般是例外,而不是常態。因此,當安排了適當數量的高級領導人參加的兵棋推演時,它們往往會受到 "膨脹 "的影響,目的和目標變得越來越雄心勃勃,以證明有這么多的高級決策者參加。在這種情況下,活動中不可避免地增加了其他內容,在活動中插入了審查其他場景和問題的機會,以充分利用參與的人才。
這必然會扭曲活動,將重點從最初的問題上移開,并有可能稀釋結論,從而使它們在更廣泛的戰后報告中丟失,這些報告中充滿了對大多數人來說不感興趣或不相關的信息。
額外的元素也將有助于固定活動方案,分散對原意的注意力,減少那些高級人員花時間 "深入研究 "的靈活性,以進一步研究與他們的同行產生的任何特殊見解。相反,他們往往被從一個點引導到另一個點,缺乏參與或時間來產生有用的投入。
當一場兵棋推演成為 "大事件",有許多高級決策者參加時,它也可能吸引媒體的注意,因此游戲的結果將受到明顯的關注。這意味著要避免被認為是失敗或缺點的尷尬,而且游戲不可避免地被傾斜,以產生一個 "成功的結果"(就外部第三方而言),而不考慮最初的目的。
在這種情況下,游戲不再是一個兵棋,而是通過計劃獲得成功的行動,只有微不足道的 "學習 "才能證明事后的活動。
如果我們考慮在最廣泛的意義上使用兵棋推演,我們需要理解許多人為了產生一個 "更準確 "的結果而希望涉及計算機模擬,也許還有人工智能(AI)。這是錯誤地認為 "更多的數據 "和 "更多的計算能力 "可以在某種程度上,本身就可以提高準確性。
使用模擬和人工智能協助軍事指揮官決策的機會是令人興奮的:使用計算機模擬未來的沖突局勢,然后 "通過人工智能運行它們",以制定最佳行動方案、部隊組合和實現成功的時間。請注意,在這種情況下,人工智能的軍事概念包括在一個基于云的分布式架構中查看多個同時進行的行動方案,以并行地完成許多這些過程(庫克,2020年)。它可能不是嚴格意義上的人工智能,但任何先進的技術計算架構都傾向于被概括為這個標題--軍事指揮官實際上只對產出的實際效用感興趣,而不是對術語的學術定義。
然而,這種方法有一些問題,主要是在兩個方面:基礎模型的準確性;以及優化的危險,導致可預測性和脆弱性。
人工智能系統采用規則來優化其行為,以尋求優勢。這種方法的優勢在于它的有效性。這種方法的缺點也是它有效。我們必須非常小心,確保我們為人工智能定義參數,以產生我們想要的行為(例如,最佳攻擊路線可能在國家邊界之外,所以我們需要確保我們在執行計劃時不會入侵鄰國)。人工智能可以產生不同的行動方案,只要他們的規則適合任務,在封閉的模擬環境中。這必須由人類嚴格控制,以確保不僅規則適合情況,而且人工智能不會通過利用系統中的錯誤來作弊(Benson,2020)。
雖然許多這些系統或多或少都是聚集在一起的,所以必須對性能進行近似,但它們是用來訓練的,這意味著它們足夠準確,有軍事用途;對于Box(1979)來說,"所有的模型都是錯的,有些是有用的"。
危險的是,如果我們可以做這種分析,我們的敵人也可以,讓他們預測我們的行動方案。在尋求具有決定性優勢的武器系統時,這樣的系統變得昂貴,減少了用于替代方案的資源,并且需要很長時間才能投入使用。敵人在得知這樣一個系統后,可以花時間來打敗這個系統。而當他們這樣做的時候,就沒有什么可以反對他們了。韋恩-休斯教授警告說:"海上戰爭中的殺戮往往是用海軍的第二好的武器完成的。如果在未來的某個沖突中,雙方都反擊了對方的首要武器,那么海軍將不得不問:我們的下一個最佳武器是什么?" (Rielage, 2017)。如果人工智能生成的可預測性已經導致了一個單一的武器系統或最佳方法,而它被打敗了,可能就沒有什么替代品了。
優化的系統也是脆弱的,特別是在面對突發事件時。這一點在COVID-19大流行病早期的衛生紙交付的供應鏈失敗中得到了明確的證明(Wieczner, 2020)。特別是軍事行動,需要對突發事件有強大的抵抗力。
然而,許多這樣的實驗未能解決的是關于情報和局勢數據準確性的一些隱性和顯性假設。正如在科索沃的空襲行動中所證明的那樣,塞族人能夠用相對粗糙的技術騙過美國的情報分析員(施密特,1999年),而且在堅實的地面、泥濘的斜坡和耕地上的相對 "前進"(即前進速度)很少被量化,所以假設是危險的。
然而,所有的軍事規劃都是在不完善的信息基礎上進行的。假設人類對人工智能的建議有所節制,那么當人類和人工智能合作以利于決策時,有可能導致更好的結果(an den Bosch & Bronkhorst, 2018),或至少排除更愚蠢的選擇。
因此,人工智能,在一些注意事項和人類的支持下,可以使其發揮作用 - 但代價是什么?人工智能的歷史是一個炒作和預期失敗的故事,被Floridi(2020)稱為 "人工智能的冬天"。其他技術(現有的統計方法、人工兵棋推演、競爭性假設的分析)已被證明是同樣有效的,而成本和精力卻只有一小部分(Makridakis等人,2018),而且不容易出現人工智能衍生結果有時會產生的嚴重錯誤(Yampolskiy,2016;Osoba和Welser,2017)。
英國防部傾向于希望在最昂貴和效率最低的領域使用人工智能--而不是后勤支持和光學識別這些低垂的果實(國防采購機構認為在正常競爭下會自動交付)。相反,他們追求的是最昂貴和最令人興奮的獎品:常規部隊的行動過程評估(Kerbusch等人,2018)。
兵棋推演應該是小型的定期活動,其范圍靈活,產出集中,能夠從最廣泛的角度考慮問題。只有從這樣的活動中才能產生洞察力。
正如偉大的F.W.蘭徹斯特所說。"提供有用見解的簡單模型比那些與現實世界如此接近的模型更受歡迎,因為他們想要解開的謎團在模型中重復出現,而且仍然是謎團"(Fletcher, 1995)。
然而,到目前為止,對兵棋推演最大的誤用僅僅是因為許多人(包括許多高級決策者)根本不了解兵棋推演這一技術,或者認為他們自己對兵棋推演的狹義解釋是正確的,而所有其他的解釋都或多或少地存在缺陷。
這并不局限于國防領域的普通民眾。職業兵棋手們自己也對兵棋的定義爭論不休,在那些認為分析性兵棋的定量科學是唯一有效的方法的人和那些喜歡 "更廣泛的兵棋"的定性藝術而不是 "狹隘的"(和 "狹隘的")替代品的人之間存在著明確的分裂。
造成這種情況的原因是,幾乎在所有情況下,兵棋推演都是由自學成才的少數人進行的,由他們個人的職業發展提供信息,缺乏正規專業教育所能提供的更廣闊的視野。這并不是說兵棋推演課程不存在,但總的來說,這些課程是其環境的產物,因此其產出偏向于其贊助商的要求。舉個例子,MORS7兵棋證書(正如你所期望的那樣)在很大程度上偏向于分析的一端。
為了有效,兵棋推演需要來自指揮系統的正式支持。它需要一個冠軍(一個高級領導人,承擔起確保每個參與者都致力于該技術的最終成功的重任),需要有人負責確保兵棋推演在每個級別都得到理解并定期進行,從計劃分區攻擊的初級士兵到軍隊的最高級別,如英國國務卿的網絡評估和挑戰辦公室(SONAC;見Elefteriu,2020)。
需要在軍事學校和學院開設正式的教育課程,教授全方位的兵棋推演,而且兵棋推演應該被強制規定為任何課程或單位和編隊的年度培訓周期的一部分。只有這樣,才能培養出新一代有適當資格和經驗的人,以取代 "有天賦的業余愛好者",他們在大多數軍隊中構成了大部分的兵棋推演專家。
不過,無論怎樣強調都不為過的是,不能把應該進行兵棋推演的授權與應該玩某種游戲或游戲類型的授權混為一談。
正如弗朗茨-哈爾德將軍(Generaloberst Franz Halder)在談到20世紀30年代和40年代的德國軍隊兵棋推演時所說:
"軍事文獻包括關于兵棋推演的非官方手冊。為了避免哪怕是最輕微的軍團化跡象,并在戰爭游戲的應用和發展中保持充分的自由,官方沒有發布任何形式的正式指令。(霍夫曼, 1952)"
在這篇文章中,我試圖確定兵棋推演的多種多樣的用途,強調游戲類型之間的差異,所有這些游戲都是為了一個特定的目的。沒有哪種游戲適合所有人--用于教育、培訓和分析的游戲之間的差異是非常重要的,而且經常被忽略。
我還從我的經驗出發,介紹了一些在運行兵棋推演時可能出現的錯誤和危險(并指出了關于這個問題的開創性工作)。為了避免其中最重要的危險,并確保它作為一種使軍隊更加有效的技術而獲得成功和發展,兵棋推演需要得到指揮系統的支持,并且必須成為軍事學校和學院課程的一個重要組成部分。
美國陸軍未來與概念中心 未來戰爭部主任 克里斯-羅杰斯上校
歷史上的戰爭包含了大量改變戰爭性質的工具和技術的例子。自最初研究多域作戰(MDO)以來,美國陸軍發現人工智能是一種新興技術,有可能改變戰爭的特點,也許也會改變戰爭的性質。使用人工智能(AI)解決方案來緩解軍事問題是過去兩年未來戰爭研究、檢查和學習的一個反復出現的主題。作為2019年未來研究計劃的一部分,我們與陸軍、聯合、多國、學術和科技組織合作,探索和了解人工智能對多軍種的影響,并為未來的研究和發展制定一個操作框架。
多域作戰的人工智能運作最終報告提供了采用人工智能的組織框架,以幫助陸軍和聯合部隊更好地定義所需的能力以及相關的數據和網絡架構,以實現多域能力部隊。描述聯合部隊如何采用人工智能解決方案,為了解人工智能在時間和空間上對多域作戰的影響提供了一個操作說明。本報告確定并解決了與人工智能相關的好處、機會和挑戰,為進一步分析提供了基礎。諸如人工智能等新興技術使陸軍不僅可以改進當前的戰術、技術和程序,而且可以創造新的運用和融合能力的方法。
該報告支持美國陸軍人工智能任務組,該組織負責制定陸軍的人工智能戰略和政策。本文通過描述部隊如何在整個MDO框架內采用人工智能解決方案和相關技術,啟動了陸軍的人工智能運用工作。這份報告使概念發展團體能夠修改陸軍功能概念和戰場發展計劃。它為能力發展團體提供了作戰視角和部隊在確定所需能力時必須考慮的技術影響。此外,該報告還為作戰概念文件或基于能力的評估提供了開發情景或小插曲的基礎。該文件為科學和技術界提供了行動背景,以便為人工智能研究、開發、建模和模擬提供信息和指導。最后,它支持制定一個在未來使用人工智能的全面愿景,以告知陸軍現代化的努力,這將創造有能力的MDO部隊,準備好與任何對手作戰并取得勝利。
人工智能(AI)是未來聯合部隊實現多域作戰(MDO)全部潛力的基礎。人工智能系統提供了跨越領域、電磁頻譜和信息環境戰勝對手的能力。在競爭中使用這些系統使聯合部隊能夠近乎實時地了解作戰環境,從而更好地運用能力來擊敗旨在破壞區域穩定的威脅行動,阻止暴力升級,并將被拒絕的空間變成有爭議的空間。在從競爭到武裝沖突的過渡中,人工智能的機動、火力以及情報、監視和偵察能力為聯合部隊提供了拒絕敵人奪取優勢地位的能力。改進的維持能力與攻擊敵人的反介入/空中拒止網絡的能力相結合,為美國部隊提供了奪取作戰、戰略和戰術優勢位置的能力。通過由人工智能支持的多領域聯合行動圖(MDCOP)增加了解,使美國部隊有能力協調多領域的效果以創造優勢窗口。
制定人工智能的作戰概念使陸軍能夠更好地理解這些技術對戰爭的性質和特征的潛在影響。描述陸軍如何在未來的作戰環境中使用人工智能,有助于說明其對戰爭的暴力、互動和基本的政治性質的影響,以及戰爭不斷演變的特點。本文提供了一些小插曲(附錄A),說明了人工智能的組織運用,為美國陸軍RAS總體概念、作戰和組織概念、基于編隊的作戰概念以及系統或單個系統的運用概念的潛在發展提供信息。
人工智能的運作影響到未來部隊將如何運作,如何針對對手開展行動,以及指揮官如何利用軍事藝術和科學,運用部隊能力來實現預期效果和目標。在2019年未來研究計劃(FSP19)期間,人工智能工作線(LoE)確定了與實施人工智能支持的多領域解決方案有關的以下問題:
數據管理--AI/ML應用程序依賴于對策劃的數據的訪問,以便發揮作用。陸軍必須培養一種以數據為中心的文化,以標準化的格式和協議有效地生成、存儲和訪問數據。人才管理的努力必須側重于發展、培訓和保留一支精通數據的員工隊伍。這可以通過以下方式實現:
在整個部門培養一種以數據為中心的文化
投資于整個員工隊伍的數據科學培訓
簡化數據訪問
設計和實施協議,以確保數據的可發現、可訪問、可共享和可互操作性
功能分解--狹義的人工智能本質上是有限的,構建算法的數據科學家需要精確的問題定義,準確確定聯合部隊的要求。
可解釋人工智能--人工智能支持的系統需要有能力解釋決策/建議和所采取的行動背后的邏輯。這種解釋 "為什么"的能力是人類對人工智能智能體的信任基礎。
邊緣計算/人工智能--未來的作戰環境與有爭議的電磁頻譜預期要求有能力向前處理極其龐大的數據集,以及能夠自主行動的人工智能平臺。
利用商業部門--美國防部實驗室繼續在人工智能/ML發展方面取得重大進展,特別是與聯邦資助的研究和發展中心合作。商業部門繼續探索和擴大可能適用于軍事應用的工作。
作為FSP19的一部分,人工智能LoE開發了五個小插曲和一個概念草圖(見附錄A),以協助人工智能和機器學習的運作。這些小插曲說明了聯合部隊如何利用人工智能/ML來解決多領域行動所需的關鍵能力。MDCOP概念將依靠幾個有限內存的人工智能來建立和維護描繪整個戰場的藍、紅、綠活動。一個反應式機器人工智能將為特定的指揮官和總部定制MDCOP。合作傳感、維持、攻擊和瞄準的小插曲依靠反應式機器人工智能來優化傳感器覆蓋、維持吞吐量、攻擊順序和射手選擇。
未來部隊需要人工智能來充分實現多領域作戰的潛力。人工智能支持的系統使未來部隊能夠進行信息收集和分析,以便在時間有限和信息競爭的環境中增加對形勢的了解。這種能力使快速、知情和合理的決策成為可能。人工智能的決策支持代理將減輕作戰人員的認知工作量并提高整體效率。由人工智能支持的無人系統將探測、識別和穿透高風險區域,以提高開展行動和保護部隊、人口和資源的能力。人工智能使MDO在與近似對手的沖突規模下實現了作戰速度的要求。
在未來部隊結構的發展和評估過程中,兵棋推演是深入了解其優勢和劣勢的一項關鍵活動。十多年來,挪威國防研究機構(FFI)在不同程度的計算機支持下,開發支持挪威軍隊進行能力規劃的兵棋。在此期間,這些已經從可被描述為計算機輔助的兵棋發展為更逼真的仿真支持的兵棋。此外,為了更密切地了解部隊結構的威懾效果(這在實際游戲中可能無法觀察到),我們的重點也轉向了更恰當地復制規劃過程--特別是監測對方部隊的規劃過程。例如,研究特定的結構元素在多大程度上阻止了對方部隊采取某些行動,這一點很重要。在這篇文章中,我們描述了我們開發的仿真支持的兵棋推演方法,其中包括一個準備階段;一個執行階段,含有一個聯合行動規劃過程;以及一個分析階段。此外,我們還討論了我們能夠從兵棋推演中提取什么類型的數據和結果,并提出了一套我們發現的關于如何成功進行仿真支持兵棋的最佳實踐。
關鍵詞:兵棋推演;建模與仿真;實驗;國防結構;能力分析;國防規劃
在發展和評估未來的部隊結構時,兵棋推演是深入了解和更好地理解部隊結構的優勢和劣勢的關鍵活動。今天,基于計算機的仿真系統使我們能夠創造出高度復制真實世界物理特性的合成環境。此外,人工智能(AI)和行為模型的進步給我們提供了更真實的計算機生成部隊(CGF),可以高度逼真地執行戰斗演習和低級戰術。兵棋可以從這些進展中受益。然而,在指揮系統的較高層次上,人工智能還不能與人類決策者相提并論,在兵棋中規劃和實施仿真行動需要人類官員的參與。
十多年來,挪威國防研究機構(FFI)一直支持挪威軍隊在不同程度的計算機支持下開發能力規劃的兵棋。在此期間,這些已經從可被描述為計算機輔助的兵棋發展為更逼真的仿真支持的兵棋。此外,為了更密切地了解部隊結構的威懾效果(這在實際游戲中可能無法觀察到),我們的重點也轉向了更恰當地復制規劃過程,特別是監測對方部隊的規劃過程。例如,研究特定的結構要素在多大程度上阻止了對方部隊采取某些行動--或者換句話說,正在推演的概念有怎樣的戰爭預防或維護和平效果,這一點很重要。
能力規劃過程和高調的兵棋總是會涉及或吸引利益者--例如高級軍官、政治家、官僚和國防工業領導人--的利益沖突。一般來說,參與的利益者有可能想把兵棋框定在一個有利于他們利益的背景下(Evensen等人,2019)。重要的是要意識到這個問題,而且關鍵是要避免兵棋成為利益者利益的戰場。本文所描述的方法和最佳實踐試圖通過使用基于計算機裁決的仿真,以及通過提高對元游戲的認識,或對兵棋所有階段的沖突,從準備到執行,再到分析和報告,來減少這個問題。
本文的組織結構如下。首先,我們簡要地描述了這項工作的背景。接下來,我們描述了我們開發的仿真支持的兵棋推演方法,其中包括準備階段;執行階段,包括聯合行動規劃過程;以及分析階段。之后,我們討論了我們能夠從兵棋推演中提取的數據和結果類型。最后,我們提出了一套我們發現的關于如何成功進行仿真支持的兵棋推演的最佳實踐。
雖然各種形式的兵棋推演已經在FFI進行了數十年,但當FFI的研究人員開始合作研究單個仿真支持的系統評估方案時,首次出現了實施仿真支持的部隊結構評估的想法(Martinussen等人,2008)。
2010年,FFI首次將使用半自動部隊(SAF)的互動式旅級仿真系統作為兵棋推演的基礎。在 "未來陸軍 "項目中,通過一系列計算機輔助的兵棋推演,對五種基本不同的陸軍結構的性能進行了評估(霍夫等人,2012;霍夫等人,2013)。其目的是根據這些結構的相對性能進行排名。此外,兵棋推演揭示了被評估結構中固有的一些優勢和劣勢。雖然我們使用的仿真工具相當簡單,但它對于跟蹤部隊的運動和計算決斗和間接火力攻擊的結果很有用。
在此之后,FFI支持挪威陸軍進行了幾次仿真支持的能力規劃系列兵棋推演。這些兵棋推演是雙面的(藍方/友方和紅方/敵方),封閉的(可用信息有限),在戰術和戰役層面進行。
玩家總數在10到100人之間,兵棋推演的時間從一天到兩周不等。圖1顯示的是2014年FFI的一次仿真支持的兵棋推演會議的照片。
圖1 2014年FFI的仿真支持的兵棋推演會議。
自2010年以來,我們的兵棋推演逐漸從計算機輔助的兵棋推演(使用非常簡單的仿真模型),向使用更詳細和更真實的仿真模型的兵棋推演演變。此外,為了更密切地了解部隊結構的威懾效果(這在實際游戲中可能無法觀察到),我們的重點也轉向了更恰當地復制規劃過程,特別是監測紅方部隊的規劃過程。圖2說明了我們兵棋推演的演變過程。
圖2 我們的兵棋推演的演變過程。
使用基于計算機的仿真來支持兵棋推演的價值首先在于有一個系統來自動跟蹤部隊,計算其傳感器的探測情況,并評估決斗情況和間接火力攻擊的結果。此外,基于計算機的仿真非常適用于通過在地面實況上添加過濾器來真實地表現不確定性和戰爭迷霧。
戰術仿真是開發、測試和分析新的部隊結構的一個重要工具。通過兵棋推演,可以深入了解一個部隊結構對特定場景的適合程度,并揭示該結構的優勢和劣勢。然而,擁有一個好的執行計劃對于成功地進行兵棋推演實驗和從活動中獲得有用的數據是至關重要的。在本節中,我們將介紹我們的仿真支持的兵棋推演方法,該方法是通過我們在過去10年中對兵棋推演實驗的規劃、執行和分析的經驗發展而來的。我們還將討論兵棋推演的背景,以及規劃和組織兵棋推演活動的過程,這可以被視為一種元游戲。
一般來說,有幾本關于兵棋推演的書和指南可以參考(Perla,1990;Appleget等人,2020;Burns,2015;英國國防部[UK MoD],2017)。本節描述的方法是專門為支持未來部隊結構發展的分析性兵棋推演而定制的。通常情況下,我們使用這種方法來評估和比較不同部隊結構備選方案的性能,這些方案可能在物資和裝備的構成、戰術組織或作戰概念方面有所不同。
我們的兵棋推演實驗方法包括三個主要階段:
1.準備階段
2.規劃和執行階段
3.分析階段
這些階段將在下文中詳細描述。圖3說明了它們之間的關系,其中規劃過程和兵棋推演的執行階段構成了實驗的核心。
圖3 兵棋推演實驗的方法說明。
小國在發展兵力結構以威懾擁有更多兵力要素的敵人時面臨著兩難境地。敵人可能會觀察到防御結構中的變化,并可能在運用軍事力量時從集合中選擇其他更合適的元素。例如,如果小國的部隊結構是專業化的,為了對付預期的敵人行動方案(COA),敵人可能會從庫中選擇完全不同的東西,敵人的COA可能會發生巨大變化。
對所有國家來說,發展部隊結構是一個緩慢而公開的過程。從現有的、龐大的部隊要素庫中選擇部隊并創造新的行動方案是一個快速和隱蔽的過程。對于一個小國來說,在這種情況下實現威懾似乎是一項不可能完成的任務,但我們已經在幾個案例中觀察到,對部隊結構的低成本改變是如何對敵人的COA選擇產生巨大影響的(Daltveit等人,2016;Daltveit等人,2017;Haande等人,2017)。1988年為圣戰者引入手持防空導彈后,蘇聯在阿富汗的戰術發生了變化(Grau, 1996),這就是我們在兵棋推演中看到的紅方(對手)小組規劃過程中產生影響的一個很好示例。據觀察,存在感和姿態也有威懾作用。此外,社會、景觀和氣候也影響了紅方的規劃過程。這一切都歸結于敵方在規劃和制定作戰行動期間的風險評估。
為了研究部隊結構變化的威懾作用,有必要讓分析人員在兵棋推演前觀察紅方的規劃過程,而不僅僅是在仿真戰斗中。阻止敵人進攻是任何部隊結構發展的意圖,而觀察威懾效果的唯一方法是在敵人的規劃期間。
在決策理論中,風險是一個必須考慮的因素,以便能夠做出理性的選擇。馮-諾伊曼-摩根斯坦(vNM)決策理論的基礎是行為者通過考慮給定概率和結果的彩票來評估選擇(von Neumann & Morgenstern, 1944)。風險因素也需要存在于規劃過程中。如果一方的規劃過程被參與兵棋推演的其他任何一方知道,那么一部分風險因素就會消失。這將使規劃過程減少到只是評估一個已知的敵人COA,而不是評估一系列可能的COA及其概率。因此,重要的是,場景定義不能限制敵人的規劃過程,所有的規劃過程都要受到監控--特別是敵人的規劃過程。
盡管兵棋推演在最終開始時有規則,但在選擇兵棋的類型和周圍環境的過程中,并沒有明確的規則。因此,策劃和組織一場兵棋推演活動的過程可以被看作是一種元游戲--一種可以在對抗分析的規則中進行分析的游戲(Curry & Young, 2018)。例如,聯合層面的兵棋推演將包括傳統上的資金競爭對手的參與者。來自空軍、海軍和陸軍的參與者,在涉及到應該如何制定場景、應該對未來技術做出什么樣的假設、應該如何評估戰斗效果等方面,可能有不同的利益。每個領域內的分支也是如此。因此,存在著一種危險,即元游戲對部隊結構分析結果的影響可能比實際兵棋推演的影響更大。元游戲并不局限于兵棋的執行。分析和事后的報告也會受到與準備期間相同類型的沖突影響。在圖4中,存在于核心方法論之外的元游戲層就說明了這一點。
圖4 圍繞兵棋推演實驗方法的元游戲圖解。
能力規劃過程總是會涉及或吸引利益沖突的利益者,國防規劃和兵棋推演包含許多利益者爭奪地盤的例子(Evensen等人,2019;Perla,1990)。這在兵棋推演的準備階段尤其明顯。應對這種情況的一個可能的方法是,適當地將擁有發明改變部隊結構的權力角色與擁有評估和接受改變的權力角色分開。當這些角色沒有被分開時,利益者會試圖影響什么是兵棋的目標,以及使用什么類型或風格的兵棋。在最壞的情況下,我們可能會有有限數量的利益者提出新的部隊結構,然后讓同樣的利益者通過基于場景的討論來驗證他們自己的想法是否良好。如果被評估的是利益者所珍視的想法,這就特別容易出問題。
聯合需求監督委員會(JROC)是一個很好的例子,該機構以健全的決策結構處理地盤戰(參謀長聯席會議主席[CJCS],2018)。美國軍方將思想的發明者與審查其有用性的權力進行分開,這完全符合孟德斯鳩的分權原則。在挪威進行國防規劃和兵棋推演的方式,在許多情況下,人們會發現行為者既產生了對未來部隊結構的想法,又通過參與基于場景的討論來評估相同的結構。基于場景的討論如果不包括專門的紅方小組,就不是兵棋推演。引入 "紅方小組 "成員,以及對方的自由和無阻礙的規劃,消除了一些濫用權力的可能性。沒有對提議的部隊結構進行適當兵棋推演的一個特殊結果是,建議采用次優化的部隊結構來打擊固定的假設敵方作戰行動。由于沒有對這種部隊結構進行適當的推演,結構改革的支持者成功地擊敗了他們喜歡的敵人COA,但卻沒有挑戰他們自己的想法。
準備階段包括在兵棋推演執行階段開始前需要做的一切。最重要的準備工作是:
建立對兵棋推演實驗目標的共同理解。
確定總體方案,包括外部條件、假設和限制。
選擇一個或多個仿真系統,并對仿真模型進行校準。
確定藍方(友軍)和紅方(敵軍)的作戰順序(OOB)。
規劃和執行階段包括兩個獨立的活動:(1)雙方的聯合行動規劃過程,以及(2)仿真支持的兵棋推演。
在這項活動中,由軍事主題專家(SME)和軍官組成的藍方和紅方小組,根據總體方案和受控的情報信息流,分別制定他們的初步行動計劃。根據偏好,這些計劃不是整體方案的一部分,雙方都可以自由制定自己的計劃。這也意味著,對立雙方制定的計劃對另一方來說仍然是未知的。
原則上,聯合行動規劃過程可以按照與現實中基本相同的方式進行,不做任何簡化。這是一項應該與仿真支持的兵棋推演一樣優先考慮的活動,在人員配置方面也是如此。
在規劃過程中,參與者必須討論不同的選擇,并根據所感知的對方部隊結構的優勢和劣勢來制定一個COA。觀察雙方的規劃過程并揭示決定COA的根本原因,可以提供有關部隊結構的寶貴信息,而這些信息在執行兵棋推演本身時可能無法觀察到威懾效果。
兵棋推演本身是作為仿真支持的兩方(藍方和紅方)兵棋推演進行的,其中行動是在一個具有SAF的建設性仿真系統中仿真的。在博弈論中,這種類型的兵棋推演可以被歸類為非合作性的、不對稱的、不完全信息的連續博弈。
兵棋的參與者是兩組對立的玩家和一個公斷人或裁決人的小組。重要的是要記住,一個兵棋的好壞取決于它的玩家。玩家是軍事主題專家和軍官。要想有一個平衡的兵棋,關鍵是不要忽視紅色單元。如果做得好,這種類型的兵棋,由適應性強且思維不受限制的對手主導,往往會變得高度動態、對抗性和競爭性。
對于分析性兵棋推演來說,現實的仿真對于加強結果的有效性和可信度非常重要。軍事行動,尤其是陸軍行動,本質上是復雜的,對這種行動的仿真,要有足夠的真實性,是非常具有挑戰性的(Evensen & Bentsen, 2016)。此外,仿真系統可能包含錯誤,人類操作員可能會犯一些在現實生活中不會犯的錯誤。因此,重要的是要有經驗豐富的裁判員來監控仿真,并在必要時對結果進行適當的人工調整。
在某種程度上,在仿真支持的兵棋中,元游戲也會發揮作用。曾經有這樣的例子,利益者將有能力的官員從兵棋推演中撤出,只是用不太熟練的人員取代他們,很可能是為了降低利益者不希望成功的兵棋可信度。其他的例子是公斷人與參觀兵棋的更高等級利益者的干預作斗爭。歷史上有很多類似的例子(Perla,1990),挪威也不例外(Evensen等人,2019)。這里所描述的清晰的方法,意在抵制以往兵棋推演實驗的一些缺陷。
除了從仿真支持的兵棋本身的執行中收集的觀察和數據外,分析還基于規劃過程中的觀察和數據。
在規劃過程中,密切監測和記錄討論情況是很重要的。由于國防軍的主要目的--至少在挪威是這樣--是為了防止戰爭,因此在規劃過程中的考慮可能是整個兵棋中最重要的結果。只有當敵人在兵棋開始前考慮到這些因素時,才能觀察到部隊結構和態勢的預防特性。在規劃階段,通常會考慮幾個備選的作戰行動和機動性。其中許多被放棄,有些被保留,原因各異,必須記錄下來。為什么紅方決定某個行動方案不可行,可能是由于某些結構要素或來自藍方的預期策略。如果紅方由于藍方的OOB要素而不得不放棄一個計劃,那么這些要素已經證明了對藍方的價值--即使這些要素在接下來的仿真行動中最終沒有對紅方部隊造成任何直接傷害。
在仿真支持的兵棋中可能會記錄大量的數據。很容易把各種結構元素的損失交換率等數據看得很重。在實際的兵棋推演中,也許更應該注意的是雙方指揮官的決定。如果其中一方出現了機會,這是為什么?該方是如何利用這樣的機會的?是否有什么方法可以讓他們考慮利用這個機會,但不知為何卻無法利用或執行?如果有,為什么?為了收集這樣的信息,指揮官們公開討論他們的選擇是很重要的。重要的不僅僅是告知積極選擇的原因;往往可能同樣重要的是為什么沒有做出其他選擇。
確定部隊結構的主要優勢和劣勢及其利用是分析階段的一個重要部分。考察雙方在規劃階段和推演階段的考慮,是做到這一點的最好方法。這不是一門精確的科學,因為這種數據具有定性的性質。通過觀察參與者的考慮和決策,比單純看哪些武器系統摧毀了哪些敵人的系統,可以更好地確定使用某種COA的關鍵因素,或者是允許敵人有更好選擇的缺失能力。分析階段的結果是對測試的部隊結構進行評估。
分析階段也可能會在商定的兵棋推演方法范圍之外發生爭吵。甚至在事件發生后的報告撰寫中也可能受到影響,當角色沒有被很好地分開,利益者被允許過度地影響這個過程時。
一般來說,我們努力從兵棋推演環節中獲取盡可能多的數據。根據用于支持兵棋推演的仿真系統,可以記錄各種輸出數據。例如,通常可以記錄各個單位移動了多遠,他們使用了多少彈藥和燃料,以及其他后勤數據。通常,殺傷力矩陣--基本上是顯示一方的哪些單位殺死了另一方的哪些單位的矩陣--也會被記錄。其他許多定量數據也可以被記錄下來。除此以外,還有定性的數據。如前所述,這包括對規劃過程的觀察,以及與參與規劃過程的參與者的討論。此外,它還包括對兵棋推演期間所做決策的觀察,以及在兵棋推演期間或之后與玩家的討論。
人們往往傾向于把大量的注意力放在定量數據上,如殺傷力矩陣,而對定性數據的關注可能較少。定量數據更容易分析,而且通常被認為比定性數據(如隊員的決策和考慮)更客觀。但重要的是要記住,定量數據取決于雙方玩家的決策,以及對模型的輸入數據。玩家認為各種單位應該如何運用,對殺傷力矩陣有相當大的影響。因此,盡管這些數據是定量的,但它們并不比定性數據更客觀。
諸如殺傷力矩陣這樣的數據也忽略了重要的信息。雖然人們可以看到哪些部隊殺死了哪些敵方部隊,但卻失去了原因;其他部隊雖然沒有直接摧毀敵方部隊,但卻可能在為其他部隊創造有效條件方面起到了關鍵作用。雖然某些部隊可能只消滅了很少的敵人,但他們在戰場上的存在可能對阻止敵人進行某些行動至關重要。例如,雖然近距離防空可能不直接負責消滅敵人的直升機,但它可能阻止了敵人像其他情況下那樣積極地使用直升機。因此,在分析一個兵棋時,對于只看殺傷力矩陣這樣的量化數據應該謹慎。必須考慮到整體情況。
理想情況下,在比較不同的部隊結構時,應該對每個部隊結構進行幾次推演,并允許敵人在每次戰役中改變其行為。自己的部隊應該找到在特定情況下使用其結構的 "最佳 "方式,而敵人應該找到反擊這一策略的 "最佳 "方式。只有這樣,人們才能真正比較不同部隊結構的兵棋推演結果,并得出哪種部隊結構最適合給定場景的結論。然后,當然,確實有廣泛的潛在場景需要考慮。因此,雖然這也許是應該進行兵力結構比較的方式,但在這方面,時間和資源通常對大量的兵棋推演是不夠的。
所有模型都有局限性。它們可能是為某一特定目的而設計的,并適合于此,但不太適合于其他事情。在考慮哪些問題可以通過兵棋推演來回答,哪些問題應該用其他工具來調查時,必須記住這一點。從兵棋推演中到底可以推導出什么,將取決于所使用的模型--但一般來說,應該把重點放在實驗所要回答的那些問題上。如果在實驗中出現了其他的結果,就應該對其有效性進行檢查,而且這些結果往往需要在專門為調查這些新出現的問題而設計的實驗中進行評估。
兵棋推演是比較兩個(或更多)部隊結構在特定情況下的表現的一個重要工具。然而,兵棋推演并不能對任何給定的部隊結構的有效性給出任何精確的衡量,但適合于確定主要的優勢和劣勢。與具體單位有關的參數的效果,如它們的火力和裝甲,應在單獨的研究中進一步考察。這些因素雖然很重要,但它們的層次太細,無法通過我們這里討論的兵棋類型來研究它們對結果的影響。彼得-佩拉強調,"兵棋只是研究和學習國防問題所需的工具之一"(佩拉,1990,第11頁)。其他工具應被用來補充兵棋和研究這些因素的重要性。
兵棋推演通常是實質性的活動,涉及大量的人,并需要大量的時間。因此,我們通常被限制在有限的數量上--通常對于我們所分析的每個部隊結構只有一個。重要的是要記住,一個單一的兵棋推演的結果只是:特定情況下的一個可能的結果。雙方玩家可以采取不同的做法,事件的發展也可能不同。細微的變化可能會影響到對整體結果至關重要事件的結果。
在本節中,我們將列出我們發現的進行仿真支持的分析性兵棋的最佳做法,以評估部隊結構。我們發現的一些最佳實踐與處理元游戲的需要有關,或者與兵棋的沖突有關。這些最佳實踐的用處可能僅限于其他尚未將發明權與測試部隊結構的權力分開的小國。其他的最佳實踐來自于提供仿真支持和取代基于場景的討論以發展防御結構的需要。
在準備階段,必須盡早明確兵棋推演實驗的目的,這將是實驗設計的基礎。
擁有一個帶有SAF的交互式仿真系統,對玩家來說易于操作,并且需要相對較少的操作人員,這就減少了進行仿真支持的兵棋推演所需的資源,從而也降低了門檻。
一個好的紅方小組是發現自己的部隊結構、計劃和程序中弱點的關鍵。紅色小組的成員也應該對預期對手的理論有很好的了解。我們觀察到,一個好的紅色小組能迅速地阻止我們自己的規劃人員對可能的敵人行動進行集體思考的傾向。
自己部隊結構的變化也必須允許對方部隊結構的變化。部隊結構的改變是一個緩慢的過程,肯定會被預期的對手觀察到。
盡可能地復制現實生活中的規劃過程。
觀察規劃過程,以便更全面地了解部隊結構的優勢和劣勢。為了記錄藍軍部隊結構的威懾效果,觀察對方部隊的規劃過程尤為重要。據觀察,自己的部隊結構中的幾個要素對對方部隊的行動有威懾作用,存在和姿態也是如此。此外,我們還觀察到,社會、地形和氣候也會影響對方部隊的規劃。
在部隊相互靠近的情況下開始一場兵棋推演,可能會使它變成一場簡單的消耗戰。發展良好的兵棋推演,在提供了空間和時間的情況下,就像武術比賽中的對手互相周旋,評估對方的弱點,并尋找攻擊的機會。評估避免遭遇的能力可能與評估戰斗的能力一樣重要。
建立對正在發生的事情的了解需要時間,是領導軍事行動的一個自然組成部分。只有當不確定性得到適當體現時,部隊結構中某些要素的真正價值才會顯現。例如,存在的力量的影響可能是巨大的。當戰術形勢不是所有人都能看到的,而且戰斗的結果被認為是非決定性的,以至于現實是隨機的,那么不確定性就得到了最好的體現
讓參與者為兵棋推演的目的做好準備。當使用指揮和參謀訓練器作為支持兵棋推演的仿真系統時,一些參與者傾向于按照程序行事,就好像這是一場演習。如果兵棋推演的目的是探索新的部隊結構要素、作戰行動或戰術、技術和程序(TTPs),則需要鼓勵參與者在執行任務時發揮創造性。
讓與兵棋推演無關的人員遠離它,特別是高級軍官,是很重要的。在人在回路(HITL)仿真中,人類玩家是整個仿真的一部分,來訪的高級軍官(或其他人)將對人類玩家的互動方式和他們如何進行規劃產生影響。限制來訪人員也減少了外部影響結果的機會(Hoppe, 2017)。
十多年來,FFI支持挪威陸軍為能力規劃開發仿真支持的兵棋。本文介紹了我們進行仿真支持的兵棋推演的方法,并提供了一套進行仿真支持的兵棋推演的最佳實踐。該方法和最佳實踐特別針對分析性兵棋以支持能力規劃。
該方法由準備階段、規劃和執行階段以及分析階段組成。在過去的10年中,該方法通過使用更詳細和更現實的仿真模型,以及在仿真行動前復制和監測規劃過程,以更深入地了解測試的部隊結構的威懾效果,而逐漸發展起來。
我們進行仿真支持的兵棋推演的最佳做法包括:為兵棋推演實驗確定一個明確的目標,使用一個便于玩家操作的仿真系統,擁有一個良好的紅方小組,不受太多限制,提供空間和時間,使戰爭不會立即開始,并提供一個不確定性和信息收集的現實表現。最后,為了更全面地了解一個部隊結構的優勢和劣勢,分析小組必須同時觀察規劃過程和兵棋推演本身。
將擁有發明部隊結構變化的權力角色和擁有測試、評估和接受這種變化的權力角色正式分開,將解決我們在國防規劃中看到的許多問題。我們已經發現,組織兵棋推演活動的過程可以被看作是一個元游戲。當用建模、仿真和分析來支持兵棋推演時,元游戲被看作是發生在各個層面的東西,其中一些我們可能沒有任何影響力。希望這篇文章能有助于提高對這些挑戰的認識,并能對我們能影響的那部分元游戲提供一些調整。
本文介紹了在探索使用快速戰役分析工具集(RCAT)來制作人道主義援助和救災(HADR)兵棋推演過程中獲得的經驗教訓,該推演過程基于2017年國防政策的國際救災情景。這些經驗表明,RCAT可以支持對潛在行動方案(COA)的審查和能力識別,以支持基于能力的規劃(CBP)過程。然而,在這一目的中,游戲測試對于產生反饋循環至關重要,通過這種反饋循環,將對連續的迭代進行修正;玩家的組成、提前閱讀的材料和有效的第一輪教程將使游戲環節富有成效,促進玩家對兵棋推演機制初步學習,使他們參與到對兵棋推演的多學科審查中。
然而,未來的RCAT兵棋推演應該注意到玩家信息過載等問題,RCAT可能不是展現復雜人道主義問題(如恢復活動)的最佳方法。為此,如果決定利用RCAT作為作戰研究和分析中心(CORA)來支持兵棋推演工作,需要進一步探索RCAT以確定COA和能力,辨別局限,并建立一個內部RCAT的專業知識。
兵棋推演提供了一種探索棘手問題的方法,由于缺乏足夠的信息,這些問題可能難以通過傳統的分析方法進行研究。英國開發的快速戰役分析工具集(RCAT)是制作兵棋推演的一種方法;本文討論了在使用RCAT制作人道主義援助和救災(HADR)兵棋推演過程中所獲得的經驗。
兵棋推演可以模擬沖突的某些方面,以提供決策經驗或決策信息。然而,兵棋游戲是一個多樣化的分析工具集,因為存在各種方法,選擇哪種方法可能會受到發起人問題的性質及其對特定情景的適用性影響。
快速戰役分析工具集(RCAT)是英國開發的兵棋推演方法,其目的是在作戰層面上制作人工分析的桌面兵棋游戲,并與軍事戰略層面相聯系[1];在2020年夏季對其潛力進行了探索,以便在2017年以國際救災為中心的部隊發展情景基礎上制作人道主義和救災(HADR)的兵棋游戲。
該研究的目的有兩個方面:
1.了解RCAT的機制和規則,以確定在現有部隊規劃方案的基礎上制作RCAT游戲的可行性。
2.制作和玩一個或多個RCAT游戲,以了解DRDC未來使用RCAT的潛力。
本文將討論在探索RCAT過程中獲得的經驗教訓,然后將討論RCAT的潛在用途,以支持作戰研究和分析中心(CORA)的兵棋推演工作。
本文按以下方式組織:
第2節將討論為RCAT-HADR兵棋推演提供信息的方法,并將簡要介紹兵棋推演的三個連續迭代。
第3節闡明了在制作RCAT兵棋游戲的過程中所獲得的經驗。
第4節的結論是對RCAT作為一種潛在的兵棋推演方法供CORA使用的評價。之后,本文將提出兩個步驟,可用于進一步探索RCAT并建立內部RCAT的專業知識。
達爾豪斯大學大數據分析研究所、加拿大國防研究與發展部(DRDC)-大西洋研究中心和加拿大通用動力任務系統公司(GDMS-C)向加拿大自然科學與工程研究委員會(NSERC)成功申請了一項名為海軍信息空間自動監測(AMNIS)的三年期資助項目。AMNIS啟動會議于2020年10月14日舉行,許多教授、國防科學家和GDMS-C技術人員參加了會議。會議為這三個組織確定了許多行動。與DRDC和GDMS-C相關的一項行動是需要與任務相關的場景來幫助指導預期的研究。因此,DRDC率先描述了一個有代表性的海陸場景,使研究人員能夠更好地了解與AMNIS有關的潛在研究途徑。制定的方案涉及加拿大皇家海軍(RCN)和加拿大陸軍(CA)執行的一項加拿大人道主義任務。該任務是向一個最近遭受自然災害的國家分發食品和醫療用品。一支敵對勢力還試圖偷竊這些物資。該情景描述了通過更好的處理技術和決策來改善信息流、共享和使用的必要性。該方案旨在引起進一步的討論,并幫助鞏固AMNIS參與者的研究課題。
2015年,加拿大皇家海軍(RCN)的海上信息戰(MIW)概念[1]發布,概述了信息對RCN的影響。MIW的推出使人們非常需要關注信息,它既是皇家海軍使用的一種資源,也是為了更全面地使用和利用優勢而需要理解的一個概念。
該概念文件概述了信息的影響,包括其廣泛的可用性、皇家海軍對信息的依賴性以及信息的使用,特別是在戰爭中和作為戰爭倍增器的跨梯隊的使用。該概念文件還談到需要更好的處理技術來處理MIW功能領域內的數據量,如指揮、控制、通信、計算機、情報、監視和偵察(C4ISR)、指揮和控制(C2)、情報、監視和偵察(ISR)以及態勢感知(SA)。
在MIW概念文件之后,2016年又發布了RCN信息戰戰略文件[2]。這里的重點是發展海戰MIW能力和能力,以支持國內活動(即加拿大的防御)和國際部署。盡管戰略文件指出了信息的更多傳統用途,如收集、利用和傳播,但它也認識到網絡武器領域是一個機動的地方,可以采取防御和進攻的行動。MIW的概念文件涉及物理、虛擬和認知領域,而戰略文件則談到了信息領域,從而表明了信息對于作戰人員的地位和重要性。
在概念和戰略文件之后,加拿大在2017年發布了新的國防政策[3]。該國防政策并沒有明確提到信息領域。然而,該政策確實催生了兩個最近的文件,繼續表明信息對RCN的重要性:2019年的DND數據戰略[4],以及2020年的RCN數字海軍[5]。
數字海軍[5]支持加拿大國防政策[3]的創新目標,特別是那些涉及適應和利用新技術的能力。數字海軍 "作為一個指南,將數字技術與人結合起來加以利用,以確保未來海軍的成功和可持續。這份文件提出的前進方向涉及自動化、大數據分析、云計算、人工智能(AI)和機器學習(ML)方面的創新,成功是指通過上述手段做出數據驅動的決策的RCN。
數字海軍的概念促進了企業和運營RCN社區在決策中對數據的使用。在操作方面,這是為了將海軍團隊和水兵從日常工作中更平凡的方面解放出來,通過自動化功能,如基于規則的重復性任務。從更廣泛的操作角度來看,使用這種數字技術和技巧是為了更好地進行操作。
上面提到的所有文件都指出,希望將RCN推向一個信息組織,在這個組織中,信息是用來使用的,但也被用作防御和安全的工具。由于其中一些方面對RCN來說是新的,因此顯然需要一個由信息科學、人工智能、ML以及將這些與認知科學相結合的專家組成的強大而明智的科學團體,以開發更好的人類決策模型來支持RCN的目標。
通過政府、學術界和工業界合作伙伴的參與,建立了一個強大而知情的科學界。這個群體完全有能力在與現代軍隊相關的科學和技術問題上取得進展,以幫助滿足國內和國外對加拿大武裝部隊(CAF)不斷增長的需求。
為了發展這個社區,在自然科學與工程研究委員會(NSERC)的聯盟計劃下,成立了一個DRDC(大西洋研究中心)、工業界(加拿大通用動力任務系統公司,GDMS-C)和學術界(達爾豪西大學)的伙伴關系。提交并被NSERC接受的提案名為《海軍信息空間自動監測》(AMNIS)。該提案概述了海上和陸地的信息問題,特別是數據整合、事件和警報的ML、信任和對抗性數據,以及信息的可視化和呈現供用戶使用。
為了給學術研究小組提供背景和指導,下面提供了一個大大簡化的行動的基于場景的描述。該方案包括許多問題,表明與AMNIS相關的可能研究途徑。這里的目的是培養研究人員對與DRDC和GDMS-C有關的問題的理解,使研究人員能夠發展自己的思路,幫助他們追求與他們的研究和AMNIS有關的創新方法、技術和發現。
這項工作的動機是基于兩個愿望,即:
1.描述一個現實但簡化的操作,其中存在與AMNIS相關的信息問題,以及。
2.強調在AMNIS項目下DRDC和GDMS-C感興趣的研究領域。
其余各節將提供一個現實場景的發揮、可視化部分、性能建模、決策和學習的概述。每一節都包含了一系列的問題,這些問題的提出有助于為研究工作提供思考點和指導。
第2節描述了一個聯合行動的場景,陸地和海洋部隊共同支持人道主義任務。通過可能被破壞并有相關安全風險的節點相互連接和共享信息資源來實現這一目的。第3節討論了可視化在該場景中的作用及其對決策的影響。這包括物理環境的可視化表示,以及額外信息源的聚合如何影響主題專家的決策。本節還考慮了與人工智能(AI)和多樣化技術合作的人類表現模型。第4節討論了如何利用數據檔案來開發和學習對抗性注入檢測方法。第5節以總結性意見完成了本文。
軍事防御現代化規劃通常涉及復雜的系統,必須了解這些系統,以便為設計、規劃、實施和采購決策提供信息。為了獲得對系統的基本了解并確定關鍵的初始參數,仿真實驗可以用來在一個大型參數空間內有效地生成數據。雖然機器學習模型可用于模擬后的分析,以確定關鍵參數,但當目的是為決策者提供支持時,其可解釋性和黑盒性質會帶來挑戰。在本文中,應用了一種可解釋機器學習預測的模型診斷方法,稱為沙普利加和解釋(SHapley Additive exPlanations,SHAP),用于從基于Agent的模擬中獲得數據,該模擬是一個軍事作戰場景。該場景是由加拿大陸軍對其情報、監視和偵察資產進行現代化的舉措所激發的,并對其進行了抽象化,以盡量減少建模系統的復雜性并驗證SHAP的結論。
關鍵詞:基于Agent的仿真,數據耕耘,可解釋機器學習。
軍事防御現代化計劃通常涉及復雜的系統,必須了解這些系統,以便為設計、規劃、實施和采購決策提供信息--這些決策通常與數百萬到數十億美元的預算相聯系。例如,加拿大政府為實現加拿大武裝部隊(CAF)和國防部的密碼能力現代化,撥款范圍在2000萬到4900萬美元之間,為實現CAF輕型和重型后勤車輛能力的現代化,撥款范圍在10億到49.9億美元之間(加拿大政府2020)。
仿真實驗可以幫助對系統的基本了解,找到穩健的決策或方案,并比較不同決策或方案的優劣(Kleijnen等人,2005)。數據耕耘是指利用仿真實驗在一個大的參數空間內有效地增長數據,以支持決策。它是一個跨學科的協作過程,使用快速原型設計、仿真建模、實驗設計、高性能計算以及數據分析和可視化;詳細概述見Horne等人(2014)。數據耕耘過程可以幫助操作仿真模型,學習仿真模型的行為,并確定關鍵信息,包括輸入和輸出之間的因果關系(Sanchez 2015)。實驗設計應該是靈活的,以考慮不同的元模型、數據挖掘和圖形分析技術,因為通常一種單一的方法將不適合全面評估模擬輸出(Sanchez 2015)。
數據耕耘過程最早在20世紀90年代末提出(Horne 1999),此后被應用于海洋領域(Cheang 2016, Dobias and Eisler 2017, Morgan et al. 2018, Kesler 2019)、陸地領域(Kallfass and Schlaak 2012)、網絡領域(Horne and Robinson 2016)和多領域(Huber and Kallfass 2015, Gordon 2019)等各種軍事應用。數據耕耘已被用于研究各種類型的軍事行動,包括戰斗(Kallfass和Schlaak 2012)、人群控制(Kryza等人2012)、傷員疏散(Featherstone 2009)、空襲(Huber和Kallfass 2015)和國土安全,如關鍵基礎設施的保護行動、海洋環境中部隊保護的非致命武器選擇,以及城市恐怖襲擊的應急響應(Lucas等人2007)。
數據耕耘的挑戰之一是模擬后的分析和可視化。這一步的重點是突出有用的信息,提取結論,并支持決策,這需要高度有效的分析技術,以充分利用可能產生的大量數據(Horne等人,2014)。鑒于機器學習模型處理和評估大數據的能力,它們很適合這項任務。然而,許多機器學習模型的黑箱性質可能具有挑戰性,因為主要目標不是預測而是理解模擬。在以前的數據耕耘的軍事應用中,模擬后的分析往往側重于描述性統計(Huber和Kallfass 2015,Horne和Robinson 2016,Dobias和Eisler 2017)或描述性統計和可解釋性模型的組合,如逐步回歸和分區樹(Featherstone 2009,Kallfass和Schlaak 2012,Cheang 2016,Gordon 2019,Kesler 2019)。
與可解釋的模型相比,在黑箱模型中,如神經網絡或隨機森林,不可能直接有意義地檢查其組成部分并獲得洞察力(Ribeiro, Singh, and Guestrin 2016)。然而,這些更復雜的黑箱模型可以實現更高的預測準確性,在可解釋性和準確性之間形成了一種權衡(Lundberg和Lee 2017)。為了應對這種權衡,已經開發了模型診斷方法來解釋任何機器學習模型的預測。在最近的一個數據耕耘的軍事應用中,Amyot-Bourgeois、Serré和Dobias(2021年)對隨機森林模型的輸出應用了互換特征重要性,這是一種模型無關的方法。特征重要性措施表明每個特征,或數據耕耘背景下的模擬參數,在預測感興趣的結果方面的有用程度。識別重要參數有助于簡化決策過程,但除非能夠理解重要參數和感興趣的結果之間的關系,否則價值有限。SHapley Additive exPlanations(SHAP)提供了一種替代包絡特征重要性的方法,也可用于研究特征的價值與對感興趣的結果的影響之間的關系(Molnar 2021)。根植于博弈論的Shapley值,SHAP的計算要求是NP-Hard;然而,基于樹的機器學習模型有一個低階多項式時間算法,也可用于研究特征的相互作用(Lundberg等人,2020)。
本文擴展了Amyot-Bourgeois、Serré和Dobias(2021)的工作,將SHAP作為模擬后分析的一部分,以評估它是否能對一個模擬的軍事作戰場景提供有意義的解釋。在加拿大陸軍(CA)對其情報、監視和偵察(ISR)資產進行現代化的倡議的激勵下,模擬場景也對ISR支持穩定行動進行了模擬,但考慮了兩種ISR資產定位方案,并納入了一種額外的ISR資產類型。該場景在新西蘭國防技術局開發的基于Agent的模擬環境中實施,該環境被稱為地圖感知非統一自動機(MANA)。選擇MANA的部分原因是它的數據耕作能力,可以利用它在廣泛的參數選項空間內運行模擬。該方案在第2節有更全面的描述。關于模擬參數、實驗設計、指標和模擬后分析方法的細節將在第3節介紹。第4節介紹了仿真實驗和SHAP分析的結果。最后,在第5節中提供了一些結論性意見。
仿真場景是一個簡化的小插曲,它是為了證明利用ISR能力來支持加拿大軍隊的各種任務(加拿大公共工程和政府服務部2020)。它代表了一種情況,即加拿大軍隊將與一個多邊伙伴,如北大西洋公約組織(NATO),領導或促進國際和平行動和穩定任務,這是加拿大國防政策 "強大、安全和參與 "的核心任務之一(加拿大政府2017年)。地點是北約的一個成員國受到一個鄰國,一個非北約近鄰對手的入侵威脅。因此,受到威脅的北約成員國援引了北約第5條,并成立了一個北約聯盟來協助受到威脅的國家。北約聯盟(藍軍,BF)監視邊界,并與任何越境的紅軍(RF)交戰。
下面的表1列出了情景中包括的所有小隊,以及每個小隊的地形和初始位置的表述。紅軍試圖到達藍軍總部(藍軍 HQ)。當紅軍向藍軍總部推進時,它進入了藍軍邊境傳感器的探測和分類范圍。在MANA中,探測是指在某一位置感知到特工的存在,而分類是指將探測到的特工的忠誠度分為友軍(藍軍)或敵軍(紅軍)的行為。一旦探測到并被歸類為敵方,邊界傳感器就會將探測到的特工的忠誠度和位置傳達給邊界總部,后者則提示4、5和6小隊(列于表1)向確定的RF位置移動。4號和5號小隊的任務是與紅軍交戰,而由無人駕駛飛行器(UAV)組成的6號小隊的任務是持續跟蹤紅軍并提示藍軍總部進行間接火力支援。如果所有的紅軍都失去了能力,或者達到了最大的時間限制,模擬就會結束。
表1: 基于Agent的模型中每個小隊的描述和初始位置。
選擇用于參數化的自變量是藍軍邊界傳感器的數量、藍軍邊界傳感器的探測和分類范圍(稱為傳感器范圍)、藍軍邊界傳感器探測到的特工被正確分類為紅軍或藍軍的概率(稱為分類概率)、藍軍邊界傳感器對RF傳感器的隱蔽程度(稱為傳感器隱蔽性),以及藍軍無人機的數量。實驗設計遵循網格狀結構,每個設計點重復進行一百次迭代。表2顯示了參數的范圍。
仿真實驗首先進行,同時保持藍軍邊界傳感器的固定位置,如表1所示為雙傳感器情況,而對于單傳感器情況,則位于兩個傳感器之間的中點。然后重復模擬實驗,將兩個傳感器和單個傳感器隨機放置在與兩個固定的藍軍邊界傳感器之間的距離相對應的方框內(同時在雙傳感器情況下保持20個網格的最小分離距離)。在分析部分,這兩種配置的傳感器部署被稱為固定或隨機的傳感器位置。
表2:變量的參數化范圍。
仿真實驗的目的是評估傳感器組合(即給不同傳感器的配置參數,如表2所列)在情景中的性能。已經提出并監測了幾個指標來評估ISR資產的系統,如第一個探測步驟、所有紅軍坦克的平均探測步驟和探測范圍、探測到的紅軍坦克的比例,以及一些藍軍的生存能力和致命性指標(Amyot-Bourgeois, Serré, and Dobias 2021)。在本研究中,在監測到的指標中選擇了兩個衡量有效性(MOEs)的例子進行更徹底的分析:第一個檢測步驟和檢測到的RF坦克的比例。第一個檢測步驟是指從模擬開始到藍軍傳感器第一次檢測到紅軍坦克并將其分類的延遲時間(以用戶定義的時間步長為1到10,000步,后者是模擬的最大分配時間)。檢測到的RF坦克的比例是指至少被藍軍 ISR資產之一檢測到并分類的RF坦克與RF坦克總數的比率,在整個實驗過程中,該比率保持為10。
該場景使用MANA實現,MANA是一種對抽象表示有用的提煉工具(Anderson 2013)。MANA擁有數據耕耘能力,但可同時變化的參數數量限制在兩個,而且只能與相同的固定小隊相關聯。這使得我們無法使用MANA內部的數據耕作能力來生成各種設計點。然而,方案文件被保存為XML文件,不同的相關參數可以使用XML編輯器直接修改。整套設計點是用Python的ElementTree軟件包生成的,并保存為XML文件。仿真是使用高性能計算進行的,因為總的迭代次數上升到接近200萬次,而且事實證明并行化對減少計算時間很有用。然后用Python腳本處理所有迭代的輸出文件,以提取感興趣的MOEs,并將實驗結果整理成便于模擬后分析的格式。
在機器學習中,主要目標是根據一組特征變量來預測結果或目標變量。在數據農業的背景下,場景參數被視為特征變量,MOE被視為目標變量。根據目標變量是分類的還是定量的,機器學習問題被分別稱為分類問題或回歸問題。隨機森林是一種常見的機器學習模型,本研究之所以選擇它,部分原因是它被發現通常表現良好,只需要很少的模型調整(Hastie, Tibshirani, and Friedman 2009, 590)。隨機森林最早是由Brieman(2001)提出的,它由一大組通過引導訓練數據建立的決策樹組成。每次在樹中考慮拆分時,只有一個隨機的特征變量子樣本被認為是拆分的候選人。正是這個特征抽樣過程使樹去掉了相關性,導致這組樹的平均值比單樹模型的變量更少,更可靠(Gareth等人,2017,320)。然后,隨機森林通過多數票或樹的預測平均值對測試觀測值進行分類或預測。
本研究中關注的兩個MOE,即第一個檢測步驟和檢測到的RF罐的比例,是定量的目標變量。耕耘模擬數據以70/30的比例被隨機分成訓練和測試集。然后使用Python的Scikit-Learn軟件包的0.24.1版本(Pedregosa等人,2011)對隨機森林回歸器進行訓練和測試。使用隨機森林回歸器的默認設置,除了將分裂內部節點所需的最小樣本數增加到30,將葉子節點所需的最小樣本數增加到10,并將最大深度設置為10以限制單個樹的大小。在尋找最佳分割時,確定最大特征數的方法也從默認的使用總特征數改為使用特征數的(近似)平方根。在構建隨機森林時通常選擇平方根法(Gareth等人,2017,319)。為了評估隨機森林的回歸者,使用了決定系數(R2)。R2表示擬合度,是衡量未見過的觀察結果被模型預測的程度(Scikit-Learn, n.d., chap 3.3)。它的最佳分值是1,而0分表示一個恒定的模型(即一個模型總是預測預期的目標值,而忽略特征變量)。它也可以是負數,因為一個模型有可能比恒定模型的表現更差。
SHAP方法計算Shapley值,它基于聯盟博弈理論,代表了一個特征值與數據集的平均預測值相比對模型預測的貢獻(Molnar 2021)。SHAP值是局部解釋(即針對單個數據點),可以匯總起來解釋一個模型的全局行為(Lundberg等人,2020)。作為SHAP值的延伸,Lundberg、Erion和Lee(2019)提出了同樣基于博弈論的SHAP交互值,以直接捕捉成對的交互效應。由于隨機森林是一個基于樹的模型,使用Python的SHAP包中的TreeExplainer可以獲得計算SHAP值和SHAP交互值的高速精確算法(Lundberg等人,2020)。0.38.1版的SHAP包提供了一系列的圖形總結,包括SHAP特征重要性。為便于比較,還提供了互換特征重要性,它是用Python的ELI5軟件包0.11.0版本的算法計算的(ELI5, n.d.)。互換特征重要性類似于Brieman(2001)首次提出的用于隨機森林的方法。它通過確定當一個特征不可用時對模型性能(在本研究中用R2衡量)的影響來衡量其重要性。變量的去除是通過在測試集中用自身的隨機置換來完成的。
表3總結了每個MOE以及固定和隨機傳感器位置的隨機森林回歸器的性能。在所有情況下,隨機森林模型都明顯優于常數模型,后者的R2為零。對于第一個檢測步驟,固定和隨機傳感器位置的特征變量解釋了MOE中80%以上的變異。對于檢測到的紅軍坦克的比例,擬合度沒有那么強,固定傳感器位置的特征變量解釋了MOE中略高于60%的變異,隨機傳感器位置的特征變量解釋了MOE中略低于60%的變異。
圖1和圖2分別列出了第一個檢測步驟的排列特征重要性和SHAP特征重要性,以及檢測到的RF坦克的比例。這些方法在識別最重要的特征方面基本一致,盡管在某些情況下確切的排序有所不同,特別是在不太重要的特征中。在圖1(a)中,傳感器范圍是預測第一個檢測步驟的最重要特征。對于固定和隨機的傳感器位置,如果將傳感器范圍從隨機森林模型中刪除,R2將下降到零以下,表明性能比恒定模型差。在圖1(b)中,傳感器范圍也是最重要的特征。對模型輸出的幅度(即預測的第一個檢測步驟)的平均影響由SHAP值的絕對值的平均值給出。尺度與目標,即第一個檢測步驟的單位相同。在圖2(a)中,有兩個特征對預測探測到的紅軍坦克的比例很重要:無人機的數量和傳感器的范圍。請注意,這兩個特征的重要性順序對于固定和隨機的傳感器位置是不同的。在圖2(b)中,同樣的兩個特征被SHAP方法確定為最重要。請注意,在這種情況下,無人機的數量對于固定和隨機的傳感器位置都是排在第一位的。
表3:隨機森林模型的性能得分。
圖1:第一個檢測步驟的特征重要性總結
圖2:檢測到的紅軍坦克比例的特征重要性總結
雖然標準的特征重要性柱狀圖提供了關于一個特征的相對重要性的見解,但正如Lundberg、Erion和Lee(2019)所述,"它們并不代表該特征對模型輸出的影響范圍和分布,以及該特征的價值與影響的關系"。他們提出了SHAP總結圖作為替代方案,圖3顯示了第一個檢測步驟,圖4顯示了檢測到的紅軍坦克的比例。每個點代表一個設計點的SHAP值,并以相應的單個特征的值來著色,藍色代表低值,紅色代表高值。這些特征按其整體影響(即SHAP值的絕對值之和)排序。正(或負)的SHAP值表示與數據集的平均預測值相比,對預測(模型的輸出)有正(或負)的貢獻。
在圖3(a)和圖3(b)中,傳感器范圍的顏色的平滑漸變表明,隨著傳感器范圍的縮小,模型的輸出(預測的第一個檢測步驟)平滑增加。這種行為在模擬中是可以預期的:第一次檢測一般由邊界傳感器完成,當它們的范圍較大時,它們會更早地進行第一次檢測。當傳感器位置固定時,圖3(a)顯示,當有一個邊界傳感器(藍點)時,與有兩個邊界傳感器(紅點)時相比,第一個檢測步驟比平均時間早(負SHAP值)。對模擬的檢查也證實了這一結果:單個固定傳感器的位置傾向于與穿越邊界的紅軍坦克的路徑一致,使單傳感器的情況比雙傳感器的情況有優勢。在圖3(b)中,SHAP值的模式在傳感器的數量上幾乎完全顛倒。當邊界傳感器的位置在每次迭代中被隨機分配時,在固定傳感器配置中,單傳感器情況比雙傳感器情況的優勢被消除了。因此,在這種配置下,從單傳感器到雙傳感器情況下,傳感器區域覆蓋的增加更加有效,紅軍坦克路徑有更大的機會穿過兩個傳感器覆蓋的區域,而不是一個傳感器覆蓋的區域。
圖3:第一個檢測步驟的SHAP總結圖。
圖4顯示了探測到的紅軍坦克比例的SHAP匯總圖。無人機的數量是對全球影響最大的特征。對于這個特征,藍點代表沒有藍軍無人機的設計點,這降低了模型的輸出(預測檢測到的RF坦克的比例)。這種行為在模擬中是預料之中的:一旦藍軍無人機被觸發,它們就會被送到第一個探測到的RF坦克的位置,在跟蹤它的同時,可以探測到其他RF坦克。因此,擁有一些無人機與沒有無人機相比,可以增加探測到的紅軍坦克的比例。同樣,低傳感器范圍也會降低檢測到的紅軍坦克的比例。如圖3所示,較低的傳感器范圍與較晚的第一次檢測步驟有關,無人機在第一次檢測之前不會被觸發。雖然固定和隨機傳感器位置的三個不太重要的特征的排序不同,但傳感器隱身性的右尾巴長,但左尾巴短,表明在這兩種配置中,高傳感器隱身性可以明顯增加探測到的紅軍坦克的比例,但低傳感器隱身性并沒有明顯減少探測到的紅軍坦克的比例。這可以解釋為隱身性更強的邊境傳感器的生存能力更強,導致使用時間更長,有更多機會進行多次探測。
圖4:探測到的RF坦克比例的SHAP總結圖。
SHAP值側重于特征效應,而SHAP交互作用值則可以將特征效應分解為主效應和交互作用。與SHAP值一樣,SHAP交互值的全球影響也可以通過對單個SHAP交互值的絕對值進行總結。圖5和圖6分別列出了第一個檢測步驟和檢測到的紅軍坦克比例的這些總結。每個圖中的比例代表了特征交互作用的相對全球影響。在圖5中,對于固定的和隨機的傳感器位置,傳感器范圍和傳感器數量、傳感器隱蔽性和分類概率之間的相互作用影響最大。在圖6中,對于固定和隨機的傳感器位置,只有一種交互作用的全局影響遠遠大于其他交互作用:傳感器范圍和無人機數量的交互作用。基本的互動模式可以用依賴圖來進一步研究。為了說明這一點,圖7顯示了傳感器范圍和無人機數量的SHAP交互值。兩種傳感器配置的模式相似,并顯示了在可能的傳感器范圍內檢測到的紅軍坦克比例的明顯轉變。對于低于50的傳感器范圍,相對于沒有無人機,至少有一個無人機增加了檢測到的RF坦克的比例。然而,一旦傳感器范圍至少達到50,這種模式就會逆轉。這可以追溯到模擬中的行為:在另一個藍軍小隊或特工(即邊境傳感器或總部)檢測到至少一輛RF坦克之前,無人機不會參與。一旦邊境傳感器的探測范圍足夠大,無人機的額外探測能力對探測到的紅軍坦克比例的影響就會減少。
圖5:第一個探測步驟的SHAP交互值摘要
圖6:檢測到的RF坦克比例的SHAP交互作用值的匯總。
圖7:探測到的RF坦克比例的傳感器范圍和無人機數量之間的SHAP交互效應的依賴圖。
本文的目的是評估SHAP在基于Agent的模擬中的數據養殖上的使用,以改善軍事行動場景的模擬后分析。雖然機器學習模型,如隨機森林,非常適合于大數據,但當分析的主要目標是獲得對系統的基本了解以告知決策者時,其黑箱性質構成了挑戰。SHAP是一種與模型無關的方法,用于解釋任何機器學習模型的預測結果。TreeExplainer的作者Lundberg等人(2020年)提出,結合許多局部解釋(即SHAP值)可以保留 "對模型的局部忠實性,同時仍然捕捉到全局模式,從而對模型的行為有更豐富、更準確的表述"。
提出了標準的特征重要性柱狀圖,使用基于排列組合的算法和SHAP值進行計算,強調這些圖對模型行為的洞察力有限。雖然這兩種計算特征重要性的方法在確定預測兩個感興趣的MOE的前一或兩個特征方面基本一致,但SHAP總結圖、交互值和依賴圖對隨機森林模型的行為提供了更多的了解。SHAP總結圖顯示了模型的預測對不同特征值的變化(例如,隨著傳感器范圍的縮小,預測的第一個探測步驟平穩增加),并確定了極端值的影響(例如,高傳感器的隱蔽性可以大大增加探測到的紅軍坦克的比例)。SHAP的交互值和依賴性圖提供了進一步的洞察力,以了解所發現的兩個最重要的特征對探測到的紅軍坦克比例的綜合影響。SHAP還成功地識別了固定和隨機傳感器位置之間的關鍵差異,證實了在確定傳感器組合時,位置,而不僅僅是傳感器的數量,是一個重要的考慮。使用SHAP可以驗證所發現的見解,因為模擬場景被有意抽象化,以盡量減少其復雜性并保持對戰場動態的直觀理解。這意味著可以根據對實施的直接了解或通過在MANA中交互運行模擬來查看Agent的行為來確認這些見解。
雖然SHAP在改進模擬后的分析方面表現出了顯著的前景,但它解釋了在養殖數據上訓練的機器學習模型的預測。因此,它不是對模擬場景的直接解釋,在機器學習模型性能不強的情況下,可能產生誤導性的結果。對機器學習模型的適當訓練和測試仍然是模擬后分析的關鍵步驟。盡管如此,這項研究仍然可以用來向決策者展示數據農業的潛力,以及它如何利用抽象的模擬實驗幫助人們對一個復雜的系統有基本的了解。這在軍事現代化項目的早期階段可能特別有幫助;研究結果可以用來確定參數或選項,以便進行更詳細的研究。未來的研究將考慮更復雜的場景和更廣泛的機器學習模型。
MAUDE AMYOT-BOURGEOIS是加拿大國防研究與發展部作戰研究與分析中心的初級國防科學家。自2019年以來,她與加拿大陸軍作戰研究和分析小組的同事合作進行各種作戰模擬研究。Maude Amyot-Bourgeois在加拿大渥太華大學獲得物理學碩士學位。她的電子郵件地址是:[email protected]。
BRITTANY ASTLES自2021年1月起擔任加拿大國防研究與發展部作戰研究與分析中心的學生國防科學家。她之前的工作是利用機器學習研究全球恐怖襲擊趨勢和U型分形事件。她目前是地理學碩士的候選人,專業是數據科學。她的電子郵件是:[email protected]
多年來,加拿大國防研究與發展部(DRDC)一直通過一系列的研討會與軍事人員接觸,評估新興技術對概念、能力和投資的可能影響。本文概述了影響評估框架,該框架已被設計并用于調查一些新興技術的影響。該框架包括定量和定性的措施,以及支持任務所需能力要素的正式清單。該框架的應用通過幾個新興技術領域對加拿大陸軍能力要素的評估結果來說明。被評估的新興技術領域包括量子技術、超材料、人工智能、印刷電子學、人體性能增強、合成生物學、增材制造和其他許多領域。結果提供了關于哪些軍事能力領域和作戰功能將受到所審查技術的最大影響的見解。這種方法為部隊開發人員提供了額外的證據,并支持對能力發展計劃和技術路線圖的審查。
對技術、戰爭、政治和經濟之間關系的研究已經多次提出,未來必須在高度不確定的情況下做出決定。偏見塑造了國家和文化對如何預測未來的偏好。正如W.Chin所指出的,未來戰爭方面的文獻往往過度依賴明顯具有決定性軍事技術的簡單化概述[1]。
國防和安全的作戰環境不斷被競爭和沖突所塑造。雖然軍隊在評估未來作戰環境(FOE)的基礎上發展未來部隊,但它也需要評估趨勢和發展對能力的可能影響[2]。盡管大多數官方的FOE出版物包括對軍事力量的關鍵推論和高層影響,但仍然很少有既定的框架來評估新興技術在能力和概念發展方面的可能影響。
2017年,加拿大陸軍委員會批準將近距離接觸[3]作為未來軍隊(AoT)的頂點作戰概念。AoT是一個不斷發展的概念模型,說明加拿大軍隊在未來15年內應該如何配置、裝備和訓練。理想的AoT將被要求更加連接、敏捷、靈活、整合和強大。正如 "親密接觸"所指示的那樣,需要對政治、環境和技術變化進行持續的地平線掃描和觀察,以便對破壞性變化提供更好的預警[5]。作為風險管理戰略的一部分,部隊組建者需要了解技術發展以評估和利用潛在的機會。他們還需要預測和減輕他們在FOE中可能面臨的潛在風險、威脅和作戰挑戰。技術前瞻性和組織敏捷性是機構復原力的關鍵推動因素。技術優勢當然是任務成功的助推器,但創新文化和靈活的系統將是未來陸軍在作戰中成功的游戲規則。
一些軍隊已經采用了著名的基于能力的規劃(CBP)框架,該框架最初由Paul K. Davis[4]開發,用于支持能力和系統的長期戰略計劃。在加拿大,CBP于2005年被加拿大武裝部隊(CAF)采用。CBP是一種系統的部隊發展方法,旨在為最合適的部隊結構選擇提供建議,以滿足政府的優先事項。CBP過程評估了通過情景分析得出的能力目標。然后,通過對當前和計劃中的能力進行分析,確定并驗證能力的不足和過剩。它支持首選部隊結構的發展。CBP是一個使用場景的過程,這些場景松散地位于FOE中,以評估現有能力在多大程度上可以保持運作,并在不同場景下對任務的成功做出貢獻。CBP過程的主要結果是識別和記錄可能威脅到任務成功的能力差距和缺陷。CBP是關于評估現有軍事能力的準備程度、生存能力和維持能力。
傳統上,新興技術的趨勢是作為FOE的一部分來考慮的,從FOE中推導出一些情景來 "測試 "現有的軍事能力。評估新興技術的綜合方法需要考慮三種不同的應用背景。
機會:新興技術能否被塑造來解決差距和不足,提供新的能力或新的手段來實現效果?
風險:新興技術能否代表新的威脅,需要出口控制或技術保護計劃,加速我們自己技術的淘汰,或降低我們的能力?
環境:新興技術將如何塑造作戰環境?鑒于全球都能獲得新技術,我們在未來的物理和數字環境中會面臨什么?
CBP是在未來部隊結構的設計中創造機會和減少風險的藝術。
文獻中描述了在國防背景下評估新興技術的幾種方法。
顛覆性技術評估游戲(DTAG)是一種方法,最初由北約SAS-062和SAS-082任務組開發[6-8]。DTAG最適合于探索新興技術在軍事場景中的使用如何可能改變行動方案和結果。DTAG使用系統理念(IoS)卡,將幾種技術整合到一個新概念中。DTAG會議通過在軍事背景下進行基于場景的桌面兵棋推演演習,探索IoS的潛在好處。
從能力發展的角度來看,文獻中沒有證據表明,擬議的IoS卡得到了現有技術路線圖或技術趨勢分析的支持,這將有助于能力開發者估計一個新的 "系統 "在可預見的未來何時可以現實地出現和部署。DTAG會議的結果產生了新的技術應用概念,但它們缺乏技術趨勢分析和路線圖的支持,使能力開發者獲得的可操作信息有限。
澳大利亞陸軍采用了由國防科技集團(DST)的科學家開發的威脅、機會、弱點和優勢(TOWS)方法來評估新興技術對陸軍通用功能的可能影響。TOWS技術的描述見[9, 10]。TOWS技術將外部威脅和機會與一個組織的內部弱點和優勢進行比較。結果被用來定義一套行動,以保護組織免受威脅,并使其能夠利用機會。TOWS是專門為推斷行動和戰略而設計的。
表1:技術領域對軍隊一般職能的影響[10]
加拿大國防研究與發展部(DRDC)用于識別和評估新興技術的一些工具和技術已經在2015年的北約IST系列講座中進行了描述[11, 12]。目前,DRDC的計劃將這些工具和技術整合到科技(S&T)展望和風險評估的綜合方法中。圖1說明了從前景掃描活動到提供戰略建議的主要組成部分和邏輯流程。新興技術影響評估研討會每年進行一次,以評估新興技術對國防和安全能力、利益相關者和政策制定者的影響。
圖1:DRDC的科技(S&T)展望和風險評估計劃。
DRDC的科技展望和風險評估計劃的所有活動都是按照四步程序進行的,首先是進行前景掃描活動,以確定新出現的利益趨勢,然后收集和分析信息,以發展關于這些利益趨勢的技術情報。然后評估新出現的技術趨勢對國防、安全、政策和立法的可能影響。評估的結果被用來為計劃、能力和伙伴關系方面的決策提供信息。
在所有的未來情況下,任務的成功和有效性依賴于執行任務所需能力的可用性、準備性、穩健性和彈性。新興技術的潛在影響需要在所有作戰功能中進行評估,以確定哪些能力可能從中受益,哪些可能面臨風險。加拿大陸軍使用五個核心作戰功能:指揮、感知、行動、防護和維持
指揮 - 建立共同的意圖和管理指揮的必要結構和程序。作為一項作戰功能,指揮部是其他四項作戰功能的紐帶。指揮部是將所有作戰功能整合到一個全面的戰略、作戰或戰術層面的概念的作戰功能。
指揮部的運作功能由一些關鍵能力支持,包括:
表1:支持指揮職能的能力。
指揮與控制網絡 | 安全、穩健、多級和移動通信系統,允許在所有適當級別進行網絡化指揮。 |
規劃和決策支持系統 | 態勢感知(SA);協作規劃工具;建模與仿真 |
JIMP連接性 | 聯合、機構間、多國和公共 (JIMP) 連接 |
感知 - 一個單一的綜合實體,收集、整理、分析和顯示各級數據、信息和知識。戰術、行動和戰略資產被整合為一個單一的連續體。感知是為指揮官提供知識的操作功能。感知功能包含了所有收集和處理數據的能力。
“感知” 的操作功能由一些關鍵能力支持,包括:
表2:支持感知功能的能力。
地面傳感器網絡 | 雷達;光學 |
空中和戰略傳感器網絡 | 無人機;衛星;網絡 |
情報系統 | 圖像;信號;社會文化;地理空間;人類;開放源 |
行動 - 使用一種能力來影響整個沖突范圍內物質和道德領域的事件。行動反映了對各種來源的能力的整合--戰術、行動或戰略。行動是整合了機動、火力和信息戰的作戰功能,以達到預期效果。它是聯合火力和影響活動的結合,通過機動和對作戰環境的管理而同步和協調。
該法案的運作功能由一些關鍵的能力支持,包括:
表3:支持行動功能的能力。
火力 | 直接火力武器;間接火力武器;遠距離火力;聯合火力;定向能武器 |
機動 | 裝甲車;輕型車輛;自主系統;戰術空運;沿岸船只 |
信息作戰 | 電子戰;心理作戰;計算機網絡作戰(防御、攻擊、利用)。 |
防護 - 為促進任務成功而采取的部隊保護措施,通過管理風險和盡量減少人員、信息、物資、設施和活動在所有威脅下的脆弱性,維護行動自由和行動效率。防護是保護部隊、其能力和行動自由的業務職能。防護功能可以保護部隊免受常規和不對稱的威脅,適用于國內、大陸和國際行動。
防護作戰功能由一些關鍵能力支持,包括:
表4:支持盾牌功能的能力。
火災防護 | 保護基礎設施部隊、個人、車輛、武器、設備和物資免受直接和間接火災的傷害;戰斗識別(反自相殘殺) |
GBAMD | 地基防空和彈藥防御 |
避免爆炸性危險 | 簡易爆炸裝置(IED);誘殺裝置;地雷 |
化學、生物、輻射防御 | 防范化學、生物、輻射、核威脅;環境和職業健康與安全 |
保護免受心理威脅 | 反心理學行動 |
維持--產生、部署、使用和重新部署一支部隊所需的所有功能的組合。"維持"是支持行動的再生和維持能力的操作功能。
"維持"行動功能由一些關鍵能力支持,包括:
表5:支持維持功能的能力。
陸地設備系統 | 維修設施;前方維修;回收 |
材料和分配系統 | 總資產可見度;倉儲;供應;食品服務;陸路運輸;空運;集裝箱化 |
行政系統 | 財務服務;人事管理;停尸服務;牧師;法律服務;郵政服務;娛樂設施 |
衛生服務系統 | 醫療設施;傷員后送;醫療和牙科治療;醫療用品;健康報告;預防醫學(身體和精神)。 |
除了作戰功能外,還考慮了部隊生成能力。一些新興技術可能會影響到部隊生成的各個方面。例如,增強現實和虛擬現實技術正被越來越多地用于加速訓練。它們還為平臺的現場維護和修理提供了新的手段。在CA的背景下,部隊組建得到了一些關鍵能力的支持,包括:
表6:支持部隊組建的能力。
組織力量產生的結構 | 單位;旅;師;訓練機構;靶場和訓練區;總部 |
兵力投送 | 國家維持基地;戰略交通線;戰區維持(包括工程支持);空運;海運;APODs/SPODs |
通常情況下,新興技術影響評估研討會以一個或多個主題專家(SME)的展望簡報開始。中小企業有責任介紹該技術領域并描述其潛在的應用。他們還提供有關被審查的新興技術領域的新興趨勢和主要領導人的有用信息,以及對該技術目前的成熟度、限制、局限性和科學界面臨的挑戰的概述。
圖2:研討會過程。
根據中小企業提供的信息和個人的專業知識,研討會參與者被要求使用簡單的李克特量表評估新興技術領域對陸軍能力的潛在影響,從0(無影響)到7(非常大的影響)。評級過程確保參與者考慮到每個作戰功能的所有能力領域的影響。通常情況下,在考慮一項新興技術的潛在影響時,參與者已經想到了一個具體的能力領域。使用一個系統的能力評級過程,可以確保"不太明顯"的影響領域也在研討會上得到考慮和討論。
圖3:評級過程和尺度。
在研討會上,"影響"的定義是:解決現有的差距和缺陷;解決持久的問題(如士兵的負擔);改善現有的能力;引入新的概念和能力;破壞或否定現有的能力;使任務面臨風險(多種風險類別)。
在第一輪個人評估后,將結果提交給研討會參與者,以激發小組討論和辯論。小組討論提供了機會,以交流對新興技術的看法,要求中小企業提供額外的技術細節和清晰度,挑戰假設,并試圖填補 "高不確定性所固有的知識空白"。小組討論后,再進行第二輪評估。這種方法有助于衡量和減輕 "群體思維"的影響。
在研討會上收集的數據用兩種不同的方法進行分析。第一種是依靠DRDC的科學家在2006年開發的統計工具來進行多標準分析和排名共識(MARCUS)。MARCUS[14, 15]是一個產生共識結果的有用工具。MARCUS的特點之一是它能正確處理排名中的并列關系,能容忍不完整的排名,并在必要時允許單個排名在確定共識排名時具有不同的權重。
下面的例子顯示了小組討論前后評估的微小差異。在這個特殊的案例中,在小組討論之前,評估認為情報系統(5)將受到人工智能(AI)發展的最大影響。在小組討論后,與會者評估說,規劃和決策支持系統(2)將受到最大影響。
圖4:小組討論前后,MARCUS對人工智能應用在20種軍隊能力上的排名
用于分析數據的第二種定量方法是對所有參與者對每個能力領域的評分應用一個簡單的平均函數,如圖5所示。此外,在研討會期間還收集了參與者的定性評估,以便為個人評級提供額外的理由和背景。結果被用來確定哪些能力領域和作戰功能將受到所考慮的新興技術的最大影響(技術觀點),并確定哪些新興技術將有助于塑造整個作戰功能的未來能力(操作功能觀點)。自2014年以來,CA一直在舉辦一系列的研討會,以評估幾個新興技術領域的潛在影響。
如圖5所示,累積結果表明,支持指揮功能的能力將受到人工智能(AI)應用、人類性能優化和修改(HPO、HPM)發展以及量子科學(QS)應用的顯著影響。量子技術有望提供下一代的加密能力,可以提高指揮和控制(C2)網絡的安全性。
圖5:新興技術領域對CA運行功能的影響程度
結果還表明,在未來15年以上的時間里,支持理智功能的能力將受到幾種新興技術的顯著影響。人工智能(AI)的快速發展,以及量子科學(QS)、超材料(MM)和印刷電子(PE)的發展,將有助于塑造未來的感知能力。
對于支持行為功能的能力,結果表明它們將受到人工智能、文化行為模型(CBM)以及培訓、教育和演習5(TEE)新模式的影響。機動能力將大大受益于人工智能的發展,特別是在機器人、自主車輛和蜂群的應用領域,但也可以通過人工智能的增強現實技術為下崗士兵服務。量子傳感器的發展將提供更精確的定位、導航和定時(PNT)系統,以提高在GPS缺失環境下的機動能力。
支持防護功能的能力也將受到幾個技術領域的重大影響。材料科學和個人防護設備(PPE)設計的發展顯然將塑造未來的防火能力。化學和生物檢測和保護(CB DP)的進步將有助于增強或新的CBRN防御能力,同時合成生物學(SB)和人體性能優化(HPO)的發展也將有助于增強或新的CBRN防御能力。量子科學(QS)預計將提供新的傳感器,以實現對爆炸性危險的遠距離探測和規避。
在支持 "維持"功能的所有能力領域中,衛生服務系統是未來15年內變化最大的領域。合成生物學(SB)、人體性能優化(HPO)和改造(HPM)的發展,以及個人防護裝備、化學和生物檢測和保護(CB DP)的發展,培訓、教育和鍛煉的新模式,以及來自印刷電子(PE)的可穿戴和植入式傳感器,預計將對未來的衛生服務系統產生重大影響,前提是有適當的政策和立法。
年度新興技術影響評估研討會是支持能力發展和實施國防創新計劃的關鍵。它們匯集了科學家、學者、工程師、政策制定者、項目管理人員、法律顧問和軍事人員的專業知識。自2014年成立以來,新興技術影響評估研討會為國防能力、科技合作計劃和伙伴關系的戰略投資決策提供了信息。例子包括。
采用部門的量子科技戰略。
加拿大軍隊人工智能概念文件和技術路線圖。
提交給國防部(DND)"創新促進國防卓越和安全"(IDEaS)計劃的新的創新挑戰。
在新興技術領域的新FVEY活動,如超高分子量聚乙烯(UHMWPE)。
幾個國防和安全政策問題簡報。
對敏感技術和出口控制的系統性審查6。
任務的成功和有效性取決于用于實現效果的能力的可用性、準備性、穩健性和復原力。長期的戰略能力發展計劃需要識別和評估新興技術對所有作戰功能的潛在影響,以了解哪些能力可能受益于這些技術,哪些可能面臨風險。為了支持這種評估,我們設計了一個框架,其中包括定量和定性的措施以及支持任務所需的能力要素的正式清單。通過對加拿大陸軍能力要素的幾個新興技術領域的評估結果,說明了該框架的應用。自2014年第一次迭代影響評估研討會以來,累積的結果提供了寶貴的見解,即在未來15年內,哪些軍事能力領域和作戰功能將受到審查技術的最大影響。
表A-1: CA評估的新興技術領域
[1] Chin, Warren, “Technology, war and the state: past, present and future” International Affairs 95: 4, 2019
[2] Sullivan et al. Mad Scientist: Disruption and the Future Operational Environment Final Conference Report 25 July 2019
[3] Kaduck Anthony (LCol), Ron Bell (LCol), Peter Gizewski, Close Engagement. Land Power in an Age of Uncertainty, Kingston, 2017.
[4] Davis, Paul K., Analytic Architecture for Capabilities-Based Planning, Mission-System Analysis, and Transformation. RAND MR-1513
[5] Chapman B. and Gisewski P., Army 2040 Seminar. A Methodology to Address Capability Development in an Uncertain Future. 30th International Symposium on Military Operational Research (ISMOR), 2013
[6] NATO-SAS-082, Disruptive Technology Assessment Game. Evolution and Validation, RTO Technical Report TR-SAS-082, 2012.
[7] H. And?s, B. Damsgaard, G. Kindvall, E. R?nnberg, S. O. Solheim and M. Suojanen, Emerging Technology Concepts and Defence Planning in the Nordic Countries, FFI-NOTAT Eksternnotat 16/00336, 2016.
[8] G. Kindvall, A. Lindberg, C. Trané and J. Westman, Exploring Future Technology Development, FOI- R- -4196--SE, 2017.
[9] Pincombe B. and Dexter P., The Possible Effects of Potential Key Technological Developments on the Force Structure of the Australian Army in 2040. DSTO-GD-0862. 2014
[10] Dexter P. and Krysiak, K. “Assessing the impact of emerging technologies on the Australian Army”. 20th International Congress on Modelling and Simulation, Adelaide, Australia, 1–6 December 2013
[11] Auger, A. Emerging and Disruptive Technologies Impact Assessment. NATO IST 135 Lecture Series. STO-EN-IST-135. 2015
[12] Auger, A. Identification of Emerging Scientific and Technical Trends Using Scientometric Analysis. NATO IST 135 Lecture Series. STO-EN-IST-135. 2015
[13] Holland-Smith, D.J. On the Risk from High-Impact, High-Uncertainty Technologies. NATO IST 135 Lecture Series. STO-EN-IST-135. 2015
[14] Emond, E. J., Developments in the Analysis of Rankings in Operational Research. DRDC CORA TR 2006-37; Defence R&D Canada, December 2006
[15] Tania Yazbeck and E. J. Emond. Multi-Criteria Analysis and Ranking Consensus Unified Solution (MARCUS) -User Guide DOR(CORP) Research Note RN 2004/13. 2004
[16] Auger, A. Emerging and Disruptive Technologies Impact Assessment Workshop. Results from 2015, DRDC-RDDC-2016-L328, Ottawa, Oct 2016.
[17] Auger, A. Impact of Selected Emerging Technologies on Canadian Army Capabilities. Results from Emerging and Disruptive Technologies Workshop, Dec. 2017 DRDC-RDDC-2018-R152. May 2018
[18] Gunashekar S., et al. Oversight of science and technology. Learning from past and present efforts around the world. RAND Europe report, 2019. RR-2921