這篇文章概述了軍事行動規劃過程中的一個獨特階段,即兵棋推演。作為軍事藝術領域的專家,兵棋推演是決策過程的一個特殊方面,它提供了根據作戰環境的某些變量來確定最佳反應方案的可能性。因此,在這種方法中,將從有關該領域的出現和發展的主要歷史里程碑開始,以便以后可以介紹兵棋推演的某些特點,在這種情況下,將能夠確定該領域的一般理論,然后制定一系列的行動方向,以適應可能的敵人的可能行動路線。軍事藝術的發展,軍事戰略家的經驗,新技術的出現,以及戰術對戰場變化的適應,代表了進行戰爭和兵棋推演的方式的一個里程碑。這個領域唯一不變的是,人類的想象力是無限的,只能希望軍事專家能找到適當的解決方案,把虛構的東西變成現實。因此,不僅針對專家,而且也針對那些處于軍事生涯初期的人,提供該領域的觀點。
本文打算用科學的觀點分析的主要議題是兵棋推演理論,主要目的是確定其可能的演變以及該理論可能影響軍事行動的方式。
為了達到這個目的,對兵棋推演的演變進行了歷史分析,同時更加關注指揮官可以從戰斗模擬中獲得的優勢。接下來,從軍事理論、手冊和指示中規定的概念出發,利用假設-演繹分析,將強調兵棋推演對作戰方案的主要影響。
在本文的最后,將根據在開始時提出的分析,提請注意結論。
選擇這個主題進行分析的動機是由于俄羅斯-烏克蘭沖突的臨近,以及需要確定一種方法來預測它對國家利益可能產生的任何影響。
研究的新穎性在于分析兵棋推演的演變和建立這些模擬發生的總體框架的具體程序之一,更加關注羅馬尼亞國防大學的演習和培訓項目中最常用的方法。
人類建立和平和全球和諧的沖動,迫使領導人找出各種方法來化解緊張局勢,結束武裝沖突或戰爭,或至少減少人力和技術損失及財務成本。從這個角度來看,模擬戰斗的重要性是毫無疑問的。在不涉及部隊調動或人命和設備損失的情況下,擁有確定優勢和劣勢、脆弱性、關鍵能力和行動成功所需的其他一切的選擇是非常重要的,并提供了在較短時間內評估許多行動方案的可能性。
很長一段時間以來,歷史學家和哲學家都在努力回答眾多復雜的問題。在所有這些問題中,可以找出一個與武裝沖突有很大關系的問題,即兵棋推演。從我們的角度來看,人類是否首先面臨戰爭或發展出模擬的戰斗并不重要。我們認為,最重要的事實是,根據人類的本性,一方面為了提高戰斗的效率,另一方面為了拯救生命,我們不遺余力。看來,這兩種對立的感情,共同生活在我們的頭腦中,對社會的進步是最重要的。因此,其中一個分支的發展誘發了對另一個分支的對稱性影響。就像戰場上的戰術或技術被開發或發明一樣,兵棋推演的技術和方法也在同樣的程度上被調整和改進。因此們可以看到,戰爭模擬的歷史與戰斗方式的歷史有著密切的聯系。因此,為了完成有關兵棋推演歷史的研究,必須集中精力研究武裝戰斗的歷史、技術的發展以及戰術和戰略的演變,因為所有這些都影響著模擬過程。
要確定哪種戰爭或兵棋推演在人類歷史上最早出現是非常困難的。考慮到每場沖突和每場游戲都是以戰略為基礎,以取得勝利為目的,我們很容易觀察到這兩個概念之間的緊密聯系。因此,根據一些研究人員的說法,國際象棋和圍棋游戲的復雜性是一個強有力的論據,這兩種游戲可能是現代戰斗模擬的靈感來源(Goria 2011, 1 - 16)。此外,真正的游戲大師都有那種獨特的能力,在對手面前掩蓋自己的真實意圖,這正是軍事藝術的精髓: "一切戰爭都建立在欺騙的基礎上"(Tzu 2000, 3)。即使出于這個單一的原因,我們也傾向于宣布這兩種古代游戲和那個時代的戰斗方式之間一定有非常密切的聯系。更重要的是,當涉及到國際象棋時,游戲人物(國王、皇后、主教、騎士、城堡和步兵)和戰斗單位的細節之間的相似性是顯而易見的。這種相似性和女王在很長一段時間內被稱為將軍或首相的事實(Dunnigan 2005, 140),以及游戲的結束與國王的投降相吻合,國王是一個國家和軍隊的象征和最高代表,這也證明了國際象棋游戲是一個原始的嘗試,在一個平坦的、小的表面上轉述戰場事件,始終由最高指揮官支配。
如上所述,戰爭的發展和模擬戰爭的演變是相輔相成的。因此,由于軍隊作戰領域的發明和創新改變并擴大了沖突的規模,同樣,用來想象行動路線的游戲也重新調整,以面對新的挑戰。我們認為,在對戰斗模擬的進展有重大影響的眾多因素中,地理地圖的發現和使用是最重要的。從這一點出發,規劃者和工程師們能夠更貼近現實地模擬部隊的行動,有機會根據戰場的多樣性、河流或其他困難地形的存在與否,確定特定部隊的覆蓋距離。此外,該技術還影響了戰爭的進行方式。每一個新的突破都會在軍事領域得到應用,或者提高標準戰斗單位的能力,或者創造新的特定單位的必要性。在歷史上的每一個時刻,所有這些由技術引起的變化都被要求成為新模擬的一部分。因此,由64個規劃好的格子組成的棋盤已經過時了,取而代之的是地圖,其準確性完全取決于研究和模擬戰場的技術可能性。此外,每個國際象棋的16個數字讓位于代表師、營或連的可變數量的物體,根據其在戰斗中使用的主要特點進行編碼。1650年左右,在普魯士,所謂的Koenigspel(國王游戲),除了所謂的第一個 "兵棋"之外,沒有別的東西出現,包括在一個更大的棋盤上顯示不同數量的人物,反映了十七世紀戰爭的現實。被認為是第一次模擬海上沖突的游戲被認為是在十八世紀下半葉首次組織的,當時使用小木片代表的戰艦,玩家設法模仿真實的海上戰斗行動,甚至風對船只的影響或對敵人戰艦的射擊效果(Goria 2011, 1-16)。
兵棋推演的重要性是無可爭議的。每一個新的假設、理論、戰略或戰術都可以在不涉及大量部隊和設備的情況下進行測試,這意味著成本的大幅降低,并有機會投資于軍事人員的更好準備或軍事單位和戰斗設備的現代化。另外,在我看來,正是在這個時期,兵棋推演玩家的專業化成為一種絕對必要。因此,除了最高指揮官和其他指揮官之外,諸如操作員、維護人員或工程師等職能部門也開始嶄露頭角,對模擬的準確性變得不可或缺。此外,模擬被用來驗證這些創新,并將其應用于未來的戰斗(Goria 2011, 1-16)。在改變戰略或戰術之前,指揮官有機會在戰斗前進行測試,并根據游戲的結論,決定是否在軍事行動中應用它,節省了大量的資金,更重要的是,挽救了他們同志的生命。
航空和潛艇的出現是進行戰爭和兵棋推演方式的一個里程碑。它迫使工程師們超越想象力的極限,以創造一個盡可能準確的虛擬現實。從這一點來看,經典的戰斗模擬已經過時了,一方面是由于高速的空中作業,對操作人員來說是一個真正的挑戰,另一方面是由于要求對戰場進行三維表現,以便在行動中引入潛艇。正是信息技術的發展--IT--解決了這個巨大的問題。信息技術對游戲模擬的巨大影響是難以想象的。突然間,幾乎任何東西都可以在計算機的顯示屏上可視化。似乎沒有什么是不可能的,唯一的限制在于人類想象力的限制。從現在開始,以非常低的成本,成千上萬的模擬,發生在世界不同的地方,有不同的戰斗人員和設備,可以在同一臺設備上使用,位于遠離戰場的地方,返回更多的數據。所有這些都是在一個非常短的時間內完成的,涉及的額外工作人員數量減少,因此提高了安全水平,減少了信息泄露的風險。
越來越多的非軍事專家參與到武裝沖突的模擬中來,直到一家公司產生將這一概念用于民用目的的想法只是時間問題。這發生在1958年(Dunnigan 2005, 141),當時一家專門的公司決定為平民創造一個版本,這是游戲模擬歷史上的一個真正的轉折點。有可能在很短的時間內測試不同的理論,用人較少,更重要的是大大降低了成本和風險,這使得民間領導人集中資源開發這種應用。民用環境中前所未有的快速變化速度只有計算機的發展才能與之相匹配。從這一點來看,人類歷史在幾乎每一個活動領域都是軍事和民用技術的混合體,尤其是仿制軟件。兵棋推演,通過對軍事資產的高度模仿,代表了突出這種融合的無可爭議的證據。在這些視頻游戲中,艦船、飛機或坦克的設計具有看不見的準確性,它們的行動受到戰場現實的嚴格限制。也許,這些游戲最重要的優點是它們面向所有人,無論他們的年齡或職業如何,讓工程師和規劃師對他們的工作有一個更好的、不受限制的反饋。
因此,回顧了兵棋推演的歷史,看看軍事行動、戰術和戰略的演變是如何影響戰斗的模擬的。戰術游戲的目的是通過軍隊演習再現一場特定的戰斗來確定一些重要的經驗教訓,或者提出最佳的解決方案,以便在未來的武裝沖突中盡量減少損失并取得勝利。我們強調,大多數戰術演習和戰略都可以用這個系統進行測試和驗證,以便通過減少成本和軍事人員及設備的損失來簡化一個國家的整個防御過程。
此外,在我們看來,這種信息可視化工具使我們能夠進行競爭性情報實踐,并有可能通過其表現形式增加信息的價值。另一個優勢是將有關作戰環境的問題擴展到識別與具體軍事行動相關的威脅和機會。在這個想法的延續中,決策者可以確定一個行動的主要影響所在。
最后,由于無法預見新技術的突破,幾乎不可能預測未來戰爭模擬的設計。我們只能想象,新的量子計算機的發展將在這一領域產生。這個過程中唯一不變的是,人類的想象力是無限的,只能希望我們的智力能夠找到適當的解決方案,將看似虛構的東西轉化為未來的現實。同樣重要的是,互聯網為我們提供了必要的基礎設施,使我們的設備能夠以光的速度從世界的一個角落傳輸信息,這一優勢可用于各種目的,如軍事合作、模擬不同國家的戰斗單位的整合或教育過程中。
在歷史上,偉大的將軍們明白,預測是很難實現的,因此,他們最重要的能力是找到新的和更好的方法來分析對手,并盡可能多地識別敵人的行動方案。不僅如此,戰斗模擬成為計劃過程中最重要的步驟之一,它提供了評估自己的行動方案與對手的行動方案完成任務的潛力的可能性,并能正確地識別不足之處。然而,兵棋推演的真正價值在于它能讓指揮官和參謀人員同步和可視化地開展行動。它可以幫助預測可能發生的事件,識別潛在的風險和機會,可能需要對抗和利用不同的情況,最終目的是取得勝利(SMG-3 2016, 125)。為了最大限度地發揮兵棋推演的作用,聯合行動規劃組(JOPG)應考慮到各種因素,如:可用于規劃和執行的時間、需要發揮的關鍵事件、下屬參與的必要性、指揮官的支持以及與相關國家和國際行為者的合作、兵棋推演的類型--人員估計、地圖演習、行動分析(SMG-3 2016, 125)等,最大限度地提高模擬效率。從我們的角度來看,兵棋推演的成功與任命一名協調員嚴格相關,其主要目的是進行模擬的準備工作,并保持對參與過程的每個行為者的客觀態度。
研究兵棋推演的計劃過程和不同的方法,可以發現,通常情況下,模擬過程包括幾個階段,如:設定條件、進行游戲回合和評估。雖然這些階段都有特定的格式,但JOPG應該永遠記住,靈活性是一個優秀官員最重要的品質之一,因此,他們不應該局限于此。一般來說,設定條件階段是一個介紹,列出影響行動的戰略和行動條件,包括政治考慮、威脅的性質、環境、民事、媒體、信息條件等。此外,進行游戲回合是指在行動-反應-反行動的類型上進行一系列的游戲,每次都把主動權交給對手。最后,評估包括對每輪游戲后可能出現的結果和結論的評估,用于確定下一輪游戲的條件。
游戲以 "行動 "項目開始。發起這一行動的小組負責人(A部分)將提出自己的COA部分,并對其進行分析,強調其間發現的威脅。這個介紹還將包括要實現的目標、部隊本身采取的措施、確定的詳細程度、所有可用的部隊和能力、分配的任務、計劃的作戰行動的描述以及部隊的部署和機動。接下來,此舉中的 "反應 "要素,對于確定A部分在 "行動 "中采取的哪些行動可以被發現/確定是非常重要的。"反作用力 "是結束行動的要素。這是該循環中最靈活的元素。A部分的代表將就 "反擊 "中提出的行動/威脅提出他的選擇(SHAPE 2013, 4.73-4.81)。
基于上述方面,可能有必要修改自己的COA。在兵棋推演的執行過程中,不對COA進行大的修改,停止進程,進行修改,恢復游戲。每個周期的分析階段的目的是在同步矩陣中記錄由游戲主管確定的信息和由此得出的結論。在 "行動"、"反應 "和 "反反應 "中記錄的結果將由參與者進行評價。根據所選擇的兵棋推演的玩法,下一個周期在時間上可能與前一個周期密切相關,或者代表一個新的環節的開始,在空間和時間上錯開。
在一場良好的兵棋推演之后,聯合行動小組可以得到許多結論。根據軍事文獻和資料,兵棋推演最重要的結果包括:驗證自己的行動方案,確定決定性的要點,需要制定變通計劃或/和替代方案,應該發送給指定機構的新信息要求,行動的同步性,確定每個COA的優點和缺點,風險評估和確定減少風險的方法,更新初步估計,更新成本,建議修改交戰規則(ROE)或確定機會和脆弱性,額外的力量和能力要求,損失估計,等等。(NWP-5-01 2018, 4-21)。在所有這些中,我們可以得出結論,兵棋推演可以改善一些規劃方面的問題,如在空間和時間上對計劃行動的各個階段進行接續,部隊之間所需的協調程度,參與行動的部隊的同步性,確定必要的自身能力和部隊的戰斗力等。
兵棋推演的結論支持工作人員建立執行行動的部隊組織,部隊行動在時間和空間上的同步,以及實現決策支持矩陣。為此,所有在兵棋推演后提供的數據必須以這樣的方式記錄下來,以方便比較路線和制定作戰計劃的活動。有兩種已知的方法可以做到這一點:同步矩陣和課程分析工作表。這兩種方法都支持參謀部記錄所有關于確定的優勢和劣勢、下屬單位的額外任務或必要的指揮控制系統的組織的意見。
在羅馬尼亞國防大學形成的經驗使我們有機會參加各種演習,其主要目的是說教,結果我們能夠列出在這些演習中從兵棋推演中獲得的一些結論:分析小組改進了任務的部隊組織,并設法制定了一個同步矩陣。另外,他們也更容易確定每個作戰行動的優勢和劣勢,確定變體和替代方案,或確定一些可能影響實際行動發展的風險。此外,規劃者能夠直觀地看到并改進河海之間軍事行動的連續性和同步性,評估并改變監視和打擊的路線,重新考慮已接受的風險等。
從眾多可以進行兵棋推演的方法中,根據我們的經驗,我們可以確定一些適合于教學目的的兵棋推演:行動階段的兵棋推演;穿越決定性點的兵棋推演;作戰環境的分段兵棋推演(SMG-3 2016, 125-129)。
行動階段的兵棋推演的發展包括通過兵棋推演分析集結部隊的主要任務,與行動的一些階段有關,在時間上明確界定,與該階段相關的目標有關。就結果的保真度而言,這個模型是基于預先定義的場景,參與者在其中進行決策干預。因此,人工作戰的一個主要缺點是,事件的結果和順序受到參與者的決定的影響。其優點是可以精心選擇階段,使兵棋推演能夠在短期內對可能的情況進行真實的描述。另外,游戲中一個階段的錯誤不會影響下一個階段的分析。在這種情況下,規劃者面臨的挑戰是確定計算機輔助戰爭的解決方案,決策者可以在最小的誤差下做出決定(SMG-3 2016, 125- 129)。
通過決定性點的兵棋推演的發展包括實現兵棋推演,其中分析的要素是基于需要滿足一些決定性的條件,由集合的部隊的主要任務定義。決定性的地點導致了敵人的重心。轉折點代表軍事行動的那些關鍵時刻,允許過渡到下一個階段,因此,決定性點的連續導致達到擬議的最終狀態。這種方法的優點是有具體的可能性來量化結果,無論是在手動兵棋推演中還是在輔助游戲中。缺點是,對一個決定性點的錯誤分析,在一個級聯中,會導致錯誤傳播到后面的決定性點分析(SMG-3 2016, 125-129)。
對作戰環境的各個部分進行兵棋推演的方法包括確定通過分析不同行動領域特有的主要任務而獲得的結果。這樣做的好處是,針對一種行動手段的任務不會影響對另一種行動手段的分析結果。缺點是,對一個共同的任務進行分析,與兩種行動手段有關,會產生不同的效果,而不能確定錯誤在哪里(SMG-3 2016, 125-129)。
經過個人實踐,能夠推薦一些在戰術層面進行兵棋推演的方法,這些方法可以單獨使用,也可以組合使用:
如果在作戰區域內有明確劃分的方向,那么縱深大道法就適用于進攻和防御行動路線。基于對所有被分析力量的決策點、關鍵事件和重心的分析,這種方法是兵棋推演法的對應物,用于穿越作戰層面的決定性點。
使用條帶法,作戰區域將被劃分為橫向條帶(橫跨作戰區域的寬度),戰斗的組成部分將被分階段分析。這是一種很好的分析方法,因為它提供了關于影響某一事件的所有力量的信息,這就是為什么特別推薦它用于發生在大空間的行動(延遲行動、接觸推進)、分析行動的不同階段(逼迫河流)或當敵人被分組在明確界定和確定的梯隊中時。這種方法有助于我們按順序分析沿指定地帶的整個戰線所進行的行動,但建議包括屬于鄰國的部分地帶,以評估他們的行動對自己部隊行動的影響。
盒式方法包括對某些地區、部門、就業區的關鍵事件進行分析,劃定的區域被隔離開來,模擬嚴格按照該區域進行。這種方法涉及到將兵棋推演的發展集中在某一地理區域,在該區域必須達到某種效果。采用這種方法,要考慮到所選區域的劃定,要考慮到地形的一般特點、自己部隊的排列、行動的敵人的行動區域、具體的地理邊界(由湖泊、河流、三角洲、海灘、山脈、道路通訊等劃定)。當軍事行動計劃在由主要地理特征劃定的行動區域內進行時,就會使用這種方法。
區域法涉及將行動率細分為作戰區域內的子區域。每個子區都對應著一個要分析的時間段。使用這種方法時,規劃組將區域隔離開來,重點關注該區域內的關鍵事件。
基本任務的接續方法是最方便的方法之一。這種方法涉及穿越COA的一個或多個時間段。將COA分成時間段可以通過兩種方式進行。一種程序是將COA劃分為具有相同時間間隔的片段,對所有己方和敵方的COA(OPFOR)都是一樣的。另一種程序是將COA劃分為具有靈活時間間隔的片段,與戰術序列相對應。基本任務的繼承方法允許確定執行基本任務獲得成功的方式,并確定發展下一階段行動的條件。它還提供了根據對手的某些可能反應來審查行動方案的可能性。
綜上所述,我們認為軍事規劃人員有足夠的工具來分析強調COA發展的指數和警告,其依據是尊重規劃、分析和優化決策的最基本原則的兵棋推演的結果。所介紹的兵棋推演方法,以及該領域的特殊性,提供了發展分析可能情況的可能性,以做出明智的決定。
根據理論戒律,在虛擬環境中最廣泛使用的兵棋推演原則與行動的類型、目的和結構的任務以及情景中列出的初始條件有關。情景提供了一個迷人的環境,所有的游戲都在其中發生。
與作戰計劃過程類似,在兵棋推演過程中,目的和目標的制定對于確保一個要研究的問題被正確制定/構思是至關重要的。
作為一個特點,玩家和他們的決定是所有兵棋推演的基礎,所以兵棋推演的客觀性是由玩家的決定的公平性來體現的。
模擬是兵棋推演中包含的行動模型的本質。所有的模擬都是基于行動模型所依據的數據和數據源。根據這種方法提出的方面,可以看出,模擬可以是計算機輔助的,也可以是人工的。因此,規劃小組的決定最好是基于輔助分析過程。
提到可以考慮用干預措施來介紹這個過程的某些方面,確信對那些想發展這個主題的人來說是有幫助的,以發展這個概述。最后,通過這次干預,我們強調了兵棋推演在計劃軍事行動過程中的重要性。
從說教的角度來看,作為該領域的專家,我們強調,除了模擬的兵棋推演的結果之外,經驗也隨著游戲中收集的結果而增長--通常需要幫助我們理解兵棋推演中發生的事情,并加強其效益。我們把這種經驗從一代又一代的學生身上傳遞下來,但也傳遞給軍事教師。
為了對未來做準備,美國陸軍正在追求多域作戰(MDO)。MDO不僅僅是以前陸軍作戰概念(AOC)的自然和邏輯的演變;它代表了一種差異,主要是在競爭時期的定義和競爭中陸地力量的預期作用。本專著認為,采用MDO作為AOC可能會在武裝沖突期間在陸地領域取得決定性的相對軍事優勢,但可能無法有效地阻止或拒絕對手在競爭期間對抗美國的霸權。美國陸軍有一個成熟和既定的框架來發展未來的概念并進行轉型以滿足未來的要求。然而,在聯合部隊將這一概念整合為一種有凝聚力的整體戰爭方法之前,MDO可能不會產生一個真正的多域解決方案。此外,美國必須正視當前和未來環境的現實,并決定如何在與俄羅斯等對手的競爭中最好地保護自身利益。
隨著俄羅斯等在網絡和空間領域的威脅增加,加上在物理領域公開使用軍事力量,美國陸軍承認有必要修訂AOC。2018年國家發展戰略將這一轉變編入法典,明確指出大國競爭已取代恐怖主義成為國家安全的首要關切,并確定俄羅斯等是美國利益的最有能力和最堅定的對手。 出于技術和戰術的目的,MDO將重點放在俄羅斯的威脅上,為軍事規劃者提供了一個已知的、一致的對手來研究。這減少了常規威脅的不確定性,但沒有考慮到在不斷擴大的網絡和空間領域中新的沖突手段和方法的日益復雜性。這些領域內的活動缺乏全球規范和法律先例,傳統戰場也不再有邊界。
此外,迅速出現的技術對未來戰爭的影響仍然是理論上的和不確定的。TRADOC的情報分析人員確定了技術急劇進步的領域,這些領域將是相互聯系和交叉的,并可能同樣具有破壞性和不可預測性,其中包括生物學和生物工程、優化人類性能、神經學增強、納米技術、先進材料科學、量子計算、人工智能、機器人和增材制造。TRADOC描述了兩個未來時期,供軍事規劃人員用來構思MDO。第一個時期是人類加速進步的時代,從現在到2035年。在這一時期,行為者可以利用技術進步和擴散,并在所有領域越來越多地挑戰美國的軍事力量。雖然沒有明確說明,但所描述的環境表明,軍事組織有機會在這一初始時期實現RMA。第二個時期是2035年至2050年的 "有爭議的平等時代"。TRADOC的分析人員預計,技術上的史詩般的突破將導致戰爭性質的重大變化,并有可能 "挑戰戰爭本身的性質 "的戲劇性和 "幾乎革命性的 "變化。有明顯的未知數,但在這第二個時期出現MR的可能性是存在的。
MDO概念確定了未來環境中的多個問題,為實驗、測試和能力設計提供了一個重點。兩個最重要的挑戰是對手在沒有武裝沖突的情況下實現目標的能力,以及利用 "分層對峙 "來阻止美國反擊他們的活動。在競爭期間,分層對峙包括外交、經濟和信息活動,以在政治上阻止或防止行動,并將美國與合作伙伴和盟友分開。對手受益于美國在獲得民族國家進行活動的準入和許可方面的限制,以及網絡和空間領域權力的模糊性質。具體而言,俄羅斯等尋求獲得戰略和行動空間和時間來實現目標,同時避免直接對抗。在武裝沖突期間,對手通過積極從物理和功能上分離聯合部隊,通過國家層面的軍事能力的威懾價值,通過進行網絡、信息和非常規戰爭,以及通過常規部隊的展示和定位來創造對峙。
為了回應美國陸軍在過去幾十年中對全球響應和可部署的陸地力量的關注,俄羅斯等都在先進的反介入/區域拒止(A2/AD)系統上進行了大量投資,以拒絕從美國大陸向潛在的區域性戰場進行戰略和作戰機動。在行動上,最重要的軍事問題是在不遭受不可接受的戰斗力損失的情況下進入一個武裝沖突地區。具體而言,滲透和瓦解A2/AD能力是獲得作戰和戰術機動自由的必要條件。敵人利用網絡和空間效應的全球范圍來阻礙美國在物理領域投射力量的能力。聯合部隊必須使敵人的情報能力、遠程A2/AD系統和機動部隊失效,以滲透到戰區,隨后摧毀或擊敗這些對手的能力,使系統失去整合。接下來,美國陸軍部隊利用由此產生的機動自由來擊敗對手的武裝力量,并以有利于美國利益的條件回到競爭中。在這個早期階段,一個可行的軍事問題的解決方案仍然是理論上的和難以捉摸的,但隨著概念發展的成熟,無疑會出現一個解決方案。
MDO的中心思想是:"陸軍部隊,作為聯合部隊的一個組成部分,進行MDO以在競爭中獲勝;必要時,陸軍部隊穿透和瓦解敵人的反介入和區域封鎖系統,利用由此產生的機動自由來實現戰略目標(獲勝),并迫使在有利的條件下恢復競爭。" 這與以前的AOC和傳統的西方觀點有根本的不同,即軍隊通過消耗敵軍或摧毀敵人的重心,在決定性的LSCO中實現國家目標。MDO確定了一個沖突的連續性,包括競爭期、武裝沖突期和恢復競爭期。自1993年版的FM100-5以來,美國陸軍的每一本頂點作戰手冊都將和平與戰爭描述為沖突連續體的兩端,并確定了整個連續體中可能選擇的軍事行動戰爭范圍。競爭時期取代了和平來描述美國與對手的關系。這與綜合戰役聯合概念(JCIC)相一致,該概念指出聯合部隊必須 "消除過時的和平/戰爭二元作戰環境概念的機構殘余"。
根據MDO,軍隊通過在競爭期間使用軍事力量來實現國家目標,而不必訴諸于武裝沖突。MDO與JCIC的聯合指南相一致,該指南承認 "復雜和快速變化的作戰環境將需要一個在武裝沖突以下的競爭中使用聯合部隊的結構。" 競爭期間的關鍵目標包括以有利的條件阻止沖突,打擊對手在武裝沖突門檻以下擴大競爭空間的努力,并使其迅速過渡到武裝沖突。為了實現這些目標,美國陸軍部隊必須在多個梯隊和所有領域中保持持續和積極的參與。如果威懾失敗,武裝沖突成為必要,"前沿存在和遠征部隊能夠通過調整部隊態勢、多領域編隊和匯合的組合,迅速擊敗侵略,立即與敵人的深度攻擊進行較量。" 在擊敗敵人后,美國陸軍部隊產生并保持可持續的成果,鞏固對美國有利的成果,并適應新的環境。
三個原則支持美國陸軍進行MDO。第一條是校準的部隊態勢,即 "能力、能力、位置和跨越戰略距離的機動能力"。這就要求在競爭期間高級梯隊部隊的前沿存在,擁有以前由于政治和文化原因被文職領導限制的行動許可和權力。常備戰區和野戰軍有利于為作戰司令部(CCMD)校準陸軍部隊的態勢,并在競爭期間開展軍事活動以實現戰役計劃的目標。軍團和較小的戰術編隊是遠征性的,其部署是為了滿足野戰軍的要求。第二個原則是多領域編隊的存在,這些編隊具有 "容量、能力和耐力,能產生跨領域作戰所需的彈性"。美國陸軍編隊將進行組織和現代化改造,以便在梯隊中擁有多領域能力。
融合是最后一個原則,是 "在所有領域、電磁波譜(EMS)和信息環境中快速和持續地整合能力,通過跨領域的協同作用和多種形式的攻擊來優化效果,以戰勝敵人,所有這些都由任務指揮和有紀律的倡議來實現。" 融合要求指揮官能夠在所有領域 "看到",并在所有領域采取行動或指揮行動,以 "刺激 "或 "打擊 "對手。跨域協同是聯合行動頂點概念(CCJO)中 "全球一體化行動 "的一個要素,是 "在時間和空間上跨域能力的互補性,而不僅僅是相加"。融合和跨域協同擴大了地面部隊指揮官在物理領域的傳統選擇,使部隊能夠抓住所有領域的機會,施加額外的復雜性,并針對對手的脆弱性。與 "空地戰 "采用的方法類似,MDO將針對敵方能力和編隊的匯合責任分給各梯隊。
新興多領域環境的三個基本特征使MDO與以前的理論不同。首先,MDO認為傳統的CAM和同步化概念不足以管理21世紀沖突中的陸地力量的應用。在20世紀之前,陸地、空中和海洋是唯一可用的、與戰爭有關的領域。因此,比較以往戰爭中突出地面、空中和海上力量運用的戰役和戰斗是有意義的,但對于分析多領域環境來說并不完整或充分。傳統的CAM將軍事力量同步于戰術指揮官可以直接觀察或在地圖上繪制的物理戰場。跨域協同是CAM的演化,需要有能力實時識別每一方在所有領域所擁有的優勢水平,了解友方和敵方的能力,并在機會窗口出現時抓住主動。同樣地,融合取代了同步,以描述所有領域和EMS的活動的快速和持續整合。MDO的作戰勝利理論是,卓越的跨域理解和快速決策導致行動和對領域的控制,壓倒對手的有效行動能力。高級領導人最近關于美國陸軍轉型的聲明和努力表明,他們認識到目前的官僚和等級結構需要進行大規模的改革,以克服在追求融合和跨域協同方面不可避免的挑戰。
第二個根本區別是,一個確定的戰場或戰區已不復存在,各領域越來越多地相互聯系和依賴。導彈和火箭的有效射程將繼續增加和擴散,使國家和非國家行為者能夠在遙遠的距離上投射致命的力量。來自陸地、空中或海上的跨領域致命火力越來越能夠對其他物理領域施加有限的控制,或者至少能夠拒絕對手施加控制。網絡領域和信息環境的影響實際上是全球性的,而且影響幾乎是即時的。時間和距離在現代戰爭中越來越不重要。沒有一個部門可以在沒有依賴所有其他領域的能力的情況下運作,因此不能忽視任何領域的活動。領域邊界的混合使對手能夠實現分層對峙。聯合行動使不同領域的服務同步化,在多領域環境中可能被證明是不夠的。
第三,在與對手宣戰或開始敵對行動之前的競爭期間,擴大陸軍的作用,與以前的軍事力量使用概念不同。MDO尋求在競爭期間實現國家目標,而不訴諸武裝沖突,其成功有賴于改變軍事力量使用的傳統模式。在競爭時期,國家權力的其他要素傳統上會主導努力,而政治和文化因素通常會限制軍事活動。在MDO下,文職領導人必須使陸軍擁有前所未有的權力、許可和自主權,以便在競爭期間對抗對手的活動。在競爭期間設想的活動包括保持前沿存在以保證盟友,主動參與信息空間,并在情報、網絡和EMS領域采取行動。
在LSCO期間,追求MDO有可能在戰術和作戰層面上增加相對的軍事優勢。建立未來司令部和跨職能小組(CFT)所帶來的現代化將產生技術解決方案,使融合和跨領域的協同作用成為可能,并至少提高戰術部隊進行CAM的能力。實驗和測試將優化MDO的部隊結構,戰術和作戰部隊將修改領導者發展和單位培訓計劃,以獲得執行MDO的熟練程度。例如,美國太平洋陸軍(USARPAC)正在試驗戰術部隊結構,多域特遣部隊(MDTF)的第二階段試驗計劃將在今年開始。然而,這種優勢在相當長的一段時間內不會實現,也不會持續下去。敵人將繼續適應、發展和模仿美國的成功,并將使用不對稱和混合方法來應對這一優勢。在現代全球環境中,概念和技術自然會激增,對手能夠并且將會復制MDO。俄羅斯等在技術進步的關鍵領域也占有優勢,而且目前并不符合任何規范或法律上不愿意在競爭期間以敵對的方式行事。因此,民間和內部的壓力都存在,要求美國陸軍現在就實施MDO,而不是等待技術進步、驗證和接受這一概念。在這個初始階段,試圖理解和實施MDO的戰術單位面臨著巨大的挑戰,直到實驗驗證了這一概念,現代化的優先事項產生了有利的技術,以及預算周期將技術送到作戰人員的手中。
對聯合部隊的指揮和控制以及獲得在所有領域內控制效果的能力將構成一個重大挑戰。戰術和作戰指揮官必須擁有所有領域的進攻和防御能力,或者至少擁有立即調動其他部門或國家能力的權力或控制。目前戰術編隊的有機能力不能使指揮官和參謀部看到所有的領域,而要依靠更高的梯隊或國家資產從網絡和空間領域獲得支持。這種限制使編隊無法進行快速和持續的整合,而陸軍網絡的現代化可能是MDO最關鍵的優先事項。陸軍網絡的重點是提供一個共同作戰圖,將多個作戰指揮系統整合為一個,統一數據傳輸架構,提高從企業到戰術層面的機動性和生存能力,并提高聯合和聯盟的互操作性。此外,將戰術單位的行動一直連接到國家指揮機構的程序和過程需要改革,以有效地實現MDO。另一個需要探討的問題涉及到行動過程和任務指揮,以及參謀部傳統上用于規劃的深思熟慮的、分層的和詳細的方法是否足以滿足快速和持續變化的環境。幾十年來,美國陸軍一直非常重視對任務指揮的研究和教學,但由于官僚程序和結構缺乏任何實質性的改變,使得真正的任務指揮文化無法在整個部隊實現。創造性、創新性和分散的行動是MDO的一個關鍵要求,也是美國陸軍的一個文化缺陷,如果不充分解決,將限制MDO的實現。
美國陸軍在發展MDO方面似乎已經走在了其他軍種的前面,這很可能會產生一個以陸地為中心的戰術解決方案來解決未來環境的問題。如果沒有真正的聯合倡導,這種努力可能不會在作戰層面產生真正的多領域勝利理論。服務文化和組織自然會優化特定領域的概念和能力,并計劃從其他領域的效果來支持行動。海、空、陸平臺的通信和作戰指揮系統并不完全兼容,而是依靠聯絡或 "插件 "技術來實現同步和協調。 MDO要求開發和獲得跨服役的能力,以及一個提供共同作戰圖的戰斗指揮系統,并在所有領域內實現所有服役的訪問和控制。聯合需求監督委員會(JROC)和聯合能力與整合發展系統(JCIDS)對聯合能力的發展進行評估和優先排序,但在真正聯合起來發展MDO并確定所有軍種共同的聯合能力之前,存在著獲得特定領域能力的風險。各軍種仍然是國家安全機構中最強大的機構,減少了國防部、國會或政府影響軍種戰略以準備未來的能力。具體而言,國防部缺乏有效組織和協調為未來環境做準備的機制和監督。
在戰略層面上,MDO的功效不太確定,尤其是在競爭時期。俄羅斯等對國際秩序中的主權概念提出了挑戰,并對新興領域中的合理性和可接受性的界限進行了測試。然而,美國在這一時期可能會對使用軍事力量保持懷疑的態度。自二戰結束以來,大戰略一直試圖擴大參與美國主導的國際秩序的國家數量,其基礎是民族國家之間的互動和合作。國家之間的競爭是這個體系的特點。既定的規則和機制引導競爭保持在國家權力的非軍事要素內,并在維護和平方面通常是成功的。作為較小的國家,俄羅斯等的行動并沒有編入全球規范。作為霸主,競爭期間的某些行動可能會降低美國在參與國際秩序的國家中的可信度,使其他行為者的行動合法化,并產生意想不到的后果。美國的行動必須加強國際秩序,因此,文職領導層在競爭期間向陸軍下放許可和權力方面的克制將限制MDO的可行性。政治控制的一個現實是對互動和監督的要求,在武裝沖突之前和期間,對許可和授權進行持續的審查是必要的。
威懾、升級和戰爭門檻的概念在新的環境中不斷變化和發展,正如二戰結束后的情況。在核武器出現后,各國認為所有的戰爭都會自動涉及核交換,從而削弱了常規部隊的相關性。隨著核戰爭的破壞力和對雙方的生存威脅浮出水面,核武器的作用縮小到一小部分極不可能發生的情況。常規力量的威懾價值恢復了,而核力量的相關性下降了。盡管相關性增加了,但常規威懾被認為是 "不那么嚴格,更依賴于環境,而且最終作為戰略的指導更不可靠"。今天,全球政治和經濟的相互依存以及常規戰爭的殺傷力和成本的增加,削弱了核威懾和常規威懾的影響,武裝沖突的門檻也隨之提高。對侵略和戰爭的威懾應該仍然是美國安全戰略的核心,而大國沖突的成本使得即使是對大國的成功戰爭也是巨大的政策失敗。在評估MDO對威懾力的影響時,需要從多個角度來考慮。作為霸主,美國以相對強勢的地位行事,MDO試圖維持這種優勢。敵人明白這一點,也明白在常規沖突中擊敗美國的能力并不是阻止美國行動的必要條件。迄今為止,俄羅斯等的網絡活動、信息行動、非正規戰爭活動或使用常規軍事力量都沒有觸發美國的常規軍事反應。對手的行動將開戰的決定權交給了美國政府,這些對手從地理、外交和其他緩沖區中獲益,迫使美國做出反戰決定。因此,在競爭期間,常規的軍事優勢可能不會被證明是有效的威懾活動,有必要將常規威懾與其他軍事和國家手段結合起來,形成一個有凝聚力的戰略。MDO的一個意想不到的后果,以及由此帶來的常規殺傷力的增加和對對手的比較軍事優勢的擴大,可能會使戰爭的門檻更高,可能為對手在武裝沖突之前采取行動打開更多的空間。
在競爭時期,在新領域內采取軍事行動的戰略效果是不確定的。在基于消耗的戰爭和決定性的戰斗中,常規能力的傷亡和破壞可以衡量對敵人的成本和效果。對于網絡活動、信息戰和其他形式的競爭,定義成本和效果是完全不同的。特別是網絡力量已經證明了在武裝沖突中的戰術價值,并可能被證明是最有效的聯合軍事行動的推動者;但尚未證明它是否具有戰略價值。一般來說,網絡活動會對國家權力的其他組成部分造成削弱,而不是對軍事組成部分造成削弱。在沒有武裝沖突的情況下,要確定在網絡和信息空間使用軍事力量或指定軍隊作為主導的有效性是具有挑戰性的。劃分新領域中的角色需要在21世紀沖突的背景下進行大量研究。繼續強調提高國家權力的其他要素的能力將在長期內更有效地對抗對手。最近的歷史表明,這是一個不太可能的情況。
美國陸軍在許多年內都不會實現MDO的全部潛力,這本身就給這個概念帶來了風險。從歷史上看,軍事轉型在戰爭期間是困難的,而在和平時期,如果成功的話,可能需要幾十年。MDO所需的一些技術仍然是理論上的,而且預算在幾年內不會與新的計劃和優先事項保持一致。未來司令部應加速這一進程,但目前正處于建立的早期階段。美國陸軍已經產生了朝向MDO的機構動力,高級領導人也致力于此。實現MDO需要保持這種勢頭。MDO與大國競爭的回歸相一致,隨著時間的推移,美國民主的性質可能會對該概念的全面實現構成威脅。現任政府似乎已經準備好支持軍事轉型以實現千年發展目標;然而,未來政府的支持可能會下降,而持懷疑態度的國會可能會限制資金。公眾仍然普遍對美國海外軍事承諾的范圍和規模感到疏遠和不知情,而國內利用美國陸軍力量解決全球問題的傾向似乎正在減弱。因此,巴拉克-奧巴馬總統在打擊伊拉克和敘利亞伊斯蘭國(ISIS)行動的最初階段實行了克制,讓本土部隊而不是美國部隊擔任戰斗角色。最近,唐納德-特朗普總統關于削減阿富汗和敘利亞部隊的聲明表明,兩黨對目的不明確的海外軍事承諾的反對日益強烈。為了有效,MDO需要改變使用軍事力量的模式,并且必須克服對美國在沒有武裝沖突的活動中使用軍事力量的接受程度越來越低的情況。
正如1981年的空地戰一樣,MDO不是一個未來的概念。在所有領域同時作戰是今天的一個現實,因此作戰和戰術編隊必須了解MDO在作戰環境中的影響。俄羅斯已經在烏克蘭頓巴斯地區的常規戰場上經歷了一次多領域交戰的現實測試;而且這次行動是高效的,其效果是毀滅性的。2014年7月11日,俄軍采用無人駕駛飛行器(UAV)、針對指揮、控制和通信系統的網絡攻擊以及短程多管火箭炮系統(MLRS)對付烏克蘭部隊,在幾分鐘內將其壓倒并使其失去戰斗力。美國部隊在與伊拉克和敘利亞的伊斯蘭國(ISIS)的戰斗中也獲得了經驗。聯軍沒有在識別ISIS后立即對其指揮所進行打擊,而是抓住機會通過網絡攻擊刺激指揮所,誘發反應,從而識別并摧毀其他重要的指揮所和ISIS高級領導層。雖然這些行動的計劃往往需要數周時間,但總體效果是更迅速地擊敗了敵人的防御。雖然這些例子不涉及大國沖突,但它們表明當代的環境是多領域的,在發生沖突時為目前的常規部隊結構帶來了一些擔憂。首先,MDO仍然是概念性的,大部分的使能技術都是理論上的,而且是多年以后的事情,盡管MDO開始在美國陸軍和聯合理論中實現。戰術單位必須理解MDO的原則,但也要理解組織和能力不足的影響。
對TRADOC內部未來概念發展的歷史回顧顯示,一個成熟的組織和框架已經準備好解決未來的問題。美國陸軍表現出一個面向未來的軍事組織的必要特征,擁有一種對未來的 "生產性偏執"。這使得一種文化能夠在和平時期減輕創新的挑戰,而重新集中于與俄羅斯等的武裝沖突對軍事規劃者來說是富有成效的和有益的。此外,軍事組織需要一個過程來不斷完善關于戰爭可能發生變化的愿景,參與激烈的辯論,并擁有創新和實驗的機制。最后,高級領導人必須愿意接受職業風險,倡導新的想法,并保護這些想法以留出發展時間。TRADOC在其存在的前45年里為美國陸軍奠定了堅實的基礎,而未來司令部則是這一演變的下一個迭代。
最后,有兩個問題值得強調。首先,一些理論家認為,技術進步和變革性武器將要求圍繞一個新的原則來組織和進行戰爭,而傳統的聯合行動概念將不再有效。MDO可能會成為新的原則,但目前是由軍種主導的。各軍種之間有合作,CCJO和JCIC的指導意見也承認了MDO的必要性。然而,軍種部門擁有每一個傳統的物理領域,因此物理領域驅動著關于人員、設備和訓練的決策。如果聽之任之,各軍種必然會試驗和測試這一概念的可行性,以主導其法定要求的領域,并將主要關注于戰術層面。各部門之間的文化和優先事項的沖突會使真正的多領域解決方案的實現面臨風險。國防部沒有機制或能力采用MDO作為未來在國家層面上發動武裝沖突的概念,這就阻止了對該概念進行嚴格的聯合實驗和測試的手段。
第二,競爭時期對美國軍隊和聯合部隊構成了一個悖論。在國防部之外,沒有其他部門或機構有能力或資源在競爭期間采取決定性的行動,然而MDO依賴于一種不太可能的范式轉變來使國防部在這一空間采取行動。此外,MDO試圖在沒有武裝沖突的情況下擊敗對手,但需要一種威懾價值,而這種威懾價值只能來自于陸軍的大量集結和現代化。在當前的政治環境下,這種軍事擴張可能并不討好。MDO在競爭中尋求軍事行動的程度嚴重影響了戰略選擇,而這可能是危險的。這不僅僅是一個孤立主義和民族主義與持續接觸和全球主義的問題;這也是一個關于美國愿意將稀缺資源用于何處的問題。最近,退役將軍貝爾發表了一篇文章,認為美國自冷戰開始以來持續的海外承諾和戰爭所帶來的人力和財政負擔是不值得的,需要進行重新規劃。 在競爭時期,需要對武裝部隊的作用進行更多的辯論。
MDO是否是什么新事物,以及對未來的預測是否被證明是正確的,都不如美國陸軍已經為未來選擇了一條道路這一事實重要,而且DOTMPLF的優先事項正處于為實現MDO而進行調整的早期階段。復雜性阻礙了對未來的可靠預測,因此需要有戰略來應對復雜性。采用MDO作為AOC是美國陸軍管理未來安全環境復雜性的一個合理的戰略。最重要的是,美國陸軍必須準備好在陸地領域支配敵人。常規武器、部隊結構和技術的現代化所帶來的融合和跨域協同的概念,將確保美國陸軍有能力執行LSCO,并且看起來足以管理陸地力量在廣泛的軍事行動中的應用。更重要的是確保美國有一個整體的戰爭方法,除非國防部和聯合部隊確保將美國陸軍的概念整合到一個有凝聚力的軍事戰略中,否則MDO在未來可能會落空。最后,作為一個國家,美國必須正視當前和未來環境的現實,并決定如何在與俄羅斯等過的競爭中最好地保護自身利益。
今天的技術正在迅速發展,并迅速被采用到我們的日常生活中。但未來會怎樣?不是科幻小說中太空旅行的未來,而是未來5-10年內的未來。個人和社區將如何將這種技術嵌入他們的生活??對手將如何利用出現的漏洞?北約將如何反制這些威脅,應對風險,并利用這些機會?如何為日益復雜和危險的未來做準備?
將這個未來可視化,以及可能出現的新威脅載體,是21世紀傳統規劃機制難以完成的任務。傳統的規劃過程難以理解廣泛的潛在問題的復雜性和速度。對未來行動環境的理解和準備是一種被稱為威脅預測的分析方法的基礎。威脅預測使用來自社會科學、技術研究、文化歷史、經濟學、趨勢、專家訪談,甚至一點科幻小說的投入來探索未來的威脅并設計潛在的未來。
2022年3月1-2日,美國陸軍網絡研究所和北約盟軍司令部轉型召集了一個多學科小組,使用威脅預測方法探討未來的新興顛覆性技術如何提高大規模殺傷性武器在動能戰爭中的有效性和致命性。本文將討論這個項目的結果,以及確定今天可以采取的具體行動、指標和具體步驟,以破壞、減輕這些未來威脅。
今天的技術正在迅速發展,并迅速被采用到我們的日常生活中。但未來會怎樣?不是科幻小說中太空旅行的未來,而是未來10年內的未來。哪些新技術將推動和改變我們的生活?個人和社區將如何將這種技術嵌入到他們的生活中?對手將如何利用出現的漏洞?聯盟將如何打擊這些威脅,應對風險,并利用這些機會??如何為日益復雜和危險的未來做準備?
對未來作戰環境的理解和準備是被稱為威脅預測分析方法的基礎。亞利桑那州立大學社會創新未來學院與西點軍校的陸軍網絡研究所(ACI)合作,使用Threatcasting方法,為研究人員提供一種結構化的方法來設想和規劃未來十年的風險。威脅預測方法協助并使從業者能夠在對手的創新發生之前想象它們,并確定能夠破壞或應對這些對手創新的行動。對于許多組織來說,這個問題的范圍似乎是壓倒性的。
威脅預測使用來自社會科學、技術研究、文化歷史、經濟學、趨勢、專家訪談,甚至是一些科幻小說的輸入。這些輸入允許創建潛在的未來事件和趨勢(未來)。通過將威脅置于一個基于效果的模型中(例如,一個人在一個地方遇到問題),它允許組織了解需要立即做什么,也需要在未來做什么,以破壞可能的危險。威脅預測方法還暴露了可能發生的事件,表明朝著越來越可能的威脅形勢發展。
本文探討的具體研究問題是: "未來的新興破壞性技術(EDTs)可能如何提高大規模毀滅性武器(WMDs)在動能戰爭中的有效性和致命性?" 假設是,在這個研究問題上使用威脅預測方法,將在大規模殺傷性武器和EDTs的交匯處產生一系列可能的和潛在的詳細威脅未來。這些將為讀者和實踐者提供:
豐富的數據集,以了解EDT對大規模毀滅性武器的可能影響,以及為破壞、減輕和恢復這些影響而采取的明確行動。
一個或多個未來威脅開始顯現的具體指標。
這項工作是與北約盟軍司令部轉型(ACT)戰略計劃與政策(SPP)部門、西點軍校的陸軍網絡研究所(ACI)和亞利桑那州立大學(ASU)共同完成的。
聯合國將大規模毀滅性武器稱為 "一類有可能在一瞬間殺死數百萬公民、危害自然環境,并通過其災難性影響從根本上改變世界和后代生活的武器"。[1] 美國國防部在聯合出版物1-02中,將大規模毀滅性武器定義為 "能夠造成高度破壞或大規模傷亡的化學、生物、放射性或核武器"。[2] 更廣泛地說,大規模毀滅性武器是旨在恐嚇和威懾的武器。[3] 這些武器的想法本身就是 "可武器化的",這意味著部署大規模殺傷性武器的威脅往往與武器本身一樣有效--因此對使用這些武器有很大的猶豫。毒氣、蘑菇云和可怕的瘟疫的形象是故意和有效地增強恐懼和混亂,以及避免沖突升級的巨大威懾力(正如最近在烏克蘭的背景下所看到的)。
正如其縮寫所示,EDTs是一些不同技術的總稱,這些技術既是新興的--從實驗室階段到距離大規模生產只有一步之遙--又是破壞性的,因為它們對現有的不擴散和威懾理論構成了挑戰。[4] 在本文的范圍內,EDT擁有巨大的潛力:1)加速沖突升級,降低使用大規模殺傷性武器的門檻;2)復制和/或增強大規模殺傷性武器的殺傷力和/或長期破壞性,當它們配對或同時使用時;3)提供具有國防和安全應用的雙重用途,并構成潛在威脅。
不同的組織對被指定為EDT的技術集有不同的定義。北約[5]、白宮[6]、美國陸軍[7]、學術界[8]和福布斯[9]已經公布了他們的EDTs清單,這只是其中的一些例子。雖然存在一些相似之處,但也存在差異。為了回答這個研究問題,我們將以下技術定義為EDTs:
挑戰仍然是,許多這些電子技術具有雙重用途;即,它們的發展將導致社會內部的改善,但也可能導致它們對同一社會的武器化。
未來預測和威脅預測方法論[10]是戰略預見方法,已被常規地成功應用于工業[11]和國家安全問題[12], [13]。威脅預測使用來自社會科學、技術研究、文化歷史、經濟學、趨勢、主題專家(SME)訪談,甚至一點科幻小說的輸入。這些輸入允許創建潛在的未來。通過將威脅置于一個基于效果的模型中(例如,一個人在一個地方遇到問題),它允許組織了解需要立即做什么,也需要在未來做什么,以破壞可能的威脅。這種方法也暴露了可能發生的事件,表明朝著越來越可能的威脅景觀發展。
有幾種展望和建模方法可用于探索大規模毀滅性武器和電子戰的未來。然而,"威脅預測 "方法具有一些獨特的屬性,使其有別于其他方法。該方法與傳統的情景規劃不同,它提供了更高程度的細節和對威脅的多角度看法。威脅預測利用了德爾菲法的某些方面,然而,研討會的最終數據和產出不僅圍繞德爾菲法產生的可能和潛在威脅收集共識,而且還記錄了德爾菲法沒有產生的具體行動和指標。
威脅預測方法的優勢在于,它從跨學科的投入(主題專家訪談)中獲取信息,并利用一組不同的參與者來開展研討會,為分析人員提供強大而詳細的數據集,以完成他們的發現。在過去的六年里,美國陸軍在各種國家安全問題上使用該方法并取得了成功。據作者所知,這是第一次將這種方法應用于大規模毀滅性武器領域。
2022年3月1日至2日,60多名與會者在弗吉尼亞州的弗吉尼亞海灘召開會議,探討新興技術如何增強大規模毀滅性武器的有效性和使用。
利用 "威脅預測 "方法的基礎,與會者在經驗、專業知識和前景方面被策劃為多樣化。參與者包括來自所有六所美國高級軍事學院(諾維奇大學、德克薩斯農工大學、城堡大學、弗吉尼亞軍事學院、弗吉尼亞理工大學和北喬治亞大學)和兩所美國軍校(美國軍事學院和美國空軍學院)的本科生,以及來自美國和歐洲各學院的教授。它還包括來自美國陸軍的連級軍官和來自北約國家的戰地級軍官。最后但并非最不重要的是,它包括來自國家實驗室的高級研究人員,以及來自整個工業界的戰略思想家。
威脅預測方法的第1階段是研究綜合,目的是捕捉 "房間的智慧"。[與德爾菲法[14]不同--德爾菲法通過反復的提問和反饋來吸引專家意見--在這里,參與者的見解(以及他們對最初的主題專家的反應)與主題專家的見解同樣重要。參與者會看到精心策劃的主題專家視頻,這些視頻圍繞主要研究問題涉及不同的觀點/領域。這些視頻提供了關于其領域現狀的研究、數據和專家意見,以及其在未來十年可能的發展(因為它與研究問題有關)。然后,這些想法的迭代反而來自于參與者。與德爾菲不同的是,我們的目標不是就一個想法達成共識,而是提供獨特的數據點,這些數據點成為情景框架,并最終與參與者的見解和綜合相結合。
為了達到這個目的,首先要求參與者找出主題專家在錄音講話中提供的、他們認為對研究問題有一定影響的所有關鍵點或突出點。完成后,與會者被組織成3-4人的小型工作小組,對這些投入進行綜合。也就是說,他們對每個關鍵點的三個開放式問題進行討論并提供反饋:
第一個問題抓住了參與者的偏見、意見、矛盾和專業知識。第二個問題是對關鍵點的進一步反饋,迫使參與者從不同的角度去思考。第三個也是最后一個問題是為了讓參與者開始思考未來可以/應該采取的具體微觀行動。
對于WMD+EDT的研究問題,我們使用了8個主題專家來為2040年可能出現的情況奠定基礎。以下是這些主題專家的名單:
鑒于這些最初的主題專家的見解,參與者開發了95個他們認為對未來運營環境的發展有影響的綜合點。
威脅預測方法的第二階段是未來預測。[10]在這里,參與者被安排在同樣的3-4人的小組中,創造他們對2040年的愿景;新興技術對大規模毀滅性武器的影響。這個階段被設計成一個基于效果的模型,使用第一階段的數據點,并整合了參與式設計[21]、體驗設計[22]和科幻小說原型設計過程[23]的元素。
這些小組偽隨機地從研究綜合階段選擇數據點,并將這些數據點作為他們2040年世界的基礎。主題專家數據點的交集和圍繞意義的評論給參與者提供了所需的原始輸入,以創造一個可信的、基于當前研究的未來。在建立了環境的心理可視化之后,小組想象一個具體的人生活在這個未來。然后,由威脅引起的問題的物理或數字實例被描述為 "事件"。參與者從 "藍色 "和 "紅色 "的角度來探索這個事件。這些都是通過一系列問題完成的,特別是為了創造一個引人注目的敘述。
威脅預測方法的第三階段是時間階段、替代行動定義(TAD)過程[10]。利用第二階段創建的未來威脅(基于效果的模型),各小組接下來會探討如何破壞、減輕和恢復威脅。他們還將確定可采取的行動以及表明威脅開始顯現的指標(標志)。威脅預測法將傳統的逆向預測[24]從關注通往特定威脅未來的單一路徑擴展到探索多種路徑和可能性的愿景。
最終,參與者通過第二和第三階段的四輪討論創造了52個故事。在每一輪中,各小組從研究綜合工作手冊中選擇不同的關鍵點組合來創造他們未來世界的基礎:
在弗吉尼亞海灘研討會結束后,五位分析家聚集在一起,綜合和分析從參與者那里收集的數據。這導致了一系列與研究問題有關的發現,以及對北約聯盟的具體行動和影響。
這些技術的進步暴露了一個新的威脅景觀,出現了七個一般的威脅空間。前三組側重于EDT對傳統大規模殺傷性武器的影響。第二組側重于如何將EDT與傳統武器結合起來部署,以產生 "大規模殺傷性武器效應",而不訴諸于傳統大規模殺傷性武器的使用。然后,分析人員審查、處理和研究了這些結果,咨詢了主題專家,并提出了對北約的七個啟示,這些啟示可以在下面找到:
EDT引發、促進和升級了現有的地緣政治沖突,增加了全面沖突和使用大規模毀滅性武器的風險。這是因為EDT加速了經典的升級和威懾模式,并使之復雜化和混亂化。蘭德公司的戰略家赫爾曼-卡恩開發了一個44步的升級階梯[25],描繪了導致 "全面 "戰爭的武力展示、暴力行為和對抗的條件。卡恩模型的關鍵是背景和閾值的重要性。成功的降級取決于對立的行為者相互感知和解釋對方的動機和意圖的能力--沒有這種能力,他們就有失控升級的危險。與此相關的是,不斷升級的危機從來不會順利地或不可避免地從一個階梯上升到另一個階梯,而是在關鍵的門檻處被絆倒,這些門檻對決策起到了 "斷火 "的阻嚇作用。[26]就像斷火線被用來減緩或防止野火的迅速蔓延一樣,這些威懾力量也可以起到同樣的作用[27]。例如,在冷戰期間和此后,大規模殺傷性武器的使用充當了最終的 "防火線",即使是朝鮮戰爭或古巴導彈危機也無法跨越。
EDTs在幾個關鍵的方面對Kahn和類似的模型進行了短路:
因此,北約應該擴大核斷火或核威懾能力,并盡量減少/減緩沖突的螺旋式升級。在火災科學中,防火帶是一個特意劃出的土區,沒有可燃的植被,包含了野火的影響。在崎嶇的地形和不確定的天氣條件下,這些防火隔離帶必須挖在消防員能最有效到達的地方,而不是最方便的地方。有時,防火隔離帶會優先考慮拯救景觀的某些部分而不是其他部分。
將EDT對大規模殺傷性武器升級的影響降到最低的關鍵是抵消扭曲和壓縮的力量,同時鼓勵照明對對手行動的影響。這將為北約提供機會,成為在NC3系統中定義人類、技術和混合人類-AI團隊的防火線的領導者。
自長崎以來,大規模殺傷性武器的門檻一直沒有被跨越,原因之一可能是 "核禁忌"[28]--一種規范性的恥辱,足以讓最理性的戰略家也束手無策。其他大規模殺傷性武器也有自己的負擔--太弱而無法阻止它們的使用,但與常規武器的類似效果相比,足以引起譴責和潛在的巨大政策反應。EDTs則沒有這樣的污點。
它們的使用不僅有可能促進和加速升級門檻的跨越,而且還有可能降低部署大規模毀滅性武器的門檻,部分原因是它們擴大了潛在參與者的范圍,包括非國家行為者和其他從未生活在大規模毀滅性武器陰影下或有理由考慮核禁忌的人們。
對于國家行為者來說,風險在本質上是相反的--用EDT進行攻擊可能會在升級的階梯上插入一個階梯,最終超越核禁忌。在這種情況下,雙方都有EDT(以及潛在的大規模殺傷性武器)可能會加劇緊張局勢,導致一方決定先下手為強或使用EDT升級的情況。這反過來又會使肇事者面臨受到壓倒性力量的攻擊或反擊的風險,從而發現自己 "背靠著墻",除了使用大規模殺傷性核武器似乎沒有其他選擇。
在未來,EDT可以創造一種條件,使使用大規模毀滅性武器的意圖得到加強。提高門檻可以保持使用大規模殺傷性武器的 "禁忌",也可以減緩使用大規模殺傷性武器的螺旋式升級,最重要的是在軍事沖突情況下使用戰術核武器。令人擔憂的是,在 "攻擊平原 "上使用EDT會創造一個心理空間,讓他們覺得自己被逼到了墻角,以至于他們覺得恢復與北約的力量平衡的唯一途徑就是使用核反應。作為最近在伊拉克、敘利亞和阿富汗沖突中的積極參與者,北約親眼目睹了由EDT驅動的沖突的未來是如何出現的。北約可以在領導和參與這些類型的討論中成為一個值得信賴的聲音。
EDTs將使新舊內部威脅成為可能,為其壯膽,并將其放大。除了來自已知的國家和非國家行為者的攻擊外,EDT還將引入新的脆弱性,并產生來自內部威脅(如極端分子、罪犯、不知情的參與者等)的巨大影響,這些內部威脅的行為只能被檢測和模擬。EDTs將以一種不可預測的指數方式放大他們作為載體、助推器和不知情的幫兇的作用,將他們推向全球舞臺,使他們能夠影響地緣政治的多米諾骨牌。
人們可以想象,他們會成為針對世界領導人或其他利益相關者的個性化合成生物武器的毫無戒心的攜帶者。[29]或者可以想象,他們可以作為激進的 "獨行俠",濫用網絡或量子等雙重用途的EDT。?EDT也可以用來創造或增強內部威脅本身。網絡和人工智能的操縱,從被黑的個人和財務信息到深度偽造和其他形式的社會工程,都將被用來損害有機會進入關鍵系統的人員的心理健康和安全。
在未來,來自一個人的攻擊的速度、范圍、規模和影響的增加,會隨著單個或組合EDT的使用而被放大。一個人將有可能利用EDT對北約成員產生巨大的影響。此外,在未來,"不知情 "的內部威脅可能變得更加危險,因為EDT(如人工智能、工業物聯網和自主系統)可以實施和加強基于內部的攻擊。最后,試圖找到這些不知情的內部人員將被證明是近乎不可能的,因為他們不會顯示其意圖的傳統指標和警告標志。
這為北約提供了一個現今的機會,讓它牽頭制定一個明確的戰略,對所有北約成員的內部威脅進行監測和培訓。這應該與探索不知情的內部威脅這一新類別相結合--探索EDT的速度、范圍和規模如何影響一個人如何成為載體。這也將包括培訓,以使一個人免受操縱,以及可以監測這種類型活動的系統。
核禁忌或斷火存在的一個原因是,即使沒有進一步的升級,核大規模殺傷性武器也會產生不同種類和程度的影響。瞬間毀滅、大規模死亡和混亂破壞(從千年污染到核冬天[30])的可怕景象;將大規模殺傷性武器完全置于另一個類別中。然而,通過配對或結合多種EDT,如機器人、人工智能和自主系統、量子和高超音速,國家和非國家行為者可以實現大規模殺傷性武器的速度、規模和破壞,而無需跨越核門檻。如上所述,這將同時升級和降低實際使用大規模毀滅性武器的門檻。
雖然不太可能在一次攻擊中復制大規模殺傷性武器的全部效果,但EDT的新組合將成功實現對目標戰略資源的即時震懾和長期退化。例如,網絡和量子武器可以針對民用能源或交通基礎設施進行部署,以煽動具有全球沖擊力的地方或區域攻擊。這方面的例子包括2015年和2016年對烏克蘭電網的攻擊(據稱在2022年)[31],或者可以想象黑客攻擊個人車輛以造成廣泛的碰撞、混亂和死亡。對關鍵社會系統,如醫療、農業、金融、工業和政治的更微妙的攻擊,將有較少的可見性,但隨著時間的推移,可能會有更深刻的影響。
北約有必要了解多種EDT相互作用的全部范圍,以提供足夠的檢測機制、準備工作、復原力和集體防御措施的變化。這種理解還要求北約考慮EDT在其預期的科學、社會和商業應用中的雙重用途效果,同時也被用于沖突。
目前,大多數EDT是由私營企業開發的,特別是在西方民主國家[32]。除了俄羅斯[33],他們都對研究和開發保持著重要的國家控制,EDTs的進展將在北約及其成員的控制之外發生。像北約的新興和顛覆性技術咨詢小組這樣的組織,可以引導人們對主要由私營部門推動的技術創新做出反應。本著這種精神,北約應該 "制定出利用兩用、多用技術發展的目標--利用其他領域已有的技術,推動多用產出的發展"。[34]
最后,北約應制定關鍵的推動程序,以監測單一和組合EDT的使用,為衡量EDT或EDT組合何時有可能產生大規模殺傷性武器的效果設定指標。北約最近透露計劃制定一個正式的計劃,以合作的方式開發新興技術[35]。這一計劃在2021年6月的北約布魯塞爾峰會上得到了概念上的批準,并在2022年通過批準北大西洋防務創新加速器(DIANA)得以實現。DIANA "旨在利用新的學術、商業和創業啟動技術,將其作為潛在的防御能力進行測試和開發,并將其更快地與軍事終端用戶的操作要求聯系起來。" [36] DIANA近50個測試中心和加速器項目的概念是北約迭代和考慮EDT的影響的理想場所,因為它們影響了戰略和作戰要求。
伴隨著EDT聯合攻擊的最初沖擊和破壞,將有更普遍和更隱蔽的努力來實現對對手戰略資源和能力的長期退化。反過來,降低其戰斗意志和能力。這些入侵的主要目標將是支撐國家和基于規則的國際秩序的復雜和相互依存的系統:能源和基礎設施;醫療保健;農業和糧食生產;貿易和金融系統;工業和原材料;以及其他機構,這些機構的健康對一個正常運轉的社會至關重要。
這些反復攻擊的二階和三階效應將是對受影響的系統和機構的信任的削弱,有能力創造危機、動亂和戰略癱瘓。在沒有通過明確的大規模殺傷性武器攻擊的對抗者的情況下,這些EDT的影響將被內部化、政治化,并在國內爭端中越來越難以解決。社會系統的崩潰將通過公共秩序混亂、基礎設施故障、國內恐怖主義以及最終以出生率崩潰、死亡人數增加和預期壽命持續下降的大規模影響而不可預測地表現出來。
關鍵基礎設施的一個或多個方面的不穩定,可以在不實際使用大規模毀滅性武器的情況下產生破壞穩定和致命的大規模毀滅性武器效應。因此,為了監測、破壞或減輕這種威脅,重要的是對這些復雜的系統或關鍵基礎設施可能是什么有一個功能性的定義。在美國,總統政策指令/PPD-21確定了16個關鍵基礎設施部門[37]。歐盟有一個類似的定義,但確定了11個部門[38]。北約沒有一個商定的關鍵基礎設施的定義,但它鼓勵在該領域的研究[39]。它還重振了冷戰結束后優先級下降的 "民事準備 "的努力。復原力作為一種國家和集體價值,與保護關鍵基礎設施和北約條約第3條的宗旨密切相關;2016年華沙峰會概述了民事準備的七個基線要求。[40]
北約有機會為成員建立一個復雜系統和關鍵基礎設施的工作定義。這包括為衡量對北約范圍內民事準備的貢獻水平制定標準,以及為識別和描述因EDT而出現的威脅制定衡量標準。北約清楚地了解到歐盟在管理關鍵基礎設施架構方面的參與以及與商業部門的關系。然而,需要確定機制和程序,以測試民用部門和北約在真實事件中應如何合作,這些機制和程序是缺乏的。
與大規模殺傷性武器相比,EDT所帶來的最大威脅是其不可知性。通過創造性地、慎重地、耐心地使用EDT的不同組合來攻擊、破壞穩定,并持續破壞關鍵系統、政治意愿和社會凝聚力,對手可能會在目標人口甚至不知道他們是攻擊的受害者的情況下,實現大規模毀滅性武器的戰略效果。
除了經濟不平等、政治分化和社會不信任之外,EDT也可能被用來明確地攻擊整個人口而不被發現。COVID-19大流行強調了即使是一種陽性率和死亡率較低的病毒也有引發全球動蕩的傾向。這可以通過中斷的供應鏈、封閉的邊界和長期的公共衛生危機看出來。未來病毒學和遺傳學的進步提高了在數年甚至數十年內故意感染或削弱人口的可能性--包括醫療費用上升、生產力下降、依賴比例傾斜和其他具有可怕后果的現象的間接影響。
另一個值得關注的領域是農業和環境,由于氣候變化,這兩個領域目前在西方都處于壓力之下。美國和地區大國為確保全球糧食供應而進行的全球斗爭,已經產生了關于農業間諜、知識產權盜竊和基因篡改的指控。例如,想象一下,一種改性病毒攻擊小麥或大豆而不是人類,這將引發作物枯萎、糧食價格飆升和社會崩潰。這可能會相對容易地被信息EDT所助長。
其影響是令人警醒的。EDTs可以模擬大規模殺傷性武器的影響(即EDTs的影響可能是大規模殺傷性武器的數量級,但傳播的時間更長)而不被發現,而且與在城市上空引爆核導彈不同,社會本身可能是攻擊面。
根據目前對大規模殺傷性武器和大規模殺傷性武器影響的定義,沒有探索或具體的框架來說明一個長期游戲的攻擊可能如何呈現。因為這些攻擊的目的是保持 "低調",它們將以犯罪攻擊、系統中的小故障的形式出現,或者可能完全隱藏,直到其影響無法逆轉。
私營企業對EDT的進一步開發將增加其發展的隱蔽性。此外,由于這些EDTs將來自工業界,任何攻擊或攻擊的早期跡象都將表現為私營部門的犯罪或異常。北約成員甚至可能不知道他們正受到來自對手的攻擊。
在為長期游戲的攻擊進行感應時,有一種風險,即北約成員可能被視為監測噪音,甚至是過度熱情。例如,2022年4月,社交媒體用戶抓住了美國各地食品加工廠發生的看似可疑的火災,導致媒體人士,如美國轉折點創始人查理-柯克,在推特上宣稱:"我們的食品供應受到攻擊--問題是,被誰攻擊?" [41]事實上,這些火災被確定為意外事故,在統計學上并無異常之處。[42] 關鍵是,這些事實并沒有阻止社會媒體用戶繼續推動調查。
北約有機會與成員及其關鍵基礎設施和行業伙伴合作,開始感知和測量 "灰色空間 "的潛在影響。隨著這種感應,可以建立一個指標,以表明正在觀察的活動何時從私營部門的犯罪或異常情況轉移到EDT攻擊。通常情況下,這種類型的攻擊可以通過其對關鍵基礎設施的不穩定影響來衡量。
未來EDT的接入和有效性的提高將使非傳統的對手能夠攻擊北約成員。這些對手將包括非民族國家團體和公司。
目前以國家為基礎的國際框架是建立在一個最初由歐洲設計的體系上的。國家是一個現代的政治構造,在很大程度上,它是由歐洲的沖突經驗(如三十年戰爭)發展而來的,但在過去的幾個世紀中不斷發展。那么,一個民族國家是一個秩序系統,它表達了對邊界和人民的權力。因此,一個民族國家將擁有以下所有條件:領土/空間、官僚機構/行政管理、對武力使用的控制/主權,以及一個或多個民族(即字典上的 "共同血統、語言或歷史 "的概念)。
今天的數字世界使領土/空間的概念變得復雜。隨著我們吸收網絡空間的影響,我們目前對領土和空間的想法正在發生變化--就我們如何構思和使用物理以及虛擬人工制品來定義它們而言。對土地控制權的爭奪一直是現代(15-20世紀)的一個決定性特征。在我們所處的新時代,不同的斗爭可能會承擔物理領土的地位。
現代全球公司就是在這種 "邊疆 "的背景下誕生的。公司一直在混合環境中運作,商業組織有相當多的東西需要考慮,而不是簡單的資本主義努力。公司行使民族國家權力的情況比大多數人認為的要多。
北約必須認識到,未來的盟友和對手不一定會被限制在民族國家。因此,他們的伙伴關系和成員模式,以及他們的威懾理論將需要發展。
威脅預測方法不僅描繪了未來10年的可能和潛在威脅,還試圖識別作為信號或趨勢的旗幟(指標),表明特定的未來威脅正在發生。? 這些標志有時被稱為 "信號",可以提供早期警告,表明可能和潛在的未來威脅正在發生或開始形成。通常情況下,旗幟是連續的,不太明顯的前兆已經生效,而更令人震驚的旗幟仍然在地平線上。
研討會上的數據提供了三組指標或旗幟的分組,這些指標或旗幟將預示著EDT的進展和發展。? 這些分組是相關的,適用于所有7個調查結果。
北約作戰頂點概念(NWCC)是一個關于北約成員軍隊如何在未來20年內獲得并保持優勢的概念性構想。為了獲得成功,軍事工具必須能夠超越思維、超越卓越、超越戰斗、超越步伐、超越伙伴和超越對手。[43]
這六個 "超越 "構成了我們對參與者對北約的行動、投資和反應的分析/綜合,以便能夠對抗和擊敗對手對EDTs和WMDs的使用。威脅預測方法中第三階段的部分內容要求我們的參與者確定可以采取的行動步驟,以破壞、減輕和/或從他們的未來威脅中恢復。以下是對行動的解釋,但是,詳細的行動清單可以在技術報告中找到[44]。
戰勝對手的一個關鍵因素要求北約成員必須擁有正確的信息。北約的相互訓練的情報過程對于收集和理解大量的數據、信息和經過處理的情報至關重要,這些都是超越對手所需要的。我們的數據表明,這種理解來自于幾個相輔相成的活動,包括探索性的基礎和應用研究、探測和傳感、數據共享,以及在各個國家層面的戰爭游戲中的預測性決策。
實現卓越部分取決于了解對手的動機和能力;投資于應對潛在威脅所需的培訓、專業知識和工具,以及發展共享基礎設施和能力,以指導和規范這些技術的發展。我們的數據表明,這些行動可以分為基礎研究與開發(R&D)、培訓和最佳實踐、以及購買和投資。
隨著EDT的發展超過了工作的概念驗證和原型,北約及其成員必須準備好大規模地開發、制造、運營和監管這些技術。這需要建立必要的技能、供應鏈、生產能力和培訓,以及必要的法律和政策框架,以確保負責任的使用和避免擴散。
這反過來又要求北約及其成員對新的培訓和技能進行相應的投資,以便在聯盟的各個層面灌輸這些最佳做法。這樣做需要建立新的設施、英才中心和工具,使北約工作人員做好準備迎接這些挑戰。最后,隨著EDTs的成熟,北約必須投資于指導其發展,并建立保障措施,防止來自對手、非傳統行為者和內部威脅的威脅。
為了使北約能夠戰勝對手對EDT的使用,有必要對威懾和沖突準備進行理論、行動和戰略上的改變。
EDT在降低大規模殺傷性武器使用門檻的同時,還能使沖突升級,這在能力集結時造成了新的復雜程度。這種情況可能會通過鋪天蓋地的多重困境(在頻率和規模上)迅速升級,而這又會將多重復雜性提升為多重邪惡問題;最終導致決策癱瘓。此外,裝備有EDT的非民族國家行為者有可能超出傳統軍事聯盟的范圍和能力。明天的戰斗將不像歷史書中描述的那樣。北約必須準備好重新思考 "神圣的牛 "和傳統思維,以準備擊敗未來的對手。
此外,北約需要開展活動,使電子威脅作為一種獨特的威脅類別合法化,然后將其納入最新的威懾模式。這包括開發新的培訓和最佳做法,將電子威脅納入組織/單位/實體。
北約及其成員如何才能在EDT環境下,利用新的政策、程序和技術,最大限度地減少使用大規模殺傷性武器的風險,破壞對手的決策過程(OODA循環[45]),從而超越對手?這不僅需要對EDT進行先發制人的監管和限制,還需要重新思考后勤、通信和規劃,以便在面對新的和正在出現的威脅時進行調整。
數十年的核武器削減和不擴散條約,加上國際監測工作和國家對兩用技術出口的限制,都有助于減少大規模毀滅性武器的風險。新一代EDTs將需要類似的政策和機構來監管兩用技術,如機器人和人工智能,同時限制EDTs和大規模殺傷性武器,如能夠與EDTs配對產生大規模殺傷性武器效果的生物制劑。
鑒于EDT有可能迅速升級沖突,并通過對基礎設施的攻擊產生長期的大規模殺傷性武器效應,北約有責任重新設計其通信和供應線,以加快對威脅的反應。北約必須擴大和加強成員、傳統伙伴和新伙伴之間的溝通,以配合EDTs帶來的巨大速度和破壞。它還必須重新認識 "復原力",將其視為一種積極主動的能力,即北約如何快速應對和減輕新的威脅,而不是僅僅擁有從威脅中恢復的能力。
鑒于我們預計在未來可能會看到新類別的對手,這意味著所需的合作伙伴陣列也將發生變化。
自聯盟成立以來,戰爭游戲和聯合演習一直是北約合作和凝聚力的重要工具。本著這種精神,北約不僅應該更新其戰爭演習和規劃劇本,以考慮EDT的特殊性,而且還應該作為一種手段,與不同規模(如國際、國家、地方)、不同學科(如技術和生物基因)和不同部門(如政府、非政府組織、私營部門)的新伙伴進行接觸。
作為戰爭演習和軍事演習的政治對應物,北約及其外交部門應制定戰略,如何以最佳方式在聯盟之外建立對監測、威懾和攔截EDTs所需的監管和限制類型的支持。
最后,鑒于EDT的潛在行為者和潛在目標的范圍,有必要培養整個聯盟和整個社會的反應,以減輕這些威脅。這需要北約成員國的軍隊、政府和公民社會之間進行更密切的協調,目的是在沖突升級中的EDT風險方面形成社會共識。
為了實現和保持對潛在威脅的長期看法,并培養一種應對的彈性文化,北約必須投資于教育和人員。這將使其成員能夠超越對手。
教育和培訓標題下的許多技術,包括機器人、人工智能和生物遺傳學;已經成為圍繞未來人才、就業和經濟增長的對話的中心。建立一個能夠應對EDTs帶來的威脅的聯盟,需要培養一支與開發和/或對抗這些技術的挑戰相當的勞動力和人才庫。
針對未來非傳統行為者的EDT攻擊和內部威脅,最好的預防措施也許是將潛在的對手變成現在的盟友。北約和聯盟成員應通過對人的投資來做到這一點,這不僅意味著發展人才,還意味著解決沖突,接觸邊緣化社區,并消除促進激進化的條件。
最后,復原力(不僅是我們的人口,還有我們的關鍵基礎設施)將是戰勝對手的關鍵。制定方案和程序,確保基本服務和基礎設施的冗余,并在全社會形成在困難和不確定的情況下戰斗的意愿是關鍵。最近的例子,如俄羅斯在烏克蘭的侵略,顯示了一個國家的準備和對復原力的依賴的緊迫性和重要性。
威脅預測實驗室的數據不僅被用來撰寫技術報告,還將作為兩部圖畫小說的科學基礎,在2022年秋末發布。其中一篇將展示EDT如何加速國家間的沖突升級,并導致大規模殺傷性武器的使用增加。第二篇將說明EDT的組合如何被對手用來產生大規模殺傷性武器的效果,而無需實際使用傳統的大規模殺傷性武器。這些圖畫小說的目的是為觀眾提供一個直觀和高層次的概覽,介紹通過威脅預測項目產生的可能和潛在威脅。這些科幻故事以科學事實為基礎,但用敘事的方式來表達結果的新鮮感和吸引力。
美國陸軍使用可視化的方式來傳達復雜的想法有著悠久的歷史。一戰后,他們讓著名漫畫家威爾-艾斯納創作了PS,即《預防性維護月刊》。這本月刊用插圖和漫畫藝術向士兵們傳達關于預防性維護技術的技術信息。[46]繼承這種方法的精神,從2017年開始,陸軍網絡研究所發布了一系列圖形小說(《暗錘》[47]、《隱形力量》[48]),調查和探索未來網絡和信息戰對軍隊的威脅
這項研究的影響將為北約及其成員提供一個關于大規模毀滅性武器和EDT未來的新的、長期的視角。研究結果為一系列可能的和潛在的未來提供了詳細的模型,這些未來目前還沒有被作為新出現的威脅進行討論和考慮。這些威脅的未來將為北約提供一個交流工具,以解釋和探討組織內部以及成員的意識和準備。
這項研究也暴露了未來的盲點和關注領域,這些盲點和關注領域不僅在北約的雷達上,而且根據該組織的性質,威脅根本就不會被看到。這種影響使北約能夠更好地準備和發展對EDT和大規模殺傷性武器的更高水平的復原力。
最終,研究的影響為北約和成員提供了一個具體的路線圖,以跟蹤這些威脅的發展,并為可能采取的行動提出建議,這些建議與現有的NWCC規劃和戰略相聯系。
NWCC為聯盟提供了一個二十年的視角,在不斷變化的作戰環境中保持優勢,同時開展多領域的行動。為了實施這一概念,北約ACT創建了戰爭發展議程(WDA),重點是五個必要條件。戰爭發展議程將在五年的規劃中執行,并將重點放在 "啟動 "上。繼續使用威脅預測方法將為連續的規劃期提供一個共享的框架和研究參數,但它也將全部用于識別與以往NWCC活動有關的新的或變異的威脅。
威脅預測項目的結果為北約提供了更廣泛的可能的和潛在的威脅,以及在大規模殺傷性武器和EDT的交匯處應采取的具體行動。在最初的目標和假設的基礎上,每一個新的威脅都圍繞著威脅的描述、二階和三階效應以及如何識別威脅提供了高水平的細節。這些數據還為北約和成員提供了具體的影響,既包括廣泛的影響,也包括具體適用于NWCC的影響。
為了應對這些未來的威脅,北約將需要進行研究和情報收集,同時進行探索性的研究和開發,以更好地了解EDT的狀況及其潛在影響。有了這些信息,聯盟將需要進行合作的 "戰爭演習 "和規劃,以探索一系列可能的和潛在的EDT威脅。從所有這些活動中獲得的知識將為未來的培訓和最佳實踐提供信息,以準備和解決這些威脅。
北約成員和合作伙伴還需要增加他們在EDT相關領域的投資,這就要求各國不僅要改變他們的作戰方式,而且要改變他們對威懾的思考。成員國之間擴大的監管、政策制定和政治團結將發揮越來越重要和擴大的作用。將需要更廣泛的政府、軍事和民事合作,結合更廣泛的公眾意識來破壞和減輕其中的一些未來威脅。所有這些行動都將對北約成員之間的合作和共同復原力賦予更高的價值。
關于兵棋推演定義的激烈爭論一直持續到今天。 彼得-佩拉(Peter P. Perla)是專業兵棋推演的巨頭之一,也是開創性的《兵棋推演的藝術》的作者,他將兵棋推演描述為由四個主要元素組成:一個合成環境,包含一個抽象的沖突,使用人類決策,以及展示這些人類決策的后果。 2016年,佩拉進一步將兵棋推演定義為 "在一個合成環境中對沖突或競爭的動態表現,人們在其中做出決定并對這些決定的后果做出反應"。 誠然,兵棋推演存在各種定義,但就本編輯卷而言,佩拉的定義是其基礎試金石。
以游戲的形式抽象人類沖突是很古老的,其根源可以追溯到古代的游戲,如圍棋或威海,一種在19×19英寸棋盤上進行的抽象戰略游戲,或印度次大陸的現代國際象棋的前身Chaturanga。然而,從武器職業的角度來看,喬治-利奧波德-馮-賴斯維茨在19世紀初開發的Kriegsspiel以及他的兒子喬治-海因里希-魯道夫-約翰-馮-賴斯維茨的繼續開發,才是開創性的起源點。萊斯維茨的Kriegsspiel是專業兵棋推演的一個里程碑式的時刻,因為它脫離了象棋等傳統系統,并在普魯士軍隊中被廣泛引入和采用。隨著時間的推移,作為娛樂、教育和分析的工具,兵棋推演的使用一直很豐富。威爾斯(H. G. Wells)和弗萊徹-普拉特(Fletcher Pratt)都是著名的小說家,他們設計了自己的兵棋推演來探索戰爭及其在20世紀的輪廓。第二次世界大戰的特點是主要使用兵棋推演,從英國皇家海軍西部近海戰術部隊(WATU)對抗德國潛艇攻擊的兵棋推演,到中途島戰役前臭名昭著的日本兵棋推演。從那時起,兵棋激增,并發展成為強大的商業游戲產業和一個充滿活力的專注于分析和教育的專業兵棋推演領域。
但這引出了一個問題。一個人如何成為一個兵棋推演者,無論是作為玩家、贊助商、分析家還是設計師?
當大多數職業兵棋手被問及他們是如何進入設計或使用兵棋研究沖突的領域時,大多數人(如果不是全部的話)都會羞澀地提供某種形式的 "我偶然進入的"。本文作者認為自己也是偶然闖入兵棋推演領域的一員。不幸的是,由偶然事件產生的戰棋手的普遍性并不罕見,而是由于沒有正式的系統來培養他們。缺乏一個既定的兵棋推演人才管道--無論是作為參與者、贊助者、分析者還是設計者--有可能使兵棋推演領域越來越小,越來越孤立。在軍隊中,軍官的兵棋推演經驗主要局限于駐地專業軍事教育(PME)和作為分析周期的一部分直接參與兵棋推演的選定任務。對于士兵來說,兵棋是一種罕見的商品,主要限制在個人使用商業兵棋和戰術決策游戲(TDG)進行基于單位的訓練。 目前的兵棋推演事業充其量是零散的、不連貫的。
對于有抱負的設計師來說,只有少數幾個機構為國防專業人員提供兵棋設計課程。在軍隊中,這包括位于俄亥俄州萊特-帕特森空軍基地的空軍技術學院(AFIT);位于堪薩斯州萊文沃思的美國陸軍指揮和總參謀部學院(CGSC);位于弗吉尼亞州匡提科的海軍陸戰隊大學(MCU);位于華盛頓特區萊斯利堡的國防大學(NDU)。麥克奈爾堡的國防大學(NDU);羅德島紐波特的美國海軍戰爭學院(NWC);以及加利福尼亞蒙特雷的海軍研究生院(NPS)。在民用方面,少數大學在專注于安全研究的課程中提供兵棋推演課程,如喬治敦大學、麻省理工學院、約翰霍普金斯大學、麥吉爾大學和倫敦國王學院。然而,這些課程大多是針對有抱負的設計師的入門課程。在學生接受了對兵棋推演的初步引導后,繼續學習和發展的途徑很少。這一點在Caitlyn Leong的文章《如何培養一個戰棋手》中得到了最好的反映,她強調了年輕設計師面臨的各種挑戰。她敏銳地寫道:"除了偶爾的個人導師之外,學生經營的兵棋推演組織和專業兵棋推演社區之間的聯系并不頻繁,甚至不存在。"
教育和培養兵棋推演專家的磨難是一個經常出現的話題,也是社區持續不斷的抱怨。2018年,作者寫道,美國防事業需要在整個隊伍中培養兵棋推演,利用無數的兵棋推演和工具。這包括使用像Steam這樣的數字平臺和設計定制的教育兵棋推演,以促進對兵棋推演這一工具的熟悉和欣賞。Rand公司的Elizabeth Bartels為兵棋推演教育提供了一個雙軌解決方案,為那些尋求成為專家或設計師的人,或那些尋求學習如何利用兵棋推演的人,如贊助商、項目經理和分析師,定制兵棋推演體驗。相反,Jeff Appleget、Jeff Kline和Robert Burks認為,美國國防部(DOD)應該致力于發展和振興其軍警隊伍中的兵棋推演專業知識。鑒于外部組織在兵棋推演中的主導地位,如聯邦資助的研發中心(FFRDCs)和國防承包商,他們認為這種依賴外包了 "國家國防戰略、軍官職業發展和部門采購過程的智力基礎"。同樣,2019年連接兵棋推演會議,一個兵棋推演的年度專業會議,有一個專注于下一代兵棋推演者的研討會,包括平民和軍警人員。不出所料,關于什么是最好的發展步驟的討論引起了激烈的爭論。由于解決方案的難以捉摸,如何培養下一代戰爭玩家的問題仍然是連接會議的一個長期辯論話題。
培養兵棋推演專家的問題不是一個無意義的學術探索,而是一個具有潛在可怕后果的緊迫任務。兵棋推演界正在迅速接近一個拐點,該領域的巨頭們正在穩步退休,而隨后的一代正在努力填補這個空白。同時,即使在美國防部,兵棋推演仍然受到誤解、偏見以及對兵棋推演的效用和局限性缺乏理解的阻礙。在 "正確看待兵棋推演"一文中,杰出的戰爭專家和前CNA兵棋推演總監Ed McGrady說:"人們普遍誤解了兵棋推演的含義,不愿意接受兵棋推演的力量和限制。這導致了對兵棋推演的誤用和濫用,從源于無知的錯誤描述到對兵棋推演的惡意誤用。
因此,本卷作者強調的問題和建議對于兵棋推演領域的持續發展是及時的。作者們探討了一系列廣泛的問題,廣泛地定義在三個主要的主題中:培養兵棋推演者,將兵棋推演應用于教育,以及教育外部利益相關者了解兵棋推演的價值。Natalia Wojtowicz、Kyleanne Hunter、Timothy Smith和Paul Kearney少校討論了培養戰爭玩家和兵棋推演素養的各個方面。同時,Scott Jenkinson中校、Jo Brick大隊長、Ian Brown少校和Benjamin Herbold上尉探討了如何將兵棋推演應用于PME。最后,Jeff Appleget、Robert Burke、Brandon Valeriano、Ben Jensen和Brooke Taylor探討了如何更好地通知和吸引外部利益相關者參與兵棋推演,從國會到社會科學家。
這本書還是以美國防部為中心,以英美為中心,以男性為主,這說明在更廣泛的兵棋推演領域里,多樣性很差。雖然該領域的人口結構正在發生變化,但變化的幅度和速度都很慢,仍有大量的工作要做。因此,除了對兵棋推演文獻進行補充外,這本書還試圖推動對兵棋推演領域的未來進行更廣泛的討論。
長期以來,兵棋推演一直被吹捧為想象和準備未來競爭和沖突輪廓的關鍵途徑,但兵棋推演界在如何最好地納入技術方面存在分歧。兵棋推演界的技術懷疑論者指稱,許多兵棋推演的技術不靈活,使用起來有難度,而且往往不能實現兵棋推演所陳述的體驗或分析的最終目標。另一方面,技術愛好者指出,兵棋推演中缺乏科學的嚴謹性和復雜性,是技術被納入的原因。在這兩個根深蒂固的立場之間--懷疑論者和熱衷者--技術在兵棋推演中的作用正在被裁定,這對兵棋推演界和國家安全具有廣泛的基礎影響。
雖然許多人試圖通過研究游戲組件(如場景)或兵棋推演應用(如行動過程分析)來確定兵棋推演和技術工具的理想融合,但本文采取了一個略微不同的方法。相反,它采用了用戶體驗研究方法,通過關注專業的戰爭游戲玩家和他們的經驗來確定前進的道路。本文通過對專業戰爭游戲社區的十幾次用戶訪談、八個焦點小組和一項技術調查(該調查在《戰火》--專業兵棋推演玩家中最受歡迎的國家安全媒體--中引起了500多名自認為是兵棋推演專業人士的回應),概述了技術最適合加強兵棋推演的領域。它評估了四個已確定的兵棋推演痛點--判斷、可用性、游戲的沉浸感和分析,并就技術如何能夠最好地緩解這些挑戰提供了建議。
軍隊為訓練、規劃和研究目的進行兵棋推演。人工智能(AI)可以通過降低成本、加快決策過程和提供新的見解來改善軍事兵棋推演。以前的研究人員根據強化學習(RL)在其他人類競技游戲中的成功應用,探討了將強化學習(RL)用于兵棋推演。雖然以前的研究已經證明RL智能體可以產生戰斗行為,但這些實驗僅限于小規模的兵棋推演。本論文研究了擴展分層強化學習(HRL)的可行性和可接受性,以支持將人工智能融入大型軍事兵棋推演。此外,本論文還通過探索智能體導致兵棋推演失敗的方式,研究了用智能體取代敵對勢力時可能出現的復雜情況。在越來越復雜的兵棋推演中,對訓練封建多智能體層次結構(FMH)和標準RL智能體所需的資源以及它們的有效性進行了比較。雖然FMH未能證明大型兵棋推演所需的性能,但它為未來的HRL研究提供了啟示。最后,美國防部提出了核查、驗證和認證程序,作為一種方法來確保未來應用于兵棋推演的任何人工智能應用都是合適的。
兵棋推演是成功軍隊的寶貴訓練、規劃和研究工具。自然,美國(U.S.)國防部(DOD)計劃將人工智能(AI)納入兵棋推演。將人工智能融入兵棋推演的一種方式是用智能體取代人類玩家;能夠展示戰斗行為的算法。本論文研究了用智能體取代人類兵棋推演操作員的可行性、可接受性和適宜性。為此,本章解釋了為什么兵棋推演對成功的軍隊至關重要。
軍隊進行兵棋推演是為了回答關于戰爭的關鍵問題,這些問題必須在實際沖突發生之前被理解。兵棋推演是利用對立的力量模擬實際的戰斗,并由人類的決策來決定[1]。雖然有廣泛的不同類型的兵棋推演,但它們都有一個共同的目標:"獲得有效和有用的知識" [2]。這種劃分很重要,因為兵棋推演的不同目的會導致玩家和游戲控制者的行為不同。圖1顯示了兵棋推演從訓練到分析到實驗的廣泛范圍。
1.訓練用的兵棋推演
最直接的兵棋推演類型是用于訓練的兵棋推演。大型參謀部使用建設性的模擬(數字兵棋推演)來鍛煉他們的參謀過程,并驗證他們的軍事準備。小型參謀部使用虛擬模擬器來訓練他們的戰斗演習和船員演習。軍隊進行這些兵棋推演是為了了解戰爭和鍛煉決策能力[3]。所有隊員的行動和決策一般都要符合已知的條令和戰術、技術和程序(TTP)。對于大型的參謀部演習,對手可能會突破TTP的界限來挑戰參謀部(例如,表現得更有侵略性,但仍然依賴相同的TTP)。
2.用于分析的兵棋推演
兵棋推演可用于分析,即 "確定在部隊對抗中會發生什么"[3]。這些是大多數軍事人員所熟悉的兵棋推演類型:作為行動方案(COA)分析的一部分而進行的兵棋推演。這些類型的兵棋推演允許對戰爭計劃、部隊結構或理論進行評估。在這些戰役中,雙方都要采用已知的理論和TTP,但 "在這些戰役中,創新精神可以自由發揮"[4]。
3.實驗性的兵棋推演
在譜的另一端是實驗性兵棋推演。在這些戰役中,雙方都可以使用新的力量、武器和/或戰術來探索潛在的未來戰爭[5]。歸根結底,組織進行實驗性兵棋推演是為了產生 "關于戰爭問題性質的知識"[2]。美國軍方在演習中整合了這些類型的兵棋推演,如美國陸軍未來司令部的聚合項目和聯合作戰人員評估。
4.兵棋推演的好處
盡管兵棋推演既不是預測性的,也不是對現實的完全復制,但它們確實提供了一些沒有實戰就無法獲得的東西:對戰爭中決策的洞察力。當為訓練而進行戰爭演習時,組織正在學習良好的決策是什么樣子的(包括過程和最終結果)。當為分析而進行戰爭演習時,計劃者正在評估他們在計劃期間做出的決定,以及在執行期間需要做出的潛在決定。
這些好處足以讓美國防部副部長羅伯特-沃克在2015年發布了一份備忘錄,呼吁在整個美國防部重新努力開展兵棋推演[6]。沃克副部長認為,兵棋推演有利于創新、風險管理和專業軍事教育。沃克認為,最終,兵棋推演將推動美國防部的規劃、計劃、預算和執行過程,這是告知國防部資源分配的方法。美國和它的西方盟友并不是唯一相信兵棋推演好處的軍隊。中國正在為兵棋推演投入大量資源,包括將人工智能融入兵棋推演[7]。
人工智能提供了一個機會,通過降低成本、加快決策過程和提供新的見解來改善軍事兵棋推演。為兵棋推演中的許多角色雇用人類操作員是昂貴的。組織必須給自己的人員分配任務(使他們脫離正常的職能)或支付外部支持。這種成本可以通過將人工智能整合到兵棋推演中而消除。兵棋推演分析的速度只能和人類操作者一樣快。用智能體代替操作員可以加快兵棋推演的速度,并允許多個兵棋推演同時發生,從而實現更廣泛的分析。最后,智能體因其在游戲中的創造性而受到關注[8]。創造性的智能體可以通過探索人類戰爭者可能沒有考慮的可能性,使戰爭計劃、部隊編隊或戰術得到更好的分析。
美國國內的國家安全組織認識到將人工智能融入兵棋推演的潛力。人工智能國家安全委員會在其最終報告中主張立即將人工智能能力整合到兵棋推演中,以確保美國及其盟友保持與同行的競爭力[9]。美國陸軍未來的模擬訓練系統--合成訓練環境(STE)設想整合人工智能來監測和調整訓練場景的難度[10]。美國陸軍研究實驗室有許多項目在調查人工智能與軍事指揮和控制系統的整合。具體來說,他們正在探索使用人工智能的一個子領域,即強化學習(RL)來進行連續規劃,以開發 "藍色部隊的新計劃"[11]。連續規劃將需要一個能夠評估其計劃的智能體,可能通過兵棋推演。
基于其他RL智能體在人類競技游戲中的成功,如《星際爭霸II》[12]、《古人防御》(DotA)[13]和圍棋[14],多名研究人員正在研究用于戰爭游戲的RL智能體。像《星際爭霸II》和DotA這樣的實時戰略(RTS)游戲最能代表兵棋推演。與兵棋推演類似,RTS游戲需要在有限的信息環境中進行長期的目標規劃和短期的戰術決策。以前的研究表明,RL智能體可以在兵棋推演中復制理想的戰斗行為[5], [11]。根據Kania和McCaslin的說法,谷歌的AlphaGo成功擊敗了世界上最好的圍棋大師,證明了人工智能可以應用于兵棋推演[7]。
雖然以前的研究已經證明RL智能體可以產生戰斗行為,但實驗僅限于小型交戰。研究人員只要求RL智能體控制三到五個下屬單位。強化學習智能體將需要成功擴展,以滿足涉及幾百個單位的大型兵棋推演的規模要求。
問題是,隨著兵棋推演中單位數量和類型的增加,信息量和可能的動作數量變得難以解決。Newton等人提出可擴展性是一組目標:速度、收斂和性能,同時保持在一組約束條件下:隨著項目規模的增加,成本、計算能力和時間[15] 。分層組織是擴展的一種方法。本論文將研究分層強化學習(HRL)的可擴展性。換句話說,任何可行的、可接受的人工智能集成到戰爭游戲中,隨著戰爭游戲中單位數量的增加,必須仍然顯示出理想的戰斗行為。
除了將人工智能整合到軍事兵棋推演中的可行性和可接受性之外,這種整合還需要是合適的。開發和執行一個失敗的兵棋推演是有可能的,因為從中得出的知識是無效的或沒有用的。Weuve等人[16]解釋了可能導致兵棋推演失敗的不同途徑,他們稱之為兵棋推演病癥。以取代人類操作者為目的的智能體的設計和實施,需要防止兵棋推演的病態,從而確保有效的結果。
這導致了以下的研究問題。HRL是否允許智能體在不損失性能的情況下增加合作單位的數量和有效性?什么框架可以確保智能體的設計和應用正確,以滿足兵棋推演的目的?
本論文延續了[17]和[18]對Atlatl戰斗環境中RL的調查。Atlatl是一個離散的、基于六邊形的兵棋推演,模擬陸地作戰行動。最初的研究使用一個簡單的多層感知器[17]成功地在RL智能體中產生了戰斗行為。隨后的研究使用卷積神經網絡(CNN)架構在復雜的地形和動態的對手中研究RL智能體[18]。
雖然有廣泛的HRL方法,但本研究的重點是封建多智能體層次結構(FMH)。在FMH中,一個單一的R智能體(即經理),將任務分配給一系列被稱為工人的下級RL智能體[19]。本論文比較了在Atlatl中越來越大的場景中采用基于規則的智能體、單一RL智能體和FMH所需的資源和有效性。
兵棋推演是由玩家和裁判員組成的[1]。友軍單位的玩家被稱為藍軍,他們的對手被稱為紅軍,任何一個玩家之外的平民或軍事單位被稱為綠軍。雖然有可能通過使用所有玩家和裁判員的智能體來實現兵棋推演的完全自動化,但本論文只評估了對單個玩家的替換。
本論文還研究了用智能體替換對方部隊(OPFOR)即紅色部隊時可能出現的復雜情況。討論了具體的兵棋推演病癥,并提出了緩解這些病癥的方法。美國防部的驗證、核實和認證(VV&A)框架被應用于通過RL對OPFOR的建模。
本論文發現,當FMH智能體以分布式方式進行訓練時,FMH智能體未能比單一RL智能體表現得更好。當經理和工人在同一環境中訓練時,FMH智能體的學習能力有所提高。然而,工人的不一致行動使經理無法制定最佳策略。此外,FMH的訓練要求超過了單個RL智能體的要求,這抑制了FMH擴展到大型軍事兵棋推演的能力。最后,本論文發現,將人工智能整合到軍事兵棋推演中的方法適合于像美國防部的VV&A框架那樣的過程。否則,基于模型的去太原的病癥會使兵棋推演的目標失效,并對美軍產生負面影響。
本論文通過進一步研究在建設性模擬中采用完全自主的智能體,對美國政府有直接好處。完全自主的兵棋推演智能體,能夠在多個層次上運作,需要支持兵棋推演的全部范圍。這很容易延伸到軍事規劃期間的決策支持工具,協助規劃者快速評估不同的COA。此外,探索在兵棋推演中使用智能體的適宜性將促進兵棋推演界采用人工智能。
本文是挪威國防大學學院更廣泛的研究和開發項目的一部分,該項目旨在探索各種兵棋推演和軍事演習的效用和潛力。這篇文章旨在激發對兵棋的使用和問題進行討論,并激發產生新的和更好的建議。因此,本文包含意見和學術思考。本文討論了兵棋推演、其多種不同類型、它們的實際用途,以及在使用兵棋以產生有用結果時出現的一些危險或陷阱。本文的目的是促進辯論,而不是給出任何明確的結論。
"兵棋推演"這個詞對不同的人意味著許多不同的含義。在某些情況下,存在著截然不同的解釋,從與軍事決策過程(MDMP;見CALL,2015)中的特定階段有關的極其狹窄的定義,到記者和大部分公眾傾向于將戰爭之外的所有軍事努力,包括現場訓練和計算機模擬,視為兵棋推演。這個詞有許多不同的使用方式,并帶有許多情感成見,這取決于相關人員的經歷。問題的一部分在于"'兵棋推演'沒有單一的、普遍接受的定義"(英國國防部,2020)。
即使是那些在專業基礎上參與兵棋推演的人,也很難接受現有的眾多定義,這些定義在定性技術和對更多分析性產出的定量要求之間可能有所不同。對于是否應該包括計算機模擬,或者 "兵棋推演"是否僅指人工技術,也存在分歧。有些人甚至不認可寫成 "war gaming"或"wargaming"。
與許多軍官一樣,我不關心學術定義的細枝末節,而更關心與我所承擔的任務有關的特定技術的有效性。我認為,任何 "兵棋推演"的定義都只能與兵棋推演所支持的具體任務和目的相關,而不是任何全面的概括。我還認為,試圖給"兵棋推演"下一個萬能的定義,不僅是徒勞的,而且實際上對更廣泛地采用這種技術來解決國防需求是有害的。因此,針對本文目的,我將以最廣泛的定義來使用 "兵棋推演",包括所有涉及人類決策者的教育、培訓和分析目的,但不包括實際戰斗。
兵棋推演是一種決策技術,它提供了結構化的、但在智力上是自由的、可以避免失敗的環境,以幫助探索什么是有效的(勝利/成功),什么是無效的(損失/失敗),通常成本比較低。兵棋推演是一個對抗性挑戰和創造性的過程,以結構化的形式提供,通常有裁判或裁決。兵棋推演是由玩家決策驅動的動態事件。除了敵對的行動者,它們還應該包括所有抵制計劃的 "反對 "因素。兵棋推演的核心是:
玩家。
他們做出的決策。
他們創造的敘事。
他們的共同經歷;以及
他們所獲得的教訓"。(英國國防部, 2020)
兵棋推演涵蓋了廣泛的方法和技術,旨在優化其與目標相關的產出,從那些旨在利用想象力、創造力和原創思維的方法和技術,到那些旨在支持軍事決策過程的方法和技術,以及那些旨在產生定量數據以支持采購和部隊開發的方法和技術。
由于這是一篇以實踐為導向的文章,關注的是兵棋推演在現實生活中的實際應用,以支持特定的任務和目的,因此也許值得花一些時間來闡述我自己作為一個兵棋玩家的實踐以及我過去在軍隊中舉辦訓練活動的經驗。我是1979年在桑德赫斯特皇家軍事學院開始接觸兵棋推演的,當時是在帕迪-格里菲斯(已故)的指導下,他是一位軍事歷史學家、兵棋家和多產的軍事歷史和戰術作者。在接下來的幾年里,我參與并幫助組織了許多大規模的兵棋推演活動,這些活動都是利用桑赫斯特的設施,由帕迪-格里菲斯和其他人負責。
有幾個不同的,往往是重疊的,你可能希望進行兵棋推演的原因。根據30年的經驗,我提供了一個主要原因的簡短清單,如下:
了解系統能力。
有效地了解態勢。
教育。
訓練。
當前部隊戰略或戰術。
未來部隊發展(包括作為采購過程的一部分)。
軍事決策過程的一部分。
了解團隊。
預測可能的未來。
了解系統能力。
2015年,我應邀在中國長沙的國防科技大學講授仿真和建模。作為一系列講座的一部分,我被邀請向軍校學生演示一個簡單的 "自由兵棋(free-kriegsspiel)"(一種很少或沒有書面規則的兵棋,裁決是基于一個高級裁判的經驗,而不是復雜的規則和程序)。這是在大學體育館進行的,由模擬學生充當裁判員(之前接受過技術培訓),同時進行25場10人的同一游戲。
我觀察到,中國學生傾向于尋找 "答案",而不是探索學習或自己思考,所以當一個學生質疑為什么有人會進行兵棋推演時,我選擇指導他們玩游戲,然后告訴我他們認為游戲的目的是什么。
在比賽中,關于戰術的討論非常少(以至于一個玩家在得知有炮火支援時,建議連續轟炸敵人的陣地,直到敵人死亡)。大部分的問題和討論都與武器的能力和效果有關。有人向我提問,如 "某個武器系統的有效射程是多少?",我回答說,作為解放軍的軍官,他們應該知道這些信息。這導致了許多討論、信息共享和對軍事手冊的研究。會議結束時,學生們一致認為,與死記硬背相比,這是一種非常高效和有效的信息教學方式。大多數人還同意,這顯然是進行這樣一個兵棋推演的主要原因。我并不反對。
與上述見解相聯系的是,約翰-康普頓博士3在2018年的 "連接美國 "專業兵棋推演會議上討論說,兵棋推演是向參與者介紹軍事態勢的一種極其高效和有效的方式。這是因為信息的呈現方式與它所處的環境直接相關,而且,由于它通常是通過發現學習的過程獲得的,所以它往往更容易在解決問題時發揮作用(Alfieri等人,2011)。這與我在英國常設聯合部隊總部工作時,在俄羅斯吞并克里米亞后,就波羅的海局勢進行的兵棋推演的經驗相吻合。
最終,我為總部的辦公人員就波羅的海局勢進行了四小時的矩陣游戲。游戲結束后,大家一致認為,游戲使參與者迅速掌握了不同的要素和關于當前局勢的重要背景。一位玩家說:"我現在知道了我所知道的,并理解了我不知道的,以及我需要研究的東西。一位J2的工作人員對此提出質疑,他指出這些信息已經以電子郵件簡報的形式提供,并指著一疊至少300毫米高的紙質打印件。大多數工作人員的回答是 "太長了--沒看"。
兵棋推演在教育中特別有效,正如上面提到的發現學習的背景。"我聽了就忘,我看了就記,我做了就懂"(Seok,2011)。然而,與所有基于游戲的學習一樣,也有一些注意事項,那就是需要仔細管理,所選擇的游戲類型應該是有重點的,并且與預期的學習結果相關(以及在現有的時間內可以實現)。也有很好的證據表明,試圖讓不熟悉或不習慣這種方法的教師強制使用基于游戲的學習,可能弊大于利(Whitney等人,2014)。
將游戲用于教育目的需要考慮的其他因素是,游戲不一定要玩到最后(避免得出 "我輸了,所以游戲不好 "或 "我贏了,所以游戲好 "的結論--這兩種結論對教育理解都是有害的),以及游戲不一定要完美地表現現實--游戲的簡易性和學生的參與性更為重要。事實上,如果游戲是不完美的,教員邀請學生就如何改進游戲提出建議,可以產生比游戲本身更多的洞察力和智能對話。因此,在一節基于游戲的學習之后,進行適當的匯報是非常重要的,以確保游戲與要達到的學習結果相聯系。
兵棋推演可以在培訓中發揮作用,因為兵棋推演往往比其他培訓方法更容易獲得,更容易接觸,而且成本更低(允許有更多的機會進行練習--刻意練習比天賦更重要;見Ericsson等人,1993)。就像上面的評論一樣,游戲是在一個特定的環境中進行的,這有助于信息的保留,并有助于理解游戲中描述的情況。
然而,與教育游戲不同的是,特別重要的是,游戲機制和裁決要根據對現實世界表現的期望進行驗證,以防止對游戲的價值失去信心或從體驗游戲中獲得錯誤的教訓。
2019年,駐扎在蘇格蘭愛丁堡的3號步兵營(一個輕型步兵營)的指揮官要求我協助開展一些戰斗小組級別的兵棋推演。該部隊將從輕步兵重新定位,成為一個機械化營,配備輕型裝甲的偵察車、支援車和運兵車。其目的是為了獲得一些洞察力和理解,以適應裝備這些車輛所需的戰術和程序的變化。
很快就可以看出,作為在阿富汗使用的 "緊急行動需求 "而購買的車輛,完全不適合機械化營所期望的更廣泛的作用。當把它放在一個特定的兵棋推演場景中,試圖在不同的地形中使用不同的車輛,并對付另一種更常規的敵軍時,很明顯,如果按照最初的設想使用這些車輛,會有很大的缺點。用于偵察的車輛雖然裝甲較輕,但缺乏對乘員的保護,特別容易受到炮彈碎片和敵人裝備的大炮的偵察。運兵車雖然在阿富汗的地形上對簡易爆炸裝置有很好的防護作用,但完全不適合在另一種地形上越野行駛。
事實上,所有這些因素都被暴露出來,在場景的操作背景下,在所有相關的利益相關者在場的情況下一起工作,這使得什么可能有效,什么不可能有效變得很明顯。這導致了對如何改變戰術以減少這些風險,或對部隊可以承擔的任務和角色進行限制的清晰理解。
當考慮將未來部隊的發展作為兵棋推演的目的之一時,這分為兩個主要領域:兵棋推演作為分析過程的一部分,以確定未來采購的數量和性能;以及兵棋推演,以確定這些新能力在特定場景下的最佳應用。前者最有可能由研究機構進行,后者則由軍事單位和編隊進行。
應該注意的是,在用于分析目的的兵棋推演中,游戲規則、數據和程序必須盡可能準確,以確保游戲產生的數據同樣準確;游戲的簡易性和玩家的參與是次要的(與教育戰爭游戲相反)。
可以說,兵棋推演是軍事決策過程中最關鍵的部分之一,因為它將指揮官的計劃從概念變成了細節,并使部隊的戰斗力同步于行動。這通常是軍事人員最熟悉的戰爭演習類型,也是由于對如何正確執行戰爭演習的誤解,以及缺乏分配給這一職能的時間和專業知識而通常做得不好的類型(CALL, 2020)。
戰術演練應該被用來評估作戰方案(COA)完成任務的潛力,以應對不同對手COA的預見性反擊,以及識別和糾正不足之處。然而,真正的價值在于它能夠允許指揮官和參謀部將行動的開展可視化,并深入了解對手的能力和行動,以及作戰環境的狀況(AJP-5,2019)。
基本要素是在作戰的背景下了解計劃,以及敵人可能采取的作戰方針。
托馬斯-謝林是美國經濟學家,馬里蘭大學學院公園公共政策學院的外交政策、國家安全、核戰略和軍備控制教授。他因 "通過博弈論分析提高了我們對沖突和合作的理解 "而被授予2005年諾貝爾經濟科學紀念獎。他還根據自己在戰略層面上的博弈經驗,在美國和俄羅斯之間建立了核熱線(Miller, 2021, pp.176-191)。
在蘭德公司的論文《27年后的危機兵棋推演》(Levine et al., 1991)中,Schelling寫道:"最大的好處是他們(參與者)與一些他們將來可能有機會合作或依賴的人變得親密無間,或者至少是隨意地熟悉起來。" 這被明確為兵棋推演的一個重要副產品,以及我所說的場景理解和系統能力。
"兵棋推演不是預測性的。兵棋推演說明了可能的結果,所以有可能從兵棋推演的一次運行中發現錯誤的教訓。兵棋推演可以說明某些事情是合理的,但不能明確地預測它是可能的。(英國國防部, 2020) "
許多作者,包括支持使用兵棋推演的作者和批評兵棋推演方法的作者,都對兵棋推演的預測能力提出了可怕的警告。人們總是對兵棋推演的失敗提出批評,從未能預測1899-1902年布爾戰爭的心理或經濟方面的決定性因素(Caffrey,2019),到商業兵棋推演 "遙遠的平原"(關于阿富汗戰爭)的設計者無法預測2021年8月阿富汗軍隊出現災難性崩潰的可能性(BGG,2021)。
如果兵棋推演在過去的122年里都不能預測未來,盡管有些作者聲稱它們可以(Dupuy, 1985),那么它們在這個領域有什么用處呢?
答案在于它們能夠在關鍵的利益相關者在場的情況下,暴露出一個計劃的多面性,同時面對克勞塞維茨式的摩擦(Watts,2004)和敵人行動所能帶來的所有對抗性因素。這種方法,如果執行得當,有一種獨特的能力,可以暴露任何未來計劃的弱點,排除那些根本行不通的行動和意圖,并完善可能結果的未來錐(Voros, 2017),突出預測的、合理的和可能的未來,并允許更好地理解與之相關的風險。
兵棋推演可能無法預測實際的未來,但它們善于排除那些根本行不通的未來計劃,并允許更好地理解在執行一項行動時可能發生的一系列結果。
在簡要討論了你可能希望進行兵棋推演的一些原因之后,重要的是要介紹一下為專業目的進行兵棋推演所涉及的陷阱和危險。
然而,在開始之前,有必要參考一下關于這個特定主題的開創性工作:"兵棋推演的病癥"(Weuve, et al, 2004)一文。我所做的任何評論只是反映了對我所進行的兵棋推演影響最大的問題,由于我在職業生涯的后半段是一名 "教育者",這影響了我的思維,也意味著在兵棋推演的某些領域(訓練和分析),我的經驗比較有限。
以色列軍方堅定地認為,任何具有虛構背景的訓練活動,包含專門為該活動創建的數據,不僅是一種浪費,而且浪費了對真實世界的理解和洞察的機會 - 他們是絕對正確的。你永遠不應該使用假的場景。
除非你必須這樣做。
在某些情況下,對運行有關真實潛在敵人的游戲存在政治敏感性。大多數情況下,這些都是誤導,實際上對活動的價值有害。在真實的潛在情況下進行游戲的行為不僅本身非常有價值,而且如果消息傳到反對派那里,那就更好了,因為這將產生威懾作用。更不用說,如果一般公眾認為我們是在 "瞎編",他們會認為我們不認真對待這種情況,是瘋了。畢竟,20世紀20年代的 "紅色戰爭計劃 "是美國針對英國和加拿大的一套真實的計劃方案,是由一個剛剛在歐洲作為英國的盟友之一打了一場大仗的國家設計的(Major, 1998, pp.12-15)。
如果你被迫擁有一個虛構的場景,基本上有三種選擇:從頭開始生成場景,增加一個額外的國家,以及改變名稱。
從頭開始構建場景是最糟糕的選擇。所需的工作是巨大的,根據游戲的層級,你可能需要創建整個大陸、國家和其他社會政治集團。你可能需要繪制地圖,以及關于友軍和敵軍作戰命令的深層背景數據,這可能是非常耗時的。
添加一個額外的國家是一個稍好的選擇,因為地緣政治環境是真實的世界,但在危機地區插入了一兩個虛構的國家。這減少了準備工作的負擔,通常允許使用真實的地形(重新劃定一些邊界),并有一個可否認的外衣。
改變名稱是最好的選擇。它允許所有相關人員使用現實世界的情況,并將變化降到最低,而我們決定費盡心思改變名稱的事實表明,我們不希望冒犯他人,同時顯然允許在真實的地緣政治情況下進行訓練。然而,不要搞錯了--"僅僅改變名稱 "本身就可能是一項巨大的努力。我曾參與過一次軍團級的演習,我們要使用西德的地理環境,我們只是把它重新命名為 "紅土"。準備工作已經到了高級階段,當參加演習的德國師級人員震驚地發現,只有國名改變了,但城鎮、地區或河流的名稱都沒有改變。例如,將下薩克森州作為 "敵人的領土",這在政治上被認為是不可接受的,而且,由于計算機模擬無法在現有的時間內進行修改,因此不得不完全重寫設定,使用英國的地理環境,因為這是當時唯一存在的替代模擬地形。
人們經常表示擔心,如果使用真實世界的數據,場景將不得不成為機密;增加的費用和努力是一個數量級的。有幾件事情需要考慮:
用真實的數據進行訓練是更好、更現實的。它將吸引在現實生活中處理情況的個人更高水平的參與,并提供一個機會在事件中檢查數據的有效性和背后的假設。在大多數情況下,在高分類的情況下,實際需要的數據非常少,但額外的成本可能非常高。
根本不需要使用分類數據。完全可以使用通常用于 "訓練 "或公共領域的數據,以較低的分類來設計事件,將其設置在現實世界中。與從完全 "編造 "的數據中得出的那種教訓相比,認為這可能會產生 "錯誤的教訓 "的論點顯然是可笑的。
在過去,這不是一個問題,因為人們普遍認為戰爭與和平之間有一條分界線。這意味著,與手頭的軍事任務相比,對地緣政治局勢、當地政治或宗教的詳細了解被置于次要地位。然而,在當前的不對稱威脅環境中,這種復雜性變得極為重要,因此,為了解決這個問題,場景模擬變得越來越復雜了。
當一位高級軍官說他希望通過一個特定的兵棋推演來 "證明我們需要更多的[某種]導彈 "時,我實際上也在場。他沒有按照兵棋推演的原意使用兵棋,而是為了研究一個問題,以收集有助于為辯論提供信息的見解,他已經決定了答案,只是想通過兵棋推演來證實他的偏見。
這種行為比你想象的要多,不一定像上面的例子那樣明目張膽地發生,但在減少兵棋推演的范圍時,表面上是出于預算或編程的原因,所以被審查的場景被迫處理如此少的替代方案,結果是預先注定的。
英國皇家海軍進行了一次兵棋推演,研究格陵蘭島、冰島和英國之間的差距,這是大西洋北部的一個區域,在這三個陸地之間形成了一個海軍扼制點。其目的是確定是否可以有效地發現俄羅斯北方艦隊的潛艇運動進入北大西洋。一些憤世嫉俗的分析家認為,這場戰爭的目的是為了 "證明 "皇家海軍沒有足夠的潛艇來發揮效力。他們感到驚訝的是,這個假設在游戲開始時就被假定了,而實際的問題是調查如果這種情況被證明是真的,最具有成本效益的替代方案。
最后,顯然需要更多的潛艇才能有效地對付更現代化的俄羅斯潛艇,但除了試圖采購更昂貴的潛艇外,還有一些具有成本效益的替代方案:衛星監視、與盟國加強合作以及海上空中巡邏。當然,海軍兵棋準備建議為皇家空軍海上航空隊提供額外的資金,這一事實在分析上,特別是在政治上都是令人信服的,并且保證了結果被廣泛分享和采取行動。一個提出正確問題的例子。
重要的不是兵棋推演確定了某一系統或戰略存在嚴重的不足,而是玩家做了什么來克服這一不足,以及這是否能夠成功。
兵棋推演,至少以我在英國的經驗來看,一般是例外,而不是常態。因此,當安排了適當數量的高級領導人參加的兵棋推演時,它們往往會受到 "膨脹 "的影響,目的和目標變得越來越雄心勃勃,以證明有這么多的高級決策者參加。在這種情況下,活動中不可避免地增加了其他內容,在活動中插入了審查其他場景和問題的機會,以充分利用參與的人才。
這必然會扭曲活動,將重點從最初的問題上移開,并有可能稀釋結論,從而使它們在更廣泛的戰后報告中丟失,這些報告中充滿了對大多數人來說不感興趣或不相關的信息。
額外的元素也將有助于固定活動方案,分散對原意的注意力,減少那些高級人員花時間 "深入研究 "的靈活性,以進一步研究與他們的同行產生的任何特殊見解。相反,他們往往被從一個點引導到另一個點,缺乏參與或時間來產生有用的投入。
當一場兵棋推演成為 "大事件",有許多高級決策者參加時,它也可能吸引媒體的注意,因此游戲的結果將受到明顯的關注。這意味著要避免被認為是失敗或缺點的尷尬,而且游戲不可避免地被傾斜,以產生一個 "成功的結果"(就外部第三方而言),而不考慮最初的目的。
在這種情況下,游戲不再是一個兵棋,而是通過計劃獲得成功的行動,只有微不足道的 "學習 "才能證明事后的活動。
如果我們考慮在最廣泛的意義上使用兵棋推演,我們需要理解許多人為了產生一個 "更準確 "的結果而希望涉及計算機模擬,也許還有人工智能(AI)。這是錯誤地認為 "更多的數據 "和 "更多的計算能力 "可以在某種程度上,本身就可以提高準確性。
使用模擬和人工智能協助軍事指揮官決策的機會是令人興奮的:使用計算機模擬未來的沖突局勢,然后 "通過人工智能運行它們",以制定最佳行動方案、部隊組合和實現成功的時間。請注意,在這種情況下,人工智能的軍事概念包括在一個基于云的分布式架構中查看多個同時進行的行動方案,以并行地完成許多這些過程(庫克,2020年)。它可能不是嚴格意義上的人工智能,但任何先進的技術計算架構都傾向于被概括為這個標題--軍事指揮官實際上只對產出的實際效用感興趣,而不是對術語的學術定義。
然而,這種方法有一些問題,主要是在兩個方面:基礎模型的準確性;以及優化的危險,導致可預測性和脆弱性。
人工智能系統采用規則來優化其行為,以尋求優勢。這種方法的優勢在于它的有效性。這種方法的缺點也是它有效。我們必須非常小心,確保我們為人工智能定義參數,以產生我們想要的行為(例如,最佳攻擊路線可能在國家邊界之外,所以我們需要確保我們在執行計劃時不會入侵鄰國)。人工智能可以產生不同的行動方案,只要他們的規則適合任務,在封閉的模擬環境中。這必須由人類嚴格控制,以確保不僅規則適合情況,而且人工智能不會通過利用系統中的錯誤來作弊(Benson,2020)。
雖然許多這些系統或多或少都是聚集在一起的,所以必須對性能進行近似,但它們是用來訓練的,這意味著它們足夠準確,有軍事用途;對于Box(1979)來說,"所有的模型都是錯的,有些是有用的"。
危險的是,如果我們可以做這種分析,我們的敵人也可以,讓他們預測我們的行動方案。在尋求具有決定性優勢的武器系統時,這樣的系統變得昂貴,減少了用于替代方案的資源,并且需要很長時間才能投入使用。敵人在得知這樣一個系統后,可以花時間來打敗這個系統。而當他們這樣做的時候,就沒有什么可以反對他們了。韋恩-休斯教授警告說:"海上戰爭中的殺戮往往是用海軍的第二好的武器完成的。如果在未來的某個沖突中,雙方都反擊了對方的首要武器,那么海軍將不得不問:我們的下一個最佳武器是什么?" (Rielage, 2017)。如果人工智能生成的可預測性已經導致了一個單一的武器系統或最佳方法,而它被打敗了,可能就沒有什么替代品了。
優化的系統也是脆弱的,特別是在面對突發事件時。這一點在COVID-19大流行病早期的衛生紙交付的供應鏈失敗中得到了明確的證明(Wieczner, 2020)。特別是軍事行動,需要對突發事件有強大的抵抗力。
然而,許多這樣的實驗未能解決的是關于情報和局勢數據準確性的一些隱性和顯性假設。正如在科索沃的空襲行動中所證明的那樣,塞族人能夠用相對粗糙的技術騙過美國的情報分析員(施密特,1999年),而且在堅實的地面、泥濘的斜坡和耕地上的相對 "前進"(即前進速度)很少被量化,所以假設是危險的。
然而,所有的軍事規劃都是在不完善的信息基礎上進行的。假設人類對人工智能的建議有所節制,那么當人類和人工智能合作以利于決策時,有可能導致更好的結果(an den Bosch & Bronkhorst, 2018),或至少排除更愚蠢的選擇。
因此,人工智能,在一些注意事項和人類的支持下,可以使其發揮作用 - 但代價是什么?人工智能的歷史是一個炒作和預期失敗的故事,被Floridi(2020)稱為 "人工智能的冬天"。其他技術(現有的統計方法、人工兵棋推演、競爭性假設的分析)已被證明是同樣有效的,而成本和精力卻只有一小部分(Makridakis等人,2018),而且不容易出現人工智能衍生結果有時會產生的嚴重錯誤(Yampolskiy,2016;Osoba和Welser,2017)。
英國防部傾向于希望在最昂貴和效率最低的領域使用人工智能--而不是后勤支持和光學識別這些低垂的果實(國防采購機構認為在正常競爭下會自動交付)。相反,他們追求的是最昂貴和最令人興奮的獎品:常規部隊的行動過程評估(Kerbusch等人,2018)。
兵棋推演應該是小型的定期活動,其范圍靈活,產出集中,能夠從最廣泛的角度考慮問題。只有從這樣的活動中才能產生洞察力。
正如偉大的F.W.蘭徹斯特所說。"提供有用見解的簡單模型比那些與現實世界如此接近的模型更受歡迎,因為他們想要解開的謎團在模型中重復出現,而且仍然是謎團"(Fletcher, 1995)。
然而,到目前為止,對兵棋推演最大的誤用僅僅是因為許多人(包括許多高級決策者)根本不了解兵棋推演這一技術,或者認為他們自己對兵棋推演的狹義解釋是正確的,而所有其他的解釋都或多或少地存在缺陷。
這并不局限于國防領域的普通民眾。職業兵棋手們自己也對兵棋的定義爭論不休,在那些認為分析性兵棋的定量科學是唯一有效的方法的人和那些喜歡 "更廣泛的兵棋"的定性藝術而不是 "狹隘的"(和 "狹隘的")替代品的人之間存在著明確的分裂。
造成這種情況的原因是,幾乎在所有情況下,兵棋推演都是由自學成才的少數人進行的,由他們個人的職業發展提供信息,缺乏正規專業教育所能提供的更廣闊的視野。這并不是說兵棋推演課程不存在,但總的來說,這些課程是其環境的產物,因此其產出偏向于其贊助商的要求。舉個例子,MORS7兵棋證書(正如你所期望的那樣)在很大程度上偏向于分析的一端。
為了有效,兵棋推演需要來自指揮系統的正式支持。它需要一個冠軍(一個高級領導人,承擔起確保每個參與者都致力于該技術的最終成功的重任),需要有人負責確保兵棋推演在每個級別都得到理解并定期進行,從計劃分區攻擊的初級士兵到軍隊的最高級別,如英國國務卿的網絡評估和挑戰辦公室(SONAC;見Elefteriu,2020)。
需要在軍事學校和學院開設正式的教育課程,教授全方位的兵棋推演,而且兵棋推演應該被強制規定為任何課程或單位和編隊的年度培訓周期的一部分。只有這樣,才能培養出新一代有適當資格和經驗的人,以取代 "有天賦的業余愛好者",他們在大多數軍隊中構成了大部分的兵棋推演專家。
不過,無論怎樣強調都不為過的是,不能把應該進行兵棋推演的授權與應該玩某種游戲或游戲類型的授權混為一談。
正如弗朗茨-哈爾德將軍(Generaloberst Franz Halder)在談到20世紀30年代和40年代的德國軍隊兵棋推演時所說:
"軍事文獻包括關于兵棋推演的非官方手冊。為了避免哪怕是最輕微的軍團化跡象,并在戰爭游戲的應用和發展中保持充分的自由,官方沒有發布任何形式的正式指令。(霍夫曼, 1952)"
在這篇文章中,我試圖確定兵棋推演的多種多樣的用途,強調游戲類型之間的差異,所有這些游戲都是為了一個特定的目的。沒有哪種游戲適合所有人--用于教育、培訓和分析的游戲之間的差異是非常重要的,而且經常被忽略。
我還從我的經驗出發,介紹了一些在運行兵棋推演時可能出現的錯誤和危險(并指出了關于這個問題的開創性工作)。為了避免其中最重要的危險,并確保它作為一種使軍隊更加有效的技術而獲得成功和發展,兵棋推演需要得到指揮系統的支持,并且必須成為軍事學校和學院課程的一個重要組成部分。
這本書回答了你可能從未想過要問的問題,比如說:
這篇序言回答了關于本書的三個重要問題:為什么要閱讀它,為什么寫它,以及它是如何創建的。
如果你只是想讀一些既有娛樂性又能 "節省時間 "的書,那就有足夠的理由去讀這本書。一路上,你將了解到H.G.威爾斯最不準確(或者,我們希望是最不成熟)的預測。你會遇到軍事上的特立獨行者,并了解你可能認為自己已經知道的歷史事件的其余部分。
如果你在軍隊中服役,并希望以較低的時間和財富成本履行你的職責,你應該閱讀這本書。如果你是一名新兵,一名高級將領,或一名政治任命者,你會在這本書中找到與你的水平相關的見解。
如果你是一位家長,關注電子游戲中暴力程度和你的孩子所處的競爭日益激烈的世界,這本書是為你準備的。我描述了父母如何利用兵棋推演來幫助他們的孩子發展戰略思維和有效競爭的能力。
如果你是一名選民,希望對國防有更好的了解,這本書告訴你許多關鍵決定是如何做出的。
如果你的業務是商業,這本書描述了類似兵棋的技術在這個世界上越來越廣泛的使用。當企業不僅要與街邊的公司競爭,還要與遠在地球另一端的政府擁有的公司競爭時,商人們需要他們能得到的一切優勢。本書中描述的技術可以提供一個重要的優勢。
如果你有興趣幫助建立一個更繁榮、更和平的世界,你會在我的結論中發現一個論斷:雖然兵棋長期以來被用來使勝利更有可能,但它們也有可能幫助使和平更持久。
我開始寫這本書是出于一個功利性的原因:1997年,我需要一本空軍指揮和參謀學院選修課的兵棋推演教材。出于不同的原因,我一直在寫這本書。隨著我對兵棋推演歷史的研究,我越來越相信,兵棋是一個非常強大的工具。兵棋對我們今天所處的世界形態產生了巨大的影響,有好有壞。不幸的是,那些對兵棋推演本身產生重大影響的人不僅不為大眾所知,而且在很大程度上也不為今天的軍隊所知。這讓我覺得既不公正又危險。我還觀察到,兵棋推演的藝術、科學和應用并不總是能傳給下一代。歷史似乎表明,當有效使用時,兵棋推演提供了強大的優勢,而關于棋的健忘癥則造成了更大的傷亡。
這導致了另一個認識——僅僅講述兵棋推演的故事是不夠的。即使這個故事說服了讀者進行兵棋推演,游戲本身也不能確保成功。從我的研究中可以看出,兵棋已經成為全球性的,我們的對手幾乎不可避免地也會進行兵棋推演。我需要寫一本書,幫助我方從兵棋推演中獲得比對手更多的價值。
在我努力完成這本書的過程中,我產生了一個最終的動機。我開始相信,兵棋——或者更廣泛地說,模擬游戲技術--可以成為實現其他目的的寶貴工具。類似兵棋技術可以幫助我們在經濟上更有效地競爭,使我們能夠承擔更有效的防御。最終,兵棋還可以幫助培養致力于一個更加和平和繁榮的世界的戰略家。
如果成功有一千個父親,這本書應該是非常成功的。1990年,我在 "起源 "兵棋推演會議上首次發表了關于兵棋推演歷史的演講。我經常從我的聽眾那里獲得線索。
此外,從1997年到2005年,我在空軍指揮和參謀學院教授兵棋推演選修課。我的教員、客座講師和學生提供了許多杰出的見解,這些見解塑造了我目前對兵棋推演潛力和一般游戲技術的想法。
然而,我從兵棋推演社區的年度聚會"聯結"的參與者那里得到了最寶貴的見解和鼓勵。自1993年以來,"聯結"將來自美國和世界各地的學術和娛樂性兵棋推演從業者以及各軍種的軍事人員聚集在一起。最后,我在美國和盟國軍隊中的同事,特別是美國空軍總部、空軍物資司令部和空軍研究實驗室,教會了我很多關于兵棋推演及其應用的知識。這本書確實是兵棋推演界的作品。
導言以描述一個近期的兵棋開始,這個游戲塑造了我們今天所處的世界。接下來是對"兵棋推演101"描述,以便對原則和詞匯有一個基本了解。最后是基于案例總結了系統的使用歷史。
第一部分,"兵棋推演的歷史",占據了本書的大部分內容,是本書的核心。它追溯了兵棋推演對歷史的影響,從最早的文明到現在的寫作時間。介紹了對兵棋推演有影響的人,以及反過來影響歷史的兵棋推演。
第二部分是收益,如何從兵棋推演中獲得最大價值。它解釋了為什么兵棋推演是有效的,以及領導者、實踐者和參與者如何能夠提高這種有效性。最后,它描述了人們,從父母到總統,如何使用兵棋推演來支持他們的特定需求。
結論以簡短的回顧開始,然后問道:我們希望兵棋在未來如何發展?然后,提出了一種兵棋發展方式,即從幫助贏得戰爭的工具發展到幫助首先避免戰爭的工具。該書最后說明了兵棋推演的作為避免戰爭工具的用途,以幫助實現最高形式的勝利--公正和持久的和平。
全域作戰 (ADO) 是美國軍事聯合概念的演變,旨在應對戰略對手,他們希望利用戰爭的新興特征來破壞和克服美國在日益復雜和全球戰場上的優勢。ADO作為一個概念很重要,因為它同時認識到作戰環境的復雜性以及對手打算如何在其中實現戰略優勢。這個概念描述了美國陸軍如何在鞏固成果的同時,使聯合部隊能夠防止、拒絕和利用對手。隨著多域作戰環境的出現和美國陸軍尋求在未來獲得并保持持久的優勢,繼續發展ADO概念將至關重要。
兵棋推演繼續作為軍事組織的一項關鍵職能和工具。兵棋推演工具根據玩家的決定,以不同程度的現實和抽象來模擬過程和后果。兵棋推演理論對美國陸軍領導力的開發至關重要,因為它提供了一個過程,通過抽象的機制將關鍵的決策還原成一個反復的過程,使人們能夠探索失敗并獎勵學習,以做出更合適的決策。兵棋推演是測試ADO概念的關鍵因素,也是培訓和教育未來領導力的關鍵方法。
ADO的關鍵是發展理解概念和作戰環境的能力。ADO推演允許領導者和軍事理論家學習和探索作戰環境,包括對手與美國和盟軍在作戰環境中的能力。設計一個關于ADO作戰概念的兵棋推演工具,可以創造一個框架,在這個框架內,領導者可以練習規劃、執行和反思關鍵因素。這篇論文提出了一個概念證明,即通過教育和培訓,重點關注陸軍的ADO規劃和執行的作戰方法,以促進未來的領導力開發。
戰爭是永遠存在的。在某種不同程度上,行為者總是為沖突做準備或參與沖突。戰爭的特征和現代戰爭的概念在時間上無情地向前推進。美國的戰爭專家和政策制定者主要認為,全域作戰(ADO)是未來的戰爭概念。全域作戰代表了美國軍隊在2020年和不久將來的現代聯合作戰概念和方法。這一概念將空中、陸地、海洋、網絡空間、電磁和太空領域整合在一起,進行跨時空的規劃和同步執行。ADO固有的復雜性要求領導者對跨領域的能力、規劃和執行有一定的了解。
從戰術層面開始的領導力開發路徑限制了聯合和作戰經驗。對ADO的理解和更好的執行需要領導者在經驗發展的早期學習規劃和實施新生的概念。到目前為止,真實世界的親身體驗是最好的,但很難復制,在聯合作戰中更是如此。兵棋推演提供了一個補充教育和培訓的工具,利用機械原理來幫助對問題和決策過程的理解框架。一個全面的兵棋推演工具對于ADO中未來作戰領導力的開發是至關重要的。
本報告的目的是展示兵棋推演如何為美國陸軍在ADO中的角色開發和領導力培養提供方法。該研究旨在為對ADO感興趣的領導人提供一個基礎,并通過兵棋推演進行開發和教育。本報告展示了兵棋推演如何模擬ADO的概念,以指導和促進教育。兵棋推演的目的包括跨越時間和空間,通過所有領域來規劃和管理軍事行動,同時在與ADO相關的各個階段納入作戰藝術和科學元素。兵棋推演模型應能適應任何場景,并采用模塊化設計,允許根據需要強調背景。設計者根據現有的作戰框架,通過在至少兩個主要對手之間的偶發階段來開發兵棋推演工具,從而實現反思和討論。本報告提供了一個概念證明,即作為進一步開發的基線Theatrum Belli,并解決了陸軍理論中關于兵棋推演的一個重要空白。
在陸軍兵棋推演中,ADO的概念和理論存在一個重大的空白。很少有現有的模型能以現代的方式將所有的五個戰爭領域都納入其中,以適當地呈現ADO的要素。此外,美國陸軍缺乏一個模擬的、標準化的模型來最好地描述從師到戰區陸軍在作戰層面執行 ADO。美國空軍和美國海軍目前正在開發一個以ADO為導向的兵棋推演,但仍然沒有納入大量的地面部隊。本報告提出了一種兵棋推演的設計,能夠在作戰層面上對ADO的規劃和執行的領導力進行教育和開發。鑒于該兵棋推演的主要目標,設計者必須承認該模型和研究的局限性。
第一手和真實世界的經驗是最好的學習環境。然而,在作戰層面為ADO創造一個真實世界的訓練環境,在時間、物質和人員上的成本可能是令人望而卻步的。兵棋推演是一個有明確目標的模型,它準確地描述了至少兩個對立面之間的一些戰爭要素。為了實現這個明確的目標,必須對設計的因素進行優先排序。該模型只模擬了現實和戰爭的某些部分,優先用于實現兵棋推演的目標。設計的細節越精確、越全面,它就越復雜。兵棋推演通常會犧牲不同程度的精確性來實現簡單性,以減輕參與者所需的時間和精力成本。設計的目的是在ADO上進行指導,這也帶來了其他的限制。兵棋推演可以通過多次迭代來教授類似的學習目標,但對現實的每一次抽象都意味著模型的應用在任何時候都只能解決這么多問題。
兵棋推演的獲取和可用性是對擬議的兵棋推演的關鍵限制。兵棋推演中的任何機密材料都會大大降低大多數專業軍事教育(PME)項目的準入門檻。由于缺乏機密材料,該設計不可避免地掩蓋了ADO固有的某些方面。這使得一個用于訓練和教育目的的模型能夠得到更廣泛的傳播,甚至可能包括盟軍部隊。此外,該模型的擴大傳播鼓勵了PME之外更廣泛的參與,這可以進一步創新和調整未來的迭代。除了所討論的本報告的局限性外,設計過程的范圍更好地定義了設計方法。
本報告的兵棋推演設計范圍提出了一個課堂環境的概念說明,以補充ADO的學習。因此,重點支持實現具體的學習目標,只需要教師和學生的必要時間和努力。一個兵棋推演如果吸收了太多的時間,無論是學習操作還是執行本身,對任何有時間安排的人來說都會成為一種負擔。為了解決參與者的注意力問題,兵棋推演的模式必須是高效和簡短的,但仍然包括促進學習目標的機制。教員通過兵棋推演來管理學生的注意力,并需要利用剩余的時間來發揮綜合作用,而不是讓學生筋疲力盡。為了補充高級軍事研究項目(AMSP)的課程,設計應該以研討會的環境為基線。這種形式可以擴展到旅以上梯隊的工作人員,在幾個小時內執行迭代,而不是全天的事務。設計的迭代性質適合于情節性的場景,參與者可以用默認的標準跳入和跳出場景,或者在不同的情節之間進行進展,以實現持續的連續性。這是對兵棋推演范圍的一般性介紹,本報告將在后面對其設計背后的理論作進一步的詳細說明。
本報告的引言闡述了論文和主要目的,確定了重大差距,以及兵棋推演設計的局限性和范圍。下一節涵蓋了所研究的文獻、理論、概念和以前的兵棋推演,以及它們對擬議設計方法的應用。
圖4. 在MDO框架中強調的軍事問題。
在不確定性下進行的決策序列出現在各種環境中,包括交通、通信網絡、金融、國防等。為序列決策問題找到最優決策策略的經典方法是動態規劃;然而,由于維度詛咒和建模詛咒,它的用處有限,因此許多現實世界的應用需要另一種方法。在運籌學中,過去的 25 年中,使用近似動態規劃 (ADP)(在許多學科中被稱為強化學習)來解決這些類型的問題越來越受歡迎。通過這些努力,成功部署了 ADP 生成的卡車運輸行業駕駛員調度、機車規劃和管理以及制造中高價值備件管理的決策策略。在本文中,我們首次回顧了 ADP 在國防背景下的應用,特別關注那些為軍事或文職領導層提供決策支持的應用。本文的主要貢獻是雙重的。首先,我們回顧了 18 個決策支持應用程序,涵蓋了部隊發展、生成和使用的范圍,它們使用基于 ADP 的策略,并針對每個應用重點介紹了其 ADP 算法的設計、評估和取得的結果。其次,基于所確定的趨勢和差距,我們討論了與將 ADP 應用于國防決策支持問題相關的五個主題:所研究的問題類別;評估 ADP 生成策略的最佳實踐;與當前實施的策略相比,設計漸進式策略與徹底改進策略的優勢;情景變化時策略的穩健性,例如從高強度沖突到低強度沖突的轉變;以及尚未在國防中研究的,可能從 ADP 中受益的順序決策問題。
關鍵詞:序列決策問題、馬爾可夫決策過程、近似動態規劃、強化學習、軍事
許多決策不是孤立地做出的;觀察到以前不確定的新信息;鑒于這些新信息,將做出進一步的決策;更多新信息到來;等等。這些類型的決策被恰當地描述為順序決策問題、不確定性下的順序決策或多??階段決策問題,其特點是決策對未來獲得的回報或產生的成本、未來決策的可行性以及在某些情況下的外生時間對決策的影響[1],[2],[3]。本質上,“今天的決策影響明天,明天的決策影響下一天”[2, p.1],如果不考慮決策之間的關系,那么所取得的結果可能既沒有效率也沒有效果。
自20世紀50年代以來,人們就知道這種順序決策可以被建模為馬爾科夫決策過程(MDP),它由五個部分組成:一組候選行動;選擇行動后得到的獎勵;做出決策的歷時;狀態,即選擇行動、確定獎勵和告知系統如何演變所需的信息;以及定義系統如何從一個狀態過渡到下一個狀態的過渡概率[4]。給定一個MDP,目標是找到一個決策策略--"一個規則(或函數),根據現有的信息確定一個決策"[3,p.221],也被稱為應急規劃、規劃或戰略[2,p.22]--作出的決策使得系統在給定的標準下表現最佳。尋找最優決策策略的經典方法是通過動態規劃(DP)解決貝爾曼的最優方程[5]。在國防背景下,DP已被應用于確定各種連續決策問題的決策策略,包括艦隊維護和修理[6]、基本訓練安排[7]、研究和開發項目選擇[8]、軍事人員的去留決策[9]以及醫療后勤資產調度[10]。
盡管DP為解決順序決策問題提供了一個巧妙的框架,但它在許多現實世界的應用中的作用有限,這一點早已得到認可。這是由于維度的詛咒[5]--"隨著變量(或維度)數量的增加,問題的難度異常快速增長"[11]--以及建模的詛咒,即需要一個明確的模型來說明系統如何從一個狀態過渡到下一個狀態[12]。雖然今天的計算機可以解決有數百萬個狀態的順序決策問題[13],但許多問題仍然太大,無法通過經典的DP方法有效解決。此外,通常的情況是,狀態之間的過渡概率根本不知道。具有這些特征的順序決策問題貫穿于整個國防領域,跨越了軍力發展、生成和使用的范圍。比如說:
在軍力發展中,關于能力投資的決策可能多達數百項,通常在業務規劃周期內的固定時間進行,并且每年重復。決策者必須考慮所選擇的投資的短期和長期影響,以及未選擇的投資,同時考慮到未來軍事合同的不確定性,聯盟和對手能力的變化,國防特定通脹,等等。
在軍力組建中,決定招募多少名軍人和軍士,以滿足各種軍事職業的要求,同時尊重國家的授權力度,并考慮到各種不確定因素,包括每年的退休、晉升、自然減員等等;
在軍力雇傭范圍內,在大規模疏散行動中決策,如重大海難期間,將哪些人裝上直升機,同時考慮到包括天氣變化、個人健康、直升機故障等不確定因素。
由于這些挑戰,在這些類型的問題中,通常不可能找到一個最優的決策策略,需要采用其他的方法,重點是找到一個好的或接近最優的策略。第一個方法是由Bellman和Dreyfus[14]提出的,在接下來的幾十年里,包括運籌學、控制論和計算機科學在內的各個領域都發展了更多的方法,詳細的討論和相關的參考文獻列表見Powell[15]。此外,數學規劃領域,特別是隨機規劃,已經開發了復雜的算法來解決高維決策和狀態向量的問題,這在現實世界的順序決策問題中經常看到[16]。
在運籌學中,這些方法以各種名義被開發出來;尤其是神經動態規劃、自適應動態規劃和近似動態規劃(ADP)。如圖1所示,這些方法在過去的25年里越來越受歡迎,從1995年到2021年4月9日,共發表了2286篇文章,年發表率從一篇文章增長到每年近250篇。最近,ADP--"一種在模擬中做出智能決策的方法"[17,p.205],其中 "產生的策略不是最優的,所以研究的挑戰是表明我們可以獲得在不同情況下穩健的高質量決策策略"[18,p.3]--已經成為更常用的術語[3]。作者們最近也開始使用強化學習這個標簽,最近出版的《強化學習和最優控制》一書[19]和即將出版的《強化學習和隨機優化:隨機決策的統一框架》一書[20]就是證明。值得注意的是,ADP生成的決策策略已經成功部署到工業領域,包括卡車行業的司機調度策略[21],[22],[23], 機車規劃和管理[24],[25], 以及制造業內高價值備件的管理[26]。
圖1. 1995年至2021年4月9日期間每年發表的ADP相關文章的數量。
在這篇文章中,我們首次回顧了ADP在國防背景下的應用。特別是,我們專注于軍事運籌學領域的同行評議文獻;也就是 "應用定量分析技術為軍事[或民事]決策提供信息"[27]。本文的主要貢獻有兩個方面。首先,我們回顧了18個決策支持應用,這些應用跨越了部隊發展、生成和使用的范圍,使用了基于ADP的策略,并為每個應用強調了其ADP算法是如何設計、評估和取得的結果。其次,基于所發現的趨勢和差距,我們討論了與將ADP應用于國防決策支持問題有關的五個主題:所研究的問題類別;評估ADP生成策略的最佳做法;與目前實行的策略相比,設計策略是漸進式的,而不是完全徹底的;隨著情景的變化,策略的穩健性,如沖突中從高強度到低強度的轉變;我們還建議提出國防內部可能受益于ADP生成策略的其他順序決策問題。
本文的其余部分組織如下。第2節提供了相關的背景信息。第3節介紹了進行此次審查的方法。第4節和第5節是審查的主要內容。第4節回顧了18個已確定的ADP在國防領域的決策支持應用,第5節介紹了與在國防領域應用ADP相關的五個主題。最后,第6節給出了總結性意見。
在本節中,我們介紹了通過上述文獻搜索確定的18篇基于應用的文章的摘要。表2列出了每項研究,其應用領域,以及所實施的ADP策略和算法的特征。所列的特征主要集中在第2.3節中討論的那些特征,即:
決策策略的類型--短視CFA、PFA、VFA、DLA或混合。
價值函數近似策略--查詢表、參數化或非參數化。
價值函數模型--層次聚合、線性結構、NN等。
算法策略-狹義搜索、數學規劃、隨機規劃、AVI、API。
更新價值函數模型參數的方法--時差學習、LSTD、LSPE、SVR,等等;
步長--常數、廣義調和、多項式等。
對于所列出的一些文章,沒有提供足夠的信息來確定作者是如何處理某些特征的。在這種情況下,該特征被列為未說明。此外,有些文章中的某些特征并不適用。在這種情況下,該特征被列為不適用。下面給出了進一步的細節。研究報告分為三類--軍力發展、軍力組建、軍力使用,然后按時間順序排列。
表2. 1995-2021年期間ADP在軍事作戰研究中的應用。文章按橫線分為三組:部隊發展(上組)、軍力組建(中組)和軍力使用(下組)。
同步使用針對所有社會職能中的特定漏洞而定制的多種權力工具,以實現協同效應。混合作戰入侵者將尋求利用目標國家的弱點。每一個混合戰爭入侵者可能有獨特的能力,可用于打擊目標國家。戰爭的“奇襲”原則可能是混合攻擊成功的最大因素。