長期以來,兵棋推演一直被吹捧為想象和準備未來競爭和沖突輪廓的關鍵途徑,但兵棋推演界在如何最好地納入技術方面存在分歧。兵棋推演界的技術懷疑論者指稱,許多兵棋推演的技術不靈活,使用起來有難度,而且往往不能實現兵棋推演所陳述的體驗或分析的最終目標。另一方面,技術愛好者指出,兵棋推演中缺乏科學的嚴謹性和復雜性,是技術被納入的原因。在這兩個根深蒂固的立場之間--懷疑論者和熱衷者--技術在兵棋推演中的作用正在被裁定,這對兵棋推演界和國家安全具有廣泛的基礎影響。
雖然許多人試圖通過研究游戲組件(如場景)或兵棋推演應用(如行動過程分析)來確定兵棋推演和技術工具的理想融合,但本文采取了一個略微不同的方法。相反,它采用了用戶體驗研究方法,通過關注專業的戰爭游戲玩家和他們的經驗來確定前進的道路。本文通過對專業戰爭游戲社區的十幾次用戶訪談、八個焦點小組和一項技術調查(該調查在《戰火》--專業兵棋推演玩家中最受歡迎的國家安全媒體--中引起了500多名自認為是兵棋推演專業人士的回應),概述了技術最適合加強兵棋推演的領域。它評估了四個已確定的兵棋推演痛點--判斷、可用性、游戲的沉浸感和分析,并就技術如何能夠最好地緩解這些挑戰提供了建議。
“聯合規劃過程”是一份描述巴西武裝部隊使用準則的文件。軍隊也可以將這些準則用于教育目的,在和平時期培訓參謀人員。巴西國防部打算模擬軍事力量的運用,以加快決策周期,增加行動成功的機會。更好地規劃行動,更好地評估風險。作戰方案(COA)兵棋推演模擬了每個友軍的作戰方案與可能的敵軍作戰方案。然而,理論過程缺乏描述如何進行作戰方案推演的信息。因此,理論上的知識僅限于系統化的分析。COA兵棋推演一直是主觀的,并且依賴于隱性知識。這項工作的目的是提出一種實施COA兵棋推演的方法,以及構建COA兵棋推演的概念模型,以便能夠進一步使用計算機系統來支持其進行。兵棋推演的概念啟發了這個游戲的設計。兵棋推演被定義為合成環境中沖突的建模或模擬,涉及敵對勢力,玩家根據規則、程序和信息做出決策。將COA兵棋推演改進為一個教育性兵棋推演工具,可以模擬軍事計劃,支持玩家建立有效的戰略,支持教官分析玩家的決定和裁判交戰,并建立一個技術框架來收集決策數據,以便將來應用于知識管理和人工智能。
設計科學(DS)的認識論范式是這項研究的基礎。DS專注于建立知識的過程,并產生與全球實踐和研究社區相關的結果(Johannesson & Perjons, 2014)。DS包括對設計一個新的人工或改進現有人工制品以解決一個問題或一類問題的項目的研究(Dresch等人,2015)。
設計科學研究(DSR)是我們用來計劃、執行和監督研究的策略。DS建議當目標是開發一個人工制品時,采用DSR來操作研究。基于問題的描述,DSR指導研究設計和評估工件,對一個給定的系統進行改變,并改造情況以實現改進(Dresch等人,2015)。DRS的步驟包括確定問題、定義需求和設計、開發、演示和評估人工制品。
數據收集為人工制品的設計提供了要求。由于單一方法不足以回答研究問題,我們采用了混合方法。文件(Johannesson & Perjons, 2014)是我們的第一個數據來源。我們搜索了其他國家和軍事組織的軍事理論中包含的明確知識。我們在這項工作中研究和引用的所有文件都是不保密的。我們使用的其他方法是觀察和訪談(Johannesson & Perjons, 2014)。我們還搜索了巴西軍官的隱性知識,以了解他們如何進行COA兵棋推演,特別是在教育活動中。
接下來,我們收集并分析了數據,以設計人工制品。我們應用基礎理論(Pandit, 1996)作為定性數據分析的方法。我們設計了一個進行COA兵棋推演的方法和一個概念模型,它描述了COA兵棋推演的結構。數據分析使我們能夠確定關于COA兵棋推演的概念、類別和主張(Pandit, 1996)。建議的人工制品提出了關于跨類別命題的假說。經過幾個周期的數據收集和分析,我們達到了每個工件的目標。在每個周期中,藝術品中提出的假設都由軍事計劃和戰爭游戲的專家進行評估。
以下各小節描述了我們在這項工作中所進行的活動,其中包括審查軍事文件,直接觀察總參謀部軍事學校的兩次訓練演習中的COA戰爭演習,以及采訪參加這些演習的軍官。
圖5:作戰方案兵棋推演概念框架
關于兵棋推演定義的激烈爭論一直持續到今天。 彼得-佩拉(Peter P. Perla)是專業兵棋推演的巨頭之一,也是開創性的《兵棋推演的藝術》的作者,他將兵棋推演描述為由四個主要元素組成:一個合成環境,包含一個抽象的沖突,使用人類決策,以及展示這些人類決策的后果。 2016年,佩拉進一步將兵棋推演定義為 "在一個合成環境中對沖突或競爭的動態表現,人們在其中做出決定并對這些決定的后果做出反應"。 誠然,兵棋推演存在各種定義,但就本編輯卷而言,佩拉的定義是其基礎試金石。
以游戲的形式抽象人類沖突是很古老的,其根源可以追溯到古代的游戲,如圍棋或威海,一種在19×19英寸棋盤上進行的抽象戰略游戲,或印度次大陸的現代國際象棋的前身Chaturanga。然而,從武器職業的角度來看,喬治-利奧波德-馮-賴斯維茨在19世紀初開發的Kriegsspiel以及他的兒子喬治-海因里希-魯道夫-約翰-馮-賴斯維茨的繼續開發,才是開創性的起源點。萊斯維茨的Kriegsspiel是專業兵棋推演的一個里程碑式的時刻,因為它脫離了象棋等傳統系統,并在普魯士軍隊中被廣泛引入和采用。隨著時間的推移,作為娛樂、教育和分析的工具,兵棋推演的使用一直很豐富。威爾斯(H. G. Wells)和弗萊徹-普拉特(Fletcher Pratt)都是著名的小說家,他們設計了自己的兵棋推演來探索戰爭及其在20世紀的輪廓。第二次世界大戰的特點是主要使用兵棋推演,從英國皇家海軍西部近海戰術部隊(WATU)對抗德國潛艇攻擊的兵棋推演,到中途島戰役前臭名昭著的日本兵棋推演。從那時起,兵棋激增,并發展成為強大的商業游戲產業和一個充滿活力的專注于分析和教育的專業兵棋推演領域。
但這引出了一個問題。一個人如何成為一個兵棋推演者,無論是作為玩家、贊助商、分析家還是設計師?
當大多數職業兵棋手被問及他們是如何進入設計或使用兵棋研究沖突的領域時,大多數人(如果不是全部的話)都會羞澀地提供某種形式的 "我偶然進入的"。本文作者認為自己也是偶然闖入兵棋推演領域的一員。不幸的是,由偶然事件產生的戰棋手的普遍性并不罕見,而是由于沒有正式的系統來培養他們。缺乏一個既定的兵棋推演人才管道--無論是作為參與者、贊助者、分析者還是設計者--有可能使兵棋推演領域越來越小,越來越孤立。在軍隊中,軍官的兵棋推演經驗主要局限于駐地專業軍事教育(PME)和作為分析周期的一部分直接參與兵棋推演的選定任務。對于士兵來說,兵棋是一種罕見的商品,主要限制在個人使用商業兵棋和戰術決策游戲(TDG)進行基于單位的訓練。 目前的兵棋推演事業充其量是零散的、不連貫的。
對于有抱負的設計師來說,只有少數幾個機構為國防專業人員提供兵棋設計課程。在軍隊中,這包括位于俄亥俄州萊特-帕特森空軍基地的空軍技術學院(AFIT);位于堪薩斯州萊文沃思的美國陸軍指揮和總參謀部學院(CGSC);位于弗吉尼亞州匡提科的海軍陸戰隊大學(MCU);位于華盛頓特區萊斯利堡的國防大學(NDU)。麥克奈爾堡的國防大學(NDU);羅德島紐波特的美國海軍戰爭學院(NWC);以及加利福尼亞蒙特雷的海軍研究生院(NPS)。在民用方面,少數大學在專注于安全研究的課程中提供兵棋推演課程,如喬治敦大學、麻省理工學院、約翰霍普金斯大學、麥吉爾大學和倫敦國王學院。然而,這些課程大多是針對有抱負的設計師的入門課程。在學生接受了對兵棋推演的初步引導后,繼續學習和發展的途徑很少。這一點在Caitlyn Leong的文章《如何培養一個戰棋手》中得到了最好的反映,她強調了年輕設計師面臨的各種挑戰。她敏銳地寫道:"除了偶爾的個人導師之外,學生經營的兵棋推演組織和專業兵棋推演社區之間的聯系并不頻繁,甚至不存在。"
教育和培養兵棋推演專家的磨難是一個經常出現的話題,也是社區持續不斷的抱怨。2018年,作者寫道,美國防事業需要在整個隊伍中培養兵棋推演,利用無數的兵棋推演和工具。這包括使用像Steam這樣的數字平臺和設計定制的教育兵棋推演,以促進對兵棋推演這一工具的熟悉和欣賞。Rand公司的Elizabeth Bartels為兵棋推演教育提供了一個雙軌解決方案,為那些尋求成為專家或設計師的人,或那些尋求學習如何利用兵棋推演的人,如贊助商、項目經理和分析師,定制兵棋推演體驗。相反,Jeff Appleget、Jeff Kline和Robert Burks認為,美國國防部(DOD)應該致力于發展和振興其軍警隊伍中的兵棋推演專業知識。鑒于外部組織在兵棋推演中的主導地位,如聯邦資助的研發中心(FFRDCs)和國防承包商,他們認為這種依賴外包了 "國家國防戰略、軍官職業發展和部門采購過程的智力基礎"。同樣,2019年連接兵棋推演會議,一個兵棋推演的年度專業會議,有一個專注于下一代兵棋推演者的研討會,包括平民和軍警人員。不出所料,關于什么是最好的發展步驟的討論引起了激烈的爭論。由于解決方案的難以捉摸,如何培養下一代戰爭玩家的問題仍然是連接會議的一個長期辯論話題。
培養兵棋推演專家的問題不是一個無意義的學術探索,而是一個具有潛在可怕后果的緊迫任務。兵棋推演界正在迅速接近一個拐點,該領域的巨頭們正在穩步退休,而隨后的一代正在努力填補這個空白。同時,即使在美國防部,兵棋推演仍然受到誤解、偏見以及對兵棋推演的效用和局限性缺乏理解的阻礙。在 "正確看待兵棋推演"一文中,杰出的戰爭專家和前CNA兵棋推演總監Ed McGrady說:"人們普遍誤解了兵棋推演的含義,不愿意接受兵棋推演的力量和限制。這導致了對兵棋推演的誤用和濫用,從源于無知的錯誤描述到對兵棋推演的惡意誤用。
因此,本卷作者強調的問題和建議對于兵棋推演領域的持續發展是及時的。作者們探討了一系列廣泛的問題,廣泛地定義在三個主要的主題中:培養兵棋推演者,將兵棋推演應用于教育,以及教育外部利益相關者了解兵棋推演的價值。Natalia Wojtowicz、Kyleanne Hunter、Timothy Smith和Paul Kearney少校討論了培養戰爭玩家和兵棋推演素養的各個方面。同時,Scott Jenkinson中校、Jo Brick大隊長、Ian Brown少校和Benjamin Herbold上尉探討了如何將兵棋推演應用于PME。最后,Jeff Appleget、Robert Burke、Brandon Valeriano、Ben Jensen和Brooke Taylor探討了如何更好地通知和吸引外部利益相關者參與兵棋推演,從國會到社會科學家。
這本書還是以美國防部為中心,以英美為中心,以男性為主,這說明在更廣泛的兵棋推演領域里,多樣性很差。雖然該領域的人口結構正在發生變化,但變化的幅度和速度都很慢,仍有大量的工作要做。因此,除了對兵棋推演文獻進行補充外,這本書還試圖推動對兵棋推演領域的未來進行更廣泛的討論。
未來技術的軍事效用評估(MUAFT)方法是作為北約的破壞性技術評估游戲方法的一個具有成本效益的替代方法而開發的,將作為瑞典武裝部隊長期能力發展進程的一部分。本研究涉及的問題是,MUAFT是否可以被認為在其背景下具有有效性,因此它是否有可能對其他中小國家有用。該分析基于克拉克科技情報分析框架的實操化,并結合以軍事能力為中心的軍事效用觀點。從2012年到2018年的MUAFT報告在如何滿足五個關鍵標準方面被審查。該研究表明,如果由適當的專家小組使用,MUAFT提供了實用性,他們意識到了該方法的局限性。這些局限性主要來自于缺乏對評估除技術力量以外的變革力量對軍事能力發展影響的明確支持。專家組作為技術預測和軍事效用評估之間的綜合橋梁。因此,需要在各種軍事技術專業、發起人的軍事能力以及為評估其他有影響力的社會變革力量而必須掌握的科目方面有全面的專業知識。
"技術突襲是指在戰爭中通過引進新武器(或通過創新使用已知武器)來獲得單方面的優勢,而對手要么沒有意識到它的存在,要么沒有準備好有效的反制措施,而反制措施的開發需要時間。" [1]因此,大多數國家考慮探索可能對軍事戰略能力決策至關重要的科學技術的長期發展。在過去,新技術的使用以及成熟技術的新應用都影響了沖突和戰爭的進行方式,而且它們很可能會繼續影響。技術發展對戰爭的影響往往是漸進式的,但有時,正如漢德爾最初的那句話所暗示的,它們是令人驚訝的,甚至是革命性的[2]。這種影響被稱為破壞性的[3],因為它們使一些能力過時,同時也產生了對新能力的需求。火藥、鐵路、雷達技術、信息技術、全球導航衛星系統只是軍事史上許多可能的例子中的幾個[4]。這些例子告訴我們,一個真正了解技術中的潛力的軍事行為者可以獲得優勢,或者通過利用技術,或者通過避免在戰場上的意外。此外,根據經驗,我們知道,將新技術整合到武器系統中,引入軍事單位,并調整理論,往往需要幾十年時間。因此,軍事決策者確實需要有能力、準確的技術預測。
預測的特點是 "對高度可能發生的事件進行或多或少的線性系統估計、陳述、推斷、預測或預報" [5]。因此,預測是一個適用于研究領域和選擇部門的概念,如技術和國防與安全部門。雖然,即使在其起步階段,技術預測被預測為會像經濟和天氣預測一樣被接受和有用[6],但預測方法可以因其不可避免的不準確性而受到批評。例如,未能預測1973年的 "石油沖擊 "導致人們對預測的有效性和實用性產生了相當大的懷疑[7]。今天,一些軍事思想家甚至聲稱,認為在部隊規劃中使用科學或軍事情報可以避免戰場上的技術突襲是徒勞的。相反,芬克爾建議,補救措施是設計一支足夠靈活的部隊,以便在不可避免的技術發生時迅速恢復[8]。他聲稱一些必要的靈活性需要軍事物資的多樣性和冗余性,但他強調了組織要求,首先是軍官的教育和培訓。然而,由于它們的目的是幫助決策者評估不同技術發展的概率和意義,而不是預測它們在未來特定日期的具體應用中的確切形式[6],對可行方法的研究仍在進行。
在文獻中,發展是以眾多的外延報道的,如:未來研究、預測、展望、地平線掃描、未來研究、技術預測、數據挖掘、文本挖掘、未來學、技術觀察、面向未來的分析、新興技術、破壞性技術、戰略展望、道路圖、場景規劃、結構化頭腦風暴、形態分析和軍事破壞性技術[[9], [10], [11], [12], [13]] 。本刊以前發表的工作討論了技術預測和技術評估[[14]、[15]、[16]、[17]、[18]、[19]]。我們選擇使用技術預測這一術語來描述圖1中的活動序列。該序列改編自Kindvall等人[9]。
瑞典技術預測過程中的活動順序通常包括活動一到八。所有的活動都可以,但不能由一個組織中的一個小組來完成。在活動四中,贊助者,如瑞典武裝部隊(SwAF)通過瑞典國防物資管理局(FMV),選擇優先考慮的技術和訂購科學報告。為選定的技術準備科學報告對應于活動五和六。然后在下一步中,它們被用作MUAFT的輸入。MUAFT方法將在第三節進一步描述。MUAFT評估的結果以及對每項技術的未來行動建議將在每年的技術預測報告中提交給發起人。這些建議是關于投資、監測或不考慮具體技術的。資助者負責第八項活動。
在20世紀80年代,由瑞典武裝部隊(SwAF)協調的技術預測,每四年左右為相關的技術領域提供趨勢報告。這項工作是與瑞典國防物資管理局(FMV)和瑞典國防研究局(FOI)密切合作完成的。然而,由于所產生的報告內容廣泛,而且是保密的,很少被用于SwAF的研究或其他發展目的,所以最后一份這種格式的報告是在2005年發布。巧合的是,在20世紀90年代末,蘇聯解體后,歐洲的軍事發展呈現出緩和的特點。從20世紀90年代末到21世紀的第一個十年,瑞士空軍的長期規劃受到了主導戰場意識(DBA)、軍事事務革命(RMA)和網絡中心戰(NCW)等概念的嚴重影響。人們相當關注傳感器和指揮與控制系統發展的技術方面[9]。然后,在9/11襲擊事件之后,為了配合瑞士空軍在阿富汗參與打擊塔利班的戰爭,重點發生了變化。人們對支持海外任務的技術更感興趣,例如,對士兵設備的保護和供電[20]。在這個時候,瑞士空軍不想重新采用以前那種無效的、耗費資源的技術預測方法。因此,開發了一種新的未來技術趨勢分析方法。作為一個小國,用于技術預測的經濟資源有限,瑞典需要一個簡單的、具有成本效益的、能夠支持軍事能力發展的綜合方法的過程[20]。一些中等規模的國家使用復雜、昂貴和耗時的技術預測方法,并已開始改變它們[21,22]。瑞典軍事技術預測的主要目的是為瑞典空軍提供國防研發撥款的政策建議。由于預算削減,技術預測所能涵蓋的技術數量不得不減少。因此,必須對要評估的技術進行嚴格的優先排序(圖1中活動四)。2005年至2015年期間,瑞典國防物資管理局(FMV)的一個小組決定了優先事項,并選擇了未來技術的科學報告,用MUAFT方法進行分析。自2016年以來,瑞典空軍總部參與了選擇過程,在委托弗勞恩霍夫研究所、麻省理工學院或瑞典國防研究局等研究機構提供科學報告之前,批準了技術清單。
此外,瑞典空軍希望增加對未來技術的了解,特別是在武裝部隊人員中。因此,在2009年開發了一種針對普通公眾的新報告格式。新的出版物使用了圖形和對未來技術應用的通俗科學解釋,否則決策者可能難以掌握,它在瑞典國防界的受歡迎程度也隨之提高[20]。
直到2011年,政策建議(活動八)直接基于瑞典國防研究局、FOI或合作伙伴研究機構發布的技術評估報告。2012年,瑞典國防大學(SEDU)被要求評估選定的未來技術的潛在軍事用途;因此,圖1中的活動七被添加到該序列中。評估的重點是這些技術是否有可能被瑞典空軍或可能的對手成功地整合到軍事系統中,以提高軍事能力。該方法的基本原理是避免走上漫長的、不確定的、往往是昂貴的開發新軍事物資的道路。相反,應該探索某些選定技術對軍事能力的潛在貢獻。在新的瑞典技術預測過程中,應該放棄以前純粹基于潛在技術性能的建議[2,23,24]。從一開始,SEDU的評估也包括關于SwAF研究、研發投資或監測技術發展的建議的政策建議,即對圖1中活動八的投入。本文所評估的方法已經逐步發展,現在被稱為未來技術的軍事效用評估(MUAFT)[24]。
有理由相信,瑞典具有成本效益的MUAFT方法可能對其他中小國家有意義。然而,它能提供效用嗎?雖然傳統的技術預測活動在其他地方已經被徹底討論過,但MUAFT還沒有。該方法已經使用了十年之久,現在需要仔細研究。本研究的目的是分析和評估MUAFT方法作為瑞典武裝部隊長期能力發展進程的一部分的效用。
在第二節中,我們介紹了理論,即我們對中心概念的看法和我們的理論框架,該框架來源于美國情報分析家羅伯特-M-克拉克的經驗[25,26]。在第三部分,我們簡要介紹MUAFT方法。此后的結構是傳統的。我們在第四節描述了評估的方法。第五節介紹了分析,隨后在第六節討論了結果的效用和MUAFT方法。本文最后在第七節中提出結論和對未來研究的建議。
美第38任司令官在他的《司令官規劃指南》中,責成美海軍陸戰隊在教育和訓練中更多地采用兵棋推演。鑒于其他類型的決策游戲,如戰術決策游戲(TDG)和決策強制案例(DFC),往往不清楚為什么需要使用這種技術來練習決策。雖然這些其他決策教育工具在磨練估計、命令和相應理由的溝通方面有其優勢,但兵棋推演的主要優點在于玩家必須在不斷展開的情況下做出更多的決策。
關鍵詞:專業軍事教育,PME,嚴肅游戲,嚴肅戰爭游戲,教育游戲,軍事判斷,決策,機動戰爭
在本文中,我們討論了如何將人工智能(AI)用于政治-軍事建模、仿真和兵棋推演,針對與擁有大規模殺傷性武器和其他高端能力(包括太空、網絡空間和遠程精確武器)國家之間的沖突。人工智能應該幫助兵棋推演的參與者和仿真中的智能體,理解對手在不確定性和錯誤印象中行動的可能視角、感知和計算。人工智能應該認識到升級導致無贏家的災難的風險,也應該認識到產生有意義的贏家和輸家的結果可能性。我們將討論使用幾種類型的AI功能對建模、仿真和兵棋的設計和開發的影響。 我們在使用或沒有使用AI的情況下,根據理論和使用仿真、歷史和早期兵棋推演的探索工作,討論了基于兵棋推演的決策輔助。
在本文中,我們認為(1)建模、仿真和兵棋推演(MSG)是相關的調查方法,應該一起使用;(2)人工智能(AI)可以為每個方法做出貢獻;(3)兵棋推演中的AI應該由建模和仿真(M&S)提供信息,而M&S的AI應該由兵棋推演提供信息。我們概述了一種方法,為簡潔起見,重點是涉及擁有大規模毀滅性武器(WMD)和其他高端武器的國家的政治-軍事MSG。第2節提供了我們對MSG和分析如何相互聯系的看法。第3節通過討論20世紀80年代的系統來說明這一點是可行的。第4節指出今天的挑戰和機遇。第5節簡述了結構的各個方面。第6節強調了在開發人工智能模型和決策輔助工具方面的一些挑戰。第7節得出了結論。在本文中,我們用 "模型"來涵蓋從簡單的數學公式或邏輯表到復雜的計算模型的范圍;我們用"兵棋"來包括從小型的研討會練習(例如Day-After練習)到大型的多天、多團隊的兵棋推演。
MSG可以用于廣泛的功能,如表1所示。每種功能都可以由每個MSG元素來解決,盡管相對簡單的人類活動,如研討會兵棋和Day-After練習已被證明對后兩個主題具有獨特的價值。
通常形式的M&S和兵棋推演有不同的優勢和劣勢,如表2前三欄中的定型。M&S被認為是定量的、嚴格的和 "權威的",但由于未能反映人的因素而受到嚴重的限制。M&S的批評者走得更遠,認為M&S的 "嚴格 "轉化為產生的結果可能是精確的,但卻是錯誤的。在他們看來,兵棋推演糾正了M&S的缺點。M&S的倡導者則有不同的看法。
我們確實認識到并長期批評了正常建模的缺點。我們也從兵棋推演中受益匪淺,部分是通過與赫爾曼-卡恩(P.B.)、蘭德公司和安德魯-馬歇爾的長期合作,但兵棋推演的質量從浪費時間甚至起反作用到成為豐富的洞察力來源。雖然這種見解在沒有后續研究的情況下是不可信的,但來自建模的見解也是如此。
我們本文的一個論點是,這種刻板印象不一定是正確的,我們的愿望(不加掩飾的崇高)應該是表的最后一欄--"擁有一切",將建模、仿真和推演整合在一起。圖1顯示了一個相應的愿景。
這種理想化的活動隨著時間的推移,從研究、兵棋推演、軍事和外交經驗、人類歷史、人類學等方面開始(第1項),匯集關于某個領域(例如印度-太平洋地區的國際安全問題)的知識。這就是對棋盤、行動者、潛在戰略和規則書的定性。
兩項工作的進行是不同步的。如圖1的上半部分,兵棋推演在進行中,為某種目的而結構化。無論圖中的其他部分是否成功執行,這都可能獨立發生。同時,M&S以游戲結構化模擬的形式進行。隨著時間的推移,從M&S和兵棋推演中獲得的經驗被吸收,使用人工智能從M&S實驗中挖掘數據(第4項),以便為后續周期完善理論和數據(第5項)。在任何時候,根據問題定制的MSG都會解決現實世界的問題(第7項)。如同在淺灰色的氣泡中,人類團隊的決策輔助工具(項目6a)和智能體的啟發式規則(項目6b)被生成和更新。有些是直接構建的,但其他的是從分析實驗和兵棋推演中提煉出來的知識。有些智能體直接加入了人工智能,有些是間接的,有些則根本沒有。圖1鼓勵MSG活動之間的協調,盡管這種協調有時可能是非正式的,可能只是偶爾發生。
圖1的意圖可以在一個單一的組織中完成(例如,敏感的政府內工作)和/或在智囊團、實驗室、私營企業、學術界和政府中更開放的持續努力計劃中完成,就像圖2中的DARPA研究稱為社會行為建模實驗室(SBML)。在任何一種情況下,這種方法都會鼓勵多樣性、辯論和競爭。它也會鼓勵使用社區模塊來組成專門的MSG組件。這與專注于一個或幾個得天獨厚的單一模型形成鮮明對比。直截了當地說,這個愿景是革命性的。
圖1的愿景的一個靈感是20世紀80年代的蘭德公司戰略評估系統(RSAS)(附錄1指出了文件)。為了回應美國防部關于更好地利用兵棋推演進行戰略分析的要求,由卡爾-鮑爾領導的蘭德公司團隊提出了自動化兵棋推演,它將利用那個時代的人工智能、專家系統,但它將允許可互換的人工智能模型和人類團隊。這導致了一個多年的項目,我們中的一個人(P.K.D.)在1981年加入蘭德公司后領導這個項目。
該項目從深入設計開始,保留了可互換團隊和人工智能智能體的開創性想法,但也包括一個靈活的全球軍事模型;與人工智能有關的新概念,如替代的紅方和藍方智能體,每個都有彼此的模型;代表其他各方的綠方智能體,有簡單的參數化規則子模型;紅方和藍方智能體在做決定前做 "前瞻 "的能力;以及 "分析性戰爭計劃"--代表軍事指揮官的自適應插槽式腳本人工智能模型。該設計還預計:多情景分析,納入 "軟因素",如定性的戰斗力,以及人工智能模型的解釋能力。圖3勾勒出高級RSAS架構。整個80年代都在實施。蘭德公司將RSAS用于國防部的研究,例如,歐洲的常規平衡和常規軍備控制的建議,并將其出口到各政府機構和戰爭學院。聯合參謀部收到了RSAS,但事實證明連續性是不切實際的,因為一旦有適當才能的官員學會使用它,他們就會被提升到其他任務。
盡管RSAS在技術上取得了成功,但它在某些方面還是領先于時代。一方面,其創新的全球作戰模型被廣泛接受并用于分析和聯合兵棋推演。它成為聯合綜合作戰模型(JICM),在過去的30年中不斷發展,現在仍在使用。另一方面,RSAS的人工智能部分除了用于演示外,很少在蘭德公司之外使用。大多數指導RSAS工作的政府辦公室對政治層面的問題沒有興趣,如危機決策、戰爭路徑或升級。少數人有興趣,這導致了蘭德公司的研究,但在大多數情況下,他們的需求可以通過相對簡單的兵棋推演來解決,包括事后演習(Roger Molander,Peter Wilson)。此外,完整的RSAS是昂貴、復雜和苛刻的。更為普遍的是,隨著蘇聯的解體,美國防部對兵棋推演的興趣驟然下降。
幸運的是,事實證明有可能實現 "去粗取精":用人工智能智能體進行類似RSAS的模擬,可以通過非常簡單的模型和游戲獲得一些重要的見解,正如最近未發表的用對手的替代形象進行核戰爭的工作中所說明的。
RSAS在某種程度上納入了表2最后一欄的大部分想法,所以它顯示了可行性。也就是說,它可以作為某種存在的證明。然而,那是在冷戰時期,采用1980年代的技術。今天能做什么?
今天的國際安全挑戰遠遠超出了冷戰時期的范圍。它們呼喚著新的兵棋推演和新的M&S。新的挑戰包括以下內容。
現在的世界有多個決策中心,他們的行動是相互依賴的。從概念上講,這將我們置于n人博弈論的世界中。不幸的是,盡管諸如公地悲劇和食客困境等現象可以用n人博弈論的語言來描述,而且平均場理論有時也可以作為一種近似的方法來使用,但似乎n人博弈的復雜的解決方案概念還沒有被證明是非常有用的。由于種種原因,這種解決方案并沒有被廣泛采用。商學院的戰略課程很少使用這些技術,國防部的智囊團也很少將這些技術納入他們的M&S中。可能是現實世界的多極化太過復雜,難以建模,盡管在戰略穩定方面已經做出了一些努力。就像物理學中的三體問題一樣,n方系統的行為甚至可能是混亂的。我們還注意到,隨機混合策略在n人博弈中通常發揮的作用很小。同樣,在計算其他玩家的行動時,可能有很多內在的復雜性,以至于隨機化產生的一層額外的不確定性對我們理解未來的危機動態沒有什么貢獻。
與1980年代相比,有更多的國家擁有大規模殺傷性武器(即印度、巴基斯坦、朝鮮),甚至更多的國家擁有大規模破壞性武器。網絡作為一種戰略武器的加入,使問題進一步復雜化。在這里,人工智能可能有助于理解事件。作為一個例子,假設一支核力量受到攻擊,使其用于電子控制的電力系統癱瘓(由于分散和防御,這可能并不容易)。一支導彈部隊只能在短時間內依靠備用電力系統執行任務。大國肯定意識到自己和對手的這種脆弱性。在商業電力領域,人工智能對于在電力中斷后向需求節點快速重新分配電力資源變得非常重要,例如2021年發生在德克薩斯州的全州范圍內的冰凍溫度。
武器裝備的變化擴大了高端危機和沖突的維度,如遠程精確打擊和新形式的網絡戰、信息戰和太空戰。這意味著卡恩很久以前提出的44級升級階梯現在必須被更復雜的東西所取代,正如后面6.3節中所討論的。
一個推論被低估了,那就是現在的世界比以前更加成熟,可以進行有限的高端戰爭--盡管更熱衷于威懾理論的人有相反的斷言--其中可能存在有意義的贏家和輸家。在考慮俄羅斯入侵波羅的海國家、朝鮮入侵韓國等可能性時,這一點變得很明顯。出現的一些問題包括俄羅斯對 "升級-降級 "戰略(北約冷戰戰略的俄羅斯版本)的依賴,以及網絡戰爭和攻擊空間系統的前景。因此,觀察到更多國家部署跨洋范圍的精確打擊武器也是麻煩的。即使是曠日持久的“有限”戰略戰爭現在也可能發生,盡管如第6.3節所討論的那樣,升級很容易發生。
今天的美國安全伙伴有著不同的重要利益和看法。北約在整個冷戰期間表現出的非凡的團結,在現代危機或沖突中可能無法重現。在亞太地區,朝鮮和韓國、中國、日本、臺灣、印度和巴基斯坦之間的矛盾關系是危機中困難的預兆。所有這些國家都有通過使用太空、網絡空間或區域范圍內的精確武器進行升級的選擇。
這里的總體問題是,聯盟仍然非常重要,但今天的聯盟可能與冷戰時期緊繃的街區不同。我們可能正在進入一個類似于20世紀初的多極化階段。第一次世界大戰爆發的一個因素是,柏林認為倫敦不會與法國一起發動戰爭,在歐洲阻擊德國。這導致人們相信,戰爭將類似于1871年的普法戰爭--有限、短暫,而且沒有特別的破壞性。甚至法國在1914年8月之前也不確定英國是否會加入戰爭。這種對自己的盟友會做什么的計算,對穩定至關重要。這里的不確定性確實是一個具有巨大意義的戰略問題。
在考慮現代分析性兵棋推演的前景時,新的技術機會比比皆是。下面的章節列出了一些。
基于智能體的建模(ABM)已經取得了很大的進展,對生成性建模尤其重要,它提供了對現象如何展開的因果關系的理解。這種生成性建模是現代科學的革命性發展。與早期專家系統的智能體不同,今天的智能體在本質上通常是追求目標或提高地位的,這可能使它們更具有適應性。
當然,更普遍的人工智能研究比ABM要廣泛得多。它提供了無限的可能性,正如現代文本中所描述的那樣。我們在本文中沒有多加討論,但是在考慮M&S的未來,以及兵棋推演的決策輔助工具時,最好能有長篇大論的章節來論述有時被確認的每一種人工智能類型,即反應式機器、有限記憶的機器、有限自動機、有自己的思維理論的機器,以及有自我意識的機器。這在這里是不可能的,這一限制也許會被后來的作者所彌補。
聯網現在是現代生活的一個核心特征,人與人之間、組織與組織之間都有全球聯系。數據是無處不在的。這方面的一個方面是分布式兵棋推演和練習。另一個方面是在線游戲,甚至到了大規模并行娛樂游戲的程度,對這些游戲的研究可能產生國家安全方面的見解。這類游戲并不"嚴肅",但在其中觀察到的行為可能暗示了在更多的學術研究中無法認識到的可能性和傾向性。
現在,建立獨立有用的模型(即模塊)并根據手頭問題的需要組成更復雜的結構是有意義的。這種組合與國防部歷史上對標準化的大型綜合單體模型的偏愛形成鮮明對比。在不確定因素和分歧普遍存在的情況下,這種標準化的吸引力要小得多,比如在更高層次的M&S或兵棋推演中。模塊化設計允許帶著對被建模的東西的不同概念。這可以打開思路,這對預見性是很有用的,就像避免驚訝或準備適應一樣。也有可能將替代模型與數據進行常規比較,部分用于圖2中建議的常規更新。另外,模塊化開發有利于為一個特定的問題插入專業性,這是2000年中期國防部研討會上建模人員和分析人員社區推薦的方法。
今天,AI一詞通常被用來指機器學習(ML),這只是AI的一個版本。ML已經有了很大的進步,ML模型通常可以準確地擬合過去的數據,并找到其他未被認識到的關系。一篇評論描述了進展,但也指出了局限性--提出了有理論依據的ML版本,在面向未來的工作中會更加有效,并強調了所謂的對抗性人工智能,包括擊敗對手的深度學習算法的戰術。
規劃的概念和技術取得了根本性的進展,在深度不確定性下的決策(DMDU)的標題下討論。這從 "優化 "最佳估計假設的努力,轉向預期在廣泛的可能未來,也就是在許多不確定的假設中表現良好的戰略。在過去,解決不確定性問題往往是癱瘓的,而今天則不需要這樣。這些見解和方法在國防規劃和社會政策分析中有著悠久的歷史,應該被納入人工智能和決策輔助工具中。
設計"永遠在線"的系統,并不斷提高智能。從技術上講,大多數國防部的MSG都是人工智能界所謂的"轉型"。該模型或游戲有一個起點;它運行后會報告贏家和輸家。可以進行多次運行,并將結果匯總,以捕捉復雜動態中固有的差異。較新的人工智能模型的設計是不同的,它所模擬的系統是 "永遠在線的"。這被稱為反應式編程,與轉化式編程不同。這些系統永遠不會停止,并且不只是將輸入數據轉化為輸出數據。例子包括電梯系統和計算機操作系統。國防方面的例子包括網絡預警系統,導彈預警系統,或作戰中心。這些都不會"關閉"。防御系統正變得更加反應靈敏,所以必須用模型來表示它們。這一點在1980年代RSAS的更高級別的紅方和藍方智能體的設計中已經預見到了,它們會在事件發生后'醒來',并對局勢和選項進行新的評估,而不是繼續按照腳本行事。
在轉換型模型中,環境中的事件可能會觸發程序按順序采取某種行動。反應式模型則不同。程序在環境中同時做出改變。他們一起改變,或幾乎一起改變。國防工作的一個有趣的例子涉及自主武器。人類和機器決策之間的界限已經模糊了,因為在一個反應式系統中人和機器之間的互動可能是連續和交織的。反應式系統是美國、中國和俄羅斯國防投資的一個主旨。無人機群和網絡預警系統將如何在M&S和兵棋推演中得到體現?除非表述恰當,否則相關人工智能模型在模擬中的價值可能會適得其反。
然而,這僅僅是個開始。隨著機器擁有更好的記憶和利用它們所學到的東西,以及它們納入世界理論,包括對手的思想理論,人工智能將如何變化?一個令人擔憂的問題是,正如Yuna Wong及其同事所討論的那樣,對人工智能的更多使用將增加快速升級的前景。這方面的風險對于專注于最大化某些相對量化措施,而不是更多的絕對結果及其定性評價的人工智能來說尤其高。以冷戰時期的經驗為例,執著于誰會在全球核戰爭中以較高的核武器交換后比率 "贏得"的分析是危險的。幸運的是,決策者們明白,結果將是災難性的,沒有真正的勝利者。即使是1983年電影《兵棋》中的計算機約書亞也明智地得出結論:"核戰爭。一個奇怪的游戲。唯一的勝利之舉就是不玩。來一盤漂亮的國際象棋如何?無論約書亞體現的是什么人工智能,它都不只是關于如何通過數字贏得一場娛樂游戲的ML。
為現代分析性兵棋推演開發一個完整的架構超出了本文的范圍,但建議一些方向是可能的。圖4勾勒了一個頂層架構,表3則更詳細地提出了各種特征。圖4認識到,在考慮許多可能的危機和沖突時,需要深入關注至少三個主要的行為者,以解決當前時代的危機和沖突。一個例子可能是朝鮮、韓國、美國和中國。圖4還要求對軍事模擬采取模塊化方法。
如表3所示,1980年代RSAS的一些特征可能會延續到現代化的版本。然而,許多其他特征應該有很大不同。我們認為表3是討論的開端,而不是終點。
由于在我們的討論中,為大規模的場景生成、探索性分析和不確定性下的決策做準備是很突出的,因此需要強調兩個重要問題:
只有當模擬在結構上是有效的(即只有當模型本身是有效的),不同參數值的探索性分析才是有用的。
從探索性分析中得出的結論可能會有問題,當所研究的案例(情景)的可能性不一樣,它們的概率是相關的,但沒有很好的基礎來分配概率分布。
1、模型驗證
正如其他地方所討論的,模型的有效性和數據的有效性應該分別對描述、解釋、后預測、探索和預測進行定性。另外,必須根據特定的問題和背景來判斷它們。參數化方法有很長的路要走,但模型的不確定性常常被忽視,需要更多的關注,正如最近的一篇文章中所討論的那樣。攜帶目標和價值非常不同的對手模型只是這樣做的一個例子。
關于在不知道案件的相對概率的情況下如何使用探索性分析這個令人困擾的問題,我們建議探索性分析至少在表4中說明的目的上很可能有價值,這些目的都不需要概率。對于每一個例子,探索的目的是找到可能性(如脆弱性或機會),促使采取措施來防止它們,預測它們,或準備相關的適應措施。如果存在一個關鍵的漏洞,就應該修復它,無論它被利用的概率 "看起來 "是低還是高(如果它的概率被知道是很小的,那將是另外一回事)。
本節討論了在思考建模和兵棋推演的人工智能和決策輔助工具時出現的一些問題。首先討論了決策輔助功能。接下來討論了在設想使用人工智能的ML版本來利用大規模場景生成時的一個挑戰。最后一節討論了開發 "認知人工智能 "和相關決策輔助工具所涉及的基本挑戰之一。
如果我們根據我們所看到的對玩家的重要性,而不是對人工智能提供者的興奮點來詢問決策輔助工具的主要功能,那么一些關鍵的功能就會如表5所示。
從科幻小說中,我們可能期望現代游戲的決策輔助工具是高度計算機化的,并由人工智能以相對個性化的形式提供信息,就像艾薩克-阿西莫夫的機器人或電影《2001》中不那么邪惡的計算機哈爾9000。然而,作者迄今為止的經驗是,在游戲中 "幫助 "人類的努力往往被證明是適得其反的,阻礙了本質上人類的自由討論。事實上,這些努力有時會因為分散注意力而使玩家生氣。考慮到這一點,我們分別討論了實用的短期決策輔助工具和更具推測性的長期目標。
表6提供了我們對第一欄所示的簡單決策輔助工具的價值的主觀估計,從低到高。這些都不涉及人工智能。相反,最有價值的輔助工具是具有簡潔的檢查表、信息表或圖表的簡單視圖。評估區分了不同類型的游戲或演習,也區分了玩家之前是否接受過決策輔助工具訓練的游戲。這些評價是在蘭德公司與韓國國防分析研究所合作進行的一些兵棋推演實驗后制定的。
關于簡單決策輔助工具的另一個數據點是蘭德公司同事開發的(但尚未出版)的 "奇怪的游戲"。這是一個關于核使用的高效兵棋推演,玩家代表一個戰區指揮官,通過選擇適當的卡片來進行游戲。該游戲建立了決策輔助工具,包括目標類別和評估選擇何種目標的簡單線性算術。
作為近期決策輔助工具的最后一個例子,最近的一個原型研究采用了一種低技術的方法來進行人類演習,考慮如何在危機和沖突中影響對手。該方法涉及一種定性的方法,即不確定性敏感認知模型(UCM),如圖5所概述。這些機制都是定性的,通過真實或虛擬的白板和互動軟件進行展示和討論。它們包括因素樹、表示有限理性的Red替代模型、影響圖以及戰略明顯優缺點的表格比較。沒有一個涉及人工智能。很明顯,人工智能甚至不會有幫助。也許這是一個重要的洞察力,也許這反映了想象力的不足。現在讓我們來看看長期的情況。
從長遠來看,可能會有更多的東西,我們應該從科幻小說、電子娛樂游戲、甚至主要電視網絡對新出現的選舉結果的實時討論中尋找靈感。僅僅舉例說明在不遠的將來可能出現的功能,在每一個功能中,人工智能系統都會對查詢作出反應。
一個團隊口頭命令對 "成功之路 "進行探索性分析,包括是否有某一盟友的堅定合作。
一個小組詢問,鑒于最近發生的事件,對手的哪些替代模型仍然是可信的。人工智能報告反映了依賴于主觀可能性函數的貝葉斯式分析,這些函數已被更新以反映最近的歷史。
一個考慮有限升級的團隊詢問了潛在的反應。人工智能幫助器顯示了在以前的兵棋推演中觀察到的反應,玩家被認為很好地代表了實際的決策人。它還確定了在模擬中反應不好的條件(在下一節中討論),從而強調了條件的哪些方面需要特別注意以避免災難。
這些猜測是最低限度的,只是為了激發人們對人工智能如何在決策輔助方面發揮作用的更多創造性思維。這個領域是開放的,從某些類型的人工智能的名稱中可以看出,從反應型機器到具有有限記憶、內置心智理論和自我意識的機器,這個領域是開放的,甚至更加明顯。一些主要人物,如珀爾和麥肯錫,自信地預計后者將包括意識本身。然而,那是未來的事了。佩爾將目前的機器人描述為 "像鼻涕蟲一樣有意識"。也就是說,蜂群武器很快就會像鳥群、魚群和昆蟲一樣有 "意識"。
讓我們接下來談談涉及人工智能與M&S的一些棘手問題。它們涉及到哪些人工智能決策輔助工具是可行的。
如前所述,機器學習類人工智能(AI/ML)有可能通過挖掘大規模場景生成的結果來尋找洞察力。然而,成功取決于(1)模擬的質量和(2)用于搜索結果的方法。
大量場景生成的成果可能是有用的,也可能是反作用的,這取決于基礎模型是否足夠豐富,結構上是否符合探索的目的。在研究可能的高端危機時,如果基礎模型假設了完美的理性、認知、聯盟關系,并專注于例如核武器的交換后比率作為結果的衡量標準,那么一百萬種情景的數據庫有什么用呢?對于軍事技術目的,如部隊規劃,可能有價值,但對于威懾或預測實際沖突中的問題,甚至是嚴肅的精英兵棋推演,可能沒有價值。
模型建立者所面臨的挑戰的某些方面是眾所周知的,如認識到對決策者(性格、人格、健康)的替代概念的需要,認識到錯誤認知的可能性,以及允許卡尼曼和特沃斯基的前景理論和其他心理現象所描述的那種非理性決策。應對這些挑戰,至少可以說是困難重重,但至少挑戰是被認可的。
相比之下,軍事模擬和社會行為模擬的一個骯臟的小秘密是,工作場所的模型通常不會產生黑天鵝事件、不連續現象或各種突發現象,而這些現象是研究復雜適應性系統的核心要素,在現實世界和一些大型游戲中都會出現,比如20世紀50年代的 "精英 "高級冷戰兵棋推演。原因有很多,但通常是由于模型是 "腳本化的",而不是基于智能體的,或者--即使它們確實有智能體--沒有給智能體足夠的多樣性、自由度和激勵來產生現實的適應性行為,以及不允許有長尾分布的隨機性。在這些問題上做得更好,對社會行為模擬來說是一個巨大的挑戰,特別是對那些打算與現實兵棋推演相聯系的模擬來說。一些成分包含在復雜的兵棋推演中,因此人們可以觀察到,例如,聯盟的解體和新集團的建立,在團隊看來,這更符合他們的國家利益。今天的模擬通常不允許這樣做。從推測上看,我們認為至少有兩條路可以做得更好。如果可以預見感興趣的突發現象(比如上面的聯盟問題),那么就可以建立適當的對象,模擬可能會識別出何時引導它們出現或消失。但是,最重要的突發現象(包括一些在兵棋推演中出現的現象)可能無法被預期。盡管我們并不聲稱知道什么是必要的,但我們從過去的復雜性研究的經驗中觀察到,突發現象的產生往往是因為復雜的自下而上的互動、多樣性和隨機事件。然而,傳統的高層政治軍事模擬并不具備這些特征。它們的價值在很大程度上是由于它們代表了更高層次的實體和過程,大致與系統動力學的模型相類似。我們的結論是,在前進的過程中,重要的是開發多分辨率的模型系列和將它們相互聯系的方法。例如,一個更高分辨率的基于智能體的模型可能有適應性的智能體,用于所有卷入危機或沖突的國家。仿真實驗可能會發現(就像人類游戲一樣)上面提到的那種突發行為,例如聯盟的偶爾解散、側翼切換和新的便利聯盟的出現。這將是''洞察力'',然后可以導致在更高層次的模型中添加新的智能體,根據模擬中的情況激活或停用的智能體。然而,這將需要類似于最近一本關于社會行為建模的書中所討論的 "自我感知的模擬",特別是伊爾馬茲的那一章,他設想的計算可以監測自己的狀態,并在必要時改變自己的結構,還有一章是作者之間關于出現的辯論。
如果模擬足夠豐富,那么有意義的大規模場景生成是可能的。但然后呢?對模擬數據進行探索性分析的一個核心挑戰是了解如何評估不同情況的相對重要性。一種方法是分配主觀的概率分布,但哪里能找到能夠可靠地估計概率的專家,而不在前面加上諸如 "嗯,如果明天像過去一樣 "的評論。現實上,專家并不是預測或概率的好來源,Tetlock及其同事已經深入討論過了。
一種變通的方法是報告結果的頻率(以百分比計算),例如,好或壞。這可以通過全因子設計或使用蒙特卡洛抽樣來完成。不幸的是,存在著滑向討論"可能性"而不是百分比的趨勢,即使案例的可能性不一樣。另外,在MSG的背景下,這種類型的展示掩蓋了這樣一個現實,即行為者不斷尋找他們將獲得重大優勢的情景空間的模糊 "角落"。因此,在模擬中不經常觀察到的情況可能正是發展中的情況。
我們建議的方法是避開明確的概率分配,而是 "尋找問題"或 "尋找成功"。也就是說,當探索性分析產生的大量數據時,人們可能會尋求找到結果非常好、非常壞或其他的條件。這在關于穩健決策(RDM)和DMDU的文獻中被稱為情景發現。
更進一步,我們敦促人工智能以 "聚合片段"的形式得到提示,其動機來自理論、簡單模型和主題領域的專業知識。一個例子可能是 "沖突開始時的準備狀態"。對于戰略預警時間、戰術預警時間、領導層特征、先前的軍事準備狀態和動員率的巨大不同組合,其數值可能是相同的。也就是說,這個變量是許多微觀初始狀態的集合。另一個例子(假設有合適的智能體)可能是危機發生時的心理狀態,其值包括偏執狂、冷靜和理性以及自信的攻擊性。
鑒于足夠豐富的模擬和理論為人工智能在探索性分析中提供了提示,我們懷疑人工智能可以在識別 "完美風暴 "的情況等活動中完成大量工作--不是為了預測它們,而是為了注意要避免的條件,就像在簡單的兵棋推演中以低技術方式完成的那樣。
另一個ML應用可以從關于對手行動的大規模情報收集中為兵棋推演和M&S創建算法,例如那些潛艇或地面移動導彈。曾經需要幾個月或幾年的時間來收集和分析的東西,現在可能在很短的時間內就能得到,產生可用于兵棋推演或M&S的操作程序的算法。作為一個類比,考慮獲得關于駕駛安全的洞察力。今天最深刻的洞察力來自保險公司(Progressive, GEICO),它基于可下載的軟件,跟蹤個人操作者:他們的速度,左轉的數量,加速模式,等等。這些數據可以與信用評分和其他數據整合。其結果可以是個性化的保險費率。這樣的數據分析已經是今天的現實。應該有類似的軍事和MSG影響。當然,有一些必然是分類的,對于本文的政治軍事重點來說,其意義不如MSG的其他應用。
上面的討論集中在ML式的人工智能上,但所需要的豐富的模擬必須有智能體以更像人類的方式進行推理,這種東西可以被描述為認知型人工智能。在這一點上,決策邏輯使用的因素和推理與人類喜歡相信的東西相似,是他們實際行為的基礎。
1980年代RSAS的紅方和藍方智能體是早期的例子。他們利用廣泛接受的升級階梯結構來描述核危機和沖突中的情況、選擇和決策選擇。
今天,我們需要新一代的更高層次的決策模型,但不存在升級階梯的替代品。也許也不會找到替代品。當從兩方博弈到甚至三方博弈時,復雜性大大增加。一個替代的概念必然會更加復雜--更像是一個n維網格而不是一個階梯--因為升級可能不僅涉及核武器及其目標的數量,還涉及與網絡戰爭、太空戰爭和精確射擊的戰略使用有關的數量、強度和目標。
圖6簡單說明了這一概念,結合了幾個維度,以便人為地顯示只有三個維度的結果。它顯示了一個說明性的情景,開始是一場溫和的常規戰爭(第1項),但隨后依次過渡到嚴重的網絡攻擊(第2項),更廣泛地使用精確制導導彈(PGMs)(第3項),有限的核使用(如箭頭所示的核升級)(第4項),甚至更具破壞性的使用PGMs(如針對大壩和發電廠)。 例如,針對水壩和電網)(第5項),也許大規模殺傷性武器的水平略有提高(也許只是為了以牙還牙),以及全面核戰爭(第6項)。然而,今天,對于某種特定的攻擊會出現在某一軸線上,以及行為者是否會有相同的評估,并沒有共同的理解。不僅"客觀"的答案充其量是短暫的,認知很可能取決于路徑,取決于國家,并受到隨機影響。規劃的一個核心問題是核武近鄰國家之間的長期非核戰爭是否可信。由于常規戰爭和核戰爭的指揮和控制系統的糾纏,這些問題變得更加麻煩。似乎預測模型,無論是否基于人工智能,都不在考慮之列,盡管產生值得擔心的合理情況的模型應該在考慮之列。
對于那些尋求建立認知型人工智能模型以代表危機中的國家決策者的人來說,可能還會列出更多的挑戰,但我們希望我們的例子能吸引眼球。
本文的主要建議是推薦一個研究議程,將建模、模擬、游戲和分析視為相關的和相互交織的。在這樣一個綜合的觀點中,兵棋推演的人工智能將通過使用模型的分析來了解,這些模型包括包含了部分由兵棋推演提供的人工智能智能體。例如,這將導致具有類似于兵棋推演決策助手的人工智能智能體,以及更復雜的算法。它將導致基于兵棋推演的決策輔助工具,它將類似于將有理論依據的ML應用于由探索性分析產生的 "數據",這些探索性分析來自于利用決策智能體形式的AI的M&S。
關于人工智能本身,我們對今天的ML中常見的一些做法提出警告。我們注意到缺乏關于未來危機和沖突的可靠的信息性經驗數據。此外,我們強調,在決策輔助工具和模型中使用的智能體中,都需要解釋。這表明我們更傾向于由認知模型構成的人工智能,即使ML被用來填充和調整該結構。
最后,我們敦促對兵棋推演(包括小規模的活動,如事后演習)和模型所提出的問題要非常謹慎。模型、模擬、游戲和分析仍然是不完美的,有時甚至是明顯不完美的,但我們有可能很好地利用它們來解決許多問題,也就是說,提高決策的質量。預測可能性有很大的潛力;可靠的預測則沒有。
美國軍隊分析中心(CAA)開發了戰略競爭與危機兵棋推演,以捕捉現代軍事競爭在當今世界的運作方式。CAA責成我們的跨學科團隊開發一個更強大、更全面的聲譽模型,利用在系統工程、國防和戰略研究以及運籌學中各自的專業,從另一個國家的角度來量化一個國家的聲譽。該團隊利用系統決策過程中的工具來量化理論上的、無形的聲譽概念。研究從基于專家利益相關者分析和文獻審查的定性價值模型開始。然后,研究小組確定了價值衡量標準,以建立一個搖擺權重矩陣,從另一個國家的角度為每個國家產生一個聲譽分數。這個分數,以及一個增強的游戲用戶界面,現在可以被整合到現有的SC2兵棋推演中,以提供一個更完整的、敘述性的體驗,在整個游戲中記錄玩家的決定。
關鍵詞:兵棋推演,競爭,聲譽,跨學科
這個頂點項目旨在開發一個聲譽模型,加強戰略競爭與危機(SC2)兵棋推演的現有架構,通過利用價值建模的系統方法,說明軍事、經濟或政治決策對感知國際力量的影響。我們的客戶,軍隊分析中心(CAA),已經開發了他們的SC2兵棋推演,"以捕捉與'競爭'相關的討論,以及它如何支持軍隊的全球戰略框架"(Engelmann & Kearney, 2021)。該游戲的目的是采取行動,提高自己的全球聲譽水平,"基于對其實力、可靠性和決心的普遍看法"(陸軍部總部,2021)。目前,CAA有一個考慮到外交、軍事和經濟實力的聲譽模型。我們的畢業設計小組進行了研究,以開發一個新的模型,包括更多影響國家聲譽的因素,然后能夠成功地將該模型應用到SC2兵棋推演中,特別是四個大國:美國、英國、中國和俄羅斯。
Wargaming in Professional Military Education: Challenges and Solutions
職業軍事教育中的兵棋推演:挑戰與解決方案
美國海軍陸戰隊埃里克·沃爾特斯(Eric M. Walters)上校(退役)
鑒于強調在專業軍事教育中使用兵棋推演,學校、作戰部隊和支持機構的教官——尤其是那些本身沒有經驗的兵棋推演者——如何去做呢?本文解釋了在經驗豐富專家的幫助下,為選定、修改或內部設計的嚴格兵棋式推演制定理想的學習成果的必要性。總結了最近的相關學術成果,它提供了促進協作對話的基本術語和概念,并就這種動態和沉浸式教學方法的常見但可避免的陷阱提供了建議。
對于那些認為兵棋推演不僅僅是一種娛樂消遣的人來說,商業兵棋推演曾經是——而且可以說仍然是——一種小眾愛好。在 20 世紀和 21 世紀初的歷史中,只有相對較小比例的軍人和學者經常進行所謂的嚴格式兵棋推演。過去,這一想法受到制度性的抵制,在職業軍事教育(PME)中使用一些人認為是兒童游戲的東西;雖然最近這種恥辱感有所減輕,但對于外行來說,兵棋推演的學習障礙仍然很高。兵棋推演可能很難學習,甚至更難戰勝有能力的對手。然而,我們已經到了 2021 年,軍事兵棋推演似乎正在 PME 學校、作戰部隊甚至支持機構中復活。海軍陸戰隊司令大衛 H. 伯杰將軍在他的指揮官規劃指南中,強調了在 PME 中練習軍事決策的必要性,這是教育兵棋推演的主要目的。但一個事實仍然存在。對于那些有興趣使用和設計兵棋推演來教授軍事判斷力的人來說,這種教學方法似乎很難有效實施。學術界的成功案例涉及作戰部隊中已經是兵棋推演者的教授、教官和海軍陸戰隊領導人。不是兵棋推演者但教軍事決策的人如何弄清楚要使用什么兵棋推演?如何使用它?各種可用游戲的優點和局限性是什么?整合兵棋推演和課程有哪些挑戰,如何克服這些挑戰?本文旨在幫助那些不熟悉兵棋推演的人定位,并就在教授決策中的軍事判斷時使用它們的經過驗證的最佳實踐提供建議。
1 教育者如何使用游戲來教學生?
1.1 了解戰術、作戰和戰略中力量、空間和時間之間的關系
?1.2 在兵棋推演中模擬現實“決策環境”以解決決策困境
?1.3 在兵棋推演環境中體驗摩擦、不確定性、流動性、無序和復雜性的交互動力學
1.4 鍛煉創造性和批判性思維:準備、參與和分析兵棋推演活動
2 哪種類型的兵棋推演最適合學習目標?
?2.1 角色扮演游戲 (RPG)
? ?2.2 研討會矩陣游戲
2.3 系統游戲
?2.4 紙牌游戲
3 哪種情況最適合使用——歷史情景還是假設情景?
4 兵棋推演教學——挑戰與解決方案
?4.1 克服設計偏見
?4.2 時間和復雜性的挑戰
?4.3 對教師要求的考慮
?4.4 兵棋推演支持單位教育和凝聚力