亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

作者

Erik Lin-Greenberg:麻省理工學院
Reid B.C. Pauly:布朗大學
Jacquelyn G. Schneider:斯坦福大學

摘 要

政治科學家越來越多地將兵棋推演融入他們的研究。通過部署原創游戲或利用檔案兵棋材料,研究人員可以研究難以觀察證據的罕見事件或主題。然而,學者們對如何將這種新的方法論應用于政治科學研究幾乎沒有相關指導。本文評估了政治科學家如何將兵棋推演作為一種學術探究的方法,并著手建立國際關系中兵棋推演的研究議程。我們首先將兵棋推演與其他方法論區分開來,并強調它們的生態有效性。然后,我們繪制了研究人員如何構建和運行自己的游戲或從檔案兵棋推演中提取理論開發和測試的圖表。在此過程中,我們解釋了研究人員在使用兵棋推演進行研究時如何解決招募、偏見、有效性和普遍性問題,并確定評估兵棋推演作為調查工具的潛在好處和缺陷的方法。我們認為,兵棋推演為政治科學家研究國際關系子領域內外的決策過程提供了獨特的機會。

關鍵詞

兵棋推演,博弈,方法論,檔案,實驗,網絡,新興技術,核擴散

圖 兵棋推演開發指導框架

1 背 景

人類行為和決策是國際關系 (IR) 中最持久難題的核心。然而,有關決策的數據很難獲得,特別是涉及罕見事件以及與安全和外交決策相關的精英決策者。近年來,兵棋推演作為一種產生和獲得這些行為洞察力的方式重新燃起(Bartels,2020 年;Colbert 等人,2017 年;Dorn 等人,2020 年;Hirst,2020 年;Jensen 和 Valeriano , 2019 ; Pauly, 2018 ; Reddie 等人, 2018 ; Schneider, 2017)[1]。作為政策制定者的領地,國際關系學者開始利用歷史兵棋推演中的檔案數據,并運用自己的兵棋推演來測試決策和沖突動態的理論。總之,這個嶄露頭角的學術問題使用兵棋推演來探索支撐外交政策決策的機制和邏輯。

關于此問題快速增長的研究興趣是三個因素的產物。首先,冷戰時期國防兵棋推演的解密為學者們提供了新的和獨特的檔案材料,以更好地了解有關核使用和沖突升級等主題的歷史決策。其次,在過去的二十年中,政治科學家越來越多地轉向綜合數據生成過程,例如調查和實驗室實驗(Hyde,2015 年)。這種行為轉向強調了實驗設計,政治科學家在他們自己的游戲中應用了這種設計。第三,政治科學家對理論背后的微觀基礎越來越感興趣(Kertzer,2017)。通過闡明決策過程,兵棋推演為研究人員提供了一種新的方法論工具,用于探索和測試 IR 理論所依賴的機制,可能比其他研究方法提供更深入的見解。

兵棋推演可能為學者們提供了一種很有前途的工具,可以以創造性的方式回答問題,但在該領域采用兵棋推演方法或數據之前,我們需要更好地了解博弈對政治科學的承諾和陷阱。兵棋推演與其他研究方法有何不同?兵棋推演可以產生哪些類型的見解和數據,學者如何最好地利用它們進行研究?研究人員在設計自己的游戲時應該考慮什么?將兵棋推演作為 IR 研究的一種方法應該解決哪些方法問題?

本文繪制并評估了政治科學家如何將兵棋推演作為一種學術探究的方法,并著手制定 IR 兵棋推演的研究議程。我們探索研究人員現場兵棋推演的發展以及使用檔案兵棋推演材料來產生對決策的見解。我們考慮了博弈對理論開發和測試的效用;檢查偏見、有效性和普遍性問題;并描述博弈如何闡明支撐核心 IR 理論的微觀基礎。

文章分五個部分進行。首先,我們定義兵棋推演并確定不同的博弈類型。其次,我們回顧了一系列關于兵棋推演價值的主張,這些主張將其與其他政治科學研究方法區分開來。第三,我們討論了研究人員如何以社會科學規則為指導,評估設計選擇的成本和收益。第四,我們描述了檔案中出現的歷史兵棋推演材料,如何最好地使用這些文獻證據,并確定歷史兵棋推演可以教給我們哪些關于研究人員現場兵棋推演的最佳實踐。最后,我們概述了兵棋推演研究議程,探索兵棋推演如何補充其他研究方法,為正在進行的辯論做出貢獻,并提出具體問題,以幫助研究人員更好地理解可以從兵棋推演中得出的推論

2 什么是兵棋推演?

兵棋推演的使用可以追溯到幾千年前,古羅馬、早期伊拉克和中國都有兵棋推演的證據(Caffrey,2019 年)。隨著普魯士開發的Kriegspiel棋盤游戲,兵棋推演在現代戰爭行為中發揮了核心作用,這是一種模擬戰斗訓練軍官的棋盤游戲(Schuurman,2019年;Wilson,1968年)。一個世紀后,美國在第一次世界大戰和第二次世界大戰期間將兵棋推演用于軍事規劃,成為海軍在太平洋地區取得成功的關鍵部分(Lillard,2016年)。在冷戰期間,美軍再次轉向兵棋推演來了解核革命的影響(Pauly, 2018;Schelling, 1987)。柏林墻倒塌后,美國的國防兵棋推演仍在繼續,旨在測試有關戰爭和援助采購決策的新想法(Krepinevich和Watts,2015年)。

盡管發展歷史悠久,但并不清楚什么是“兵棋推演”(Sepinsky,2021年)。雖然兵棋推演是為了準備戰斗而出現的,但它們的用途超出了對戰爭的研究。政府使用游戲來模擬自然災害和評估經濟合作(Abbasi等,2012;Smith和Bell,1992);商業顧問使用兵棋推演來測試新的商業戰略(Oriesek和Shwarz,2008年);學者應用游戲來研究人類行為如何影響各種社會和政治現象(Banks等人,1968年;Camerer,2011 年;Fiorina 和 Plott,1978 年)。例如,Thomas Schelling 關于強制的工作在很大程度上受到他設計的國防部兵棋推演的啟發(Schelling,1987 年),而 Schelling 的同時代人使用模擬來探索沖突和核使用(Bloomfield 和 Whaley,1965 年;Brody,1963 年;Hermann,1967年)。此后,學者們使用游戲中嵌入實驗來測試對沖突引發的解釋(Johnson等人,2006 年;McDermott 等人,2008 年)以及國內政治討價還價(Hamman等人,2011 年;Huckfeldt等人,2014年)。最近,政治科學家使用兵棋推演來研究數據稀少的現象,例如新興技術對IR的影響(Jensen and Banks, 2018; Jensen and Valeriano, 2019; Lin-Greenberg, 2020; Pauly, 2018; Reddie et al., 2018; Schneider, 2017; Schneider et al., 2021)。

雖然通常被稱為“模擬”或“演習”,但兵棋推演不同于計算機模擬戰斗、以實際軍隊為特色的實地演習或有組織的頭腦風暴會議。此外,大多數傳統兵棋推演也不是旨在研究因果關系的實驗室實驗。相反,兵棋推演是具有四個特征的交互式事件:人類玩家、沉浸在場景中、受規則約束以及受基于結果的驅動

首先,兵棋推演涉及人類玩家。正如Perla (1990 : 164) 解釋的那樣,“兵棋推演是人類互動的練習。它的長處是探索人類決策的作用和潛在影響” 。這種人類特征使得兵棋推演成為因變量或假設因果機制與人類行為有關的研究的理想選擇。事實上,博弈可以幫助闡明微觀基礎,或源自個體人類行為的較低層次的機制,它們是許多學術理論的基礎(Kertzer,2017年)。兵棋推演的人為因素將它們與計算機模擬或計量經濟學“博弈”區分開來,其中模型模擬假定人類行為。

其次,兵棋推演將人類參與者置于模擬現實世界決策的場景中(Pettyjohn,2019年)。現實的表示和環境的整合產生了兵棋推演場景的厚度,并將它們與越來越多地用于 IR 研究的實驗室和調查實驗區分開來。這些模擬的決策環境,類似于參與者經常體驗的環境,可以誘導玩家的行為方式與他們在相似的現實世界環境中的行為密切相關[2]。兵棋推演設計師必須仔細平衡抽象,這使游戲更容易執行,現實主義是兵棋獨有的,并可能最終增加游戲發現的穩健性。

第三,兵棋推演具有規定人類玩家如何與場景互動的規則。規則可能是嚴格的,其中玩家有一組有限的動作,或者允許自由博弈,玩家幾乎沒有限制。這些規則可以塑造玩家的行為和結果,最終影響觀察者從博弈中得出的結論。因此,規則會產生復雜的設計權衡。例如,免費游戲會使復制變得困難,而僵化游戲更有可能不自然地限制結果。盡管規則是博弈與許多模擬、模型和實驗共有的特征,但兵棋推演(尤其是具有多個動作、玩家或團隊的兵棋推演)通常使用更復雜的規則來管理團隊如何互動,同時允許更廣泛的行為選擇,因此,導致結果差異更大。

兵棋推演區別于大多數其他國際關系研究方法的第四個特征是其基于結果的產出的經驗性質。正如巴特爾斯所說,兵棋推演必須讓人類玩家“沉浸在基于一組隱含或明確規則的競爭環境中,應對其行為的潛在后果”(Bartels,2020)。這些后果,例如“輸掉”一場兵棋推演或在前一輪做出的決定會影響下一輪,被認為會激勵參與者更深入地考慮他們的決定。在更常見的研究方法中,例如調查實驗,參與者通常不會面對真實或模擬的后果。兵棋推演,在他們最好的情況下,超越了玩家的“游戲”結果,以感受和內化他們行為后果。最后一個特征的成功與游戲設計師在前三個特征之間進行權衡有關,包括使用正確的玩家、創建適當的場景和建立有用的規則。

總之,兵棋推演是互動場景,讓人類玩家沉浸其中,他們根據給定的規則做出決定,并對他們的選擇的后果做出反應。這四個特征的變化導致了各種看起來截然不同的“兵棋推演”。例如,兵棋推演包括棋盤游戲、少數玩家參與的戰術桌面演習,以及數百名參與者參與的政治軍事游戲。它們可以面對面、虛擬或使用某種混合組合進行,并具有不同的規則(表1)。學者們需要了解這些博弈特征如何影響可以從博弈中得出的關于 IR 理論和決策的結論;我們將在后續部分中探討。

表1 博弈的特征

3 為什么需要兵棋推演?

上面我們概述了兵棋推演是什么,但為什么研究人員會選擇兵棋推演而不是其他方法或數據源?下面,我們確定了關于兵棋推演作為研究決策的研究工具有用性的四個命題:(1)兵棋推演比其他方法更能讓研究對象身臨其境,(2)經常玩兵棋推演的精英參與者使得比其他方法更接近實際決策者,(3)參與者之間的交互更好地代表了現實世界的決策,以及(4)兵棋推演向玩家展示了他們自己決策的后果。總之,這些命題表明,使用和分析兵棋推演的主要價值不是生成關于結果的新的或更好的數據,而是理解導致這些結果的行為和選擇。兵棋推演不能預測沖突或危機中會發生什么,但它們可以告訴我們為什么以及如何發生一種結果或另一種結果。雖然在從業者社區中被廣泛接受(Bartels, 2020; Oberholtzer et al., 2019; Perla, 1990; Perla and McGrady, 2011; Wong et al., 2019),但這些關于兵棋推演作為研究工具的價值的假設大多未經檢驗。我們在本節中列出它們,以開始概述關于兵棋推演與其他方法和檔案數據源的獨特作用的前瞻性研究議程。在結論中,我們評估了研究人員如何研究這些命題,并描述了學者可能使用兵棋推演解決的問題類型。

總體而言,這四個命題中的每一個都提高了兵棋推演作為一種研究方法的生態有效性。生態效度(心理學研究中的一個常見概念),關注測試條件下的行為反映現實世界行為的程度。換句話說,更生態有效的研究設計應該對實際行為提供更可靠的見解。為了獲得高生態效度,心理學家關注三個關鍵維度。首先,測試環境應該包括在自然環境中發生的特征——例如時間限制和干擾——而不是表現出精簡實驗室設置的更加不切實際的性質。二、刺激——例如信息注入——在模擬環境中應該與現實世界的刺激相似。第三,參與者在測試中可以做出的行為反應和行為應該代表他們在現實世界中可以做出的行為。來自過于不切實際或涉及不自然刺激和行為反應的環境的測試信息可能會限制從研究中得出結論(Gouvier等,2014年)。

在兵棋推演中實現高生態有效性需要模擬條件,以反映真正的政策制定者在實際危機中必須應對的壓力、激勵和信息環境的類型。然后,這些條件允許參與者提出類似于他們在現實世界中提出的解決方案。如果兵棋推演具有較高的生態效度,學者們應該能夠利用兵棋推演真實地模擬和研究外交政策決策過程。事實上,生態有效性使其他領域的專業人士能夠將博弈和模擬用于培訓目的。例如,使用準確的現實世界參數進行編程的飛行模擬器具有很高的生態有效性,并且是一種更便宜、更容易、更安全的方式來訓練飛行員并了解他們的決策[3]。雖然跨學科的文獻繼續對其定義進行辯論(Baumeister 和 Vohs,2007;Brunswik,1947:276;Schmuckler,2001),但我們認為生態效度是外部效度的關鍵要素——研究結果在研究背景之外的普遍性(Findley等人,2020年)[4]。

3.1 命題 1:兵棋推演比其他方法更具沉浸感,因此在生態上更有效

作為兵棋推演專家Perla 和 McGrady (2011: 113) 斷言:兵棋推演“吸引玩家參與并構建他們的故事;他們確實將玩家置于故事之中。” 這是兵棋推演優于其他不復制真實世界決策環境的方法的論據。就生態效度的維度而言,沉浸式旨在提供一個有效刺激的有效測試環境。理想情況下,玩家沉浸在其中,以至于他們暫時忘記或忽略了他們正在被研究的事實,而是關心他們在兵棋推演中的進展。因此,兵棋推演尋求創造沉浸式環境,在這種環境中,參與者不扮演游戲玩家的角色,而是內化他們過去和未來對類似現實生活場景的反應。從歷史上看,兵棋推演反映了政府參與者的真實經歷。在古巴導彈危機期間,一位曾參與過托馬斯·謝林兵棋推演的國防官員表示,“這場危機確實證明了Schelling的兵棋推演是多么逼真”,一位同事對此回應說,“不”,兵棋推演“證明了這場古巴危機是多么不切實際”(Schelling and Ferguson, 1988: 10)。

當然,兵棋推演可能會被剝奪細節并失去其身臨其境的品質,但隨后該活動是否仍可被視為兵棋推演就成了問題。例如,調查實驗優先考慮內部有效性和控制,但往往缺乏這種沉浸式互動或實際決策設置的應激源(Barabas和Jerit,2010 年)。相比之下,通常持續數小時或數天并具有大量細節的博弈,可以通過提供逼真的場景、創造參與者可以與另一個團隊贏或輸的條件以及允許參與者之間的擴展互動來引起參與者的支持。投入時間和精力參與其中的玩家,可能會比不那么投入的研究對象更好地理解場景并更關心其結果。因此,他們可能會更周到地對給定的場景做出反應。此外,兵棋推演通常要求玩家在信息過多(或過少)、時間限制和情感負擔的情況下做出決策,從而產生了 McDermott (2002) 所說的“實驗現實主義”。事實上,學者們發現“綜合體驗”向研究對象展示身臨其境的小說或視頻,會觸發類似于現實世界決策的認知過程(Daniel 和 Musgrave,2017;Miller,2020)。最后,兵棋推演超越了許多調查實驗,要求參與者扮演決策者的角色并回答我會做什么,而不是我會支持其他人做什么?[5]

3.2 命題 2:更具代表性的樣本使兵棋推演更具生態有效性

兵棋推演可能比其他研究方法提供更多的見解,僅僅是因為它們傳統上招募了包括決策者和軍官在內的專家參與者。學者們通常認為,當研究樣本反映感興趣的人群時,研究提供了最有用的見解(Dietrich 等人,2021;Hyde,2015;McDermott,2002)。然而,國際關系學者越來越多地轉向更大的在線和學生便利樣本進行實證研究。雖然這種方法允許進行可重復的統計分析,從而克服因果推理的基本問題并能夠研究公眾偏好,但如果受試者不能代表實際的政策制定者,便利樣本可能會產生對政府決策的有限見解(Dietrich 等人,2021 年);Oberholtzer 等人,2019 年)。

相比之下,精英兵棋推演的特點通常與便利樣本相反——參與者被故意招募是因為他們的實質性知識或他們在現實世界決策中的經驗。這種招募策略可以產生高度真實的樣本。然而,即使是這些現實的樣本也可能包括顯著影響決策的經驗和世界觀的變化。例如,奧巴馬政府的國家安全專家在做決定時會考慮與特朗普政府的國家安全專家相同的因素嗎?因此,這些精英研究對象的代表性可能會提高兵棋推演的生態有效性,但是——如果只招募有限數量的參與者來玩少量的兵棋——研究人員仍然需要清楚地解釋從研究結果中得出的推論的局限性。

即使精英參與者的數量很少并且有針對性的招募,精英兵棋推演參與者的獨特性仍然可以提供重要的分析見解。例如,參與者在游戲中的審議可能會揭示精英在做決定時強調或不強調的因素。例如,規范或道德對于沖突決策有多重要?參與者將哪些國際政治信念帶入決策?他們在做決定時是否討論過心智模型、歷史類比或其他啟發式方法?由于精英參與者在玩研究人員和政府贊助的游戲時可以利用他們的實質性知識和專業知識,因此這些游戲的見解對于 IR 理論測試可能比非專家玩的游戲更有用。

3.3 命題 3:兵棋推演中的群體互動比收集個人偏好的實驗或調查更能代表現實世界的決策

大多數兵棋推演和其他合成數據生成過程之間的一個顯著區別是群體在決策中的作用。兵棋推演本質上是多玩家的努力,而大多數調查實驗和許多實驗室實驗都收集個體參與者的反應。最終在兵棋推演期間形成決策的團隊內部和團隊之間的玩家互動非常重要,因為現實世界的外交政策決策很少由一個人做出(Kerr 和 Tindale,2004 年;Mintz 和 Wayne,2016 年;Saunders,2017 年)。大多數兵棋推演中的組級交互提供了一個獨特的機會來研究決策如何展開,并通過比其他研究方法更好地模擬實際決策過程和行為反應來潛在地提高生態有效性。情緒、狂妄自大、溝通不暢、地位、聲譽、多樣性、性別、經驗和鷹派等因素會影響兵棋推演期間的團隊動態和決策,讓研究人員有機會探索這些重要(但難以收集)的變量如何影響外圍策略 ( Wang et al., 2020)。兵棋推演討論還可以揭示團隊如何根據團隊成員的性格或特征進行自我排序以及分配或推遲決策責任。事實上,一位在 1960 年兵棋推演中的精明報告員指出,政策重量級人物沃爾特·羅斯托(Walt Rostow)在美國隊“做了大約 75% 的談話”((Bloomfield,1960 年)。相比之下,調查和許多實驗往往忽視群體動態,并通過衡量個人層面的偏好來概括外交政策決策。

3.4 命題 4:兵棋推演向玩家展示后果,創建關于結果和決策的更生態有效的數據

博弈可能更有可能反映現實世界的決策,因為它們要求玩家做出響應或導致基于結果的輸出的選擇[6]。兵棋推演的這種體驗品質,要求玩家在模擬挑戰之后調整策略,超越了對迭代后果或未來陰影的擔憂。反對派將政治-軍事信號作為“感受對方可能接受或拒絕的過程”(Schelling 和Ferguson, 1988: 1)所做的遠不止決定如何在實驗室中分配一美元。事實上,這些決策邏輯可能類似于 Hayward Alker 所描述的參與囚徒困境游戲的玩家的“內心獨白”,揭示了人類如何解釋自己和他人的行為(Alker,1985 年)。

首先,兵棋推演通常允許玩家“贏”或“輸”,至少相對于其他參與者而言。正如一位兵棋推演實踐者所說,“兵棋推演是一種人類活動。當人們在游戲中輸球時,他們會感到失落。當他們獲勝時,他們會很興奮”(McGrady,2019)。在這里,結果的引入再次以可以塑造行為反應的方式提供了一個更生態有效的測試環境。其次,這個命題斷言,這種失落或興奮感的強度隨著研究對象在他們的策略上投入的努力而增加。將一群人長時間放在一起可以通過將玩家更多地投入到游戲中來增加這些后果的顯著性,而不是通過在線、電話或郵件進行的調查實驗。因此,游戲允許研究人員檢查參與者為獲勝而采取的權衡、選擇和風險。

這四個命題表明,兵棋推演為研究人員提供了在現實世界數據有限的情況下進行決策的寶貴見解。至關重要的是,兵棋推演的價值不在于確定結果,而在于闡明決策者如何得出這些結果。盡管兵棋推演本質上是對現實的模擬,但我們相信其身臨其境的性質、群體互動、后果以及精英樣本的使用比其他研究方法更準確地模擬了現實世界的決策環境,從而提高了研究結果相對于其他方法的生態有效性。任何單獨的游戲設計都可能會強調某些主張而削弱其他主張——例如,片面的博弈可能會犧牲一些競爭精神,同時賦予群體互動特權——但兵棋推演保留了每個命題的一些價值。在接下來的部分中,我們將繪制出學者如何使用原始兵棋推演和使用檔案兵棋推演數據進行研究,并確定在設計游戲和分析游戲數據時如何駕馭這四個命題。

4 學者生成的兵棋推演

學者生成的兵棋推演最適用于回答有關人類決策的問題,無論是關于罕見事件還是難以獲得真實世界數據的主題。因此,使用學者生成游戲的現有研究傾向于回答有關新興技術和核武器的問題(Jensen and Valeriano, 2019; Lin-Greenberg, 2020; Reddie et al., 2018; Schechter et al., 2021; Schneider, 2017; Schneider et al., 2021)。然而,兵棋推演也可用于研究一系列國際關系主題,包括外交政策決策中的群體動態、決策中規范的強度、條約承諾在武力使用決策中的作用、軍事力量的發展和效用、經濟制裁、對威懾戰略相對有效性的看法以及危機信號的準確性。

在本節中,我們整合了來自專業兵棋推演和政治科學研究設計的最佳實踐,為學者們開發自己的兵棋推演提供了一個指導框架。在此過程中,我們概述了生態有效性、內部有效性和實施可行性之間的權衡。圖1總結了我們的主要設計建議。

圖1 游戲設計建議

4.1 游戲設計與迭代

兵棋推演開發的第一步是確定研究問題是否可以通過觀察或實驗設計得到最好的回答。觀察性游戲通常是獨立的事件,既不操縱玩家也不操縱他們面臨的場景。一個單一的觀察游戲通常會在定義的場景中揭示可能的結果,使這種類型的游戲最適合探索一般決策過程或產生假設[7]。相比之下,實驗性游戲通過改變感興趣的關鍵因素(例如有關場景的細節)來測試假設,從而創建“治療”和“控制”游戲,使研究人員能夠研究特定變量如何影響決策[8]。

游戲的類型通常會影響所需的迭代次數。實驗設計的游戲可能需要比觀察設計游戲更多的迭代,以評估實驗操作是否會導致決策趨勢。研究人員越來越多地部署數十到數百個實驗性游戲迭代(Jensen 和 Valeriano,2019年;Reddie等人,2018年;Schechter等人,2021年;Schneider 等人,2021年),以識別游戲中的趨勢并幫助確保發現不會偶然的結果。

4.2 參與者

對于觀察性和實驗性兵棋推演來說,比迭代更重要的是玩家選擇。在選擇樣本時,學者們應該問兩個問題:(1)我的研究問題是關于特定實體的決策還是關于人類決策?(2) 玩家將代表誰?

如果研究問題是關于特定實體做出的決策,那么在理想情況下,現實世界的決策者會在兵棋推演中“玩”自己。這樣的構造將是最生態有效的。然而,由于高級官員甚至很少有時間參加政府贊助的高調游戲,因此實踐者兵棋推演往往依賴于代理人,包括前政策制定者或在職的下級官員,他們具有足夠的主題和組織專業知識。一些研究人員參與的游戲依賴于這種類型的樣本,吸引了來自軍方、私營部門和政府的玩家(Lin-Greenberg, 2020; Schneider, 2017; Schneider et al., 2021)。研究人員還縮短了游戲時間或部署虛擬游戲,以減輕精英參與者的負擔。無論精英招募方法如何,研究人員都需要確定他們樣本的人口統計學或意識形態特征是否會限制從調查結果中得出的結論。例如,一個主要由幾十年前在政府任職的參與者組成的團隊的行為可能與最近任職的官員不同。

或者,如果研究問題是關于更一般的決策或人類行為——例如人類如何響應不同的信號或威脅——研究人員可能能夠證明招募更容易獲得的便利樣本是合理的(Goldblum 等人,2019年)。事實上,越來越多的研究表明,便利樣本的偏好通常與更具代表性或精英樣本的偏好相似(Berinsky 等人,2012 年;Kertzer,2020 年)。理想情況下,研究人員應盡可能招募更能代表感興趣的目標人群的樣本。然而,考慮到精英招募的兩大挑戰(Dietrich 等人,2021 年;Kertzer 和 Renshon,2022 年) 以及即使在精英人群中的重要變化,研究人員也不應該依賴“精英”作為參與者選擇的充分特征。相反,研究人員應該識別精英樣本和便利樣本中可能影響兵棋推演行為的特征,并研究數據以了解這些特征在兵棋推演中的影響。

研究人員面臨的一項特殊招募挑戰是在兵棋推演中尋找代表外圍決策者的參與者,這些兵棋以特定的盟軍或敵對行動者為特色。理想情況下,這些參與者應該對他們被要求代表的人物有深入的知識。這有助于確保他們在兵棋推演中的行動保持在行動者可能實際做出的合理決定的范圍內。然而,即使是專家也可能將他們自己的參考框架鏡像到外圍人物(Jervis,1976)。為了降低這種風險,研究人員可以嘗試招募實際上來自他們被要求代表的州的參與者。由于這并不總是可能的,從業者的游戲通常依賴于地區專家,包括學者和外交官。或者,兵棋推演設計師可以為扮演外圍人物的非區域專家提供詳細的賽前準備材料,甚至是一本規則書,說明外圍人物可能遵循的合理策略或原則。誠然,高手并不具備應對國外危機行為的水晶球,但這不是游戲的目的。設計師應該追求現實主義,而不是預測。在分析數據時,研究人員必須承認這些招聘挑戰可能如何影響參與者的行為。

參與者的數量受玩家在游戲中所代表的人的影響,因此也受團隊構建方式的影響。這種選擇應該根據研究問題是關注群體做出的決定還是特定個人的角色來決定。例如,在某些游戲中,研究問題詢問組織或團體的角色——例如軍事指揮部的互動——因此需要足夠多的玩家來模仿這些組織的功能。在其他情況下,玩家代表特定的角色——例如總統或內閣部長——或更抽象的職位不明確“官員”。在決定如何設計這些團隊以及是否分配特定角色時,研究人員應考慮研究問題如何影響玩家在游戲中做出的決策類型(Bartels 等人,2013 年:42-46)。例如,研究對核攻擊的反應的游戲可能需要代表多個機構的玩家,而不僅僅是國防機構。

游戲設計也會影響樣本量。例如,具有多種治療游戲的實驗性游戲通常比不太復雜的游戲需要更多的參與者。同樣,具有多面性或模擬詳細組織過程的游戲通常比單面或高度抽象的游戲需要更多的玩家。對于理想的參與者人數沒有硬性規定,但游戲應該包括足夠的參與者,以允許將兵棋推演與其他研究方法區分開來的互動。

4.3 規則:動作(moves)、隊數(sides)、裁決(adjudication)

研究人員接下來必須制定他們的游戲結構規則——有多少步數、多少邊(即團隊)以及游戲將包括多少裁決?首先,為了確定游戲需要多少輪(即動作),學者們應該詢問他們是對一次性決策(例如,反擊或不反擊的選擇)感興趣,還是對多個決策的結果感興趣(例如,長期危機或權力轉移)。額外的回合可以通過引入切實的結果來增強現實性,但也會削弱對混淆因素的控制,特別是在以多次并行迭代為特色的實驗游戲中。

研究人員還必須確定隊數(即多少團隊參加游戲)。單方面的游戲可能足以回答不取決于其他參與者的即時反應的問題——例如,我對恐怖襲擊的即時反應是什么?這些游戲需要較少的參與者和較簡單的裁決過程。相比之下,對于取決于對方反應的研究問題,例如策略對威懾的有效性,學者們應該考慮一個半邊的游戲,其中對方的行動由游戲裁判員編寫,或者兩個/涉及多隊玩家的多方比賽。這些提供了更大的活力,并允許研究人員探索演員之間的互動。然而,隊數越多,研究人員在多個游戲迭代之間的控制就越少。

大多數具有不止一個動作的游戲都需要游戲組織者的裁決。這種對回合之間結果的“裁判”會影響后續回合的展開。在具有多個游戲迭代的項目中,這可能會在游戲之間引入差異,從而導致游戲不再具有直接可比性。在某些情況下,跨博弈差異可能對研究人員有用——例如,研究危機早期階段的變化如何產生不同的下游效應。然而,這些差異可能會引入混雜因素,從而難以隔離第一輪之后引入的額外操作的影響。

學者們可以根據他們的研究目標從一系列裁決技術中汲取經驗。對比較大量游戲感興趣的研究人員可能會使用公式化的判斷——比如概率表或隨機生成的結果。這種方法允許跨游戲的標準化規則;但是,它會降低真實感。希望最大限度地提高玩家參與度的學者可以選擇免費游戲裁決,專家根據主題知識確定結果。這可能會為玩家創造一個更有活力的游戲,支持生態有效性,但可能會引入裁判者的偏見,使得難以在多個游戲中復制裁判,并增加現場比賽所需的裁判員數量。免費游戲還增加了隨機性,這會降低游戲多次迭代的可比性。

4.4 場景設計

與調查和實驗室實驗一樣,研究人員必須在他們的場景設計中平衡控制和現實主義,以構建一個實用但生態有效的測試環境。在決定提供多少有關場景和環境的信息時,通常需要在抽象和細節之間進行權衡。兵棋推演必須足夠逼真以捕捉現實世界決策的要素并在生態上有效,同時又足夠簡單以回答研究問題(Mutz,2011:65)。例如,參與者應該獲得多少關于危機前導的背景信息?參與者可以獲得多少關于對方團隊的能力和意圖的信息?

一個關鍵的設計選擇是是否在場景中列出實際的國家(Dafoe等人,2018年)。一方面,識別真實的狀態可能會創造一個更現實的場景,進而影響決策。但這種現實主義可能會導致政策制定者避免參與軍事演習,因為他們擔心泄露機密信息。或者,參與者可能會對這些國家產生偏見。另一方面,使用虛構的或不知名的國家可能會增加國家安全從業人員的參與,但限制了從發現中得出的推論。

一般來說,學者們應該傾向于針對特定案例的研究問題(例如美國如何應對伊朗贊助的網絡攻擊)的現實主義和具體性,并為適用于廣泛案例的更廣泛問題做出更抽象的場景選擇。例如,網絡攻擊與傳統攻擊的看法不同。可以肯定的是,相對于提供更多上下文細節的場景,過于抽象的小插曲可能會導致參與者做出可能削弱研究人員控制的假設。Brutger等人最近的研究表明,抽象和細節之間的權衡可能被夸大了,研究人員應該在設計兵棋推演場景時認識到這些問題。

4.5 數據收集和分析:捕獲動機(motivations)、交互(interactions)和決策(decisions)

最后,研究人員還必須制定一種策略來收集和分析兵棋推演期間產生的數據。兵棋推演數據可以分為兩種類型:結果型和協商型。結果數據識別玩家在游戲中做出的決策,通常在動作、響應計劃或其他正式數據輸入中捕獲。結果數據通常比記錄參與者交互的審議數據更容易收集。然而,如果沒有經過深思熟慮的數據,結果數據是不完整的。深思熟慮的數據揭示了決策的方式和原因,這可以幫助研究人員探索理論的微觀基礎。可以追溯豐富的審議數據,以了解想法是如何提出的、玩家如何反應以及團隊如何做出決策。結果數據和審議數據結合起來,可以解釋現象如何和為什么發生,反之,更多的概率評估可能發生的事情,這是許多實驗IR研究的共同特征。

在理想情況下,研究人員會逐字記錄所有參與者的互動和決定。在他們的在線兵棋推演中,Goldblum 等人(2019 年)通過數字化捕獲玩家決策和參與者之間的聊天消息來實現這一目標。研究人員還可以通過視頻或音頻記錄兵棋推演來捕捉參與者的語氣和肢體語言。然而,數字收集并不總是可行的。參與者可能不同意錄音,兵棋推演經常在禁止使用電子設備的環境中進行,環境噪音和串擾可能使錄音變得困難。因此,研究人員經常依靠研究助理來記錄審議并手動記錄團隊決策,這是從業者游戲中常見的過程。

然而,人類收集數據是一個固有的偏見過程。由于他們的背景,或者由于討論的速度,記錄者會寫下某些觀察結果并省略其他觀察結果(Emerson et al., 2011: 13)。此外,數據收集可能會產生霍桑效應,其中參與者會因為被觀察而改變他們的行為(Wickstr?m 和 Bendix,2000)。為了降低這些風險,研究人員可以指派多名研究助理來觀察每場比賽,允許進行三角測量,同時盡量讓記錄員不引人注目。為了準確捕捉游戲結果,研究人員可以指示參與者提交確定最終決定的表格。這些表格還可能要求參與者列出他們考慮的選項,并簡要解釋他們為什么選擇他們所做的行動,生成關于參與者對自己決策過程的看法的書面數據。最后,研究人員可以在團隊或個人層面進行賽后采訪或調查,以獲取有關指導決策的邏輯信息。為了衡量生態效度并改進未來的游戲,這些訪談和調查可能還會要求參與者描述兵棋推演如何模擬真實世界的決策環境。

在設計和分析兵棋推演時,研究人員必須確定分析單元。單元通常應位于與所研究假設相同的分析水平(Gerring,2012: 90–91)。如果被測試的理論與個人層面的信念或行為有關(例如關于內化規范),研究人員可能會使用兵棋推演者作為分析單元。這允許在游戲分析中評估玩家的背景或從屬關系如何影響他的行為。同樣,使用兵棋推演來研究群體動力學理論的項目可能會將團隊視為一個分析單元,從而使研究人員能夠解釋群體在將個人信念與團隊行為聯系起來方面的中介作用。然而,如果該理論更廣泛地涉及國家安全決策,研究人員可能會考慮使用博弈作為分析單元。一些研究,尤其是那些涉及多個游戲迭代的研究,可能包括多個分析單元,這些分析單元既可以進行內部比較,也可以進行交叉比較。

4.6 游戲設計過程圖解

在實踐中如何運作?為了演示兵棋推演設計過程,我們將介紹研究人員如何設計和部署國際危機兵棋推演系列(Schechter 等人,2021 年)。研究人員從一個研究問題開始:“網絡行動如何影響核穩定性?” 具體來說,他們想評估競爭對手的核指揮、控制和通信網絡(主要自變量)中的網絡漏洞和漏洞利用是否會影響使用武力的決策(因變量)。基于研究漏洞和漏洞利用的變化是否會影響決策的愿望,研究人員決定使用實驗方法。研究人員在“控制”和“治療”游戲中改變了漏洞和利用的可用性。

為了生成樣本,研究人員最初尋求外交政策、網絡和核政策方面的精英專業知識,但后來擴大了他們的人口,包括學生和便利樣本,以探索不同類型的專業知識和人口統計變量如何影響決策。在規則方面,研究人員選擇了一個相對簡單的游戲玩法結構,一招一式。這種簡單的結構允許團隊跳過裁決。正如研究人員解釋的那樣,“ICWG 優先考慮內部有效性和控制,但也試圖隨著時間的推移使用大量且異質的樣本進行迭代,以創建可概括的發現”(Schechter 等人,2021:6)。

最后,研究人員收集了定量和定性數據進行分析。游戲期間完成的響應計劃“移動表”捕獲了群體決策,而調查收集了數據以了解單個玩家的動機和對游戲中所采取行動的解釋。正如研究人員詳述的那樣:盡管響應計劃是由團隊集體制定的,但個別參與者可能對危機有不同的看法或對最佳行動方案的信念。這些調查旨在捕捉這些看法和信念。此外,該調查試圖捕捉群體動態如何影響響應計劃的完成(Schechter 等人,2021年)。

在設計他們的游戲時,研究人員做出了幾個明確的權衡。為了增加他們在三年內進行的迭代之間的游戲總數和控制游戲,研究人員做出的選擇可能會降低真實感和沉浸感。例如,使用單方游戲而不是多方游戲增加了游戲迭代的次數,但以現實主義為代價。同樣,使用單步游戲而不是多步游戲有助于增強控制力,但可能會限制研究人員探索更復雜的升級問題的能力。此說明的目的不是確定一組選擇是對還是錯,而是幫助未來的學者慎重思考兵棋推演中固有的權衡取舍。在下面的章節中,我們將評估與分析兵棋推演產生的數據相關的最佳實踐和挑戰。

5 兵棋推演檔案數據

除了開發自己的游戲外,學者們還可以使用歷史游戲中的數據。在 1950 年代后期,兩位研究人員所做的正是我們在本文中討論的內容:麻省理工學院 (MIT) 政治學家Lincoln Bloomfield和哈佛經濟學家 Thomas Schelling 著手設計社會科學兵棋推演 ( Bloomfield, 1984 : 784–785)。然而,當 1961年參謀長聯席會議創建了兵棋推演辦公室并引進了Schelling和Bloomfield的方法時,這些創新又回到了政府分類的混亂之下(Bloomfield,1963年)。

這些數據越來越多地可供 IR 研究人員使用(Pauly,2018;Emery,2021)。今天,可以在總統圖書館、中央情報局的 CREST 檔案館、美國在線解密文件、蘭德公司和麻省理工學院檔案館找到美國早期兵棋推演的解密記錄。這些數據來自高級決策者參與社會科學家兵棋推演的黃金時代,對于政治學理論檢驗來說已經成熟。由政府機構、智囊團、非政府組織和學者運營的最新游戲的數據也經常公開,包括由蘭德公司、海軍戰爭學院、海軍研究生院、哈佛貝爾弗中心發布的數據,并且越來越多地出現在定期復制材料中(Pauly, 2018; Schneider, 2017)。

無論是冷戰還是現代游戲——學者們應該如何使用檔案游戲數據來思考其比較優勢、內部、生態和外部有效性以及偏見?關于設計和分析未來游戲的最佳實踐,過去的游戲可以教給我們什么?

5.1 分析存檔游戲數據

與兵棋推演設計一樣,學者的研究問題將為他們的檔案游戲選擇提供信息。在某些情況下,研究人員可能會尋求解釋特定的歷史政策或危機決定,生成假設以針對歷史記錄進行測試(Levine等人,1991),或生成歷史反事實。在其他情況下,學者可能會尋求檢驗理論。

試圖了解特定歷史決策的學者可以使用兵棋推演來研究對政策過程的投入、決策者考慮的突發事件或機構如何游說。學者們應該更加關注從業人員兵棋推演的一個關鍵原因是,許多政策制定者使用兵棋推演為規劃和決策提供信息。因此,游戲選擇將與進行游戲的歷史背景相關聯。例如,了解約翰遜政府領導下的核政策或決策將受益于他的政府成員所玩的游戲。相比之下,如果研究人員對沖突或危機的一項新技術的影響感興趣,玩家的政治立場可能不那么重要,但玩家的專業知識可能仍然很重要。

如果研究問題涉及更普遍的國家行為模式——例如威懾何時起作用、領導人何時升級或危機如何失控——選擇特定的檔案兵棋推演記錄就類似于定性案例選擇。開放式的政治軍事兵棋推演,其中玩家對一系列治國之道工具擁有自由裁量權,可能更適合回答有關戰爭原因和后果及其限制的問題或測試理論。玩家在戰場上進行戰術行動的作戰兵棋推演可能更適合測試關于戰爭行為的安全研究理論。然而,學者們必須確保他們選擇的游戲確實考慮到了興趣的變化,因為有些兵棋推演可能會排除某些玩家的行動。例如,使用存檔游戲來研究核升級問題的研究人員應該確保,他們從中抽取的游戲不會禁止使用核武器。

學者們還必須確保檔案中呈現的數據類型有助于解決他們的研究問題。例如,如果學者們有興趣解析理論的微觀基礎機制,那么某些具有良好審議數據的歷史兵棋推演是最合適的。與大型游戲甚至現實世界事件的記錄相比,小型精英兵棋通常提供非常精細的定性證據,證明玩家選擇背后的動機和邏輯。許多冷戰兵棋推演數據甚至記錄了賽后舉行的私人討論的記錄。這些參與者的反思提供了在現實世界事件之后通常無法獲得的證據。

在極少數情況下,研究人員可能會在檔案中找到旨在提出與他們自己類似研究問題的游戲。即便如此,由于兵棋推演仍然是對現實的模擬,研究人員在分析發現時必須謹慎行事。例如,玩家是否將基于結果的輸出視為對現實世界的準確表示,還是將其視為限制生態有效性的“游戲主義”?參與者是否認為她是在為贏得比賽或解決危機而競爭,可以通過對理論發展和測試產生有意義的影響的方式塑造她的行為。因此,在可能的情況下,對理論測試和機制感興趣的研究人員應收集多個檔案兵棋推演進行跨游戲分析,以揭示行為模式,盡管各個游戲在設計、背景或玩家之間存在顯著差異。

不同兵棋推演收集、報告和總結審議數據的方式各不相同,研究人員對設計選擇了解得越多越好。研究人員必須適應幾種常見的偏見。就像采訪、日記或回憶錄一樣,兵棋推演檔案記錄并不代表對事件的完整和公正的描述。相反,這些數據提供了很好的證據,必須對這些證據進行評估和三角化。為了做到這一點,學者們應該認識到原始和處理過的戰局數據之間的區別。原始數據包括游戲行動或結果的定量和定性核算,玩家討論的文字記錄,或玩家體驗的調查或訪談。原始的戰局數據比處理過的數據更不容易受到系統偏差的影響,但也會受到完整性的影響(Bartels,2020:23-25)。

與原始數據相比,處理后的數據呈現出更完整的兵棋推演畫面。已處理的數據包括游戲設計者或管理員記錄游戲設計、玩家行為、結果、結論和政策建議的游戲摘要或報告。由于其完整性,研究人員起初可能更喜歡處理過的數據。然而,處理后的數據比原始數據更有可能表現出一些關鍵的偏差。游戲報告通常是高度政治化的文件,反映了行政人員的官僚動機,這對學者事后可能不透明。事實上,追蹤誰被告知(或沒有被告知)兵棋推演結果已被證明是過程追蹤者的有效數據(Pauly,2020)。例如,Greenstein和Burke (1990[1989]: 576)發現越南兵棋推演的悲觀結論從未在1960年代提交給美國總統辦公室。

這種偏見源于許多從業者游戲由機構“贊助”,這些機構使用游戲報告來驗證現有的記錄或理論計劃或證明預算和權限的合理性。例如,空軍贊助的兵棋推演得出的結論是國會應該為更多的轟炸機買單也就不足為奇了。另一方面,經過處理的數據對研究人員仍然很有價值,因為它們可以揭示有關兵棋設計的決策:場景、裁決和主題,以及原始設計者試圖學習的內容。此外,贊助商造成的偏見為學者們提供了一個機會,可以就外交政策制定中的組織和官僚競爭的政治問題提出研究問題。

其他兵棋推演的偏見可能不是其設計或贊助,而是其玩家。研究人員必須努力了解主機和玩家之間的關系。有些人可能會引入嚴重的霍桑觀察者效應,從而破壞測試環境的生態有效性。例如,考慮海軍研究生院與印度和巴基斯坦玩家進行的危機游戲(Khan et al., 2016)。乍一看,這些模擬似乎是研究南亞升級的絕佳機會。然而,在美國東道主在場的情況下,比賽有可能變得表演性強,每個地區的核大國都不是為了勝利而努力,而是將對方視為不負責任的。因此,雖然一些游戲服務于召集和教育決策者的重要目的,但尋求檢驗理論的研究人員需要了解玩家激勵和潛在的觀察者偏見。

最后,無論是原始的還是經過處理的,許多檔案兵棋推演數據都存在解密過濾器遺漏的偏差。這個問題并不是兵棋推演所獨有的,解密偏差對兵棋推演記錄的影響并不比類似的定性來源(例如在案例研究分析中經常使用的機密會議紀要、政策審查和情報評估)更嚴重(盡管國防組織經常選擇解密兵棋推演支持他們的預算或組織優先事項)。如果玩家在私人或匿名分類錄音中更公開地講話,分類也可以提高數據質量。盡管如此,如果對兵棋推演的興趣結果影響其解密,這對學者來說是一個問題。美國兵棋記錄,即使是“藍”(美國)隊“輸掉”的那些,也可以解密,但它們在 1970 年代以后的檔案中的可用性很少。參與兵棋推演研究議程的學者必須繼續提交 FOIA 和強制解密審查文件請求。

6 兵棋推演研究議程

長期以來,國家安全從業人員一直依靠兵棋推演來制定政策。通過從現有的游戲中汲取經驗或運用自己的游戲,研究人員還可以使用游戲來測試 IR 理論——尤其是探索決策背后的微觀基礎和機制。作為一種學術探究的工具,兵棋推演有可能比其他常用方法更好地逼近現實世界決策的混亂程度,并對人類決策產生更深入的見解。研究人員可能會將兵棋推演作為獨立的研究設計,或將其納入混合方法研究設計,兵棋推演有助于彌補其他研究方法的不足。兵棋推演的核心是通過讓學者深入了解為什么會形成某些看法或做出決定,從而強調過程而不是結果。

兵棋推演為研究人員提供了一個機會來分析玩家審議中的證據,例如,來自團隊內部關于對手信號和意圖感知的對話。這可以產生關于人類如何理解他們的角色、他人的角色或解釋決策的意義和背景的見解。兵棋推演構建的社會環境還允許研究人員探索性別、身份、等級和經驗等特征如何影響團隊內部和團隊之間的互動。兵棋推演期間的互動可以揭示決策背后的機制,幫助學者研究大量實質性主題。事實上,國際關系中的許多核心概念,如威懾、危機信號和發動戰爭,都是基于決策者的決策和互動。因此,從兵棋推演中獲得的見解可以幫助研究人員以超越只關注結果變化的實證測試的方式來解讀理論。

除了使用兵棋推演對國際關系理論進行實質性研究外,學者們還可以研究政策兵棋推演對現實世界的影響。例如,未來的研究可以檢查決策者是否以及何時從政府部署的游戲中學習。五角大樓在 1960 年代的 SIGMA 兵棋推演系列以高級決策者為特色,并預言了越南的困境(McDermott, 2002; Pauly, 2018),但其結果在外交決策過程中被擱置了??。這種對兵棋推演課程的忽視有多普遍?相反,選擇性解密的兵棋推演在美國最近的公共預算和武器采購討論中發揮了巨大作用,立法者甚至呼吁更多兵棋推演來為決策提供信息(Gallagher,2020)。兵棋推演如何與組織政治互動?兵棋推演的政治化與其他影響預算或政策選擇的政治嘗試有何相似之處?研究人員可能會將檔案兵棋推演報告與過程追蹤和精英訪談相結合來研究這些問題。

然而,為了有效地將兵棋推演用于實質性 IR 研究,學者們還必須檢查兵棋推演設計和執行的各種元素是否以及如何影響其整體有效性(內部、外部和生態)以及可以從游戲中得出結論。為此,學者們可能會更深入地研究我們在本文中提出的四個命題。這將有助于學者們更好地利用兵棋推演作為其他研究方法的補充

首先,未來的項目可能會研究兵棋推演的沉浸性是否會產生不同于非沉浸性方法的行為。例如,受試者在參與兵棋推演時是否使用與完成調查時不同的決策邏輯或調用相同的啟發式方法?這對兵棋推演結果的生態和外部有效性意味著什么?而且,這能告訴我們學者們可以使用兵棋推演解決的問題類型嗎?

為此,研究人員可以求助于檔案游戲數據來研究沉浸感的影響。對 1958 年至 1964 年間在麻省理工學院舉行的政治軍事兵棋推演中的 77 名參與者進行的一項調查發現,64.9% 的參與者報告了“極端”或“強烈”程度的情感參與。Schelling 回憶說,參與者“虛擬地”進行了兵棋推演,很難在“沒有開始看起來真實或可能是真實的場景”的情況下花費這么多小時(美國國防部,1966 年,D3)。但是,雖然這些游戲可能創造了身臨其境和逼真的環境,但一些玩家也報告了表現出攻擊性的傾向(Barringer 和 Whaley,1965:440)。

如果沉浸在兵棋推演中可以提高生態有效性,我們可能會期望看到玩家在游戲中的行為與現實世界危機決策的記錄平行。檔案兵棋推演提供了幾個示例——越南、古巴、柏林危機——其中參與者在游戲中的行為與實際危機相似。如果沒有這樣的歷史驗證,研究人員可能會在幾天、幾周或幾年后詢問精英參與者,他們的兵棋推演經驗是否影響了他們在現實世界中的決策。

有一些證據表明,在玩家離開游戲環境后,他們會受到這種影響。在上述麻省理工學院的同一項調查中,56% 的“參與政策規劃、制定或實施”的玩家可以回憶起他們的兵棋推演經驗在他們的工作中具有實際價值。雖然當代數據較少,但一些參與者回憶起深遠的影響。例如,Condoleezza Rice報告說,作為國家安全顧問,她于 2001 年 9 月 11 日考慮將美國的軍事警報通知莫斯科,并向朋友和敵人解釋“美國沒有被斬首”,這是基于她的誤解和冷戰危機模擬期間的升級(Rice 和 Zegart,2018: 178)。同樣,前國防部副部長Robert Work和負責情報的國防部副部長Michael Vickers講述了網絡評估辦公室在 1990 年代和 2000 年代初期設計的一系列未來兵棋推演在制定戰略和武器采購方面發揮的關鍵作用(Krepinevich 和 Watts,2015 年)。

除了分析檔案數據之外,研究人員還可以設計和實施混合方法項目,其中包括在平行研究中與替代方法一起進行的兵棋推演。這將使研究人員能夠評估沉浸感如何影響參與者的行為和決策。最近開展了平行調查實驗和兵棋推演來解決相同研究問題的項目提供了一個有用的起點(Reddie 等人,2018 年)。例如Schneider等人(2021),發現沉浸在虛擬兵棋推演中的參與者比提供相同場景和預備閱讀材料的調查實驗受訪者對兵棋推演的理解要高得多。事實上,97.5% 的兵棋推演參與者正確回答了一個場景理解問題,而調查實驗受訪者的這一比例僅為 73%。其他研究也可能通過改變兵棋推演的結構和設置來更系統地探索沉浸感。例如,研究人員可以改變兵棋推演的時長(例如幾小時與幾天)或進行兵棋推演的物理環境,并評估決策過程或結果是否發生變化。

其次,更多的研究可以幫助學者們更好地理解在兵棋推演中專家和非專家的行為是否不同,以及如何不同。這一研究方向將直接促成關于現代實證 IR 研究中不同類型樣本效用的方法論辯論。一方面,一些學者認為,使用具有高度代表性但規模較小的專家樣本來進行較少的兵棋推演會限制研究結果的推廣程度(Reddie 等人,2018 年)。他們認為,玩多個游戲迭代的大樣本(通常是方便的)允許進行統計分析,從而克服普遍性問題并實現復制。然而,其他學者和從業者認為,便利樣本限制了游戲的結論(Oberholtzer et al., 2019)。具體而言,非專家可能缺乏做出現實決策所需的技術或政策知識,這些決策反映了現實世界中可能出現的決策。使用其他研究方法的政治科學家長期以來一直在爭論便利樣本是否足以代表更具代表性的專家樣本(Dietrich 等人,2021 年;Hyde,2015 年)。一些研究發現便利樣本和精英樣本的行為存在差異(Mintz et al., 2006 ; Pauly, 2018),而另一些研究發現精英和非精英偏好之間存在一致性(Kertzer, 2020)。

同樣,來自檔案游戲的見解提供了探索我們的第二個命題是否會影響我們從兵棋推演中學到東西的機會。驚人的“精英”使一些檔案兵棋成為很好的比較點。例如,謝林指揮了參謀長聯席會議主席、陸軍參謀長和司法部長參與的兵棋推演(Schelling和Ferguson,1988)。這些游戲可以與五角大樓嘉賓(包括名人、記者和企業高管)玩的其他檔案游戲進行比較。有興趣參與關于研究樣本的方法論辯論的研究人員可能會考慮部署兵棋推演,將專家玩的兵棋推演中的決策過程與非專家玩的相同博弈中的決策過程進行比較。

第三,未來的研究可能會通過探索群體互動是否以及如何影響兵棋推演期間的決策和行為來促進對群體動力學的研究。如果兵棋推演在生態上是有效的,那么從兵棋推演中汲取的教訓應該適用于實際的決策環境。例如,參與者是否擔心隊友會根據他們的言行來評判他們?團體是否更有可能減輕或放大個人風險傾向?團隊組成如何影響團隊動態?來自研究人員現場游戲和檔案游戲的成績單通常包括玩家相互證明他們的選擇。這些數據可以用來分析與等級、順從、戰斗、情感或性別決策相關的語言,研究人員可以探索不同的團隊組成如何影響給定游戲的多次迭代動態。

近期將兵棋推演與交互性較低的合成數據生成過程一起進行的項目為此類未來研究提供了起點(Reddie 等人,2018 年)。Lin-Greenberg (2020),發現兵棋推演團隊的決策在參與者之間的審議過程中經常發生變化。在某些情況下,參與者在與隊友討論問題后會改變立場。或者,持有特定觀點的參與者可能只是人數超過團隊的其他成員,并服從多數立場。因此,兵棋推演審議的動態性質提供了優于互動較少的研究方法的優勢,后者通常只在特定時間捕捉個人層面的偏好,使研究人員對想法如何發展和演變的了解較少。

第四,學者們應該評估基于結果的輸出是否以及如何影響兵棋推演中的行為和決策。兵棋推演專家難以區分準確反映現實世界決策的后果和可能限制從游戲中得出的結論的“游戲主義”。玩家在游戲中是否會比在實際危機中承擔更大的風險?參與者是誠實行事,還是采取行動支持雇主的機構利益?關于激勵和獎勵是否會影響模擬和實驗期間的行為的類似爭論仍未解決(Andersen 等人,2011 年;Karag?zoglu 和 Urhan,2017 年)。為了解決這些問題,研究人員可能會轉向檔案游戲,看看精英們在兵棋推演中是否承擔了與現實世界危機中類似的風險。或者,研究人員可以評估參與者的行為是否會隨著多個兵棋推演的利害關系而變化。

將兵棋推演用于 IR 學術研究仍處于復興的早期階段,但我們相信這種方法對于尋求了解如何制定外交政策和國家安全決策的研究人員具有巨大的潛力。隨著學者們探索兵棋推演作為一種探究工具的好處和局限性,我們看到兵棋推演研究令人興奮的可能性,有助于解決其他難以解決的理論和政策問題。

7 致謝

作者感謝 Valentin Bolotnyy、Amber Boydstun、Cole Bunzel、Peter Dombrowski 和 Rose McDermott 對草稿的有益評論,以及 2020 年美國政治學協會會議、喬治城大學兵棋推演協會、倫敦國王學院、海軍的研討會參與者戰爭學院和麻省理工學院,尤其是 Richard Samuels、Eric Heginbotham、Stacie Pettyjohn、Ellie Bartels 和 Andrew Reddie。Andrew Ortendahl 提供了出色的研究協助。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

摘要

記錄一個系統或集成系統內所有信息變化的出處,這提供了關于正在做出的決定和促使這些決定的重要信息。從取證的角度來看,這可以用來重新創建決策環境。然而,出處也可以為其他兩個重要功能服務。收集的數據可以支持組件的整合,而生成的圖形數據結構可以通過解釋、總結和告警來支持操作員進行態勢感知。混合戰爭將必然匯集不同決策支持能力,因為決策者必須在多個戰爭領域運作。自主代理將可能在計劃和執行過程中發揮作用,有時能夠在沒有人類干預的情況下做出決定,但人類決策者必須意識到這一點。事實證明,證據圖可以轉化為修辭結構圖(RSG),使代理能夠用自然語言甚至多模態交流,向人類解釋他們的行動。證據還被證明可以加強對計劃執行監控,并可用于向人類或自主代理提供通知,當計劃中使用的信息發生變化時,可能需要重新考慮計劃。隨著我們朝著智能機器在復雜環境中支持人類決策者團隊的方向發展,跟蹤決策及其輸入的需要變得至關重要。

引言

出處是關于實體、活動、代理以及這些概念之間關系的信息[1]。這些信息不僅僅解釋了發生了什么,它還回答了關于實體如何被操縱、何時發生以及誰參與了這個過程的問題。我們很可能熟悉關于追蹤藝術作品出處的新聞和虛構的故事。任何實體的創造、破壞或修改的出處都可以被追蹤。在本文中,我們將重點討論軍事系統內的信息。在指揮與控制(C2)內,信息出處對于記錄行動背后的決策過程是必要的,特別是當自主和人工智能(AI)代理深入參與時。參與某一過程的 "誰 "可能是人類或人工智能代理。

信息出處有幾個目的。在取證方面,出處追蹤提供了參與決策的人和代理,以及數據是如何演化為該決策的。美國公共政策委員會指出,數據出處是算法透明度和問責制的一個明確原則[2]。完整記錄的出處可以闡明數據的依賴性、責任流,并幫助解釋為什么采取某些行動。隨著人工智能和自主代理繼續自動化進程,它們在做出關鍵決策時已變得更加不可或缺[3]。

圖1 PROV-DM模型。
付費5元查看完整內容

本文是《第 14 屆北約運籌與分析 (OR&A) 會議:新興和顛覆性技術》上的重要文章,介紹了從手工兵棋推演到桌面兵棋推演,再到數字兵棋推演,到智能兵棋推演的整個開發過程,值得一讀

摘要

作者描述了他們在瑞士國防裝備采購局科學和技術部(armasuisse Science + Technology)的技術前瞻研究計劃,也稱為 DEFTECH(DEfence Future TECHnologies,國防未來技術),應用各種兵棋推演相關方法的經驗,以識別破壞性技術趨勢,評估其在軍事背景下的影響并向瑞士武裝部隊通報可能的機會和威脅。

這包括一個從 2017 年開始并仍在進行的迭代過程,其中不僅創建了一個開放平臺,而且還舉辦了幾次國際研討會。應用的方法包括更高聚合級別的矩陣式兵棋推演、受北約破壞性技術評估游戲 (DTAG) “系統卡理念(Idea of System Cards)”啟發的紅隊成就,以及講故事的方法。

對技術的特別關注最終促進了一種名為“新技術戰爭”的戰術桌面兵棋推演平臺開發,該游戲可商用。作為一個平臺構建的互聯網組件允許感興趣的利益相關者之間進行交互,這些利益相關者希望模擬其他技術或場景并將其提供給社區。集成多智能體模擬、決策支持、人工智能和視頻游戲的數字化游戲正在開發中。

作者介紹了過去研究的結論,包括不同的設計理念、確定的優缺點、最佳實踐、當前的發展和愿景。

1 引言&背景

你通常期望從一個關于技術預見的研究項目中得到的肯定是關于在給定的時間范圍內可能出現的技術分析報告。根據你的考慮,那個時間范圍可以是近的,也可以是遠的。這似乎是一個合乎邏輯且直截了當的答案,而且確實如此。但是,請稍等片刻,問問自己:你是對技術本身感興趣還是對它們將提供什么感興趣?它們將如何影響你的作業方式以及它們可能代表哪些機會和威脅?在這個階段,甚至更進一步,問問自己,你真正感興趣的是機會、威脅,以及它們所代表的東西,還是它們代表你?這種差異并不是軼事,因為它意味著從更具描述性的可交付成果轉變為與你個人產生共鳴的事物。實現這一目標的最佳方式是產生獨特的體驗,與你的感官互動,以便你可以在需要時參考它。

我們處于國防環境中,正常的預期交付成果將是一份專門針對技術領域的報告。因此,包括一些故事講述在內的敘事工作可能是向讀者傳遞經驗的一種方式。不幸的是,這種體驗可能只停留在情感層面。讓人們玩弄技術可以實現的東西,并在給定的場景中體驗他們決定的后果肯定會帶來更多的見解。

然而,在之前還有一個額外的挑戰:我們想要試驗的要素還不存在。因此,我們必須模擬它們,而不是簡單地測試它們。帶著想法和感受而不是價值觀,為了提供必要的數學模型來轉向模擬世界。正是在這一刻,我想到了“游戲”。但是怎么做?用什么做?和誰一起?在哪個級別?多久?在不知情的情況下,我們打開了潘多拉魔盒,其中包含我們必須考慮構建游戲環境的可能性和替代方案。

這里報告的是一個原始的嘗試,不僅展示了已完成的工作,還展示了在此過程中以一種或另一種方式參與的不同利益相關者的動機。過去,現在,將來;每個人都在我們今天的位置和明天的位置中發揮了重要作用。現在看起來很明顯的要素在開始時并不是這樣的;未來可以實現的目標肯定需要今天的奮斗。

2 Deftech兵棋推演項目

該項目是 armasuisse Science + Technology 技術前瞻研究計劃的一部分,也稱為 Deftech - 國防未來技術。該計劃的任務是識別顛覆性技術趨勢,評估其在軍事背景下的影響,并向瑞士武裝部隊通報其可能的機遇和威脅。

該計劃于 2013 年開始,由中央協調并由年度預算支持,以執行不同的項目。鑒于其特殊性,Deftech 的愿景是通過協同效應進行預測。多年來,在前瞻性方法、信息的表示和可視化、開源情報 (OSINT) 的利用、科幻小說的使用、最近側重于使用技術的兵棋推演以及對社會接受(或不接受)雙重用途技術應用的理解。

鑒于該計劃的協作性質,大部分活動及其成果可在專用互聯網平臺 (//deftech.ch) 上獲得。

新技術的主要挑戰之一在于評估其未來影響并創造洞察力,這對軍事作戰員和指揮官來說都是切實可行的,對軍事規劃人員和系統開發人員來說也是可行的。由于兵棋推演是基于人類互動的演習,因此當應用于技術環境時,它有助于在潛在軍事用戶定義的動態和有爭議的作戰環境中實現新興技術。這允許探索潛在的技術實施及其影響。因此,技術分析是兵棋推演在國防環境中的主要應用之一。

這形成了認知興趣以及我們選擇的方法論方式的起點,這將在以下部分中進行描述。

3 技術型兵棋推演——第一次迭代

2017 年,我們首先為 2035 年的瑞士進行了一場技術兵棋推演。在這個框架中,我們專注于三個不同的子場景,它們描述了潛在但最典型的安全挑戰。根據 armasuisse 的“DEFTECH 雷達”() 描述的預選未來技術,在兵棋推演中提供給玩家,以便他們可以在行動過程中根據需要靈活使用。

游戲設計的靈感來自于 Engle 的矩陣游戲理念,因為它具有探索性的方法以及在設計和執行過程中的靈活性。在我們的案例中,我們開發了一個雙邊桌面研討會游戲,每個回合都有計劃周期,之后雙方交替執行他們的行動。在每一個回合中,雙方各有四名參與者,討論了他們行動的預期效果,并描述了為此問題應用的技術,由主持人主持。基于該討論,主持人為行動分配了成功概率。隨后通過擲骰子來確定實際結果,以將隨機效應整合到交互中并保持游戲繼續進行。

根據我們的設計,游戲依據玩家的決定、技術應用、討論的論點和確定的結果創建了一個連續的敘事。分析的洞見來自于敘事本身、分析者的觀察和玩家在對方不斷的對抗和反制下討論并努力創造效果的投入。此外,記錄在案的敘述、分析師的筆記和最具爭議的話題為后續研究提供了各種小插曲和假設。

除了這些結果之外,我們還發現了我們設計的一些挑戰和缺點:首先,一般來說,兵棋推演提供了探索性見解,但由于開放的人機交互,以逃避可復制性為代價。更重要的是,應用技術的物化和與系統的集成構成了主要挑戰,尤其是高水平的集成。為了減輕赤字,我們改編了北約顛覆性技術評估游戲 (DTAG) 中的元素,即所謂的“系統理念”(IoS)。

要創建IoS,首先要確定相關的未來技術。在第二步中,IoS卡牌是在一個研討會上以給定的卡牌格式制作的,即將一種或多種選定技術與特定設備相結合,以運行新的潛在系統。此類 IoS 卡牌可以單獨使用(即記錄如何將相關技術應用于未來軍事系統的見解和想法)或作為上述進一步技術兵棋推演的輸入。我們于 2018 年在 armasuisse 的一個研討會上執行了這一步驟,其中有幾個工作組,最多 8 人,他們首先必須針對特定場景和要實現的目標提出一兩張 IoS 卡牌。之后,兩個小組配對并通過順序結構化的討論在紅隊努力中相互挑戰他們的 IoS 卡牌。第三步,包括使用 IoS 卡牌進行的以技術為中心的兵棋推演及其相關分析,可以按照上述兵棋推演的描述執行。作為經典兵棋推演的替代方案,IoS 卡牌還可以用作游戲和計算機模擬的建模輸入,以分析假設的未來操作環境中的基礎技術,如下所述。

圖 3-1:初始兵棋推演的游戲輸入和執行

4 大轉變:走向桌面兵棋推演

分析情況后,我們得出了一個顯而易見的想法,即為了了解通過新技術集成實現的新產品影響,我們需要在它使用的級別上對其進行模擬。在我們的案例中,這意味著從戰略層面轉移到戰術層面,其中必須為每個系統定義保護、殺傷力、機動性等參數的值。由于重點是理解這些系統提供的潛在破壞,我們必須具有輕松更改這些值的靈活性,以查看哪種組合將允許戰術破壞或簡單優勢。

讓我們考慮一下外骨骼的例子。愿景是裝備一些步兵,使他們能夠更快地移動,攜帶更多的重量(保護?彈藥?),減少身體疲勞和受傷等。每個參數的大問題是“多少?”。使士兵能夠攜帶 80 公斤而不是 50 公斤可能會提供優勢,因為這可能意味著在特定情況下提供更多的保護或更多的彈藥,但是專注于開發這樣的系統是否足夠重要?如果你可以攜帶 800 公斤而不是 80 公斤呢?

因此,為了激發交流和討論,游戲必須能夠輕松模擬這些變化并激發圍繞它們的討論。目標不是取勝,而是了解這些未來系統在給定戰術場景中的優勢和劣勢。考慮到所有這些,桌面游戲的選擇作為一種解決方案。

然而,為了在半天的過程中整合“游戲”部分,以便在模擬之前展示新系統,我們提出了以下先決條件:

(1) 游戲將圍繞“藍對紅”場景。

(2) 用戶手冊應該足夠簡單,以便初學者能在 15 分鐘內開始玩起。

(3) 一場比賽的持續時間必須最長為 60 分鐘,以便在半天的時間內測試不同的選項。

(4) 游戲必須足夠模塊化,以允許引入新的未來技術/系統以及新場景,以適應不同利益相關者的興趣和關注點。

在開發過程中,我們直接讓瑞士武裝部隊,即軍事理論和未來規劃團隊參與場景的定義以及未來技術的選擇。我們一起確保我們從藍方模擬的一切都尊重日內瓦戰爭公約。我們與專家驗證了各種技術參數,以確保至少在第一次迭代中,我們將使用可以在未來幾年內實現的價值。

考慮到這些要求,我們開始了將成為“新技術戰爭”(NTW)兵棋推演平臺的旅程。

4.1 讓它變得簡單的挑戰

大多數桌面兵棋推演,其中最成功的商業游戲,都針對最廣泛的現實主義。由于精確的游戲機制和夸張的細節,您通常會以犧牲簡單性為代價來實現這一點。很少看到最少少于 30 或 40 頁的規則手冊。對于我們的開發,我們必須顛倒范式,拿出一個 4 頁的手冊來盡可能準確地模擬,要盡可能簡單。

因此,我們從需要開發一款能夠以簡單且非常靈活的方式采用當前瑞士學說的游戲原則開始。靈活,因為我們必須能夠細化游戲的參數,才能清楚地看到對這些參數有影響的新技術效果,而且僅限于那些參數。

圖 4-1:以新技術和系統為重點的桌游“新技術戰爭”的表示(標題“用明天的系統挑戰今天的戰術”總結了我們通過玩這個嚴肅的游戲試圖強調的內容)

在這個階段,桌子周圍的所有玩家都應該開始更好地理解新系統可以在特定的戰術情況下帶來什么。比僅僅閱讀有關它的報告要好得多。然而,還有一個懸而未決的問題我們還沒有真正解決:作為防御者或攻擊者,有沒有一種特定的方法可以使用這個新系統來完成分配的任務?

要回答這個問題,您需要考慮在給定場景中使用新系統的所有可能方式。為此,您需要探索數字世界。

5 從桌面到數字

我們決定將兵棋推演轉移到數字世界,而不是讓它在屏幕上播放,而是為了獲得關于如何以最佳方式使用新系統并挑戰當前戰術程序的更多見解。為了實現這一愿景,我們開始研究以下三個主題:

(1) 我們可以從生成藍色與紅色場景的所有可能結果中學到什么?

(2) 人類可以從與人工智能 (AI) 的兵棋推演中學到什么?我們該怎么做?

(3) 我們可以向人類玩家呈現什么類型的信息,以使人類加 AI 比單獨的 AI 更好?你如何將信息呈現給玩家?

5.1 模擬所有的結果

在任何重要的兵棋推演中,可能的結果數量都非常龐大,以至于人類無法靠想象探索和分析它們。在專注于創造學習效果的訓練兵棋推演中,無法探索整個結果空間可能無關緊要,但如果你將其用于開發新條令、測試作戰概念和評估戰術決策,則具有至關重要的意義。在這些情況下,你需要區分什么是可能的、合理的或可能的。

如何克服這一挑戰?多虧了所謂的多智能體模擬。由于計算機比人類玩得更快,多智能體模擬可以系統地探索游戲結果的整個空間并確定最佳行動方案,從而產生合理的游戲結果。

5.1.1 多智能體模擬

桌面游戲等基于規則的系統可以直接轉化為模擬:游戲規則和游戲環境(如地形和時間)被編碼為計算機模型,逐漸向前成型,同時玩家互動的結果被記錄為模擬世界的新狀態。

多智能體模擬是城市、金融交易或軍事行動等現實世界系統的數字雙胞胎。為了構建多智能體模擬,首先生成合成種群。這是感興趣系統的靜態快照,包括個人的社會人口特征和行為以及社會技術環境。然后使用模擬技術根據行為規則和環境約束對合成種群進行動畫處理。然后對模擬進行校準,以產生盡可能與感興趣的真實世界變量在統計上無法區分的輸出。這種經過驗證的模擬不僅有助于探索游戲結果的范圍,而且有助于診斷、預測和預見。

5.1.2 兵棋推演仿真

構建和運行我們的“新技術戰爭”(NTW)的多智能體模擬涉及以下步驟:

(1) 熟悉NTW:玩幾輪NTW,學習游戲,了解規則。

(2) 構建NTW模型:根據規則手冊、其他資料和對NTW的主觀理解,包括選手、裝備、規則、地形等。

(3) 將模型編碼為多智能體模擬:編寫軟件來近似游戲“物理”,例如游戲板的數字化版本;描述由每個場景的系統、效應器和平臺組成的軟件包;為智能體定義任務目標,并為智能體配備強化學習行為。

(4) 模擬的驗證:手動回合的游戲結果是手繪草圖的(見圖 5-1,左)。藍色和紅色虛線表示人類玩家在游戲中如何移動藍色和紅色軍事單位。藍色和紅色的點表示射擊位置。藍色和紅色實線表示火力線。然后將手繪草圖數字化(圖 5-1,右);運行了 1,000 次 NTW 模擬,結果以類似于手繪草圖的格式自動繪制出來(圖 5-2)。最后,通過為圖像識別開發的機器學習算法將手動游戲結果與模擬游戲結果進行比較。

(5) 創建一個基礎設施來運行實驗:以探索游戲結果的空間并確定最佳行動方案。這包括產生 10,000 次模擬運行。

圖 5-1:兩個人玩游戲的手繪草圖結果與數字化版本

圖 5-2:模擬游戲結果的可視化表示

5.1.3 結果分析

正如一開始所假設的那樣,模擬可以探索合理的游戲結果的整個空間。我們并不打算重現特定的游戲結果,而是想知道為多智能體模擬提供動力的人工智能是否具有產生超越人類想象和游戲的合理結果所需的屬性。首先,我們發現模擬確實產生了人類玩游戲的結果。這些在圖 5-3 中的棕色簇中顯示為紅色十字。點云代表 1,000 個模擬游戲。其次,通過機器學習對游戲結果進行聚類,出現了三個不同的群體。這張圖的意義就很明顯了:模擬玩游戲并產生人類玩家沒有想到的合理結果。這些都是藍色和綠色集群中代表的所有游戲。

圖 5-3:以點云表示的 1,000 個模擬游戲結果(游戲分為三個不同的組。現實世界的游戲,在點云左側被描繪為紅色十字,僅類似于棕色的游戲集群。游戲以藍色和綠色的簇是模擬玩的游戲,但不是人類玩家想象的。點之間的距離代表游戲的兩個數字表示之間的差異,如圖 5-2 所示)

5.1.4 我們能學習到什么?

人類玩的游戲表明 BLUE 可以贏得大約 40% 的 NTW。相反,模擬表明,考慮到完整的結果集,而不僅僅是人類迄今為止所玩的結果,BLUE 獲勝的機會要低得多,約為 3%。微調BLUE的強化學習參數后,BLUE的勝率沒有超過10%。因此,模擬表明人類可能對獲勝過于自信。這可以通過最初不知道玩游戲的其他可能性來解釋。人類鎖定在狹窄、熟悉的模式中;而模擬沒有。模擬有助于確定最佳行動方案,而不會成為我們自己認知缺陷的犧牲品。

通過與數字冠軍比賽來消除認知偏見是為 NTW 開發兩種人工智能(一個玩 RED,另一個玩 BLUE)追求的目標。

5.2 使用人工智能增強作戰戰術

現代基于人工智能的智能體不僅在提供信息的能力上優于人類,而且在受控情況下做出決策的能力也優于人類。這意味著:在一個具有給定規則和行動的微型世界中,IT 系統不僅為決策提供背景,而且能夠自行決定。如果可以將決策任務放入這樣一個簡化的世界(通常以游戲的形式),那么量身定制的 AI 通常可以幫助選擇正確的動作。所描述的設置幾乎包括所有戰略游戲,例如國際象棋、圍棋、將棋、Hex 等,AI 玩家可以毫不費力地擊敗人類世界冠軍。

這項技術突破的核心在于通過數十億次模擬訓練人工智能的想法。每一次輸贏都會被記錄下來,每一步都會改進人工智能。不僅向決策者提供了一個模擬,而且一個 AI 會運行盡可能多的合理案例,并選擇最有可能產生最佳結果的行動。經過足夠多的迭代后,這個過程產生了在幾乎所有戰略游戲中超過人類大師能力的奇妙動作。

5.2.1 “新技術戰爭”模式下的兵棋推演

NTW 游戲是與軍事專家密切合作設計的。它是一個簡化但現實的模型,用于在各種現實世界的戰爭場景中進行決策。玩家面臨典型的軍事沖突情況,必須決定戰略和戰術以達到他的軍事目標。當然,玩家可以在他的想象中運行有限數量的場景(模擬),并根據經驗、可用數據和模擬采取最佳行動。然而,已經為許多其他游戲建立了訓練 AI 智能體的方法,以達到超人的表現。 NTW 采用基于人工智能的方法,旨在學習軍事戰術和戰略。一旦在游戲規則范圍內達到令人滿意的表現,游戲的結構可能會被擴展,以更準確地捕捉現實戰爭。示例包括添加未來的武器、詳細說明其屬性、合并具有不同目標的其他智能體等。

5.2.2 策略游戲的AI架構

就策略游戲 AI 玩家的開發而言,兩種尋找最佳策略的方法可以被視為標準。我們將在下面詳細描述這些方法。

首先是經典搜索,其中 AI 玩家嘗試模擬盡可能多的游戲狀態,然后選擇最好的模擬。這種方法可以被描述為蠻力,因為它的最終目標是嘗試所有可能的游戲狀態并遵循導致勝利的決定。在實踐中,窮舉搜索通常是不可能的,因為即使是簡單的游戲也會很快破壞最強計算機的能力。國際象棋中合理的游戲狀態數量估計在 1040 左右,這個數字遠遠超出了計算機模擬的范圍。因此,并非所有狀態都被分析,但人工智能限制了足夠數量的合理結果。搜索由兩個關鍵參數量化。分支因子衡量對手玩家在當前決定下可以采取的合理行動的數量。搜索深度定義了模擬了多少后續動作。對于國際象棋,典型的分支因子約為 3,即對于每一步,通常考慮三個回復,并且深度最多為 80 步。一旦達到最大搜索寬度(由分支因子給出)和深度,定制的評估就會測量結果的質量。實現這種方法的常見 AI 算法是所謂的 AlphaBeta 搜索。值得一提的是,在商用智能手機上運行的實現 AlphaBeta 的公開國際象棋程序(例如 StockFish)比人類世界國際象棋冠軍要強得多。

雖然 AlphaBeta 在分支因子和搜索深度不太大的情況下非常成功,但當這些指標增加時它很快就會失敗。由于搜索練習的指數性質,即使增加一個單位的深度也會將計算機所需的容量乘以分支因子。因此,不能通過簡單地選擇更好的計算基礎設施來解決這個問題。

在游戲中做出決策的第二種也是更現代的方法,明確地解決了 AlphaBeta 搜索的弱點,可以被描述為定向搜索。已經提出了各種架構,但基本設置如下。兩個深度神經網絡 (DNN) 用于決策。第一個是評估性的,因為它衡量質量。第二個 DNN 通過估計合理行為的概率來指導搜索。與 AlphaBeta 相比,此方法更關注決策的可能和相關后果,而不是盡可能多地檢查。這種類型的搜索算法總結在首字母縮略詞 MCTS(蒙特卡洛樹搜索)下。近年來,MCTS 搜索算法在包括國際象棋、圍棋、Chogi、Hex 在內的許多游戲中都優于 AlphaBeta 搜索,并構成了當前最先進的技術。

5.2.3 AI 在“新技術戰爭”中的應用

與國際象棋相比,NTW 的特點是分支因子明顯更大,但同時搜索深度更小。分支因子大致反映了合理動作的數量。在 NTW 的情況下,可能有多種類型的動作,包括移動、攻擊和響應動作。此外,在 NTW 的每一輪中,玩家的所有人物都可以行動,而國際象棋則只有一個人物移動。這個結果是一個通常從 50 到 100 的分支因子。另一方面,NTW 對每個場景都有一個有限的深度,標準深度是 12,這比國際象棋要小得多。

由于 AlphaBeta 或 MCTS 框架中的大型分支因子,現成的 AI 無法訪問 NTW,但必須開發定制方法。該游戲的一個特殊之處在于響應動作的可能性,它打破了上述策略游戲的標準移動順序。總而言之,NTW 需要一個 AI,它是為游戲的特定結構量身定制的,并且必須在定制的工作中進行開發。我們的團隊目前在 PyTorch 開源 AI 框架(由 Facebook)中實現了一個實驗性 AI。這些實驗是用多個智能體進行的,以測量它們在 NTW 上的性能。智能體可以通過 Web 界面與人類對戰(見圖 5-4)。

圖 5-4:數字化NTW游戲的Web界面,允許人類玩家挑戰為該游戲訓練的人工智能。

5.3 士兵的數字同伴模擬

此時,擁有有關游戲所有可能結果的數據以及能夠玩游戲的人工智能,我們應該能夠幫助玩家獨立于情況做出最佳決策。我們知道在現實生活中會有所不同,但我們仍然有興趣模擬的“數字同伴”可能是什么,并更好地了解玩家在玩游戲時的認知偏差是如何出現的。為此,我們開發了一個簡單的 NTW 視頻游戲。

玩家將在戰場上化身為一名士兵。挑戰在于處理為棋盤游戲創建的一些初始情況,并將其解決方案轉化為教學敘述。我們的目標是為使用新技術提出的問題提供額外的視角。

這些敘述將始終要求玩家找到 NTW 中現有新系統的最佳用途,即無人機系統、外骨骼、武裝運送機器人和醫療后送機器人。呈現士兵的同伴的游戲交互將支持和評估玩家的表現。

由于智能手機已經可以被視為我們的日常伴侶,因此該游戲是為 Android 和 Apple 設備開發的。

5.3.1 任務創建過程

雖然棋盤游戲任務定義了初始情況,但我們將使用多智能體模擬提供的數據來定義有限數量的游戲進程(例如完全成功路徑、混合成功路徑、失敗路徑)。這些數據將形成由不同分支組成的敘事樹。這些分支點將構成在任務期間呈現給玩家的行動選擇。

5.3.2 一般游戲玩法

選擇任務后,會描述其情況,并附有敘事說明。然后向玩家提供一個選擇(例如前進/激活外骨骼/等待)。根據所選擇的選項,將呈現下一個情況,然后再次出現另一個選項。重復此序列幾次(參見分支點)后,將顯示任務結果。首先將要求玩家選擇(從有限的選擇中)其決策背后的原因。這些數據將被發送到分析服務,以便之后進行解釋。

最后,玩家的選擇將以圖形方式呈現,并附有基于理想路徑的批判性評論。目標是讓玩家了解自己的錯誤。一旦任務成功完成,一個新的任務將解鎖并變得可玩。

5.3.3 有同伴的特定游戲玩法

在第一個任務中,玩家/士兵將不得不僅根據他們的判斷做出決定。同伴只會在場評論游戲中描述的情況,提供正在進行事件的全局信息并提供行動后評論。

只有在完成幾次任務后,同伴才會開始建議最佳路徑。這種游戲機制的目的是讓玩家慢慢習慣于在決策過程中獲得幫助。

但是,對于最后的任務,同伴會開始提出錯誤的選擇,如果被玩家跟隨,則會導致任務失敗。敘事方法將通過敵人對同伴的攻擊來證明這一點。

借助通過數據分析服務檢索到的游戲數據,該游戲機制將衡量一旦習慣了相關建議,即使該信息明顯錯誤,也傾向于盲目遵循同伴指示。這說明即使是你忠實的數字同伴也可能受到網絡威脅!

圖 5-5: The Soldier’s Digital Companion 截圖

6 總結與展望

最初選擇的方法,IoS 卡牌研討會以及兵棋推演本身,因其互動性和參與者的參與度而脫穎而出。造成這種情況的一個主要原因可能是他們的探索性特征與敵對元素相結合,以挑戰對方的意見、決定和解決方案。除了研究本身,這些活動還為社區內的社交和傳授新技術知識提供了一個平臺。

? 兵棋推演可以幫助展示基于情景作為操作框架的技術影響。它可以展示人類,無論是友好的還是敵對的,在未來如何應用技術。

? 兵棋推演技術支持探索。盡管幾乎不可能重現已執行的兵棋推演過程,但它可以幫助確定進一步分析的起點,并打破主流或過早的觀點,因為它具有對抗性。

? 然而,兵棋推演需要時間來執行,并且不是適合所有目的的正確方法。這尤其適用于不包括人類決策和選擇但側重于物理效應和可能性的技術研究主題,技術實驗、計算機模擬等可能更適合這些主題。

在這一點上,我們結合桌面游戲和基于計算機的分析(如上所示)的方法完成了未來分析的工作。基于游戲的分析有助于深入了解人類行為,無論是作為未來技術的潛在用戶還是個人,都受到對手對技術的創新使用的挑戰。

具有數千次運行的多智能體模擬通過底層游戲機制優化行動過程,來縮小由人類交互和人類偏見造成的時間限制差距。誠然,這強調了整個建模和仿真過程中有效性和驗證的緊迫性。

總而言之,似乎方法和工具的組合將產生最可靠和最有用的結果。結構良好的程序化方法與混合工具包相結合,可確保利用不同方法的優勢并減輕甚至消除弱點。此外,方法學的混合和迭代過程為軍事能力管理領域的深遠決策提供了必要的三角測量。

我們仍處于冒險的開始階段,在我們能夠概括結論并驗證某些直覺之前,仍需要在許多方向上進行努力。這將是一個激動人心的旅程,似乎是構建混合的物理和數字生態系統。它的相互作用將使我們能夠更好地理解和預測新技術在未來或其他方面可能發揮的作用。

致謝

本文總結了自 2017 年以來發生(現在仍然如此)的眾多活動和思考。本文的匯編得益于以下人員的工作和貢獻:Helvetia Games SA 的“新技術戰爭”(Pierre-伊夫·弗蘭澤蒂); Scensei GmbH(Armando Geller 和 Maciej M. Latek)的多智能體模擬; Istituto Dalle Molle di Studi sull’Intelligenza Artificiale(Oleg Szehr、Claudio Bonesana 和 Alessandro Antonucci)的人工智能; Oni3 SNC(Matthieu Pellet、Seiko Annie Rubattel 和 Nicolas Schluchter)制作的“士兵同伴”視頻游戲; Longviews (Gabriele Rizzo) 的遠見和方法論討論; IABG mbH(Matthias Lochbichler、Sibylle Lang 和 Philipp Klüfers)的初始技術兵棋推演和 IoS 研討會。

附34頁PPT

付費5元查看完整內容

摘要

基于人工智能 (AI) 實現的軍事情報(MI)自動化,在許多方面拓寬了情報收集程序和分析功能范圍。在當今的數字化世界中,每分鐘都以指數方式產生數據。世界各地的情報機構正在體驗新的信息維度,而這些信息在過去由于人類處理龐大數據集的能力有限而被忽視。人工智能/機器學習 (ML)的發展帶來了一種革命性的方法,可以收集大量數據并使用 ML 算法進行分析,從而為非戰時時期和戰時戰略、作戰和戰術指揮官生成各種情報信息摘要。為了應對傳統和非傳統威脅,基于機器學習的軍事情報數據收集和分析,將通過有監督、無監督、強化和深度學習方法進行,其中自動化程度通過人在回路和人在回路之外的方法確定。這些 ML 工具將有助于開發系統框架,能夠通過自適應學習技術感知和響應運行環境,從而從其經驗中學習,根據以前的學習和經驗適應不斷變化的環境。結合智能安全傳感器、監控無人機、地球觀測衛星、電子和虛擬源監控系統,可以增強軍事情報信息收集系統。數據分析和數據融合可以在信息源收集、存儲與處理、融合與分析、數據共享4層框架內,通過回歸、分類、時序分析、聚類分析、主題建模、協同過濾和關聯規則等方式進行。軍事云網絡和物聯網 (IoT)可以增強數據共享。與其他武裝軍種、相關部委、工程大學和商業利益相關者合作,將有助于制定未來的策略指南、研發、ML 算法開發計劃以及為各種基于 ML 的 MI 平臺和應用程序生產兼容的硬件。

1 引言

軍事情報 (MI) 是收集、解釋和向軍事指揮官傳播信息以協助其決策的過程。它研究廣泛的作戰環境,分析各種參與者,同步相關信息并監控非戰時、戰時正在進行的事件。隨著技術的進步,多源數據呈現多倍和多維度增加。這些數據來自戰略、作戰和戰術層面,包括政治、軍事、經濟、社會、商業、媒體和多背景職業人員。情報分析人員經常面臨從大量信息中得出適當結論的復雜任務。從可用數據中得出的假設不能被認為是結論性的,因為它無法通過最大程度收集的信息源進行驗證。由于生成的信息在時間和空間上是動態的,隨著形勢變化而快速演變;從一組信息中得出的結論通常需要驗證,由于處理如此大量的數據和信息的限制,有時甚至在給定的上下文中排除了驗證。此外,需要通過與其他來源的各種相關性分析,定期檢查來源的真實性,這對從這些信息中得出的假設有明顯的影響。

不可否認,由于各種來源的數據生成激增,在信息的收集、分析和相關性評估方面將有很大的改進空間。在收集和分析過程中使用人工智能 (AI) 和機器學習 (ML) 可能是未來最有效的方法。許多技術先進的國家正在用AI/ML改造他們的智能系統。因此,需要評估機器學習是否可用于情報信息的收集和后續分析,處理非戰時、戰時的海量數據流,以獲得戰場環境和當代全球形勢最準確的結論性圖景。

軍事情報是一個動態過程,這是由于各種參與者無處不在的活動,他們產生了連續的數據流。對數據進行評估和分析,將數據分發給利益相關者,采取適當的行動并監測相應的影響,這些都是不可分割的過程,可以通過機器學習系統驅動的自動化進行。此外,通過 ML 系統可以提高和更有效地運行指揮、控制、通信、計算機、情報、監視和偵察 (C4ISR) 系統的功能,其中集成系統可以從環境中學習,并根據迭代學習過程提出評估方法。因此,可以將軍事情報、偵察和監視集成在一個綜合指揮系統下,通過機器學習可以拓寬軍事視野。

2 軍事情報過程中機器學習模型的概念化

Shu-Hsien 等人(2003 年)強調了基于知識的未來軍事情報規劃系統架構。已經討論了許多應用 ML的系統架構和系統配置,其中介紹了自動和半自動分析方法的過渡。此外,還討論了一個具有假設系統實施策略的典型模型。

Prelipcien 等人 (2010) 強調了可用于分析和決策行為模型的各種 AI 算法。簡要介紹了神經網絡的應用、泛型算法、模糊邏輯和專家系統。一些模型描述了神經網絡可用于模式識別但在決策應用方面存在不足。泛型算法具有對環境動態適應的自學習原理,可廣泛用于開發多種決策方案。模糊邏輯被推薦用于基于輸入和期望輸出之間關系的決策規則。它有助于機動計劃和兵力分配,但缺乏具體的判斷決定。專家系統是基于知識規則進行識別和確定特定情況下的行動時間。并重點討論了各種算法模型設計的 ML 應用。

Dijk (2019) 在他之前關于國防應用中的 AI 和 ML 的會議上,為軍事情報分析方法編譯了許多 ML 模型。與實現研究目標相關的方法是無人傳感器和系統、使用 ML 方法對無人機進行聲學檢測、通過無人機系統進行態勢感知、可見光和熱光譜范圍內的視頻監控、用于視覺識別的神經網絡、用于行為識別的深度學習,提出了用于危險分類、信息提取和語義世界建模的深度神經網絡模型,和基于對象的深度學習多光譜圖像融合方法,應用于軍事情報分析。

Ahmed (2019) 強調了人工智能在孟加拉國 (BD) 武裝部隊監視領域應用的重要性。詳細闡述了 AI 實施路線圖架構,可用作探索預期目標的初始參考方案。調查已用于基于ML進行軍事情報分析框架的意見和指南。

Mitchell 等人(2019 年)討論了情報周期元素之間的相互聯系,并列舉了如何將 ML應用于情報周期的各個階段。通過人工智能實現自動化,所有情報機構都可以利用潛在的工作時間,這為情報機構在量化價值方面的效率加速程度提供了深入的見解。這為情報主體在情報過程中應用數學模型時的效率提供了定量比較。

中國(2017)強調了潛在的通用技術、支撐平臺和未來人工智能產業,以開發智能計算技術,用于未來人工智能驅動的重大科技項目。重要的是要發現知識計算技術是建立在自適應機器學習和分析推理技術之上的。其中,關鍵群體智能技術、跨媒體分析推理技術、知識計算與服務技術、混合增強智能架構、智能自主無人系統、智能虛擬現實技術、智能計算芯片與系統、自然語言處理技術,已成為探索未來軍事情報分析的重要創新。大數據智能理論、跨媒體感知理論、混合與增強智能理論、群體智能理論、自主協調與控制、優化決策理論、高級機器學習理論、類腦智能計算等學術研究發展規劃理論、群體智能理論和量子智能計算理論已被預測為 ML 應用于情報分析的指導學術話語。這些將通過機器學習為未來的軍事情報分析構建基于知識的架構。這些是基本的學術指導方針,持續發展將為 ML 用于軍事情報分析創建研發計劃。結合這一理論框架,Haridas(2015)提出了用于國家和軍事情報收集的大數據分析,基于大數據分析的情報可以為決策提供必要的支持。ML 被用作情報大數據分析工具,通過該工具可以實現威脅警報、社交媒體監控、信息挖掘、文檔分析和網絡安全監控。討論了基于大數據應用的情報收集系統的概念布局,其中可以對來自多個收集源的各種信息數據進行實時高級分析,以提供態勢感知、決策制定和戰斗評估。這些都為今后的研究和開發提供了較為詳細的理論概念。

Michael O'Hanlon (2019) 預測未來 20 年軍事技術將發生顯著變化,他專注于軍事技術的未來趨勢。在四類技術突破中,第一類是收集與軍事行動相關數據的傳感器,第二類是處理和分發這些數據的計算機和通信系統。預測了 2020-2040 年關鍵可部署技術的預計進展,其中顯示了傳感器和其他通信系統的部署概率。它對情報采集源、通信和信息處理技術的未來發展做出了清晰的預測。 Connable (2012) 強調了各種形式和格式的情報數據融合過程,并介紹了融合過程對于相關國家和國際參與者分析未來復雜環境的重要性。一個包含政治、經濟、軍事、社會和信息基礎設施的系統分析圖,解釋了信息流如何影響戰略和作戰重心,這驗證了未來情報數據收集和處理熱潮的顛覆性轉變。它描繪了融合的情報圖片如何更好地反映地面圖片,從而幫助情報人員了解復雜的社會-政治-軍事環境,并與大局建立聯系。因此,在未來復雜的作戰和戰略場景中,將在情報數據融合分析方面尋求范式轉變。

為了對來自不同來源的數據進行融合,Cruickshank (2019) 提出通過應用數據科學來開發軍事情報架構,為了從原始數據中提取知識的能力。建議使用 ML 和其他 AI 技術,數據科學將成為分析來自各種收集源結構化和非結構化數據的首選學科。在這方面,Kendrick (2019) 展示了一個在所有陸軍梯隊采用以數據為中心的框架。這允許在陸軍決策和執行的每一層面將數據科學有效地整合到陸軍情報中。數據科學工具可以自動化情報過程的復雜步驟,最終開發軍事情報數據庫。這些概念可以提供為軍事情報過程開發合適的 ML 模型。

Dopico 等人(2009 年)在他們的《人工智能百科全書》中匯編了大量關于當前人工智能技術發展的研究文章。在這些文章中,各種最新的智能系統建模、自適應技術、人工神經網絡、用于信息檢索的人工智能、認知建模、基于行為的神經網絡聚類、智能代理中的決策、面部表情識別程序、分層強化學習、自然語言處理程序、模糊邏輯系統的監督學習和群體智能方法模型,可以提供一個啟動框架,可用于說明 ML 如何用于解釋情報數據并將其轉換為可用信息。有了 ML 程序開發指南,對用于軍事情報分析的 ML 系統的研究和開發可能非常重要。

3 用于軍事情報分析的全球軍事機器學習應用平臺

機器學習是人工智能的一個子集,已被發達國家和發展中國家的軍隊廣泛用于其各種軍事應用和作戰平臺。 ML算法用于分析和學習數據(Bhatnagar,2018)。 ML 旨在通過分析示例和信息中有意義的關系和數據模式,來學習和調整其思維模式,這些示例和信息旨在以類似于人類認知邏輯的性質工作(Janiesch & Heinrich,2021)。在 2018 年美國國防戰略(Defense, 2018)中宣布,將人工智能作為未來打贏戰爭的關鍵技術,這已被美國(US)列為未來戰略。俄羅斯在 2017 年重申追求人工智能技術,因為俄羅斯總統公開宣布了其對未來軍事前景的立場(Simonite,2017)。中國在 2017 年發布了一項戰略,詳細說明了到 2030 年通過人工智能引領軍事技術的路線圖(Council,2017 年)。 Maven 項目是正在進行的領先的軍事 AI 實施項目之一,在伊拉克和敘利亞打擊 ISIS 的行動中,五角大樓通過算法戰跨職能團隊將無人機視頻轉換為可操作的情報,從而開始對 ML 進行軍事應用(WEISGERBER,2017 年)。

3.1 軍事情報流程的系統架構

軍事情報(MI)流程集成了情報、監視和偵察 (ISR),ISR開發了情報發送 (IC) 流程。通常,它結合了空間數據庫、屬性數據庫、案例庫、規則庫和知識庫,MI 過程通過這些知識庫進行工作。軍事偵察是獲取有關敵對部隊和自身作戰利益地形信息的過程。軍事監視是根據偵察數據對活動進行監測,以便保持有關的最新情況 。MI 結合了分析偵察和監視數據,并將原始信息轉換為對當前和未來行動具有軍事利益的有用情報的過程(Liao 等人,2003 年)。軍事 ISR 的框架如圖 1 所示。

圖1:軍事ISR框架(Liao等,2003)

從圖 1 可以明顯看出,MI 的相互交織的過程列舉了每個過程都與其他過程相輔相成,并且任何過程中缺乏活動都會導致整個 IC 過程出現故障。可以通過自動化以最小的錯誤概率加速持續的協調、修訂、更新和執行。因此,最新的人工智能強化學習方法通??過人機協作將整個過程納入情報分析框架。

MI過程是通過使用管理信息系統(MIS)進行的,通過該系統處理顯性知識。但在當今世界,有大量的數據產生,包括物理數據和虛擬數據,有屬性數據庫、空間數據庫、案例庫和知識庫等多種數據庫。地理信息系統(GIS)和基于知識的決策支持系統(KBDSS)被用于整合決策支持和知識管理功能,以增強顯性和隱性知識庫。在這方面,提出了結合情報戰支持系統(IOSS)結構,通過混合推理策略完成豐富的知識表示,證明了其在生產決策系統中的適用性(Xia & Rao,1999)。該系統的運行基于從書面知識中學習、從問題解決中學習、從問題解決失敗中學習和從遺忘中學習。這稱為自適應和強化學習,它是 ML 的主要屬性和 AI 的核心功能。由于情報收集、積累、分析和傳播功能的動態特性,基于強化學習的 ML 功能正變得越來越流行,并且依賴于 MI 過程。

3.2 軍事情報流程的層次結構和配置

MI 流程的層次結構和配置大致分為三個層次(Liao 等,2003)。第一層由作戰和戰術情報收集組織和單位組成,其通過偵察和監視手段收集數據、圖片、信號和網絡信息。這些手段大致可細分為人類智能、信號智能、圖像智能和通信智能。第二層次對提供的數據和信息進行不同的情報分析。在此層面上,分別根據日常和緊急需求提供常規和特殊情報報告。常規情報的存檔是這一層面的重要組成部分之一,它會定期更新并根據需要進行檢索。第三層是經常提出智能化要求的用戶組織、上級指揮部和高層領導。他們還定期更新態勢感知以及具有作戰和戰術價值的特殊情況。

MI的作戰流程分為常規任務和特殊任務。在常規任務中,作戰注意力集中在基于常規和標準操作程序的基本情報收集上。有時限的特殊任務側重于從特定事件、情況和人員中獲取特定情報。因此,這兩個作戰過程都闡釋了如圖 2 所示的 IC。

圖2:軍事情報作戰流程(Liao等,2003)

廣義情報作戰流程建立在對第一層情報采集組織和單位采集的原始數據處理之上。將原始數據轉換為信息的過程是由隱性和顯性知識庫完成的。這兩種類型的知識庫之間存在核心差異。隱性知識是任何智力主體的經驗、邏輯思維和膽識的積累,本質上更多的是個人屬性(Oliver, et al., 1997)。它因人而異,并且根據此類知識庫做出的決定通常是出乎意料的,可能不是基于邏輯推理(Hedlund,1994)。盡管在某些情況下,隱性知識被證明是根據情報預測任何結果的合理正確方法。但另一方面,顯性知識基于教義基礎的規則、方法和技術,本質上更精確、清晰和結構化(Zhang & Griffith,1997)。此外,程序性知識是由顯性知識支持的標準操作程序(Anderson,1985)。

3.3 為什么ML是MI分析的擾亂技術

在當今的數字化世界中,人類處于大量數據中,這些數據正以指數方式增長。數據的多樣性、數量、速度、矢量和無處不在不僅擾亂了當今的作戰前景,而且忽視了對通過它所承載的信息解釋,從而危及國家安全。在“信息就是力量”的格言下,作戰部隊必須具備解讀這種不斷增加的結構化和非結構化數據的能力,并找到有助于促進非戰時、戰時情報數據庫發展的模式。世界各地的情報機構正在重新定位和重組其傳統的情報作戰方法,以適應動態數據流并準備分析大型數據集。很明顯,在未來的技術時代,情報前景必須拓寬,并依賴于收集和組織大部分自己感興趣的數據來可視化未來態勢。

一般情報作戰由五個相互關聯、相互依賴的循環組成。分別是計劃、收集、處理、分析和傳播 (PCPAD)。收集、處理和分析 (CPA) 階段至關重要,需要從技術方面加以重視,因為操縱和處理的數量已經超過了人類的能力。數據收集來源包括傳感器、航空系統、衛星、無線電信號、開源互聯網、社交網絡、不同的組織、代理、對手等等。這些數據在不同的時間和空間以不同的格式在不同的介質中以二進制數據的數字格式或書面和口頭數據的形式出現。因此,它需要一個通用的解釋系統,可以處理、存儲、解釋所有類型的數據格式,并可以制作通用的情報圖。

根據 Desjardins(Desjardins,2019 年)的說法,世界正在產生大量數據,如圖 3 所示。

圖3:2019年中一天的數據(Desjardins, 2019)

Bulao (Bulao, 2020) 總結了以下關于互聯網世界中通過信息高速公路產生了多少數據的細節。

表 1:通過信息高速公路生成數據(Bulao,2020)

這些是在非戰時時期準備情報數據庫時需要分析的數據量和數據類型,以便在需要的時候幫助提取必要的信息。此外,在過去十年中,非傳統安全 (NTS) 威脅仍然很高,并且已經成為新的安全問題。因此,需要每天開發、更新和監控針對 NTS 威脅的情報,以便及時了解由于參與者的不可預測行為而導致的任何即將發生的情況。在戰時,在活躍的戰場情景下,持續的偵察和監視是任何作戰活動必不可少的組成部分。在戰場環境中,這些來自各種來源的數據被添加到以前的數據庫中,從而產生海量的數據流,這是人類操作員使用傳統的收集、存儲和分析方法無法處理和組織的。在正在進行的 AI 技術時代,有監督和無監督 ML 被廣泛用于收集大量數據。使用 ML 的優點是它可以自主或半自主地訓練自己來整理 MI 所需的數據,這使它能夠用可用的模式標記數據。因此,機器學習系統可以輕松篩選數十億字節的數據并捕獲所需的數據類型,為機器學習創建有意義的信息。雖然機器學習應用于數據收集,但系統通過數據挖掘(Chan,2020)通過正確識別、定位、分析、集成、清理和存儲來準備數據。

3.4 ML 在 MI 中的全球軍事應用

在討論了 MI 流程和系統架構的廣泛結構之后,不同國家的軍隊一直在通過監督學習和強化學習關注隱性知識和顯性知識來開發和重新定位其 MI 流程。隨后,對各種正在進行的MI流程系統進行了徹底的重組,這些系統將在可預見的未來主導MI流程的制定。簡要討論了一些最近開發的用于收集和分析 MI 流程的自動化系統。

? 多域指揮和控制系統(MDC2)是集中式平臺之一,收集和分析通過傳感器從陸地、空中、海洋和網絡空間收集的原始數據。這些數據與中央系統的融合是為了創建一個單一的信息庫,從而為決策者創建一個通用的作戰圖(CLARK,2017)。

? 邊境監視系統(BSS),對邊境沿線的物體和人員進行自動監視。它由傳感器、網絡資源和數據庫組成,其中開發了算法來計算指標,從而為威脅提供預測值。它不僅可以估計威脅程度,還可以評估一系列事件的不確定性程度。貝葉斯推理、背書理論、模糊推理和 Dempster Shafer 理論與編程算法一起用于 BSS 的設計(Albertus C. van den Broek,2019)。

? 聲學探測器,是一種通過機器學習方法運行的主動探測系統,可以跟蹤和探測空中和地面中的小型微型物體。 ML 方法用于使用來自各種傳感器和雷達的實時數據來檢測和評估多種算法的性能。這可以將各種音頻特征與可聽和不可聽頻譜區分開來。基于 ML 的檢測算法可以剔除噪聲并通過作戰環境產生可用的情報(Alexander Borghgraef,2019 年)

? 通過增強技術在可見光和熱光譜范圍內進行視頻監控,采用深度神經網絡記錄和檢測紋理和熱圖像。卷積神經網絡是在自適應學習算法下設計的,通過從各種來源獲取傳感器數據并做出決策。它在長波紅外和可見光譜范圍內的大規模多光譜熱世界數據集中特別有用(Vanessa Buhrmester,2019)。

? 基于深度學習的行為識別已經應用于監控系統中的傳感器數據分析。該系統致力于識別人的異常行為并跟蹤具有特定行為模式的人員(Maria Andersson,2019)。該系統通過預設的人與人、人與物、人在特定環境的行為模式來分析不同的行為特征。這是在監督學習模型上設計的,其中具備不同的行為類別和模式,通過這些模型分析和檢查受試者的行為特征,以篩選和檢測所需的感興趣的人。

? 通過結合和分析不同的情報輸入,開發了基于語義世界模型的信息提取技術。這些情報輸入的形式有人力情報(HUMINT)、圖像情報(IMINT)、開源情報(OMINT)、虛擬源情報(VIRINT)等。通過使用數據驅動的機器學習機制和語義世界建模,將信息整合、處理、融合產生一個通用的情報。這些是基于深度學習方法面向結構化和非結構化數據開發的(Almuth Hoffmann,2019)。

3.5 用于 MI 分析的 ML 算法開發模型

ML 在國防、經濟、醫療保健、交通、航空、空間技術、商業等領域的應用領域已經具有較大發展。有趣的是,這些領域的應用成果可以加速國防應用的發展。對于 MI,這些 ML 算法可以用于探索未來的應用,這些應用已經在理論研究中或已經在實際工業應用中。在此基礎上,討論了算法模型及其在模型分析中的應用范圍:

? 從互聯網資源和通信媒體中檢索多媒體信息會在高維空間中產生大量數據。主動學習支持向量機 (ALVSM) 一直在開發以處理此類高維系統,因此可以作為 MI 數據收集和分析的基本系統 (Jiang & Horace, 2009)。

? 基于智能體的智能系統建模被開發用于感知和響應作戰環境,作為一個自適應系統來獲取和存儲信息,從其經驗中學習,通過自動化或半自動化控制,調整方向,適應變化的環境。通過自適應學習不斷修改規則,使系統在不斷變化和演變的環境中做出必要的決策輸出。智能體的工作原理是通過基于代理的建模 (ABM) 結合人類和基于機器的數據進行監控、傾聽和響應 (Tang, et al., 2009)。

? 環境智能 (AmI) 通過物聯網 (IoT) 無縫集成智能設備和基礎設施。它通過語音識別和圖像轉換集成了所有的采集和監視傳感器、智能系統、人、計算機和社會交互。該系統通過認知推理的直觀界面工作,并向智能體提供合適的策略選擇(Sadri & Stathis,2009)。

? 面部表情識別系統 (FERS) 用于識別人類情緒并捕捉大量圖像序列中的面部表情。人機交互解釋面部運動并分析情緒狀態(Dornaika & Raducanu,2009)。

? 數據挖掘和數據倉庫被廣泛用于管理和分析大型數據集(基于模式識別技術)。數據倉庫可用于存儲可在需要時檢索的數據。數據挖掘用于壓縮龐大的信息存儲庫。它是一個涵蓋大數據集、模式識別、機器學習、信息與控制理論、信息檢索、并行與分布式計算和數據可視化的多學科領域(Zhou,2003)。與 MI 分析最相關的數據挖掘活動可能是關聯、序列、分類、聚類和通過神經網絡、決策樹、回歸分析和基于記憶的推理進行的預測(Wang 等人,2009 年)。

? 帶有傳感器、AI 和 ML 的地理信息系統 (GIS) 生成數字地圖,其中輸入來自地面傳感器、空中平臺和衛星。它生成定制的便攜式地圖,其中包含實時和空間放置的更新對象以及用于檢測和跟蹤系統的準確地理坐標。圖像和對象處理是通過自適應和監督機器學習的深度挖掘建模完成的(Matheson,2020)。

? 基于傳感器的認知平臺通過廣泛的神經網絡系統中的各種數據和圖像收集傳感器工作。該平臺通過模糊邏輯和遺傳算法進行操作,形成專家和學習系統(Hamblem,2017)。

4 機器學習在軍事情報中的應用潛力

要在大局下開發完整的情報概要,顯然需要關聯和融合來自多個收集源的所有情報數據。基于機器學習方法的工具可以分為三類,例如監督學習、無監督學習、強化學習和深度學習。 Alkire (Alkire, et al., 2016) 將分析工具分類為啟用分析、執行分析和支持分析。啟用監督學習方法下的分析工具可幫助智能體快速、準確、完整地執行特定的分析任務。這種半自動化工具通過人機交互和人在環結構中執行分析任務。執行分析是替代智能體的全自動工具;從而在具有人外循環結構的無監督學習方法下運行。執行分析工具可以通過基于任務和基于周期的方式進行操作。基于任務的工具從情報代理中卸載指定的任務并自主完成任務。基于循環的工具完全無需人工??干預即可執行智能循環的所有步驟。強化學習和深度學習下的分析工具通過自適應學習運行,它通過知識管理數據庫、建模、模擬環境、人際協作、縱向和橫向協作來支持智能體。

數據合成是情報數據分析的重要步驟。其目的是將來自各種收集源的所有不同元素組合在一起,以開發單個事件和情況的情報摘要。這種合成一般分三個層次進行。初級階段是基礎分析和開發,其中匯總來自單一來源的數據以制作情報產品。這是關鍵基礎,因為到下一層次的合成鏈取決于此數據組合階段。高級分析和開發層次目的在于解釋多源數據,由于來自多個來源的數據量和類型,分析和開發變得更加復雜。與此層次并行,可以創建多源分析和多情報融合,以發現情報產品之間的關系,這可以被認為是更深層次的階段。這樣做主要是為了找出數據模式,以便可以預測任何情報事件的概率。最后一個層次是所有源分析,其中所有可用數據被融合和合成在一起,并在時間、地點和行為方面對目標進行更準確的預測。這種類型的分析需要一種整體方法來組合所有類型的數據格式,這可以通過監督學習 ML 方法較好地完成。

人機界面和人機協作是將機器學習納入 MI 的重要階段。在 MI 流程的自主化方面,人在環系統一直是首選。可以通過多個層次開發將 ML 納入 MI 流程。這些層級是相互關聯的,可以從總部放置到外勤單位,以促進各種來源的信息流動。

4.1 第 1 層(數據來源)

第 1 層將主要包括人力、機械和電子來源。可以放置傳感器、無人機、衛星和雷達,以全天候收集來自全國各地和感興趣區域的圖像源,以用于作戰目的。傳感器是靜態設備,低成本設備,可以很容易地放置在感興趣的地方。傳感器之間可以建立局部連接,其中圖像數據可以收集在全國分布式服務器的數據庫中。此數據存儲功能將在第 2 層(存儲和處理)中進行協調,其中可以在中央數據庫中收集、分類和篩選來自傳感器的所有圖像數據。無人機和衛星分別是可以探測、跟蹤和定位靜止和移動物體的戰術和戰略設施。無人機可以將圖像數據發送到本地和中央數據庫,而衛星數據可以發送到中央數據庫。由于衛星范圍超出國家邊界,它可能用一個單獨的數據庫用于外部圖像存儲。雷達是靜態檢測系統,可以檢測飛行物體、移動物體。這些圖像數據可以通過光纖網絡直接存儲到中央數據庫。

圖4:第1層(數據來源)

智能安全傳感器、無人駕駛航空器(UAV)、地球觀測衛星(EOS)以及電子和虛擬源的功能

非戰時監視是 MI 部門的主要職能之一。為此,除了人工收集信息外,傳感器、無人機和地球觀測衛星(EOS)也可以在收集大量數據和信息方面發揮重要作用。

? 智能安全傳感器

智能安全傳感器是構建 MI 采集系統的關鍵元素。靜態的、通過物聯網(IoT)互聯的傳感器,可以在國家邊境形成一個大型監控網絡系統。它們可以執行各種功能,包括環境監測、武器控制、通信和信號攔截、監測軍事行動、犯罪檢測、入侵檢測、NBC 檢測等。有多種類型的傳感器可用 MI 目的。有源傳感器通過自己的輻射源發揮作用??,該輻射源在電磁頻譜的微波和無線電波長區域工作。它支持包括運動檢測和入侵檢測在內的各種 ML 算法。這些都是通過ML算法下的自動提取過程,從復雜的噪聲頻譜中處理無線電信號。智能傳感器通過強化學習機制發揮作用,這是一種多功能、自我診斷和自我補償的裝置。這些是由具有更高處理芯片的高分辨率圖像傳感處理器構建的,可以將數據從遠程站快速傳輸和共享到中央數據庫或本地數據庫。短波圖像輻射機制已證明它是用于 MI 目的的精密和可靠傳感器之一。微機電系統 (MEMS) 傳感器通過機電傳感器發揮作用,小型化機電傳感器尺寸,因其在短時間內快速部署而廣受歡迎。這些是在崎嶇不平地形和環境中長時間工作的理想傳感器。視覺解釋數據生成過程使其成為值得信賴的軍事檢測傳感器之一。納米傳感器被認為是用于 MI 的最先進技術。它們耐用、堅固、重量輕,并通過自適應學習算法工作。這些新興技術通過創建本地虛擬云網絡來共享數據。這些在難以接近的地形配置中提供了更好的連接性,該配置通過認知學習方法和通過增強現實 (AR) 界面進行工作(Electronicsforu,2018 年)。

? 監視無人機(UAV)

監視無人機(UAV) 是收集難以接近和易受攻擊的地形圖像和視頻數據的基本系統之一。由高分辨率計算機視覺和圖像處理技術建模的移動對象檢測和跟蹤 (MODAT) 框架,用于創建地理空間地圖和其他圖像文檔。對地形物體的監測、對運動物體的跟蹤和實時位置數據的更新,有助于對感興趣區域進行24小時監控。它們獨立運行,集群工作,分散方式通信,以確保最佳的安全性和應用靈活性。自動化 MODAT 框架在圖像對齊、運動檢測和對象跟蹤等三個模塊下運行。圖像數據的大量計算是基于強化學習的各種圖像處理算法進行的(Ibrahim等人,2010)。

? 地球觀測衛星

地球觀測衛星(EOS) 是一個覆蓋廣泛地形的寶貴情報收集系統,因此可以作為任何軍隊的戰略資產設施。 EOS可以從不同高度觀察獲取地形衛星圖像并將其發送回中央控制站。經過適當處理后,這些圖像可以通過機器學習研究地形配置模式的變化,并為潛在的越境入侵提供警報。對衛星圖像進行采集、存儲、處理和解釋的整個過程都是由各個ML算法模型自主完成的。

? 電子和虛擬來源

除了其他傳統和現有的情報來源之外,電子和虛擬來源對 MI 至關重要。數字簽名和潛在信息出現在各種電子媒體和虛擬信息高速公路(互聯網、社交媒體網絡和其他媒體資源)中,可以對任何即將發生的情況建立 360 度的視角和評估。通過有監督的算法建模框架來強化人工智能學習,可以從這些媒介中提取所需的信息。這需要人工的持續監督,可以通過監督學習程序來實現。互聯網上的電子資源是 ML 在檢測和提取所需信息方面發揮重要作用的主要信息來源之一。它可以通過自動化過程對所需信息進行分類和收集,由于數據量大,情報人員經常忽視這一過程。潛在情報來源包括互聯網網站、社交媒體平臺(Facebook、Twitter、Instagram 等)、視頻共享平臺(YouTube、Vimeo、TikTok 等)、新聞門戶(國內和國際)、媒體頻道(國內和國際)。這些來源的數據通常以非結構化的圖像和語音數據格式出現。外交機構是提供該國家最近在政治、經濟和軍事方面發展情況的真實來源之一,這些發展通常以結構化的形式出現。全球軍備合同和交易細節可以提供潛在對手的最新軍備能力。這些主要是結構化數據,收集來源通常需要在第 2 層進行驗證。除此之外,各種軍事技術開發計劃可能是了解未來軍事發展趨勢的最重要來源。這些數據采用結構化格式,通常需要在第 2 層進行驗證。

? 人力情報

人力資源仍將是最重要的信息來源,正如孟加拉國陸軍所流行的那樣。人力情報(HUMINT)可以通過各種人力和其他來源收集。這些可以分為常規、非常規、專業、按需和共享 HUMINT。常規 HUMINT 是從一般收集來源收集的,這些來源經過培訓并符合常規就業原則。從需要定期驗證的來源收集非常規的 HUMINT。這些來源必須符合個性配置文件下第 3 層中設置的驗證參數。專業的 HUMINT 是從高度機密的來源收集的,這些來源通常在感興趣的地方處于休眠狀態,基于自驅動機制收集信息。專業的來源通常在放置之前進行驗證,但需要與在第 3 層中執行的活動模式相匹配。 按需HUMINT 是常規 HUMINT 的擴展,其中來源通常在特定情況下放置在特定的時間范圍內。共享 HUMINT 是經常從其他組織按需或出于共同目的收到的共同情報。 HUMINT 的模式有書面、口頭和編碼格式的數據。這種結構化、半結構化甚至非結構化數據可以通過數據挖掘、NLP 和文本分析方法進行分析。非結構化信息管理架構 (UIMA) 可用于第 2 層,以處理半結構化和非結構化數據并創建通用結構化數據庫。

4.2 第 2 層(存儲和處理)

在第 2 層中,將協同進行數據存儲、數據處理、數據流、數據處理硬件。來自各種來源的數據可以存儲在分散的服務器中,該服務器可以將數據傳輸到中央數據庫。按需數據也可以通過軍用云網絡進行提取。數據處理可以通過 ML 算法進行。對于結構化數據,監督學習系統可以在有限的自主性下使用。對于圖像和語音數據,可以使用強化學習,使其可以從環境中學習,并可以繼承具有情境經驗的自適應配置。 NLP 可以應用于各種語音識別、語音解釋和語音定向。數據存儲可以通過大數據框架內的神經網絡來實現。數據流可以通過安全的光纖網絡進行。此外,機械采集源可以通過物聯網互連,從而可以即時和集中地執行數據流和設備控制。

圖5:第2層(存儲和處理)

基于機器學習的情報數據處理

通過各種收集源獲得的數據將形成大數據。不斷變化的數據結構需要基于ML的數據處理算法,這是一個不斷發展的研究領域。 ML算法對數據的處理是通過數據選擇(結構化、半結構化和非結構化)、數據處理、數據轉換、數據輸出和最終數據存儲來進行的。在不斷發展的數據科學領域,有多種 ML 算法方法。其中,回歸、分類、時間序列分析、主題建模、聚類分析、協同過濾、關聯規則和降維很流行,并在軍事和商業中得到廣泛應用(Bhatnagar,2018)。在使用 ML 算法進行數據處理時,可以采用三種學習類型的 ML 技術。被廣泛使用的 ML 的三個子領域是監督學習、強化學習和自動/無監督學習。在 ML 的這些子領域中,監督學習(神經網絡、貝葉斯網絡、樸素貝葉斯、支持向量機和馬爾可夫模型算法)用于對數據處理任務進行分類和估計。強化學習(Q-Learning、R-learning、TD 學習和 Sarsa 學習算法)用于從情報數據集中開發決策任務。無監督學習(k 均值、高斯模型、X 均值和 Dirichlet 過程模型算法)的主要功能是通過對形勢趨勢分析來產生數據聚類,以做出未來的預測事件(Bhatnagar,2018)。處理和分析各種來源生成的情報數據需要使用大數據框架。在眾多大數據處理框架中,Hadoop 框架最適合 MI 分析(Chowdhury,n.d.)。

4.3 第 3 層(融合和分析)

第 3 層通過融合各種數據集發揮作用,從而可以開發人格剖析模型、決策模型、動態情境模型和綜合預警 (EW) 系統。結合HUMINT,收集、協作和融合個人在社交網絡(OSN)和其他網站中的互動,創建軍事和非軍事感興趣者的內部動態人格檔案。這類人員的選擇范圍可能包括敵人的軍事和非軍事領導層以及非傳統威脅集團的嫌疑行為者。根據 (Souri, et al., 2018),艾森克三因素模型(精神病、外向、神經質 (PEN) 模型)、大五模型和另類五模型被廣泛用于描述人格概況。為此,可使用樸素貝葉斯、決策樹、神經網絡和支持向量機等 ML 算法來分析在線數據集。

基于強化學習,可以實現定期更新和重構的人格輪廓。根據一個人在不同情況下的各種行為反應所形成的一系列人格特征,編制了人格模型。這種個性模型將被廣泛用于開發大量決策模型,這些模型將成為戰略和作戰領導力的重要成分。類似地,基于某種情況下的各種活動,可以將活動元素的組合以隨機方式融合在一起,以預測即將到來的情況。因此,情景元素的融合將利用機器學習的自適應學習方法構建動態情景模型。所有這些模型將有助于創建關于相關人員和任何情況的綜合電子戰,特別是高級領導和一般部隊。

圖6:第3層(融合和分析)

MI 數據融合的特點

? 數據融合是機器學習將所有類型的數據處理成可用的格式,并為當前和未來情況準備統一圖景的方法。 ML一般通過數據的不不完整、數據的關聯、數據的不一致性和數據的分散性來進行這種數據融合。數據融合是處理多源數據和信息的集自動檢測、因果、關聯、估計和組合的多層次、多方面的過程(F.E.White,1991)。它是信息從不同來源和不同時空點轉換的過程。該過程提高了檢測能力和可靠性,減少了數據模糊性,并擴展了從國家邊界到興趣點區域的空間和時間覆蓋范圍。JDL模型是軍事領域中最常見、最流行的融合模型之一,它基于輸入的結構數據,通過對象、影響、情境和過程細化四個不斷增加的抽象層次產生輸出。 JDL 模型主要側重于輸入輸出數據,而不是處理。相反,Dasarthy 的框架允許輸入/輸出數據流和功能處理(Dasarthy,1994)。基于全球、區域和國家層面事件的不確定性,MI 通常需要適應隨機數據集。根據這些隨機數據集構建大量決策模型將很有用。在這方面,Goodman (Goodman, 1997) 隨機集就是一個非常有用的過程,它具有結合決策不確定性以及呈現不確定性選項的一般模式能力。

? 用于 MI 數據轉換的數據融合技術必須經過魯棒的自適應編程框架,以解決數據類型的不完善、數據類型的多樣性、傳感器技術的多樣性以及操作環境的性質和類型。

? 數據融合算法需要能夠承受智能體和傳感器從現場收集的不完美、不精確的數據類型。它還應該能夠導出冗余數據,從而減少測量中的噪聲。

? 數據融合系統應該能夠避免反直覺的結果,并且能夠以適當的注意力處理高度沖突的數據,從而消除決策錯誤的增加。

? 數據融合方案應該能夠同時處理同質和異構數據,如音頻、視頻、無線電信號和其他形式的信號源。

? 數據融合系統需要通過傳感器注冊來克服由單個傳感器模式引起的校準誤差。該處理可以集中式和分布式兩種方式完成。分布式融合過程在必須建立無線傳感器網絡的偏遠地區非常有用。

? 數據融合方法應針對多個時間尺度,以處理傳感器接收和發送數據的多個時間尺度變化。由于數據流通過的路由是可變的,因此可能存在數據亂序到達的可能性。為了解決這種性能變化的潛在缺陷,融合中心應該具有分布式融合設置。

? 融合過程必須通過強化學習方法進行操作,以便能夠快速適應變化并相應更新。

數據融合方法

實時數據融合系統將面臨許多挑戰,因為該方法仍在探索中。主要挑戰來自非結構化、不完整和不精確的數據。很明顯,MI 數據永遠不會具有完整的結構化格式,因為預測的來源包括人類傳感器、無人機、衛星和其他虛擬和在線平臺。 Khaleghi (Khaleghi, et al., 2011) 描述了數據融合系統中的幾個與數據相關的挑戰。數據融合方法的分類如圖 7 所示

圖7:數據融合方法的分類(Khaleghi等,2011)

無論數據結構如何,ML都可以使用數據融合算法,在多個數據模型中創建數據結構,以滿足MI的各種需求。其中,數據不完備性是數據融合系統面臨的最基本的挑戰,主要表現為不確定性、模糊性、不完全性和粒度性。有許多建議的不完善的數據融合框架來解決這些限制。流行的數據融合框架是概率、證據、模糊推理、可能性、粗糙集理論、混合和隨機集理論融合。該框架具有處理數據不確定性、模糊數據融合、模糊數據處理、不完整數據處理和不完整數據融合的能力。

4.4 第 4 層(數據共享)

第 4 層是數據共享平臺,將與內部和外部利益相關者共享完整的態勢模型和集成電子戰信息。這個集中的數據共享平臺將連接到所有編隊指揮部,使態勢感知可以即時到達。這些可以通過具有單獨通信集線器的光纖網絡連接到其他組織和利益相關者。

圖8: 第4層(數據共享)

軍事云計算在MI融合中的應用

軍事云計算(MCC)可以為通用情報數據和資源提供方便的按需共享網絡訪問。 MCC 至關重要的可訪問性功能使其可靠、耐用且安全,具有軍事級別的網絡攻擊保護。它將為所有情報大數據和其他資源提供一個動態的資源池和存儲設施,以便任何情報人員可以在世界任何地方隨時訪問它,同時可以在任何地方、時間上傳各種數據。這樣,MI 資源可以 24 小時共享和訪問。 MCC 可以在 4 層單獨的分散功能中構建。 Cheng & Liao (Cheng & Liao, 2011) 將它們命名為資源層、面向服務的架構層、面向服務的工具層和云計算應用層。資源層將保存所有的物理資源和邏輯資源。物理資源包括存儲配件、網絡設備、物理數據庫配件、服務器等。邏輯資源包括應用軟件和其他相關軟件。面向服務的架構層執行情報服務、通用服務和專業服務的資源共享。面向服務的工具層提供用戶接口和訪問接口,進行仿真建模和調試加密數據。

用于情報數據傳輸的軍事物聯網

軍事物聯網 (MIoT) 將是一個新興且必不可少的系統,用于連接同一軍用級網絡下的所有設備、傳感器、無人機、衛星和其他采集設備。它將人和機器互連在一起,促進人機協作。 MIoT將由除了采集設備之外的所有軍事平臺組成,因此也可以傳遞執行部署指令。這不僅允許信息不斷地流入中央數據庫,而且還將流出的信息傳播給最終用戶。

5 建議

基于上述關于將機器學習納入 MI 過程的各種因素討論,提出以下建議:

? 除了傳統的 MI 收集源之外,還可以在感興趣的領域中加入基于機器學習的收集源。

? 可引入數據融合中心,對各類數據進行組合融合,形成統一的情報圖。

? 可以與工程機構、政府機構和相關行業合作啟動研發,以幫助推動機器學習算法和配套硬件的自主創新和開發。

? 可規劃ML算法開發時間線及相關MI應用平臺,將MI過程向人機協作轉變。

? 可以在 MI 框架內引入情報層級框架,以便協同實現自動化。

? 必須通過充分更新的防火墻系統確保每一層來源的信息安全。

? 在 MI 流程的每一層都需要確保備份數據存儲。

6 總結

機器學習是人工智能的一個子集,已被發達國家和發展中國家的軍隊廣泛用于各種軍事應用和作戰平臺。為支持這一趨勢,發達國家通過機器學習重新定位其情報收集和分析過程,以更深入地了解情況并從各個角度進行分析。軍事ISR的框架包括空間數據庫、屬性數據庫、案例庫、規則庫和知識庫,這些過程相互交織。在機器學習應用的情報分析框架中,可以通過自動化以最小的錯誤概率要求人機協作,來加速持續的協調、修訂、更新和執行。地理信息系統(GIS)和基于知識的決策支持系統(KBDSS)被用于整合決策支持和知識管理,以增強顯性和隱性知識庫這兩種形式的情報知識方法。結合智能作戰支持系統(IOSS)結構,通過混合推理策略完成豐富的知識表示,證明了其在決策系統中的適用性。 MI的層次結構和配置大致分為三個層次;第一級由作戰和戰術情報收集組織和單位組成,第二級對收集組織和單位提供的數據和信息進行不同的情報分析,第三級是用戶組織,上級總部和高層領導經常對情報提出要求。第一級和第二級的數據收集和分析步驟可以通過結合基于人工智能的功能系統來實現自動化。

ML 在 MI 中的全球軍事應用的最新發展范圍,包括多域指揮和控制系統 (MDC2)、邊境監視系統 (BSS)、聲學探測器、視頻監視、基于深度學習的行為識別,及通過語義世界建模進行信息提取。這些系統或技術通過使用監督、強化和深度學習方法,來分析來自人力情報 (HUMINT)、圖像情報 (IMINT)、開源情報 (OMINT)、虛擬源情報 (VIRINT) 和許多其他來源的信息。用于 MI 分析的 ML 算法模型已經開發出來,該領域的一些重要成就是主動學習支持向量機 (ALVSM)、基于智能體的智能系統建模、環境智能 (AmI)、面部表情識別系統 (FERS)、數據挖掘和數據倉庫、帶有傳感器的地理信息系統 (GIS) 和基于傳感器的認知平臺。

MI 的收集、處理和分析 (CPA) 階段至關重要,需要從技術方面予以重視,因為操縱和處理龐大的數據量已經超過了人類的能力。數據來源的類型包括傳感器、航空系統、衛星、無線電信號、開源互聯網、社交網絡、不同的組織、代理、對手等等。在非戰時時期,非傳統安全 (NTS) 威脅在過去十年中一直居高不下,并已成為新的安全問題。在戰時,在活躍的戰場情景下,持續的偵察和監視是任何作戰活動必不可少的組成部分。在戰場環境中,這些來自各種來源的數據被添加到以前的數字數據庫中,從而產生大量數據流。 ML 系統可以輕松篩選數十億字節的數據,并捕獲所需的數據類型,為 MI 創建有意義的信息。當機器學習應用于數據收集時,系統通過正確識別、定位、分析、清理和存儲來準備數據。有各種 ML 方法利用復雜算法和預測建模來進行數據分析以預測未來的結果。監督學習適用于訓練和測試數據集,其中訓練數據集可用于 MI 智能體訓練 ML 系統。無監督學習用于查找數據集中的數據結構模式。強化學習使用復雜的算法從其經驗中學習并重新設計其程序以分析預測情況。深度學習通過人工神經網絡發揮作用,其中數據保存在多個層級中,以便通過可變數據接口層使用。在 MI 的自動化中,發現 AI的應用在 MI 過程的處理和分析階段帶來了最大影響。因此,機器學習的內在價值將為 MI 組織促進和利用“自動化紅利”,以便人類可以將節省的時間用于其他高優先級任務。

非戰時監視是 MI 部門的主要職能之一。除了手動和人工收集信息外,傳感器、無人機和 EOS 還可以在收集大量數據和信息方面發揮重要作用。智能安防傳感器可以通過物聯網互聯,可以形成跨越國界的大型監控網絡系統。監視無人機 (UAV) 是通過移動目標檢測和跟蹤 (MODAT) 框架收集無法訪問和易受攻擊的地形圖像和視頻數據的基本系統之一。地球觀測衛星 (EOS) 是一種覆蓋廣泛地形的寶貴情報收集系統,因此可以作為任何軍隊的戰略資產設施。通過監督算法建模框架來強化人工智能學習,可以從電子和虛擬資源中提取所需信息。 ML算法對數據的處理是通過數據選擇(結構化、半結構化和非結構化)、數據處理、數據轉換、數據輸出和最終數據存儲來進行的。用于情報數據處理的 Hadoop 框架作為大數據框架執行,用于處理和分析從各種來源生成的情報數據。數據融合是 ML 將所有類型的數據處理成可用的格式并準備好當前和未來情況的統一圖景的方法。 ML一般通過數據的不完善、數據的關聯、數據的不一致性和數據的分散性來進行數據融合。在各種融合系統中,Joint Director of Laboratories (JDL) 模型、Dasarthy 框架和 Goodman 隨機集執行各種數據融合、特征融合、決策融合和信息融合。流行的數據融合方法涵蓋了概率、證據、模糊推理、可能性、粗糙集理論、混合和隨機集等多種理論。數據合成是情報數據分析的一個重要步驟,它可以將來自各種收集源的所有不同元素組合在一起,以開發單個事件和情況的情報摘要。軍事云計算(MCC)的動態資源池和所有情報大數據及其他資源的存儲設施,可以為通用情報數據和資源提供便捷的按需共享網絡訪問,讓任何情報人員可以在世界任何地方的任何時間訪問它,同時可以在任何時間上傳各種數據。

數據收集、數據存儲和處理、數據融合和分析以及最后的數據共享四個層次的功能,可以通過監督和強化學習方法開發。這將允許全方位擴展 MI 的范圍,并且可以監視感興趣的物理和虛擬區域。因此,ML 的應用將促進 MI 收集和分析過程的自動化,以便可以查看自己興趣點的所有情況,并且戰略、作戰和戰術領導者清楚接下來會發生什么。

作者

Nizam Uddin Ahmed 中校, 在孟加拉國國防學院擔任高級研究員。他對國防技術發展有著廣泛的興趣。他在 Springers、Mirpur Papers 和 NDC 期刊上發表了多篇論文。目前,他正在研究將人工智能納入武裝部隊的可行性,并開發各種深度學習模型。

付費5元查看完整內容

摘要

幾十年來,政治科學家和國家層面的軍方政策制定者一直在戰略層面使用博弈論,但對其在作戰層面的使用幾乎沒有評論。傳統上,三個主要挑戰阻礙了規劃人員和分析人員在作戰層面使用博弈論,即復雜的作戰環境、參與者的動態交互以及大多數陸軍參謀人員不具備使用復雜數學技能。

這本專著表明,這些挑戰是可以克服的,博弈論可以在規劃過程中提供新穎的見解。美陸軍參謀部規劃人員可以在作戰層面有效地使用基本博弈論和簡單的數學來了解作戰環境、了解行動者及其動機,并在軍事決策過程中比較行動方案。本專著展示了如何避免高級博弈論用于解決理論問題的繁瑣數學程序,而是專注于使用基本博弈論在規劃過程中提供價值。它通過回顧博弈論在戰略層面的應用、教授基本博弈論和涵蓋一些基本博弈概念來展示博弈論的實用性。然后,它考察了一場歷史性的行動,以展示博弈論的使用將如何達到另一個推薦行動方案和結果,也許會改變歷史進程。最后,它通過將博弈論應用于軍事決策過程、任務分析和行動制定過程的兩個步驟的練習,提供了使用博弈論的指南。

引言

幾十年來,戰略規劃者和政策制定者在戰略層面有效地應用了博弈論,但軍事從業者往往不在作戰層面使用它。當約翰·馮·諾依曼和奧斯卡·摩根斯坦在 1940 年代初在蘭德公司工作期間發展博弈論時,他們尋求一種數學方法來為沖突領域,特別是經濟沖突提供解決方案。他們于 1944 年發表了開創性的著作《博弈論與經濟行為》

博弈論允許通過將場景建模為簡化的博弈來分析決策。博弈論試圖定義參與者、策略——或可供他們選擇的選項——以及博弈結果的預期回報。它試圖澄清由于參與者的選擇而導致的不確定性。它的主要用途是它認識到結果是通過多個參與者的互動共同決定的,而不僅僅是一個人自己決定的結果,它允許分析對手可能會做什么。由于這些原因,政策制定者和戰略家使用博弈論來理解戰略問題,例如核對手、貿易慣例、內戰解決和裁軍以及缺乏國際合作,從而制定政策建議以幫助解決這些問題

作戰層面的規劃者是否可以有效地應用博弈論仍然是一個懸而未決的問題。在作戰層面使用博弈論的批評者強調了動態交互的復雜性。他們指出,培訓軍官了解博弈論的基本概念并將操作層面問題的復雜性提煉成基本博弈需要大量時間。

本專著認為博弈論提供了一個有價值的框架,最適用于在軍事決策過程的任務分析和行動發展步驟過程中理解環境中的參與者。博弈論旨在提供對情況的理解。這需要了解參與者及其潛在計劃或戰略動機。博弈論提供了一種理性的方法來研究行動者如何制定他們的策略和他們的動機基礎。由此,指揮官和參謀人員可以獲得理解,然后疊加其他因素,包括行動方案和潛在結果。它提供了一種合理而直接的方法來簡化復雜的問題。因此,博弈論為作戰規劃者提供了另一種工具,可用于了解作戰環境。

本專著重點介紹博弈論在戰略層面的歷史應用、當前的規劃過程學說和相關框架,以回答作戰規劃者能否在作戰層面有效地使用博弈論。這本專著主要通過囚徒困境分析博弈論在戰略層面的應用,將其應用于冷戰、國際貿易和價格戰期間的降價。 1777 年的新澤西戰役為應用博弈論和理解喬治華盛頓將軍和查爾斯康沃利斯將軍之間的競爭環境提供了一個歷史例子。最后,它演示了如何以及在何處將博弈論工具實施到美國陸軍當前使用的規劃過程中。所使用的博弈論是一種基本的應用方法,而不是過于復雜和無用的高級學術博弈論。簡單的博弈可以使復雜的操作情況變得清晰。該研究回顧了陸軍規劃學說,以專注于了解作戰環境和問題。任務分析旨在了解環境中的參與者以及他們之間沖突的根源。這 3 項研究的重點是深入了解對抗性和中立的參與者、激勵措施、潛在的行動方案和回報。該專著追溯了博弈論的戰略應用和作戰應用之間的差異,以了解哪些要素是一致的,同時說明了差異。最后,它將討論如何克服實施中的潛在挑戰

博弈論在軍事決策過程中的應用

規劃人員可以在軍事決策過程中使用博弈論工具,特別是在任務分析期間,以不同的視角理解作戰環境和行動發展過程,以檢查未發現的假設。博弈論工具不是替代軍事決策過程中現有的步驟和工具,而是對其進行補充。戰地手冊 6-0 解釋說,指揮官和參謀人員使用任務分析來更好地了解作戰環境和部隊面臨的問題。接下來,規劃人員使用任務分析來制定假設以填補知識空白。最后,考慮到博弈論理解競爭的本質,任務分析也有助于理解友軍和敵軍如何互動。行動方案制定過程提供了一種客觀的方式來看待多個潛在計劃。在上面的歷史例子中,華盛頓將軍和康沃利斯將軍需要了解他們的潛在行動以及他們認為 30 名敵方指揮官可能會做什么。在某種程度上,歷史例子中的將軍們可以在他們的行動發展過程中使用博弈論來檢查他們的假設。開發從敘述性或定性評估開始,然后轉向帶有每個計劃的加權分數的可量化評估。博弈論允許另一種觀點來評估潛在的計劃。以下思想實驗提供了一個示例,說明工作人員如何在任務規劃期間使用一些博弈論工具。

演習如下:美國討論在一個靠近對手的友好國家增加軍事存在,這旨在阻止對手入侵友好國家。軍團工作人員了解國家決策者關于在一個地區增加軍事存在的辯論。此外,他們知道如果國家領導層追求升級,軍團是升級的一個因素。工作人員致力于了解作戰環境并了解國家層面的優先事項和激勵措施,以便他們可以就選項提出更高的建議并為預期的行動方案做好準備。其次,他們努力了解敵人的動機和行動計劃。敵人還面臨著增加其在該地區的軍事存在或維持現狀的前景。兩國都擁有核武器,都不想進行全面戰爭。最后,兩個大國都可以遷移的地區的人口不希望被外國勢力占領。國家決策者面臨的戰略決策具有操作層面的影響。

如上所述,任務分析提供了對情況和問題的理解。在任務分析過程中,工作人員開始對行動者的動機和動機有所了解。戰場情報準備是任務分析的關鍵步驟。參謀人員對友軍和敵軍如何在環境中相互作用做出假設。由此,工作人員開發了每個參與者在即將到來的操作中可以使用的潛在選項。此外,情報準備步驟確定了指揮官和參謀人員的知識差距。這些差距導致了獲取信息的情報需求的發展。正如文獻回顧中所述,人們根據他們擁有的信息做出決策,并預測競爭對手的行為。這些步驟不會取代或否定軍事決策過程的任何步驟,它們只是關于如何以及在何處實施博弈論工具的建議。

鑒于這種情況,參謀人員開始制定敵人的行動方案。當應用于博弈矩陣時,這些行動方案成為敵人的策略。敵人可以用他們的一個師或軍將該地區軍事化,也可以選擇不軍事化。是否軍事化的選擇為敵人創造了兩種不同的戰略。第二步著眼于每個策略的結果。如果雙方都軍事化,那么他們將面臨戰爭。如果雙方都沒有軍事化,那么他們就維持現狀。如果一個國家軍事化而另一個國家不軍事化,那么軍事化的國家就會在沒有爭議的環境中這樣做。表11顯示了這種情況的結果。

表11:定性結果

第三步要求參謀人員查看敵人的動機,然后對他們的選擇進行定性分析。敵人想在美國不決定將該地區軍事化的情況下將該地區軍事化。這為他們創造了一個無可爭議的環境。其次,他們既不看重自己也不看重美國將該地區軍事化,這是現狀。第三個可取的結果是美國軍事化,而敵人沒有,這意味著美國擁有無可爭議的軍事化。最后,如果美國也進行軍事化,敵人不想升級為戰爭,也不想將該地區軍事化。工作人員現在可以根據偏好對敵人的行動路線進行排序。作戰和情報人員可以利用收集資產并制定收集計劃,以確定有關敵人計劃的任何指標,例如在該地區集結部隊。信息收集計劃有助于回答信息需求并協助進行有效規劃。

工作人員現在進入行動開發過程。生成選項步驟概述了指揮官和參謀人員可用的選項。工作人員制定了可以切實擊敗敵人行動方案的選項,然后確定它們的優先級。工作人員還產生了兩個廣泛的選項。他們可以軍事化,也可以不軍事化。由于每個參與者的策略,工作人員現在可以對他們的行動方案進行排序。指揮官和參謀更愿意維持現狀。如果美國采取行動將該地區軍事化,它可能會擾亂地方、國家政府和民眾。因此,美國對該地區的軍事化和一個不軍事化的敵人是次要的選擇。這種選擇意味著美國擁有無可爭議的軍事化,但正如所述,當地政府感到不安。第三,排名是美國不軍事化,但敵人軍事化,給了他們無可爭議的優勢。最后,美國不希望發生戰爭,如果美國和敵人都進行軍事化,就會發生戰爭。

接下來,工作人員將博弈發展為矩陣或戰略形式。首先,他們進行定性分析,說明每次交戰的可能結果,見表 12。然后參謀人員從每個指揮官的角度對結果進行排序,以生成定量分析和回報,如表 13 所示。該表顯示了回報敵方第一,美國第二。使用倒序排列,最低數字的收益表示排后的選項,數字越大,表示首選的選項。每個戰斗人員都是近鄰,因此參謀人員認為交戰將有利于主動一方。

表12 :定性分析

表13:定量結果

這兩種的價值在于員工進行分析以掌握對潛在未來結果的理解。它提供了一個簡潔的可交付產品,參謀計劃人員可以在一張紙上將其交給指揮官或參謀長,以供將來參考或思考,因為指揮官和參謀人員開始在軍事決策過程的未來步驟中權衡選項。這種分析為員工提供了一個思考他們正在做什么以及他們的計劃可能產生什么結果。這是舍恩所說的實踐中反思的一個例子。正如他所說,它允許人們在執行任務時思考他們正在做什么,然后塑造他們所做的事情。

下一步要求參謀人員將可用選項縮小到只有指揮官可用的可信選項。參謀部尋找指揮官永遠不會使用任何主導策略。敵方指揮官沒有任何主導策略,并且兩種策略都可供他使用。但美國永遠不會在博弈中選擇軍事化,因為無論敵人選擇什么,不軍事化都會主導博弈。表 14 以粗體突出顯示哪個選項在美國占主導地位。例如,如果敵人決定軍事化,如果它決定軍事化,美國將獲得 1 的回報,否則將獲得 2 的回報。因此,在這種情況下,美國會選擇不進行軍事化。同樣,如果敵人不軍事化,那么如果它軍事化,美國將獲得三倍的回報,如果它不軍事化,美國將獲得四倍的回報,美國將再次選擇不進行軍事化。因此,工作人員將其排除在外。

表14:以粗體突出顯示的美國的收益

既然參謀人員了解美國沒有軍事化的動機,它就可以看看敵人可能會采取什么行動作為回應。敵人知道美國不想軍事化,并尋求使其結果最大化。因此,敵人選擇軍事化,因為這比不軍事化帶來更好的回報。這達到了納什均衡,即敵人軍事化并獲得四分之二的回報,而美國不軍事化并獲得三分之二的回報。表 15 顯示了圈出的所得納什均衡。

表15:軍事化為主

但現實生活中的情況并不總是一致的。一方通常首先采取行動,迫使另一方做出決定。在上述情況下,美國正在努力應對將該地區軍事化的決定。然后他們的決定迫使敵人做出決定。下一步著眼于在順序移動游戲中情況如何展開,以及納什均衡在決策分析中是否發生變化。順序博弈見表 16。該表首先顯示了敵人的收益,其次是美國的收益。

表16:順序多次博弈

參與者對每個結果的選擇和回報保持不變。唯一的區別是美國先行動,敵人必須做出反應。工作人員必須使用子博弈分析來分析這個博弈及其結果。敵人有第二步,因此分析從他們的預期步驟開始。這兩個參與者都知道,如果美國選擇軍事化,敵人將選擇不軍事化,因為兩個人的回報比一個人要好。如果美國選擇不軍事化,敵人會想要軍事化,因為四比三好。鑒于美國的選擇,上面的表 16 通過圈出每個敵人的首選選擇來表明這種行為。既然美國知道敵人會根據美國的選擇做出哪些選擇,他們就會在兩者之間做出選擇。美國選擇軍事化,知道敵人不會軍事化,從而為美國帶來三倍的回報。美國軍事化總比不軍事化并獲得兩個回報要好,因為知道敵人會選擇軍事化。因此,納什均衡變成了美國軍事化和敵人不軍事化,敵方兩分,美國三分,見表 17。

表17:納什均衡

序列博弈導致的納什均衡與同步博弈不同,為什么?每場比賽都會導致一方軍事化,而另一方不軍事化。在同步博弈中,敵人通過軍事化獲得了最有利的回報,美國知道這一點,因此選擇不軍事化。然而,在順序博弈中,美國先決勝負。如果他們不軍事化,他們將獲得最高的回報,而敵人也選擇不軍事化。兩國都不會軍事化,因為如果美國不軍事化,敵人就有動機進行軍事化。美國意識到這一點,因此認為他們的下一個最佳選擇是軍事化,因為它知道敵人不會軍事化,因為這會迫使兩個參與者之間發生戰爭。這個游戲提供了一個先發優勢的例子。如果敵人先選擇,他們也會有軍事化的動機

序列多次博弈反映了更現實的情況。但是運行這兩種類型的博弈為工作人員了解動機和潛在行動提供了分析價值。工作人員可以看到排序操作如何改變結果。如上所述,使用這種方法的價值在于分析。工作人員可以按照矩陣形式對每個結果進行簡要說明。然后他們可以看到他們的選擇之一不是一個可行的選擇。然后,他們查看了定量評估并確定可以使用平衡結果。所進行的定性分析重申了 Thomas Schelling 的觀點,即博弈論的數學并不總能解決沖突,不應過度依賴數學。而是對問題的思考增加了價值。

結論

博弈論提供了一種分析工具來看待競爭情況。它使分析師能夠了解潛在的行動計劃、激勵措施以及回報或結果。此外,它可以突出信息差距和需要進一步理解的領域。在 20 世紀中葉,戰略層面的規劃者用它來更好地了解美國和蘇聯之間在使用核武器和原子戰方面的競爭。國防部以外的分析師使用它來了解競爭公司之間的貿易爭端和降價。

在作戰層面,博弈論允許對潛在計劃、激勵和結果進行相同類型的分析和理解。這本專著審視了博弈論的歷史并探索了基本的博弈論,確立了博弈論在分析沖突情況方面的有用性。文獻回顧揭示了博弈論的優勢和劣勢,這為如何最好地利用它以最大限度地發揮其潛力提供了信息。檢查諸如核局勢和國際貿易等戰略層面的決策為以前的努力如何有效地應用博弈論提供了背景。博弈論在特倫頓和普林斯頓的美國獨立戰爭中的應用與指揮官們所追求的不同,展示了使用博弈論如何提供獨特的見解,這對于像康沃利斯這樣經驗豐富的將軍來說并不明顯。最后,該專著展示了軍團級別的參謀人員如何使用博弈論來理解戰略級別的決策如何影響作戰級別的行動,比較了同步博弈和序列博弈的實用性。最后一部分提供了一個基本框架,工作人員可以通過將博弈論應用于任務分析和行動開發過程來解決操作問題。

博弈論的使用不僅限于軍事決策過程。博弈論非常適合國防部和美國陸軍目前使用的現有規劃流程。規劃人員可以在聯合作戰設計過程和陸軍設計方法中使用博弈論工具。具體來說,在聯合設計期間,博弈論工具最適合理解戰略指導和理解作戰環境。在軍隊設計期間,它最適合構建作戰環境和理解問題。博弈論是參謀人員或計劃團隊的工具包中的另一個有用工具。當通過軍事決策過程或設計過程應用時,博弈論分析與其他工具很好地結合在一起,可以更好地了解作戰環境。

付費5元查看完整內容

【標 題】

Wargaming in Professional Military Education: Challenges and Solutions

職業軍事教育中的兵棋推演:挑戰與解決方案

【作 者】

美國海軍陸戰隊埃里克·沃爾特斯(Eric M. Walters)上校(退役)

【摘 要】

鑒于強調在專業軍事教育中使用兵棋推演,學校、作戰部隊和支持機構的教官——尤其是那些本身沒有經驗的兵棋推演者——如何去做呢?本文解釋了在經驗豐富專家的幫助下,為選定、修改或內部設計的嚴格兵棋式推演制定理想的學習成果的必要性。總結了最近的相關學術成果,它提供了促進協作對話的基本術語和概念,并就這種動態和沉浸式教學方法的常見但可避免的陷阱提供了建議。

【正 文】

對于那些認為兵棋推演不僅僅是一種娛樂消遣的人來說,商業兵棋推演曾經是——而且可以說仍然是——一種小眾愛好。在 20 世紀和 21 世紀初的歷史中,只有相對較小比例的軍人和學者經常進行所謂的嚴格式兵棋推演。過去,這一想法受到制度性的抵制,在職業軍事教育(PME)中使用一些人認為是兒童游戲的東西;雖然最近這種恥辱感有所減輕,但對于外行來說,兵棋推演的學習障礙仍然很高。兵棋推演可能很難學習,甚至更難戰勝有能力的對手。然而,我們已經到了 2021 年,軍事兵棋推演似乎正在 PME 學校、作戰部隊甚至支持機構中復活。海軍陸戰隊司令大衛 H. 伯杰將軍在他的指揮官規劃指南中,強調了在 PME 中練習軍事決策的必要性,這是教育兵棋推演的主要目的。但一個事實仍然存在。對于那些有興趣使用和設計兵棋推演來教授軍事判斷力的人來說,這種教學方法似乎很難有效實施。學術界的成功案例涉及作戰部隊中已經是兵棋推演者的教授、教官和海軍陸戰隊領導人。不是兵棋推演者但教軍事決策的人如何弄清楚要使用什么兵棋推演?如何使用它?各種可用游戲的優點和局限性是什么?整合兵棋推演和課程有哪些挑戰,如何克服這些挑戰?本文旨在幫助那些不熟悉兵棋推演的人定位,并就在教授決策中的軍事判斷時使用它們的經過驗證的最佳實踐提供建議。

提 綱

1 教育者如何使用游戲來教學生?
1.1 了解戰術、作戰和戰略中力量、空間和時間之間的關系
?1.2 在兵棋推演中模擬現實“決策環境”以解決決策困境
?1.3 在兵棋推演環境中體驗摩擦、不確定性、流動性、無序和復雜性的交互動力學
1.4 鍛煉創造性和批判性思維:準備、參與和分析兵棋推演活動

2 哪種類型的兵棋推演最適合學習目標?
?2.1 角色扮演游戲 (RPG)
? ?2.2 研討會矩陣游戲
2.3 系統游戲
?2.4 紙牌游戲

3 哪種情況最適合使用——歷史情景還是假設情景?

4 兵棋推演教學——挑戰與解決方案
?4.1 克服設計偏見
?4.2 時間和復雜性的挑戰
?4.3 對教師要求的考慮
?4.4 兵棋推演支持單位教育和凝聚力

付費5元查看完整內容

?美國國防部已經可以開始應用其現有的國際科技協議、全球科學網絡以及在多邊機構中的作用來促進數字國防合作。本報告將這些選項集合構建為軍事人工智能合作工具箱,可為調整政策、推進研究、開發和測試以及連接人員提供了有價值的途徑。

美國將人工智能 (AI) 的領導地位視為提升其在國際體系中的戰略地位和保持其未來軍事優勢的關鍵。美國的盟友和伙伴網絡是服務于這些目標的不對稱資產,正如旨在讓美國為當前戰略競爭時代做好準備的國家安全和國防政策所確認的那樣。

最值得注意的是,美國國防部 (DOD) 人工智能戰略中宣布的關鍵舉措和國家安全委員會關于人工智能的建議表明了國際參與對人工智能安全、安保、互操作性和與民主價值觀保持一致的重要性。

簡而言之,人們一致認為,加強聯盟和伙伴關系很重要,不僅因為美國在聯盟中行動,而且因為俄羅斯等經常單獨行動。由于技術加速如何推動軍事進步、刺激經濟增長和塑造21世紀的治理模式,人工智能和其他新興技術是與這些近乎同等競爭對手競爭的核心。如果不深化與盟友和伙伴的合作,美國既無法應對大國帶來的挑戰,也無法從塑造人工智能的民主軌跡中獲益。

在此背景下,本報告重點關注通過基于可互操作部隊和尖端技術的強大軍事關系,維護美國及其伙伴和盟國網絡相對于潛在對手的優勢的必要性。國防部已經擁有多種工具可用于深化與其盟國和國際安全伙伴的科技(S&T)合作。但為了充分利用它們在人工智能方面的潛力,該部門需要重新設想并更好地整合它們。

為此,此處的分析將現有的國防科技協議、軍事科技交流和多邊機構的要素構建為軍事人工智能合作工具箱。這項工作不僅僅是為人工智能能力開發集中資源,還包括政策調整;測試、評估、確認和驗證 (TEVV) 管道;研發(R&D)、人員交流;數據共享;和標準化。這里的目的不是提出新的協議,而是回答國防部如何利用其現有的科技合作機制來支持數字時代的軍事合作,確保相關資源和框架在尋求人工智能領導力和未來時不會被利用聯軍成功。

雖然應該承認挑戰,包括圍繞數據交換的敏感性和對技術政策的不同政策觀點,但隨著時間的推移,它們也可以成為合作以減輕這些障礙的動力。換言之,現有工具有助于在政治信任、凝聚力和互操作性方面獲得更多支持,從而使合作有助于應對數字威權主義和技術驅動的國際安全環境變化的共同挑戰。 主要發現是:

  • TEVV 是軍事人工智能合作的一個重要但代表性不足的特征。一系列活動可以納入 AI 的合作 TEVV 管道,包括聯合測試、試驗、實驗、培訓、練習以及建模和模擬。
  • 利用國防科技協議就共同的研發優先事項進行合作,有助于為其他形式的人工智能合作建立良好意愿,包括與民主價值觀保持一致。
  • 軍事人工智能合作不是純粹的技術努力。促進政策和人員聯系的技術、人力和程序措施對于推進可互操作的人工智能采用同樣重要。
  • 印度-太平洋地區的盟國和合作伙伴在現有軍事人工智能合作工具箱所涵蓋的主要協議和機構中的代表性不足。

雖然軍事人工智能合作的某些方面可能需要新的投資、機制和協議,但這不應該排除現有工具可以用于新用途的多種方式。軍事人工智能合作工具箱之所以有吸引力,正是因為它可以在短期內啟動,滿足與盟友和伙伴盡早建立互操作性和推進人工智能的緊迫性。

付費5元查看完整內容

【導讀】2021年國際萬維網大會The Web Conference(舊稱WWW)將于2021年4月19日-23日線上召開。TheWebConf是中國計算機學會(CCF)推薦的A類國際學術會議,是互聯網技術領域最重要的國際會議之一,由國際萬維網會議委員會(IW3C2)和主辦地地方團隊合作組織,每年召開一次,今年是第30屆會議。本次會議共接收1736篇提交長文,最終錄用357篇,錄用率為20.6%。剛剛最佳論文一系列獎項出爐了!來自華盛頓大學的強化學習在線心理健康應用《 Towards Facilitating Empathic Conversations in Online Mental Health Support: A Reinforcement Learning Approach》獲得最佳論文,臺灣國立交通大學《ConceptGuide: Supporting Online Video Learning with Concept Map-based Recommendation of Learning Path》獲得最佳學生論文!

本屆大會采用ZOOM軟件開展網絡會議。你可以在會議中回顧過去30年的Web技術和行業的變遷,分享最新研究成果,并規劃基于Web技術的未來研究。會議目前公開了三項主題演講,多研究方向介紹,研討會和教程,博士學位會議等環節。會議匯聚了眾多在大數據、人工智能、醫療保健、計算機科學、計算社會科學、公共政策、法律和人權等領域最杰出和最有影響力的研究人員,開發人員,決策者和思想家,他們將討論如何創建未來的Web–即多樣化,中立和平衡的Web,能夠真正實現內容訪問民主化夢想的Web。

詳情可登陸以下會議官網查詢://www2021.thewebconf.org/

「最佳論文獎」(Best Paper Award)

促進在線心理健康支持中的共情對話:一種強化學習方法

作者: Ashish Sharma, Inna W. Lin, Adam S. Miner, David C. Atkins, Tim Althoff

摘要:在線點對點支持平臺使數百萬尋求和提供心理健康支持的人能夠進行對話。如果成功,基于網絡的心理健康對話可以改善獲得治療的機會,并減少全球疾病負擔。心理學家多次證明,同理心,即理解和感受他人情緒和經歷的能力,是在支持性對話中取得積極成果的關鍵因素。然而,最近的研究表明,在在線心理健康平臺上,高度共情的對話非常罕見。

在這篇論文中,我們致力于改善在線心理健康支持對話中的共情。我們引入了一項新的共情改寫任務,旨在將低共情會話職位轉化為高共情。學習這種轉換是具有挑戰性的,需要深刻理解同理心,同時通過文本的流暢性和對話語境的特異性來保持對話質量。在這里,我們提出了PARTNER,一個深度強化學習代理,學習對帖子進行句子級編輯,以增加表達的同理心水平,同時保持對話質量。我們的RL代理利用了一個基于GPT-2 transformer語言模型的策略網絡,該模型完成了生成候選共情句子和在適當位置添加這些句子的雙重任務。在訓練過程中,我們獎勵那些在保持文本流暢性、上下文特異性和多樣性的同時增加共鳴的轉換。通過將自動評估和人類評估相結合,我們證明了PARTNER成功地產生了更多的共情、具體和多樣的反應,并在風格遷移和共情對話生成等相關任務中表現優于NLP方法。我們的工作對促進網絡平臺上的共情對話有直接的影響。

「最佳學生論文獎」(Best Student Paper Award)

ConceptGuide: Supporting Online Video Learning with Concept Map-based Recommendation of Learning Path

人們越來越多地使用YouTube等在線視頻平臺來查找教育視頻,以獲取知識或技能,滿足個人學習需求。然而,大多數現有的視頻平臺都是根據查詢的相關性以通用的排名列表的形式顯示視頻搜索結果。面向關聯的信息顯示設計沒有考慮知識領域的內部結構,可能不適合在線學習者的需求。在本文中,我們提出了ConceptGuide,一個原型系統的學習方向,以支持從無組織的視頻材料臨時在線學習。ConceptGuide的特點是一個計算管道,它對檢索到的YouTube視頻文本進行內容分析,并生成基于概念圖的概念間和視頻間鏈接的視覺推薦,形成供學習者消費的學習路徑結構。我們評估了ConceptGuide,將其設計與YouTube的通用界面在學習經驗和行為方面進行了比較。ConceptuGuide被發現可以提高視頻學習的效率,并以許多建設性的方式幫助學習者探索感興趣的知識。

付費5元查看完整內容
北京阿比特科技有限公司