本文將對當前的朝鮮導彈危機進行博弈論分析。首先,本文將從現有文獻中找出參與博弈的各方可供選擇的方案,并為各方可能的方案組合確定一個排序(從最佳到最差)。將利用移動理論(ToM)來預測危機的最終結果。此外,這還需要談判開始時的初始 "博弈狀態",以及博弈中的先行者,兩者均由危機歷史給出。ToM 允許各方嚴格輪流從初始狀態出發。每輪移動時,棋手可以選擇移動(回到之前的狀態或前進到另一個狀態),也可以選擇放棄(保持當前狀態)。當棋手選擇連續幾輪都不移動,即接受當前狀態為最終結果時,就達到了均衡。
每個棋手的偏好排序都很難確定,因此考慮了各種可能性。通過閱讀有關危機歷史的現有文獻以及相關國家所表達的利益,發現了一系列貌似合理的可能性,值得在本分析中加以考慮。使用 ToM 方法將這一系列可能性分為三個子集,每個子集都會產生不同的最終結果。將 ToM 的預測結果與流行的博弈論方法納什均衡(NE)進行比較。因此,分析將危機的可能結果從九種縮減為三種,并指出兩國的偏好排序如何影響這三種結果中的哪一種。
表 1:共享納什均衡和最終結果的博弈
本文采用混合方法探討 "軟件即武器"(SaaW)這一主題,融合了計算機科學、國際關系和戰略研究的元素。
因此,首先通過對軍官、學者和其他人員三類受訪者進行問卷調查,探討了軟件、惡意軟件和武器化軟件的性質。結果顯示,參與者對防御性軟件能力對國家安全的重要性達成了共識。然而,根據受訪者的培訓和背景,有關軟件性質的問題在統計上表現出顯著差異。例如,在決定是否應像對待實物一樣對待軟件,或惡意軟件是否是一種武器時。然而,也有一些共識,如防御性軟件能力對國家安全至關重要。
第二部分研究了促使行為者追求 SaaW 的因素。探討了有關擴散的爭論,并研究了與傳統武器(包括核武器、生物武器和化學武器)以及小武器和輕武器的異同。然后利用這些因素創建一個貝葉斯網絡模型,代表行為者的動力來源。根據這一模型,可以推理出互補和競爭力量的相互作用。通過考慮限制和激勵因素,該模型為有關網絡領域行動者動機的辯論引入了客觀性,為各種利益相關者提供了評估行動者軟件武器化可能性的工具。
為了展示和評估該模型,我們使用了三種不同的行為者,分別代表恐怖分子、國家政權和一般攻擊者。定量數據與定性訪談相結合,用先驗概率和觀察到的依賴關系的相對權重填充網絡節點。結果顯示,一般攻擊者實施 SaaW 的概率是不確定的,這很好地反映了這一情景的性質。國家行為者也表現出矛盾性,但在這種情況下,幾乎同樣高的能力反制了高約束,而激勵力量卻很低。另一方面,盡管限制因素很低,但由于缺乏能力和動機有限,恐怖主義行動者的可能性為中低。
總之,本文強調了網絡安全的跨學科性質,并提供了來自計算機科學、國際關系和戰略研究的新工具和概念來理解 SaaW。
本文以跨學科為重點,為網絡安全做出了四項核心貢獻:
1.一項基礎研究,考察不同人群對軟件、惡意軟件及其武器化的看法和概念,包括創建一個數據集(見 1.2.1)
2.一個概念模型,描述有助于追求 SaaW 的各種因素,將 CS 和 IR 學科結合起來,可供各利益相關方使用(見 1.2.2) 3.
3.該模型的 BN 實施,可進行經驗評估和調整(見 1.2.3)
4.建立一個新的數據集,用于評估行為者追求 SaaW 的動機(見 1.2.4)。
在結構良好、信息完備的環境中,決策制定是無法保證的。研究中的任務通常側重于在無限時間框架內利用完整信息做出決策,而在信息缺失或不確定的情況下,當前的研究并未涉及缺失信息在環境中的分布所產生的影響。本文旨在具體了解這些信息分布如何影響時間壓力下的決策者,以及如何在一系列決策策略中為不完美環境下的決策提供最佳支持。這項工作有三方面的貢獻。首先,研究結果表明,在六項以不同信息復雜性和決策策略偏差為特征的獨立人體研究中,所研究的三個信息分布因素(即總信息、完整屬性對和信息不平衡)對決策準確性具有顯著的預測作用。其次,本論文通過信息估計和決策前信息搜索的視角,強調了專家和新手行為的關鍵差異,這進一步解釋了不確定性下的個體差異,并為這些環境下的決策支持系統(DSS)提供了新穎的設計考慮。最后,在啟發式和分析式偏差環境中,信息修正和選項預測決策支持系統的應用表明,各成績組的準確性顯著提高,響應時間顯著縮短。
圖 3.2:參照兩個示例目標(危險程度高的導彈和危險程度低的運輸工具)的可視化決策任務。
要回答所有研究問題,就必須能夠在信息不完整的情況下,在人體實驗中將這些問題具體化。為此,下文將簡要介紹本論文中使用的兩種決策環境,并在后續章節中對其設計和實施進行詳細說明。
第一個環境要求參與者扮演一艘軍艦上的防空作戰協調員(AAWC),其領空內有目標。決定目標敵意的決策標準基于四個二元線索:高度、速度、與中立空中走廊的距離和大小。標準分數由每個選項的提示分數的線性加權組合計算得出,提示按提示加權的等級順序顯示。參與者只需從兩個目標中選擇一個最危險的目標,并與飛機交戰。每個決定都必須在 20-30 秒內做出,參與者可使用彩色計時器進行時間管理。
第二個環境是由 Unity 游戲引擎構建和托管的車道防御游戲。游戲的每一輪都有一組獨特的三個選項,它們從屏幕左側沿著三條車道中的一條向屏幕右側移動。參與者有 60 秒的時間來判斷這三個選項中哪個最危險。為了做出決定,參與者可以訪問詳細的情報菜單,該菜單顯示了描述每個敵人敵意程度的五個提示值(武器、體型、裝甲、盾牌、頭盔),這些提示值按提示權重排序顯示。在以前的 AAWC 環境中,參與者需要根據閾值臨界值對每個可用線索值做出敵意/非敵意判斷。在這個環境中,參與者的這一過程被簡化了,非敵意提示值用綠色向下箭頭表示,敵意提示值用紅色向上箭頭表示。新環境的特點包括幾乎雙倍的可能信息總量、信息訪問跟蹤以及更靈活的用戶界面設計,所有這些都有助于對所有三個研究問題進行更詳細的探討。
在信息缺失或不確定的環境中,信息的分布如何影響決策結果,文獻尚未對此有全面的認識。本論文在一系列決策環境的人類受試者研究中考察了信息結構的三種測量方法(TI、CAP、II),并證明信息不平衡最小化和完整屬性對最大化最有利于提高決策準確性(第 4、5、8 章)。研究發現,總信息量的增加總體上有助于提高準確性,但如果不包含 CAP 和 II,則不足以解釋準確性的提高。此外,生態合理決策策略(由環境結構定義)對這些結果也有影響(第 8 章)。經測試發現,補償生態學(WADD、高分散和低分散)對信息結構的變化更為敏感,而非補償生態學(TTB)則不太敏感,尤其是對信息不平衡的變化。
此外,本論文還研究了對缺失信息進行估計的作用,并首次對決策者的估計策略進行了直接征詢。這項在 AAWC 環境中完成的研究(第 5 章)表明,新手傾向于估計幾乎所有缺失信息,而任務專家則能夠忽略信息,主要根據第一個可用的(也是最重要的)線索來估計信息。這與 Lane Defense 研究(第 8、9、10 章)中的策略選擇數據相吻合,這些數據表明,無論環境結構如何,新手都傾向于補償性決策行為,這違反了非補償偏置環境中的生態合理性。
最后,決策支持在被拒止和退化的環境中所能發揮的作用在這里得到了更充分的證實。第 6 章測試了獲取和限制信息的概率方法和基于規則的方法,結果表明基于規則和基于概率的修改技術都能帶來更大的決策結果。第 9 章將支持系統的設計向前推進了一步,對比了基于圖形用戶界面的隊友與基于獲取的隊友,前者可以卸載信息估算,而后者則采用第 6 章中基于規則的方法為參與者收集缺失的信息。結果發現,這兩種方法都能顯著提高新手和專家的成績。
軍事創新過程在戰時和平時具有不同的特點。戰時創新有戰場的直接反饋。和平時期的創新必須考慮到各種可能的未來,同時還要面對信息不完善所帶來的不確定性。軍事創新研究表明,實驗為克服這一挑戰提供了工具。現有的學術研究將實驗描述為一個迭代學習的過程,它能產生關于未來戰爭的新數據,并引用了美國航母戰和德國聯合武器演習等歷史實例。
本文認為,要理解實驗如何支持和平時期的創新,這種觀點并不全面。與其說實驗揭示了未來戰爭的本質,倒不如說實驗作為一種建立共識的工具最具價值。和平時期的軍事實驗是一個社會過程,在這一過程中,組織、團體和行動者影響著國防政策子系統內的意識形態競爭。社會過程包括構建知識,并就 "什么是真實的 "和 "什么是有效的 "達成共識。在戰爭期間,這一過程是通過戰場上的共同經驗實現的。在和平時期,這一過程發生在實驗過程中。軍事實驗需要高層領導的支持,但僅靠支持并不能在關鍵群體中達成足夠的共識。為了提高實驗向創新過程的實施階段過渡的可能性,國防政策制定者利用宣傳網絡(由國防政策制定者和政策影響者組成的松散聯盟)在整個國防政策子系統中建立共識。
本論文在三個案例研究中考察了這些論點:20 世紀 80 年代陸軍的摩托化概念實驗、20 世紀 90 年代陸軍的新路易斯安那演習和二十一世紀部隊實驗,以及 20 世紀 90 年代末和 21 世紀初聯合部隊司令部的聯合實驗。就國防政策而言,本文的研究結果表明,國防決策者應集中精力擴大宣傳網絡,將實驗與更廣泛的國防政策子系統聯系起來,以最大限度地發揮實驗的作用。此外,實驗還要求領導者在思想上與新理念保持一致,能夠傳達新理念的價值,擁有可靠的實戰經驗,并參與到宣傳網絡中,將實驗與關鍵群體聯系起來。最后,有效的實驗要求領導者在其職業生涯的早期經常接受必要的教育和體驗。
軍事創新過程
本文探討了在烏克蘭沖突的第一年(2014 年 2 月至 2015 年 2 月)中,影響烏克蘭決策者在與歐盟和俄羅斯的關系中做出反應的因素。為解釋烏克蘭的決策,論文采用了博弈論啟發的分析框架,該框架基于四個核心博弈論要素:信息、信任、回報和資源。本研究旨在從三個主要方面豐富文獻:將博弈論啟發的分析框架應用于外交政策分析(并將博弈論的應用擴大到正式建模之外)、將這一分析框架應用于烏克蘭戰爭,以及關注烏克蘭的決策(而非歐盟與俄羅斯的關系)。在方法論方面,論文的貢獻在于設計了訪談指南和訪談項目,將博弈論元素應用于分析框架。還對烏克蘭、歐盟和俄羅斯的政策制定者(政治家、外交官和記者)進行了 38 次精英半結構化訪談。此外,還分析了官方文件和媒體報道,這有助于對訪談數據進行三角測量。按照第一年的四個主題和三個時期進行的專題分析使能夠根據烏克蘭決策者對事件的看法來組織研究結果。
博弈論文獻為提供了外交政策決策中的關鍵要素:有關其他國家(及其領導人)偏好的信息;對來自外國對話者的信號(包括正面和負面信號)的信任;所有參與者的回報結構(他們每個人可能得到的結果);各方的資源及其在特定互動中投入這些資源的意愿。運用這一基于博弈論的分析框架,可以解釋烏克蘭領導人在 2014 年 2 月至 2015 年 2 月期間與歐盟和俄羅斯對話者關系中的決策。核心實證研究結果表明,烏克蘭決策者有限的外交政策分析和缺乏危機管理經驗是如何導致他們對歐盟和俄羅斯的行動產生誤解的。還指出了削弱烏克蘭外交政策能力的因素:革命后權力結構的變化、領導人原本不愿意為自己的戰爭決策負責、高級官員的腐敗、俄羅斯領導人不可預測的形勢步驟,以及歐盟和俄羅斯有意或無意發出的誤導信號。不過,數據也顯示,在戰爭的第一年里,烏克蘭領導人在外交政策分析和決策方面有學習和改進的跡象。
論文分為引言、五章和結論。第一章介紹了文獻綜述,描述了論文旨在填補的空白,介紹了基于博弈論的分析框架,并解釋了該框架將如何幫助回答研究問題。第二章討論了決策者在 1991-2014 年間如何制定烏克蘭的獨立外交政策,尤其側重于該國與歐盟和俄羅斯關系的演變。接下來的三章涉及 2014 年 2 月至 2015 年 2 月這一時間段,并介紹了通過訪談和文件分析得出的原始實證研究結果。根據關鍵時刻和升級/降級時刻將這一年分為三個時期。起點是 2014 年 2 月 21 日,即亞努科維奇與反對派領導人達成協議以及亞努科維奇傍晚離開基輔(第二天離開該國)的日子。次日晚,即 2 月 22 日至 23 日,普京與幾位顧問舉行了一次會議,會上顯然做出了奪取克里米亞的決定。第三章討論的吞并克里米亞時期于 3 月 26 日結束,這一天俄羅斯接管了烏克蘭在半島上的大部分財產。下一個時期是第四章的主題,從 3 月 26 日持續到 9 月 5 日。這一時期包括 3-4 月頓巴斯的叛亂、反恐行動的開始以及夏季爆發的公開戰爭。本章在《明斯克協定一》的關鍵時刻結束。這一時期發生了許多相關事件,一些學者強調了 5 月 25 日總統選舉后暴力的變化和烏克蘭政治的轉變(阿列克謝耶夫,2016 年;馬普爾斯,2016 年)。不過,將這五個月放在一章中研究,因為吞并克里米亞以及明斯克第一和第二協議是更重要的關鍵時刻,這一點也得到了大多數受訪者的認可。第五章探討了《明斯克協議一》和《明斯克協議二》之間的時期。決定在 2015 年 2 月 12 日結束研究時間框架,因為直到撰寫本文時,《明斯克協議》仍是解決沖突的核心文件,而且僅集中研究這第一年在學術意義上是有價值的,因為這一年發生了如此豐富的事件,參與者的觀念和互動也發生了如此多的變化。在每一章實證研究的末尾,都會附上一張表格,列出在這一時期的核心實證研究成果。現在,將開始對博弈論框架進行更細致的討論,這將使能夠開展進一步的分析,并使新穎的實證研究結果更有意義。
隨著大數據的興起,信息的傳播速度也在不斷加快。速度將影響基于信息的決策。問題是,信息速度、連續性和真實性的提高是否有助于提高組織中決策者的決策質量。這種決策質量可以通過解決智能體在決策過程中對速度和準確性的權衡來解決。為了了解信息速度對決策質量的影響,本研究探討了速度對速度-準確性權衡的影響。本研究在決策過程中分析了這種權衡的背景。
關于大數據的興起及其對組織決策過程的影響,目前已有相關研究。這些研究從所有四個方面對大數據進行了描述:數量、速度、種類和真實性;不過,有關速度對這些過程的具體影響的研究尚未問世。本研究有助于理解信息速度的概念以及這種速度對決策過程的影響。我們將通過描述信息速度對速度和準確性之間權衡的影響來探討這一問題。有關速度、速度-準確性權衡和決策過程的現有文獻為本研究提供了方向。
為了探討信息對速度和準確性之間權衡的影響,本研究采用了基礎理論方法,在現有文獻和收集的數據之間反復推敲,以構建有關信息速度對速度-準確性權衡影響的理論。
我們在 Da Silveira 和 Slack(2001 年)的模型基礎上建立了一個模型,以解決速度對如何在速度和準確性之間進行權衡的影響問題。該模型經過調整,適用于智能體的行為影響過程中的權衡的情況。通過使用該模型,可以確定流程中的下一個因素:必要條件、一個目標給另一個目標帶來的變化、能力的有效性以及智能體如何平衡權衡的選擇。為了確定這些因素,采用了實證研究來解決這一問題,因為智能體的選擇是可以觀察和質疑的。實證研究是在一個案例研究中進行的:荷蘭國防部組織內的一個情報流程。實證研究采用了兩種方法:人種學觀察和訪談。訪談用于了解智能體所感知到的取舍,并深入了解導致這些取舍的因素。在人種學研究過程中,發現智能體在速度和準確性之間的實際權衡。數據收集過程的結果被整合到一個模型中,以解決信息速度對速度和準確性之間權衡的影響。
通過實證研究方法收集的數據,我們構建了一個關于速度和準確性之間權衡影響的模型,如圖 S.1 所示。
圖 S.1: 信息速度對速度-準確性權衡的影響模型
該模型是通過分析在進行實證研究的背景下收集的數據構建的。這種環境受到以下背景因素的影響:所有接收到的信息都應進行分析的規則、交付結果的明確截止日期、流程中特定智能體的特定任務以及主要通過報告共享信息。
信息速度的影響既有消極影響,也有積極影響。積極影響包括信息可用性的提高,盡管這種影響只有在沒有信息進行分析過程時才會顯現。負面影響包括信息的可理解性降低,從而降低分析能力、速度和準確性。另外,當最后期限固定時,高信息速度導致的工作量增加要求智能體具有更高的速度水平。這種效應會導致結果的準確性降低,而在決策可能對人的生命造成高風險的情況下,這種結果往往是不可取的。
雖然速度提高后信息流動速度會加快,但如果不對當前決策過程的組織結構進行調整,決策過程的速度就不可能提高。而且,在特定情況下,當信息速度提高時,決策所依據的信息的準確性也可能降低。速度可以通過提高信息可用性為決策過程帶來機遇,但為了應對速度帶來的負面影響,應改變決策過程的組織結構。
在這項研究中,我們發現了信息速度對速度-準確性權衡的影響。這項研究是在特定背景下進行的,研究人員的主觀性影響了所構建的結果。為驗證研究結果,應在不同組織內,由多名研究人員和受訪者通過訪談和人種學研究開展更多實證研究。此外,基于 Da Silveira 和 Slack 模型開發的模型也應得到驗證,以適合解決智能體如何在目標之間進行權衡的問題。
本論文創建了一個矩陣,用于比較美國國防部發布的四份冷戰后《核態勢評估報告》(NPRs)。這些白皮書的并列比較揭示了美國核政策的顯著趨勢。矩陣首先將《核態勢評估報告》中的主題歸入國際關系研究中常見的范式。這些范式包括宣言政策、采購政策、就業政策和部署政策。本論文首先分析了 NPRs 的歷史以及學術界和國際社會對 NPRs 的反應。接著,論文對已確定的主題進行了公正的總結,因為這些主題是通過 NPRs 追蹤到的。然后,本論文根據矩陣、學者對 NPRs 的反應以及與美國力量結構和全球威脅環境相關的其他研究(如美國與大國之間的經濟相互依存關系及其對兩國關系的影響),分析并批評了核政策的發展趨勢。一些政策趨勢遵循黨派路線,另一些則不然。有些變化無常,有些則更容易預測。就美國的核態勢和全球威脅環境而言,這些趨勢的價值驗證了一些擔憂,反駁了另一些擔憂。論文的結論是,有核武器的世界更安全,雖然無核武器世界是未來決策者的一個負責任的目標,但在可預見的未來這根本不切實際。
本論文認為,空軍因作戰原因而產生的網絡風險將造成深遠的戰略后果。通過對現有文獻的全面研究,論文強調了知識中的一個關鍵缺口,即未能繪制空中力量網絡風險的作戰原因與戰略后果之間的聯系圖,而這種風險一旦實現,將威脅到國家的作用,并在極端情況下威脅到國家的生存,從而對現有觀點提出了挑戰。本論文承認風險的突發性和情況的特殊性,即并非所有國家都依賴空中力量,而且風險的大小與嚴重程度成反比,但同時認為這些戰略后果的實現是 "何時 "的問題,而不是 "如果 "的問題。論文以風險管理框架為基礎,輔以文獻綜述和案例研究,提出了意見和建議,并為進一步研究提供了途徑,以降低空中力量的網絡風險。如果采納,學術界和從業人員將有機會協同行動,填補已確定的知識空白,并積極應對風險。反之,如果忽視并不遵循這一途徑,本文了預測,其影響將導致空中力量的網絡風險重塑 21 世紀地緣政治格局的無法緩解的戰略后果。
本論文認為,盡管空軍的網絡風險是由作戰原因造成的,但它將在戰略國家層面上產生失去作用或在極端情況下生存的后果。這一論斷建立在現有大量作戰和戰略層面的文獻基礎之上。然而,在研究這些文獻時,論文對當前的思維提出了挑戰,指出了由于未能描繪作戰和戰略層面之間的因果關系而造成的知識空白。如果學術界不理解并由實踐者管理這一知識空白,就會產生一種風險,即日漸成熟的運營原因將成為已確定的戰略后果的催化劑。
本論文通過詢問空軍網絡風險的作戰原因將如何產生戰略后果來強調這一風險,從而為采取緊急行動提出了明確的理由。論文的結論部分提出了意見和建議,為啟動這一行動、充分解決知識差距和實現實際發展提供了知識跳板。這篇論文的最終目的是激勵后續研究,推動取得進展,從而管理空中力量網絡風險的原因,減輕其后果,使其成為歷史的注腳。如果不能實現這一發展,論文警告說,風險將在知識的陰影下增長,并預測戰略影響將是嚴重的。在這種情況下,當作戰原因不可避免地成為空中力量的網絡風險時,那些依賴空中力量的國家將看到自己的社會角色甚至生存受到威脅。
為確保這些論點能夠深入展開,論文的第一部分首先通過對作戰和戰略文獻的概述介紹了這一主題,從而確認了已確定的知識差距。在此基礎上,第 1 部分通過定義網絡的總體概念和介紹指導研究的國際關系(IR)理論,完成了基礎性討論。
在此基礎上,第 2 部分的論文通過系統地探討以下三個已確定的原因,直面航空力量的網絡風險為何具有戰略性質的問題:具有全球作用或生存威脅的國家對航空力量的依賴、緊迫漏洞的識別以及可行威脅的出現。然后,這些原因造成的戰略后果將通過第 3 部分的一系列案例研究加以闡述,這些案例研究雖然側重于西方國家和結盟國,但被認為具有普遍意義。
論文最后在第 4 部分總結并提出了明確的意見和建議。正是在這些內容中,我們將確認知識上的差距,將知識的跳板具體化,并呼吁采取行動,以保護國家免受戰略后果的影響。
要引導這一討論,并以所需的嚴謹性得出這些結論,就必須采用強有力的方法。本論文的研究和實施都建立在基于風險管理的框架內。
在介紹了總體論點并概述了研究方法之后,論文將在第 1 部分確認知識差距并探討基本概念。在此基礎上,風險管理方法將在第 2 部分和第 3 部分中展開,然后在第 4 部分的結論、意見和建議中提供知識跳板。這一跳板如果得到利用,將彌補知識差距,確保空中力量的網絡風險不會成為 21 世紀的決定性因素。
本文是研究指揮與控制(C2)未來表現形式的四篇系列論文中的第一篇。第一篇論文通過探討未來指揮與控制(C2)系統需要在其中運行的未來作戰環境,為后續研究設定了基線。具體來說,本文探討了復雜性的驅動因素、表現形式和影響,而此前的研究表明,復雜性很可能是這一環境的特征。為此,它討論了 C2 和復雜性等關鍵術語的定義;介紹了未來運行環境中復雜性的一些驅動因素,并討論了這些因素如何對 C2 系統和組織造成新的壓力;研究了分析和理解復雜性的可能方法;并概述了 2030 年代及以后可能產生的一些實際考慮因素。由于本文旨在為本系列的后續三篇論文提供資料,因此沒有全面涵蓋未來 C2 思考的所有方面,包括提出具體建議。
C2 沒有直截了當的定義,對于該術語在當代作戰環境中的范圍和相關性也存在爭議。對 C2 傳統定義的批判來自于對 21 世紀有效領導力構成要素的更廣泛質疑。在英國、美國和北約,最近出現了大量與 C2 相關的新術語,并將重點從聯合思維轉向多領域思維。我們的研究將 C2 定義為一個動態的、適應性強的社會技術系統,因此有必要考慮組織、技術和人力要素。
同樣,復雜性也沒有一個公認的定義。學術界對復雜性的研究日益增多,涉及多個科學學科,但缺乏統一的方法或理論框架。一個有用的出發點是區分簡單系統、復雜系統、復雜系統和復雜適應系統。文獻還描述了在這些條件下可能出現的所謂 "棘手"或 "超級棘手問題"。還可以對有限博弈和無限博弈進行重要區分--這是考慮作為復雜適應系統的國家間競爭時的一個有用視角。鑒于這些爭論,我們的研究避開了對復雜性的僵化定義,而是從其關鍵屬性的角度對這一現象進行了 DCDC 式的描述。
未來作戰環境的特征--以及國防 C2 系統和組織預計將執行的任務類型--具有很大的不確定性,因此任何預測都必須謹慎。盡管如此,文獻指出了各種政治、經濟、社會、技術、法律、環境和軍事(PESTLE-M)趨勢,預計這些趨勢將影響國際體系的演變,進而影響 2030 年及以后的國防行動。這些趨勢包括以下宏觀趨勢
最重要的是,沒有一個單一或主要的趨勢推動著變化或復雜性;相反,最令人擔憂的是多種因素的融合及其不可預測的相互作用。這種認識為進一步研究這些趨勢影響國際體系復雜性水平和特征的具體機制提供了基礎,從而為在這一領域開展工作的 C2 帶來了新的挑戰。
上述 PESTLE-M 趨勢為未來組織應對 C2 帶來了一系列困境和壓力,包括但不限于
此外,無論是理論家還是實踐者,在處理包含非線性動態的問題時,都缺乏有力的措施來衡量所做決定或采取的行動的有效性。因此,很難確切地說未來作戰環境中的復雜性是否在客觀上不斷增加(而不是以不同的形式出現),但對軍隊應處理的復雜任務的政治期望與當前 C2 方法的執行能力之間顯然存在巨大差距。當前的學術理論為決定如何在復雜環境中配置 C2 提供了一個方法工具包的初步輪廓和一些指導原則,但并沒有提供靈丹妙藥。該理論強調審議分析方法,即讓不同利益相關者參與共同設計、借鑒多學科和知識體系的見解,并在分析和決策過程中建立靈活性,以便根據反饋意見不斷迭代和改進的方法。
要應對復雜的自適應系統,就必須摒棄當前的線性 C2 流程和等級結構,盡管在處理非復雜任務和問題時,更傳統的方法可能仍然有用。在競爭激烈的世界中,英國既需要培養能夠對他人施加建設性影響的特性和能力(例如,將復雜性強加給對手的 C2),也需要培養能夠增強自身駕馭復雜性能力的特性和能力。
要影響敵對行動者的觀念、決策和行為,首先要深入了解其 C2 結構、流程和文化。根據這種了解,英國國防需要一套動能和非動能杠桿,對敵方的 C2 施加建設性影響,包括施加復雜性。除了敵對行動者,英國國防部還需要進一步了解如何對 PAG、盟友、合作伙伴、工業界、學術界、公民和對 C2 采取截然不同方法的其他人施加建設性影響。
在增強英國自身應對復雜性的能力方面,未來的 C2 系統和組織必須促進靈活性、復原力以及學習和適應能力等特性。整個決策周期都需要變革。例如,傳感器和通信技術的進步為獲取更多深度和廣度的數據提供了機會,包括有關復雜問題的數據。因此,提高認知能力對于理解所有這些數據至關重要,既要利用人類和機器的優勢,又要減少各自的缺點。要改變決策方法,還需要改變領導風格,以培養更善于駕馭復雜適應系統的決策者。在做出決策或計劃后,提高跨部門或跨層級的能力,在實施階段更好地整合活動或匯聚效應,對于抵消英國的局限性(如在質量方面)至關重要。
同樣,整合也不是萬全的;如果國防缺乏足夠深度的力量和能力,無法在充滿敵意的威脅環境中采取可信行動或維持高節奏行動,那么即使是最高效的指揮控制系統也無法在未來取得成功。此外,還需要采取防御措施以及恢復和失效模式,以阻止或減輕敵方破壞 C2 系統和組織的努力所造成的影響。鑒于所面臨的威脅,以及英國國防可能需要解決的不同形式的復雜問題,很可能會同時出現多種并行的 C2 模式,而不是單一的方法。應對復雜性意味著不斷學習、適應、創新和開放求變。因此,必須從一開始就將效果衡量標準、信號和變革機制納入計劃以及 C2 系統和組織,使其能夠隨著時間的推移不斷學習和調整,以應對各種情況。至關重要的是,未來 C2 系統和組織的設計只是挑戰的一部分--它們還必須得到更廣泛的國防企業緊急改革的支持,以確保獲得所需的使能因素(人員、技術等)。從 C2 的角度來看,這本身就是一個挑戰,因為改變這個企業--一個復雜的適應性系統--本身就是一個棘手的問題。
學術理論家和政府、軍事或工業從業人員對復雜性或復雜適應系統的理解并不全面,而這正是未來 C2 運行環境的特點。雖然文獻提供了處理復雜性的有用方法和工具,以及未來 C2 的一些初步設計考慮,但英國 C2(本身就是一個社會技術系統)的現代化和轉型將是一項高度復雜的工作。這意味著要與不斷發展的作戰環境、不斷變化的威脅和技術環境共同適應,從而進行迭代和不斷學習。因此,最緊迫的挑戰或許是,考慮到 C2 系統在未來面對復雜性時取得成功所需的轉型(技術、結構、流程、文化、教育等)的程度和性質,了解如何在一段時間內最好地引導這一過程。
自相矛盾的是,要克服實現以應對復雜性為目標的 C2 系統所面臨的障礙,可能需要英國國防部已經表現出其所尋求建立的系統的許多特征。面對這樣的循環邏輯,英國國防部可能需要某種外部沖擊來迫使其進行創造性的破壞,或者利用(或不顧)更傳統、線性的 C2 方法來啟動自身的激進改革努力,并隨著時間的推移,隨著變化的到來而進行調整。
在美國陸軍的條令中,結束狀態和條件描述的是沖突后的未來。結束狀態意味著沖突的結束--戰爭結束。許多現代戰爭都缺乏明確的輸贏劃分,因此無法達成和平協議,也無法實現最終狀態的解決。因此,軍事規劃人員需要一個成功解決沖突的框架和條件,以實現結束狀態。
本專著探討了戰爭如何結束。案例研究包括以最終地位解決而告終的戰爭、試圖但未能實現最終地位解決的戰爭,以及在僵持沖突中繼續進行的戰爭。北愛爾蘭戰爭以及以色列和埃及之間的戰爭在經過多年談判和實施之后以最終地位的解決而告終。以色列和巴勒斯坦之間的沖突未能解決最終地位問題,導致第二次起義的暴力爆發。塞浦路斯和納戈爾諾-卡拉巴赫存在著僵持不下的沖突,盡管談判仍在繼續,以期達成協議。
和平進程本質上是危險的,因為無論是失敗還是成功,都會導致相關地區的暴力加劇。不過,某些條件可以減輕這種危險。本專著建議,成功解決戰爭的框架應包括以下因素:穩定力量;沖突局部化;適當當事方的參與和消除不相干當事方;交戰人口的分治或隔離;實現和平的激勵措施;以及停火。
本文總結了關于自主軍事系統的測試、評估、驗證和確認(TEV&V)的挑戰和建議的部分文獻。本文獻綜述僅用于提供信息,并不提出任何建議。
對文獻的綜合分析確定了以下幾類TEV&V挑戰:
1.自主系統的復雜性產生的問題。
2.當前采購系統的結構所帶來的挑戰。
3.缺少測試的方法、工具和基礎設施。
4.新的安全和保障問題。
5.在政策、標準和衡量標準方面缺乏共識。
6.圍繞如何將人類融入這些系統的操作和測試的問題。
關于如何測試自主軍事系統的建議可以分為五大類:
1.使用某些程序來編寫需求,或設計和開發系統。
2.進行有針對性的投資,以開發方法或工具,改善我們的測試基礎設施,或提高我們勞動力的人工智能技能組合。
3.使用特定的擬議測試框架。
4.采用新的方法來實現系統安全或網絡安全。
5.采用具體的建議政策、標準或衡量標準。
在過去的十年中,計算和機器學習的進步導致了工業、民用和學術應用中人工智能(AI)能力的激增(例如,Gil & Selman,2019;Narla, Kuprel, Sarin, Novoa, & Ko, 2018;Silver等人,2016;Templeton,2019)。由人工智能促成的系統往往在某種意義上表現得很自主:它們可能會接管傳統上由人類做出的決定,或者在較少的監督下執行任務。然而,與武裝沖突期間的錯誤決定相比,一個真空機器人、一個高頻股票交易系統,甚至一輛自主汽車做出錯誤的選擇是可以通過糾正措施相對恢復的。軍事系統將面臨與民用系統相同的大部分挑戰,但更多地是在結構化程度較低的環境中運作,所需的反應時間較短,而且是在對手積極尋求利用錯誤的情況下。人工智能和自主軍事系統將需要強有力的測試,以保證不理想的結果,如自相殘殺、附帶損害和糟糕的任務表現是不太可能的,并且在可接受的風險參數范圍內。
為了自信地投入使用自主軍事系統(AMS),必須相信它們會對設計時可預見的問題和它們必須適應的不可預見的情況做出適當的決定。簡而言之,這些系統必須是熟練的、靈活的和值得信賴的。 當AMS要在狹義的情況下運行時(例如,要求一個 "智能"地雷在一天中的特定時間內施加特定的壓力時爆炸),要保證系統的行為符合要求就容易多了。它能遇到的相關不同情況的數量和它的行為反應(即其決策的狀態空間)都是有限的。擴大這個狀態空間會使保證更加困難。例如,一個自主的基地防御系統旨在根據目前的ROE用適當的武力來應對任何可能的威脅,預計會遇到更多的情況,包括設計的和不可預見的。要在這種情況下適當地運作,需要更多的靈活性,這反過來又要求系統更加熟練,允許它運作的人類更加信任。這些需求的相互作用是這些系統的許多T&E困難的一個核心驅動因素。
人工智能技術為美國防部(DoD)內的采購項目的測試和評估過程帶來了一系列的挑戰。首先,這些系統純粹的技術復雜性和新穎性可能難以駕馭。此外,美國防部的采購流程是在假設的基礎上進行優化的,而自主權可能不再成立(Tate & Sparrow, 2018)。例如,將承包商、開發和操作測試分開,假設我們有離散的、相對線性的開發階段,導致系統的 "生產代表 "版本。對于AMS來說,這可能不是真的,特別是如果它們在整個生命周期中繼續學習。此外,在我們擁有一個系統之前就寫需求,是假設我們事先了解它將如何被使用。因為AMS的熟練度、靈活性和可信度會隨著時間的推移而發展,并會影響人類如何使用或與系統互動,所以與標準系統相比,作戰概念(CONOPS)和戰術、技術和程序(TTPs)將需要與系統共同開發,其程度更高(Haugh, Sparrow, & Tate, 2018; Hill & Thompson, 2016; Porter, McAnally, Bieber, & Wojton, 2020; Zacharias, 2019b)。
然而,即使美國防部的采購流程被更新,美國防部員工用于測試和評估(T&E)的具體方法、工具和基礎設施將無法保證系統的性能達到預期。開發和設計工作包含了測試,通過內部儀器建立可測試性;提高軟件的透明度、可追溯性或可解釋性;對培訓和其他數據進行良好的管理和驗證,可以改善開發過程,同時也為測試和評估鋪平道路,但它們沒有被普遍采用。此外,能夠幫助項目克服所有這些挑戰的政策和標準要么缺乏,要么不存在。
自主性的定義繁雜眾多,有些定義對美國防部來說不如其他定義有用。許多定義包含了獨立、不受外部控制或監督、或與其他實體分離的概念(例如,牛津英語詞典,2020年)。然而,假設任何參與者將在沒有控制或監督的情況下運作,甚至是人類作戰人員,這與美國防部的政策和指揮與控制(C2)的思想相悖。不希望自主系統擁有選擇行動路線的完全自由,而是在其分配的任務中擁有一些受約束的自由。
與作戰人員一樣,可能希望與自主系統有一個C2或智能體關系。希望:1. 明確具體任務和/或整體任務的目標或目的,可能還有這些目標的更大原因,如指揮官的意圖(即做什么和為什么)。2.明確與任務相關的約束,如交戰規則(ROE,即不能做什么)。3. 不指定使用的方法或對每一種情況給出明確的應急措施,如對對手的反應做出反應(即如何完成任務)。
一個系統是否被授權為一項任務做出這些 "如何 "的決定,是本文將區分自主系統和非自主系統的方法。
在 "是什么"、"不是什么 "和 "為什么 "的限制下,為 "如何 "做出有用的、理想的選擇,假定了某種程度的智能。因為這些是機器,這就意味著存在某種程度的人工智能。需要人工智能來實現對非瑣碎任務的有用的自主性,這可能解釋了為什么人工智能和自主性經常被混為一談。在本文件中,我們將自主性稱為系統在其操作環境中的行為,而人工智能則是與該環境進行有意義的互動的 "內在 "促成因素。