2010 年后,用于兵棋推演的人工智能(AI)技術突飛猛進,激發了人們對這一技術可能給兵棋推演帶來的益處的濃厚興趣。倡導者認為,人工智能可能使兵棋推演更有效,或使兵棋推演應用于新問題成為可能。本報告評估了將人工智能技術應用于兵棋推演的局限性,以及未來在兵棋推演中有效應用人工智能的投資機會。
為此,按類型或目的(系統探索、創新、替代條件和評估)以及按時間階段任務(準備、游戲、裁決和解釋)對兵棋推演進行了分類。這些框架用于評估在特定條件下將人工智能應用于特定類型兵棋推演各個方面的技術可行性和成本效益。
本報告是五卷系列中的第四卷,論述了如何在網絡安全、預測性維護、兵棋推演和任務規劃這四個不同領域運用人工智能來協助作戰人員。它面向那些對兵棋推演、人工智能在兵棋推演中的應用歷史以及更廣泛的人工智能應用感興趣的人。
本文是研究指揮與控制(C2)未來表現形式的四篇系列論文中的第一篇。第一篇論文通過探討未來指揮與控制(C2)系統需要在其中運行的未來作戰環境,為后續研究設定了基線。具體來說,本文探討了復雜性的驅動因素、表現形式和影響,而此前的研究表明,復雜性很可能是這一環境的特征。為此,它討論了 C2 和復雜性等關鍵術語的定義;介紹了未來運行環境中復雜性的一些驅動因素,并討論了這些因素如何對 C2 系統和組織造成新的壓力;研究了分析和理解復雜性的可能方法;并概述了 2030 年代及以后可能產生的一些實際考慮因素。由于本文旨在為本系列的后續三篇論文提供資料,因此沒有全面涵蓋未來 C2 思考的所有方面,包括提出具體建議。
C2 沒有直截了當的定義,對于該術語在當代作戰環境中的范圍和相關性也存在爭議。對 C2 傳統定義的批判來自于對 21 世紀有效領導力構成要素的更廣泛質疑。在英國、美國和北約,最近出現了大量與 C2 相關的新術語,并將重點從聯合思維轉向多領域思維。我們的研究將 C2 定義為一個動態的、適應性強的社會技術系統,因此有必要考慮組織、技術和人力要素。
同樣,復雜性也沒有一個公認的定義。學術界對復雜性的研究日益增多,涉及多個科學學科,但缺乏統一的方法或理論框架。一個有用的出發點是區分簡單系統、復雜系統、復雜系統和復雜適應系統。文獻還描述了在這些條件下可能出現的所謂 "棘手"或 "超級棘手問題"。還可以對有限博弈和無限博弈進行重要區分--這是考慮作為復雜適應系統的國家間競爭時的一個有用視角。鑒于這些爭論,我們的研究避開了對復雜性的僵化定義,而是從其關鍵屬性的角度對這一現象進行了 DCDC 式的描述。
未來作戰環境的特征--以及國防 C2 系統和組織預計將執行的任務類型--具有很大的不確定性,因此任何預測都必須謹慎。盡管如此,文獻指出了各種政治、經濟、社會、技術、法律、環境和軍事(PESTLE-M)趨勢,預計這些趨勢將影響國際體系的演變,進而影響 2030 年及以后的國防行動。這些趨勢包括以下宏觀趨勢
最重要的是,沒有一個單一或主要的趨勢推動著變化或復雜性;相反,最令人擔憂的是多種因素的融合及其不可預測的相互作用。這種認識為進一步研究這些趨勢影響國際體系復雜性水平和特征的具體機制提供了基礎,從而為在這一領域開展工作的 C2 帶來了新的挑戰。
上述 PESTLE-M 趨勢為未來組織應對 C2 帶來了一系列困境和壓力,包括但不限于
此外,無論是理論家還是實踐者,在處理包含非線性動態的問題時,都缺乏有力的措施來衡量所做決定或采取的行動的有效性。因此,很難確切地說未來作戰環境中的復雜性是否在客觀上不斷增加(而不是以不同的形式出現),但對軍隊應處理的復雜任務的政治期望與當前 C2 方法的執行能力之間顯然存在巨大差距。當前的學術理論為決定如何在復雜環境中配置 C2 提供了一個方法工具包的初步輪廓和一些指導原則,但并沒有提供靈丹妙藥。該理論強調審議分析方法,即讓不同利益相關者參與共同設計、借鑒多學科和知識體系的見解,并在分析和決策過程中建立靈活性,以便根據反饋意見不斷迭代和改進的方法。
要應對復雜的自適應系統,就必須摒棄當前的線性 C2 流程和等級結構,盡管在處理非復雜任務和問題時,更傳統的方法可能仍然有用。在競爭激烈的世界中,英國既需要培養能夠對他人施加建設性影響的特性和能力(例如,將復雜性強加給對手的 C2),也需要培養能夠增強自身駕馭復雜性能力的特性和能力。
要影響敵對行動者的觀念、決策和行為,首先要深入了解其 C2 結構、流程和文化。根據這種了解,英國國防需要一套動能和非動能杠桿,對敵方的 C2 施加建設性影響,包括施加復雜性。除了敵對行動者,英國國防部還需要進一步了解如何對 PAG、盟友、合作伙伴、工業界、學術界、公民和對 C2 采取截然不同方法的其他人施加建設性影響。
在增強英國自身應對復雜性的能力方面,未來的 C2 系統和組織必須促進靈活性、復原力以及學習和適應能力等特性。整個決策周期都需要變革。例如,傳感器和通信技術的進步為獲取更多深度和廣度的數據提供了機會,包括有關復雜問題的數據。因此,提高認知能力對于理解所有這些數據至關重要,既要利用人類和機器的優勢,又要減少各自的缺點。要改變決策方法,還需要改變領導風格,以培養更善于駕馭復雜適應系統的決策者。在做出決策或計劃后,提高跨部門或跨層級的能力,在實施階段更好地整合活動或匯聚效應,對于抵消英國的局限性(如在質量方面)至關重要。
同樣,整合也不是萬全的;如果國防缺乏足夠深度的力量和能力,無法在充滿敵意的威脅環境中采取可信行動或維持高節奏行動,那么即使是最高效的指揮控制系統也無法在未來取得成功。此外,還需要采取防御措施以及恢復和失效模式,以阻止或減輕敵方破壞 C2 系統和組織的努力所造成的影響。鑒于所面臨的威脅,以及英國國防可能需要解決的不同形式的復雜問題,很可能會同時出現多種并行的 C2 模式,而不是單一的方法。應對復雜性意味著不斷學習、適應、創新和開放求變。因此,必須從一開始就將效果衡量標準、信號和變革機制納入計劃以及 C2 系統和組織,使其能夠隨著時間的推移不斷學習和調整,以應對各種情況。至關重要的是,未來 C2 系統和組織的設計只是挑戰的一部分--它們還必須得到更廣泛的國防企業緊急改革的支持,以確保獲得所需的使能因素(人員、技術等)。從 C2 的角度來看,這本身就是一個挑戰,因為改變這個企業--一個復雜的適應性系統--本身就是一個棘手的問題。
學術理論家和政府、軍事或工業從業人員對復雜性或復雜適應系統的理解并不全面,而這正是未來 C2 運行環境的特點。雖然文獻提供了處理復雜性的有用方法和工具,以及未來 C2 的一些初步設計考慮,但英國 C2(本身就是一個社會技術系統)的現代化和轉型將是一項高度復雜的工作。這意味著要與不斷發展的作戰環境、不斷變化的威脅和技術環境共同適應,從而進行迭代和不斷學習。因此,最緊迫的挑戰或許是,考慮到 C2 系統在未來面對復雜性時取得成功所需的轉型(技術、結構、流程、文化、教育等)的程度和性質,了解如何在一段時間內最好地引導這一過程。
自相矛盾的是,要克服實現以應對復雜性為目標的 C2 系統所面臨的障礙,可能需要英國國防部已經表現出其所尋求建立的系統的許多特征。面對這樣的循環邏輯,英國國防部可能需要某種外部沖擊來迫使其進行創造性的破壞,或者利用(或不顧)更傳統、線性的 C2 方法來啟動自身的激進改革努力,并隨著時間的推移,隨著變化的到來而進行調整。
各國政府正越來越多地考慮將自主人工智能代理集成到高風險的軍事和外交政策決策中,特別是隨著 GPT-4 等先進的生成式人工智能模型的出現。我們的工作旨在仔細研究多個人工智能代理在模擬兵棋推演中的行為,特別關注它們傾向于采取可能加劇多邊沖突的升級行動。借鑒政治學和國際關系學中有關升級動態的文獻,我們設計了一個新穎的兵棋推演模擬和評分框架,以評估這些代理在不同場景中所采取的行動的升級風險。與之前的研究不同,我們的研究同時提供了定性和定量的見解,并側重于大型語言模型(LLM)。我們發現,所研究的五種現成 LLM 都顯示出升級形式和難以預測的升級模式。我們觀察到,模型往往會發展出軍備競賽動態,導致更大的沖突,在極少數情況下,甚至會導致核武器的部署。在定性方面,我們還收集了模型所報告的選擇行動的理由,并觀察到基于威懾和先發制人戰術的理由令人擔憂。鑒于軍事和外交政策的高風險,我們建議在部署自主語言模型代理進行戰略性軍事或外交決策之前,進行進一步的檢查和謹慎考慮。
圖 1:實驗設置。八個自主國家智能體,每次模擬都使用相同的語言模型(GPT-4、GPT-3.5、Claude 2、Llama-2 (70B) Chat 或 GPT-4-Base),在基于回合的模擬中相互影響。每個回合,1)智能體采取預先定義的行動,從外交訪問到核打擊,并向其他國家發送私人信息。2) 一個獨立的世界模型 LLM 總結行動對智能體和模擬世界造成的后果。3) 行動、信息和后果在每天結束后同時揭示,并反饋到隨后幾天的提示中。模擬結束后,我們根據升級評分框架計算升級評分(ES)。完整方法請參見第 3 節。
持續討論。2023 年,眾議員蒂姆-遼(Tim Lieu)在參議員愛德華-馬基(Edward Markey)的共同支持下,提出了《阻止自主人工智能進行核發射法案》(Block Nuclear Launch by Autonomous Artificial Intelligence Act),規定美國核戰略決策必須接受人類監督(保羅,2023 年)。安德森(Andersen,2023 年)強調了人工智能融入軍事行動的不斷升級,強調了允許人工智能進入關鍵的指揮和控制功能所固有的風險,尤其是在核能力方面。2023 年 10 月,拜登總統發布了《關于安全、可靠地使用人工智能的行政命令》,啟動了專門針對國防人工智能應用的監督機制,指導商業、國防和情報機構之間的協調,以建立對構成安全風險的模型和計算能力的報告要求(拜登,2023 年)。(拜登,2023 年)。Hirsh(2023 年)討論了各種風險,包括決策窗口減少、過度依賴人工智能進行戰略和戰術評估,甚至在核戰爭中也是如此,以及人工智能驅動的智能引發意外沖突的可能性,強調有必要對這些技術的軍事應用所帶來的危險進行審慎考慮、有意義的限制和強有力的評估。Hoffman 和 Kim(2023 年)探討了將人工智能納入軍事戰略的機遇和風險,重點關注美國和中國對人工智能在關鍵軍事場景中提高決策能力的潛力的看法。Mikhailov (2023) 則更廣泛地討論了如何利用人工智能優化國家安全戰略。最后,Scale AI 最近宣布與戰略與國際研究中心合作,探索在兵棋推演中使用 LLM,但沒有任何關于未來成果公開的信息(Albergotti,2023 年)。
(計算機輔助)兵棋推演。兵棋推演被用來 "讓玩家重現特定事件,更重要的是,如果玩家決定以不同的方式行事,還能探索可能發生的事情"(Dunnigan,2000 年)。兵棋推演游戲的組成部分包括 "一張地圖、代表歷史人物或軍事單元的棋子,以及一套告訴你可以或不可以用它們做什么的規則"(Dunnigan,2000 年)。計算機輔助兵棋推演的范圍可以從決策支持系統到綜合兵棋模擬。之前的研究表明,計算機自動化程度高的兵棋推演更容易導致核使用(Emery, 2021);作者的一個假設是,計算機模型沒有充分考慮到戰爭或核使用的非物質成本(Emery, 2021),"兵棋推演中的移情能力來自于讓人感受到決策的分量,并在高度逼真而非抽象的模擬環境中行使道德實踐判斷"。(Emery, 2021)。據稱,這種道德理解的缺失增加了計算機輔助兵棋推演中事態升級的可能性。
LLM 智能體決策。最近,研究人員探索了基于強化學習和基于 LLM 方法相結合的決策智能體的使用,例如,在玩策略游戲《外交》(FAIR 等人,2022 年)時。不過,FAIR 等人(2022 年)所描述的核心規劃能力來自于 "使用 RL 訓練模型的規劃算法",而不僅僅是 LLM。與這項工作相比,我們在每個模擬步驟(包括行動規劃)中都使用了現成的 LLM。Mukobi 等人(2023 年)在多智能體通用和環境中使用了現成的 LLM,與我們的方法最為接近,但他們側重于在外交變體中對合作進行基準測試,而我們則側重于在更現實的環境中對沖突進行評估。此外,Lorè 和 Heydari(2023 年)在博弈論框架下探索了 LLMs 的戰略規劃能力,而 Ye 等人(2023 年)則研究了 LLMs 作為自主決策者的潛力以及提高這些能力的方法。
沖突模型。Owsiak (2015)建立了一個預測沖突管理行為的模型,并強調了沖突管理相互依存理論的重要性。Marwala 和 Lagazio(2011 年)比較了預測軍事化國家間爭端的基于模型的方法。Gochman 和 Maoz(1984 年)對國家間沖突行為進行了實證描述,強調了持續模式和跨越地理邊界的普遍性。
理論沖突和沖突升級評估框架。Kahn(1970 年)將沖突升級描述為在冒險和決心方面存在競爭的情況,并以害怕對方做出過激反應作為威懾。在后續著作中,Kahn(2010 年)描述了一個由越來越多的升級行動組成的升級階梯。Patchen (1987)認為,隨著參與者目標的擴大、期望的改變以及對使用武力的抑制作用的減弱,國際沖突就會升級。Brecher(1996 年)將升級定義為 "從萌芽到全面危機的變化;從非暴力到暴力的變化;以及從無暴力/低暴力到嚴重暴力的變化"。最后,Rubin 等人(1994 年)的理論貢獻指出了沖突升級過程中發生的五種轉變。
將 LLM 納入外交政策決策需要十分謹慎。根據本文的分析,在軍事和外交政策決策中部署 LLMs 顯然充滿了復雜性和風險,而這些復雜性和風險尚未得到充分理解。這些模型在模擬環境中表現出的升級行為的不可預測性突出表明,在將其納入高風險的軍事和外交政策行動時,需要采取非常謹慎的方法。
只能從模擬兵棋推演中進行有限的推斷。如果使用兵棋推演或模擬來估計在這些高風險環境中部署 LLMs 的潛在結果,那么分析人員在從這些 LLM 執行的游戲中推斷未來會發生什么時就應小心謹慎。具體來說,目前還不清楚 LLM 在更復雜的環境中會有怎樣的表現,我們也沒有辦法在部署前對其行為進行安全、可靠的測試。
模型和設計選擇至關重要。不同模型之間的差異以及即時靈敏度分析中的差異表明,關于 LLM 如何響應以及使用哪些數據來構建其知識的人為設計決策會對升級結果產生重大影響。
有必要開展更多研究。與早期使用的計算機自動化外交和戰爭相比,這些 LLM 似乎更智能、更細致,甚至可能更有同情心。然而,在模擬環境中觀察到的這些模型的不可預測性要求我們在將其納入高風險決策過程時采取謹慎和克制的方法,在對這些模型在單 LLM 和多 LLM 環境中的行為和保障措施進行進一步研究之前,應暫緩將其納入決策過程。密切分析兵棋推演中人類玩家與 LLM 之間的差異,可以進一步幫助完善 LLM 決策,還可以確定如何利用這些作為檢查人類偏見的一種方式。此外,建議對 LLM 決策模式進行重點調查。這包括在可能的升級行動之前暫停情景,并進行多次重演,以評估 LLM 是否始終選擇升級或表現出不同的反應。此類研究將說明模型的行為概率譜,并有助于加深對 LLM 不可預測性的理解。
美國空軍越來越關注人工智能(AI)在增強作戰各方面能力方面的潛力。在這個項目中,空軍要求蘭德公司的研究人員考慮人工智能無法做到的事情,以了解人工智能在作戰應用中的局限性。
研究人員沒有試圖確定人工智能的一般限制,而是選擇并調查了四個具體的作戰應用作為潛在用例:網絡安全、預測性維護、兵棋推演和任務規劃。選擇這些應用是為了代表各種可能的用途,同時突出不同的限制因素。在可以獲得足夠數據的三個案例中進行了人工智能實驗;剩下的兵棋推演案例則廣泛探討了如何應用或不能應用人工智能。
本報告是五卷系列中的第一卷,總結了所有應用案例的研究結果和建議。報告面向政策制定者、采購專業人員以及對將人工智能應用于作戰普遍感興趣的人員。
美國空軍部對人工智能(AI)徹底改變作戰各個方面的潛力越來越感興趣。在這個項目中,美國空軍要求蘭德公司的 "空軍項目"(Project AIR FORCE)廣泛考慮人工智能無法做到的事情,以了解人工智能在作戰應用中的局限性。本報告討論了人工智能系統在執行兩種常見網絡安全任務(檢測網絡入侵和識別惡意軟件)中的應用,以及分布轉移對這些任務的影響,這種現象會極大地限制人工智能的有效性。當人工智能系統在部署后遇到的數據與經過訓練和測試的數據有明顯差異時,就會發生分布偏移。
本報告闡述了分布偏移的重要性,它如何并確實顯著限制了人工智能在檢測網絡入侵和識別惡意軟件方面的有效性,如何測試和量化其影響,以及如何減輕這些影響。這項工作主要針對大型組織,如總部設施,它們有足夠的帶寬和計算能力來實施人工智能網絡安全系統并定期更新系統。
本報告是五卷系列報告中的第二卷,論述了如何利用人工智能在網絡安全、預測性維護、兵棋推演和任務規劃四個不同領域為作戰人員提供幫助。本卷面向技術讀者;整個系列面向對作戰和人工智能應用感興趣的讀者。
盡管電子游戲軍事化是一個有爭議的重要話題,但由于它關系到社會青少年的未來、軍事技術的發展以及軍方的經濟關系,因此此前并未受到廣泛關注。以往的相關研究并未深入探討軍事與電子游戲產業之間的關系。本文通過對不同領域的研究,如電子游戲對個人的影響、技術在軍事中的應用、軍隊的經濟關系等,試圖探討游戲產業與軍隊之間的關系。雖然沒有很多具體證據表明軍方從青少年玩電子游戲中直接受益,但兩者之間確實存在聯系。在對這一主題的研究中,很明顯,軍方和電子游戲產業之間的關系只會越來越密切,越來越牢固。
本報告介紹了美國陸軍研究實驗室內容理解處的研究人員在 2023 財年為采用增強型戰術推理(ETI)框架所做的工作。ETI 的開發旨在支持多智能體環境(數據源智能體、推理模型智能體和決策者智能體)中人工推理研究的實驗和演示。在本報告中,ETI 被用于在跨現實環境中演示基于不確定性的決策推薦功能。從模擬場景的數據開始,再加上額外的外部環境,ETI 智能體對態勢感知信息中的不確定性進行推理,為決策者提供建議選擇。最后,ETI 的產品被轉化為跨現實可視化,以探索新的人機交互模式。
增強戰術推理(ETI)框架的設計和創建是為了支持人工推理研究的實驗和演示。ETI 目前的結構包括三個主要智能體:數據源智能體、推理模型智能體和決策者智能體。數據源智能體分為幾大類:信息(圖像、音頻、文本)、設備、網絡和可視化。數據源智能體可以捕獲數據并將數據傳輸給其他智能體。其他信息系統也可以向這些智能體提供數據。推理模型智能體執行不同方面和不同層次的推理。推理智能體的輸出將有助于生成建議的決策。決策者智能體負責做出最終決策。這些 ETI 智能體可以是模塊化的,允許串行或并行處理,以及獨立或相互依存。在這項工作中,ETI 發揮著決策輔助工具的作用。主要的推理模型是信息不確定性(UoI)模塊。該 UoI 模塊可在決策建議中考慮任何信息的不確定性。ETI 的另一項功能是實現與人類的互動,包括未來的可視化和協作環境。我們在跨現實(XR)環境--運籌、研究與分析加速用戶推理(AURORA)中進行了演示。與 AURORA 等系統集成后,可以探索智能系統與人類交互的新模式。在本報告中,將詳細介紹我們的演示開發過程,包括將模擬環境中的數據映射到可視化環境中,將決策點和 ETI 建議納入行動方案中,以及用 "假設 "情況來增強場景,以探索基于推理的框架的影響。
這項研究的目標是開發、整合和演示基于推理的決策框架。ETI 框架的決策建議被用于師演習訓練和審查系統(DXTRS)中的模擬場景,并在 XR 環境 AURORA 中實現可視化。下文將介紹 DXTRS、場景和 AURORA 可視化的背景情況。
在該場景中,藍軍(BLUFOR)的目標是向東推進,穿過阿塞拜疆名為阿格達姆區的地區,同時與部署在河東的對方部隊(OPFOR)交戰并將其消滅。(見圖 1)
隨著任務的展開,BLUFOR 將遇到一條阻礙他們前進的河流,他們需要在那里進行濕空隙穿越。(見圖 2)
為了探索可視化和與 ETI 的交互,DXTRS 場景和相關的 ETI 推理信息在 XR 環境中顯示。該環境由美國陸軍作戰能力發展司令部(DEVCOM)陸軍研究實驗室(ARL)開發,名為 AURORA。AURORA 為安全、聯網、多設備跨現實信息調解和交互提供了一個通用作戰框架。為了便于可視化,將場景數據集合映射為 AURORA 可以處理的目標光標(CoT)信息。本報告第 3 部分將詳細解釋映射過程。圖 3 和圖 4 顯示了AURORA環境中的場景截圖。
如前所述,ETI 的設計是利用各種推理模型作為模塊,允許不同的推理配置。本次工作的推理模型是用戶體驗模塊。UoI 的概念包括產生或捕捉一個值,并用描述符對不確定值進行分類。這為決策者提供了不確定性的上下文信息,并支持對由此產生的建議進行推理。描述符基于格申論文中提出的不完全信息的性質。目前,該分類法包括不一致、損壞、不連貫、不完整、不精確、復雜和可疑。它們共同描述了特定信息源不確定性的原因和類型。
當前版本的UoI表達式是一個加權和,如式1所示。
公式 1. UoI 計算,其中 dp 為決策點,D 為變量,表示可能是任務關鍵因素的決策組成部分,W 為與這些組成部分的重要性相關的權重,T 為分類權重類別(相當于 G),S 為數據來源類別。UoI 值表示數據源和因素對所分類的不確定性的貢獻。
以下是分類法中七個術語的描述:
這篇研究論文探討了美國政府(USG)高級文職領導人和高級軍事領導人之間歷史上經常發生爭執的關系,并提出了在未來高級領導人之間建立協作伙伴關系的方法。本文特別關注增加未來軍隊和美國政府領導人之間的合作。本文建議文職和軍事專業人員將組織間的兵棋推演作為一種途徑,在戰地級軍官和同等級別的聯邦政府文職人員之間建立合作關系。美國政府和私營企業在冷戰期間利用兵棋推演成功地進行了批判性思維和決策方法。今天在設計組織間兵棋推演時,文職和軍事領導人可以從探索這個時代的洞察力中受益。
組織間兵棋推演可以使軍官和適當的美國政府專業人員了解對方在制定行動方案建議時采用的分析過程和方法。這將使參與者有機會從機構間的角度分析風險。擬議的兵棋推演將促進更多的政府間理解和凝聚力。它們還將為有機的紅方團隊和創造性思維提供機會。組織間的兵棋推演有可能將未來的文職和軍事領導人聚集在一起,為他們提供一個建立合作關系的機會,并深入了解對方的關鍵性思維和決策過程。從冷戰時期美國政府和私營企業的兵棋推演中獲得的見解和教訓,可以大大有助于設計對21世紀的軍官和美國政府專業人員都有意義和價值的兵棋推演。
本文采用的方法是首先研究最近的軍民關系作為背景,然后分析可適用于機構間的各種類型的兵棋推演。考慮的關鍵主題領域是決策、戰略目標、威懾和風險評估。研究借鑒了軍事歷史、政治科學、安全研究和政府。研究包括分析當前通過兵棋推演進行的軍事訓練的應用,研究可能納入政府文職人員、批判性思維和改善關系。本文還探討了冷戰時期的兵棋推演,作為針對美國政府戰略優先目標和規劃的博弈效用的案例研究,以及將非軍事政府分析納入這一過程的好處。
盡管美國陸軍希望在多域作戰中取得認知上的優勢,但它還沒有充分發展并采用認知能力提升的概念。本文對陸軍在這一領域的努力進行了全面評估,探討了對士兵認知的日益增長的要求,并將陸軍目前的方法與對手進行了比較。它的結論將幫助美國軍隊和政策執行者建立促進認知優勢和跨領域成功的文化和行為。
關鍵字:認知能力、復原力、神經倫理學、人類表現、信息過載
認知能力是支持所有士兵表現的關鍵變量:身體、精神和情感。美國陸軍條令認識到認知優勢的重要性,或獲得對敵人的智力優勢。它甚至在最近的幾個出版物中占據了突出位置,包括2019年陸軍現代化戰略(AMS)和美國陸軍多域作戰(MDO)2028年概念。 盡管認知科學取得了進展,并且認識到認知超配在多域作戰中的重要性,然而,美國陸軍還沒有完全接受認知能力優化的概念。在過去的十年中,美國國家衛生研究院在大腦研究方面的投資超過535億美元,但士兵和領導人在 "永遠在線 "的多任務和連接文化中進行訓練和操作,這種習慣最終會降低認知性能。 無論是在駐地還是在部署時,領導人都試圖過濾幾十條信息流,并在睡眠不足和對認知能力優化原則理解有限的情況下做出快速決策。
與此同時,中國和俄羅斯一直在追求生物技術、神經科學和人工智能(AI)解決方案,以提高人類的認知能力,并獲得對美國及其盟友的不對稱作戰優勢。 不受西方社會道德規范的約束,俄羅斯等積極利用雙重用途的民用和軍用研究來實現這一目的,將頭腦視為未來戰爭的主要戰斗空間,并正在采取措施在那里占據主導地位。
為了應對這一挑戰,美國陸軍必須與美國防部的認知能力研究和開發工作保持一致。然而,僅有科學是不夠的。陸軍還必須發展其文化,認識到以科學為基礎的道德方法的重要性,以確保以推動整個部隊的競爭和創新的方式發揮認知優勢。需要采取一種植根于教育、培訓和技術的審慎行為修正方法來取代過時的認知能力神話,這些神話最終會通過多任務處理、睡眠剝奪和信息過載來降低認知功能。否則,我們的對手可能會找到他們所需的不對稱優勢來支配美國的聯合部隊。
認知能力是指觀察、定向、決定和行動以產生最佳結果的能力。 認知技能對于戰場上的成功一直很重要,在決定戰斗和戰役中發揮著關鍵作用。未來將提供類似的機會,但隨著戰場擴展到空間和網絡空間,會有更大的復雜性、迷霧和摩擦。2019年AMS針對這種不斷變化的環境,提出了多域作戰的概念。 2019年AMS概述了多域作戰概念與以前的作戰概念有何不同,并要求其從業人員具有更高水平的認知能力。
MDO概念提出了認知方面的挑戰,因為它要求領導者認識并利用稍縱即逝的機會,在復雜的作戰環境中實現對先進對手能力的跨域聚合效應。 為了在多領域作戰中取勝,美國陸軍沿著六個貫穿所有領域的現代化優先事項部署了日益復雜的系統。這些先進的系統不僅需要更高的智力和技術技能來操作和維護,而且當與改進的數字通信和網絡能力相結合時,領導人還可以獲得比以往更多的實時數據。最后,MDO 2028概念和 "陸軍人員戰略 "將美國士兵置于多域作戰概念的中心。事實上,作為"陸軍最大的力量和最重要的武器系統",士兵們將在無數實時數據和信息源的交匯處行動,并面臨著越來越大的壓力,需要在機會和威脅出現時進行多任務處理、優先排序、評估、決定和行動。
以人工智能、人機交互和其他技術進步的承諾來解決這些挑戰是很誘人的。然而,許多這些能力仍然是假設的,即使對士兵的認知要求繼續上升。即使當它們可用時,人工智能和其他技術將補充人類的決策,但在短期內,人腦可能仍然是關鍵節點。因此,要實現認知上的優勢,首先要了解人腦的基本能力和局限性。大衛-洛克(David Rock)等認知科學家堅持認為,了解大腦功能是提高認知能力的最佳途徑之一。最佳喚醒、多任務處理、認知耐力和決策質量等概念提供了一個理解框架,并為提高績效提供了機會。
情緒的喚醒程度直接影響認知表現。1908年首次提出的耶克斯-多德森定律(Yerkes-Dodson Law)為這一現象提供了一個基本模型,并描述了一個與巔峰表現相關的認知喚醒的甜蜜點。正確的喚醒水平,或壓力,會使大腦釋放正確的神經化學物質組合,以產生最佳表現所需的警覺性和注意力。優秀的教練認識到喚醒水平對表現的影響,并在比賽期間根據需要成功地使球隊平靜下來或振作起來。太少會讓我們變得平淡無奇,而太多則會產生適得其反的壓力、焦慮或脫離。軍隊領導人可能熟悉這種現象,在戰斗情況下,身體的威脅會激起強大的反應,但在工作壓力和信息過載的情況下也會出現類似的狀態。
盡管在戰斗中限制壓力和焦慮具有挑戰性,但監測和管理士兵的情緒喚醒水平可以為提高認知能力提供直接機會。英國皇家學會描述的一個新穎的解決方案建議軍隊和執法部門使用認知過載監測系統,在個人出現認知過載的跡象時發出警報。這種意識將使用戶有意識地改變他們的情緒喚醒和行為狀態,以專注于最關鍵的問題。同樣,美國陸軍作戰能力發展司令部士兵中心進行的監測和評估士兵戰術準備和有效性試點研究,重點是通過創新的科學技術優化士兵個人和小單位的感知、認知和互動。通過分析持續訓練期間通過佩戴式傳感器和實驗室傳感器收集的數據,該研究確定了額外研究的機會,可以幫助士兵和領導識別、預測和維持影響決策質量、射擊精度和注意力控制的最佳喚醒和戰術性能水平。
圖 1. Yerkes-Dodson 定律
軍隊領導人被要求發展一種能力,以應付多種情況--立即對短信、聊天和電子郵件作出反應,并在快速變化的環境中解決問題的同時保持對局勢的認識。不幸的是,軍隊領導人所使用的工具及其使用方法在戰斗和駐軍中加深了 "戰爭迷霧"。盡管社會聯系日益緊密,但科學表明,大腦在任何特定時間內能夠處理的操作數量和復雜性都是有限的。集中我們的注意力需要分配前額葉皮層的神經資源,使大腦不能有效地同時關注兩件事情。當多任務處理時,我們的大腦反而被迫從一個話題迅速過渡到另一個話題。在不同的任務之間轉換需要大量的代謝資源,如含氧葡萄糖;一旦耗盡,認知和身體表現都會下降。多任務處理還產生壓力荷爾蒙皮質醇,并影響腎上腺素和多巴胺水平,從而擾亂我們的思維。多任務處理影響的深刻性使一些研究人員相信,通過文本、電子郵件、廣播交通和聊天窗口等不斷的中斷,可能會產生類似于暫時降低智商的效果。
此外,研究表明,多任務處理會增加決策風險。2009年斯坦福大學的一項研究稱,重度媒體多任務處理者的記憶力、學習和認知功能都有所下降。該研究比較了被認定為重度和輕度多任務處理者的群體的認知能力。雖然其他因素可能導致這種退化,但研究表明,習慣性的多任務處理可能會諷刺地損害個人完成偶爾多任務的能力。例如,考慮到一個司機在城市的一個不熟悉的地方一邊聽廣播一邊與乘客交談。在一次轉彎失誤后,司機本能地暫停了談話,關閉了收音機,集中精力糾正方向。司機的行為顯示了他對同時做兩件事的挑戰的直覺認識。通過選擇多任務處理,我們接受了性能下降,正式稱為 "雙重任務干擾 "或 "心理折返效應"。
作為全軍腦科學教育倡議的一部分,早期職業教育可以為減少多任務、分心、頻繁中斷和信息過載的文化提供有意義的第一步。冥想、深思熟慮、元認知、正念和正念意識等技術提供了可獲得的、低成本的方法,通過提高注意力和表現來建立整個部隊更好的認知習慣,以滿足訓練和任務要求。
軍隊的腦科學教育也可以幫助領導者了解決策和注意力過濾對認知表現的累積代價。大腦可用于數據處理的資源是有限的,做出決定、抵制沖動或忽略分心等行為會隨著時間的推移消耗我們的認知能量。充滿瑣碎的選擇和分散注意力的信息的環境耗盡了我們的頭腦,使我們的認知能力變得遲鈍,因為大腦不會根據重要性的程度來區分或確定決定的優先次序。換句話說,我們的決策能力受制于認知耐力的限制,并隨著時間的推移而退化。
盡管對認知耐力的極限有天生的認識,但許多軍事領導人在安排日程和戰斗節奏時并沒有考慮到這一點。例如,在值班日結束時舉行 "夜間法庭 "非司法處罰聽證會的指揮官可能會在日常決策的累積效應使他們的認知能力出現問題和不可靠的時候做出重要決定。相反,領導人可能把他們最有成效的時間花在回答電子郵件或執行低級任務上,而不是最大限度地利用他們的認知資源來完成復雜的任務和決策。這些基本的例子說明了為什么軍隊必須將時間管理教育和培訓納入其認知主導工作中。
即使在考慮認知耐力的極限時,我們的大腦也經常被淹沒在信息中,必須在采取行動之前進行綜合分析。對最佳復雜性理論的研究表明,在做決定時需要考慮的因素有一個最佳數量,太少或太多都會降低性能。正如對計算機的研究一樣,這些研究揭示了人類工作記憶的極限。我們在綜合理解時,很難在腦海中記住超過三到五件知識。此外,試圖考慮10個以上的因素會大大降低性能。了解這一現象有助于促進更好的決策,尤其是在時間緊迫的情況下。
許多人認為,更多的投入將導致最佳決策的產生。在決策實驗中,受試者在超過最佳復雜程度后要求更多的信息,受試者的表現因信息過載而下降。這種趨勢對軍隊來說尤其值得關注,在伊拉克和阿富汗的信息至上主義現在使高級領導人有條件期待大量的信息來支持他們的決策。信息成癮可能會耽誤指揮官等待更多的信息,而這具有諷刺意味的是,這會降低他們決策的質量。
軍方認識到這一挑戰,正在利用人工智能開發改進的信息過濾和決策支持算法,使領導人能夠做出更好、更快的決定。雖然很有希望,但這些努力在不久的將來是有限的,不會完全緩解與現代戰爭相關的認知挑戰。再次,作為全軍腦科學教育倡議的一部分,關于信息過載的負面影響的教育可以推動文化變革,改善決策--無論是否有人工智能的增強。
當美國軍隊慢慢地將提高認知能力融入其文化時,俄羅斯等在認知領域取得了令人不安的進展。中國強調旨在創造神經科學、人工智能和生物技術方面的作戰優勢的研究和開發,作為正在進行的軍民融合的一部分。有影響力的中國人民解放軍(PLA)領導人強調要為延伸到虛擬領域的未來作戰環境做好軍事準備。這些領域包括信息領域和 "意識領域",需要 "精神/認知主導 "才能取得成功。新美國安全中心的高級研究員和中國問題專家Elsa B. Kania指出,這些概念現在經常在解放軍的著作中討論,還有人類和人工智能融合的概念。
同樣,俄羅斯認為思想是現代戰爭的主戰場,"戰爭要以信息和心理戰為主導"。俄羅斯模仿中國在認知優勢研究中對道德規范的堅持值得懷疑,但俄羅斯的方法更多的是依靠通過心理戰和其他手段破壞對手的認知過程。無處不在的虛假俄羅斯敘事給對手帶來了很高的認知負荷,需要增加信息過濾,這消耗了認知資源,并隨著時間的推移降低了決策的速度和質量。在2022年俄羅斯對烏克蘭戰爭的前6個月,就有無數這樣的例子。非人化的言辭、非法吞并的行為以及關于烏克蘭人親近俄羅斯的錯誤說法,都是為了混淆俄羅斯的侵略和制造混亂的說法。通過播種懷疑和制造混亂,俄羅斯的錯誤信息只需要暫時蒙蔽敵人的判斷力,就能造成猶豫,為俄羅斯的活動提供優勢。
此外,俄羅斯軍隊對使用喪失能力的藥劑來降低其對手的認知功能表現出持續的興趣。在2002年杜布羅夫卡劇院的人質事件中,俄羅斯特種部隊在通風系統中釋放芬太尼衍生物,以操縱大約50名車臣分離主義分子和750名俄羅斯人質的意識。雖然他們的行動使分離主義分子失去了知覺,但也導致了大約125名人質的過量死亡和其他人的永久性衰弱。盡管俄羅斯官員在很大程度上認為這次行動是成功的,但他們的行動招致了國際社會的譴責,并再次引發了對國際法,如1993年《化學武器公約》的有效性和適用性的辯論。
神經學和生物化學專家,如喬治敦大學醫學中心的神經倫理學主任詹姆斯-喬達諾,擔心神經科學和技術的進步為利用現有條約、國際法和超國家公約中關于使用化學和生物制劑的空白提供了機會。這包括使用CRISPR基因編輯和納米技術來增強士兵的神經結構,同時制造新型神經武器來降低對手的認知功能。
飛躍性技術的誘惑和神經科學的進步獲得了國內媒體對認知表現舉措的大部分關注。雖然這些努力很重要,而且應該繼續下去,但美軍必須利用實際的、近期的機會來實現現在的認知主導地位。
間接和直接提高和優化認知性能的方法可以以適度的成本為美陸軍提供快速的勝利。了解到直接-間接二分法涉及到對復雜的認知和神經科學概念的一些過度簡化,但這些類別還是提供了一個討論的框架。提高認知能力的間接方法是通過飲食干預、睡眠調整、體育鍛煉、藥理學和復原力訓練來影響認知能力。直接方法 "直接針對學習、感知、認知或情感的結構或功能機制和過程",包括經顱腦電刺激或現實增強等方法。在實踐中,這兩種方法沒有界限之分,都需要有效地提高和優化認知性能。
圖 2. 認知優勢的綜合方法
使用計算機類比有助于可視化認知增強,同時建立在間接和直接方法的概念上。認知性能的優化意味著我們在現有的硬件(或生理學)的限制下,最大限度地提高我們的軟件(認知能力,或我們如何思考)。在這種情況下,硬件和軟件的升級都可以為提高認知能力提供機會。硬件升級通過人才管理、生理干預、藥物干預和技術提升提供了一種間接的方法。
在《從優秀到卓越》(Harper Business, 2001)中,詹姆斯-C-柯林斯(James C. Collins)通過 "讓正確的人上車,讓錯誤的人下車,讓正確的人坐在正確的座位上 "這一比喻來描述建立一個成功組織的第一步。同樣,陸軍提高部隊集體認知操作能力的最佳機會可能在于識別、招募、評估和保留合適的人。
研究表明,認知能力部分是遺傳的,通過結合神經影像技術、統計工具和傳統的認知評估,識別諸如神經靈活性和技能專長等特質是可能的。這些工具為軍隊提供了一個識別和優化個人認知特征應用的機會,作為信息時代招聘和人才管理計劃的一部分,促進認知多樣性以提高創造力和決策力。認知多樣性被定義為 "視角或信息處理方式的差異"。最近的研究表明,認知多樣性加速了學習,并提高了團隊在不確定的復雜情況下的表現。通過有效的評估和人才管理計劃,可以提高軍事團隊的認知多樣性。諸如 "雅典娜項目 "這樣的倡議為應用評估作為自我發展工具提供了一個有前途的模式,但在軍隊范圍內實施需要增加研究、開發和應用的資金。在當今競爭激烈的就業市場上,陸軍必須在目前的評估和人才管理努力的基礎上,招募和保留所需的人才,以優化其認知潛力并超越近似的競爭對手。
大量的研究表明,體育訓練、適當的營養和睡眠管理與認知能力有明顯的聯系。陸軍長期以來一直倡導體育鍛煉對心理和生理的益處,研究證實耐力運動中產生的神經化學物質具有神經保護作用,可以改善學習和記憶。睡眠管理和營養指南也反映在美國陸軍的 "整體健康和體能"(H2F)理論和 "績效三要素戰略 "中,但在整個部隊中缺乏廣泛接受。盡管陸軍認識到適當的營養對支持 "最佳身體和認知功能 "的重要性,但士兵們往往將陸軍的營養概念與體力、體質和能量水平聯系起來,而不是與心理功能或情緒聯系起來。例如,領導人對脫水的身體影響很熟悉。然而,脫水對認知的影響在醫學和研究界之外卻鮮為人知。
在可用于提高認知能力的生理干預措施中,睡眠管理可能是軍隊應用中最尚未開發的潛力。陸軍H2F理論指出,"認知能力和戰備狀態與獲得的睡眠量有直接關系",許多研究將睡眠與陸軍的認知功能和戰備狀態直接聯系起來。即便如此,研究表明,超過62%的士兵長期遭受睡眠不足的困擾,無論是在駐扎地還是部署地,每晚平均睡眠時間不足6小時。軍隊要想在睡眠管理方面取得有意義的進展,就必須在入伍培訓和專業軍事教育的各個階段通過腦力教育來刻意改變文化。教育必須與表彰和獎勵士兵建立健康的睡眠習慣作為提高認知能力的生活方式的計劃相結合。
隨著美陸軍尋求改變其文化,更廣泛地采用可穿戴技術可以提高士兵和領導者的意識,建立理想的習慣和做法,并改變思維方式。所有這三者都需要啟動在認知和身體領域的持久增強性能。沃爾特-里德陸軍研究所(WRAIR)和美國陸軍作戰能力發展司令部士兵中心涉及數百名第十山地師士兵的研究表明,商業化的現成可穿戴技術,如手表、戒指或手環,可以在個人和組織層面推動行為變化。例如,監測睡眠習慣和下班后的身體活動水平可以幫助領導者利用個性化的數據指導士兵建立健康的習慣。陸軍應優先考慮在這一領域的近期投資,作為快速和可見的手段來證明對提高認知能力的承諾。與領導層的教育和強調相結合,可穿戴設備的使用可以為廣泛的文化變革提供強大的催化劑。
與生理干預類似,藥物干預為提高認知能力提供了機會。興奮劑的使用就是這樣一種干預,在軍隊中已經很普遍了。在高端領域,醫療機構為飛行員開出了諸如右旋苯丙胺之類的藥物,以維持長期任務中的認知能力和警覺性。更常見的是,士兵們通過飲用咖啡因來幫助他們的個人表現。雖然有機會對提高認知能力的藥物如莫達非尼(Provigil)、哌醋甲酯(Ritalin)和各種苯丙胺混合物(Adderall)的使用進行進一步研究和道德辯論,但咖啡因的使用在西方社會基本上沒有爭議。即便如此,過量飲用咖啡因也會產生不必要的副作用,包括失眠、焦慮、血壓升高和心悸。為了可靠地提高認知能力,需要采取慎重的方法來使用興奮劑,以達到最佳的喚醒水平,同時不產生負面的健康后果。
2B-Alert應用是優化咖啡因使用的一種新方法,有可能在全軍范圍內使用。目前,沃爾特-里德陸軍研究所與生物技術高性能計算軟件應用研究所合作開發,2B-Alert使用機器學習、睡眠歷史和個人數據來預測睡眠不足時期的認知功能,并制定咖啡因劑量計劃,以在所需的時間窗口內最大限度地提高警覺性。如果與可穿戴技術相結合,納入所有訓練,并成為日常軍事文化的一部分,像2B-Alert這樣的應用可以為整個聯合部隊提供安全和具有成本效益的認知增強。
整個美國防部的多種努力都在探索基于技術的認知增強手段。這些技術在開發、應用方法和成本方面差異很大,但應被視為整體認知優勢戰略的一部分。例如,經顱電刺激(TES)可以增強大腦信號,模仿深度恢復性睡眠時的腦電波,以提高睡眠質量。因此,在睡眠不足的環境中使用TES可以使士兵從短暫的睡眠中獲得更多的恢復性效果,以提高認知能力。沃爾特-里德陸軍研究所睡眠研究中心與美國國防部高級研究計劃局(DARPA)和Teledyne Scientific合作,正在評估可實地使用的TES設備的有效性,以充分利用有限的睡眠時間并改善疲勞管理。
經顱直流電刺激(tDCS)已經被奧林匹克運動員使用,并正在國防部內進行測試。與經顱電刺激不同,tDCS通過增加大腦中的能量來促進神經活動,改變大腦連接,以改善運動表現和認知。海軍特種作業人員的初步測試顯示,TDCS可以提高訓練效率,空軍的研究顯示,使用經顱直流電刺激可以提高警覺性,增強疲勞狀態下的認知能力。
生物技術和藥物認知增強正在引發關于士兵同意增強的自由和增強社會一部分人的長期反響的道德辯論。陸軍在繼續其強化研究工作以跟上近似競爭對手的步伐時,應該參與到這場辯論中。然而,認識到這些道德限制和預算限制,陸軍應該在短期內更多地強調容易執行和爭議較少的工作。
重新審視我們的計算機類比有助于說明,增強的認知軟件--我們如何使用我們的思想--為增強認知性能提供了直接的方法。雖然間接的步驟可以改善認知的硬件,但僅靠更好的硬件可能無法提高性能。新的硬件往往需要升級的軟件和更高的用戶熟練度來最大限度地發揮其潛力。因此,直接和間接的方法--升級的硬件和軟件--對于實現最高水平的認知性能是必要的。大腦教育、基于認知科學的學習技術和管理信息過載的方法以最小的投資提供實用的軟件升級。
許多認知心理學家和神經學家都認為,優化個人的認知表現要從了解大腦開始。對大腦功能的基本了解為元認知,或 "關于思維的思考 "奠定了基礎。軍隊理論重視元認知在復雜問題解決和適應性思維方面的作用,但對如何發展和改善元認知過程卻沒有提供深入的見解。此外,陸軍理論中關于元認知的文章很少,完全集中在復雜問題解決背景下的領導人身上,沒有考慮到整個部隊的廣泛應用。安德魯-斯蒂德曼在其2011年關于應用神經科學提高陸軍認知能力的論文中指出,"元認知還沒有作為一種理想的領導者特質和培訓概念下降到戰術層面。"
對服役人員進行基本腦科學和元認知的普遍培訓和教育,如果輔之以個人實時觀察大腦過程的能力,可以為高峰認知性能打下基礎。元認知是通過正念完成的,或者說是 "有目的、無判斷 "地密切關注當下。多項神經科學和心理學研究顯示,練習正念有很大好處,包括改善認知控制和決策。陸軍將正念訓練作為士兵和家庭綜合健身計劃的一部分,并在陸軍H2F學說和教練中承認正念和正念意識的概念。然而,正念和正念意識的概念在整個部隊中缺乏廣泛的理解和采用。
腦科學、元認知和正念意識必須被納入專業軍事教育,以優化整個軍隊的士兵認知表現。美國陸軍外國軍事和文化研究大學提供的應用批判性思維課程為野戰級預科課程和陸軍戰略教育計劃提供了基線課程內容。這些主題也應該在所有的初始入職培訓管道中教授,根據技能和經驗水平進行調整,并根據職業生涯的評估結果進行定制。這種方法在許多方面類似于海軍的 "勇士堅韌"計劃,該計劃側重于發展水兵的精神、心理和體力,并取得了初步的成果。
海軍在審查了菲茨杰拉德號和約翰-S-麥凱恩號上最近發生的事故后,于2018年在所有士兵和軍官入伍計劃中實施了 "勇士堅韌 "課程。 它使用正念和體育心理學的目標設定、自我對話、可視化和能量管理技術來改善情緒調節和認知表現。勇士堅韌計劃的實施標志著對整個海軍文化變革的重大投資,其結果迄今為止還難以量化。美國海軍臨床心理學家梅麗莎-D-希勒-勞比(Melissa D. Hiller Lauby)上尉指出,2020年7月在美國海軍 "邦霍姆-理查德 "號上成功應對火災的水兵們在行動后的匯報中多次提到了 "勇士堅韌 "訓練的好處。具體來說,自我對話和情緒調節的使用幫助一些水手在面對極端壓力時更加冷靜地應對。需要更多的時間和分析來判斷該計劃的有效性,但 "勇士堅韌"可以為陸軍改變其認知性能文化的努力提供參考。
訓練在軍隊中無處不在,但最近的認知科學研究表明,軍隊的許多訓練技術可能無法產生長期的理解力。認知科學表明,重復操練、死記硬背和重讀并不像許多人認為的那樣有效。對學術情況和試圖掌握運動技能(如擊球)的運動員的研究表明,改變提供指導和訓練的方式會大大影響學習的質量和持久性。采用基于認知科學的學習方法,如間隔練習、交錯練習和適應性輔導,可以為軍隊提供低成本的機會,使教育和訓練的效果最大化,以提高認知能力。
此外,《陸軍野戰手冊》(FM)7-22《整體健康與體能》指出,基于認知科學的學習策略,控制學習環境,限制干擾,并根據士兵的學習偏好進行指導,可以使士兵更有效地掌握任務。陸軍大學的應用認知和腦科學專家韋德-埃爾莫爾(Wade Elmore)認為,自適應輔導技術有機會增加持久的學習。研究表明,使用機器學習和計算機算法提供定制教學的智能輔導平臺優于所有其他方法,包括人類輔導員。雖然智能輔導可能不會直接提高決策和批判性思維能力,但通過量身定制的強化學習方法來增加士兵的隱性知識,為隨后掌握相關的認知任務提供了基礎。基于認知科學的學習方法和技術必須在整個陸軍訓練中采用,納入陸軍訓練理論,并融入陸軍訓練文化。提高嵌入士兵長期記憶中的持久知識和技能的數量和質量是優化認知軟件以達到最佳性能的有力方法。
雖然基于認知科學的學習方法和技術可以幫助優化學習,但改善士兵的短期工作記憶需要一個不同的方法。陸軍理論認識到這一點,并在FM7-22《整體健康和體能》中宣稱,優化短期工作記憶的士兵可以更有效地處理和完成復雜任務。該手冊繼續提供任務簡化、學習提示和記憶提示作為提高績效的方法,但沒有采取更全面的方法,并錯過了在這個關鍵領域影響軍隊文化的機會。
抵消信息過載的影響需要從根本上改變陸軍 "永遠在線 "的通信和信息管理文化。特別是對領導人隨時可以進行即時溝通的期望,會因為頻繁的中斷、分心和情緒激動而降低認知能力。作為全軍腦科學教育倡議的一部分,關于多任務、分心、頻繁中斷和信息過載的影響的教育可以為推動變革提供重要的第一步。
有效的時間管理提供了另一個減少心理摩擦和提高認知能力的機會。日常行動的要求經常考驗領導者的時間管理技能。然而,在高級軍校以下的專業軍事教育中沒有系統地教授有效的時間管理技巧。因此,許多領導人不知道基于認知科學的時間管理的最佳做法,并執行保證次優認知表現的日常計劃。加強這方面的教育可以幫助領導人制定日常時間表,避免在創作期間分心,提供集中工作的機會,并支持充足的睡眠和營養。
認知能力是所有領域中個人和集體表現的基礎。隨著美國陸軍為多域作戰做準備,建立促進認知優勢的文化和行為對于成功地與在多個領域尋求不對稱優勢的近似對手競爭至關重要。為了成功,陸軍必須用一種優化和提高認知性能的文化來取代其 "永遠在線 "的多任務和連接文化,以便在信息時代占據主導地位并取得勝利。只有通過植根于教育、培訓、技術和努力工作的深思熟慮的方法,美國陸軍才能建立一種持久的認知主導文化。
雖然僅僅依靠技術進步來實現認知優勢是很誘人的,但在預算和行動不確定的情況下,需要在理論、組織、訓練、物資、領導和教育、人員、設施和政策(DOTMLPF-P)框架內采取多樣化的方法來減少風險。陸軍必須同時采用間接和直接的方法來提高認知性能,同時參與與這些方法相關的道德辯論。美國未來的對手將繼續尋求在認知領域的不對稱優勢。我們必須迫使他們嘗試克服美國士兵的決心、創造力和勇氣來實現這一目標。
人工智能(AI)是一個快速發展的領域,世界各地的政府和軍隊越來越多地將其納入其技術,以創造新的能力。人工智能有可能最終超越人類的智力能力,獲得超級智能。這篇論文研究了超級人工智能(ASI)的影響以及美國的對手如何利用它來獲得不對稱的戰略優勢。本文發現,人工智能在中期和可能的近期對未來的行動構成了極大的風險,并就美國防部應如何思考并將人工智能的威脅納入戰略規劃提出了建議。
人類最偉大的力量之一是我們利用工具的能力。縱觀歷史,工具使我們能夠提高執行任務的效率,使我們的知識專業化,并創造機會反復改進和創造更復雜的工具。機器的發明給了人類一套工具,可以完全取代人類的勞動,而不是放大它,并在勞動的速度和質量上遠遠超過人類。現在,人工智能(AI)的發展正在做同樣的思考。人工智能系統已經在前幾代人認為機器永遠無法完成的任務中超越了人類,例如:圖像和目標識別,復雜的棋類游戲,如國際象棋和明顯更復雜的圍棋,需要實時戰略思考的視頻游戲,讀唇語,甚至通過投資股票市場實現盈利。目前,人工智能的所有應用都是狹窄的,這意味著盡管它們在某項任務上可以超過人類的能力,但它們只能做它們被設計的那件特定的事情,而不是其他。然而,這種情況不會一直存在。
1993年,統計學家Vernor Vinge預測,人類將有能力創造出一種超人類的智能。他推測,這種創造將導致智能爆炸,因為超級智能在自身基礎上不斷改進,變得越來越聰明,將人類的能力遠遠甩在后面。這種能力將對人類生活的各個方面產生深遠的影響。正如人工智能和決策理論家Eliezer Yudkowsky所說的那樣。"沒有困難的問題,只有對某一智能水平來說是困難的問題。向上移動最小的一點[智力水平],一些問題會突然從'不可能'變成'明顯'。向上移動一個相當大的程度,所有的問題都會變得明顯。" 因此,超級智能將為世界舞臺上任何能夠開發和控制它的行為者提供不對稱的優勢。
自第二次世界大戰結束以來,美國一直是占主導地位的世界大國,能夠通過國家權力的四個工具:外交、信息、軍事和經濟來擴大其影響力和追求其利益。然而,歷史告訴我們,占主導地位的世界大國會因為軍事革命而非常意外和迅速地失去這種地位。西方歷史經歷了五次這樣的重大革命:現代民族國家的創建、大眾政治與戰爭的融合、工業革命、第一次世界大戰和核武器的出現。這些革命中的每一次都圍繞著為首先采用這些革命的人提供的不對稱優勢,這使得他們能夠獲得突出的地位,即使只是暫時的,直到其他人也出于需要而采用新的模式。超級智能的人工智能的出現有可能創造出下一次軍事革命,并使美國不再是世界上最大的國家。
默里和諾克斯指出,軍事革命就其性質而言是 "不可控的、不可預測的和不可預見的。"但這是一個觀點問題。納西姆-塔勒布將這些類型的事件稱為黑天鵝,并對其有三個標準:它們是罕見的,有極端的影響,并且是可追溯的。然而,他表明,某件事之所以成為黑天鵝,特別是因為沒有認真對待這種可能性,而不是沒有人想到它。舉例來說,如果有人在9-11事件之前就認為恐怖主義是一種合理的威脅,并要求在飛機艙門上加鎖,那么被劫持的飛機成為武器的黑天鵝事件就不會發生。推動這一變革的人甚至可能會因為他們的假設不正確而受到批評。如果沒有這個事件的發生,就沒有證據表明所實施的變革具有防止恐怖主義的預期效果。
對未來的正確預測在被認真對待時一般是不可能被驗證的,因為他們成功地防止了他們預測的結果。因此,被認為不值得適當考慮或規劃的想法成為決定性的。"看到一個事件的發生正是因為它不應該發生,這不是很奇怪嗎?" 如果美國希望在一個正在迅速發展并變得越來越復雜的世界舞臺上保持主導地位,它就必須對可能的和不可能的事情進行思考。正如參議院軍事委員會前參謀長克里斯蒂安-布羅斯在其《殺戮鏈》一書的結論中所說,"問題是想象力的失敗"。
技術正在以指數級的速度發展,并將在某一時刻導致下一次范式轉變和軍事革命。人工超級智能(ASI)有可能在國際行為者揮舞國家權力工具的能力方面創造不對稱優勢,并導致這樣一場軍事革命。從歷史上看,軍事革命的結果往往是,誰最先發揮新革命的不對稱優勢,誰就能推翻當時的世界霸主。下一次革命也會如此,美國可能會發現自己被剝奪了世界主導地位,除非它能預測并為即將到來的事情做好準備。僅僅為今天挑戰美國主導地位的差距尋求解決方案是不夠的,因為今天的問題在下一次范式轉變后將變得無關緊要。因此,如果下一次軍事革命以超級人工智能為中心,美國防部如何確定可能被利用的漏洞?
美國防部在超級智能方面的文獻有一個明顯的空白。這次探索的目的是填補文獻空白,確定這種技術所帶來的風險程度,并確定對手可能利用ASI攻擊美國的潛在漏洞。這將為國防界的決策者提供關于該主題的相關觀點,并告知在規劃和預測中應考慮該技術的程度。通過額外的研究,如果對手率先獲得ASI,可以減輕已確定的漏洞以防止其被利用。最終,本研究的目的是防止ASI軍事革命的出現成為一個黑天鵝事件,使美國失去其世界主導地位。
本論文試圖回答的主要研究問題是:對手如何利用ASI來取代美國作為世界主導力量的地位?為了回答這個問題并達到研究的目的,還需要回答幾個問題。 1.ASI有什么獨特的能力,使它能夠影響國家權力的信息和軍事要素? 2.對美國有敵意的行為者如何利用ASI的能力來實現作戰和戰略效果? 3.在信息和軍事領域有哪些弱點可以被擁有ASI的美國對手所利用?
作為對一項理論技術如何在未來作戰環境中使用的探索,必須對該未來環境的狀態做出若干假設。因為本論文的目的是確定脆弱性和評估風險,所以對該環境的假設是那些被認為有可能造成最大風險的假設。這些關鍵的假設在文獻回顧中都有更深入的闡述。
1.通用人工智能(AGI)將在2035年之前初步開發,并在2040年之前推進到人工智能。
2.美國的一個對手將是第一個開發AGI/ASI的人,并且該技術不會在他們的控制范圍之外被分享或擴散。
3.一個發達的人工智能是可控的,不具備獨立于其控制者的驅動力和動機,并作為其控制者意志的延伸而發揮作用。
4.2040年的作戰環境將如國家情報委員會2040年報告中描述的競爭性共存情景,主要特點是美國和中國之間的競爭。
雖然近年來國防界的成員們在文獻中充斥著關于人工智能的著作,但從國防的角度來看,關于超級智能主題的文獻存在著明顯的空白。雖然人工智能本身有可能在軍事和民用領域產生變革,但本研究將開始填補有關人工智能的未來及其創造軍事革命的潛力的知識空白。此外,這項研究還試圖確定潛在的弱點,這些弱點可能被控制人工智能的對手所利用,以廢止或取代美國作為世界主導力量的地位。這項研究的結果將為預測未來部隊需求的戰略計劃者提供洞察力。識別弱點是緩解的第一步;然而,還需要更多的研究來為識別的弱點找到解決方案。矛盾的是,本研究的真正意義只有在其預測沒有實現的情況下才能實現;也許表明它在防止所設想的負面情況的發生方面發揮了作用。