本文是《第 14 屆北約運籌與分析 (OR&A) 會議:新興和顛覆性技術》上的重要文章,介紹了從手工兵棋推演到桌面兵棋推演,再到數字兵棋推演,到智能兵棋推演的整個開發過程,值得一讀。
作者描述了他們在瑞士國防裝備采購局科學和技術部(armasuisse Science + Technology)的技術前瞻研究計劃,也稱為 DEFTECH(DEfence Future TECHnologies,國防未來技術),應用各種兵棋推演相關方法的經驗,以識別破壞性技術趨勢,評估其在軍事背景下的影響并向瑞士武裝部隊通報可能的機會和威脅。
這包括一個從 2017 年開始并仍在進行的迭代過程,其中不僅創建了一個開放平臺,而且還舉辦了幾次國際研討會。應用的方法包括更高聚合級別的矩陣式兵棋推演、受北約破壞性技術評估游戲 (DTAG) “系統卡理念(Idea of System Cards)”啟發的紅隊成就,以及講故事的方法。
對技術的特別關注最終促進了一種名為“新技術戰爭”的戰術桌面兵棋推演平臺開發,該游戲可商用。作為一個平臺構建的互聯網組件允許感興趣的利益相關者之間進行交互,這些利益相關者希望模擬其他技術或場景并將其提供給社區。集成多智能體模擬、決策支持、人工智能和視頻游戲的數字化游戲正在開發中。
作者介紹了過去研究的結論,包括不同的設計理念、確定的優缺點、最佳實踐、當前的發展和愿景。
你通常期望從一個關于技術預見的研究項目中得到的肯定是關于在給定的時間范圍內可能出現的技術分析報告。根據你的考慮,那個時間范圍可以是近的,也可以是遠的。這似乎是一個合乎邏輯且直截了當的答案,而且確實如此。但是,請稍等片刻,問問自己:你是對技術本身感興趣還是對它們將提供什么感興趣?它們將如何影響你的作業方式以及它們可能代表哪些機會和威脅?在這個階段,甚至更進一步,問問自己,你真正感興趣的是機會、威脅,以及它們所代表的東西,還是它們代表你?這種差異并不是軼事,因為它意味著從更具描述性的可交付成果轉變為與你個人產生共鳴的事物。實現這一目標的最佳方式是產生獨特的體驗,與你的感官互動,以便你可以在需要時參考它。
我們處于國防環境中,正常的預期交付成果將是一份專門針對技術領域的報告。因此,包括一些故事講述在內的敘事工作可能是向讀者傳遞經驗的一種方式。不幸的是,這種體驗可能只停留在情感層面。讓人們玩弄技術可以實現的東西,并在給定的場景中體驗他們決定的后果肯定會帶來更多的見解。
然而,在之前還有一個額外的挑戰:我們想要試驗的要素還不存在。因此,我們必須模擬它們,而不是簡單地測試它們。帶著想法和感受而不是價值觀,為了提供必要的數學模型來轉向模擬世界。正是在這一刻,我想到了“游戲”。但是怎么做?用什么做?和誰一起?在哪個級別?多久?在不知情的情況下,我們打開了潘多拉魔盒,其中包含我們必須考慮構建游戲環境的可能性和替代方案。
這里報告的是一個原始的嘗試,不僅展示了已完成的工作,還展示了在此過程中以一種或另一種方式參與的不同利益相關者的動機。過去,現在,將來;每個人都在我們今天的位置和明天的位置中發揮了重要作用。現在看起來很明顯的要素在開始時并不是這樣的;未來可以實現的目標肯定需要今天的奮斗。
該項目是 armasuisse Science + Technology 技術前瞻研究計劃的一部分,也稱為 Deftech - 國防未來技術。該計劃的任務是識別顛覆性技術趨勢,評估其在軍事背景下的影響,并向瑞士武裝部隊通報其可能的機遇和威脅。
該計劃于 2013 年開始,由中央協調并由年度預算支持,以執行不同的項目。鑒于其特殊性,Deftech 的愿景是通過協同效應進行預測。多年來,在前瞻性方法、信息的表示和可視化、開源情報 (OSINT) 的利用、科幻小說的使用、最近側重于使用技術的兵棋推演以及對社會接受(或不接受)雙重用途技術應用的理解。
鑒于該計劃的協作性質,大部分活動及其成果可在專用互聯網平臺 (//deftech.ch) 上獲得。
新技術的主要挑戰之一在于評估其未來影響并創造洞察力,這對軍事作戰員和指揮官來說都是切實可行的,對軍事規劃人員和系統開發人員來說也是可行的。由于兵棋推演是基于人類互動的演習,因此當應用于技術環境時,它有助于在潛在軍事用戶定義的動態和有爭議的作戰環境中實現新興技術。這允許探索潛在的技術實施及其影響。因此,技術分析是兵棋推演在國防環境中的主要應用之一。
這形成了認知興趣以及我們選擇的方法論方式的起點,這將在以下部分中進行描述。
2017 年,我們首先為 2035 年的瑞士進行了一場技術兵棋推演。在這個框架中,我們專注于三個不同的子場景,它們描述了潛在但最典型的安全挑戰。根據 armasuisse 的“DEFTECH 雷達”() 描述的預選未來技術,在兵棋推演中提供給玩家,以便他們可以在行動過程中根據需要靈活使用。
游戲設計的靈感來自于 Engle 的矩陣游戲理念,因為它具有探索性的方法以及在設計和執行過程中的靈活性。在我們的案例中,我們開發了一個雙邊桌面研討會游戲,每個回合都有計劃周期,之后雙方交替執行他們的行動。在每一個回合中,雙方各有四名參與者,討論了他們行動的預期效果,并描述了為此問題應用的技術,由主持人主持。基于該討論,主持人為行動分配了成功概率。隨后通過擲骰子來確定實際結果,以將隨機效應整合到交互中并保持游戲繼續進行。
根據我們的設計,游戲依據玩家的決定、技術應用、討論的論點和確定的結果創建了一個連續的敘事。分析的洞見來自于敘事本身、分析者的觀察和玩家在對方不斷的對抗和反制下討論并努力創造效果的投入。此外,記錄在案的敘述、分析師的筆記和最具爭議的話題為后續研究提供了各種小插曲和假設。
除了這些結果之外,我們還發現了我們設計的一些挑戰和缺點:首先,一般來說,兵棋推演提供了探索性見解,但由于開放的人機交互,以逃避可復制性為代價。更重要的是,應用技術的物化和與系統的集成構成了主要挑戰,尤其是高水平的集成。為了減輕赤字,我們改編了北約顛覆性技術評估游戲 (DTAG) 中的元素,即所謂的“系統理念”(IoS)。
要創建IoS,首先要確定相關的未來技術。在第二步中,IoS卡牌是在一個研討會上以給定的卡牌格式制作的,即將一種或多種選定技術與特定設備相結合,以運行新的潛在系統。此類 IoS 卡牌可以單獨使用(即記錄如何將相關技術應用于未來軍事系統的見解和想法)或作為上述進一步技術兵棋推演的輸入。我們于 2018 年在 armasuisse 的一個研討會上執行了這一步驟,其中有幾個工作組,最多 8 人,他們首先必須針對特定場景和要實現的目標提出一兩張 IoS 卡牌。之后,兩個小組配對并通過順序結構化的討論在紅隊努力中相互挑戰他們的 IoS 卡牌。第三步,包括使用 IoS 卡牌進行的以技術為中心的兵棋推演及其相關分析,可以按照上述兵棋推演的描述執行。作為經典兵棋推演的替代方案,IoS 卡牌還可以用作游戲和計算機模擬的建模輸入,以分析假設的未來操作環境中的基礎技術,如下所述。
圖 3-1:初始兵棋推演的游戲輸入和執行
分析情況后,我們得出了一個顯而易見的想法,即為了了解通過新技術集成實現的新產品影響,我們需要在它使用的級別上對其進行模擬。在我們的案例中,這意味著從戰略層面轉移到戰術層面,其中必須為每個系統定義保護、殺傷力、機動性等參數的值。由于重點是理解這些系統提供的潛在破壞,我們必須具有輕松更改這些值的靈活性,以查看哪種組合將允許戰術破壞或簡單優勢。
讓我們考慮一下外骨骼的例子。愿景是裝備一些步兵,使他們能夠更快地移動,攜帶更多的重量(保護?彈藥?),減少身體疲勞和受傷等。每個參數的大問題是“多少?”。使士兵能夠攜帶 80 公斤而不是 50 公斤可能會提供優勢,因為這可能意味著在特定情況下提供更多的保護或更多的彈藥,但是專注于開發這樣的系統是否足夠重要?如果你可以攜帶 800 公斤而不是 80 公斤呢?
因此,為了激發交流和討論,游戲必須能夠輕松模擬這些變化并激發圍繞它們的討論。目標不是取勝,而是了解這些未來系統在給定戰術場景中的優勢和劣勢。考慮到所有這些,桌面游戲的選擇作為一種解決方案。
然而,為了在半天的過程中整合“游戲”部分,以便在模擬之前展示新系統,我們提出了以下先決條件:
(1) 游戲將圍繞“藍對紅”場景。
(2) 用戶手冊應該足夠簡單,以便初學者能在 15 分鐘內開始玩起。
(3) 一場比賽的持續時間必須最長為 60 分鐘,以便在半天的時間內測試不同的選項。
(4) 游戲必須足夠模塊化,以允許引入新的未來技術/系統以及新場景,以適應不同利益相關者的興趣和關注點。
在開發過程中,我們直接讓瑞士武裝部隊,即軍事理論和未來規劃團隊參與場景的定義以及未來技術的選擇。我們一起確保我們從藍方模擬的一切都尊重日內瓦戰爭公約。我們與專家驗證了各種技術參數,以確保至少在第一次迭代中,我們將使用可以在未來幾年內實現的價值。
考慮到這些要求,我們開始了將成為“新技術戰爭”(NTW)兵棋推演平臺的旅程。
大多數桌面兵棋推演,其中最成功的商業游戲,都針對最廣泛的現實主義。由于精確的游戲機制和夸張的細節,您通常會以犧牲簡單性為代價來實現這一點。很少看到最少少于 30 或 40 頁的規則手冊。對于我們的開發,我們必須顛倒范式,拿出一個 4 頁的手冊來盡可能準確地模擬,要盡可能簡單。
因此,我們從需要開發一款能夠以簡單且非常靈活的方式采用當前瑞士學說的游戲原則開始。靈活,因為我們必須能夠細化游戲的參數,才能清楚地看到對這些參數有影響的新技術效果,而且僅限于那些參數。
圖 4-1:以新技術和系統為重點的桌游“新技術戰爭”的表示(標題“用明天的系統挑戰今天的戰術”總結了我們通過玩這個嚴肅的游戲試圖強調的內容)
在這個階段,桌子周圍的所有玩家都應該開始更好地理解新系統可以在特定的戰術情況下帶來什么。比僅僅閱讀有關它的報告要好得多。然而,還有一個懸而未決的問題我們還沒有真正解決:作為防御者或攻擊者,有沒有一種特定的方法可以使用這個新系統來完成分配的任務?
要回答這個問題,您需要考慮在給定場景中使用新系統的所有可能方式。為此,您需要探索數字世界。
我們決定將兵棋推演轉移到數字世界,而不是讓它在屏幕上播放,而是為了獲得關于如何以最佳方式使用新系統并挑戰當前戰術程序的更多見解。為了實現這一愿景,我們開始研究以下三個主題:
(1) 我們可以從生成藍色與紅色場景的所有可能結果中學到什么?
(2) 人類可以從與人工智能 (AI) 的兵棋推演中學到什么?我們該怎么做?
(3) 我們可以向人類玩家呈現什么類型的信息,以使人類加 AI 比單獨的 AI 更好?你如何將信息呈現給玩家?
在任何重要的兵棋推演中,可能的結果數量都非常龐大,以至于人類無法靠想象探索和分析它們。在專注于創造學習效果的訓練兵棋推演中,無法探索整個結果空間可能無關緊要,但如果你將其用于開發新條令、測試作戰概念和評估戰術決策,則具有至關重要的意義。在這些情況下,你需要區分什么是可能的、合理的或可能的。
如何克服這一挑戰?多虧了所謂的多智能體模擬。由于計算機比人類玩得更快,多智能體模擬可以系統地探索游戲結果的整個空間并確定最佳行動方案,從而產生合理的游戲結果。
桌面游戲等基于規則的系統可以直接轉化為模擬:游戲規則和游戲環境(如地形和時間)被編碼為計算機模型,逐漸向前成型,同時玩家互動的結果被記錄為模擬世界的新狀態。
多智能體模擬是城市、金融交易或軍事行動等現實世界系統的數字雙胞胎。為了構建多智能體模擬,首先生成合成種群。這是感興趣系統的靜態快照,包括個人的社會人口特征和行為以及社會技術環境。然后使用模擬技術根據行為規則和環境約束對合成種群進行動畫處理。然后對模擬進行校準,以產生盡可能與感興趣的真實世界變量在統計上無法區分的輸出。這種經過驗證的模擬不僅有助于探索游戲結果的范圍,而且有助于診斷、預測和預見。
構建和運行我們的“新技術戰爭”(NTW)的多智能體模擬涉及以下步驟:
(1) 熟悉NTW:玩幾輪NTW,學習游戲,了解規則。
(2) 構建NTW模型:根據規則手冊、其他資料和對NTW的主觀理解,包括選手、裝備、規則、地形等。
(3) 將模型編碼為多智能體模擬:編寫軟件來近似游戲“物理”,例如游戲板的數字化版本;描述由每個場景的系統、效應器和平臺組成的軟件包;為智能體定義任務目標,并為智能體配備強化學習行為。
(4) 模擬的驗證:手動回合的游戲結果是手繪草圖的(見圖 5-1,左)。藍色和紅色虛線表示人類玩家在游戲中如何移動藍色和紅色軍事單位。藍色和紅色的點表示射擊位置。藍色和紅色實線表示火力線。然后將手繪草圖數字化(圖 5-1,右);運行了 1,000 次 NTW 模擬,結果以類似于手繪草圖的格式自動繪制出來(圖 5-2)。最后,通過為圖像識別開發的機器學習算法將手動游戲結果與模擬游戲結果進行比較。
(5) 創建一個基礎設施來運行實驗:以探索游戲結果的空間并確定最佳行動方案。這包括產生 10,000 次模擬運行。
圖 5-1:兩個人玩游戲的手繪草圖結果與數字化版本
圖 5-2:模擬游戲結果的可視化表示
正如一開始所假設的那樣,模擬可以探索合理的游戲結果的整個空間。我們并不打算重現特定的游戲結果,而是想知道為多智能體模擬提供動力的人工智能是否具有產生超越人類想象和游戲的合理結果所需的屬性。首先,我們發現模擬確實產生了人類玩游戲的結果。這些在圖 5-3 中的棕色簇中顯示為紅色十字。點云代表 1,000 個模擬游戲。其次,通過機器學習對游戲結果進行聚類,出現了三個不同的群體。這張圖的意義就很明顯了:模擬玩游戲并產生人類玩家沒有想到的合理結果。這些都是藍色和綠色集群中代表的所有游戲。
圖 5-3:以點云表示的 1,000 個模擬游戲結果(游戲分為三個不同的組。現實世界的游戲,在點云左側被描繪為紅色十字,僅類似于棕色的游戲集群。游戲以藍色和綠色的簇是模擬玩的游戲,但不是人類玩家想象的。點之間的距離代表游戲的兩個數字表示之間的差異,如圖 5-2 所示)
人類玩的游戲表明 BLUE 可以贏得大約 40% 的 NTW。相反,模擬表明,考慮到完整的結果集,而不僅僅是人類迄今為止所玩的結果,BLUE 獲勝的機會要低得多,約為 3%。微調BLUE的強化學習參數后,BLUE的勝率沒有超過10%。因此,模擬表明人類可能對獲勝過于自信。這可以通過最初不知道玩游戲的其他可能性來解釋。人類鎖定在狹窄、熟悉的模式中;而模擬沒有。模擬有助于確定最佳行動方案,而不會成為我們自己認知缺陷的犧牲品。
通過與數字冠軍比賽來消除認知偏見是為 NTW 開發兩種人工智能(一個玩 RED,另一個玩 BLUE)追求的目標。
現代基于人工智能的智能體不僅在提供信息的能力上優于人類,而且在受控情況下做出決策的能力也優于人類。這意味著:在一個具有給定規則和行動的微型世界中,IT 系統不僅為決策提供背景,而且能夠自行決定。如果可以將決策任務放入這樣一個簡化的世界(通常以游戲的形式),那么量身定制的 AI 通常可以幫助選擇正確的動作。所描述的設置幾乎包括所有戰略游戲,例如國際象棋、圍棋、將棋、Hex 等,AI 玩家可以毫不費力地擊敗人類世界冠軍。
這項技術突破的核心在于通過數十億次模擬訓練人工智能的想法。每一次輸贏都會被記錄下來,每一步都會改進人工智能。不僅向決策者提供了一個模擬,而且一個 AI 會運行盡可能多的合理案例,并選擇最有可能產生最佳結果的行動。經過足夠多的迭代后,這個過程產生了在幾乎所有戰略游戲中超過人類大師能力的奇妙動作。
NTW 游戲是與軍事專家密切合作設計的。它是一個簡化但現實的模型,用于在各種現實世界的戰爭場景中進行決策。玩家面臨典型的軍事沖突情況,必須決定戰略和戰術以達到他的軍事目標。當然,玩家可以在他的想象中運行有限數量的場景(模擬),并根據經驗、可用數據和模擬采取最佳行動。然而,已經為許多其他游戲建立了訓練 AI 智能體的方法,以達到超人的表現。 NTW 采用基于人工智能的方法,旨在學習軍事戰術和戰略。一旦在游戲規則范圍內達到令人滿意的表現,游戲的結構可能會被擴展,以更準確地捕捉現實戰爭。示例包括添加未來的武器、詳細說明其屬性、合并具有不同目標的其他智能體等。
就策略游戲 AI 玩家的開發而言,兩種尋找最佳策略的方法可以被視為標準。我們將在下面詳細描述這些方法。
首先是經典搜索,其中 AI 玩家嘗試模擬盡可能多的游戲狀態,然后選擇最好的模擬。這種方法可以被描述為蠻力,因為它的最終目標是嘗試所有可能的游戲狀態并遵循導致勝利的決定。在實踐中,窮舉搜索通常是不可能的,因為即使是簡單的游戲也會很快破壞最強計算機的能力。國際象棋中合理的游戲狀態數量估計在 1040 左右,這個數字遠遠超出了計算機模擬的范圍。因此,并非所有狀態都被分析,但人工智能限制了足夠數量的合理結果。搜索由兩個關鍵參數量化。分支因子衡量對手玩家在當前決定下可以采取的合理行動的數量。搜索深度定義了模擬了多少后續動作。對于國際象棋,典型的分支因子約為 3,即對于每一步,通常考慮三個回復,并且深度最多為 80 步。一旦達到最大搜索寬度(由分支因子給出)和深度,定制的評估就會測量結果的質量。實現這種方法的常見 AI 算法是所謂的 AlphaBeta 搜索。值得一提的是,在商用智能手機上運行的實現 AlphaBeta 的公開國際象棋程序(例如 StockFish)比人類世界國際象棋冠軍要強得多。
雖然 AlphaBeta 在分支因子和搜索深度不太大的情況下非常成功,但當這些指標增加時它很快就會失敗。由于搜索練習的指數性質,即使增加一個單位的深度也會將計算機所需的容量乘以分支因子。因此,不能通過簡單地選擇更好的計算基礎設施來解決這個問題。
在游戲中做出決策的第二種也是更現代的方法,明確地解決了 AlphaBeta 搜索的弱點,可以被描述為定向搜索。已經提出了各種架構,但基本設置如下。兩個深度神經網絡 (DNN) 用于決策。第一個是評估性的,因為它衡量質量。第二個 DNN 通過估計合理行為的概率來指導搜索。與 AlphaBeta 相比,此方法更關注決策的可能和相關后果,而不是盡可能多地檢查。這種類型的搜索算法總結在首字母縮略詞 MCTS(蒙特卡洛樹搜索)下。近年來,MCTS 搜索算法在包括國際象棋、圍棋、Chogi、Hex 在內的許多游戲中都優于 AlphaBeta 搜索,并構成了當前最先進的技術。
與國際象棋相比,NTW 的特點是分支因子明顯更大,但同時搜索深度更小。分支因子大致反映了合理動作的數量。在 NTW 的情況下,可能有多種類型的動作,包括移動、攻擊和響應動作。此外,在 NTW 的每一輪中,玩家的所有人物都可以行動,而國際象棋則只有一個人物移動。這個結果是一個通常從 50 到 100 的分支因子。另一方面,NTW 對每個場景都有一個有限的深度,標準深度是 12,這比國際象棋要小得多。
由于 AlphaBeta 或 MCTS 框架中的大型分支因子,現成的 AI 無法訪問 NTW,但必須開發定制方法。該游戲的一個特殊之處在于響應動作的可能性,它打破了上述策略游戲的標準移動順序。總而言之,NTW 需要一個 AI,它是為游戲的特定結構量身定制的,并且必須在定制的工作中進行開發。我們的團隊目前在 PyTorch 開源 AI 框架(由 Facebook)中實現了一個實驗性 AI。這些實驗是用多個智能體進行的,以測量它們在 NTW 上的性能。智能體可以通過 Web 界面與人類對戰(見圖 5-4)。
圖 5-4:數字化NTW游戲的Web界面,允許人類玩家挑戰為該游戲訓練的人工智能。
此時,擁有有關游戲所有可能結果的數據以及能夠玩游戲的人工智能,我們應該能夠幫助玩家獨立于情況做出最佳決策。我們知道在現實生活中會有所不同,但我們仍然有興趣模擬的“數字同伴”可能是什么,并更好地了解玩家在玩游戲時的認知偏差是如何出現的。為此,我們開發了一個簡單的 NTW 視頻游戲。
玩家將在戰場上化身為一名士兵。挑戰在于處理為棋盤游戲創建的一些初始情況,并將其解決方案轉化為教學敘述。我們的目標是為使用新技術提出的問題提供額外的視角。
這些敘述將始終要求玩家找到 NTW 中現有新系統的最佳用途,即無人機系統、外骨骼、武裝運送機器人和醫療后送機器人。呈現士兵的同伴的游戲交互將支持和評估玩家的表現。
由于智能手機已經可以被視為我們的日常伴侶,因此該游戲是為 Android 和 Apple 設備開發的。
雖然棋盤游戲任務定義了初始情況,但我們將使用多智能體模擬提供的數據來定義有限數量的游戲進程(例如完全成功路徑、混合成功路徑、失敗路徑)。這些數據將形成由不同分支組成的敘事樹。這些分支點將構成在任務期間呈現給玩家的行動選擇。
選擇任務后,會描述其情況,并附有敘事說明。然后向玩家提供一個選擇(例如前進/激活外骨骼/等待)。根據所選擇的選項,將呈現下一個情況,然后再次出現另一個選項。重復此序列幾次(參見分支點)后,將顯示任務結果。首先將要求玩家選擇(從有限的選擇中)其決策背后的原因。這些數據將被發送到分析服務,以便之后進行解釋。
最后,玩家的選擇將以圖形方式呈現,并附有基于理想路徑的批判性評論。目標是讓玩家了解自己的錯誤。一旦任務成功完成,一個新的任務將解鎖并變得可玩。
在第一個任務中,玩家/士兵將不得不僅根據他們的判斷做出決定。同伴只會在場評論游戲中描述的情況,提供正在進行事件的全局信息并提供行動后評論。
只有在完成幾次任務后,同伴才會開始建議最佳路徑。這種游戲機制的目的是讓玩家慢慢習慣于在決策過程中獲得幫助。
但是,對于最后的任務,同伴會開始提出錯誤的選擇,如果被玩家跟隨,則會導致任務失敗。敘事方法將通過敵人對同伴的攻擊來證明這一點。
借助通過數據分析服務檢索到的游戲數據,該游戲機制將衡量一旦習慣了相關建議,即使該信息明顯錯誤,也傾向于盲目遵循同伴指示。這說明即使是你忠實的數字同伴也可能受到網絡威脅!
圖 5-5: The Soldier’s Digital Companion 截圖
最初選擇的方法,IoS 卡牌研討會以及兵棋推演本身,因其互動性和參與者的參與度而脫穎而出。造成這種情況的一個主要原因可能是他們的探索性特征與敵對元素相結合,以挑戰對方的意見、決定和解決方案。除了研究本身,這些活動還為社區內的社交和傳授新技術知識提供了一個平臺。
? 兵棋推演可以幫助展示基于情景作為操作框架的技術影響。它可以展示人類,無論是友好的還是敵對的,在未來如何應用技術。
? 兵棋推演技術支持探索。盡管幾乎不可能重現已執行的兵棋推演過程,但它可以幫助確定進一步分析的起點,并打破主流或過早的觀點,因為它具有對抗性。
? 然而,兵棋推演需要時間來執行,并且不是適合所有目的的正確方法。這尤其適用于不包括人類決策和選擇但側重于物理效應和可能性的技術研究主題,技術實驗、計算機模擬等可能更適合這些主題。
在這一點上,我們結合桌面游戲和基于計算機的分析(如上所示)的方法完成了未來分析的工作。基于游戲的分析有助于深入了解人類行為,無論是作為未來技術的潛在用戶還是個人,都受到對手對技術的創新使用的挑戰。
具有數千次運行的多智能體模擬通過底層游戲機制優化行動過程,來縮小由人類交互和人類偏見造成的時間限制差距。誠然,這強調了整個建模和仿真過程中有效性和驗證的緊迫性。
總而言之,似乎方法和工具的組合將產生最可靠和最有用的結果。結構良好的程序化方法與混合工具包相結合,可確保利用不同方法的優勢并減輕甚至消除弱點。此外,方法學的混合和迭代過程為軍事能力管理領域的深遠決策提供了必要的三角測量。
我們仍處于冒險的開始階段,在我們能夠概括結論并驗證某些直覺之前,仍需要在許多方向上進行努力。這將是一個激動人心的旅程,似乎是構建混合的物理和數字生態系統。它的相互作用將使我們能夠更好地理解和預測新技術在未來或其他方面可能發揮的作用。
本文總結了自 2017 年以來發生(現在仍然如此)的眾多活動和思考。本文的匯編得益于以下人員的工作和貢獻:Helvetia Games SA 的“新技術戰爭”(Pierre-伊夫·弗蘭澤蒂); Scensei GmbH(Armando Geller 和 Maciej M. Latek)的多智能體模擬; Istituto Dalle Molle di Studi sull’Intelligenza Artificiale(Oleg Szehr、Claudio Bonesana 和 Alessandro Antonucci)的人工智能; Oni3 SNC(Matthieu Pellet、Seiko Annie Rubattel 和 Nicolas Schluchter)制作的“士兵同伴”視頻游戲; Longviews (Gabriele Rizzo) 的遠見和方法論討論; IABG mbH(Matthias Lochbichler、Sibylle Lang 和 Philipp Klüfers)的初始技術兵棋推演和 IoS 研討會。
將數字資源信息整合形成系統對這些資源的利用至關重要。這種信息的形式可能是誰負責該資源,該資源可用于什么,該資源在哪里,如何獲得該資源,以及該資源如何與其他資源結合。總的來說,這些信息代表了當前信息環境中各要素態勢感知的組成部分。對這些要素的了解使數字資源的利用更有能力。在實踐中,這種感知可以幫助以一種更適應的方式分配資源,考慮到諸如信息消費者的要求以及提供者和消費者之間的通信渠道所帶來的限制。這里介紹了與自適應處理有關的概念,在基于云的聯盟反潛作戰(ASW)的背景下。在與北大西洋公約組織(NATO)合作伙伴的合作中,一個云基礎設施被用來構建與虛擬平臺相關的計算能力,包括虛擬平臺之間的模擬通信渠道。對基礎設施適應性性質的測試依賴于與 ASW 中的信息分發和利用相關的已定義用例。這里,這些用例被詳細描述。這些用例顯示了支持這樣一個適應性系統所需信息快速增長的復雜性。這些用例還指出了許多未來的研究途徑。
在加拿大皇家海軍(RCN)的作戰任務中,海上信息和衍生物的收集、處理和傳播主要集中在平臺的自主性上,無論是船只還是飛機。這種以平臺為中心的觀點部分是由于在作戰中必須成為一個自給自足的實體,有能力收集和處理對平臺重要的所有信息。盡管實驗已經顯示了無縫連接和利用外部信息的能力[1][2],但在依靠外部資源進行數據和信息處理方面存在著一種謹慎的做法。
這種謹慎的做法部分是由于不愿意依賴外部伙伴,因為與該伙伴的通信可能很差或不存在。遇到諸如缺乏帶寬、大延遲或質量下降等問題的通信渠道通常被稱為 "弱勢網絡(disadvantaged network)"[3]。這種網絡確實抑制了盟軍中其他人或海上平臺與總部所在地之間對任何收集的數據或信息的分發和使用。
當然,處理通信問題的標準對策是構建通信機制,允許更大的信息量通過通信渠道。這種解決方案有效地解決了 "給我更多帶寬"的要求。然而,另一種有效的方法則側重于更好地利用現有帶寬。這里,"更好地使用 "意味著以更全面的方式使用,通過考慮以下因素考慮到整個處理周期:
正在使用的信息。
該信息的位置。
對該信息采取行動所需的處理算法、模型等。
處理算法或模型的位置。
完成處理所需的計算能力。
參與平臺之間的帶寬連接。
最終產品的使用地點。
這些因素認識到信息是一種資源,要被移動并與處理算法相結合,然后形成一個新的產品。這些組成部分的重要性,以及這些組成部分與歷史信息科學的關系,在[4]中有所描述。
對這種描述來說,重要的是認識到信息資源有多種形式。在數字空間中,資源可以是輸入數據、軟件形式的處理算法,或可以許多形式表示的輸出產品(例如,一個數字文件,一個圖像)。還要注意的是,在許多情況下,輸出可能成為另一種算法的輸入。
然而,通過諸如上述(即清單)的考慮來利用信息資源,需要對資源本身有廣泛的了解。請考慮一下,一個信息系統如何確定它所擁有的數字模型是否與一個獨立的、不同的信息系統上存在的輸入數據集兼容。創建資源層面的元數據是一項艱巨的任務,而這一層面的資源知識是需要的。
盡管資源級元數據的編譯是有問題的,但第二個問題很可能更困難--使用資源級數據來自動調整信息系統所需的分配和處理。事實上,如果不做大量的假設來降低問題的復雜性,這種適應性系統方法是非常困難的[5]。
北約信息系統技術組168(IST168)成立于2018年[6],研究一種基礎設施,允許對自適應信息處理和分配技術進行實驗。IST168下進行的研究重點是允許數據或應用程序在聯盟網絡內流動,從而促進該網絡內不同位置的自適應處理和信息創建。其目的是考慮到數據存儲、處理能力和平臺間通信連接的本地和當前可用性。簡單地說,IST168的口號是:"把數據移到代碼上;或者把代碼移到數據上;或者把兩者都移到別的地方?"
為了將IST168的工作建立在軍事背景下,該小組正在通過為陸地和海洋領域設計的軍事場景來探索這種架構的預期應用。這些場景旨在為這種適應性基礎設施的使用方式提供一個作戰背景、故事情節或敘事說明。這些場景在IST168的研究中被廣泛使用[7-10]。
IST168的陸地場景是基于北約先前創建的名為Anglova vignette No.3的場景[11]。這集中在一次城市行動中,涉及到士兵捕捉過往車輛的視頻片段,對該片段進行處理,然后由遠程總部制作成產品。對陸地場景感興趣的人可以參考[11]。
IST168的海上場景是本文件的重點。由于以前沒有滿足參與國需求的海上場景,因此努力開發一個場景,并說明北約構建的基礎設施將如何支持該場景。因此,根據參與的北約國家和眾多加拿大CRACCEN團隊成員所表達的需求,在此創建了一個海上情景。該場景的主題是反潛作戰(ASW)。
海上反潛作戰方案利用了IST168的優勢,也為IST168做出了貢獻。作為IST168努力的一部分,多個北約國家提供了云計算基礎設施,包括加拿大的云計算基礎設施。每個貢獻的云都在東道國的完全控制之下。這些國家基礎設施然后與其他國家部分共享,產生一個國家控制但國際共享的信息空間。在這個空間內,對信息的資源級理解得到了發展。
國際云基礎設施以及單一的國家基礎設施代表了大量的工作,但也是研究信息問題的高度靈活資源。一個單獨的國家云或一個國際云,可以被配置成代表戰斗空間中物理實體上存在的信息系統。例如,云基礎設施可以被重新配置為眾多的虛擬計算單元,這些單元代表了單個平臺,如一艘船、一架直升機、一架無人駕駛飛行器(UAV)、一個總部等。然后,這些虛擬平臺可以用來容納存在于真實物理平臺上的信息系統。在虛擬環境中使用仿真通信信道可以使虛擬平臺通過現實的通信信道連接起來。在這里,通信信道是使用可擴展移動特設網絡仿真器(EMANE)[12], [13]來模擬的。
從本質上講,可以構建一個虛擬實驗室來代表整個物理平臺連接中可用的計算、通信和信息資源。
指揮部偵察區協調和控制環境網絡(CRACCEN)活動[14]是由加拿大國防研究和發展部正在執行的一項研究活動。CRACCEN被設想為一個整體的社會技術系統,所有指揮小組的決策和反潛戰任務的相關信息都將被匯集起來,以發揮作戰和戰術優勢。
CRACCEN打算徹底改變加拿大水下戰爭[15]。CRACCEN的工作支持這一變革,其研究方向是解決一個全面的人類/信息系統,以滿足未來反潛作戰的需要。在這方面,CRACCEN有一個龐大而重要的反潛隊伍,該隊伍可以在地理上分散在海上平臺和岸上的組件中。
CRACCEN下調查的概念與IST168的活動部分地相互聯系。實際上,IST168正在開發的互連云基礎設施和模擬通信渠道與支持的反艦導彈海上場景相結合,提供了與CRACCEN相關的信息發現和共享環境。這種相關性包括展示云基礎設施在ASW環境中支持數字信息發現、共享和使用的能力。
在這方面,與IST168相關的發展可以被視為具有幾個與信息相關的特點,這些特點對CRACCEN是有用的,分別是(非廣泛的清單):
a. 可訪問性--信息環境的共享區域允許其他各方訪問共享區域內的信息資源。
b. 可調整性--信息環境中的隔離區域可以被創建,這些區域允許一個特定的國家在環境中獨立于其他國家行事。
c. 靈活性--它考慮到了信息環境中共享區域之間不同的通信連接和斷開。
d. 可發現性--共享信息環境中的信息資源可以被有機會進入該環境的國家發現。
e. 有效性--在信息環境中的一個共享區域向另一個共享區域轉移資源之前,有能力評估信息資源的潛在用途。
信息環境的上述特征是可以通過生成元數據來實現的,元數據具體描述了信息環境中可用的個別信息資源。這些元數據描述,作為一個完整的集合,允許單個信息系統對該系統內可用的信息資源形成一種 "態勢感知"。這種感知有效地建立了對當前情況下的元素(即數字資源)的感知,這是態勢感知(SA)的第一個構建模塊[16]。對這種類型的態勢感知的研究是DRDC海上信息電子化(MIX)活動的一部分[17]。
總之,MIX為理解和形成信息領域的態勢感知提供了研究基礎,然后將其應用于反艦導彈的場景。這種聯系為更好地理解如何利用信息領域進行軍事行動提供了一個現實的背景。
第2節介紹了一個海上反艦導彈的敘述或情景。該場景描述了在一個海峽中的一個精心設計的反艦作戰行動,涉及兩艘水面艦艇、一架無人機和一個岸上的站點。第3節描述了9個用例,展示了在反潛作戰中如何考慮信息資源、計算資源和通信渠道。第4節提供了一個結論。
先進作戰管理系統(ABMS)是美國空軍創建下一代指揮和控制(C2)系統的最新計劃項目。ABMS建議使用云環境和新的通信方法,使空軍和太空部隊系統能夠使用人工智能無縫共享數據,以實現更快的決策。空軍將ABMS描述為其創建物聯網的努力,這將使傳感器和C2系統相互分解(與空軍傳統上執行C2的方式相反)。該計劃是空軍對國防部全域聯合指揮與控制(JADC2)工作的貢獻,重點是使國防部的作戰決策過程現代化。
ABMS最初的設想是取代目前指揮空戰行動的E-3機載預警和控制系統(AWACS)(圖1),但后來有了更廣泛的范圍。前空軍負責采購的助理部長威爾-羅珀指示,該計劃應減少對指揮中心和飛機的關注,而是創造數字技術,如安全云環境,在多個武器系統之間共享數據。羅珀博士表示,2018年國防戰略所設想的有爭議的環境迫使空軍重組ABMS項目。2021年5月,空軍副參謀長大衛-奧爾文將軍在DefenseOne的一篇文章中說:"ABMS究竟是什么?它是軟件嗎?硬件?基礎設施?策略?答案是都是"。換句話說,空軍將ABMS設想為一個采購項目,它既要采購東西,又要實施其他非開發性的工作,該部門認為這些工作同樣重要:指揮和控制空軍的新技術。
自ABMS成立以來,國會已經對下一代C2系統的發展表示了興趣。空軍表示,ABMS是一個非傳統的采購項目。因此,國會對空軍替換老舊系統的方法和試驗新興技術的方法提出了質疑。
迄今為止,空軍已經進行了五次活動,以展示其希望最終投入使用的新C2能力。2019年12月,空軍在其第一次ABMS "on-ramp"(空軍用來表示演示的術語)中,展示了從陸軍雷達和海軍驅逐艦向F-22和F-35戰斗機傳輸數據的能力。這次活動還展示了空軍的統一數據庫(UDL),這是一個結合天基和地基傳感器追蹤衛星的云環境。
2020年9月,ABMS進行了第二次"on-ramp"。這第二次上線演示了通過使用超高速武器作為防御手段,探測和擊敗一個飛向美國的模擬巡航導彈。此外,ABMS還展示了 "探測和擊敗破壞美國太空行動的手段"的能力。根據空軍的新聞稿,"70個工業團隊和65個政府團隊 "參加了這次活動。
空軍在2020年9月下旬舉行了第三次"on-ramp",以支持珍珠港-希卡姆聯合基地的 "勇敢之盾 "演習。在這次活動中,空軍展示了使用KC-46加油機通過將數據從較老的第四代戰斗機轉發到較新的第五代飛機,如F-22,來執行戰術C2。2021年5月,空軍表示,為KC-46采購通信吊艙將是ABMS項目的第一個能力發布。空軍說:"在戰斗中,無論如何,郵機將需要在作戰附近飛行,支持戰斗機,因此將它們作為指揮和控制系統,無論是作為主要的還是彈性的備份,都是有意義的。"
2021年2月在歐洲舉行了第四次"on-ramp"。根據新聞稿,空軍由于預算限制而減少了這次活動規模。這第四次將包括荷蘭、波蘭和英國在內的盟國聯系起來,進行聯合空中作戰。據美國駐歐洲空軍司令哈里根將軍說,這第四次活動測試了美國和盟國用F-15E飛機發射AGM-158聯合空對地對峙導彈(JASSM)執行遠程打擊任務的能力(見圖2),同時利用美國和盟國的F-35飛機執行空軍基地防御任務。
本預計2021年春季進行第五次"on-ramp"在太平洋地區,但由于預算限制,取消了這次活動。
2019財年國防授權法案(NDAA)指示政府問責局(GAO)評估ABMS計劃。在2020年4月的一份報告中,GAO向空軍總設計師建議采取四項行動來提高項目績效。
1.制定一個計劃,在ABMS開發領域需要時獲得成熟技術。
2.制作一個定期更新的成本估算,反映ABMS的實際成本,每季度向國會匯報一次。
3.準備一份可購性分析,并定期更新。
4.正式確定并記錄參與ABMS的空軍辦公室的采購權力和決策責任。
空軍助理部長同意了所有的建議。前空軍參謀長David Goldfein將軍不同意這些建議,他指出GAO的分析沒有反映機密信息。美國政府問責局表示,它可以接觸到機密信息,這些額外的信息并不影響其分析和建議。
根據GAO關于ABMS的同一份報告,空軍最初確定由空軍總設計師(普雷斯頓-鄧拉普),來協調空軍每個項目執行辦公室的ABMS相關工作。GAO對這種管理結構可能導致ABMS缺乏決策權表示擔憂。然而,在2020年11月,羅珀博士選擇空軍快速能力辦公室作為ABMS項目執行辦公室。首席架構師辦公室繼續開發全軍的架構(即軟件和無線電如何能夠相互連接),以支持ABMS。
國會已經對ABMS系統的發展表示了興趣。下面的清單總結了國會在前三個NDAA中的行動:
2019財政年度NDAA(P.L. 115-232):
2020年國防部(P.L. 116-92):
FY2021 NDA (P.L. 116-283) :
2021財年國防撥款法案(P.L. 116-260 C分部)將ABMS的資金從要求的3.02億美元減少到1.585億美元,理由是 "不合理的增長和預先融資"。
在ABMS的整個發展過程中,國會對在確定合適的替代物之前退役舊的C2系統如JSTARS和AWACS表示關注。國會還指示空軍制定傳統的采購理由,如成本估算和需求文件,以確保國會和軍方都了解要采購的東西。這些行動反映了美國政府問責局的建議。
使用ABMS方法分解指揮和控制的風險是什么?
空軍應如何平衡創新、實驗與采購成熟技術?
ABMS提供了哪些傳統指揮與控制系統無法提供的機會?
利用6.8軟件和數字技術試點計劃預算活動代碼中的新預算授權靈活性,ABMS是否會受益?
在不確定性下進行的決策序列出現在各種環境中,包括交通、通信網絡、金融、國防等。為序列決策問題找到最優決策策略的經典方法是動態規劃;然而,由于維度詛咒和建模詛咒,它的用處有限,因此許多現實世界的應用需要另一種方法。在運籌學中,過去的 25 年中,使用近似動態規劃 (ADP)(在許多學科中被稱為強化學習)來解決這些類型的問題越來越受歡迎。通過這些努力,成功部署了 ADP 生成的卡車運輸行業駕駛員調度、機車規劃和管理以及制造中高價值備件管理的決策策略。在本文中,我們首次回顧了 ADP 在國防背景下的應用,特別關注那些為軍事或文職領導層提供決策支持的應用。本文的主要貢獻是雙重的。首先,我們回顧了 18 個決策支持應用程序,涵蓋了部隊發展、生成和使用的范圍,它們使用基于 ADP 的策略,并針對每個應用重點介紹了其 ADP 算法的設計、評估和取得的結果。其次,基于所確定的趨勢和差距,我們討論了與將 ADP 應用于國防決策支持問題相關的五個主題:所研究的問題類別;評估 ADP 生成策略的最佳實踐;與當前實施的策略相比,設計漸進式策略與徹底改進策略的優勢;情景變化時策略的穩健性,例如從高強度沖突到低強度沖突的轉變;以及尚未在國防中研究的,可能從 ADP 中受益的順序決策問題。
關鍵詞:序列決策問題、馬爾可夫決策過程、近似動態規劃、強化學習、軍事
許多決策不是孤立地做出的;觀察到以前不確定的新信息;鑒于這些新信息,將做出進一步的決策;更多新信息到來;等等。這些類型的決策被恰當地描述為順序決策問題、不確定性下的順序決策或多??階段決策問題,其特點是決策對未來獲得的回報或產生的成本、未來決策的可行性以及在某些情況下的外生時間對決策的影響[1],[2],[3]。本質上,“今天的決策影響明天,明天的決策影響下一天”[2, p.1],如果不考慮決策之間的關系,那么所取得的結果可能既沒有效率也沒有效果。
自20世紀50年代以來,人們就知道這種順序決策可以被建模為馬爾科夫決策過程(MDP),它由五個部分組成:一組候選行動;選擇行動后得到的獎勵;做出決策的歷時;狀態,即選擇行動、確定獎勵和告知系統如何演變所需的信息;以及定義系統如何從一個狀態過渡到下一個狀態的過渡概率[4]。給定一個MDP,目標是找到一個決策策略--"一個規則(或函數),根據現有的信息確定一個決策"[3,p.221],也被稱為應急規劃、規劃或戰略[2,p.22]--作出的決策使得系統在給定的標準下表現最佳。尋找最優決策策略的經典方法是通過動態規劃(DP)解決貝爾曼的最優方程[5]。在國防背景下,DP已被應用于確定各種連續決策問題的決策策略,包括艦隊維護和修理[6]、基本訓練安排[7]、研究和開發項目選擇[8]、軍事人員的去留決策[9]以及醫療后勤資產調度[10]。
盡管DP為解決順序決策問題提供了一個巧妙的框架,但它在許多現實世界的應用中的作用有限,這一點早已得到認可。這是由于維度的詛咒[5]--"隨著變量(或維度)數量的增加,問題的難度異常快速增長"[11]--以及建模的詛咒,即需要一個明確的模型來說明系統如何從一個狀態過渡到下一個狀態[12]。雖然今天的計算機可以解決有數百萬個狀態的順序決策問題[13],但許多問題仍然太大,無法通過經典的DP方法有效解決。此外,通常的情況是,狀態之間的過渡概率根本不知道。具有這些特征的順序決策問題貫穿于整個國防領域,跨越了軍力發展、生成和使用的范圍。比如說:
在軍力發展中,關于能力投資的決策可能多達數百項,通常在業務規劃周期內的固定時間進行,并且每年重復。決策者必須考慮所選擇的投資的短期和長期影響,以及未選擇的投資,同時考慮到未來軍事合同的不確定性,聯盟和對手能力的變化,國防特定通脹,等等。
在軍力組建中,決定招募多少名軍人和軍士,以滿足各種軍事職業的要求,同時尊重國家的授權力度,并考慮到各種不確定因素,包括每年的退休、晉升、自然減員等等;
在軍力雇傭范圍內,在大規模疏散行動中決策,如重大海難期間,將哪些人裝上直升機,同時考慮到包括天氣變化、個人健康、直升機故障等不確定因素。
由于這些挑戰,在這些類型的問題中,通常不可能找到一個最優的決策策略,需要采用其他的方法,重點是找到一個好的或接近最優的策略。第一個方法是由Bellman和Dreyfus[14]提出的,在接下來的幾十年里,包括運籌學、控制論和計算機科學在內的各個領域都發展了更多的方法,詳細的討論和相關的參考文獻列表見Powell[15]。此外,數學規劃領域,特別是隨機規劃,已經開發了復雜的算法來解決高維決策和狀態向量的問題,這在現實世界的順序決策問題中經常看到[16]。
在運籌學中,這些方法以各種名義被開發出來;尤其是神經動態規劃、自適應動態規劃和近似動態規劃(ADP)。如圖1所示,這些方法在過去的25年里越來越受歡迎,從1995年到2021年4月9日,共發表了2286篇文章,年發表率從一篇文章增長到每年近250篇。最近,ADP--"一種在模擬中做出智能決策的方法"[17,p.205],其中 "產生的策略不是最優的,所以研究的挑戰是表明我們可以獲得在不同情況下穩健的高質量決策策略"[18,p.3]--已經成為更常用的術語[3]。作者們最近也開始使用強化學習這個標簽,最近出版的《強化學習和最優控制》一書[19]和即將出版的《強化學習和隨機優化:隨機決策的統一框架》一書[20]就是證明。值得注意的是,ADP生成的決策策略已經成功部署到工業領域,包括卡車行業的司機調度策略[21],[22],[23], 機車規劃和管理[24],[25], 以及制造業內高價值備件的管理[26]。
圖1. 1995年至2021年4月9日期間每年發表的ADP相關文章的數量。
在這篇文章中,我們首次回顧了ADP在國防背景下的應用。特別是,我們專注于軍事運籌學領域的同行評議文獻;也就是 "應用定量分析技術為軍事[或民事]決策提供信息"[27]。本文的主要貢獻有兩個方面。首先,我們回顧了18個決策支持應用,這些應用跨越了部隊發展、生成和使用的范圍,使用了基于ADP的策略,并為每個應用強調了其ADP算法是如何設計、評估和取得的結果。其次,基于所發現的趨勢和差距,我們討論了與將ADP應用于國防決策支持問題有關的五個主題:所研究的問題類別;評估ADP生成策略的最佳做法;與目前實行的策略相比,設計策略是漸進式的,而不是完全徹底的;隨著情景的變化,策略的穩健性,如沖突中從高強度到低強度的轉變;我們還建議提出國防內部可能受益于ADP生成策略的其他順序決策問題。
本文的其余部分組織如下。第2節提供了相關的背景信息。第3節介紹了進行此次審查的方法。第4節和第5節是審查的主要內容。第4節回顧了18個已確定的ADP在國防領域的決策支持應用,第5節介紹了與在國防領域應用ADP相關的五個主題。最后,第6節給出了總結性意見。
在本節中,我們介紹了通過上述文獻搜索確定的18篇基于應用的文章的摘要。表2列出了每項研究,其應用領域,以及所實施的ADP策略和算法的特征。所列的特征主要集中在第2.3節中討論的那些特征,即:
決策策略的類型--短視CFA、PFA、VFA、DLA或混合。
價值函數近似策略--查詢表、參數化或非參數化。
價值函數模型--層次聚合、線性結構、NN等。
算法策略-狹義搜索、數學規劃、隨機規劃、AVI、API。
更新價值函數模型參數的方法--時差學習、LSTD、LSPE、SVR,等等;
步長--常數、廣義調和、多項式等。
對于所列出的一些文章,沒有提供足夠的信息來確定作者是如何處理某些特征的。在這種情況下,該特征被列為未說明。此外,有些文章中的某些特征并不適用。在這種情況下,該特征被列為不適用。下面給出了進一步的細節。研究報告分為三類--軍力發展、軍力組建、軍力使用,然后按時間順序排列。
表2. 1995-2021年期間ADP在軍事作戰研究中的應用。文章按橫線分為三組:部隊發展(上組)、軍力組建(中組)和軍力使用(下組)。
混合行動由多個行動領域的協調攻擊完成,包括網絡戰和信息戰。檢測混合型威脅的一個關鍵挑戰是如何識別個別事件是對手(精心策劃的)措施的結果,并將所謂不相關的事件聯系起來。由于物理和網絡及信息領域的行動可能發生在不同的時間、不同的地點、不同的速度,作為短期或長期的活動,并且可能是低強度的,因此連接這些點的任務變得更加困難。為了確定與具體任務規劃和執行相關的信息,混合威脅的風險評估必須始終在具體任務的背景下進行,包括其任務目標、行動區域和任務時間范圍。
在本文中,我們描述了兩種情況,在這兩種情況下,對手可能在物理以及網絡和信息空間中進行攻擊,以干擾行動。接下來,我們描述了一個演示器的高級架構,顯示了不同類型的傳感器和信息源是如何連接在一起的。為了應對混合威脅并充分發揮對分析員和決策者的支持潛力,有必要在不同的細節水平上實現態勢感知--從原始數據到高度聚合的風險評估--在不同的領域中共享信息,并在聚合水平上融合它們。
多域作戰(MDO)并不是一個新現象。在戰爭中,長期以來一直在多個領域開展行動。從陸、海、空行動開始,空間和網絡領域補充了對手的組合。為了對付這些,需要不同部門的深入合作。同樣,混合威脅這個詞也不是2020年的發明。一開始是混合戰爭,它與非對稱戰爭、非正規部隊和信息行動等概念混雜在一起。
在早期,重點是傳統的軍事沖突。戰場是傳統的地面,坦克、飛機和艦艇與人員一起是主要的行為者。通信是決定勝負的一個關鍵因素。數字化的開始提供了新的好處和選擇,但也給戰爭帶來了新的脆弱性。今天被稱為網絡和信息領域(CID)的使用在軍事能力方面是一個很大的推動。隨著社交媒體的出現,信息領域發生了巨大的變化,因為它使對手更容易影響公眾輿論和關鍵人物的意見。此外,隨著物聯網中相互連接的設備越來越多,網絡威脅的重要性也在增加。今天的關鍵基礎設施(用于能源、交通、衛生等)比過去更容易受到信息技術的威脅,它們是現代戰爭中的熱門目標。這為敵對勢力的攻擊打開了大門。他們的工具箱不再局限于經典的軍事資產。當然,新興的技術導致了反擊和反擊的措施,以及一場永恒的競爭。
在軍事和民用領域,對信息交流的使用和依賴日益增加,產生了新的攻擊載體,同時也產生了防御這些攻擊的新需求。在今天的沖突中,威脅影響到政治、軍事、經濟、社會、信息和基礎設施等領域。不同的威脅可能是由正規和非正規部隊造成的。這些可能是不利的國家,也可能是出于非政府考慮的團體。
一個關鍵的挑戰是如何在戰術層面上認識到個別事件是對手(精心策劃的)措施的結果,并將所謂不相關的事件聯系起來。在任務規劃或任務執行的風險評估中,這個問題的答案可能會導致對自己的措施無動于衷的決定,如使用通信渠道、部隊保護、路線規劃或反網絡行動。由于物理和網絡及信息領域的行動可能發生在不同的時間,以不同的速度,作為短期或長期的活動,并且可能是低強度的,因此連接這些點的任務變得更加困難。
本文旨在展示開源數據的潛力,結合大數據分析和數據可視化,以表明特定領域的彈性水平,其中包括北約彈性評估的基線要求(blr)。
本文中描述的概念驗證提取了特定領域的相關彈性指標,涵蓋了包括能源和交通在內的選定基線要求。概念驗證使用交互式儀表板,允許終端用戶從多個角度探索可用的公共數據,以及對這些數據進行高級分析和機器學習模型的結果。
關鍵詞:大數據分析,機器學習,彈性,能源,交通,媒體
軍隊越來越意識到大數據分析在作戰和戰略決策中的重要性和作用。在正確的時間獲得相關信息一直是做出最佳決策的關鍵因素。今天,這種影響甚至更大,因為數據和信息可以大規模收集并提供給每個人。技術和人工智能方法成為利用數據的巨大推動者[1]。
廣泛可用的開源數據來自媒體、科學文章、相關(專家)門戶網站,涵蓋經濟、政治、社會、能源、交通運輸等帶來了創造更有洞察力的背景的可能性,并通過分析各種來源和整合結果為任何評估提供了有價值的新維度。
從軍事角度來看,我們從開源數據中確定了許多跨不同領域的重要指標,這些指標可以用于評估整個聯盟的戰備和恢復能力。來自不同領域的許多指標似乎相互影響,可以相互關聯。
在去年,北約CI機構數據科學團隊參與了一項創新性的概念驗證,包括轉型和作戰命令,如ACT、SHAPE和JFCBS;為了識別、提取、計算和呈現開源數據中最相關的指標,以支持整個聯盟的彈性評估。由于彈性評估是一項復雜的評估,它依賴于許多不同領域和事件的關系,因此該項目定義了較小的范圍,重點關注以下關鍵領域:
?關鍵基礎設施——醫院、發電廠、港口、液化天然氣接收站和軍事設施
?能源——專注于電力和天然氣
?交通——專注于空運、公路、海運和接近實時的交通指標
?媒體——態勢感知
其主要目標是通過使用來自公開數據集的大數據來確定相關指標。然后創建有用的策劃數據和機器學習(ML)模型,以識別相關關系,并提供對當前情況和破壞性事件影響的見解。為了提高結果的準確性,我們最初關注于一個特定的地理區域。
如今,隨著技術飛速發展和威脅環境變得更加復雜,在信息爆炸的局面下,作戰人員面臨著具有挑戰性的決策空間。人工智能(AI)和機器學習(ML)可以減輕作戰人員負荷。人工智能系統具有深遠的好處——提高態勢感知能力,檢測威脅,理解對手的能力和意圖;確定和評估可能的戰術行動方針;并提供方法來預測行動決策的結果和影響。人工智能系統是理解和解決高度復雜的戰術情況的關鍵。
人工智能系統為作戰人員提供了優勢,但前提是這些系統被正確設計和實施,并且以減輕作戰人員的認知負荷的方式。為國防應用實施人工智能系統帶來了獨特的挑戰。本文確定了四個獨特的挑戰,并描述了它們如何影響戰術作戰人員、工程設計界和國防。本文通過國防采辦和系統工程計劃,為解決這些獨特的挑戰提供了解決方案。
Bonnie Johnson——在海軍工程研發方面擁有超過 25 年的領導和系統工程經驗。她曾是 SAIC 和諾斯羅普·格魯曼公司的高級系統工程師,研究用于海戰系統和導彈防御能力的自動決策輔助。她于 2011 年加入美國海軍研究生院 (NPS) 系統工程系。她擁有 NPS 系統工程博士學位、約翰霍普金斯大學系統工程碩士學位和弗吉尼亞理工大學物理學學士學位。
人工智能是一個包含許多不同方法的領域,其目標是創造具有智能的機器(Mitchell,2019)。圖 1 顯示了一個簡單的維恩圖,其中機器學習 (ML) 作為 AI 的子集,而 AI 作為更廣泛的自動化類別的子集。自動化系統以最少的人工輸入運行,并且經常根據命令和規則執行重復性任務。人工智能系統執行模仿人類智能的功能。他們將從過去的經驗中學到的知識與收到的新信息結合起來,以做出決策并得出結論。
圖 1. 自動化、人工智能和機器學習的維恩圖
如圖 2 所示,有兩種主要類型的 AI 系統。第一種類型是明確編程的,也稱為手工知識系統。 Allen (2020) 將手工知識系統描述為“使用傳統的、基于規則的軟件,將人類專家的主題知識編碼為一長串編程的‘如果給定 x 輸入,則提供 y 輸出’規則的人工智能”(第3頁)。這些系統使用傳統的或普通的編程語言。第二種類型是從大量數據集訓練而來的機器學習系統。 ML 系統從訓練過的數據集中“學習”,然后在操作上使用“訓練過的”系統在給定新的操作數據的情況下產生預測結果。
圖 2. 兩種類型的人工智能:顯式編程和學習系統
自動化、人工智能和機器學習系統,包括手工知識系統和學習系統,為美國國防部 (DoD) 提供了巨大的潛力,在大多數任務領域具有多種應用。這些智能系統可以擴展國防部理解復雜和不確定情況、制定和權衡選項、預測行動成功和評估后果的能力。它們提供了在戰略、規劃和戰術領域支持國防部的潛力。人工智能系統可以減輕作戰人員的負擔,但前提是這些系統的設計和實施正確,并且以減輕作戰人員認知負擔的方式。這為國防應用實施人工智能系統提出了獨特的挑戰。本文確定了四個獨特的挑戰,并描述了它們如何影響戰術作戰人員、工程設計界和國防。
第一個為國防應用實施人工智能系統的獨特挑戰是戰術戰爭呈現高度復雜的情況。戰術復雜性可能涉及信息超載、需要處理的多個并發任務、具有可怕后果的時間關鍵決策、態勢感知的未知/不準確/不完整,以及因各種分布式戰爭能力所需的互操作性而產生的工程挑戰。將人工智能系統添加到這個已經很復雜的環境中是一項必要但極具挑戰性的工作。
第二個獨特的挑戰是人工智能系統需要大量數據來訓練。所開發的人工智能系統的質量很大程度上取決于訓練數據集的質量和數量。軍事領域的數據尤其難以獲得。軍事數據可能涉及分類問題、網絡漏洞、數據驗證挑戰,并且根據艦隊演習和兵棋推演的需要,收集起來可能非常昂貴且耗時。
第三個獨特的挑戰是人工智能系統為系統工程提出了一個新的前沿。在傳統系統中,行為是固定的,因此是可預測的:給定輸入和條件,系統將產生可預測的輸出。一些人工智能解決方案可能涉及本身就很復雜的系統——適應和學習——因此會產生無法預料的輸出和行為。事實上,一些人工智能系統的目的就是為了做到這一點——與人類決策者合作,承擔一些認知負荷并產生智能建議。需要系統工程方法來設計智能系統,并確保它們對人類操作員來說是可解釋的、可信賴的和安全的。
第四個獨特的挑戰是,對于國防應用,總是需要考慮潛在的對手。在人工智能系統方面,采購界必須注意同行競爭對手國家,他們在人工智能進步方面取得了自己的進步。美國國防系統也必須在這場人工智能競賽中取得進步。網絡攻擊在防御系統中總是有可能發生的。隨著防御能力增加對自動化和人工智能系統的依賴,這可能會造成更多的網絡漏洞。最后,技術正在迅速發展,對抗性威脅空間正在發生變化。國防采購和系統工程界必須確保人工智能系統不斷發展和適應,以應對威脅環境的變化,并以可信賴和安全的方式做到這一點。
第一個獨特的挑戰是許多防御領域呈現出復雜的決策空間。因此,設計和實施適當的人工智能系統來解決這種復雜性將是極具挑戰性的。圖 3 突出顯示了導致戰術領域決策復雜性的許多因素。例如,海軍打擊部隊的行動可以迅速從和平狀態轉變為一種巨大的危險——需要對威脅保持警惕并采取適當的反應行動——所有這些都在高度壓縮的決策時間線上。戰術威脅可能來自水下、水面、空中、陸地、太空,甚至是虛擬的,因此需要處理多個時間緊迫的任務。在船舶、潛艇、飛機、陸地和太空中擁有海軍和國防資產;戰術決策空間必須解決這些分散和多樣化資源的最佳協作使用問題。制定有效的戰術行動方案也必須發生在高度動態的作戰環境中,只有部分和不確定的態勢知識。決策空間還必須考慮指揮權、交戰規則和戰術條令施加的限制。人類作為戰術決策者的角色增加了決策空間的復雜性——面臨信息過載、操作員錯誤、人工智能信任以及人工智能模糊性和可解釋性問題等挑戰。最后,戰術決策及其可能后果的風險可能非常高。
圖 3. 導致戰術決策空間復雜性的因素
解決高度復雜的決策空間是美國國防部面臨的挑戰。人工智能提供了解決這種復雜性的潛在解決方案——通過處理大量數據、處理不確定性、理解復雜情況、開發和評估決策替代方案以及了解風險水平和決策后果。人工智能解決方案可以應用于國防部的戰略、規劃和戰術層面。海軍研究生院 (NPS) 開發了一種工程框架和理論,用于解決高度復雜的問題空間,這些問題空間需要使用智能和分布式 AI 系統來獲得態勢感知并做出適應動態情況的協作行動決策(Johnson, 2019)。模擬了一個復雜的戰術場景,以演示使用 AI 來驗證該方法(Johnson,2020a)。 NPS 已經開發了一種預測分析能力的概念設計,該設計將被實施為一個自動化的實時戰爭游戲系統,該系統探索不同的可能戰術行動方案及其預測效果和紅軍反應(Johnson,2020b)。 NPS 研究已經確定了在戰術行動中描述復雜性水平的必要性,并實施自適應人機協作安排以做出戰術決策,其中自動化水平根據情境復雜性水平進行調整。正在進行的 NPS 研究正在研究這些概念工程方法在各種防御用例應用中的應用,包括防空和導彈防御、超視距打擊、船舶自衛、無人機操作和激光武器系統。
復雜的決策空間為 AI 系統嘗試和解決創造了具有挑戰性的問題。表 1 根據決策空間的復雜性比較了不同的 AI 應用領域。該表包含 10 個表征決策空間復雜性的因素:認知不確定性(對情境知識的不確定性數量)、情境動態、決策時間線(做出決策的時間量)、決策的復雜性決策過程中的人機交互、資源復雜性(數量、類型、它們之間的距離以及它們的動態程度)、是否涉及多個任務、對手(競爭對手、黑客或打算摧毀的徹底敵人)的存在,允許誤差的幅度(多少決策錯誤是可以接受的),以及決策后果的嚴重性。
表 1. 不同 AI 應用的決策復雜度比較
人工智能應用程序涉及的決策空間用于廣告(根據特定用戶的購買習慣或互聯網搜索確定將哪些廣告流式傳輸)、貸款批準(根據貸款金額和信用評分確定貸款資格)和醫療(根據診斷確定關于患者癥狀)相對簡單。存在大量訓練數據,決策過程中的計算和人為交互簡單,情況相對穩定。不良廣告的后果是微乎其微的。可以審計不良貸款批準決定。糟糕的醫學診斷可能會產生更嚴重的后果,但通常有足夠的時間在治療前尋求更多的評估和意見。為自動駕駛汽車確定最佳運輸路線和工程 AI 系統是更復雜的工作。這些應用程序是動態變化的,需要更短的時間來做出決策。運輸路線在可能路線的數量上會很復雜——這可能會導致許多可能的選擇。但是,存在運輸錯誤的空間,并且后果通常不會太嚴重。對于自動駕駛汽車來說,決策錯誤的余地非常小。此應用程序中的錯誤決定可能導致嚴重事故。
然而,軍事戰術領域在決策空間的所有領域都呈現出極端的復雜性:不確定性和有限的知識/意識、高度動態的情況、非常有限的時間線、復雜的人機交互、大量和類型的資源、多個任務、昂貴和困難- 獲取訓練數據集、極小的允許誤差范圍以及行動(或不行動)的生死攸關的后果。
第二個獨特的挑戰是 AI/ML 系統需要大量相關且高質量的數據用于訓練和開發,而這些數據在軍事領域可能很難獲得。明確編程的手工知識系統在開發過程中需要數據進行評估和驗證。 ML 系統在開發過程中對數據的依賴性更大。如圖 4 所示,ML 系統從代表操作條件和事件的數據集中“學習”。 ML系統學習的過程也稱為被訓練,開發階段使用的數據稱為訓練數據集。有幾種類型的 ML 學習或訓練——它們是有監督的、無監督的和強化的。所有三種類型的 ML 學習都需要訓練數據集。 ML 系統在部署后或運營階段繼續需要數據。圖 4 顯示,在運營期間,ML 系統或“模型”接收運營實時數據,并通過使用其“訓練過的”算法處理運營數據來確定預測或決策結果。因此,在整個系統工程和采集生命周期中,ML 系統與數據密切相關。 ML 系統從訓練數據集的學習過程中“出現”。機器學習系統是數據質量、充分性和代表性的產物。他們完全依賴于他們的訓練數據集。
圖 4. 開發和實施機器學習系統
隨著許多領域(戰爭、供應鏈、安全、物流等)的更多 AI 開發人員正在了解 AI 解決方案的潛在優勢并開始著手 AI 系統開發,DoD 開始認識到對這些數據集的需求。在某些情況下,數據存在并準備好支持 AI 系統開發。在其他情況下,數據存在但不保存和存儲。最后,在其他情況下,數據不存在,需要模擬或在艦隊演習或戰爭游戲中收集。圖 5 說明了收集、獲取和在某些情況下開發用于開發和訓練 AI 和 ML 系統的數據時需要考慮的過程。
圖 5. 人工智能和機器學習系統訓練數據集的開發
軍事領域對開發訓練數據集提出了一些獨特的挑戰——數據可能被分類,數據可能存在網絡漏洞(它可能被攻擊并被對手故意破壞),如果數據不存在,它可能需要從軍事/艦隊演習或兵棋推演中獲得。數據驗證也是一項具有挑戰性的工作。
NPS 正在為海軍的數據管理系統執行需求分析和概念設計,該系統將收集數據并向海軍內部許多正在開發 AI/ML 系統的不同組織提供數據(French 等人,2021 年)。圖 6 是海軍中央人工智能庫 (CAIL) 的上下文圖,它被設想為一個數據管理系統和流程,用于識別數據集并提供索引、驗證、審計和對 AI 可以使用的數據的安全訪問。從事海軍應用的機器學習開發人員。 CAIL 將不是一個數據存儲庫或數據庫,而是一個中央組織,使 AI/ML 開發人員能夠訪問經過驗證和保護的海軍數據——以幫助識別數據集的存在,啟用授權訪問,并幫助支持開發人員所需的數據尚不存在,需要獲得——可能通過艦隊演習或兵棋推演。
圖 6. 概念性中央人工智能庫
第三個獨特的挑戰是開發人工智能系統為系統工程提出了一個新的前沿。系統工程方法已被開發用于設計可能非常復雜但也具有確定性的傳統系統(Calvano & John,2004)。傳統系統具有可預測的行為:對于給定的輸入和條件,它們將產生可預測的輸出。圖 7 說明了對傳統 SE 方法(如 SE Vee 過程)進行更改的必要性,以便設計復雜且不確定的 AI 系統。特別是,需要新的方法來定義隨時間適應的學習系統的要求,并且系統驗證過程可能需要在操作過程中不斷發展和繼續,以確保安全和期望的行為。對于具有高風險后果的軍事系統,幾乎沒有出錯的余地,因此需要實施一個可以確保 AI 系統安全和預期操作的系統工程流程。
圖7. 人工智能:系統工程的新前沿
國際系統工程師理事會 (INCOSE) 最近的一項倡議已經開始探索需要對系統工程方法進行哪些改變才能有效地開發人工智能系統。圖 8 是作為該計劃的一部分創建的,旨在強調在 SE 過程中需要考慮的 AI 系統的五個方面。除了不確定性和不斷發展的行為之外,人工智能系統可能會出現新類型的故障模式,這些故障模式可能會突然發生,并且可能難以辨別其根本原因。穩健的設計——或確保人工智能系統能夠處理和適應未來的場景——是另一個系統工程設計考慮因素。最后,對于涉及更多人機交互的 AI 系統,必須特別注意設計系統,使其值得信賴、可解釋并最終對人類決策者有用。
圖 8. 人工智能系統工程中的挑戰
NPS 正在研究可以支持復雜、自適應和智能 AI 系統的設計和開發的系統工程方法。已經開發了一個系統工程框架和方法來設計系統解決方案的復雜自適應系統(Johnson,2019)。該方法支持系統系統的開發,通過使用人工智能,可以協作以產生所需的緊急行為。當前的一個研究項目正在研究可以在設計過程中設計到 AI 系統中的安全措施,以確保操作期間的安全(Cruz 等人,2021 年)。 NPS 正在研究一種稱為元認知的設計解決方案,作為 AI 系統識別內部錯誤的一種方法(Johnson,2021 年)。當前的另一個 NPS 論文項目正在研究如何將“信任”設計到 AI 系統中,以確保有效的人機協作安排(Hui,2021)。幾個 NPS 項目研究使用稱為協同設計的 SE 設計方法,來確定人類操作員與 AI 系統之間的相互依賴關系(Blickley 等人,2021;Sanchez,2021)。
第四個獨特的挑戰是對手在防御應用中的存在和作用。國防部必須與對手競爭以提升人工智能能力,人工智能系統必須免受網絡攻擊,人工智能系統必須適應不斷變化的威脅環境演變。圖 9 突出顯示了對手的存在給國防部正在開發的 AI 系統帶來的一系列獨特挑戰。
圖9. 敵手的挑戰
競爭對手國家之間開發人工智能能力的競賽最終是為了進入對手的決策周期,以比對手更快的速度做出決定和采取行動(Rosenberg,2010 年)。人工智能系統提供了提高決策質量和速度的潛力,因此對于獲得決策優勢至關重要。隨著國防部探索人工智能解決方案,同行競爭對手國家也在做同樣的事情。最終,實現將 AI 用于 DoD 的目標不僅僅取決于 AI 研究。它需要適當的數據收集和管理、有效的系統工程和采集方法,以及仔細考慮人類與人工智能系統的交互。國防部必須確保它能夠應對實施人工智能系統所涉及的所有挑戰,才能贏得比賽。NPS 研究計劃正在研究如何應用 AI 和博弈論來進入對手的戰術決策周期(Johnson,2020b)。該項目正在開發一個概念,用于創建戰術態勢模型、對手的位置和能力,以及預測對手對形勢的了解。然后,概念系統將進行實時“兵棋推演”,根據預測的對抗反應和二階和三階效應分析戰術決策選項。這是一個研究未來戰術戰爭可能是什么樣子的一個例子,它為藍軍和紅軍提供了增強的知識和決策輔助。為 AI 競賽準備國防部的其他 NPS 舉措包括研究新的 SE 方法和獲取實踐以開發 AI 能力、研究海軍和國防部的數據管理需求(French 等人,2021 年)以及研究 AI 系統安全風險開發確保安全 AI 能力的工程實踐(Cruz 等人,2021 年;Johnson,2021 年)。
賽博戰是國防部必須成功參與的另一場競賽,以保持領先于黑客攻擊的持續攻擊。隨著國防部實施更多的自動化,它自然會導致更多的網絡漏洞。使用本質上依賴于訓練數據和操作數據的人工智能系統,為黑客在開發階段和操作階段用損壞的數據毒害系統提供了機會。如果對手控制了一個可操作的人工智能系統,他們可能造成的傷害將取決于應用程序領域。對于支持武器控制決策的自動化,后果可能是致命的。在最近一項關于汽車網絡安全的研究中,一家汽車公司在網上發布了一個假汽車電子控制單元,在不到 3 天的時間里,進行了 25,000 次違規嘗試(Taub,2021 年)。國防部必須注意人工智能系統開發過程中出現的特定網絡漏洞。必須為每個新的人工智能系統實施仔細的網絡風險分析和網絡防御策略。 NPS 正在研究數據安全要求,以確保 ML 訓練數據集不受黑客攻擊,并且需要安全授權才能訪問(French 等人,2021 年)。 NPS 正在研究使用元認知作為 AI 系統執行自我評估的一種方法,以識別網絡入侵、篡改或任何異常行為(Johnson,2020b)。 NPS 還在研究使用 ML 來識別惡意欺騙和篡改全球定位系統 (GPS; Kennedy, 2020)。
威脅環境的演變是國防部在開發人工智能系統時的第三次對抗性競賽。由于對抗性威脅空間隨著時間的推移而不斷變化,擁有更快、更致命的武器、更多的自主權、更大的監視資產、更先進的對抗措施和更多的隱身性,這對國防部能夠預測和識別新威脅并進行應對提出了挑戰戰場上的未知數。 NPS 研究的重點是在作戰過程中不斷適應和學習的工程系統,以檢測和識別戰場中的未知未知,并通過創新的行動方案快速響應新威脅(Grooms,2019;Jones 等人,2020;Wood,2019 )。 NPS 正在研究通過研究特定區域隨時間變化的數據來識別異常變化的機器學習方法(Zhao et al., 2016)。一個例子是研究商用飛機飛行模式并根據異常飛行模式識別可疑飛機。隨著時間的推移,可以監視地面行動,以識別可能意味著軍事行動的新的和不尋常的建設項目。
人工智能系統為國防部在實現和保持知識和決策優勢方面提供了重大進展。然而,為國防應用實施人工智能系統提出了獨特的挑戰。軍事戰術領域在決策空間的所有領域都呈現出極端的復雜性:不確定性和有限的知識、高度動態的情況、非常有限的時間線、復雜的人機交互、大量和類型的資源、多個任務、昂貴且難以獲得訓練數據集、極小的允許誤差范圍以及行動(或不行動)的生死攸關的后果。 AI 系統,尤其是 ML 系統,需要有代表性、足夠、安全和經過驗證的數據集來進行開發。為國防應用收集合適的數據具有處理分類數據集和確保數據安全和免受網絡攻擊的額外挑戰;這也將是收集代表戰術行動的真實數據的一項重大努力。將需要新的系統工程方法來有效地指定、設計和評估人工智能系統,這些系統通過其不確定性、新型人機協作挑戰以及難以預測和預防的新安全故障模式而呈現出新的復雜性.最后,軍事領域中對手的存在呈現出三種形式的 AI 競賽:與對手一樣快地開發 AI 系統的競賽、保持領先于可能的網絡攻擊的競賽以及訓練能夠應對的 AI/ML 系統的競賽隨著不斷發展的對抗性威脅空間。
NPS 正在通過一系列正在進行的研究計劃來解決四個獨特的挑戰領域。 NPS 研究人員正在研究人工智能系統在海軍戰術作戰領域的實施,對軍事數據集進行需求分析和需求開發,研究開發復雜人工智能系統的系統工程方法,以及開發安全、可信賴的人工智能系統工程方法,并注意潛在對手的作用。 NPS 正在為軍官和平民學生提供人工智能研究和教育機會。 NPS 歡迎與國防部和海軍組織合作,繼續研究用于國防應用的人工智能系統,并繼續探索解決方案戰略和方法,以克服開發和實施人工智能能力的挑戰。
建模和仿真有助于德國武裝部隊后勤的數字化,必須提供靈活性和穩健性等因素,以識別后勤鏈中的風險和弱點。 ESG,作為一家擁有多年軍事經驗的德國軍事技術公司,我們展示了成功的仿真和分析項目(例如,“以歐洲戰斗機為例,預測德國空軍的作戰能力”或“基于仿真的醫療救援鏈分析”),并提出進一步的行動方向,例如基于仿真的分析,以優化軍事供應鏈中的加法生產或自主系統的最佳概念。通過對軍事供應鏈使用后勤仿真,可以檢查和優化其穩健性和可持續性。這種基于數據的決策支持方法(工具 AnyLogic,德國聯邦國防軍基于仿真的分析指南和模型檔案)。它聚焦于一個關鍵問題,例如“在某些參數/因素/影響下,系統的材料運行準備情況如何更高概率的為在未來發展,以及什么可以提高系統的性能?”如本講座所述那樣提供各種優勢。
圖2-1 模型開發流程
圖2-2 系統結構
Wargaming in Professional Military Education: Challenges and Solutions
職業軍事教育中的兵棋推演:挑戰與解決方案
美國海軍陸戰隊埃里克·沃爾特斯(Eric M. Walters)上校(退役)
鑒于強調在專業軍事教育中使用兵棋推演,學校、作戰部隊和支持機構的教官——尤其是那些本身沒有經驗的兵棋推演者——如何去做呢?本文解釋了在經驗豐富專家的幫助下,為選定、修改或內部設計的嚴格兵棋式推演制定理想的學習成果的必要性。總結了最近的相關學術成果,它提供了促進協作對話的基本術語和概念,并就這種動態和沉浸式教學方法的常見但可避免的陷阱提供了建議。
對于那些認為兵棋推演不僅僅是一種娛樂消遣的人來說,商業兵棋推演曾經是——而且可以說仍然是——一種小眾愛好。在 20 世紀和 21 世紀初的歷史中,只有相對較小比例的軍人和學者經常進行所謂的嚴格式兵棋推演。過去,這一想法受到制度性的抵制,在職業軍事教育(PME)中使用一些人認為是兒童游戲的東西;雖然最近這種恥辱感有所減輕,但對于外行來說,兵棋推演的學習障礙仍然很高。兵棋推演可能很難學習,甚至更難戰勝有能力的對手。然而,我們已經到了 2021 年,軍事兵棋推演似乎正在 PME 學校、作戰部隊甚至支持機構中復活。海軍陸戰隊司令大衛 H. 伯杰將軍在他的指揮官規劃指南中,強調了在 PME 中練習軍事決策的必要性,這是教育兵棋推演的主要目的。但一個事實仍然存在。對于那些有興趣使用和設計兵棋推演來教授軍事判斷力的人來說,這種教學方法似乎很難有效實施。學術界的成功案例涉及作戰部隊中已經是兵棋推演者的教授、教官和海軍陸戰隊領導人。不是兵棋推演者但教軍事決策的人如何弄清楚要使用什么兵棋推演?如何使用它?各種可用游戲的優點和局限性是什么?整合兵棋推演和課程有哪些挑戰,如何克服這些挑戰?本文旨在幫助那些不熟悉兵棋推演的人定位,并就在教授決策中的軍事判斷時使用它們的經過驗證的最佳實踐提供建議。
1 教育者如何使用游戲來教學生?
1.1 了解戰術、作戰和戰略中力量、空間和時間之間的關系
?1.2 在兵棋推演中模擬現實“決策環境”以解決決策困境
?1.3 在兵棋推演環境中體驗摩擦、不確定性、流動性、無序和復雜性的交互動力學
1.4 鍛煉創造性和批判性思維:準備、參與和分析兵棋推演活動
2 哪種類型的兵棋推演最適合學習目標?
?2.1 角色扮演游戲 (RPG)
? ?2.2 研討會矩陣游戲
2.3 系統游戲
?2.4 紙牌游戲
3 哪種情況最適合使用——歷史情景還是假設情景?
4 兵棋推演教學——挑戰與解決方案
?4.1 克服設計偏見
?4.2 時間和復雜性的挑戰
?4.3 對教師要求的考慮
?4.4 兵棋推演支持單位教育和凝聚力
今天介紹的是美國蘭德公司、耶魯大學聯合發表于The Journal of Defense Modeling and Simulation: Applications, Methodology, Technology(國防建模與仿真學報:應用、方法、技術)期刊的論文“Artificial intelligence for wargaming and modeling”。
摘要:
在本文中,討論了如何將人工智能 (AI) 用于與擁有大規模殺傷性武器和其他涉及太空、網絡空間和遠程精確度的高端能力的國家發生沖突的政治軍事建模、模擬和兵棋推演武器。人工智能應該幫助兵棋推演的參與者和模擬中的代理人了解在不確定性和錯誤印象下作戰的對手的可能觀點、看法和計算。人工智能的內容應該認識到升級的風險,導致沒有贏家的災難,但也有可能產生有意義的贏家和輸家的結果。我們討論了對設計和發展的影響使用多種類型的 AI 功能的模型、模擬和兵棋推演。我們還討論了使用模擬、歷史和早期兵棋推演的理論和探索性工作為兵棋推演決策輔助工具,無論有無人工智能。
關鍵詞:
人工智能,兵棋推演,建模與仿真,認知建模,決策,深度不確定性下的決策,海量場景生成,探索性分析與建模