亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

美國海軍部長以審慎的方式分布海軍兵力,以支持美國防部(DoD)的指導、政策和預算。目前的戰略、部署和分布(SLD)過程是勞動密集型的,時間密集型的,而且在考慮競爭性的替代計劃方面的敏捷性較差。SLD可以從人工智能的實施中受益。本文引入了一種相對較新的方法來解決這些問題,該方法最近來自于海軍研究辦公室資助的一個早期項目,該項目結合了機器學習、優化和兵棋推演的深度分析。這種方法被稱為LAILOW,它包含了利用人工智能學習、優化和兵棋推演(LAILOW)。在本文中,我們開發了一套獨立的偽數據,模仿了實際的、分類的數據,這樣就可以安全地進行實驗性游覽。我們展示了LAILOW為每一艘可能被移動的可用船只產生了一個類似于兵棋推演場景的分數。每艘船的分值都會增加,因為需要較少的資源(如較低的成本)來滿足SLD計劃的要求,將該船轉移到一個新的母港。這就產生了一個數學模型,能夠立即比較可能被選擇的競爭性或替代性船舶移動方案。我們設想一個更加綜合、一致和大規模的深度分析工作,利用與現有真實數據源相聯系的方法,更容易地對通過SLD過程考慮的平臺移動的潛在方案進行直接比較。由此產生的產品可以促進決策者學習、記錄和跟蹤每個SLD過程中復雜決策的原因,并確定部隊發展和部隊組建的潛在改進和效率。

圖1. 在共同進化兵棋推演模擬中查看LAILOW;ML算法(即SoarRL)被用來模擬雙方的玩家或效用函數。

方法

本文詳細介紹了與研究問題和規定階段有關的方法。我們應用一個數學模型(即Leverage AI to Learn, Optimize, and Wargame[LAILOW]模型)來解決研究的深度分析問題。LAILOW源于ONR資助的一個項目,該項目專注于機器學習、優化和兵棋推演的深度分析,本質上是Leveraging AI,由以下步驟組成:

學習: D數據、數據挖掘、機器學習和預測算法被用來從歷史數據中學習關于什么和如何做出決定的模式。來自競爭需求的數據是指來自艦隊指揮官、國家領導人的游覽建議和要求,以及在不同安裝地點的各個功能區所做的評估數據。目前的人工程序主要是平衡單位搬家費用的預算和已知的需求。搬家費用是根據人力和基礎設施準備情況的永久換站(PCS)訂單制定的。這些數據以結構化數據庫和非結構化數據的形式存在,如PowerPoint幻燈片和.pdf文件。

優化: 來自學習的模式被表示為Soar強化學習(SoarRL)規則或AGI轉化器模型,用于優化未來的SLD計劃。一個SLD計劃包括每個設施、母港、基地、樞紐和岸上態勢位置(Fd)和人員(Fg)的海軍資產的完整增益或損失。考慮到眾多的組合,這種優化可能是令人難以承受的。相反,LAILOW使用集成的Soar-RL和協同進化算法,將總的SLD計劃映射到遠航建議、評估報告和其他假設分析中提到的各個單位。

兵棋推演:可能沒有或很少有關于新的作戰要求和能力的數據。這就促使了兵棋推演的模擬。一個SLD計劃可以包括狀態變量或問題(例如,未來的全球和戰區態勢、威脅特征),這些問題只能被觀察、感知,并且不能被改變。控制變量是解決方案(例如,一個SLD計劃)。LAILOW在狀態和控制變量之間設置了一個兵棋推演。問題和解決方案根據選擇、變異和交叉的進化原則共同演化。

如圖1所示,LAILOW框架可以被設定為一個由自我玩家和對手進行的多段兵棋推演。自我游戲者或防御者是SLD企業。對手或攻擊者是包括競爭性需求的環境。在應用LAILOW時,我們首先將過程分為狀態變量和決策變量,如下所示:

狀態變量: 這些變量和數據可以被感知、觀察和估計,但是,不能由自我角色決定或改變。它們是輸入變量,或自我游戲者必須考慮的問題。它們也被稱為SLD企業的測試或攻擊。

決策變量: 這些變量是使用優化算法來解決問題所需要的。在LAILOW中,決策變量的優化是通過整合Soar-RL和協同進化搜索和優化算法來實現的(Back, 1996; O'Reilly等人, 2020)。

對手(測試)和自己的玩家(解決方案)都像兵棋推演中一樣演化和競爭。LAILOW就像一個蒙特卡洛模擬,但由ML/AI學習的模式與優化算法指導。在兵棋推演中,對手產生大規模的假設測試,以挑戰自我玩家提出更好的解決方案,例如,SLD配置,以回答諸如 "如果我選擇一個不同的決定會發生什么?"的系統模擬問題。

每個 "學習、優化、兵棋推演"周期在每個階段和所有價值領域動態地迭代,其分析組件和算法詳見下文。

在LAILOW框架中,"學習 "部分通常采用有監督的ML算法,如分類、回歸和預測算法。例如,人們可以應用scikit-learn python中的各種最先進的監督ML算法,如邏輯回歸、決策樹、天真貝葉斯、隨機森林、k-近鄰和神經網絡。深度學習或AGI Transformers也可以放在這個類別中,輸入數據是多樣化的。一個AGI框架通常包含大規模的機器學習模型(例如,ChatGPT模型中的數十億個參數;OpenAI,2023),以從多模態數據中學習和識別模式。

監督的ML算法可用于學習潛在的SLD和偏離計劃的功能區的狀態變量和評估措施,如部署和執行的速度、質量和適用性,競爭性需求和約束的平衡(例如,避免不可接受的能力下降),以及Fd和Fg措施。

在LAILOW中,我們使用Soar-RL來分別學習自玩家和對手的兩個健身函數。在強化學習中,代理人根據其當前狀態和它從內部模型中估計的期望值,采取一個行動并產生一個新的狀態(Sutton & Barto, 2014)。它還通過修改其內部模型從環境的獎勵數據中學習。Soar-RL可以將基于規則的人工智能系統與許多其他能力,包括短期和長期記憶,進行可擴展的整合(Laird,2012)。Soar-RL在軍事應用中具有以下優勢,因為它

  • 可以包括現有的知識(例如,SLD的交戰規則),也可以從數據中修改和發現新規則
  • 以在線、實時、漸進的方式學習,因此不需要批量處理(潛在的大)數據
  • 提供可解釋的人工智能的優勢,因為發現的模式被表示為規則
  • 與因果學習相聯系,因為它符合因果學習的支柱(例如,關聯、干預和反事實;Pearl & Mackenzie,2018),通過使用干預產生預期效果數據(Wager & Athey,2018)。

"學習 "組件也可以應用無監督的學習算法。自玩家執行無監督的機器學習算法,如k-means、原理成分分析(PCA)和詞匯鏈接分析(LLA; Zhao & Stevens, 2020; Zhao et al., 2016)來發現鏈接。

一個SLD過程需要進行what-if分析,因為這促使了兵棋推演的模擬。一個SLD計劃可以包括狀態變量或問題(例如,未來的全球和戰區態勢、威脅特征、處理這些威脅的艦隊需求),這些問題只能被觀察、感知,不能被改變。控制變量是解決方案(例如,一個SLD計劃)。LAILOW在狀態和控制變量之間設置了一個兵棋推演。問題和解決方案根據選擇、變異和交叉的進化原則共同演化。

SLD計劃和偏移模型的狀態和決策變量的數量可能非常大。協同進化算法可以模擬未來作戰要求、威脅和全球環境及未來能力的動態配置,以及兵棋推演模擬中的其他競爭因素。如圖1所示,競爭性協同進化算法用于解決生成對抗網絡(GANs;Goodfellow等人,2014;Arora等人,2017)所遇到的minmax-問題。玩家的對抗性交戰可以通過計算建模來實現。競爭性協同進化算法采取基于種群的方法來迭代對抗性交戰,可以探索不同的行為空間。用例測試(對抗性攻擊者群體)是主動或被動地阻撓問題解決方案(防御者)的有效性。協同進化算法被用來識別成功的、新穎的以及最有效的解決手段(防御者)來對抗各種測試(攻擊)。在這種競爭性游戲中,測試(攻擊者)和解決方案(防御者)的策略會導致對手之間的軍備競賽,雙方在追求沖突的目標時都在適應或進化。

一個基本的協同進化算法用錦標賽選擇和用于變異的方法(如交叉和變異)來進化兩個種群。一個種群包括測試(攻擊)和另一個解決方案(防御)。在每一代中,通過配對攻擊和防御形成交戰。這些種群以交替的步驟進行進化: 首先,測試種群被選擇、改變、更新并針對解決方案進行評估,然后解決方案的種群被選擇、改變、更新并針對測試進行評估。每個測試--解決方案對都被派往參與組件,其結果被用作每個組件的適配度的一部分。適應性是根據對手的交戰情況整體計算的。

每個SLD配置都有一個健身值,它與需要優化的措施有關,如部隊發展(Fd)和部隊生成(Fg)效率。來自 "學習 "的模式被用來優化未來的SLD計劃,其措施如下:

  • SLD的成本:對于一艘船來說,從一個地方移動到另一個地方
    • 移動人員的成本是多少: 每個人的PCS成本 x 坯料的數量?
    • 準備必要的基礎設施(匹配的評估)以支持船舶移動的成本是多少?
  • Fd/Fg效率: 有多少游覽或需求得到滿足(匹配)?

優化可能是壓倒性的。LAILOW使用綜合Soar-RL和協同進化算法,簡化了優化過程。

LAILOW已被用于DMO和EABO的兵棋推演(Zhao, 2021),發現海軍艦艇和海軍陸戰隊的維修和供應鏈的物流操作的脆弱性和彈性(Zhao & Mata, 2020),以及超視距打擊任務規劃(Zhao等,2020;Zhao & Nagy, 2020)。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

隨著技術的飛速發展和威脅環境變得更加復雜,今天的海軍行動經常面臨著具有挑戰性的決策空間。人工智能(AI)的進步為解決海軍行動中日益復雜的問題提供了潛在的解決方案。未來的人工智能系統提供了潛在的意義深遠的好處--提高對態勢的認識,增加對威脅和對手能力和意圖的了解,識別和評估可能的戰術行動方案,并提供方法來預測行動方案決定的結果和影響。人工智能系統將在支持未來海軍作戰人員和保持作戰和戰術任務優勢方面發揮關鍵作用。

人工智能系統為海戰提供了優勢,但前提是這些系統的設計和實施方式能夠支持有效的作戰人員-機器團隊,改善作戰情況的不確定性,并提出改善作戰和戰術結果的建議。實施人工智能系統,以滿足海軍應用的這些苛刻需求,給工程設計界帶來了挑戰。本文確定了四個挑戰,并描述了它們如何影響戰爭行動、工程界和海軍任務。本文提供了通過研究和工程倡議來解決這些挑戰的解決思路。

引言

人工智能是一個包括許多不同方法的領域,目的是創造具有智能的機器(Mitchell 2019)。自動化系統的運作只需要最小的人類輸入,并經常根據命令和規則執行重復性任務。人工智能系統是自動化機器,執行模仿人類智能的功能。它們將從過去的經驗中學習到的新信息融入其中,以做出決定并得出結論。

如表1所述,人工智能系統有兩種主要類型。第一種類型是明確編程的專家系統。Allen(2020,3)將專家系統描述為手工制作的知識系統,使用傳統的、基于規則的軟件,將人類專家的主題知識編入一長串編程的 "如果給定x輸入,則提供y輸出"的規則。這些系統使用傳統的編程語言。第二種類型是ML系統,從大型數據集中進行訓練。ML系統自動學習并從經驗中改進,而不需要明確地進行編程。一旦ML系統被 "訓練",它們就被用于操作,以產生新的操作數據輸入的結果。

表1. 兩類人工智能系統

人工智能系統--包括專家系統和學習系統--為海軍提供了巨大的潛力,在大多數任務領域有不同的應用。這些智能系統可以擴展海軍的能力,以了解復雜和不確定的情況,制定和權衡選擇,預測行動的成功,并評估后果。它們提供了支持戰略、作戰計劃和戰術領域的潛力。

本文確定了工程設計界必須解決的四個挑戰,以便為未來海戰任務實施人工智能系統。表2強調了這四個挑戰領域。這些挑戰包括:(1)復雜的海戰應用領域;(2)需要收集大量與作戰相關的數據來開發、訓練和驗證人工智能系統;(3)人工智能系統工程的一些新挑戰;(4)存在對手的人工智能進展,不斷變化和發展的威脅,以及不斷變化的人工智能系統的網絡弱點。本文側重于海軍戰爭的四個挑戰領域,但認識到這些挑戰可以很容易地被概括為整個軍隊在未來人工智能系統可能應用的所有戰爭領域中廣泛存在的挑戰。

表2. 為海軍實施人工智能系統的四個挑戰領域

挑戰一:戰爭復雜性

人工智能正被視為一種能力,可應用于廣泛的應用,如批準貸款、廣告、確定醫療、規劃航運路線、實現自動駕駛汽車和支持戰爭決策。每個不同的應用領域都提出了一系列的挑戰,人工智能系統必須與之抗衡,才能成為一種增加價值的可行能力。表3比較了一組領域應用的例子,從潛在的人工智能系統解決方案的角度說明了挑戰的領域。該表在最上面一行列出了一組10個因素,這些因素對一個特定的應用程序產生了復雜性。根據每個因素對作為實施人工智能的領域的整體復雜性的貢獻程度,對六個應用領域的特征進行了定性評估。顏色代表低貢獻(綠色)、中貢獻(黃色)和高貢獻(紅色)。

表3中最上面一行顯示的特征包括: (1)認識上的不確定性水平(情況知識的不確定性程度),(2)情況的動態性,(3)決策時間表(可用于決策的時間量),(4)人類用戶和人工智能系統之間的互動所涉及的錯綜復雜的問題、 (5)資源的復雜性(數量、類型、它們之間的距離以及它們的動態程度),(6)是否涉及多個任務,(7)所需訓練數據集的復雜性(大小、異質性、有效性、脆弱性、可獲得性等 8)對手的存在(競爭者、黑客或徹頭徹尾的敵人),(9)可允許的錯誤幅度(多少決策錯誤是可以接受的),以及(10)決策后果的嚴重程度。該表的定性比較旨在提供一個高層次的相對意義,即基于一組樣本的貢獻因素,不同應用領域的不同復雜程度。

表3. 影響應用復雜性的因素比較

對于所有的應用領域來說,人工智能系統的工程都是具有挑戰性的。人工智能系統在本質上依賴于具有領域代表性的數據。獲得具有領域代表性的數據會帶來基于數據大小、可用性、動態性和不確定性的挑戰。決策時間--由情況的時間動態決定--會給人工智能系統工程帶來重大挑戰--特別是當一個應用領域的事件零星發生和/或意外發生時;以及當決策是時間緊迫的時候。具有更多決策時間、充分訪問大型數據集、直接的用戶互動、完善的目標和非致命后果的應用,如貸款審批、廣告、醫療診斷(在某種程度上)面臨工程挑戰,但其復雜程度較低。確定最佳運輸路線和為自動駕駛汽車設計AI系統是更復雜的工作。這些應用是動態變化的,做決定的時間較短。航運路線將在可能的路線數量上具有復雜性--這可能會導致許多可能的選擇。然而,航運錯誤是有空間的,而且后果通常不會太嚴重。對于自動駕駛汽車來說,決策錯誤的空間非常小。在這種應用中,決策失誤會導致嚴重的事故。

影響開發支持海戰決策的人工智能系統的因素在表3所示的所有類別中都具有高度的復雜性。因此,戰術戰爭領域對工程和實施有效的人工智能系統作為解決方案提出了特別棘手的挑戰。表4強調了導致這種復雜性的海戰領域的特點。作為一個例子,海軍打擊力量的行動可以迅速從和平狀態轉變為巨大的危險狀態--需要對威脅保持警惕并采取適當的反應行動--所有這些都是在高度壓縮的決策時間內進行。戰術威脅可能來自水下、水面、空中、陸地、太空,甚至是網絡空間,導致需要處理多種時間緊迫的任務。由于海軍和國防資產在艦艇、潛艇、飛機、陸地和太空中,戰術決策空間必須解決這些分散和多樣化資源的最佳協作使用。制定有效的戰術行動方案也必須在高度動態的作戰環境中進行,并且只有部分和不確定的情況知識。決策空間還必須考慮到指揮權、交戰規則和戰術理論所帶來的限制。人類作為戰術決策者的角色增加了決策空間的復雜性--信息過載、操作錯誤、人機信任和人工智能的模糊性/可解釋性問題等挑戰。最后,對于戰術決策及其可能的后果來說,風險可能非常大。

表4. 導致戰術決策復雜性的因素

解決高度復雜的決策領域是對海軍的挑戰。人工智能為解決海軍作戰的復雜性提供了一個潛在的解決方案,即處理大量的數據,處理不確定性,理解復雜的情況,開發和評估決策選擇,以及理解風險水平和決策后果。Desclaux和Prestot(2020)提出了一個 "認知三角",其中人工智能和大數據被應用于支持作戰人員,以實現信息優勢、控制論信心和決策優勢。約翰遜(2019年)開發了一個工程框架和理論,用于解決高度復雜的問題空間,這些問題需要使用智能和分布式人工智能系統來獲得情況意識,并做出適應動態情況的協作行動方案決定。約翰遜(2020a)建立了一個復雜的戰術場景模型,以證明人工智能輔助決策對戰術指揮和控制(C2)決策的好處。約翰遜(2020b)開發了一個預測分析能力的概念設計,作為一個自動化的實時戰爭游戲系統來實施,探索不同的可能的戰術行動路線及其預測的效果和紅色部隊的反應。首先,人工智能支持的C2系統需要描述戰術行動期間的復雜程度,然后提供一個自適應的人機組合安排來做出戰術決策。這個概念包括根據對目前戰術情況的復雜程度最有效的方法來調整C2決策的自動化水平(人與機器的決策角色)。約翰遜(2021年)正在研究這些概念性工程方法在各種防御用例中的應用,包括空中和導彈防御、超視距打擊、船舶自衛、無人機操作和激光武器系統。

在海軍作戰中實施人工智能系統的一個額外挑戰是在戰術邊緣施加的限制。分散的海軍艦艇和飛機的作戰行動構成了戰術邊緣--在有限的數據和通信下作戰。"在未來,戰術邊緣遠離指揮中心,通信和計算資源有限,戰場形勢瞬息萬變,這就導致在嚴酷復雜的戰地環境中,網絡拓撲結構連接薄弱,變化迅速"(Yang et. al. 2021)。戰術邊緣網絡也容易斷開連接(Sridharan et. al. 2020)。相比之下,許多商業人工智能系統依賴于基于云的或企業內部的處理和存儲,而這些在海戰中是不存在的。在戰術邊緣實施未來的人工智能系統時,必須進行仔細的設計考慮,以了解哪些數據和處理能力可用。這可能會限制人工智能系統在邊緣所能提供的決策支持能力。

在軍事領域使用人工智能必須克服復雜性的挑戰障礙,在某些情況下,人工智能的加入可能會增加復雜性。辛普森等人(2021)認為,將人工智能用于軍事C2可能會導致脆弱性陷阱,在這種情況下,自動化功能增加了戰斗行動的速度,超出了人類的理解能力,最終導致 "災難性的戰略失敗"。Horowitz等人(2020)討論了通過事故、誤判、增加戰爭速度和升級以及更大的殺傷力來增加國際不穩定和沖突。Jensen等人(2020)指出,人工智能增強的軍事系統增加的復雜性將增加決策建議和產生的信息的范圍、重要性和意義的不確定性;如果人類決策者對產出缺乏信心和理解,他們可能會失去對人工智能系統的信任。

挑戰二:數據需求

實施人工智能系統的第二個挑戰是它們依賴并需要大量的相關和高質量的數據用于開發、訓練、評估和操作。在海戰領域滿足這些數據需求是一個挑戰。明確編程的專家系統在開發過程中需要數據進行評估和驗證。ML系統在開發過程中對數據的依賴性甚至更大。圖1說明了ML系統如何從代表作戰條件和事件的數據集中 "學習"。

ML系統的學習過程被稱為被訓練,開發階段使用的數據被稱為訓練數據集。有幾種類型的ML學習或訓練--它們是監督的、無監督的和強化的方法。監督學習依賴于地面真相或關于輸出值應該是什么的先驗知識。監督學習算法的訓練是為了學習一個最接近給定輸入和期望輸出之間關系的函數。無監督學習并不從地面真相或已知的輸出開始。無監督學習算法必須在輸入數據中推斷出一個自然結構或模式。強化學習是一種試錯法,允許代理或算法在獎勵所需行為和/或懲罰不需要的行為的基礎上學習。所有三種類型的ML學習都需要訓練數據集。在部署后或運行階段,ML系統繼續需要數據。

圖1顯示,在運行期間,ML系統或 "模型 "接收運行的實時數據,并通過用其 "訓練 "的算法處理運行數據來確定預測或決策結果。因此,在整個系統工程和采購生命周期中,ML系統與數據緊密相連。ML系統是從訓練數據集的學習過程中 "出現 "的。ML系統是數據的質量、充分性和代表性的產物。它們完全依賴于其訓練數據集。

圖1. 使用數據來訓練機器學習系統

美國海軍開始認識到對這些數據集的需求,因為許多領域(戰爭、供應鏈、安全、后勤等)的更多人工智能開發人員正在了解人工智能解決方案的潛在好處,并開始著手開發人工智能系統。在某些情況下,數據已經存在并準備好支持人工智能系統的開發。在其他情況下,數據存在但沒有被保存和儲存。最后,在其他情況下,數據并不存在,海軍需要制定一個計劃來獲得或模擬數據。

收集數據以滿足海軍領域(以及更廣泛的軍事領域)的未來人工智能/ML系統需求是一個挑戰。數據通常是保密的,在不同的項目和系統中被分隔開來,不容易從遺留系統中獲得,并且不能普遍代表現實世界行動的復雜性和多樣性。要從并非為數據收集而設計的遺留系統中獲得足夠的數據,可能非常昂貴和費時。數據收集可能需要從戰爭游戲、艦隊演習、系統測試、以及建模和模擬中收集。此外,和平時期收集的數據并不代表沖突和戰時的操作。海軍(和軍方)還必須教導人工智能系統在預計的戰時行動中發揮作用。這將涉及想象可能的(和可能的)戰時行動,并構建足夠的ML訓練數據。

數據收集的另一個挑戰是潛在的對抗性黑客攻擊。對于人工智能/ML系統來說,數據是一種珍貴的商品,并提出了一種新的網絡脆弱性形式。對手可以故意在開發過程中引入有偏見或腐敗的數據,目的是錯誤地訓練AI/ML算法。這種邪惡的網絡攻擊形式可能很難被發現。

海軍正在解決這一數據挑戰,開發一個數據基礎設施和組織來管理已經收集和正在收集的數據。海軍的Jupiter計劃是一個企業數據和分析平臺,正在管理數據以支持AI/ML的發展和其他類型的海軍應用,這些應用需要與任務相關的數據(Abeyta,2021)。Jupiter努力的核心是確定是否存在正確的數據類型來支持人工智能應用。為了生產出在行動中有用的人工智能/ML系統,海軍需要在游戲中保持領先,擁有能夠代表各種可能情況的數據集,這些情況跨越了競爭、沖突和危機期間的行動范圍。因此,數據集的開發和管理必須是一項持續的、不斷發展的努力。

挑戰三:工程化人工智能系統

第三個挑戰是,人工智能系統的工程需要改變傳統的系統工程(SE)。在傳統系統中,行為是設定的(確定性的),因此是可預測的:給定一個輸入和條件,系統將產生一個可預測的輸出。一些人工智能解決方案可能涉及到系統本身的復雜性--適應和學習--因此產生不可預見的輸出和行為。事實上,一些人工智能系統的意圖就是要做到這一點--通過承擔一些認知負荷和產生智能建議,與人類決策者合作。表5強調了傳統系統和人工智能系統之間的區別。需要有新的SE方法來設計智能學習系統,并確保它們對人類操作者來說是可解釋的、可信任的和安全的。

SE作為一個多學科領域,在海軍中被廣泛使用,以將技術整合到連貫而有用的系統中,從而完成任務需求(INCOSE 2015)。SE方法已經被開發出來用于傳統系統的工程設計,這些系統可能是高度復雜的,但也是確定性的(Calvano和John 2004)。如表5所述,傳統系統具有可預測的行為:對于一個給定的輸入和條件,它們會產生可預測的輸出。然而,許多海軍應用的人工智能系統在本質上將是復雜的、適應性的和非決定性的。Raz等人(2021年)解釋說,"SE及其方法的雛形基礎并不是為配備人工智能(即機器學習和深度學習)的最新進展、聯合的多樣化自主系統或多領域操作的工程系統而設想的。" 對于具有高風險后果的軍事系統來說,出錯的余地很小;因此,SE過程對于確保海軍中人工智能系統的安全和理想操作至關重要。

表5. 傳統系統和人工智能系統的比較

在整個系統生命周期中,將需要改變SE方法,以確保人工智能系統安全有效地運行、學習和適應,以滿足任務需求并避免不受歡迎的行為。傳統的SE過程的大部分都需要轉變,以解決人工智能系統的復雜和非確定性的特點。在人工智能系統的需求分析和架構開發階段需要新的方法,這些系統將隨著時間的推移而學習和變化。系統驗證和確認階段將必須解決人工智能系統演化出的突發行為的可能性,這些系統的行為不是完全可預測的,其內部參數和特征正在學習和變化。運營和維護將承擔重要的任務,即隨著人工智能系統的發展,在部署期間不斷確保安全和理想的行為。

SE界意識到,需要新的流程和實踐來設計人工智能系統。國際系統工程師理事會(INCOSE)最近的一項倡議正在探索開發人工智能系統所需的SE方法的變化。表6強調了作為該倡議一部分的五個SE重點領域。除了非決定性的和不斷變化的行為,人工智能系統可能會出現新類型的故障模式,這些故障模式是無法預料的,可能會突然發生,而且其根本原因可能難以辨別。穩健設計--或確保人工智能系統能夠處理和適應未來的情景--是另一個需要新方法的SE領域。最后,對于有更多的人機互動的人工智能系統,必須仔細注意設計系統,使它們值得信賴,可以解釋,并最終對人類決策者有用。

表6.人工智能系統工程中的挑戰(改編自:Robinson,2021)。

SE研究人員正在研究人工智能系統工程所涉及的挑戰,并開發新的SE方法和對現有SE方法的必要修改。Johnson(2019)開發了一個SE框架和方法,用于工程復雜的適應性系統(CASoS)解決方案,涉及分布式人工智能系統的智能協作。這種方法支持開發智能系統的系統,通過使用人工智能,可以協作產生所需的突發行為。Johnson(2021)研究了人工智能系統產生的潛在新故障模式,并提出了一套跨越SE生命周期的緩解和故障預防策略。她提出了元認知,作為人工智能系統自我識別內部錯誤和失敗的設計方案。Cruz等人(2021年)研究了人工智能在空中和導彈防御應用中使用人工智能輔助決策的安全性。他們為計劃使用人工智能系統的軍事項目編制了一份在SE開發和運行階段需要實施的策略和任務清單。Hui(2021年)研究了人類作戰人員與人工智能系統合作進行海軍戰術決策時的信任動態。他制定了工程人工智能系統的SE策略,促進人類和機器之間的 "校準 "信任,這是作為適當利用的最佳信任水平,避免過度信任和不信任,并在信任失敗后涉及信任修復行動。Johnson等人(2014)開發了一種SE方法,即協同設計,用于正式分析人機功能和行為的相互依賴性。研究人員正在使用協同設計方法來設計涉及復雜人機交互的穩健人工智能系統(Blickey等人,2021年,Sanchez 2021年,Tai 2021年)。

數據的作用對于人工智能系統的開發和運行來說是不可或缺的,因此需要在人工智能系統的SE生命周期中加入一個持續不斷的收集和準備數據的過程。Raz等人(2021)提出,SE需要成為人工智能系統的 "數據策劃者"。他們強調需要將數據策劃或轉化為可用的結構,用于開發、訓練和評估AI算法。French等人(2021)描述了需要適當的數據策劃來支持人工智能系統的發展,他們強調需要確保數據能夠代表人工智能系統將在其中運行的預期操作。他們強調需要安全訪問和保護數據,以及需要識別和消除數據中的固有偏見。

SE界正處于發展突破和進步的早期階段,這些突破和進步是在更復雜的應用中設計人工智能系統所需要的。這些進展需要與人工智能的進展同步進行。在復雜的海軍應用以及其他非海軍和非軍事應用中實施人工智能系統取決于是否有必要的工程實踐。SE實踐必須趕上AI的進步,以確保海軍持續的技術優勢。

挑戰四:對抗性

海軍在有效實施人工智能系統方面面臨的第四個挑戰是應對對手。海軍的工作必須始終考慮對手的作用及其影響。表7確定了在海軍實施人工智能系統時必須考慮的與對手有關的三個挑戰:(1)人工智能技術在許多領域迅速發展,海軍必須注意同行競爭國的軍事應用進展,以防止被超越,(2)在海軍應用中實施人工智能系統和自動化會增加網絡脆弱性,以及(3)海軍應用的人工智能系統需要發展和適應,以應對不斷變化的威脅環境。

表7. AI系統的對抗性挑戰

同行競爭國家之間發展人工智能能力的競賽,最終是為了進入對手的決策周期,以便比對手更快地做出決定和采取行動(Schmidt等人,2021年)。人工智能系統提供了提高決策質量和速度的潛力,因此對獲得決策優勢至關重要。隨著海軍對人工智能解決方案的探索,同行的競爭國家也在做同樣的事情。最終實現將人工智能應用于海軍的目標,不僅僅取決于人工智能研究。它需要適當的數據收集和管理,有效的SE方法,以及仔細考慮人類與AI系統的互動。海軍必須承認,并采取行動解決實施人工智能系統所涉及的挑戰,以贏得比賽。

網絡戰是海軍必須成功參與的另一場競賽,以保持在不斷沖擊的黑客企圖中的領先地位。網絡戰的特點是利用計算機和網絡來攻擊敵人的信息系統(Libicki, 2009)。海軍對人工智能系統的實施導致了更多的網絡攻擊漏洞。人工智能系統的使用在本質上依賴于訓練和操作數據,導致黑客有機會在開發階段和操作階段用腐敗的數據欺騙或毒害系統。如果一個對手獲得了對一個運行中的人工智能系統的控制,他們可能造成的傷害將取決于應用領域。對于支持武器控制決策的自動化,其后果可能是致命的。海軍必須注意人工智能系統開發過程中出現的特殊網絡漏洞。必須為每個新的人工智能系統實施仔細的網絡風險分析和網絡防御戰略。海軍必須小心翼翼地確保用于開發、訓練和操作人工智能系統的數據集在整個人工智能系統的生命周期中受到保護,免受網絡攻擊(French等人,2021)。

威脅環境的演變是海軍在開發AI系統時面臨的第三個對抗性挑戰。對手的威脅空間隨著時間的推移不斷變化,武器速度更快、殺傷力更大、監視資產更多、反制措施更先進、隱身性更強,這對海軍能夠預測和識別新威脅、應對戰斗空間的未知因素構成了挑戰。尤其是人工智能系統,必須能夠加強海軍感知、探測和識別新威脅的能力,以幫助它們從未知領域轉向已知領域的過程。他們必須適應新的威脅環境,并在行動中學習,以了解戰斗空間中的未知因素,并通過創新的行動方案快速應對新的威脅(Grooms 2019, Wood 2019, Jones et al 2020)。海軍可以利用人工智能系統,通過研究特定區域或領域的長期數據,識別生活模式的異常(Zhao等人,2016)。最后,海軍可以探索使用人工智能來確定新的和有效的行動方案,使用最佳的戰爭資源來解決棘手的威脅情況。

結論

人工智能系統為海軍戰術決策的優勢提供了相當大的進步潛力。然而,人工智能系統在海戰應用中的實施帶來了重大挑戰。人工智能系統與傳統系統不同--它們是非決定性的,可以學習和適應--特別是在用于更復雜的行動時,如高度動態的、時間關鍵的、不確定的戰術行動環境中,允許的誤差范圍極小。本文確定了為海戰行動實施人工智能系統的四個挑戰領域:(1)開發能夠解決戰爭復雜性的人工智能系統,(2)滿足人工智能系統開發和運行的數據需求,(3)設計這些新穎的非確定性系統,以及(4)面對對手帶來的挑戰。

海軍必須努力解決如何設計和部署這些新穎而復雜的人工智能系統,以滿足戰爭行動的需求。作者在這一工作中向海軍提出了三項建議。

1.第一個建議是了解人工智能系統與傳統系統之間的差異,以及伴隨著人工智能系統的開發和實施的新挑戰。

人工智能系統,尤其是那些旨在用于像海戰這樣的復雜行動的系統,其本身就很復雜。它們在應對動態戰爭環境時將會學習、適應和進化。它們將變得不那么容易理解,更加不可預測,并將出現新型的故障模式。海軍將需要了解傳統的SE方法何時以及如何在這些復雜系統及其復雜的人機交互工程中失效。海軍將需要了解數據對于開發人工智能系統的關鍵作用。

2.第二個建議是投資于人工智能系統的研究和開發,包括其數據需求、人機互動、SE方法、網絡保護和復雜行為。

研究和開發是為海戰行動開發AI系統解決方案的關鍵。除了開發復雜的戰術人工智能系統及其相關的人機協作方面,海軍必須投資研究新的SE方法來設計和評估這些適應性非決定性系統。海軍必須仔細研究哪些新類型的對抗性網絡攻擊是可能的,并且必須開發出解決這些問題的解決方案。海軍必須投資于收集、獲取和維護代表現實世界戰術行動的數據,用于人工智能系統開發,并確保數據的相關性、有效性和安全性。

3.第三個建議是承認挑戰,并在預測人工智能系統何時準備好用于戰爭行動方面采取現實態度。

盡管人工智能系統正在許多領域實施,但海軍要為復雜的戰術戰爭行動實施人工智能系統還需要克服一些挑戰。人工智能系統在較簡單應用中的成功并不能保證人工智能系統為更復雜的應用做好準備。海軍應該保持一種現實的認識,即在人工智能系統準備用于戰爭決策輔助工具之前,需要取得重大進展以克服本文所討論的挑戰。實現人工智能系統的途徑可以依靠建模和模擬、原型實驗、艦隊演習以及測試和評估。可以制定一個路線圖,彌合較簡單應用的人工智能和復雜應用的人工智能之間的差距--基于一個積木式的方法,在為逐漸復雜的任務開發和實施人工智能系統時吸取經驗教訓。

海軍將從未來用于戰術戰爭的人工智能系統中獲益。通過安全和有效地實施人工智能系統,戰術決策優勢的重大進步是可能的。此外,海軍必須跟上(或試圖超越)對手在人工智能方面的進展。本文描述了為在海戰中實施人工智能系統而必須解決的四個挑戰。通過對這些新穎而復雜的人工智能系統的深入了解,對研究和開發計劃的投資,以及對人工智能技術進步時限的現實預期,海軍可以在應對這些挑戰方面取得進展。

付費5元查看完整內容

在描述未來戰場時,許多軍事從業人員推測人工智能(AI)的影響,還有人甚至要求使用人工智能。本文提供了對戰場AI技術的基本理解。首先,最重要的是,高質量、有標簽、有組織的數據為人工智能系統提供養料。此外,許多人工智能架構在接觸到太少或有污點的數據時被證明是脆弱的,有可能被對手所利用。應用一個健全的應用模式,考慮到人類與人工智能實施的互動,有助于確保軍事交戰不會變成純粹的數據驅動模式。

引言

在描述未來的戰場時,許多軍事工作者推測人工智能(AI)的影響,還有人甚至要求使用人工智能。因為人工智能已經推動了部分經濟的發展,并引導了自動駕駛汽車原型開發。這些商業例子代表了工程師們對使用人工智能的選擇,因為它為特定問題提供了正確的解決方案。這些案例經常使用機器學習(ML),它能極好地完成一個特定的數據特征任務,但并不代表人工通用智能。ML算法可以產生令人印象深刻的結果,但事實證明其高度依賴訓練數據,這使它們很容易受到攻擊。盡管如此,軍事規劃者和領導人目前面臨著在哪里實施以及如何投資AI和ML的決定,如果處理不當將很有可能失去半自主性和決策速度方面的潛在戰場優勢。事實上,美國《2022財政年度國防授權法》第226條要求審查 "人工智能和數字技術在美國防部平臺、流程和業務中的潛在應用",這使得對人工智能和ML應用的理解變得更加緊迫。此外,通過聯合人工智能中心、美國海軍研究實驗室和美國空軍-馬薩諸塞州技術研究所人工智能加速器等組織,實施的有前途的投資和研究。ML對數據的依賴,以及它的脆弱性,揭示了潛在軍事應用的基本風險和限制。這些有助于為一個基本模型提供信息,軍事規劃人員可以據此決定在哪里以及如何利用一個基于人工智能的系統。這個模型,再加上確保數據干凈和跟蹤人工智能系統的訓練時間,可以幫助確保軍事應用不會落入讓人工智能做出不準確或錯誤決定的陷阱。

背景(ML的基礎)

目前ML實施方式是通過訓練計算機系統來很好地完成一項任務。例如,目前的ML系統可以讀取路標。然而,盡管如此,一個用于圖像處理的ML算法如果應用于其他數據模式,很少會產生相稱的結果。例如,一個為其他目的而設計的系統,無法以同樣的信心使用圖像處理算法來識別人類的語音。即使是面對相同的數據模式,如圖像,一個在識別一種類型的圖像(如路標)時表現良好的ML算法,在訓練識別另一種圖像(如樹木)時也可能表現不佳。美國和中國人工智能創新的領導者李開復認為,實施一個ML系統 "需要大量的相關數據,一個強大的算法,一個狹窄的領域,以及一個具體的目標。如果你缺少其中任何一個,事情就會崩潰。" 因此,圖像、音頻、金融和信號處理之外的應用往往仍然是研究和發展的主題。互聯網提供了收集數以百萬計數據點的手段,這些數據點是開發許多強大人工智能系統原型所需要的。然而,這些數據隨后需要組織和標記,通常是由人類來完成,以便ML系統可以訓練。上面的例子,人類可能會查看、識別和標記ML系統最初學習的每一張停車標志的圖像。用來訓練軍事人工智能應用系統的真實標記數據往往很稀缺。數以千計的鳥類或停車標志圖像已經貼上了標簽,這反映了時間和資源的規模,但這不一定能用來標記訓練軍事人工智能系統所需的獨特傳感器數據。如果沒有找到可以轉化為軍事應用的已標記的數據,就必須實施一個收集和標記新訓練數據的系統。由于這些原因,數據的質量和可用性給任何軍事應用帶來了時間和資源障礙。

當提供優質數據時,人們可以在兩種基本模式下訓練ML程序:有監督的和無監督的。監督訓練需要有真實標簽(即正確答案)的樣本。在對新數據進行分類后,ML模型可以將其輸出與正確的解決方案進行比較。當它收到越來越多的訓練數據時,ML算法就會尋求使其輸出與正確標簽之間的誤差最小化。隨著更多的數據和樣本通過ML的反饋,其反應的準確性可能會增加,但太多類似的樣本會使模型過度擬合,使其在執行時對新數據進行錯誤分類。在無監督學習中,ML模型沒有正確分類的樣本;相反,它把數據分成類似的類別。同樣,訓練數據集影響了這些分組在相似性方面的精確程度。當遇到有標簽的數據并尋求特定的分類能力時,監督學習算法可能被證明更有用,而無監督學習最初可能被證明對一個新的數據集更有用。值得注意的是,兩種方法都存在錯誤。

監督和非監督學習都適用于軍事應用。對于圖像分析,一個ML系統有可能識別出特定類型的飛機或車輛的型號。一個ML系統也可以快速識別觀察到的環境變化。這種識別的變化可以觸發其他傳感器或ML系統進行更仔細的觀察。美國空軍最近表示,它已經實施了人工智能來支持目標定位。中國的軍事思想家認為人工智能和智能武器是未來戰爭中潛在的決定性技術。情報、監視和偵察(ISR);信息戰;和圖像分析是軍事ML的主要應用。

除了建立大量有組織和可消化的數據用于訓練外,ML系統必須可以獲得新數據和計算能力,以執行ML算法。事實證明,圖形處理單元,也就是驅動現代游戲電腦的硬件,可以提供所需的處理能力。然而,移動和處理ML數據所需的存儲空間和帶寬會使推動ML系統向戰術應用發展成為挑戰。這些限制意味著人們可能很快將導航、傳感器到射手射擊等應用推向戰術邊緣。其他可實現的應用,如復雜的飛機維護,需要大量的數據收集、開發和測試,然后在戰術邊緣進行輕度訓練。

有可能的是,人們可以通過在超級計算機上訓練ML系統,進而采用訓練好的算法來克服這些障礙,這個過程中可能會有專門的云架構幫助。網狀網絡和分布式計算方法也將有助于克服這一挑戰。然而,即使要實施這些解決方案,也需要對目前的戰術數據通信進行大規模的改革。訪問和處理數據的能力將決定AI應用在戰場上的位置。如果沒有在戰術邊緣推拉實時數據的能力,ML戰場應用仍將受到限制。

脆弱性(好數據和壞數據)

除了需要大量的數據來訓練ML系統,數據還必須具有良好的質量。質量意味著數據是在不同的情況下從不同來源獲取的,然后以ML系統可以接受的方式進行標注和展示。更重要的是,ML實施必須確保數據的完整性和標簽的準確性。古老的諺語 "垃圾進,垃圾出 "對ML來說是真實的,如果沒有高質量的訓練數據,假陽性或其他不良的結果會大量出現。一些研究實例已經證明了這一點對ML圖像處理算法的影響。簡單地給照片中的像素添加噪音或色調和亮度的輕微變化,就能迫使其做出錯誤的分類,即使在人眼看來圖像是一樣的。同樣,通過在停車標志上放置貼紙來改變一個物體的物理性質,也會迫使ML系統對該標志進行錯誤分類。(另一方面,人類仍然會感知到停車標志,而忽略貼紙)。同樣,谷歌已經證明,一個簡單的 ""放置在圖像的角落里會阻止正確的ML分類。雖然這些例子集中在ML的圖像應用上,但它們說明了ML系統在訓練中的脆弱性以及任何ML系統中數據完整性的重要性。這些問題對許多商業應用來說是可以容忍的,但在軍事背景下,它們就顯得更加突出。

這種對數據的依賴引入了兩種顛覆ML系統的主要方法。攻擊者可以在系統學習之前對數據下毒,或者向受訓系統提供病態數據。像素操作和圖像修補可以在模型訓練階段(即操作前)提供一種攻擊手段。將貼紙貼在停車標志上或房間里的海報上,可以用來攻擊操作中的訓練有素的ML系統。軍事從業人員可以很容易對數據進行篡改。這些可能性包括對數據庫進行網絡攻擊,以及應用簡單而一致的偽裝手段,以確保訓練中的簽名與行動中的簽名不一致。此外,偏離武器系統的正常使用方式,有可能影響ML系統的分類結果。任何ML的軍事應用都必須通過強調確保數據不被篡改、數據來自可靠來源以及數據被正確標記的重要性來防止此類攻擊。同時,軍事人工智能系統必須有一個維持計劃,以便在新的相關數據源可用時用其更新訓練過的模型。在戰場行動的緊迫時間框架內,這種維護可能很難實現。

為了防止這種可能性并反制對手對ML的應用,數據管理變得至關重要。首先,必須開發一種手段,以一種有標簽和有組織的方式跟蹤友軍的數據暴露。這意味著每一次追蹤友軍能力可能會暴露于對手的ISR或通過間諜活動、黑客攻擊、工業或新聞界不知不覺地泄露情況。同樣重要的是,友軍要保持對攻擊者可能擁有數據的理解。對手可能有機會獲得高質量的監控數據,甚至是國防部門實施的ML模型。有了這個數據集和相關的分析,就有可能進行兵棋推演并考慮到對手可能的ML能力。在兵棋推演之后,人工智能專家可以得出關于偽裝、欺騙、甚至數據攻擊的建議。另外,如果知道對手使用什么ML技術,再加上這些友軍數據,就可以估計友軍的弱點或揭示ML賦能決策中的可預測性。因此,了解對手的人工智能和ML算法應該是一個優先事項。這種數據跟蹤方法有助于確定友軍在戰場上使用前應將哪些物品隱藏起來,并指導其有效應用。

然而,僅僅識別關鍵數據是不夠的。軍事部門還必須提供培訓手段,以便進行技術簽名管理。更容易進入安全設施和無線電頻率(RF)屏蔽機庫,或只在適當的光線和云層條件下進行訓練,都是各單位必須實施的概念。人們無法抹去對手收集的舊數據,但隨著國防部門開始實施新的能力,部隊可以管理他們的數據暴露或改變簽名。簡單地改變飛機上的油漆顏色或略微改變一個射頻形式因素就可以減輕過去的簽名暴露。諸如擴大聯合攻擊戰斗機的部署、高機動性火炮火箭系統或新的戰術編隊(如海軍陸戰隊濱海團)等能力應適用所有這些原則,作為其部署和培訓計劃的一部分。總之,要應用的原則包括確保ML訓練數據的完整性,保護和改變友軍簽名數據,并確保友軍ML實施的保密性。

在哪里應用AI(風險)

風險將推動軍隊應該在哪里實施人工智能以及系統應該有多大的自主性。麻省理工學院(MIT)林肯實驗室提出了一個描述人工智能 "影響領域"的模型,它試圖定義人工智能的現有商業和軍事應用。在這個模型中,低行動后果的應用包括將人工智能用于機器人吸塵器,而高行動后果的應用則將生命置于危險之中,如醫療診斷。這個模型將人工智能投資放在不同級別的可用數據和行動后果的類別中。例如,根據這個模型,最初投資于人工智能來分析ISR圖像的行動后果低于使用人工智能來直接攻擊目標。同樣的數據可以為ISR探測和武器交戰提供信息,但顯然行動的后果隨著交戰而增加。

另一個模型在試圖解釋人工智能在未來可能取代的東西時,更依賴于人的因素。李開復分析了人工智能可能取代的人類角色。他從不同的角度對待人工智能的應用,通過審查人工智能的潛在使用是否取代了社會或非社會角色,同時仍然認識到對高質量數據的要求。作為醫療領域的一個例子,精神病醫生的角色是高度社會化的,而放射科醫生的角色是非社會化的。李認為,當提供大量有標簽和可消化的數據時,人工智能投資可以最容易地取代非社會角色。這個觀點與經濟學家已經預測的有關工作場所的自動化取代 "常規手工和認知技能 "的觀點一致,這些技能不需要大量的創造性思維或個人互動。就軍事目的而言,人工智能發揮的社會作用與戰爭中的人類因素有關,如部隊士氣、政治目的和抵抗意志。在軍事應用中只使用基于社會的模型,意味著人們可以考慮用人工智能來取代人類在確定目標和開火的優先次序方面的某些作用。然而,火力行動的后果將必須要求人類繼續參與其中。

結合社會因素和行動后果,提供了一個初步評估工具的例子,即一項軍事活動是否會從人工智能應用中受益,以及應該保留多少人類監督(圖1)。

圖 1. 來自麻省理工學院林肯實驗室和李開復研究的人工智能軍事應用評估模型

正如李開復和麻省理工學院林肯實驗室所強調的數據重要性,組合模型的第一步需要策劃大量的高質量、有標簽的數據。必要的數據和對現有系統的完整理解只意味著人工智能可能會發揮作用。其他重要的技術考慮因素比比皆是,包括但不限于計算的可操作性、優化描述的精確性,以及學習模型的適用性。除了技術上的考慮,其他的標準也告知人們是否應該使用人工智能。使用的行動后果和社會方面的雙軸分析來評估應該如何使用人工智能,而不是是否可以。對人工智能應用的完整評估需要審查數據的可用性和人工智能的技術適用性,然后評估社會和行動的后果要素。

圖1所示的混合模型表明,初始軍事人工智能應用的最佳位置在于行動后果較低的非社會應用。同樣的左下角象限也為初步實施 "人在回路"(HOTL)模式提供了機會。這意味著人工智能將在遵守交戰規則(法律框架)的情況下提供戰斗管理選項,并有可能由人類進行否決,以確保人工智能的建議符合道德要求。 然而,如果沒有人類的干預,HOTL人工智能系統將執行這些行動。HOTL與 "人在回路 "模式形成鮮明對比,在這種模式下,操作者會向人工智能決策過程提供積極的輸入。越是在高度社會化或高后果行動領域的應用,人類就越是要在決策之前保持在循環中。最后,人們會避免在這個模型的右上角直接應用人工智能,在那里會發生具有高行動后果的高度社會活動。

圖2說明了這種方法在常見的聯合目標定位活動中的應用實例。目標開發和優先排序在很大程度上是技術性和非社會性的,導致了較高的行動后果,需要人類參與其中。相反,戰斗損傷評估的行動后果較低,但在確定火力對對手造成的影響時,具有較高的人類社會作用。武器配對和能力分析本身屬于非社會領域,其行動后果相對較低,只需要人類參與其中。指揮官的決策具有高度的社會性和行動后果,應該保持只由人工智能提供信息。這個簡單的應用作為一個說明,并提供了例子之間的相對評估。雖然這個模型提供了一個可以探索如何應用人工智能的例子,但還存在許多其他例子。使用任何這樣的模型,必須首先對人工智能在任何應用中的技術適用性以及數據的質量進行完整分析。

圖 2. AI 評估模型在常見聯合目標定位活動中的應用

使用AI(可信性)

這種人工智能應用模式本身并沒有回答對人工智能系統的信任這一重要問題。就其本質而言,人工智能產生的結果,用戶(甚至設計者)并不完全知道人工智能為何做出決定。這個 "黑盒"留下了重大的道德和信任漏洞。出于這個原因,提供風險控制和代表不確定性的技術研究在不斷推進。雖然圖1中的模型指向了一個人工智能與人類互動的案例,但這并不意味著軍事從業者會信任人工智能的結果。要獲得信任,首先要確保數據的干凈和完整性,這一點在前面已經討論過了。除此之外,人們必須對系統的性能有信心。 一個軍事人工智能的實施不會總是一個靜態的系統。隨著對手調整其設備或新的傳感器上線,人工智能系統將不斷需要接觸到擴大的和當前的數據,以確保其分類決定保持準確,并以正確的理由進行。

就像軍事飛行員和其他專家必須保持使用其武器系統的資格一樣,人工智能的實施將需要一個持續的培訓和評估計劃。人工智能在性能上的重復驗證將涉及到用更新的數據集進行再訓練。任何人工智能系統都必須進行這種性能上的再驗證,因為目前使用的模型并沒有達到通用智能。重新訓練人類操作員以適應新的或新的數據輸入要容易得多,而人工智能算法在引入新的數據時可能完全無法工作。例如,如果一個人工智能系統要將一張圖片分類為朋友或敵人,那么在循環中的人類會想知道人工智能系統使用的是當前的和經過嚴格測試的模型。此外,任何重新訓練人工智能系統的人也希望將當前的性能與過去的性能指標進行比較,以了解系統是否有改進。性能的退化可能表明數據的退化甚至妥協,需要在采用該系統之前對其進行重新訓練。就像訓練有素的軍事技術人員需要在武器平臺上保持最新的資格一樣,人工智能系統在某項任務上適用性和熟練程度也應保持跟蹤。

這些挑戰導致國防部門建立了人工智能道德的五項原則:負責任、公平、可追蹤、可靠和可管理。最近,美國人工智能安全委員會呼吁國家標準和技術研究所制定措施和 "人工智能可信的工具"。 在適當的領域實施人工智能系統,適當地管理數據,并確保當前的人工智能培訓,都有助于建立對軍事人工智能系統的信任。

結論

隨著人工智能研究界開始向國防部門提供能力,沒有經驗的軍事從業者將正確地尋求了解AI和ML的作戰影響。然而,一些急于實施人工智能技術作為目的的軍事領導人有可能不理解人工智能技術的基本原則。人工智能作為解決一個問題的潛在手段,但不一定是最好的手段。首先,高質量的、有標簽的、有組織的數據為人工智能系統提供支持。在最初的開發中,AI/ML戰斗相關的應用可能會依賴來自圖像和信號處理的數據。此外,目前的ML結構在接觸到太少或有污點的數據時被證明是脆弱的。即使提供了一個健全的人工智能實施方案,現在的軍事應用也有可能被對手所預測。隨著國防部門開始使用新的能力并強調軍事行動中的簽名管理,數據管理將被證明是評估人工智能系統使用的最重要因素。應用一個健全的應用模型,考慮到人類與人工智能實施的互動,將有助于確保軍事交戰不會變成純粹的數據驅動。通過在適當領域應用人工智能,確保數據干凈,遵守道德原則,并跟蹤系統培訓,同時減輕新的攻擊載體,那軍事從業者可以信任人工智能。以錯誤的方式應用人工智能將為對手打開容易攻擊的載體,如果不能認識到戰爭中人因的重要性,導致寶貴的資源浪費,不能產生可預測的反應,那最終將無法創造出預期的戰場優勢。

付費5元查看完整內容

“聯合規劃過程”是一份描述巴西武裝部隊使用準則的文件。軍隊也可以將這些準則用于教育目的,在和平時期培訓參謀人員。巴西國防部打算模擬軍事力量的運用,以加快決策周期,增加行動成功的機會。更好地規劃行動,更好地評估風險。作戰方案(COA)兵棋推演模擬了每個友軍的作戰方案與可能的敵軍作戰方案。然而,理論過程缺乏描述如何進行作戰方案推演的信息。因此,理論上的知識僅限于系統化的分析。COA兵棋推演一直是主觀的,并且依賴于隱性知識。這項工作的目的是提出一種實施COA兵棋推演的方法,以及構建COA兵棋推演的概念模型,以便能夠進一步使用計算機系統來支持其進行。兵棋推演的概念啟發了這個游戲的設計。兵棋推演被定義為合成環境中沖突的建模或模擬,涉及敵對勢力,玩家根據規則、程序和信息做出決策。將COA兵棋推演改進為一個教育性兵棋推演工具,可以模擬軍事計劃,支持玩家建立有效的戰略,支持教官分析玩家的決定和裁判交戰,并建立一個技術框架來收集決策數據,以便將來應用于知識管理和人工智能。

研究方法

設計科學(DS)的認識論范式是這項研究的基礎。DS專注于建立知識的過程,并產生與全球實踐和研究社區相關的結果(Johannesson & Perjons, 2014)。DS包括對設計一個新的人工或改進現有人工制品以解決一個問題或一類問題的項目的研究(Dresch等人,2015)。

設計科學研究(DSR)是我們用來計劃、執行和監督研究的策略。DS建議當目標是開發一個人工制品時,采用DSR來操作研究。基于問題的描述,DSR指導研究設計和評估工件,對一個給定的系統進行改變,并改造情況以實現改進(Dresch等人,2015)。DRS的步驟包括確定問題、定義需求和設計、開發、演示和評估人工制品。

數據收集為人工制品的設計提供了要求。由于單一方法不足以回答研究問題,我們采用了混合方法。文件(Johannesson & Perjons, 2014)是我們的第一個數據來源。我們搜索了其他國家和軍事組織的軍事理論中包含的明確知識。我們在這項工作中研究和引用的所有文件都是不保密的。我們使用的其他方法是觀察和訪談(Johannesson & Perjons, 2014)。我們還搜索了巴西軍官的隱性知識,以了解他們如何進行COA兵棋推演,特別是在教育活動中。

接下來,我們收集并分析了數據,以設計人工制品。我們應用基礎理論(Pandit, 1996)作為定性數據分析的方法。我們設計了一個進行COA兵棋推演的方法和一個概念模型,它描述了COA兵棋推演的結構。數據分析使我們能夠確定關于COA兵棋推演的概念、類別和主張(Pandit, 1996)。建議的人工制品提出了關于跨類別命題的假說。經過幾個周期的數據收集和分析,我們達到了每個工件的目標。在每個周期中,藝術品中提出的假設都由軍事計劃和戰爭游戲的專家進行評估。

以下各小節描述了我們在這項工作中所進行的活動,其中包括審查軍事文件,直接觀察總參謀部軍事學校的兩次訓練演習中的COA戰爭演習,以及采訪參加這些演習的軍官。

圖5:作戰方案兵棋推演概念框架

付費5元查看完整內容

聯合全域指揮與控制(JADC2)是一項長期的工作,旨在連接跨太空、空中、陸地、海洋和網絡領域的軍事資產。美國防部打算讓JADC2分析所有這些領域的作戰數據,使決策者能夠更有效地確定、執行和監測行動。

美國防部正處于開發JADC2的早期階段,并發布了初步指南,包括一項概述廣泛目標的戰略。然而,國防部還沒有確定細節,如哪些現有系統將有助于JADC2,以及未來需要開發哪些能力。一份眾議院報告指示國防部報告整個JADC2工作的范圍、成本和時間表。目前,國防部正處于確定這些內容的早期階段。

2020年4月,美國政府問責局報告了空軍對JADC2的貢獻--先進戰斗管理系統(ABMS)--并建議空軍制定采購和規劃文件。自那時起,空軍已經采取了措施,并確定了兩項ABMS工作:

  • 能力版本1打算部分實現F-35與指揮和控制中心的數據連接,空軍計劃在2024年交付樣機。這與最初的 "能力版本1 "計劃有所變化,該計劃也包括F-22的數據連接。空軍打算更新文件以反映這一變化。

  • 基于云的指揮和控制打算整合各種防空數據源以支持國土防御。空軍計劃在2023年提供初始能力;但是,它正在確定這些能力。

2022年6月,空軍成立了一個公司聯盟,協助制定網絡要求,稱為ABMS數字基礎設施,以實現ABMS工作。此外,在2022年9月,空軍為ABMS建立了一個新的領導結構。雖然這些都是發展ABMS的積極步驟,但空軍迄今尚未交付任何能力,并正在確定未來的能力和交付時間。

報告概括

為了保持對對手的競爭優勢,美國防部(DOD)的軍事指揮官需要一個實時的、完整的戰斗空間圖,以便他們能夠迅速做出明智的決定,指導行動,并監督行動的執行。歷史上,當國防部和軍事部門獲得武器系統時,他們通常優先考慮單個系統的能力,而不是連接性、數據互操作性和各系統的功能兼容性。國防部認識到,其系統現在需要在更復雜的戰斗環境中運行,并需要更多的連接性。國防部打算讓全域聯合指揮與控制(JADC2)來解決這些問題,利用數字環境來分析所有領域的作戰數據,使決策者能夠更有效地確定、執行和監控行動。

先進戰斗管理系統(ABMS)是空軍對JADC2的貢獻。它旨在建立一個數據網絡以連接空軍和太空部隊的傳感器、系統和武器。2020年4月,美國政府問責局發現,空軍在沒有商業案例的關鍵要素的情況下開始了ABMS的開發,如為預算要求提供成本估算。

伴隨著H.R.4350號法案的一份眾議院軍事委員會報告包括了一項由GAO對ABMS進行審查的規定。此外,眾議院戰術空軍和陸軍小組委員會要求GAO對ABMS進行審查,以及它將如何促進國防部為JADC2制定更廣泛的目標。本報告討論了(1)空軍為ABMS能力制定計劃的程度,以及(2)國防部對JADC2的定義。

為了評估空軍在多大程度上制定了ABMS能力計劃,審查了ABMS采購計劃文件,以確定空軍確定了哪些能力,以及開發這些能力的成本和時間表。這些文件包括計劃簡介、采購戰略、需求文件、成本評估和合同文件。GAO還審查了空軍向國會工作人員提供的ABMS狀況簡報。GAO利用美國政府問責局確定的采購領先做法分析了這些文件,以確定空軍計劃是否涉及商業案例的關鍵要素。這些要素包括確定的要求、獲得成熟技術的計劃、成本估算和可承受性分析。

GAO還將這些文件與國防部的采購指南進行了比較,如適應性采購框架主要能力采購途徑和軟件采購途徑,以確定空軍計劃是否包括采購規劃的關鍵組成部分。GAO還確定了空軍為解決美國政府問責局先前關于ABMS的工作中的公開建議所采取的步驟,其中包括開發商業案例的關鍵要素的建議。此外,GAO審查了ABMS合同,以確定空軍計劃如何利用承包商來幫助滿足ABMS的要求。此外,GAO采訪了空軍ABMS的領導和官員,以了解目前ABMS的工作以及空軍計劃如何確定和優先考慮未來的ABMS工作。GAO還討論了空軍辦公室在規劃和執行ABMS工作中的作用和責任。

為了評估美國防部對JADC2的定義程度,審查了關鍵政策、規劃文件、實施指南、信息文件和概述簡報,包括機密和非機密文件。審查了這些文件以確定JADC2的目標、JADC2的管理結構、JADC2官員的角色和職責以及國防部領導層對如何實施JADC2目標的指導。還審查了與每個軍事部門對JADC2工作的貢獻有關的文件,包括空軍的ABMS、海軍部的Overmatch項目和陸軍的Convergence項目。盡管獲得了信息以獲得對 "聚合項目 "和 "超配項目 "的總體了解,但鑒于重點是國防部如何定義JADC2,所以沒有詳細評估這些努力。此外,采訪了JADC2的領導層以及來自國防部長辦公室和聯合參謀部的官員,他們代表了JADC2七個工作組中的四個。討論了國防部在執行JADC2目標方面的進展,潛在的挑戰,以及為應對這些挑戰所采取的措施。此外,采訪了空軍、空軍、海軍、海軍陸戰隊和陸軍的官員,以確定每個軍事部門目前為實現JADC2目標所做的努力,并討論國防部領導層如何為實施JADC2提供指導。

在2021年10月至2023年1月按照公認的政府審計準則進行了這次績效審計。這些標準要求計劃和實施審計,以獲得充分、適當的證據,為基于審計目標的調查結果和結論提供合理依據。所獲得的證據為基于審計目標的審計結果和結論提供了合理的依據。

付費5元查看完整內容

人工智能(AI)是一項具有廣泛用途的新興技術。《美國防戰略》強調了人工智能對軍事行動的重要性,以使美國保持對其近似競爭對手的優勢。為了充分實現這一優勢,不僅要在戰術層面,而且要在戰爭的作戰層面整合人工智能。人工智能可以最有效地融入作戰計劃的復雜任務,方法是將其細分為其組成部分的作戰功能,這些功能可以由狹義的人工智能來處理。這種組織方式將問題減少到可以由人工智能解析的規模,并保持人類對機器支持的決策的監督。

引言

人工智能是一套新興的、變革性的工具,有可能幫助軍事決策者。美國國家戰略將人工智能(AI)納入戰爭。《2020年國防授權法》11次提到了人工智能。國防戰略強調了利用人工智能和機器學習方面的商業突破的重要性。人工智能的軍事用途是保留國家安全的一個引人注目的方式。創造工具來支持戰術行動,如摧毀敵軍和從一個點導航到另一個點,具有顯著和可見的效果,使他們在資源有限的環境中在政治上可以接受。它們在訓練和測試方面的可重復性,使它們在采購過程中成為人工智能系統的快速贏家。然而,戰術行動的范圍和時間是有限的。僅在戰術層面上整合人工智能,忽視了在作戰層面上發生的決定性影響。

作戰,也就是實踐者將戰術行動轉化為戰略效果的層面,取決于領導者做出正確決策的能力。聯合部隊海事部分指揮官(JFMCC)的艱巨任務是制定計劃,將戰區戰略和聯合部隊指揮官(JFC)的目標結合起來,通過決定性的海軍交戰來塑造環境。在人工智能的快速認知能力的幫助下,JFMCC將能夠制定并更徹底地分析行動方案(COA)。這些品質對于未來的沖突是必要的。

人工智能必須在戰爭的各個層面進行整體集成,以充分實現其優勢。除了局部的、短期的戰斗,它還需要應用于主要的行動和戰役,涉及整個戰區的數月或數年。在戰爭的戰役(作戰)層面上的實施,放大了為實現戰略目標而進行的有序交戰和同步行動之間的協同作用。除了技術發展之外,行動上的整合將刺激政策和理論的建立,以使作戰人員有意愿使用人工智能。隨著使用人工智能的經驗的增加,其采用率也會增加。為協助海軍作戰計劃而實施的特定人工智能技術可能與那些用于計算射擊方案或在被拒絕的淺灘水域規劃路線的技術不同。然而,在作戰層面的接受度將推動戰術上的使用。

在JFMCC層面,人工智能系統網絡將為決策者提供決定性的優勢,將專注于作戰功能的獨立的人工狹義智能(ANI)單位統一起來將實現最顯著的好處。首先,人工智能解決方案比它們的通用人工智能(AGI)同行更適合于軍事問題的解決。其次,戰爭的性質促使有必要在作戰層面上整合人工智能。最后,雖然有許多方法可以整合,但沿著功能線這樣做會帶來最顯著的好處。不僅在技術意義上吸收人工智能,而且描述其在政策、理論和培訓中的使用,將使海軍能夠充分使用它,并在與我們的戰略競爭對手的競爭中獲得優勢。

如何在海戰領域整合人工智能?

目前人工智能在海上行動中的最佳應用是將復雜的海上行動問題分解成子問題,由人工智能來解決,并組合成COA建議。解決小問題的人工智能需要更少的訓練數據,有更直接的邏輯,并且可以連鎖起來解決更重要的問題。麻省理工學院人工智能實驗室前主任羅德尼-布魯克斯(Rodney Brooks)認為,創建動態環境的符號表示是困難的或不可能的。然而,特定任務的智能體可以利用足夠的傳感器數據智能地行動,更重要的是,可以連貫地互動。通過將簡單的活動連鎖起來,失敗的風險很低,更復雜的問題就可以得到解決。多個簡單的行動可以在低認知層平行運行,并將其輸出結合起來,為更高層次的復雜活動提供支持。這種結構的優點是允許軍事工程師開發和訓練人工智能,以首先解決可操作的問題。對人工智能開發者來說更具挑戰性的功能可以保留只由人類決定的方法,直到他們產生解決這些問題的專業知識。與其等待一個完整的系統,部分系統將提供一個臨時的邊際優勢。

鑒于人工智能可以通過將問題分解成更小的決策來最好地解決問題,問題仍然是如何劃分這些問題。重述作戰任務的一個模式是將它們分成作戰功能:指揮和控制(C2)、通信、情報、火力、運動和機動、保護和維持。這些作戰功能為開展有效行動提供了基礎。它們為一個行動提供了采用手段實現其目的的方法。因此,與決定如何實施這些功能以實現目標的決策者一起使用人工智能是很自然的。

如同應用于海上作戰戰爭,最低層的決策支持系統將由感知環境的活動組成:探測艦艇、飛機和潛艇;燃料水平;天氣;以及其他客觀的戰斗空間數據。通過將外部輸入限制在特定的、低層次的任務上,該系統將最大限度地減少對抗性例子或旨在消極操縱自動系統的數據的風險。中間層將把下層的輸出與作戰目標和因素結合起來,如時間、空間和力量的限制,以提供解決問題的方法和作戰功能。由于上層的對抗性數據注入的威脅較小,這些系統可以使用深度學習。深度學習是機器學習的一個子集,它不像其他形式那樣需要高度格式化的數據,但計算成本會更高,而且容易受到欺騙。深度學習將增加這一層的人類互動,并暴露出更復雜的關系。最高層將把C2流程應用于其他六個業務功能,以產生業務建議。中間層的每個功能人工智能將向其他功能人工智能和最高C2層提供建議。中間層的人工智能對復雜的數據和相鄰單位及C2功能的建議進行理解。

如果將中間層人工智能納入規劃和指導、收集、處理、分析和傳播的情報周期,將促進收集資產的更好分配。判斷對有限的收集資產的請求以滿足行動和戰術信息需求是JFMCC關注的一個問題。在收集計劃期間,人工智能可以使用已知的對手軌跡、地點、個人和組織來定義和優先考慮指定的利益區域(NAI)。在執行過程中,人工智能可以根據優先級驅動收集路線,就像企業用它來規劃送貨路線以減少勞動力、燃料和維護成本一樣。采集計劃者可以通過增加對手監視點的位置和范圍來減少反偵查的風險。在C2層面,指揮官和情報官員可以利用收集成果來證明更多的JFMCC收集資產和COA的修改。這種方法適用于其他功能。

人工智能可以在部隊部署不斷變化和對手存在不確定的環境中改善維持能力。相互沖突的要求使如何使用有限的后勤資產來滿足作戰人員的需求的決策變得復雜。后勤單位較低的生存能力促使人們決定是將它們帶入被對手防御系統拒絕的區域,還是將戰斗飛船引離目標。人工智能可以利用軍事和民用運輸的可用性、預先部署的庫存和供應商的響應能力來制定船舶和飛機需求的解決方案。企業利用人工智能準確預測需求,并分辨出影響運輸和倉儲的采購模式。維持型人工智能可以使用這個過程的一個變種,來計劃在高級后勤支持站點(ALSS)或前方后勤站點(FLS)的材料堆放。它可以決定如何以及何時使用穿梭船和站立船來運送到攻擊組。機器學習將使用燃料、食品和武器庫存、威脅環、戰備水平和維修時間來訓練維持人工智能。維持型人工智能可以提供比人類單獨完成的更有效的量化解決方案,并將其反饋給其他功能區和C2高層。

C2層將對來自下層的決定進行仲裁,并提供一個統一的建議。就像一個軍事組織的指揮官一樣,它將把其副手AI的建議合并起來。人工智能過程的早期階段使用傳感器數據和其他客觀信息來確定指揮官的方向;決定行動方案需要建立對戰斗空間的理解,這是一種更高層次的欣賞。戰斗空間的可變性和模糊性將使這一層的人工智能元素最難開發。最終,該系統將作為一個可信的智能體,壓縮指揮官負責的信息量。壓縮的信息減輕了時間有限的決策者工作時的疑慮負擔,使她能夠向下屬單位發出更及時的命令。

圖1說明了基于這些原則的系統的擬議架構。以對手預測為例,許多單一用途的ANI將在最低層結合原始傳感器和單位報告數據。它將評估敵方單位的最可能位置。公司分析評論、社交媒體和論壇發帖的情緒,以確定產品的滿意度。同樣地,這個系統將通過公開的言論和秘密的報告來確定對手的意圖。它將評估當前和歷史天氣模式,以評估氣候對敵人行動的影響。這三個輸入和其他信息將被功能情報ANI用來形成對敵方COA的評估。同樣,火力節點將使用敵人的組成、JFC的優先級和預測的彈藥可用性來產生目標指導。中間層節點將橫向傳遞他們的評估,以完善鄰近的建議,如部隊保護水平。獨立的功能建議也將直接反饋給C2層,以創建整體行動方案。

圖1. 海上人工智能系統的擬議架構

建議

首先,利用聯合人工智能資源的優勢,針對海軍的具體問題修改標準組件。擅長開發軍事人工智能系統的工程師的稀缺性將限制新系統的開發。美國防部的人工智能戰略具體規定了建立通用的工具、框架和標準,以便進行分散的開發和實驗。使用這些現成的組件,為人工智能決策網的所有子系統創建低級別的系統和標準接口。將海軍的資源集中于采購和實施用于海事具體決策的中層和高層系統。避免技術上令人著迷但無效的解決方案,并通過將職能領域的專家與設計團隊相結合來保持解決海事問題的目標。

第二,創建并維護可通過機器學習攝入的作戰數據數據庫,以訓練海軍人工智能。實施能夠在海上作戰中心(MOC)讀取和集中匯總基本作戰數據報告的技術和工藝,如燃料狀態、導彈裝載量。開發記錄和定性評分作戰決策結果的方法,如對手態勢的變化、傷亡修復率和公眾對行動的反應。將輸入與作戰決策和結果聯系起來的數據庫將加速開發符合現實世界標準的系統。

第三,將人工智能的使用納入政策和條令。條令應該編纂人工智能可以被整合到戰爭戰役層面決策中的領域。明確地說,關于情報、行動、火力、后勤、規劃和通信的海軍作戰出版物應說明人工智能在決策過程中產生優勢的地方和方式。描述海上聯合行動的聯合出版物應明確說明如何將JFC的要求解析為JFMCC的AI系統。如果國防部和海軍的政策對指揮官因整合人工智能的決策建議而產生的責任量進行了定性,那么他們在使用人工智能時就可以采取經過計算的風險。讓指揮官和作戰人員掌握使用人工智能的戰術、技術和程序將加速其在艦隊中的應用。

付費5元查看完整內容

軍隊為訓練、規劃和研究目的進行兵棋推演。人工智能(AI)可以通過降低成本、加快決策過程和提供新的見解來改善軍事兵棋推演。以前的研究人員根據強化學習(RL)在其他人類競技游戲中的成功應用,探討了將強化學習(RL)用于兵棋推演。雖然以前的研究已經證明RL智能體可以產生戰斗行為,但這些實驗僅限于小規模的兵棋推演。本論文研究了擴展分層強化學習(HRL)的可行性和可接受性,以支持將人工智能融入大型軍事兵棋推演。此外,本論文還通過探索智能體導致兵棋推演失敗的方式,研究了用智能體取代敵對勢力時可能出現的復雜情況。在越來越復雜的兵棋推演中,對訓練封建多智能體層次結構(FMH)和標準RL智能體所需的資源以及它們的有效性進行了比較。雖然FMH未能證明大型兵棋推演所需的性能,但它為未來的HRL研究提供了啟示。最后,美國防部提出了核查、驗證和認證程序,作為一種方法來確保未來應用于兵棋推演的任何人工智能應用都是合適的。

引言

兵棋推演是成功軍隊的寶貴訓練、規劃和研究工具。自然,美國(U.S.)國防部(DOD)計劃將人工智能(AI)納入兵棋推演。將人工智能融入兵棋推演的一種方式是用智能體取代人類玩家;能夠展示戰斗行為的算法。本論文研究了用智能體取代人類兵棋推演操作員的可行性、可接受性和適宜性。為此,本章解釋了為什么兵棋推演對成功的軍隊至關重要。

A. 軍方為什么要進行兵棋推演

軍隊進行兵棋推演是為了回答關于戰爭的關鍵問題,這些問題必須在實際沖突發生之前被理解。兵棋推演是利用對立的力量模擬實際的戰斗,并由人類的決策來決定[1]。雖然有廣泛的不同類型的兵棋推演,但它們都有一個共同的目標:"獲得有效和有用的知識" [2]。這種劃分很重要,因為兵棋推演的不同目的會導致玩家和游戲控制者的行為不同。圖1顯示了兵棋推演從訓練到分析到實驗的廣泛范圍。

1.訓練用的兵棋推演

最直接的兵棋推演類型是用于訓練的兵棋推演。大型參謀部使用建設性的模擬(數字兵棋推演)來鍛煉他們的參謀過程,并驗證他們的軍事準備。小型參謀部使用虛擬模擬器來訓練他們的戰斗演習和船員演習。軍隊進行這些兵棋推演是為了了解戰爭和鍛煉決策能力[3]。所有隊員的行動和決策一般都要符合已知的條令和戰術、技術和程序(TTP)。對于大型的參謀部演習,對手可能會突破TTP的界限來挑戰參謀部(例如,表現得更有侵略性,但仍然依賴相同的TTP)。

2.用于分析的兵棋推演

兵棋推演可用于分析,即 "確定在部隊對抗中會發生什么"[3]。這些是大多數軍事人員所熟悉的兵棋推演類型:作為行動方案(COA)分析的一部分而進行的兵棋推演。這些類型的兵棋推演允許對戰爭計劃、部隊結構或理論進行評估。在這些戰役中,雙方都要采用已知的理論和TTP,但 "在這些戰役中,創新精神可以自由發揮"[4]。

3.實驗性的兵棋推演

在譜的另一端是實驗性兵棋推演。在這些戰役中,雙方都可以使用新的力量、武器和/或戰術來探索潛在的未來戰爭[5]。歸根結底,組織進行實驗性兵棋推演是為了產生 "關于戰爭問題性質的知識"[2]。美國軍方在演習中整合了這些類型的兵棋推演,如美國陸軍未來司令部的聚合項目和聯合作戰人員評估。

4.兵棋推演的好處

盡管兵棋推演既不是預測性的,也不是對現實的完全復制,但它們確實提供了一些沒有實戰就無法獲得的東西:對戰爭中決策的洞察力。當為訓練而進行戰爭演習時,組織正在學習良好的決策是什么樣子的(包括過程和最終結果)。當為分析而進行戰爭演習時,計劃者正在評估他們在計劃期間做出的決定,以及在執行期間需要做出的潛在決定。

這些好處足以讓美國防部副部長羅伯特-沃克在2015年發布了一份備忘錄,呼吁在整個美國防部重新努力開展兵棋推演[6]。沃克副部長認為,兵棋推演有利于創新、風險管理和專業軍事教育。沃克認為,最終,兵棋推演將推動美國防部的規劃、計劃、預算和執行過程,這是告知國防部資源分配的方法。美國和它的西方盟友并不是唯一相信兵棋推演好處的軍隊。中國正在為兵棋推演投入大量資源,包括將人工智能融入兵棋推演[7]。

B.兵棋推演中的人工智能

人工智能提供了一個機會,通過降低成本、加快決策過程和提供新的見解來改善軍事兵棋推演。為兵棋推演中的許多角色雇用人類操作員是昂貴的。組織必須給自己的人員分配任務(使他們脫離正常的職能)或支付外部支持。這種成本可以通過將人工智能整合到兵棋推演中而消除。兵棋推演分析的速度只能和人類操作者一樣快。用智能體代替操作員可以加快兵棋推演的速度,并允許多個兵棋推演同時發生,從而實現更廣泛的分析。最后,智能體因其在游戲中的創造性而受到關注[8]。創造性的智能體可以通過探索人類戰爭者可能沒有考慮的可能性,使戰爭計劃、部隊編隊或戰術得到更好的分析。

美國國內的國家安全組織認識到將人工智能融入兵棋推演的潛力。人工智能國家安全委員會在其最終報告中主張立即將人工智能能力整合到兵棋推演中,以確保美國及其盟友保持與同行的競爭力[9]。美國陸軍未來的模擬訓練系統--合成訓練環境(STE)設想整合人工智能來監測和調整訓練場景的難度[10]。美國陸軍研究實驗室有許多項目在調查人工智能與軍事指揮和控制系統的整合。具體來說,他們正在探索使用人工智能的一個子領域,即強化學習(RL)來進行連續規劃,以開發 "藍色部隊的新計劃"[11]。連續規劃將需要一個能夠評估其計劃的智能體,可能通過兵棋推演。

基于其他RL智能體在人類競技游戲中的成功,如《星際爭霸II》[12]、《古人防御》(DotA)[13]和圍棋[14],多名研究人員正在研究用于戰爭游戲的RL智能體。像《星際爭霸II》和DotA這樣的實時戰略(RTS)游戲最能代表兵棋推演。與兵棋推演類似,RTS游戲需要在有限的信息環境中進行長期的目標規劃和短期的戰術決策。以前的研究表明,RL智能體可以在兵棋推演中復制理想的戰斗行為[5], [11]。根據Kania和McCaslin的說法,谷歌的AlphaGo成功擊敗了世界上最好的圍棋大師,證明了人工智能可以應用于兵棋推演[7]。

C. 問題陳述

雖然以前的研究已經證明RL智能體可以產生戰斗行為,但實驗僅限于小型交戰。研究人員只要求RL智能體控制三到五個下屬單位。強化學習智能體將需要成功擴展,以滿足涉及幾百個單位的大型兵棋推演的規模要求。

問題是,隨著兵棋推演中單位數量和類型的增加,信息量和可能的動作數量變得難以解決。Newton等人提出可擴展性是一組目標:速度、收斂和性能,同時保持在一組約束條件下:隨著項目規模的增加,成本、計算能力和時間[15] 。分層組織是擴展的一種方法。本論文將研究分層強化學習(HRL)的可擴展性。換句話說,任何可行的、可接受的人工智能集成到戰爭游戲中,隨著戰爭游戲中單位數量的增加,必須仍然顯示出理想的戰斗行為。

除了將人工智能整合到軍事兵棋推演中的可行性和可接受性之外,這種整合還需要是合適的。開發和執行一個失敗的兵棋推演是有可能的,因為從中得出的知識是無效的或沒有用的。Weuve等人[16]解釋了可能導致兵棋推演失敗的不同途徑,他們稱之為兵棋推演病癥。以取代人類操作者為目的的智能體的設計和實施,需要防止兵棋推演的病態,從而確保有效的結果。

這導致了以下的研究問題。HRL是否允許智能體在不損失性能的情況下增加合作單位的數量和有效性?什么框架可以確保智能體的設計和應用正確,以滿足兵棋推演的目的?

D. 研究范圍

本論文延續了[17]和[18]對Atlatl戰斗環境中RL的調查。Atlatl是一個離散的、基于六邊形的兵棋推演,模擬陸地作戰行動。最初的研究使用一個簡單的多層感知器[17]成功地在RL智能體中產生了戰斗行為。隨后的研究使用卷積神經網絡(CNN)架構在復雜的地形和動態的對手中研究RL智能體[18]。

雖然有廣泛的HRL方法,但本研究的重點是封建多智能體層次結構(FMH)。在FMH中,一個單一的R智能體(即經理),將任務分配給一系列被稱為工人的下級RL智能體[19]。本論文比較了在Atlatl中越來越大的場景中采用基于規則的智能體、單一RL智能體和FMH所需的資源和有效性。

兵棋推演是由玩家和裁判員組成的[1]。友軍單位的玩家被稱為藍軍,他們的對手被稱為紅軍,任何一個玩家之外的平民或軍事單位被稱為綠軍。雖然有可能通過使用所有玩家和裁判員的智能體來實現兵棋推演的完全自動化,但本論文只評估了對單個玩家的替換。

本論文還研究了用智能體替換對方部隊(OPFOR)即紅色部隊時可能出現的復雜情況。討論了具體的兵棋推演病癥,并提出了緩解這些病癥的方法。美國防部的驗證、核實和認證(VV&A)框架被應用于通過RL對OPFOR的建模。

E. 研究結果

本論文發現,當FMH智能體以分布式方式進行訓練時,FMH智能體未能比單一RL智能體表現得更好。當經理和工人在同一環境中訓練時,FMH智能體的學習能力有所提高。然而,工人的不一致行動使經理無法制定最佳策略。此外,FMH的訓練要求超過了單個RL智能體的要求,這抑制了FMH擴展到大型軍事兵棋推演的能力。最后,本論文發現,將人工智能整合到軍事兵棋推演中的方法適合于像美國防部的VV&A框架那樣的過程。否則,基于模型的去太原的病癥會使兵棋推演的目標失效,并對美軍產生負面影響。

F. 論文對研究的貢獻

本論文通過進一步研究在建設性模擬中采用完全自主的智能體,對美國政府有直接好處。完全自主的兵棋推演智能體,能夠在多個層次上運作,需要支持兵棋推演的全部范圍。這很容易延伸到軍事規劃期間的決策支持工具,協助規劃者快速評估不同的COA。此外,探索在兵棋推演中使用智能體的適宜性將促進兵棋推演界采用人工智能。

付費5元查看完整內容

摘要

美國海軍在實現海上作戰空間自動化的過程中面臨著挑戰,并有可能落后于其崛起的大國競爭者--中國人民解放軍海軍(PLAN)。美國海軍和中國人民解放軍海軍是如何采用自動化來改善海軍情報、監視和偵察(ISR)的?這項研究的結果表明,美國海軍是一個創新者和早期采用者,而解放軍海軍作為一個后期現代化者接受了自動化系統和人工智能(AI),受益于已經存在的相關技術知識。美國海軍的宙斯盾和艦艇自衛系統以及人工智能技術能夠實現海上優勢;然而,中國海軍在人工智能技術方面的進展比美國海軍快。這篇論文比較了兩支海軍在ISR方面采用自動化和人工智能技術的情況。在本研究中,自動化被定義為一個過程或特定的、以任務為導向的系統,它的運行不需要人類的直接控制。人工智能更深入,包括旨在創造能夠分析、評估和優化備選方案以追求更廣泛目標的機器技術。采用了埃弗雷特-羅杰斯的擴散過程S曲線模型,作為分析海軍規劃者和決策者提高效率的框架,因為他們正在考慮采用哪些自動化和人工智能技術以及如何最好地利用它們。

1. 簡介

自動化和人工智能(AI)的發展將影響未來的海權。2017年7月8日,中國表示,目標是建立一個國內的人工智能產業,并在2030年之前使國家成為"人工智能的創新中心"。2019年2月11日,唐納德-特朗普總統簽署了13859號行政命令,以保持人工智能的領導地位,并體現美國的價值觀。雖然這些戰略已經公布,但在海軍事務中采用自動化的速度仍然緩慢。在美國海軍作戰部長2018年的文章《海上優勢的設計》中,海軍作戰部長的首要任務是設計未來的綜合海軍力量結構,并 "全員上陣,使杰拉爾德-R-福特號(CVN 78)盡快準備好作為戰艦。"而中國人民解放軍旨在向未來的 "智能化戰爭 "發展。人工智能超級大國的海軍競相采用自動化和人工智能技術進行持久的情報、監視和偵察。這篇論文比較了兩個關鍵的自動化傳感器--美國宙斯盾和中國348型 "龍眼"的技術采用情況,以及它們如何改進海軍的情報、監視和偵察(ISR)

自冷戰以來,海上優勢已經開始依賴來自相互連接的ISR平臺的自動化預警系統。在美國和當時的蘇維埃社會主義共和國聯盟(USSR)之間,海上指示和警告(I&W)的自動化被大量嵌入常規海軍能力。蘇聯解體后,中國穩步崛起,并一直在尋求使用人工智能(AI)來增強其軍隊的認知能力,速度越來越快,特別是在未來的海權方面。航空母艦、海軍飛機和潛艇之間的自動化通信鏈路,稱為Link-11或Link-16,允許人類操作員通過互聯網計算機系統即時發送信息。

這項研究的重點是美國海軍和中國人民解放軍海軍(PLAN)采用基于自動化的平臺。海軍ISR平臺的例子包括:船舶自動化、有人和無人系統、空中偵察衛星、可視化識別和定位海上平臺的計算機系統。這個話題很重要,因為有三個關鍵因素:快速人工智能技術研發的政策;大國競爭(GPC)的回歸;以及減輕不確定性和增強判斷力的需要。然而,先前的地緣政治事件表明,由于設備的錯誤配置和人為錯誤,自動化系統可能容易出現錯誤的、非結構化的或無監督的數據。在正確的時間、正確的地點接收正確的數據,對于了解未來海權自動化的采用至關重要。

本研究關于關鍵領域的范圍包括:自動化戰略;輔助決策(速度);以及使自動化工具發揮作用的空間關鍵情報系統。對采用自動化的影響的概述是以美國和中國的國防和政策戰略文件為界。將討論采用關鍵情報系統的戰略意義。

采用和駕馭當今的自動化技術是至關重要的。對新興技術的技術采用有賴于頻繁的軟件更新和兼容的硬件來成功運作;否則,系統將不能按預期或最初的設計運作。另一種方式來概念化這個采用和整合2020年的技術的過程,就是思考將現代藍牙揚聲器或收音機整合到20世紀80年代的車輛中;可能的,但試圖整合不兼容的軟件或硬件將是有代價的,很可能會出現故障并導致不兼容,這就是在海軍ISR平臺上部署或采用自動化系統或AI工具之前缺乏冗余的測試。

1.1 研究問題

美國海軍和中國海軍(PLAN)是如何采用自動化技術來改善海軍ISR與 "宙斯盾 "和348型雷達傳感器對未來海權的影響

1.2 背景介紹

半個世紀前,美國陸軍參謀長威廉-C-威斯特摩蘭將軍對未來戰爭的看法在今天看來是正確的。1969年10月14日,他在美國陸軍協會的演講中指出

  • 在未來的戰場上,通過使用數據鏈、計算機輔助的情報評估和自動火力控制,敵軍將幾乎在瞬間被定位、追蹤和鎖定......有了可以持續追蹤敵人的監視裝置,用大量的部隊來固定對手的物理位置的必要性將變得不那么重要。

威斯特摩蘭將軍概括了采用持續監視、跟蹤和瞄準的設想,用計算機即時跟蹤敵人。

著名的斯坦福大學計算機科學教授、人工智能開發者和企業高管安德魯-吳(Andrew Ng)認為,就像一個多世紀前電力幾乎改變了一切一樣,今天很難想象在未來幾年內有哪個行業不會被人工智能所觸及。他的愿景似乎正在實現,今天提供海上態勢感知的軟件程序被稱為共同作業圖像(COP)。美國國防公司雷神公司開發的COP是為了以近乎實時的方式直觀地顯示海軍的空中、陸地和海上平臺。屏幕上的圖片點根據其獨特的標識符或指紋來識別和定位海上的海軍平臺,這也是GPS在地圖上的顯示方式。這是一種人工智能的應用形式,其中自動化催化了這個過程,并簡化了飛機、水面艦艇、潛艇、地面站和衛星之間的數據流。

自20世紀50年代以來,杰出的領導人已經研究并在海軍事務中采用了海上平臺的模式識別及其相關的雷達信號或信號。對于海軍ISR來說,一種被稱為基于活動的情報(ABI)的軟件程序是 "一種分析方法,它圍繞人、事件和活動的相互作用,迅速整合來自多個情報源和來源的數據,以發現相關模式,確定和識別變化,并對這些模式進行定性,以推動收集和創造決策優勢"。

根據海軍研究生院(NPS)計算機科學家Joshua Kroll教授的說法,自動化是根據一套既定的規則對一個過程進行操作,這些規則被稱為一套顯性和隱性的規范。這些規則可以非常簡單,也可以非常復雜,由人類和機器以各種方式實施。這些規則在軟件程序中以 "如果,那么"的邏輯實現和編碼,然后可以與機械功能相配合,通常與人配合。自動化是有益的,因為它在機械或視覺上使一項任務自動化,同時避免了人類的弱點,如疲勞和不專心。

自動化和人工智能是不完美的,有時會有特定的錯誤。系統規則或規則的輸出可能不正確或不完整,它可能導致災難性的事件,導致自動化的研究停止或暫停。人的錯誤在系統錯誤中也會有很大一部分。

使海上數據流自動化的海軍傳感器已經推動了海軍運營商和戰略家為未來的海上戰斗空間重塑人工智能的采用。美國防部(DOD)的人工智能戰略已經加快了 "采用人工智能和創建一支適合我們時代的部隊。"簡單地說,使用有效的傳統技術是有價值的,但了解人工智能超級大國如何采用改變游戲規則的技術,對于改善海軍ISR至關重要。采用自動化的合適方式圍繞著知識、訪問和時間來進行相關和準確的預警。

第二種方法是定義和理解自動化和人工智能的文獻,包括其在社會各部門的看法。對自動化沒有一個公認的具體定義。我的方法將是概述來自政府、軍事、公共和私人的標準定義,并將他們的定義與計算機科學家等技術專家進行比較。當人們說或聽到人工智能這個短語時,各種想法和圖像就會出現在腦海中--從摧毀對手的致命自主武器或殺手機器人到不那么嚇人的圖像。對人工智能的看法可以從想象水手們坐在船上的電腦屏幕前到蘋果的Siri或亞馬遜的Alexa技術。對自動化的看法可以是簡單的流水線,到自動精簡信號以控制信息流,并納入數字地圖以顯示船只、飛機和潛艇的位置。定義取決于你問誰。

第三種方法是分析今天有關人工智能超級大國之間海軍ISR的自動化和人工智能能力。

第四種方法是構思和描述采用自動化加上人工智能新興技術的設計方法,這些技術可以在不到六個月的時間內被回收、重復使用和轉身,從而擁有為海軍ISR采用自動化的長期戰略的優勢。這種不規則的方法將納入有效性和性能的措施,并有一個苛刻的時間表,其中包括積極的、及時的和道德的標準。

1.3 研究方法

本論文方法將是開發一個適應性模型,用于比較分析今天美國海軍和中國海軍之間的自動化和人工智能能力,包括其海軍的空軍部分。我們的目標是產生一種研究方法,為參謀長聯席會議主席提供精確和簡明的指標和衡量標準,以便其啟發式地觀察和吸收,在今天采取行動,并在人工智能軟件開始超越現有技術時重新調整方向。在第二章中,對自動化和人工智能的文獻回顧進行了定義,海軍ISR的技術方面對于討論、概念化和在本論文中使用一個簡單的工作定義是必要的。

除了定性分析,定量分析將通過對有貢獻的行業公司(私營和公共)的網絡分析來進行,以追求為高層決策和反饋系統開發一個采用框架。混合方法的目的是為了確定情報、監視和偵察的自動化做法。對ISR自動化的徹底分析將使我們更好地了解海上戰場ISR的當前趨勢和限制。值得注意的是,采用的理論通常是基于組織或用戶;因此,將討論兩者。將使用埃弗雷特-羅杰斯(Everett Rogers)的擴散過程的S型曲線模型,研究在過去50年里ISR采用自動化的水平。

這篇論文將包括三個具體的自動化系統,它們可以連接到兩個重點自動化傳感器和兩個海軍采用的云服務來存儲ISR數據。這些系統包括無人潛航器(UUVs)、無人駕駛飛行器(UAVs)。除了美國防部企業范圍內的云解決方案,美國還整合了聯合企業防御基礎設施(JEDI)云計劃,這可以提高海軍ISR支持,并與中國保持同步。關于解放軍的云服務發展計劃,已知的公開信息很少。然而,在2017年,與解放軍合作的中國科技部招募了互聯網巨頭百度、阿里巴巴集團控股公司和騰訊控股--也被稱為BAT--用于云計算。

埃弗雷特-羅杰斯1962年的擴散過程S曲線模型將有助于更好地理解當前的采用方法。例如,美國國防采購系統(DAS)和聯合能力整合與發展系統(JCIDS),以及根據DODI 5000.2的2020年中層采購(MTA)途徑是美國技術采用的采購模式。還將使用定量措施來聯系相關公司的空間和時間網絡分析,私營和非營利公司,可以積極和消極地促進自動化的采用。其目的是可能揭示公司的專有權利和它們之間的距離或分離度,這可能顯示出未來海軍ISR的方法和整體采用過程中的弱點。

作為第三章的案例研究,將提供埃弗雷特技術采用的S型曲線的概述和一個逐步的過程,以幫助海軍ISR采用自動化和AI的過程。其他可提及的擁有采用自動化系統或AI工具的AI戰略的國家將在本論文中簡要討論,它們是英國、俄羅斯、法國、伊朗和韓國。

1.4 技術采用理論

幾十年來,技術背景下的采用理論一直是研究人員、商業和工業界的焦點。現代術語 "采用 "源自羅馬的一種采用形式,即adoptio。這個15世紀末的法語和拉丁語短語adoptare來自ad,意思是 "到",optare意思是 "選擇"。簡單地說,人們可以選擇一個無生命的物體、人、地方或事物,或者選擇改變,或者不改變。

技術采用的S型曲線代表了一個理論框架,幫助概念化一個人或一個組織如何成功或不成功地采用一項技術。根據美國傳播理論家和社會學家埃弗雷特-羅杰斯(Everett Rogers)的觀點,創新技術的成功采用發生在一個分布式的鐘形曲線上,呈S型,它是由擴散曲線在時間和常態方面得出的(圖1)。采用系統的五個類別是。(1) 創新者;(2) 早期采用者;(3) 早期多數;(4) 晚期多數;(5) 落后者。了解S型鐘形曲線的各個階段對成功采用新興技術非常重要。

圖1以水平和拉伸的 "S "形式描述了技術采用率,采用率在Y軸上,時間在X軸上。這意味著,當一項技術最初被采用時,無論是技術還是市場條件,都需要幾年的時間來調整或發展到達到一個拐點,以實現快速采用。

圖1. 擴散過程的S型曲線模型

當市場開始飽和時,曲線就會變平,技術的后期采用者在飽和點上采用新興技術并融入競爭環境已經太晚了,這就是落后者的位置。海軍領導層會發現這一點很有用,因為這意味著最好是在S型曲線的拐點上,而不是在它的起點或終點。

隨著人口的增長,自動化和人工智能新興技術也將增長。S型曲線思想的歷史始于19世紀,其動機是為了了解更多關于人類的成長。羅杰斯的S型曲線采用理論是基于Logistic函數作為人口增長的模型,該模型由比利時數學家Pierre-Francois Verhulst在1839年首次提出。Verhulst將這一理論與人口增長聯系起來,最初他的想法來自英國人和政治經濟學家托馬斯-馬爾薩斯在1789年的《人口原理論》。在這一時期,人們擔心人口增長超過食物供應,以及未來養活人口的問題。從1950年到今天,美國的人口增長從3.3億美國公民增長到14億中國公民;促成了目前77.6億的人口,而且還在不斷增加。人類人口越是增長,對知識的渴求就越有可能,不僅是人類,還有自動化和AI。人們希望有更多的自動化系統,并采用人工智能技術,因為它們通常比人類更快,可以消耗更多的數據,同時提供智能和監控,有時某些技術只是使用起來很有趣。

S型曲線采用理論的一個重要推論是,海軍應該在已經成長并經歷過失敗的技術上建立公司,以實現成功采用。一些技術包括AlphaGo深度學習系統和IBM的DeepMind子公司谷歌,用于下圍棋的戰略游戲,或稱圍棋。2016年,計算機系統AlphaGo擊敗了韓國特級大師李世石。對于這兩個人工智能超級大國的海軍來說,這種模擬游戲直接關系到美國海軍和解放軍海軍之間的傳感器和計算機系統如何在海上戰場上相互學習。技術的采用和增長可以很好地轉化為生命周期模式,并以長期的累積增長來衡量。

自20世紀50年代以來,自動化技術的增長并不令人驚訝,而且是不完善的。根據Modus的說法,S型曲線 "來自于一個定律,即增長速度與已經完成的增長量和有待完成的增長量成正比"。就像生命周期--出生、成長、青春期或成熟和死亡的時期一樣,S型曲線階段作為減速、加速、換檔或完全停止并重新開始的關鍵機制。不是每一個為ISR設計的特定海軍傳感器或計算機系統都能實現對海上戰場的完美了解。

這種觀察在商業領域得到了認可和利用。谷歌前首席執行官和國防部顧問委員會的董事會成員埃里克-施密特認為問題是直接的。他認為,如果我們建立可靠的系統,在其中了解故障模式和錯誤率,計算機視覺是很容易理解的。通過宙斯盾接收、分析和傳播信息和情報,計算機系統與傳感器的連接有時間差,這在年輕的操作人員中產生了公認的挫折感,他們設想計算機系統和人工智能應用,就像高分辨率的視頻游戲,是采用自動化的一個弱點。

人類使用自動化軟件應用來解決問題。重要的是要明白,自動化目前沒有能力進行智力評估。人工智能模擬了人腦的認知功能和計算機視覺顯示數據。在美國海軍中,機器背后的人類操作員使用基于規則的自動化系統,該系統顯示雷達信號。靜止的數據--計算機中沒有被使用或操作的數據--被限制在輸入的數據量中。

采用理論的變化是不可避免的。與美國歷史學家Elting Morison的研究和反思過程相似,自動化的采用主要圍繞著四個不同的部分:"任何機械變化的起源點的初始條件;變化的主要代理人的特點;那些抵制變化的人的性質;以及促進適應所引入的變化的手段。"不理解和忍受這些部分,就不能超越現有知識體系的門檻。

在2020年,我們處于另一個巨大的技術發展和GPC回歸的時代,通過這個時代維持未來的海權取決于在網絡空間的第四維度的優勢。俄羅斯總統弗拉基米爾-普京曾經說過:"人工智能是未來,不僅是俄羅斯的,而且是全人類的。它帶來了巨大的機會,但也有難以預測的威脅。誰成為這個領域的領導者,誰就會成為世界的統治者。"自動化簡單的任務和采用人工智能工具,即使是傳統的系統,也需要改變今天的GPC和國家安全。

5 總結和建議

5.1 前言

這篇論文試圖比較美國和中國海軍采用自動化和人工智能進行海軍ISR的不同方式。將具體的自動化工具--宙斯盾、SSDS和346型--如何改善現代海上戰斗空間的問題進行了概念化。第二章概念化了自動化一詞--一種技術、過程或系統,機器通過它來實現一個特定的目標--和人工智能,一個更雄心勃勃的概念,提出了分析和評估能力。第三章描述了羅杰斯的技術采用的S型曲線,并建議總共有五類采用者來規范采用者類別的使用。這種方法很重要,因為如果沒有這種方法,在采用過程中,將想法討論和將適當的技術歸類到其適當的時間表是至關重要的。第四章展示并分析了兩國海軍采用自動化和人工智能海軍ISR平臺和軟件的方式。盡管美國海軍在海上優勢和空中優勢方面一直保持著主導地位,但中國海軍在主導人工智能以獲得未來的海權方面正在快速接近。

這篇論文包含一個七步戰略和設計過程,適用于簡單、復雜和特別復雜的自動化或人工智能應用的技術采用。這個理論過程可以幫助確定海上戰斗空間中成功的海軍ISR實踐所需的主要需求和材料。人、材料和物理空間代表了關鍵要素。本研究的理論框架確定了五個關鍵的技術采用能力:早期和季度的 "篝火談話";有遠見的思想領袖;宏偉的戰略敘事;設計一個人工智能發展計劃;在計算機技術材料資源方面的領先;以及,為人工智能工程專家和海軍知識專家建立一個即時的和用戶友好的平臺。

本章涵蓋了調查結果的總結、人工智能的差距、倫理和人工智能、對美國海軍的建議,以及涉及海軍ISR的人機合作的自動化和人工智能工具的未來工作。

5.2 調查結果摘要

弗蘭克-巴納比提醒我們,"軍事技術正在使戰爭自動化。"目前的趨勢顯示,無疑是自動化處理、融合和產品交付,用于指揮和控制海上戰斗空間。我開始對自動化和人工智能應用于海軍ISR的調查,以更好地了解兩國海軍采用的機制和類別,不僅使每個海軍成為偉大的競爭對手,而且使其部隊成功的海軍人工智能力量有哪些特點和技術。

如果指揮官被信息或情報淹沒,海軍ISR技術采用的S型曲線的結論可能很重要,相反,可以刺激一種新的文化,采用自動化和人工智能的混合方式,將早期采用者與后期采用者折疊在一起。根據谷歌前首席執行官埃里克-施密特的說法,"美國防部有一個創新采用的問題",應該對軟件系統采用DevOps,或開發運營的文化,并專注于 "客戶采用 ",文化發展的中心是用戶或戰術操作員和在兩國海軍中服務的AI工程師。例如,中國人民解放軍有一種采用技術較晚的發展文化。后期采用者或落后者可以從早期創新者的成功和失敗中獲益,因為這類采用者專注于采用和 "復制 "成功的技術,并觀察到哪些技術的失敗不被采用。

圖20表明,這兩支海軍作為近似的競爭者,在采用自動化方面是成功的;然而,它們處于曲線的兩端。這意味著美國海軍代表著創新和早期采用,而解放軍海軍代表著海軍ISR任務中采用技術的后來者。

圖20. 美國海軍創新者和采用者與中國人民解放軍后期采用者在S型曲線上的對比

這兩個大國競爭者似乎都在采用技術的前向或后向思維方式中共存并完成波長,但政治制度會影響采用技術的速度,無論是創新者還是后來者。

5.2.1 人工智能有利于專制的海軍

自動化和人工智能技術的采用速度往往有利于專制社會。根據中國的人工智能戰略,中國的計劃是通過快速發展人工智能成為全球創新中心,加強中國在采用自動化進行海軍ISR方面的領先地位。"中國的人口超過14億公民,大約有29萬解放軍人員,這大約相當于解放軍230萬人員的12.6%。自2018年以來,中國發表了約42.64%的頂級人工智能論文,約52%的人工智能全球專利,在人工智能公司中排名第二,有超過1011家公司,而美國的人工智能公司有2028家。"在私營部門,中國利用百度、阿里巴巴和騰訊(統稱為BAT)來推動人工智能的發展。中國擁有開放社會中較多人口的優勢,可以協助清理數據,開發或復制算法,并利用開源數據和社交媒體收集和監視海上的海軍平臺。也許,開發人工智能的公司和中國之間的強大反饋回路對軍隊來說是天作之合。

5.2.2 自動化和人工智能:國際海事治理的變化

此后,解放軍海軍能夠利用并聲稱擁有一種新的海事治理模式,并迅速接近其在人工智能方面的主導地位。中國已經開始在采用自動化方面超越美國海軍。在中國清華大學最近關于人工智能發展的工作中,中國國家人工智能政策演變的第五階段(2017年至今)顯示了下一代人工智能在軍事、工業和民用部門中的特點。自2013年以來,解放軍和中國建設和軍事化了其自造島(即,在第一個島鏈內,解放軍擁有 "主場 "優勢,可以監視和維護其在SCS有爭議島嶼周圍12海里的區域。解放軍繼續使用東雕級AGI船來了解美國的海軍事務。作為后來者,解放軍海軍將有可能 "復制 "美國海軍所展示的成功海軍ISR戰術和行動。

中國正在通過收集大量的數據,在人工智能方面領先于美國海軍的間諜船、偵察衛星和OTH雷達。摩爾定律,即每塊硅芯片的晶體管數量--計算處理能力每兩年翻一番,導致快速增長和生產力。中國正在利用收集從海上到太空資產的大量數據的優勢,生產高質量的數據。如果計算機處理能力每兩年翻一番,那么用長期收集的高質量數據進行過濾的難度就會降低,并且更容易在中央數據存儲(即云)中找到。

隨著中國繼續在當地和全球建立更多的網絡基礎設施,它顯示了它愿意為長期優勢承擔短期風險。另一個長期接受的因素,梅特卡夫定律,斷言完全連接的網絡的價值增長與兼容通信設備數量的平方成正比。例如,如果一個網絡有五個節點完全相互連接,每個節點的固有價值是x,它的力量是100倍(由于它有十個不同的鏈接),而單一鏈接的網絡的力量是5倍。雖然網絡的價值增加了兼容通信,但如果競爭對手破壞或黑掉其中一個節點,它也會增加網絡安全問題。解放軍的愿意承擔計算機網絡攻擊的風險,在人工智能方面占據主導地位,以實現長期戰略。

5.2.3 美國海軍的先發優勢:半導體和軟件

然而,美國在人工智能方面的領導地位已經超越了美國沿海地區,擁有比中國更多的海軍人員,并領導著建立網絡基礎設施所需的物質資源。雖然美國人口為3.294億,低于中國的總人口,但美國海軍有339,448人,比中國海軍人數多。美國海軍在采用人工智能技術方面具有先發優勢,不僅僅是因為它的人數比中國海軍多,而是因為美國在頂級人工智能公司方面處于領先地位。具體來說,美國的人工智能公司集中在企業軟件、半導體和量子計算方面。

然而,美國海軍與工業界或私營公司的聯姻可能會帶來重大問題,并與那些不或不堅持用人工智能支持軍隊的人工智能工程師產生摩擦。美國人才來自于硅谷、聯合人工智能中心、國防部的項目,如DARPA、DIU和NavalX。然而,谷歌、臉書和亞馬遜等頂級人工智能公司因隱私權問題受到批評,公眾對人工智能武器化的看法造成了無縫合作的問題。即使美國海軍和國防部在與硅谷合作,在60至90天內完成商業人工智能工具的原型制作并投入使用時,似乎在人工智能的某些方面處于領先地位,但這并不適用于所有海軍ISR平臺。美國海軍司令部可能能夠利用硅谷的人工智能工程師的商業人工智能工具,但傳統的美國海軍可能需要數年或數十年才能完全自動化并采用傳統的常規平臺的人工智能工具。

5.2.4 在人工智能和海權的未來,一艘自動化的航空母艦可能無能為力

ISR技術使海軍平臺幾乎無法隱藏,大量的數據可以欺騙競爭對手。勞倫斯-利弗莫爾國家實驗室高級研究員、海軍研究生院教授扎卡里-戴維斯博士在他的文章《戰場上的人工智能》中認為,"人工智能可以通過增加突襲的感知風險來侵蝕穩定性",一方的人工智能支持的ISR平臺可以迷惑其他精致的ISR。 由于許多海軍ISR操作人員工作時間長,無法完全審核定位移動目標的相關性和準確性,也無法以速度和精度進行打擊,戴維斯稱今天的ISR操作人員很容易被大量的數據和過度收集的數據所害,而競爭者都很想操縱或欺騙其他競爭者。

5.3 AI差距:缺少連接AI工程師和運營商/用戶的AI平臺

這項研究顯示,沒有明顯的中央自動化或人工智能工具,具有連接人工智能工程師和知識專家或海軍用戶的即時通知技術,以更快地解決問題。自動彌合這一差距可以大大有助于獲得客戶和競爭對手的洞察力。根據蘭德公司關于評估數據分析的研究,一個特殊的挑戰與非結構化數據的收集和使用有關,而且不在固定的位置,如關系型數據庫.直接在一個中央數據庫內為人工智能工程師和海軍用戶自動化一個人工智能平臺,對于美國海軍解決和掌握至關重要。采用一個新的平臺來連接人工智能建設者和海軍用戶將有助于超越技術應用的拐點。

盡管收集的信息越來越多,這項研究顯示,描述性和診斷性的風格,特別是視覺分析和趨勢分析,被利用。人工智能提供了關于海軍ISR(即平臺和傳感器)所發生的信息,而診斷性人工智能則迅速指出了確切的問題或議題。正如第四章中提到的,美國海軍采用了一種OTH視覺分析工具,用于對來襲的海軍平臺進行預警。描述性和診斷性的人工智能都是在采用更復雜的預測性和規定性人工智能之前需要掌握的基本程序,其典型代表是神經網絡、模式識別、機器學習和深度學習。

預測性人工智能在美國海軍的數據分析武庫中是缺乏的。預測性人工智能為可能發生的事情提供數據--一個海軍平臺下一步可能去哪里,或者可能是為什么它下一步要去特定的地點。預測性人工智能技術的例子是機器學習、模式識別和統計建模;這種人工智能編程的方法使用歷史和統計數據來進行海軍活動的趨勢分析。預測性和規定性人工智能是對中國保持競爭態勢所必需的先進技術。

規定性人工智能也是缺乏的。規定性人工智能根據歷史數據提供數據,說明如果海軍ISR平臺在海上進行x、y或z的演習,會發生什么以及什么可以更好地發生,并提供建議。規定性人工智能的例子包括監督學習算法,如 "隨機森林",它根據以前收集的數據或模型創建并將決策樹合并成一個 "森林"。這可以幫助支持未來的熱圖和生成對抗網絡(GANs)技術,用于兵棋推演或與競爭對手進行 "紅隊"。簡而言之,無論海軍是早期采用還是在所有其他海軍采用特定的自動化或人工智能技術之后,完善基礎知識并在每一級指揮部發展創新和人工智能操作的文化仍然是成功領導人工智能的關鍵。

美國海軍缺乏的另一個人工智能平臺是能夠從海上生活的 "正常 "模式中區分出可能的異常或反常現象。為了開發和采用區分海上異常或反常現象的技術,目前可用的材料,如來自硅谷的半導體和軟件人才,應該持續和頻繁地訪問和測試。軟件或硬件不足的問題會導致更新的延遲,這最終可能會對識別和定位在海上行動的解放軍部隊構成問題。

人工智能和軍事技術的商業化可能是下一個改變游戲規則的威脅。商業行業出售和使用的無人機可能導致競爭對手使用蜂群戰術來對付關鍵的傳感器,如宙斯盾、SSDS或龍眼雷達。每一級的自動化和人工智能都會增加一層復雜性,以診斷、預測和規定解放軍的下一步行動。此外,如果解放軍與商業部門一起開發人工智能,就會減少美國海軍對具體軟件或硬件更新的控制。對特定的自動化或人工智能工具的控制減少,可能導致其他競爭者或對手購買、銷售和采用這些工具,并利用它們直接對付美國海軍。

5.4 建議

這項研究提供了四個主要建議。另一個已經在快速采用新興技術的模范社區是特種作戰部隊(SOF),特別是特種作戰司令部另一個已經在快速采用新興技術的模范社區是特種作戰部隊(SOF),特別是特種作戰司令部(USSOCOM)。根據NPS教授Leo Blanken的說法,DIU、NavalX和USSOCOM等美國防部組織可以提供 "一種簡單且具有成本效益的方式來改善該領域的現有創新工作:將軍事研究生研究人員與已部署的特種作戰部隊結盟,以快速建立原型:概念和技術。"SOF社區為快速原型設計提供了一個有吸引力的測試平臺,并將戰術用戶與人工智能工程師即時聯系起來。

其次,美國海軍應該投資并采用 "DevOps "文化,以保持對解放軍的競爭優勢。在一個等級森嚴的組織中,培養和實踐DevOps將內在地從人工智能學校或部署前和部署后周期的教育時間開始。這只能由負責的高級官員進行灌輸和啟發。可以說,美國在創新和軟件技術及人才方面繼續領先,但可以通過將美國海軍司令部或總部設在商業和私營人工智能公司附近來進一步提高,以培養和采用下一個人工智能的突破。

第三,在為航母植入更多自動化和人工智能的同時,相應的理論應該考慮蜂群戰術和網絡空間。就像一窩蜜蜂可以蜂擁而上超越一頭熊一樣,自主的無人機可以輕易地蜂擁一個航母打擊群,特別是宙斯盾或SSDS及其相關的天線。如果不將蜂群技術與作戰和戰術ISR任務結合起來,其后果可能導致競爭對手以極小的代價摧毀宙斯盾或346型,并對海軍ISR造成巨大的損害。

第四,兩國海軍共享網絡空間。JP 3-12將信息主導權定義為 "一支部隊在網絡空間的主導程度,允許該部隊及其相關的陸地、空中、海上和太空部隊在特定的時間和地點安全、可靠地開展行動而不受對手的干擾。"網絡空間是自動化海軍平臺的致命弱點,因為海軍ISR平臺之間的自動化和通信依賴于共享信息空間和解讀頻率進行通信。

這篇論文發現了在海軍ISR采用自動化和人工智能時應該考慮的五點:

1.從第一天起就制定一個戰略敘事,并在每個指揮層討論人工智能戰略。戰略敘事是一種特殊的故事,一個組織可以清楚地理解和參與這個故事。這很重要,因為它能告訴其他海上競爭者你是誰,你曾經去過哪里,你要去哪里,以及你在哪里。每個指揮部都應該希望激勵其軍隊成員,讓盟友和合作伙伴興奮,并吸引用戶,如人工智能工程師和人類操作員。

2.控制了建立自動化和人工智能所需的技術材料的國家和海軍,如半導體、硅和鍺,將在未來海權的人工智能方面占據主導地位。市場是否準備好支持軍方在海軍ISR方面的解決方案?

3.采用自動化的成敗在很大程度上取決于對電磁頻譜的控制和頻率的解調能力,如果不是全部的話。

4.應該有一個自動化的人工智能反饋平臺,以便軍事用戶和人工智能工程師可以直接發短信和說話。一個獲勝的、更好的端到端產品需要很好的用戶體驗,以實現高效的工作流程和即時的報告。

5.早期采用者和后來者之間的重大洞察力表明,美國海軍和解放軍海軍在技術采用和競爭的波長上處于兩端。在羅杰斯在第三章關于技術采用的S型曲線的工作中,美國和中國海軍領導人都落在S型曲線的兩端,適合他們各自的組織和理論結構。

5.5 海上力量的未來和未來工作:人機合作

人類和機器聯手是在海軍ISR事務中采用自動化和AI的關鍵。本節涵蓋了未來的工作和采用自動化和人工智能過程中的長期考慮。這些因素是:為操作者提供自動化的健康指標;利用量子計算的研究;以及各種現實技術(虛擬、增強和混合)的增加。

5.5.1 團隊AI健康:COVID-19

海軍ISR和采用自動化或新興技術的重心取決于海軍平臺上健康的人類操作員來操作這些系統。如果一種流行病在一艘航空母艦上蔓延,如USS Theodore Roosevelt (CVN 71),那么所有支持航母行動的ISR都會停止,美國海軍未能采用AI進行監視--其后果可能會導致生死攸關的情況。AI可以提供重要的人類輔助工具,可以將明確的指標自動化。

指揮官會發現,為海軍操作人員的各種設計制定策略,并設計一個整合健康實踐和人工智能的戰略是非常有用的。一個自動化的紅綠燈圖表和每日追蹤器,帶有閃爍的通知符號,將有助于為指揮官和決策者指示診斷出的問題或觸發因素。與生物事件相關的社會破壞的自動化指標的一個簡單模型是威爾遜-科爾曼量表,即生物事件可能性增加的四個階段:有利條件、單焦點或多焦點生物事件、嚴重的基礎設施限制和當地反應能力的耗盡,然后是社會崩潰。第二個復雜的模型是約翰霍普金斯大學冠狀病毒互動地圖。另一個可以提取或利用模型的數據庫是康奈爾大學的arXiv數據庫,供世界頂級人工智能研究人員提交給斯坦福大學的知名資料庫(見附錄)。以互動的方式自動列出SWOT,可以使海軍ISR受益。這很重要,因為有一個明確定義的任務和問題清單有助于盡早診斷出問題,并迅速找到合適的人工智能研究人員。

5.5.2 量子計算

對量子計算的進一步研究將有助于美國海軍對人工智能的成功采用。量子計算超越了二進制數字(比特值為0或1),這是計算機中最小的數據單位,并使用研究人員托馬斯-坎貝爾所說的 "量子比特,其中單個比特可以處于三種狀態之一:開、關,以及唯一的,同時開和關。"在2018年的美國國家量子倡議中,國會確定國家標準與技術研究所(NIST)和能源部的量子信息科學研究中心為量子計算的頂級領導部門。因此,美國海軍應不斷與NIST和能源部密切合作。在這種情況下,國會是資助和提出法案以啟動海軍內部采用新興技術的最高關鍵之一。雖然處于初級階段,但量子計算可以提高人工智能的速度,特別是在機器學習方面,以便迅速發現模式并過濾大量數據集;它將為未來的海權投下長長的陰影。

5.5.3 倫理與人工智能

美國和中國都發布了 "原則",而不是專注于自動化和人工智能是否符合道德、道德上允許或不允許的爭議性問題。2019年6月,中國科技部發布了《新一代人工智能治理原則:發展負責任的人工智能》,其中列出了人工智能治理的八項原則:(1)和諧友好;(2)公平公正;(3)包容共享;(4)尊重隱私;(5)安全可控;(6)責任共擔;(7)開放合作;(8)敏捷治理。2020年2月,美國防部的國防創新部門花了15個月時間才宣布采用人工智能道德的五項原則。它們應該是負責任的、可靠的、公平的、可治理的、可追蹤的。發布像人工智能倫理指南這樣的原則表明,兩個國家都希望在人工智能的發展中具有靈活性,但也有責任。不管有沒有原則,關于使用人工智能的主要爭議很快就與人工智能的錯誤識別以及自動化和人工智能工具武器化的可能性有關。

首先,存在與人工智能和軍事有關的倫理問題,這些問題在電影中都有描寫,如《終結者》或《我,機器人》,這些電影最初是艾薩克-阿西莫夫的深思熟慮的短篇小說,并在現實生活中得到了證明。一些人認為,軍事技術或人工智能在軍隊中的使用不應繼續下去,因為計算機系統可能會自行行動,或根據流行的電影和社交媒體做出自己的致命決定。如果人工智能告訴人類操作員一架飛機有敵意,那么指揮官只有幾秒鐘的時間來決定是否根據現有信息作出反應。然而,自1988年以來,在ISR平臺上采用自動化和人工智能工程,增加了透明度,避免了像美國海軍文森號這樣的事件,這是人的錯誤而不是機器的錯誤。可以說,自動化有助于防御友軍或敵軍的火力,有助于國家安全。

第二,在人機合作中,人是道德主體,而機器不是,但可以被打造為提供道德的選擇。在亞里士多德的《尼各馬可倫理學》中,一個有德行的人并不持有公開的德行態度,而是在特定情況下以某種方式行事,并有一系列的理由。人類可以有意識地做出單獨的選擇;而今天的機器只是協助人類做決定。在美國海軍中,道德問題很可能取決于傳統主義或法律主義的觀點,也可能是以更多的探究性或可能是功利性的心態來修正一種觀點。

在中國人民解放軍中,未來關于道德和采用自動化的工作可以通過中國的道德決策來研究。在中國,倫理學與美德倫理學密切相關,涉及一個人應該如何生活,以及后果主義,涉及所有涉及物質產品的利益。

雖然今天的人工智能機器在一定程度上是自主的,但人工智能機器最終可能會根據特定的道德倫理規范,比人類更快地提出后果。兩個嚴重的倫理問題是:自主系統在未來能否或將被歸類為道德代理人?如果在生死攸關的情況下,對違反人類戰爭法的無道德的代理人--自主系統--缺乏問責,會發生什么?NPS教授Bradley Strawser提出的這些倫理問題值得考慮,但超出了本論文的范圍。

5.5.4 人機合作與虛擬現實(增強現實)。

雖然Ishare對自動化和人工智能大大改善人類福祉的潛力抱有極大的熱情,但智力優于人類的機器的發展可能會導致人類操作者頭腦中的認知失調,并可能被用作一種威懾機制。愛因斯坦警告說,原子的力量會改變我們的思維模式。原子彈導致了廣島和長崎的核災難。然后,核電變成了 "核大決戰 "的想法,這是一個涉及使用核武器造成廣泛破壞并最終導致文明崩潰的理論情景。今天,前國務卿亨利-基辛格等人認為,人工智能威脅著我們的意識以及我們理解真理和現實的方式。"人工智能可以作為威懾工具的概念是一個重要問題,可以在未來的研究中進一步研究。

根據這項研究,海軍ISR平臺的自動化程度越高,人工智能工具的增加,海軍事務和海權將變得更加虛擬。最近的報告,如美國 "2020年美國國防訓練中的擴展現實應用",闡明了數字轉型對人類的日常影響,并已延伸到虛擬現實(VR)、增強現實(AR)和混合現實(MR)技術,這可能是下一個顛覆性技術。各種形式的VR的商業化可能會成為對海軍部隊的威脅。本研究沒有涉及現實技術,VR、AR或MR對于保持人類安全不受傷害或作為一種威懾工具是非常有用的。

由于愛因斯坦和基辛格分別就核戰爭的災難和人工智能對人類意識的威脅提出了警告,人工智能可能會走向一場 "認知戰爭"。認知戰爭將是在海上戰場上使用自動化和人工智能,幾乎由不在海上的人類控制。作為一種威懾工具,人工智能可以被用來用 "假的注入數據 "來威脅競爭對手在海上可能存在的海軍威脅,而實際上,沒有機器存在或曾經存在過。

在一場由自動化和人工智能驅動的革命中,人類正處于信息主導的邊緣。自古以來,海上的艦隊一直在尋求了解地平線外的情況,即敵人可能潛伏的地方。一個世紀前,安裝在駕駛飛機上的無線電和雷達的興起使海軍有能力將監視范圍擴大到地平線以外。具有諷刺意味的是,人工智能解決問題和管理信息的最終效果可能是人類推理、智能和決策的轉變。今天,自動化既在全球范圍內擴展其影響力,又在解釋大量的信息以解決問題,并比以往任何時候都更能創造出充分的透明度。真正的,自動化ISR正在改變人類的知識、認知、現實,并最終改變21世紀海權的面貌。

付費5元查看完整內容

  • 本研究由美國陸軍研究實驗室贊助,根據合作協議號W911NF-21-2-0227完成。

?在日益復雜的軍事行動環境中,下一代兵棋推演平臺可以減少風險,降低作戰成本,并改善整體結果。基于具有多模態交互和可視化能力軟件平臺的新型人工智能(AI)兵棋推演方法,對于提供滿足當前和新興戰爭現實所需的決策靈活性和適應性至關重要。我們強調了未來作戰人-機器交互的三個發展領域:由人工智能引導的決策指導,高計算力下的決策過程,以及決策空間的真實呈現。這些領域的進展將使有效的人機協作決策得以發展,以滿足當今戰斗空間日益增長的規模和復雜性。

關鍵詞:決策、交互、兵棋推演、人工智能、增強/混合現實、可視化

1 引言

在傳統的兵棋推演中,指揮官利用一個共同的基于地圖的作戰地形,并在軍事決策過程(MDMP,方框1)中模擬各種因素的組合如何產生行動方案(COA)、可能的反擊行動、資源使用估計和預測結果(美國陸軍,1997年,2014年,2015年)。在幾天或幾周的時間里,MDMP過程導致了一套精煉的COAs,它對作戰環境做出了一定的假設,包括地形、天氣以及戰區資產的可用性和能力(即塑造支持主要作戰行動的活動)。

方框1. 軍事決策過程(MDMP)
MDMP是美國陸軍解決問題的理論方法,從接到任務開始,到生成作戰命令結束。MDMP被用作一種工具,幫助指揮人員審查眾多的友軍和敵軍的作戰行動。MDMP的7個步驟在規劃新任務、擴展行動和執行訓練演習所需的決策過程中灌輸徹底、清晰、合理的判斷、邏輯和專業知識(美陸軍,1997年,2015年)。
指揮官在接到任務后啟動了MDMP。在MDMP的第1步中,所有的工作人員和關鍵的任務參與者都被告知任務和待定的規劃要求,包括進行MDMP的可用時間量。確定進行任務分析所需的工具,并收集與任務和作戰區有關的文件。步驟2,執行任務分析,建立對任務的全面理解,包括關鍵的事實和假設,形成擬議的任務說明和任務分析簡報,為制定COA做準備。
MDMP的第3至第6步著重于制定COA以進行分析和比較。這些步驟包括:第3步,制定COA;第4步,COA分析(兵棋推演);第5步,COA比較;第6步,COA批準。COA是對一個已確定的問題的潛在解決方案。每個COA都要使用篩選標準來檢查其有效性,如在既定的時間框架、空間和資源限制內完成任務。COA的選擇過程通常涉及到兵棋推演,它試圖在考慮到友軍力量和敵人能力的情況下,將行動的順序流程可視化,同時考慮到行動區域內平民的影響和要求(美陸軍,2014)。戰術模擬(兵棋推演)方法的好處是突出了作戰行動的優勢和劣勢。這往往是一個反復的過程,對作戰行動方案進行評估,然后根據需要進行修改,直到出現一個或多個具有最高成功概率的作戰行動方案來完成任務目標。
在一個具體的行動方案得到指揮部的批準后,MDMP的最后一步是制作行動指令,這是一份給下屬和鄰近單位的指令,旨在協調所有參與任務的組織的活動。這一步驟涉及到所有受命令傳播影響的組織之間的積極合作,并建立起對局勢的共同理解。

盡管MDMP幫助指揮官了解作戰環境和考慮作戰方法,但這個過程有很多局限性,如時間密集、假設僵化、跨場景訓練的機會有限,以及將人工智能(AI)指導納入決策過程的機會很少。傳統上,一項任務的成功與指揮部執行MDMP的能力直接相關。然而,鑒于當今多域作戰(MDO)的復雜性增加(Feickert,2021年),有大量的任務指揮系統和流程,與行動相關的所有活動的整合和同步變得越來越困難,甚至到了人為無法完成的地步。由于MDMP的缺陷而導致的規劃專業知識的缺乏,可能會導致不同步和不協調的行動,從而最終導致士兵的生命損失。

MDMP中沒有具體描述戰斗空間的可視化能力,但它顯然在決策過程中發揮著重要作用。最近,集成了先進可視化能力的新系統和新技術已經被開發出來,它們可以提高態勢感知,從而增強決策過程。美陸軍的例子包括Nett Warrior(Gilmore,2015),它使下馬戰士能夠直觀地看到附近的友軍和敵軍,同時根據當地的地形協同規劃戰術任務。盡管這項技術將無線電和數字地圖擴展到了下馬戰士,但它缺乏一個底層的人工智能引擎來提供決策幫助。戰斗空間可視化和交互平臺(BVI,前身為增強現實沙盤,ARES)是陸軍技術的另一個例子,它能夠為任務規劃提供分布式協作,具有從任意視角和廣泛選擇設備的共同作戰畫面的二維和三維可視化能力(Su等人,2021)。BVI架構的制定是為了拉入外部計算服務,如分析管道、模型和人工智能引擎。美陸軍研究實驗室正在努力將這些類型的服務納入BVI,包括用于加強決策支持的人工智能。

目前,MDMP并沒有將人工智能指導納入整體任務規劃方法中。美陸軍的自動規劃框架(APF)(Bailey,2017)開始通過將自主技術插入MDMP工作流程來解決人工智能輔助決策問題。指揮人員可以通過APF的數字規劃呈現、規劃創建和規劃監控工具,在任務規劃和COA開發期間獲得背景援助。任務執行和估計能力通過監測任務的規劃和實際進展,為改進決策跟蹤和支持活動提供自動協助。盡管APF為MDMP引入了基本的自動化水平,但它缺乏Nett Warrior和BVI所提供的先進的可視化和用戶互動能力。

提供地面部隊自動化和用戶可視化能力的是美陸軍最知名的兵棋推演平臺--半自動化部隊(OneSAF),為計算機生成的地面部隊提供建模和模擬能力(PEO_STRI, 2022)。OneSAF提供了半自動和全自動的軍事實體(即士兵、坦克、直升機和綜合單位)的建模,在類似真實世界的戰斗空間中以不同的保真度來支持特定的應用和場景。OneSAF主要用于訓練,并與目前的任務指揮系統具有互操作性。它可以使用多分辨率的地形和詳細的實體相關數據庫來模擬廣泛的作戰環境。然而,OneSAF對地形和實體系統的高保真建模的優勢使得它的設置和運行成本很高。它受到老化系統的限制,而且眾所周知,士兵需要大量的培訓來學習如何操作模擬,使用起來很困難(Ballanco,2019)。OneSAF的復雜功能并不適合開發人工智能能力,以實現快速和敏捷的戰士-機器決策。

除了MDMP和上面提到的陸軍平臺外,最近將人工智能納入決策過程的工作包括一些方法(Goecks等人,2021a),在模擬人類決策過程方面取得了一些成功。一般來說,人工智能在決策變量有限的問題上取得了一些成功,如資源分配(Surdu等人,1999)、飛行模擬器(Drubin,2020)和更簡單的場景。正在進行的挑戰包括需要提高人工智能的能力,以解決有多個行為者、不完整和可能沖突的信息、不斷變化的單位行動和環境屬性的復雜決策,以及需要將這些決策的后果在許多空間和時間尺度和領域內可視化。

以下各節描述了對MDMP的潛在改進。"未來軍事決策過程所需的進步"一節概述了支持MDO決策的三個研究領域,并以圖表形式描述了這些研究領域與軍事理論決策方法之間的關系。"未來軍事決策過程所需的進步 "一節中的小節對每個研究領域進行了更深入的討論。"展望推進人-人工智能團隊決策的交互技術 "一節概述了未來的作戰人員-機器接口(WMI)的發展方向,重點是與決策有關的人-人工智能團隊的跨學科研究。

2 未來軍事決策過程所需的進步

軍事決策過程在支持MDO復雜決策方面的局限性,突出了在三個研究領域的改進需要。首先,有必要將人工智能產生的指導和輔助決策支持納入MDMP。這既包括進一步開發和整合人工智能到戰斗空間決策規劃,也包括進一步改善人工智能決策過程的可解釋性和透明度(Chen等人,2018)。第二,有必要在戰略層面以及戰術邊緣,盡可能地將決策分析與高性能計算(HPC)的力量結合起來。這將能夠利用HPC系統的力量來支持建模、分析和計算時間,同時整合和同步來自所有戰區領域的信息。最后,有必要利用先進的可視化技術,如混合現實技術,對決策空間進行更準確和互動表述。不是簡單地在一個固定的時間尺度上顯示地形的二維渲染,而是需要可視化不同領域的決策是如何相互作用的,并利用混合現實技術來提高理解的吞吐量,并產生平面顯示不可能的洞察力。

除了MDMP之外,其他更廣泛適用的支持戰斗性問題解決的軍事理論包括:DOTMLPF[例如,學說、組織、訓練、物資、領導、人員和設施;(美陸軍,2018年)],這是一個確定差距并為當前和未來作戰要求提出設計解決方案的框架;以及METT-TC[例如,任務、敵人、地形和天氣、部隊、可用時間和民事考慮;(美陸軍,2019年)],這是一個結構化框架,用于捕捉任務相關因素的狀態,以便在軍事行動期間進行共享評估。這些理論定義了MDO戰場的信息背景,構成了應用于上述三個研究領域的軍事決策的核心基礎。如圖1所示,在為人類和人工智能指揮開發復雜軍事決策空間的新表述時,研究進展和MDO相關理論相互借鑒、相互啟發、相互加強(美陸軍,2010)。

圖1. 新型作戰人員-機器交互(WMIs)和人工智能輔助決策所需的三個研究發展領域,以支持和加強基本的MDO理論[右下圖來源:Lebsack(2021)]。

2.1 人工智能導向的決策指導

需要新的人工智能支持的WMI,以利用人工智能決策方面正在取得的進展,并為復雜的適應性決策的人工智能學習作出貢獻。在簡化的戰斗空間中測試人工智能決策輔助工具是開發過程中重要的第一步,也是將人工智能納入更成熟的戰斗空間平臺(即BVI、OneSAF)的前奏。開發用于決策輔助實驗的人工智能測試平臺可以在MDO中產生能力越來越強的潛在COA建議。圖2顯示了陸軍開發的兩個人工智能測試平臺的例子。

圖2. 兩個ARL人工智能測試平臺的例子。左邊:ARL Battlespace(Hare等人,2021)( //github.com/USArmyResearchLab/ARL_Battlespace )。右邊:ARL的Simple Yeho測試平臺。圖片由C. Hung制作。

人工智能測試平臺能夠開發出匯集所有領域信息的AI,并計算出人類和AI智能體的風險和預期回報。圖2的左側顯示了ARL戰斗空間測試平臺(Hare等人,2021年),它是從頭開始開發復雜決策的新型人工智能的理想場所。它對戰斗空間的抽象強調了軍隊相關場景下的核心推理原則,在這種情況下,用蜜罐進行網絡欺騙。較小的網格空間使人工智能的學習和發展能夠集中在不確定性下的復雜推理,有多個友好和敵對的agent。圖2的右側顯示了ARL的Simple Yeho測試平臺,它提供了將人工智能開發與更多真實世界場景中的默契推理結合起來的能力,有多個基于地形的海拔高度、視線范圍、障礙物、樹葉(隱蔽)、道路和城市區域。紅色陰影和黑色線條表示任務的起點和終點、左右邊界以及人工智能建議的路線。這種額外的真實性使其能夠與MDO理論相結合,包括DOTMLPF和METT-TC,并使人工智能與自然的、機會主義的士兵行為共同發展。這兩個人工智能測試平臺都可以擴展為傳統和沉浸式混合現實WMI開發平臺。

使用漸進式和可擴展的人工智能測試平臺,可以調查現有人工智能的幾個基本限制,特別是對于具有不確定性的復雜和適應性決策,以及人類和AI智能體的協作和對抗。對多智能體的協作和對抗性決策進行建模可能特別復雜,因為其遞歸性質,其他智能體是模型的一部分(Goldman,1973;Grüning和Krueger,2021),需要對決策特征、個性化的價值、風險規避、記憶和注意力進行動態和不斷發展的估計。這些具有高度不確定性、復雜性和動態性的情況是人類擅長的領域,適當設計的交互界面和人工智能測試平臺的人機協作可以提供加速和更有效的決策。對于有效的團隊合作,新穎的WMI應該幫助作戰人員篩選復雜的信息,并幫助人工智能發現決策的隱含規則。下面,我們提供了關于人機協作如何有效的案例。

多域兵棋推演中需要的復雜決策是開發有效人工智能決策輔助工具的直接挑戰。最近人工智能在圍棋、國際象棋、Minecraft和大富翁等游戲中的成功(Silver等人,2017;Goecks等人,2021b;Haliem等人,2021)是基于對世界現有狀態有完整了解的游戲(即 "開放 "游戲),而兵棋推演平臺通常包括關于作戰環境的不完整(如星際爭霸)、不確定或欺騙性信息(Vinyals等人,2019)。不確定性也可能來自變化的物理學或其他環境規則,正如在《憤怒的小鳥》中所探索的那樣(Gamage等人,2021)。由于世界狀態、不同行動者的狀態以及所采取的行動不確定性,知識的缺乏使得人工智能agent難以計算未來行動的風險回報情況(Cassenti和Kaplan,2021)。不確定性也限制了人工智能估計其他行為者的風險回報概況的能力,而這是計算有效的博弈論策略所需要的。人工智能被可能的最優和近似最優選擇的廣度所淹沒(Lavine,2019),即由于信息有限而選擇錯誤的選項,這種情況并不罕見,因為人類在制定有效探索隱藏信息的策略時,采用啟發式方法進行有效的選擇和預測(Gardner,2019)。為了幫助發展人工智能的隱性知識和探索能力,新型的WMI需要有效地解釋和展示決策景觀,以使作戰人員能夠快速和自然地瀏覽可能的選擇,同時使人工智能能夠在不施加認知負擔的情況下從人類的決策中機會主義地學習(Lance等人,2020)。這種機會主義學習可以包括:例如,凝視跟蹤,以捕捉吸引人類興趣和意圖的視覺區域和未標記的目標。它們還可以包括建立在自然的士兵選擇行為基礎上的行動者批評方法,以改善人工智能對人類專家在不確定、不完全信息和欺騙的情況下如何優先考慮某些選擇的學習,這取決于任務相關的背景。

開發人工智能的WMI的另一個基本挑戰是如何有效地整合和顯示MDO中所有五個領域的信息,特別是空間和網絡,因為這些領域的信息具有不同的時空尺度(Gil等人,2018)。對于網絡,決策的規模和速度可能比人類處理和理解的能力更快,需要人類的輸入來指導半自動化的決策,以及實施進攻和防御性欺騙策略的人工智能。WMI需要能夠以這樣的方式顯示決策圖景,即可以解釋一小部分最優和接近最優的決策策略(例如,圖3中的決策樹)。這應該包括對關鍵agent在不確定情況下的未來狀態和風險回報情況的估計(Hare等人,2020),以使有效的博弈論決策能夠被共同開發和相互理解。

圖3. 在頂部,是BVI網絡戰術規劃器應用程序中友軍與敵軍戰爭場景的三維視圖。三維視圖提供了一個比二維視圖更真實的決策視角,例如,顯示友軍(藍色)和敵軍(紅色)機載預警系統(AEWs)和周圍地形的海拔。這使得快速審查可能的視線和相對于周圍地形的感應。下面是人工智能的導航決策樹,為人工智能計算的幾個關鍵選擇的風險/回報概況以及它們如何映射到地形上提供透明度。這種抽象的決策空間還可以整合非空間決策,例如網絡欺騙。虛線表示與友方AEW的通信聯系和對敵方AEW的可能干擾。圖片由C. Hung制作。

這些挑戰為有效的WMIs設計提供了參考。也就是說,我們需要有能力從不同的來源(包括從其他國家的決策輔助工具)提取信息,以及一個能夠承載整合這些信息的計算能力的架構,同時還要處理基礎的人工智能計算(用于學習和部署)。我們還需要共同開發一個界面和算法設計,以適時地利用人類和人工智能agent的優勢并減少其局限性。

2.2 高計算能力下的決策過程

在復雜的決策過程中,需要大量的計算能力來處理和記錄所有組件、實體和狀態空間。從積累的動態狀態空間的數據集中建立過去、現在和預測模型,需要利用HPC資源來產生分析性的見解,并在決策背景下創建有用的表述。

實施HPC分析工作流程的一種方法是使用持久性服務框架(PSF)。PSF是一個最近可用的分布式虛擬化解決方案,它可以通過一個基于網絡的前端實現對HPC服務的非傳統訪問,而不像傳統的HPC環境,計算節點在特定的時間段內以批處理模式分配給用戶。此外,PSF提供對數據、數據庫、容器化工具集和其他托管平臺的分布式連續訪問(Su等人,2021)。

在一個PSF方法的例子中,一個模擬引擎連接到PSF,用于記錄人類和人工智能做出的所有決定。這允許分析在任務規劃和COA開發過程中發生的決策行為,以及識別決策模式和戰略,以開發競爭性和現實的兵棋推演場景。一個戰斗空間可視化平臺可以托管在PSF上,并使用消息傳遞協議來更新所有連接的設備接口。來自模擬引擎的狀態信息可用于生成戰斗空間和參與作戰單位的圖形表示。

使用PSF方法并利用HPC資源,可以實施人工智能輔助決策機制,利用大數據攝取和分析,同時可供地理分布的用戶用于協作決策工作和 "永遠在線 "的個性化培訓和紅色團隊。連接到PSF托管服務器的各種混合現實顯示模式可以支持一系列作戰場景,從戰略層面的指揮和控制到作戰邊緣的更多移動戰術使用。

2.3 決策空間的真實呈現

用圖形表示各級行動的軍事決策戰略需要新的可視化方法,這些方法可以應用于以規則變化、認知狀態、不確定性以及個人偏見和啟發式方法為特征的動態環境(Dennison等人,2020;Hung等人,2020;Raglin等人,2020)。戰斗空間的視覺表現應該在技術上盡可能準確和逼真,但又保持在人類可以理解和解釋的認知水平(Kase等人,2020;Larkin等人,2020;Hung等人,2021)。融合了混合現實技術的先進可視化方法有可能更好地表現多領域戰爭的變化特征及其不斷變化的威脅和動態環境。隨著最近混合現實可視化設備的技術進步,成本降低,硬件的可靠性和實用性顯著提高,混合二維和三維可視化方法現在已經成為可能。

由多個二維顯示器組成的混合現實方法增強了更先進的三維可視化能力,可以為指揮人員提供理解復雜的兵棋推演狀態空間所需的洞察力(Su等人,2021)。當需要一個共享的戰斗空間表示時,可以通過在不同的可視化模式上實現多個協調的視圖來實現協作的戰略規劃模式,以根據分布式指揮人員的輸入進行互動更新。

BVI(Garneau等人,2018)平臺表示地理空間地形信息和地圖圖像,允許指揮人員建立和修改戰術任務規劃和COA。作為一個數據服務器,BVI將地形和作戰數據分發給支持多種可視化模式的客戶端應用程序,包括頭戴式顯示器設備、基于網絡的界面、移動安卓平板設備和混合現實設備(例如,HoloLens 2、Oculus Quest)。

例如,圖3(頂部)顯示了位于加利福尼亞州圣貝納迪諾縣歐文堡國家訓練中心的高分辨率地形上的友軍與敵軍的兵棋推演場景(Wikipedia, 2021)。與MDMP期間經常使用的傳統2D地圖顯示相比,戰斗空間的3D視圖可以從多個觀察角度提供更豐富的用戶體驗。三維視圖,在BVI的網絡戰術計劃器(WTP)中,將地形和人工特征的空間信息以及由MIL-STD 2525C符號描繪的單位位置可視化(美國防部,2014)。可以想象,地理空間視角,如BVI提供的視角,支持決策者對動態戰斗空間環境的理解。與可導航的人工智能增強的決策空間(圖3,底部)搭配,組合的視角可以使人們更好地理解視覺空間依賴性、影響和因果關系、估計的風險和價值、不確定性以及復雜決策的欺騙性。將這種以地理空間和決策為中心的視角與人工智能相結合,可以提供必要的廣度,以協調物理行動與網絡和其他非空間領域的行動,跨越多個時間尺度,并具有快速適應變化的任務目標的靈活性。

3 人-人工智能團隊決策的交互技術展望

人工智能和人-人工智能團隊的快速發展需要WMI同步發展。隨著新型人工智能對有價值的COA產生更好的預測,并能更好地處理復雜的決策,它們也必須利用人類的專業知識,學習如何處理具有高度不確定性、欺騙、隱性知識和博弈論的決策。相反,人工智能的推理必須既抽象又能與兵棋推演環境相聯系,以實現透明和信任,同時又不造成過度的認知負擔。基于三維混合現實的WMI可以利用和增強人類固有的三維認知和預測能力(Welchman等人,2005;Kamitani和Tong,2006;Kim等人,2014;Boyce等人,2019;Krokos等人,2019),如果設計得當,其交互將感覺自然,同時擴大顯示多個領域的信息的能力,同時使AI能夠適時地從用戶的決策中學習。

我們強調了三個關鍵的發展領域,即人工智能引導的決策指導,支持這種指導的計算基礎設施,以及決策透明度的混合現實表現的發展。這些領域的進步需要跨越許多不同學科的專業知識。新的人工智能發展需要融合神經科學、心理學和數學的思想,以克服復雜決策中長期存在的問題的瓶頸。這包括跨時間尺度的學習和變化環境下的災難性遺忘,以及更具體的兵棋推演問題,如具有不確定性、欺騙和博弈論的多Agent決策。計算基礎設施也需要發展,因為計算能力和數據框架對于在戰術邊緣產生人-人工智能團隊的共同操作圖來說都是必不可少的。為了有效地開發,應該通過一個共同的框架來抽象出專有的限制和軟件的依賴性,并為使用和故障排除提供清晰的文檔,以使學術界、政府和工業界更好地專注于解決人與人工智能的合作問題。這個通用框架應該包括有效的信息傳遞,同時提供靈活性和適應性,以滿足人工智能開發和人類用戶在訓練和實際使用環境中的需求。最后,交互技術的開發本身需要跨學科的協同專業技術。一個基礎性的問題是如何壓縮信息使之被用戶有效地理解,以及如何最好地利用用戶的互動來進行機會主義學習。人類的大腦并不處理所有的感官信息,而是對世界進行預測和假設,以便在信息不完整的環境下節約計算。一個有效的WMI應該同時預測潛在的決策結果以及個人用戶的期望和假設。此外,人工智能決策輔助工具必須估計用戶的默契,使其能夠提供最相關的信息和最有希望的選擇,這些信息來自整個作戰領域。

結論

信息作戰和指揮與控制(C2)是美國陸軍可以向盟友和伙伴提供的兩種能力。在未來的作戰環境中,不僅要為動能作戰做準備,而且要為混合作戰和以信息為重點的戰爭做準備。這需要在復雜和默契推理的人工智能能力方面取得進展,在能夠提供持續訓練、分布式混合決策和大數據分析系統方面取得進展,以及在人與人工智能協作決策和機會主義學習方面取得進展,以實現人工智能的持續進步和人與人工智能的共同適應。這些進展中的每一項都需要跨學科的計劃性努力,以克服復雜的技術挑戰,創造新的決策原則、理論和理論方法,包括持續開發綜合測試平臺和技術,以實現政府、學術界和工業界的合作和協同發展。

付費5元查看完整內容
北京阿比特科技有限公司