指揮與控制(C2)活動涉及國防、應急響應、警務和危機管理等多個領域。這些領域的問題通常具有復雜性,即種類繁多。根據控制論,控制器(C2 系統)的多樣性必須等于或超過作戰環境中受控系統的多樣性。足以控制特定系統的多樣性程度被定義為必要多樣性。
本文旨在將外部和內部多樣性可操作化,縮小高層抽象描述與具體解決方案之間的差距,以便在設計 C2 系統時提出切實可行的建議。C2 系統由方法、技術、人員和組織構成。在這項工作中,我們將重點放在人員和組織方面。我們特別關注人員組成部分中的能力變量。我們根據以往對多樣性等方面的研究,討論了在開展 C2 活動以應對復雜性時,能力變量的哪些方面可能最為重要。
然而,大量的 C2 研究也表明,快速決策對于應對來自對手的問題非常重要。我們詳細闡述了高度內部多樣性的潛在代價,即由于團隊溝通需求的增加,它可能會延遲 C2 團隊的決策。最后,我們介紹了一種調查方法,其中包括模擬外部復雜性,要求由具有不同能力(內部多樣性)的 C2 團隊進行動態決策。
圖 1. 任務響應系統由 C2 系統和執行系統(圖中最右邊的灰色實體)組成。C2 系統由三級指揮系統組成,而三級指揮系統又包括通信、數據提供、定向和規劃等遞歸的通用活動[7,第3頁]。
在本文中,我們將首先對作戰環境或工作空間進行總體描述,包括其特征和與這些特征相關的典型需求。特征和潛在問題之間的多樣性將被稱為外部多樣性。
我們對 C2 的看法是系統性的,這意味著任務響應系統由 C2- 系統和執行系統組成(見圖 1)。我們對 C2 的定義是 C2 是為實現目標而努力解決(軍事)問題的人類活動或系統。C2 過程產生的關鍵產品是指揮和協調[7]。
C2 方法空間可視為對真實 C2 系統關鍵方面的抽象或理論描述。C2 方法空間由三個相互依存的維度構成:a) 信息分配;b) 互動模式;c) 決策權分配[8]。表示具體 C2 系統的一種方法是列出其組成部分:方法、組織、人員和技術[7,第 14 頁]。C2 方法空間的維度與 C2 系統中的組織、方法和技術類別之間存在聯系。每個類別內部的潛在多樣性以及這些類別之間的組合影響著整個 C2 系統控制的潛在多樣性。
然而,在 C2-方法空間中,人員部分并不明顯。我們選擇將工作重點放在人員部分,主要有兩個原因。首先,它可能是 C2 研究中對 C2 系統研究最少的部分。但最近一個值得注意的例外是 Valaker 等人[9]。其次,在我們看來,它是 C2 系統中最具影響力的因素,這主要是因為 C2 與決策密切相關。盡管人工智能(AI)有了長足的發展,但決策仍主要是人類的活動。
當然,人員部分還可以進一步細分為幾個不同的子部分,如個人的人口特征(如性別、年齡、種族)和功能或任務相關的多樣性方面(如知識、技能和專業知識/能力)。在本文中,我們將主要討論能力因素,更具體地說是任務/使命能力[10,第 105-182 頁]。因此,在描述 C2 系統內部多樣性時,能力因素將是我們的主要關注點。
因此,在本文中,我們開發了一種方法,用于更精確地研究多樣性與速度之間的平衡性質及其如何影響性能。歷史事件清楚地表明,如果任務響應系統沒有足夠或必要的多樣性,其代價可能是災難性的。一個著名的例子是 1415 年的阿金庫爾戰役,當時法國裝甲騎士對英國長弓手發動騎兵攻擊,但被有效阻止。這場戰役的結果對法軍來說是一場災難,標志著騎士時代的終結[18]。博伊德(Boyd)提供的經驗中描述了一個速度不夠(關于瞬時機動)的典型例子,在朝鮮戰爭中,由于瞬時機動速度出眾,美國 F-86 戰斗機對俄羅斯米格-15 的殺傷率達到了 10:1[19,第 41 頁]。
事后分析(AAR)在軍隊和組織中用于評估事件及其相應的培訓成果。團隊討論提供了一種以學習為中心的方法,用于評估表現、分析失敗或對未來活動可能的改進。有用的信息經常以非結構化文本和語音的形式嵌入這些 AAR 中。本文提出了一種對 AAR 進行數字分析和趨勢分析的解決方案。討論了使用手持設備采集數據的解決方案。此類設備可將音頻輸入數據管道,在管道中進行語音到文本的處理。音頻處理的操作方法是識別音素等原始語言成分,并對其關系進行上下文建模,以識別最有可能的文本輸出。然后,將討論語音到文本的轉換以及自然語言處理 (NLP) 在分析中的應用。NLP 技術可發現非結構化文本中的語義模式,然后將其與團隊績效指標相關聯。通過揭示 AAR 與團隊表現之間的成功促進因素,這種趨勢可以優化軍事訓練課程。
對分布式作戰資產進行最佳管理以實現協同作戰的能力可顯著增強軍事優勢。最近的研究指出,戰爭的速度越來越快,威脅的能力和數量不斷增加,越來越多的傳感器和網絡導致數據超載。面對復雜的決策空間、大量的信息和所需的快速反應時間,人類的決策面臨挑戰。自動化作戰管理輔助系統(BMA)具有縮短時間、提高決策可信度和優化戰爭資源的潛力。本文介紹了為未來海軍和聯合作戰任務構思和設計 BMA 的系統工程方法。系統方法將 BMA 視為管理未來分布式戰爭資產的能力使能因素,將其視為復雜自適應系統簇 (CASoS)。
戰術戰爭是復雜的(Bar-Yam,2004 年)。它需要敏捷、適應性強、具有前瞻性思維、思維敏捷和有效的決策。威脅技術的不斷進步、戰爭節奏的加快、每個戰場情況的獨特性,再加上信息量的增加,而這些信息往往是不完整的,有時甚至是令人震驚的;所有這些因素都導致人類決策者不堪重負(Zhao 等人,2015 年)。自動化 BMA 是解決這種復雜性的一種方法--簡化復雜性,增加理解/知識,并對決策選項進行定量分析。
自動化 BMA 是計算機輔助決策支持系統,旨在加強和改進戰術決策。BMA 可通過以下方式改進決策:加快決策過程;使人們對決策所依據的知識更有信心;制定更多的決策方案;使人們對決策后果有更深入的了解;制定成功概率更大的方案;和/或改進資源使用的優化。軍方目前使用 BMA 共享和處理數據,以開發作戰圖片和態勢感知。不過,本文的重點是構想未來海軍和聯合作戰中的 BMA。
系統方法綜合了分析和合成方法,包括整體論和還原論(Checkland,1993 年)。它強調系統內部各要素之間以及系統與其外部環境之間的相互依存和相互作用(Gharajedaghi,2011 年)。本文提出有必要采用系統方法來構思和設計未來的自動化 BMA。本文首先描述了戰術決策的特點以及未來自動決策輔助工具可能發揮的作用。然后,針對這一復雜的問題空間提出了一種系統方法。
作為自動 BMA 概念化的準備工作,本節介紹了戰斗管理決策的類型。它討論了如何在軍事戰術環境中使用 BMA 來支持人類決策者。最后,它介紹了 "決策復雜性 "的概念以及 BMA 在管理和解決戰術復雜性方面的作用。
軍事戰術行動涉及大量戰斗管理決策。大多數決策涉及戰爭資產的使用或部署,其中包括平臺(艦艇、飛機、潛艇等)、武器、傳感器、通信設備和人員(Johnson、Green 和 Canfield,2001 年)。圖 1 展示了戰爭決策的四個領域:時間領域、空間領域、主動/被動領域以及規則和政策領域。其中每個領域都會影響決策過程,并可能導致決策復雜度增加。
規劃性或主動性決策包括部隊定位(艦艇、戰斗群、飛機等)、隱形行動、進攻性攻擊,以及通過干擾或其他武力措施阻止敵方行動。反應性或響應性決策的例子包括抵御主動威脅、將平臺移動到防御態勢、從威脅環境中撤退以及評估戰斗損失。有效的戰斗管理必須認識到何時主動或被動決策需要自動支持。
圖1 -戰術決策域
軍事決策的性質會隨著時間的推移而變化,可以被視為分等級的。戰略決策的時間跨度較長,考慮的目標層次較高,有時甚至跨越數年。計劃層面的決策時間跨度較短,即使在安排防御時也是積極主動的。戰術決策是戰斗管理的重點,時間跨度最短,涉及近期規劃或主動決策以及應對敵方行動的被動決策。三個時間決策域之間需要保持一致,以實現戰術、計劃和戰略決策之間的兼容。同樣,計劃和戰略需要支持有效的戰術戰爭,并反映戰術威脅環境的重大變化。自動 BMA 的設計應支持分級決策范式,以及支持和適應不同決策時間跨度的范式。
分層時間決策領域的成果之一是一套指導戰術決策的規則和政策。這些規則是近實時決策與長期計劃和戰略保持一致的方法之一。這些規則和政策支持符合更高目標的有效戰術決策。自動決策輔助工具可支持跨時空和跨層級的動態和適應性決策,以實現各層級之間的一致性;考慮各層級的變化可能會如何影響其他層級;以及跨層級有效發布指導意見。
第四種對作戰管理決策進行分類的方法是按照空間領域進行分類,如太空、空中、海上、水下和陸地。在這些作戰環境中,威脅千差萬別。同樣,作戰系統的開發也是為了應對特定的威脅或威脅類型,這自然反映了其空間環境。海軍戰斗群必須同時應對所有空間領域的威脅。自動化 BMA 有可能通過提高跨空間域態勢感知能力,并通過制定可優先執行任務和交戰策略的備選決策來應對這種復雜性。
最終,隨著作戰行動從和平時期到遭遇多域威脅,作戰管理決策空間也從簡單到復雜不斷變化。影響決策空間復雜性的問題空間變化的例子包括:戰斗節奏(或反應時間)、同時發生的威脅(或戰斗事件)的數量、戰斗事件后果的嚴重性、威脅的異質性(由于威脅類型或空間領域)以及事件或事件的范圍(受影響的地區或人口)。所有這些作戰因素都轉化為構成 "決策空間 "的多維變量。隨著決策空間復雜性的增加,軍事決策者可能會力不從心。此時,自動化 BMA 可以為有效決策提供支持。
由于傳感器、網絡、參與者、回傳和情報的增多,作戰空間的信息量也隨之增加。人類決策者被信息淹沒,決策時間縮短。自動 BMA 是有效戰術決策的必要能力。
如圖 2 所示,自動決策輔助工具或 "機器 "可通過多種方式為人類決策者提供支持。圖中顯示了人機決策互動的三種模式(Johnson、Green 和 Canfield,2001 年)。人工決策模式包括人類在頭腦中收集和 "存儲 "相關信息并進行決策分析(處理和決策)的情況。這種模式意味著一個相當簡單明了的決策空間,其中的數據量和變體數量是可以人工管理的。在半自動化模式中,人類決策者可以依靠機器來管理、存儲、融合和處理輸入信息,從而向人類顯示決策分析結果。決策分析可包括對作戰空間和威脅的了解、行動方案(COA)選項以及對預期事件成功率和后果的定量測量。最后,在全自動模式中,人類的作用是監控自動化機器決策過程,并在必要時推翻或更改決策。
針對決策類型建立適當的機制非常重要。一般來說,當問題空間相對簡單,需要考慮的因素數量和信息量在人類決策者的管理范圍內時,決策可由人工執行。對于某些類型的決策,半自動化的人機界面機制最為合適。這對于具有潛在關鍵或嚴重后果的更復雜決策空間是有效的;需要自動化 BMA 的支持,但需要大量的人工參與。全自動人機交互適用于需要處理和融合大量復雜信息,但決策類型非常簡單的決策空間。全自動決策模式適用于和平時期的行動,在這種情況下,決策不會產生嚴重后果,或者適用于高度復雜的行動,在這種情況下,決策反應時間對人類來說過于緊迫。全自動決策模式適用于對信息和情況了解非常有把握的情況。例如,當高度確信被跟蹤物體實際上是敵方威脅目標時。
圖 2 - 人機決策模型
戰斗管理決策支持系統的未來目標是能夠為給定的決策空間選擇適當的決策模型。也許一個靈活的決策架構可以容納所有三種人機模式,并根據需要加以應用。上層結構本身將對決策空間進行監控,評估需要做出何種決策,然后確定人機之間的適當互動,以做出每項決策。
戰斗管理行動十分復雜(Young,2012 年)。如圖 3 所示,戰術環境從和平環境到高度危險的環境都有,來自許多不同方向的威脅多種多樣。這就形成了復雜的戰斗管理決策空間。決策空間的 "狀態 "必須靈活轉變,從正常無威脅行動期間的線性和直接,轉變為作戰行動期間的高度非線性和多變。
圖 3 - 復雜戰術環境中的作戰管理
復雜問題空間的特征包括:復雜的目標、復雜的環境和/或行動;適應性;集體行為;以及決策結果的不可預測性。這些特征都是戰術行動所固有的(Young,2012 年)。戰斗空間呈現出多種目標,這些目標通常不一致且不斷變化。軍事系統必須權衡各自的作戰目標(如自衛)與部隊級任務(可能包括區域防御、隱形作戰或特定資產防御)。由于不利的環境和千差萬別的環境導致目標優先級不斷變化,以及多種跨空間域任務,因此需要復雜的作戰行動。在應對復雜多變的威脅環境時,適應性是作戰系統的必要特征。軍事行動必須有效地適應威脅,以提高生存機會,實現戰術和戰略目標。分布式作戰資產的集體行為必須得到適當的協調,以避免碰撞和友軍誤傷事件的發生;并且最好能從它們的累積貢獻中獲益。最后,戰術決策的結果難以預測,從誤射、錯誤識別到對戰損的錯誤評估,這些不準確的知識和行動漣漪效應以及不可預見的后果使問題空間變得更加復雜。
自動化 BMA 有可能通過描述作戰環境的復雜程度并將這一知識轉化為決策空間,為人類決策者提供支持。理想情況下,完整而準確的作戰空間 "圖像 "將為決策空間提供態勢感知。BMA 可以對 "圖景 "進行監控,并對問題空間的復雜性特征進行評估。這些知識可支持有效、及時地使用決策輔助工具,并使人類決策和機器決策有效地相互作用。
"......只有復雜的系統才能執行復雜的任務(Braha,2006 年)"。
Bar-Yam 寫道:"......高復雜性任務需要一個足夠復雜的系統來完成(Bar-Yam,2004 年)"。戰術軍事行動呈現出高度復雜的環境,轉化為戰爭資產必須執行的復雜任務。本節探討了在軍事行動中實施自動化 BMA 的復雜系統方法,以有效解決戰術問題空間。
上一節從決策的角度描述了作戰管理問題空間的特點;區分了人類決策與自動化決策輔助工具如何支持這些決策;并描述了作戰管理復雜性的特點。本節將介紹一種思考問題空間的方法,作為構思并最終實施系統解決方案的一種手段。
系統性方法的第一步是從系統角度 "看待 "問題和解決方案空間。對于戰術戰爭而言,首先要將戰爭資產視為資源系統。將資產(如:艦船、飛機、潛艇、武器系統、傳感器、通信設備/網絡和干擾器)定義為系統,就可以將其視為資源,并從其功能、性能、行為、結構和界面等方面加以審視。這樣就能根據它們的位置、狀態和預期能力等特征進行定量分析。隨著作戰行動日趨復雜,當存在多個目標重疊和沖突時,自動化 BMA 可以進行分析,以確定戰爭資源的有效利用。在 BMA 的幫助下,戰爭資源的利用可包括在系統間形成協作,以實現系統的行為和能力,從而更好地應對復雜的戰術任務。圖 4 展示了作為系統之系統的作戰資產網絡化協作。
"多維性可能是系統思維最有力的原則之一。它能夠從對立的趨勢中看到互補關系,并用不可行的部分創造出可行的整體(Gharajedaghi,2011 年)"。通過將作戰空間視為一組相互作用的系統,利用其多維性的能力可支持跨越空間和時間領域的部隊級協作行為。它使分層防御和綜合火力控制戰略成為可能,其中涉及到分布式武器和傳感器。當存在復雜的多維目標時,自動 BMA 可提供定量分析,以確定協作資源的利用情況。
圖 4 - 將作戰資產視為系統資源
復雜的戰術環境要求從部隊層面以整體視角管理戰爭資源。隨著環境變得越來越復雜,事件發生得越來越快,而且是并行發生。決策數量和所需行動方案的數量都在增加。對有限的戰爭資源提出了更多的要求,其任務、目標和行動方案的相互關聯性也越來越強。從 "整體 "上了解多種威脅和任務,以及應對這些威脅和任務的可能方案和可能后果,就能做出更有效的軍事反應,這可能是有效應對高要求威脅的必要條件。作戰空間視角的概念可被描述為 "決策范圍",或圍繞問題空間和解決方案空間設定邊界。更全面的決策范圍包括一個地區或戰區,以及該地理空間區域內的所有威脅和戰爭資源。較窄的決策范圍可能只包括特定威脅和特定平臺及其相關資產。
確定決策范圍既是限制因素,也是必要的促進因素。隨著作戰環境日趨復雜,戰術決策在因果關系上變得更加相互依賴和 "混亂"(Jackson 和 Keys,1984 年)。當只有一個威脅需要清除或一個區域需要觀察時,做出特定的武器交戰決策或傳感器任務分配決策就比較簡單。然而,如果將決策范圍縮小到發射單一武器系統或管理一艘艦艇上的傳感器,就會在需要處理多個戰術任務或需要優先處理和應對多個威脅時,失去其在部隊層面的整體有效性。在這種情況下,"整體性 "原則適用于決策,包括 "同時和相互依賴地盡可能多地考慮系統的各個部分和層次(杰克遜和凱斯,1984 年)"。換言之,擴大決策空間的范圍,或許可以考慮一個戰術區域或戰區。確定決策范圍本身就是一項決策。我們的目標是設計出支持靈活決策范圍的未來部隊架構,當部隊層面的任務變得更加復雜并可能受益于分布式作戰資產協作時,決策范圍可以擴大。
一旦戰術軍事力量面臨復雜的作戰問題空間,未來的自動化 BMA 就能建立更全面、更廣泛的決策范圍,并支持平臺和部隊層面的資源管理。最終,各種自動化 BMA 可支持不同層面的資源使用。支持特定傳感器和武器的 BMA 可由更高層次的 BMA 架構進行協調。因此,可以實施一個 BMA 系統體系。
決策空間 "可視為一個系統。通過對決策空間采取系統方法,可以定義邊界、輸入和輸出、功能、性能和結構。圖 5 展示了決策空間的背景環境。戰斗空間的知識(或態勢感知)是作為 "問題空間"(或作戰戰術圖)來開發和維護的。它包括跟蹤的威脅目標以及地形、天氣、防御資產和現實世界中的所有其他物理實體。此外,還必須開發和維護 "資源圖",其中包括戰爭資產的最新狀態、健康狀況、戰備狀態和預計能力。問題空間和資源圖景是決策空間的主要輸入。
概念決策空間系統的邊界圍繞決策架構和決策分析,其中包括決策輔助、評估、優先排序、備選方案生成和整體決策管理。決策空間系統的主要功能是開發決策備選方案。這些備選方案為管理戰爭資源資產提供建議。例如,傳感器任務分配、行動方案、武器調度、平臺(艦船、飛機等)移動等。次要功能包括估計與決策備選方案相關的置信度,以及為備選方案提供信息的多種類型的分析。分析實例包括:確定威脅的優先次序、兵棋推演可能產生的后果、估計傳感器誤差、估計知識的準確性和完整性、評估作戰復雜性、推薦最佳的人機決策互動。圖 5 所示的簡化概念沒有說明人機決策空間之間的互動。但在戰術行動中,這種互動將非常重要。
圖 5 - 決策空間的映射
概念決策空間系統的輸出可包括決策備選方案、預測后果估計、成功和失敗的估計概率,以及與源信息、備選方案和一般知識相關的置信度。
在對BMA的系統方法進行概述的過程中,最后一步是對解決方案空間進行概念化。為了能夠對復雜的威脅空間做出戰術反應,解決方案空間包括有效利用分布式戰爭資產/資源。解決方案必須隨著威脅環境的變化而及時改變和調整。有時,進攻行動是最佳選擇;有時,單一平臺即可應對威脅;有時,可能需要并行或串聯多種進攻、防御、協作和自主行動。解決方案空間能夠從簡單操作無縫轉向復雜操作,從而改變其系統狀態的性質,這是一項具有挑戰性的要求。
本文將解決方案空間概念為復雜自適應系統簇(CASoS)(格拉斯,2011 年),其中分布式戰爭資源作為系統的系統進行交互,表現出突發性(部隊級)行為,并適應不斷變化的作戰環境。這類系統是有效解決復雜戰術問題空間所需的解決方案。設計未來戰爭系統使其表現為 CASoS,需要自動化 BMA 的決策架構和解決方案空間,以提供以下三種能力(Johnson,2017 年):
1.自適應關系--自適應智能架構可實現組成系統之間的靈活相互關系,這些系統最終構成一個自適應 SoS,能夠應對不斷變化的復雜環境。
2.由智能組成系統組成的系統--CASoS 的自適應突發行為受分布式組成系統自我管理的支配,這些組成系統可根據復雜情況的需要進行協作或獨立行動。
3.知識發現和預測分析--工程化 CASoS 的關鍵在于獲取和維護有關環境和分布式組成系統的共享態勢知識的能力。對這些知識進行分析,可確定任務的優先次序;制定任務和行動方案(對問題空間的自適應響應);制定 "假設 "和 "如果-那么 "預測方案,以形成未來智能決策和自適應 SoS 關系的綜合體。
決策空間必須支持概念化的 CASoS 解決方案空間。這種復雜應用的決策空間可以看作是一個 BMA 系統,由整體部隊級管理決策輔助工具支持與特定資源或平臺系統相關的低級 BMA 的協調。整體級 BMA 可以管理問題空間信息,并專注于高層次問題,如評估復雜程度、確定決策范圍和建議人機決策互動。所有這些都需要自動化的 BMA、自適應架構、"可執行任務 "的作戰資源以及支持這種系統方法的指揮與控制文化。
總之,作戰管理問題空間是復雜的,而且隨著更多傳感器、更多信息、更多無人威脅、更多非國家對手和技術進步,其復雜性只會繼續增加。要想在這一問題空間中保持領先,就必須構思并最終實現一個復雜的解決方案空間,以促進快速行動和高度響應的戰爭利用。系統方法通過提供整體性、系統視角以及將決策空間定義為一個系統的系統,為解決所需的多維和適應性決策提供了一種方法。它將問題定義為 "CASoS",并強調了對決策架構的需求,這種架構可實現自適應關系、系統級情報、共享知識和預測分析。有效利用自動化 BMA 支持人類決策為 CASoS 解決方案空間奠定了基礎。
參考來源:美國海軍研究生院
介紹將提出一個分析武裝部隊作戰能力的模型,包括考慮電子戰的某些方面。該模型應通過確定關鍵目標來確定和優先考慮所需的能力:確定未來的安全環境和其中的作戰環境,確定規劃方案和對未來武裝部隊的要求,包括執行電子戰的部隊。確定與武裝部隊使命和任務相關的具體任務,確認能力目錄中的所需能力清單。本文介紹了確定所需能力和找出差距的思路。分析過程中提出的關鍵問題是 確定的能力是否與任務和作戰概念以及威脅相匹配?實現所需作戰能力的衡量標準是什么?為武裝部隊提供所需能力的成本可能是多少?解決問題的關鍵方法是什么?采用基于能力的方法進行規劃,包括確定武裝部隊的參考(計算)單元,包括電子戰單元。一個重要的問題是使用正式和模擬方法確定作戰能力的尺寸。因此,在具有所需能力的參考模塊的基礎上,構建了一個優化模型,以確定武裝部隊的結構,從而能夠實施已確定的作戰概念,同時考慮到以下標準:作戰和成本。該分析以武裝部隊運作的數學模型為基礎,提出了自己的模擬模型。模擬以逐步分析引入的場景、對手的可能結構和確定的任務為基礎。工作中提出的方法還為評估武裝部隊的預算發展提供了一個工具。
圖:基于能力的規劃范方案
為了真實地再現軍事行動,嚴肅的戰斗模擬要求建模實體具有合理的戰術行為。因此,必須定義作戰戰術、條令、交戰規則和行動概念。事實證明,強化學習可以在相關實體的行為邊界內生成廣泛的戰術行動。在多智能體地面作戰場景中,本文展示了人工智能(AI)應用如何制定戰略并向附屬單元提供命令,同時相應地執行任務。我們提出了一種將人類知識和責任與人工智能系統相結合的方法。為了在共同層面上進行交流,人工智能以自然語言下達命令和行動。這樣,人類操作員就可以扮演 "人在回路中 "的角色,對人工智能的推理進行驗證和評估。本文展示了自然語言與強化學習過程的成功整合。
為了獲得模型架構的靈感,我們研究了 DeepMind 的 AlphaStar 架構,因為它被認為是復雜 RL 問題領域的最先進架構。通過我們的架構(如圖 2 所示),我們提出了一種靈活、可擴展的行動空間與深度神經網絡相結合的適應性新方法。觀察空間的設計基于如何準備戰場的軍事經驗。通常使用地圖和可用部隊表。因此,模擬觀測被分為標量數據(如可用坦克數量及其彈藥)。同時,基于地圖的輸入作為視覺輸入提供給空間編碼器。
標量數據用于向人工智能提供幾乎所有場景細節的建議。其中包括有關自身部隊及其平臺的數據,以及有關敵方部隊的部分信息。輸入并非以絕對數字給出,而是采用歸一化方法來提高訓練效果。編碼器可以很容易地寫成多層感知器(MLP);不過,使用多頭注意力網絡可以大大提高訓練后智能體的質量,因此應予以采用(Vaswani 等人,2017 年)。
為了理解地理地形、距離和海拔高度的含義,人工智能會被輸入一個帶有實體編碼的地圖視覺表示。顏色方案基于三通道圖像,這使我們能夠輕松地將數據可視化。雖然使用更多通道會給人類的圖形顯示帶來問題,但人工智能能夠理解更多通道。不同的字段類型和實體會用特殊的顏色進行編碼,以便始終能夠區分。這種所謂的空間編碼器由多個卷積層組成。最初,我們嘗試使用 ResNet-50 (He 和 Zhang,2016 年)和 MobileNetV3 (Howard 等,2019 年)等著名架構,甚至使用預先訓練的權重。然而,這并沒有帶來可接受的訓練性能。因此,我們用自己的架構縮小了卷積神經網絡(CNN)的規模。
為了測試和優化這一架構,我們使用了一個自動編碼器設置,并使用了模擬中的真實樣本。我們能夠將參數數量從大約 200 萬減少到大約 47000。此外,我們還生成了一個預訓練模型,該模型已與模擬的真實觀測數據相匹配。這一步極大地幫助我們加快了 RL 進程。
一個可選元素是添加語言輸入,為人工智能定義任務。雖然一般的戰略人工智能不使用這一元素,但計劃將其用于下屬智能體。這些智能體將以自然語言接收來自戰略人工智能的任務,并使用雙向門控遞歸單元(GRU)編碼器對其進行處理。
視覺數據、任務數據和標量數據的編碼值被合并并輸入核心網絡。根據 Hochreiter 和 Schmidhuber(1997 年)的介紹,核心主要是一個擁有 768 個單元的長短期記憶(LSTM)組件。在軍事場景中,指揮官必須了解高價值資產的長期戰略規劃。在本模擬中,人工智能可以請求戰斗支援要素,這些要素在影響戰場之前需要長達 15 分鐘的時間。因此,人工智能必須了解未來任務的時間安排和規劃。在 RL 中使用 LSTM 網絡相當困難,因為它需要大量的訓練時間,而且會導致上面各層的梯度消失。因此,我們決定在 LSTM 上添加一個跳過連接,以盡量減少新增層的負面影響。
動作頭由一個自然語言處理(NLP)模型組成。這是一個非常簡化的動作頭模型,包含一個小型 LSTM 和一個額外的密集層,共有約 340000 個參數。其結果是一個尺寸為 8 x 125 的多離散動作空間。
除主模型外,還有一個單獨的價值網絡部分。價值網絡使用核心 LSTM 的輸出,并將對手信息串聯起來傳遞給 MLP。然后,MLP 可以精確預測價值函數。通過對手信息,價值網絡對模擬有了一個上帝般的地面實況視圖。由于該網絡只與訓練相關,因此可以在不干擾訓練完整性的情況下進行。
本文提出了一種基于古代戰爭策略的新型元啟發式優化算法。所提出的戰爭策略優化(WSO)基于戰爭期間陸軍部隊的戰略移動。戰爭策略被模擬為一個優化過程,其中每個士兵都朝著最優值動態移動。所提出的算法模擬了兩種流行的戰爭策略,即攻擊和防御策略。士兵在戰場上的位置會根據所實施的戰略進行更新。為了提高算法的收斂性和魯棒性,引入了一種新的權重更新機制和一種弱士兵遷移策略。所提出的戰爭策略算法實現了探索階段和開發階段的良好平衡。介紹了該算法的詳細數學模型。在 50 個基準函數和四個工程問題上測試了所提算法的有效性。該算法的性能與十種流行的元啟發式算法進行了比較。各種優化問題的實驗結果證明了所提算法的優越性。
古代王國擁有一支軍隊,以抵御其他王朝的進攻。王國的陸軍由步兵、戰車、大象等各種力量組成。在戰爭中,每個王國都會設計一種被稱為 "Vyuha "的戰略來攻擊對方的陸軍,以取得戰斗的勝利,從而確立自己的霸主地位。Vyuha 是戰爭中用于征服對方王國的各種陸軍部隊的模式或排列[69]。為了確保自己的陸軍達到預定目標,實現目標,皇帝和各單元的指揮官會按照特定的模式協調部隊。戰爭戰略是根據任務的目標、威脅、困難和前景制定的。戰爭戰略是一個持續的動態過程,在這個過程中,武裝力量只需協調并與對手作戰。隨著戰爭的進展,這種戰略可以適應不斷變化的條件。國王和指揮官的位置對陸軍士兵的位置有著持續的影響。國王和陸軍指揮官戰車頂部的旗幟代表他們的位置,所有士兵都能觀察到。團隊中的士兵接受訓練,根據鼓聲或其他樂器的聲音來制定策略。當一名軍事指揮官死亡時,戰略就會發生變化,其他每名指揮官都必須學會如何重建和繼續戰爭戰略的建立。國王的目標是征服對方的國王/首領,而陸軍士兵的主要目標則是攻擊對方隊伍,并在軍銜上取得進步。
戰爭戰略的各個步驟如下:
A. 隨機攻擊
在戰場上,陸軍部隊以戰略方式隨機分布在整個戰場上,攻擊對面的軍隊。軍隊中攻擊力最強的人員被視為陸軍首領或指揮官。國王是各軍團長的領導者。
B. 攻擊戰略
該戰略的主要目標是攻擊對方。國王帶頭并指導陸軍部隊。陸軍部隊找出對手的薄弱位置(有希望的搜索空間)并繼續進攻。國王和指揮官乘坐兩輛不同的戰車,戰車頂端插有戰略旗幟。士兵根據國王和指揮官的位置動態改變自己的位置。如果士兵成功提高攻擊力(體能值),他的軍銜就會提高。隨著士兵的晉升,他將成為其他人的好榜樣。但是,如果新的位置不適合作戰,士兵就會回到原來的位置。戰爭初期,陸軍部隊向四面八方移動,大步流星地改變自己的位置。
C. 鼓聲信號
國王會根據戰場上的局勢動態地改變戰略。因此,一群士兵會有節奏地擊鼓。士兵們會根據鼓聲的節奏改變策略,調整位置。
D. 防御戰略
這一戰略的主要目標是在不輸掉戰斗的情況下保護國王。指揮官或陸軍首領帶頭,利用陸軍部隊形成像鎖鏈一樣的包圍圈,將國王團團圍住。因此,每個士兵都會根據附近士兵的位置和國王的位置改變位置。陸軍部隊在戰爭中會嘗試探索大面積的戰場(搜索空間)。為了迷惑對方軍隊,陸軍會不時動態改變策略。
E. 薄弱士兵的替換/轉移
在戰斗中,戰斗技能最低的士兵或受傷的士兵可以與敵軍士兵同等對待。由于他的表現不佳,陸軍的威信完全受到威脅(算法效率)。戰爭中死亡的士兵很少,這可能會影響戰爭的結果。在此,陸軍有兩種選擇。一是用新兵替換受傷/體弱的士兵。第二個選擇是重新安置體弱的士兵。因此,他將受到所有其他士兵的引導(所有士兵的平均位置)和隔絕,以保護他,從而保持陸軍的士氣,使其在戰爭中獲勝的幾率很高。
F. 對方的陷阱
對方陸軍會根據自身的能力采用各種策略,迫使前軍向錯誤的方向移動或到達錯誤的目標(局部最優)。
美國陸軍對人工智能和輔助自動化(AI/AA)技術在戰場上的應用有著濃厚的興趣,以幫助整理、分類和澄清多種態勢和傳感器數據流,為指揮官提供清晰、準確的作戰畫面,從而做出快速、適當的決策。本文提供了一種將作戰模擬輸出數據整合到分析評估框架中的方法。該框架有助于評估AI/AA決策輔助系統在指揮和控制任務中的有效性。我們的方法通過AI/AA增強營的實際操作演示,該營被分配清理戰場的一個區域。結果表明,具有AI/AA優勢的模擬場景導致了更高的預期任務有效性得分。
美國陸軍目前正在開發將人工智能和輔助自動化(AI/AA)技術融入作戰空間的決策輔助系統。據美國陸軍機動中心稱,在決策輔助系統等人工智能/輔助自動化系統的協助下,士兵的作戰效率可提高10倍(Aliotta,2022年)。決策輔助工具旨在協助指揮官在作戰場景中減少決策時間,同時提高決策質量和任務效率(Shaneman, George, & Busart, 2022);這些工具有助于整理作戰數據流,協助指揮官進行戰場感知,幫助他們做出明智的實時決策。與使用AI/AA決策輔助工具相關的一個問題是,陸軍目前缺乏一個有效的框架來評估工具在作戰環境中的使用情況。因此,在本文中,我們將介紹我們對分析框架的研究、設計和開發,并結合建模和仿真來評估AI/AA決策輔助工具在指揮和控制任務中的有效性。
作為分析框架開發的一部分,我們進行了廣泛的文獻綜述,并與30多個利益相關者進行了利益相關者分析,這些利益相關者在人工智能/AA、決策輔助、指揮與控制、建模與仿真等領域具有豐富的知識。根據他們對上述主題的熟悉程度,我們將這些利益相關者分為若干焦點小組。我們與每個小組舉行了虛擬焦點小組會議,收集反饋意見,并將其用于推動我們的發現、結論和建議(FCR)。同時,我們還開發了一個逼真的戰場小故事和場景。利用該場景和我們的FCR輸出,我們與美國陸軍DEVCOM分析中心(DAC)合作開發了一個功能層次結構,通過建模和仿真來測量目標。我們將假設的戰斗場景轉移到 "一個半自動化部隊"(OneSAF)中,該模擬軟件利用計算機生成部隊,提供部分或完全自動化的實體和行為模型,旨在支持陸軍戰備(PEOSTRI, 2023)。使用分析層次過程,我們征詢了評估決策者的偏好,計算了功能層次中目標的權重,并創建了一個電子表格模型,該模型結合了OneSAF的輸出數據,并提供了量化的價值評分。通過A-B測試,我們收集了基線模擬和模擬AI/AA效果的得分。我們比較了A情景和B情景的結果,并評估了AI/AA對模擬中友軍任務有效性的影響。
分析評估框架可針對多標準決策問題對定量和/或定性數據進行評估。定性框架,如卡諾模型(Violante & Vezzetti, 2017)、法式問答(Hordyk & Carruthers, 2018)和定性空間管理(Pascoe, Bustamante, Wilcox, & Gibbs, 2009),主要用于利益相關者的投入和頭腦風暴(Srivastava & Thomson, 2009),不需要密集的計算或勞動。定量評估框架以數據為導向,提供一種數學方法,通過衡量性能和有效性來確定系統的功能。分析層次過程(AHP)適用于我們的問題,因為它使用層次設計和成對的決策者偏好比較,通過比較權重提供定性和定量分析(Saaty,1987)。雖然AHP已被廣泛應用,但據我們所知,該方法尚未被用于評估人工智能/自動分析決策輔助工具,也未與A-B測試相結合進行評估。
指揮與控制(C2)系統用于提供更詳細、更準確、更通用的戰場作戰畫面,以實現有效決策;這些C2系統主要用于提高態勢感知(SA)。研究表明,使用數字化信息顯示方法的指揮官比使用無線電通信收集信息的指揮官顯示出更高水平的態勢感知(McGuinness和Ebbage,2002年)。AI/AA與C2的集成所帶來的價值可以比作戰斗視頻游戲中的 "作弊器":它提供了關于敵方如何行動的信息優勢,并幫助友軍避免代價高昂的后果(McKeon,2022)。對C2系統和SA的研究有助于推動本文描述的小故事和場景的發展。
建模與仿真(M&S)是對系統或過程的簡化表示,使我們能夠通過仿真進行預測或了解其行為。M&S生成的數據允許人們根據特定場景做出決策和預測(TechTarget,2017)。這使得陸軍能夠從已經經歷過的作戰場景和陸軍預計未來將面臨的作戰場景中生成并得出結論。模擬有助于推動陸軍的能力評估。測試和評估通常與評估同時進行,包括分析模型以學習、改進和得出結論,同時評估風險。軍隊中使用了許多不同的M&S工具。例如,"步兵戰士模擬"(IWARS)是一種戰斗模擬,主要針對個人和小單位部隊,用于評估作戰效能(USMA, 2023)。高級仿真、集成和建模框架(AFSIM)是一種多領域M&S仿真框架,側重于分析、實驗和戰爭游戲(West & Birkmire, 2020)。在我們的項目范圍內,"一支半自動化部隊"(OneSAF)被用于模擬我們所創建的戰斗情況,以模擬在戰場上擁有人工智能/自動機優勢的效果。
如前所述,人工智能/AA輔助決策的目標是提高決策的質量和速度。人工智能可用于不同的場景,并以多種方式為戰場指揮官和戰士提供支持。例如,人工智能/AA輔助決策系統可以幫助空中和地面作戰的戰士更好地 "分析環境 "和 "探測和分析目標"(Adams, 2001)。人工智能/自動機輔助決策系統可以幫助減少人為錯誤,在戰場上創造信息和決策優勢(Cobb, Jalaian, Bastian, & Russell, 2021)。這些由AI/AA輔助決策系統獲得的信息分流優勢指導了我們的作戰小故事和M&S場景開發。
在我們的作戰小故事中,第1營被分配到一個小村莊,直到指定的前進路線。營情報官羅伊上尉(BN S2)使用AI/AA輔助決策系統(即助手)準備情報態勢模板(SITTEMP),該系統可快速收集和整合積累的紅色情報和公開來源情報衍生的態勢數據。然后,它跟隨瓊斯少校和史密斯上尉,即營行動指揮員(BN S3)和S3助理(AS3),使用AI/AA輔助決策系統制定機動行動方案(COA),以評估 "假設 "情景、 她根據選定的機動方案開發指定的利益區域(NAI),然后在其內部資產和上層資源之間協調足夠的情報、監視和偵察(ISR)覆蓋范圍。假設時間為2030年,雙方均不使用核武器或采取對對方構成生存威脅的行動,天氣條件對藍軍和紅軍的影響相同,時間為秋季,天氣溫暖潮濕。
作為解決方案框架背景研究的一部分,我們與32位民用和軍用利益相關者進行了接觸,他們都是AI/AA及其對決策和仿真建模的貢獻方面的專家。我們進行的利益相關者分析過程如下: 1)定義和識別利益相關者;2)定義焦點小組;3)將利益相關者分配到焦點小組;4)為每個焦點小組制定具體問題;5)聯系利益相關者并安排焦點小組會議;6)進行焦點小組會議;7)綜合并分析利益相關者的反饋;以及8)制定FCR矩陣。我們利用FCR矩陣的結果來繪制功能層次圖,其中包括從模擬場景中生成/收集的目標、衡量標準和度量。然后根據這些目標、措施和指標對任務集的重要性進行排序。這為使用層次分析法(如下所述)奠定了基礎。
AHP是托馬斯-薩蒂(Thomas Saaty)于1987年提出的一種方法,它利用專家判斷得出的一系列成對比較,將功能層次結構中的每個功能和子功能放入一個優先級表中。然后通過有形數據或專家定性意見對各種屬性進行排序。如表1所示,這些排序被置于1-9的范圍內。在賦予每個屬性1-9的權重后,再賦予標準和次級標準權重,以顯示其相對重要性(Saaty,1987)。
如何確保一個組織有能力在不斷變化的不利環境下進行協調?以及如果需要的話,如何能夠轉移負責協調的人?這些都是努力實現復雜目標的軍事和民事組織的關鍵問題。這方面的例子包括:陸海空軍事資產或警察、衛生、消防部門等機構的整合。在這篇文章中,我們探討了協調能力的特點和可能的影響,以及可用的協調形式,即誰可以被指定為協調。我們報告了一個軍事組織的調查結果,用調查來闡明所需的能力,用演習中的溝通記錄來闡明所使用的協調形式。關于能力,我們發現在聯合層面上強調的是能夠掌握協調的權力,在戰術層面上強調的是對各種團隊的理解,在次戰術層面上強調的是對戰術任務的具體專業知識。關于協調形式,我們發現在演習期間,組織的協調形式從等級制轉變為更多的授權,然后又回到等級制。我們的發現闡明了為了協調,哪些類型的能力可以在組織成員之間分配。此外,所頒布的協調形式雖然有用,但可能限制性太強,無法實現向更分散的協調形式的轉變。我們指出了對我們的假設進行操作分析測試的進一步方向,如通過更廣泛的演習記錄(如共同作戰圖)和表現。
北約科技組織(STO)應用車輛技術(AVT)329 "NexGen旋翼機對軍事行動的影響 "評估了2035+時間框架內適用科學技術(S&T)發展對軍事行動的潛在影響。對預計的未來任務進行的兩次作戰分析(OA)評估時,評估采用了基于風險的主題專家判斷。
利用定義的任務小插曲,參與評估的主題專家確定了利用當前北約軍用直升機能力實現各項任務的風險。然后評估每個風險發生的可能性和對實現任務的影響。對于每個風險,確定的緩解措施包括技術的應用、戰術的改變和其他措施。隨后對確定的風險緩解措施的行動影響進行了評估,以確定其軍事價值。
基于風險的評估框架使來自多個北約和伙伴國的具有軍事行動、需求和技術專長的主題專家能夠進行定性評估。由于所有參與者以前都熟悉風險評估過程,該框架很容易被調整為進行貿易空間業務需求和關鍵技術的審計。
近幾十年來,國防系統的規劃已經演變成基于能力的規劃(CBP)過程。本文試圖回答兩個問題:首先,如何表達一個復雜的、真實世界的能力需求;其次,如何評估一個具有交互元素的系統是否滿足這一需求。我們建議用一套一致的模型以可追蹤的方式來表達能力需求和滿足該需求的解決方案。這些模型將目前的能力模型,具體到規劃級別和能力觀點,與系統思維方法相結合。我們的概念模型定義了環境中的防御系統,數據模型定義并組織了CBP術語,類圖定義了CBP規劃元素。通過給出一個能力參數化的例子來說明這個方法,并將其與DODAF能力觀點和通用CBP過程進行比較。我們的數據模型描述了能力在行動中是如何退化的,并將該方法擴展到能力動態。定量能力定義的目的是支持解決現實世界中相互作用的子系統,這些子系統共同實現所需的能力。
在本節中,能力被定義為執行任務的效果或功能并作為系統時,我們討論CBP;在1.2小節中進一步討論Anteroinen的分類中的第三和第五類。為了專注于軍事系統或軍事單位的結構定義和未來的數學建模,只考慮系統的物理組成部分,即人員和物資,以及他們與能力的關系。環境的影響--天氣條件、地形、周圍的基礎設施和其他軍事單位--被省略,以關注兩種力量之間的相互作用;盡管在實踐中,環境和其他更廣泛的系統問題顯然是相關的。通常情況下,CBP過程定義了環境的相關方面和軍事行動的類型,為能力需求定義、能力評估和解決方案選擇制定了可能的規劃情況集合。
一個軍事單位或一個組織由其人員和物資組成。經過組織和訓練的人員配備了適當的物資,代表、擁有或產生能力。當兩個軍事單位相互作戰時,他們會啟動自己的能力,以造成敵人的物資和人員的退化。為了定義能力需求并計劃如何作為軍事單位或系統來實施,需要解決的問題是:在與敵人的互動過程中,能力將如何演變,而敵人的能力卻鮮為人知?圖1說明了在敵人能力的作用下,自己的軍事作戰和維持能力的動態互動。我們的能力削弱了敵方的人員和物資,對敵方的能力產生了影響;而敵方的能力削弱了我們的人員和物資,對我們的能力產生了影響。外部資源,也就是供應和維持能力,維持著被削弱的人員和物資。如因果循環圖所示,敵方的能力可以與我方的能力對稱地表示。第3節的進一步建模集中在我們自己的能力上,由圖1中的虛線表示,以便更純粹地表示。
對我們自己的能力的定義說明,由人員和物資提供,表明了復雜的結構和與能力有關的功能和元素之間的相互作用。此外,真正的軍事單位,通常由較小的編隊組成,有幾種能力,由大量不同的物資和人員組成,并與環境互動。
架構被定義為 "一個系統在其環境中的基本概念或屬性,體現在其元素、關系以及設計和進化的原則中"。因此,架構描述是一種表達架構的工作產品。架構框架是在一些應用領域或社區應用架構描述的基礎。架構框架為網絡系統的復雜性管理提供了結構化的方法,使利益相關者之間能夠進行溝通,并支持未來和現有系統的系統分析和設計。企業架構的Zachman框架是這類通用框架的一個例子。DoDAF、MODAF和NAF是用于國防系統分析和定義的架構框架,特別是用于指揮、控制、通信、計算機、情報、監視和偵察系統(C4ISR)。這些架構框架由觀點組成,定義了代表特定系統關注點的一組架構視圖的規則。架構視圖由一個或多個模型組成。架構框架基礎的元模型定義了不同視點中元素之間的關系。DoDAF元模型DM2有一個概念數據模型圖(DIV-1),用來向管理者和執行者傳達架構描述的高層數據構造的概念。MODAF元模型詳細定義了每個架構視圖的數據模型。
利益相關者需要適當的支持,以促進他們彼此之間以及與規劃專家團體的溝通,從而從CBP方法中獲益。軍事專家的作用不是參與復雜的工具和方法,而是為規劃過程提供重要的領域專業知識。架構框架是一個很好的工具,可以定義當前的防御系統,確定能力需求,并描述系統解決方案。不幸的是,架構框架和相關元模型的精確但復雜的機制與復雜的符號并不一定能以明顯的方式解釋能力觀點和要素之間的關系。因此,架構觀點和典型的CBP流程并沒有明顯的聯系。因此,參與能力規劃的軍事專家和決策者很少能夠加深理解,或者在沒有專門掌握這些工具和方法的人員的情況下,通過應用架構框架確定解決方案。需要對能力進行更簡單的定義,與流程兼容。
圖2提出了一個高層次的數據模型,它代表了能力定義問題的抽象。數據模型描述了能力模型類型及其關系,作為能力和防御系統建模的框架。符號的選擇是為了保持信息量,但對更多的人來說是可讀的,因此它不遵循任何特定的方法,但與SODA的認知圖譜有一些共同點。
能力的現實世界實例在圖的左邊,而概念模型類型在右邊。該模型的第一個版本已經被Koivisto和Tuukkanen應用于一個基于研發的自下而上的過程和概念性的未來系統,即認知無線電。原始模型描述,系統模型定義了物資、戰斗力和功能能力。實際上,這是一種雙向的關系:在所需能力和所需資源的驅動下建立系統模型,然后用系統模型來預測特定環境和實例中的結果。
防御系統由系統、系統要素及其相互作用組成,其突發屬性由系統、系統要素和它們的相互作用界定。圖3中的模型代表了系統層次結構中的防御系統層次。防御系統可以被看作是SoS,但我們應用一般的系統術語來保持模型的可擴展性,并為防御系統層次結構的較低層次提供合適的術語。在國防系統層次結構的任何一級,系統代表一個由系統元素組成的軍事單位:人員和物資。
圖3 國防系統在其背景下的概念系統模型。防御系統,即利益系統(SOI),被環境和其他行為者的系統所包圍。這些系統包括相互作用的系統要素人員(P)和物資(M)。子系統和系統元素之間的聯系是示范性的。
除了系統元素和它們的組織之外,還要定義功能和相應的輸出,以獲得更全面的系統定義。我們將能力定義為執行任務的效果或功能,是一種功能能力。在CBP過程中,功能能力定義了一些當前或計劃中的軍事單位或由物資和人員組成的系統的能力潛力。最終,能力發展過程必須以現實世界的軍事單位來定義系統的實施。力量要素的概念定義了最終的系統結構,也就是要生產的現實世界的軍事單位的組織。在我們的數據模型中,功能能力被安排在SOI內部,以代表系統的涌現屬性。當這種潛力或涌現被計劃為引起某種效果時,系統,具體來說是其功能能力,在計劃過程中被分配到一個任務中。此外,當軍事單位執行任務時,效果就會產生。高層數據模型的作用,如圖4,是將關鍵的術語及其關系可視化。
圖 4 基于能力的規劃中術語及其關系的高級數據模型表示
圖5中的類圖將圖3所示的概念系統模型中確定的國防系統規劃要素與圖4中的能力模型類型結合起來。由于我們關注的是國防系統,國家權力和軍事力量的要素被認為是其環境的一部分,不在圖中。然而,我們建議,國家權力也可以通過效應來表示。
圖 5 基于能力的規劃元素的統一建模語言 (UML) 類圖表示
本文重點介紹了 10 種武器系統,這些系統具有的特征可能有助于考慮武器系統的自主性。它旨在展示用于各種領域的武器系統類型的多樣性,以及能力的增強;包括打擊范圍、目標類型、共同運行的系統數量以及無需人工操作即可進行的活動范圍。這些指向自主性的趨勢,這可能有助于確定可能需要監管以確保遵守道德和法律規范的領域。
探測目標并根據傳感器輸入對其打擊的武器已經存在多年。這類系統與那些由人類操作者設定具體位置和時間點以進行打擊的系統不同。在很大程度上,這些都是 "防御性"武器系統,通常在其位置上是固定的,與人類操作者同處一地,并具有固定的 "目標輪廓",限制了它們可以攻擊的目標類型。
然而,近年來的技術發展導致具有自主功能的武器系統能力增加,包括更大的地理區域和行動時間,以及更復雜或可改變的目標輪廓的潛力。這種擴大的獨立操作范圍引起了人們對如何將人類的 "控制 "應用于此類系統,或如何將其理解為具有足夠的 "可預測性 "的關注。目標輪廓的變化也引起了相關的關注,以及在使用武力時被認為有 "非人化 "的風險。這些主題是關于限制武器系統自主權的國際法律討論的核心。
在過去的幾年里,看到生產商的數量和多樣性都在增加,自主武器系統所處環境類型的變化,以及隨著自主性的增強,武器系統的能力也在發生變化。
來自越來越多國家的越來越多公司正在開發具有越來越多自主功能的非飛行武器系統。在過去,主要是美國、西歐、韓國和以色列在這個領域處于領先地位。最近幾年,來自中國、俄羅斯、土耳其和東歐的生產商出現得更多。更廣泛地說,幾乎每一個擁有大量國內武器開發能力的國家也在為其產品增加自主功能。
大多數武器系統的自主目標定位最初是針對通常不太復雜的領域--海洋(地下和表面)和空中的目標物體。這方面的一個例外是地雷,它也使用傳感器來探測并對目標施力,并且與重大的人道主義問題有關。然而,其他具有自主功能的武器系統是在更簡單的環境中使用的,這些環境呈現出更均勻的地形,與之互動的固定物體和車輛較少,這也導致了更容易的背景,以正確識別預定目標。然而,最近,看到無人駕駛地面車輛(UGVs)的數量在增加--由于環境的復雜性,操作上的成功率有高有低。目前,UGVs仍然需要人類操作員在環境中遠程導航。在空中,游蕩彈藥的生產有了很大的擴展,這些航空器可以攻擊地面上的目標。這種系統可以在指定的地理區域內搜索潛在的目標一段時間。當打擊陸地上的目標時,這些系統可以將具體何時何地發生武力的不確定性與地面上平民和物體的相對豐富和多樣性結合起來。因此,據報道,目前的許多游蕩彈藥都有一個人類操作者,在彈藥與目標交戰之前必須批準攻擊。
縱觀具有自主功能的武器系統的能力,近年來在以下方面有所提高:
使部件更小、更輕的能力,加上更長的電池壽命,擴大了操作的時間和地理區域。由于信息技術(包括處理能力、大數據、神經網絡、模式識別)和傳感器(包括電子光學和紅外攝像機)的進步,自動目標識別的發展導致了更多種類的目標輪廓的潛力。最近幾年也出現了對蜂群技術的重視,例如在中國、美國、俄羅斯和土耳其的軍事項目。目前,大多數蜂群要么是遙控的,要么是預先編程的,但各國和各公司正在優先考慮開發自主運作的蜂群能力。易于交換的組件和有效載荷--包括各種相機和傳感器(包括光電、熱能和聲納)、電子戰系統以及一系列用于實際使用武力的 "武器 "或彈頭(無論是否打算致命)--擴大了可能的應用范圍。當以群集方式部署時,不同的系統可以配備不同的有效載荷,以創造一系列的操作選擇。本報告中描述的各種武器系統是這種發展的例子,包括無人機40、卡爾古、亞里和機器人戰車。一個重要的跨領域趨勢是新技術組件的成本降低。這有助于公司和軍隊采用更多的模塊化方法,并對不同的能力進行更多的試驗。成本的降低也使消耗性成為可能--例如在許多在打擊目標物體的過程中被摧毀的閑置彈藥中可以看到。
值得注意的是,不同的公司對自動化和自主性的標記或表述是不同的。對一些公司來說,"自主性"一詞被用作強調創新的積極營銷術語。其他公司則試圖強調保留人類的決策,也許是考慮到正在出現的關于武器系統自主性的公眾和政治辯論。這意味著自動化功能的實際性質和程度在宣傳資料中并不總是很明顯。
本報告的研究基于公共領域的信息,要么來自公司網站,要么來自可信的(軍事方向)媒體。并非所有關于這些技術的技術和操作信息都可以公開獲得。已盡力確保信息的正確性。
本文中強調的系統具有不同程度的自主性。并不是說這些都被認為是自主武器(在使用傳感器探測和對目標施力的意義上)。然而,它們確實指出了在武器系統中增加自主性的趨勢和可能性。分析這些能力可以為關于自主武器的辯論提供信息。在未來幾年,可能會繼續看到武器系統具有進一步擴大地理范圍、持續時間和目標輪廓復雜性的技術能力。所有這些領域的漸進式發展可能會推動所使用武器的效果更加不可預測。這意味著,與其說是一個分水嶺,不如說是朝著更加自主和減少人類用戶在決策過程中的作用不斷邁進。
(具體案例系統參數請閱原文)
無人機40(Drone 40)是一種小型四旋翼無人機/彈藥,可由40毫米步兵榴彈發射器發射。它有基于GPS的自主導航和一個便攜式 "地面站"。操作員可以遠程解除彈藥的武裝,使其降落回收。它可以使用各種有效載荷,包括用于偵察的傳感器、非致命性(煙霧/閃光)和致命性彈藥。它包括多個無人機同時打擊一個目標的能力。
無人機40的開發主要由澳大利亞政府資助。衍生產品也已經開發出來,用于60毫米、81毫米和155毫米發射平臺,具有更大的有效載荷和射程能力。 無人機40已經賣給了澳大利亞和英國的軍隊。英國已經在馬里使用Drone 40進行監視和偵察。它還被用于波蘭的演習和美國海軍陸戰隊的演習中。
JARI是一種50英尺長的USV,可用于反潛、反艦和反空戰。JARI可以被遠程控制,但據說在某些配置下也可以自主導航并進行戰斗活動。 由于其小尺寸和航程,獨立的遠洋任務是不可能的,但可以作為大型載人船只的輔助任務艇。 目前它是單獨使用的,但CSOC(見下文)正在努力使JARI在群組中使用。該USV已經為海軍和潛在的出口客戶設計。
Blowfish是一種長度約為兩米的無人駕駛直升機。它既可用于民用,也可用于軍事目的。Blowfish有不同的版本,包括A2和A3,規格略有不同。A2型可以攜帶多枚60毫米迫擊炮彈或35-40毫米榴彈發射器。A3可以攜帶不同類型的機槍,并采用空氣動力學設計,可以從不同角度進行射擊。 據制造商稱,Blowfish有一個目標識別系統,可以識別不同的目標,如車輛、無人機或人。它可以整合可見光和紅外線,實現多源目標識別和跟蹤。Blowfish通過自組織網絡具有蜂群能力,不必依賴地面控制。無人機可以 "自主起飛,避免在空中發生碰撞,并找到通往其指定目標的道路。一旦收到攻擊命令,它們就會以協調的方式自主地攻擊目標"。
據Ziyan稱,Blowfish A2廣泛用于軍事、警察和公共安全目的、消防、海上行動和其他領域。
海鷗號(SEAGULL)是12米長的無人水面艦艇,被設計用于反水雷和反潛任務。在反水雷方面,它有 "水下機器人車輛來識別和消除水雷"。它能夠探測、分類和消除海中的地雷。對于反潛任務,它能夠發射輕型魚雷。其他類型的任務包括監視、水文地理、電子戰和海上安全。 它可以一次執行四天的深水任務,視線范圍可達100公里。 它在船頭有一門穩定的遙控12.7毫米機槍。
兩個 "海鷗 "可以由陸地或母艦上的控制站同時控制。埃爾比特系統公司在 "海鷗 "號上增加了 "云雀 "C小型無人機,以進一步提高態勢感知和情報收集能力。 以色列海軍已經在北約的幾次海上演習中使用了 "海鷗",包括與英國皇家海軍和西班牙海軍的合作。
迷你HARPY是以色列航空航天工業公司(IAI)開發的一種游蕩彈藥。它結合了Harop和Harpy彈藥的能力,即探測廣播輻射和電子光學能力。它可以游蕩并探測輻射發射物體,如雷達裝置。攻擊是由擁有行動視頻資料的人批準的。據IAI稱,操作者可以控制到最后一刻來阻止攻擊。然而,該公司還表示,它有一個 "完全自主 "的操作選項。目前還不清楚完全自主模式會帶來什么,但最有可能的是,武器系統檢測并攻擊目標,而不需要人類批準。
該公司指出。"在一個不對稱戰爭和快速移動目標每次'閃爍'幾秒鐘的時代,使用游蕩彈藥為關閉火力圈提供了強大的能力。開發的系統不是依靠精確的參考點,而是在空中徘徊,等待目標出現,然后在幾秒鐘內攻擊并摧毀敵對威脅。迷你HARPY"可從陸地、海上或直升機平臺發射,射程為100公里,續航時間為120分鐘。
MARKER是一種無人地面車輛(UGV),可以使用輪式或履帶式底盤。 它是一個實驗性平臺,用于測試地面機器人技術,如自主導航、群體互動和人工視覺。 MARKER有一個模塊可以同時控制幾個車輛。據報道,它使用算法和編程模塊來探測各種目標。 研究機構ARF(其開發者)指出,該武器系統給操作者一個目標指定,然后操作者可以批準交戰。 ARF補充說,"戰斗機器人的演變正走在提高自主模式下執行任務的能力的道路上,操作者的作用逐漸減少"。
MARKER是模塊化的,可以安裝卡拉什尼科夫生產的機槍、反坦克榴彈發射器、游蕩彈藥、電火箭,以及管狀發射和牽引式無人機。 據報道,該系統有一個模塊化的多光譜視覺和數據處理系統,具有神經網絡算法,以及 "二維和三維物體識別、語義分割、深度計算、自動自我定位、軌跡構建"。
據稱,俄羅斯已經測試了五臺Markers,作為一個沒有人類參與的自主團體運作。這些 "機器人在沒有人類參與的情況下,解決了在小組內分配目標的任務,達到最佳射擊位置,對戰斗形勢的操作變化作出獨立反應,并交換目標名稱"。MARKER還在沃斯托奇尼太空港進行了測試,在那里它與保安人員一起自主地巡邏周邊地區。在未來,開發人員計劃將其與無人機一起測試。
KUB是卡拉什尼科夫公司和ZALA航空集團開發的一種游蕩彈藥。它可以從安裝在海軍平臺上的特殊發射器發射,如卡拉什尼科夫公司生產的BK-016型高速登陸艇。在未來,將開發一個甲板集裝箱發射器來發射KUB蜂群。 發射后,無人機可以在空中游蕩以探測目標,然后從垂直軌道上攻擊目標。這使得它可以攻擊坦克,從其 "裝甲保護最小 "的上方刺穿炮塔,也可以攻擊防空系統等其他目標。 目標坐標由操作者指定或從瞄準有效載荷中獲取。 據卡拉什尼科夫公司稱,操作人員還可以向控制系統上傳預定目標類型的圖像。 據報道,它有人工智能視覺識別功能,可以進行 "實時識別和分類檢測對象"。 它的目的是不被傳統雷達看到。
2021年,開發并測試了一個海軍版本,可以從高速船和特殊用途的船只上使用。
KARGU是一種多旋翼無人機,可用于了解情況,也可作為游蕩彈藥使用。該系統有一個便攜式移動地面控制站,允許用戶批準使用武力或中止任務。 開發商STM公司表示,他們認為 "從道德上講,應該有一個人參與到這個循環中"。 然而,這并不意味著KARGU在技術上不可能自主地對付一個目標。
STM公司一直在進一步開發KARGU的能力,據說包括面部識別,以及增加該系統可使用的有效載荷的多樣性。根據STM公司的說法,多達30個卡爾古裝置可以在一個蜂群中一起運作,同時由一個地面控制站控制。
Kargu于2020年被引入土耳其武裝部隊,并有報告稱將有更多的單位被交付。根據聯合國的一份報告,KARGU也被用于利比亞,在那里,"武器系統被編程為攻擊目標,不需要操作員和彈藥之間的數據連接"。 據報道,阿塞拜疆也使用了這種武器,但沒有得到證實。
(9)機器人戰車(UGV) - 美國
機器人戰車(RCV)是美國正在開發的一系列無人駕駛地面車輛。其目標是讓它們作為一個團體工作。輕型RCV(RCV-L)的重量不到10噸,其主要目的是偵察和信息收集。它有更多的傳感器和較少的重型武器(一枚反坦克制導導彈和一個無后坐力武器)。它的模塊化平甲板結構可以使用超過20種有效載荷。它的目標是主要與較小的和無裝甲的車輛作戰。 中型版本裝備了更多的裝甲和火力,以對付更廣泛的目標。中型RCV(RCV-M)將重約15噸,并將擁有更多的火力(幾枚反坦克引導導彈,一門30毫米大炮和一挺機槍)。在2020年的一次測試中,它安裝了Switchblade游蕩彈藥。 RCV-M比RCV-L更耐用。 RCV重型(RCV-H)將重達20-25噸。它仍在開發中,但打算擁有M1艾布拉姆斯坦克的火力和生存能力,同時重量要輕得多。它的目的是作為有人駕駛的坦克的伙伴單位。
RCVs將擁有自主導航和遙控武器。計劃為這些系統配備人工智能輔助探測和目標識別(AIDTR),以 "比人更快、更有效地探測和識別威脅車輛"。它必須能夠形成共同的作戰圖景,并 "分析威脅模式和習慣,并向指揮官提出建議"。 目前,每輛RCV由兩名操作員控制,一名為駕駛員,一名操作武器系統。 據報道,未來的意圖是一個操作員將控制幾個系統,他們只需要給予許可就可以與目標交戰。
Qinetiq公司正在建造RCV-L。德事隆公司正在其Ripsaw小型坦克的基礎上建造RCV-M。RCV-L和RCV-M已經進行了單獨測試。這兩個系統將在2022年參加載人-無人合作(MUM-T)士兵作戰實驗。
(10)Agile condor(電腦吊艙) - 美國
Agile condor不是一個武器系統,而是一個可以添加到MQ-9 "死神 "無人機上的使能技術。它是一個結合機器學習的機載高性能嵌入式計算機,用于自主融合和解釋傳感器數據,以識別、分類和 "提名"感興趣的目標。 傳感器數據來自MQ-9 "死神 "的傳感器,其中包括光電和紅外傳感器以及合成孔徑雷達。敏捷禿鷹 "吊艙由許多隔間組成,可以支持各種技術,包括商用單板計算機、圖形處理單元、固態硬盤存儲和更先進的芯片。 開發者設想了以人腦為模型的計算機技術的潛力(所謂的神經形態架構)。
板載處理減少了必要的通信帶寬,因為系統有可能只與其他平臺共享特定數據。 此外,機載視頻處理有助于減少分析和決策時間,當使用帶有攝像頭的無人機進行ISR時,這可能是一個很大的問題。越來越多的軍隊正在尋求使用機器學習來加快對這些數據的分析,正如在 "Maven項目 "中看到的那樣。敏捷禿鷹吊艙將把這種技術整合到平臺本身。它還可以使MQ-9在GPS和通信缺失的環境中更自主地運行,因為該技術還可以通過識別地標來進行導航,避免潛在的威脅。雖然沒有明確提到,但機載處理能力也可以讓它自主地探測、識別和攻擊目標。一個開發者的視頻說明了該系統通過使用面部識別來識別一個人類目標,并提醒地面上的操作人員,后者改變了經過該地點的車隊的路線。
第一個Agile Condor吊艙于2016年交付,2020年9月,Agile condor吊艙在一架MQ-9 Reaper無人機上進行了測試。
本文強調了在其運作中具有 "自主性 "的十個系統。并不是說這十個系統比其他許多可能被指出的系統更有問題。之所以選擇這些例子,是因為它們指出了自動化能力被納入其中的系統的多樣性:能力的多樣性、運作的規模、運作環境和來源國的多樣性。
這些系統中的大多數在使用武力的時候都保留了人類決策的能力。在導言中對 "自主武器 "做了廣泛的定義,即探測目標并根據傳感器的輸入對其使用武力的系統。在這里看到的系統包含了自主性的一些方面,但根據這個定義,它們不一定是 "自主武器"。然而,它們中的許多可以被配置成這樣一種模式。這就提出了這樣的問題:隨著時間的延長和更廣泛的行動地理區域,將如何做出有意義的決定,即是否可以將某些模式的傳感器數據充分代表一個合法的目標。分析武器系統自主性增強的趨勢,可能有助于確定可能需要監管的領域,以確保遵守道德和法律規范。