電子戰(EW)操作人員在日益密集和敏捷的威脅環境中執行單平臺和分布式平臺的傳感和干擾任務時,面臨著眾多的挑戰。在交戰時限內,往往必須根據現有的部分信息迅速采取行動。最近,世界觀察到了人工智能的蓬勃發展,這是一套數據驅動的橫向技術,已經顛覆了自主性和大數據是關鍵因素的多個領域。盡管它不是所有EW任務的解決方案,但人工智能顯示出有希望提供潛在的解決方案,通過超出人類操作員能力的知情決策來提高EW效率和有效性。約翰霍普金斯大學應用物理實驗室(APL)精確打擊任務區已經投資于發射器識別和自主資源分配等具體EW任務的研究和開發。本文介紹了這些項目的有希望的結果,并描述了在這些領域建議的未來工作,以及可能從人工智能研究中受益的其他EW應用。
電子戰(EW)作戰威脅空間是一個在有爭議的頻譜環境中運行的多個射頻(RF)傳感和發射平臺之間的非合作性互動。這個作戰空間給執行任務的操作人員帶來了許多挑戰,如感知電磁(EM)頻譜、有效管理頻譜資源、在多個EW平臺之間共享關鍵信息,同時干擾威脅發射器。這些挑戰促使人們需要能力越來越強的射頻系統,以機器的速度處理大量的信息并采取行動,通常幾乎不需要人工干預。下一代軟軟件定義的射頻威脅發射器,使用越來越復雜的敏捷波形,推動了未來電子支持(ES)和電子攻擊(EA)活動方式的轉變。干擾平臺的整體有效性受制于其有效探測、描述、干擾和通信威脅波形的能力,同時智能地管理戰斗空間內的可用射頻資源。
在過去幾年中,人工智能領域受到了極大的關注,在物體識別、自然語言處理和自動語音識別等領域取得了多項重大突破。機器學習(ML)技術在其他問題領域的成功應用,引起了EW贊助商、運營商和研究人員的興趣,他們希望確定ML方法如何解決EW的差距。本文重點介紹了通過APL的精確打擊任務區(PSMA)獨立研究和開發(IRAD)項目取得的幾個有希望的成果,這些項目專門針對發射器識別和自主資源分配的EW任務。它還包括其他建議的研究課題,以使自動化EW方法成熟,并可過渡到未來的軍事平臺。此外,本文還強調了幾個特定領域的挑戰,并提出了未來的研究課題,在這一重點領域中,使用ML技術可能會顯示出前景。
圖1展示了一種場景,它試圖通過使用協作式EW來實現信息主導并對對手產生壓倒性的EW效應。開發ML應用以提高單平臺背景下的EW效率和有效性,是實現協作、自主和適應性EW能力的一個重要基石。在這篇文章中,我們主要描述了從兩個IRAD項目中獲得的結果和知識,這些項目將ML應用于傳感和發射器識別,以研究自動調制識別(AMR)和自主資源分配。這項基礎性工作證明了這些方法的優點,并建立了一條通往多平臺、協作式EW能力的發展道路。本文介紹的方法和結果與平臺無關,盡管迄今為止考慮的主要平臺是機載的,但可能也有引人注目的地面或海基應用。
圖1. 在APL的PSMA中,有兩個感興趣的協作EW主題。美國將建立頻譜優勢,并通過使用協作式EW來對對手提供壓倒性的EW效果。為了實現這一目標,必須克服兩個挑戰:分布式傳感,ML AMR將識別感興趣的特定信號(左);以及分布式資源管理,傳感和干擾資源將在戰斗空間中自動管理(右)。
圖1大致說明了戰術EW操作中的兩個具有挑戰性的主題領域,ML提供了有希望的解決方案。本節簡要介紹了與分布式傳感和分布式資源管理相關的挑戰。
敵方傳感器和通信系統的敏捷性給EW系統帶來了挑戰,它們能迅速適應并在整個電磁頻譜上運行。傳統的EW系統必須首先確定一個威脅雷達,以確定適當的預編程EA技術。隨著雷達從固定的模擬系統發展到具有未知行為和敏捷波形的可編程數字變體,這種方法的有效性就會下降。未來的雷達可能會帶來更大的挑戰,因為它們將能夠感知環境,同時適應傳輸和信號處理,以最大限度地提高性能和減輕干擾影響。同樣,通信系統能夠適應頻率、調制和編碼以及協議,以便在各種退化的信道條件下運行,目標是最大限度地提高數據吞吐量,同時最大限度地減少幀錯誤和比特錯誤率。此外,由于硬件、軟件和自適應信號處理的進步,現代傳感器系統以更敏捷和更不確定的方式工作的能力得到了大幅提升。打擊這些潛在的威脅需要靈活的EW交戰方案,根據當前觀察到的運行參數和威脅的模式,在特定的快照下調整EA技術。通常情況下,這種交戰需要在威脅發射者的時間刻度上以機器的速度調整反措施--換句話說,比人類操作員的速度快得多(以毫秒或微秒為單位,而不是秒)。美國國防部高級研究計劃局(DARPA)的兩個項目專注于這一問題空間:自適應電子戰的行為學習(BLADE)項目已經成功地將ML技術應用于敏捷的通信信號,而自適應雷達對抗措施(ARC)項目已經成功地將ML應用于威脅雷達信號。鑒于該領域的基礎性工作已經建立,本文不進一步討論ML對威脅發射器的應用。
EW系統的關鍵挑戰之一是實時提供精確的電磁頻譜態勢感知,以描述所觀察到的信號的行為,并確定什么是友好、威脅和中立。敵方的傳感和通信系統正在擴大其對電磁波譜的使用,要求ES傳感器同時觀察多個千兆赫茲的頻譜。傳統的ES系統在同時監測大面積的電磁頻譜方面能力有限,通常會求助于掃描一組窄帶頻道。在信號收集之后,大量的信號捕獲數據必須在戰術時間尺度上進行處理,以便在這些測量變得陳舊之前確定發射體的特征并告知EA的反應。如果考慮到遇到多個高密度射頻發射器在不同的射頻功率水平下工作,觀察到部分信號,以及在高度的機載和非機載射頻干擾的情況下進行感應,這些挑戰就進一步加劇了。
除了在基于傳感器的應用中很有價值外(如模擬處理),ML方法也有可能在緩解ES數據處理瓶頸中發揮作用。只有當這種傳感與能夠應對相應的大信息速率的信號處理器結合在一起時,才能實現寬帶傳感的好處。即使計算昂貴的操作與完整的輸入流解耦,如果檢測沒有被有效過濾,密集的信號環境仍然會使下游資源超載。ML技術可以在處理鏈的早期丟棄低優先級的檢測,減少整個系統的負荷,為處理關鍵任務的檢測節省計算資源。換句話說,ML可以通過在處理鏈的早期和較少的步驟中捕捉關鍵模式來發揮作用。這一優勢適用于本文介紹的AMR工作的一個特定的下一步應用。AMR工作僅側重于調制識別,為潛在的富有成效的ML調查參數留下了機會,如通過帶寬、中心頻率、脈沖重復間隔、到達角或這些參數的組合來確定信號特征。
必須根據具體任務和威脅環境平衡使用EW平臺的傳感和干擾資源,以有效地打擊射頻通信和雷達目標。一個EW任務可能包括與一系列的威脅交戰,從需要有限的傳感支持的已知的、不太敏捷的威脅到需要精確的傳感和交戰時間表來跟蹤和擊敗的復雜的、適應性強的威脅。來自單一平臺的傳統EW傳感和干擾資源是按時間尺度管理和安排的,可以在任務前分配或在任務中由操作人員調整。然而,必須被感知和打擊的可適應的對手目標的數量正在增加,超出了傳統的人在環形方法的可行性。在威脅發射器的時間尺度上保持有效性需要自主優化方法,以機器速度平衡和分配EW資源。未來的分布式、協作式EW任務包括多個平臺一起工作,并適應實現特定的EW任務目標,這將需要分布式資源管理。
如果我們從貝葉斯的角度出發,這個看似難以解決的問題可以得到簡化。在每個時間點上,操作者必須考慮對手正在做什么的多種競爭性假設。然后,操作者必須從一組可能的假設中考慮什么是最佳行動方案。這些假設可以被列舉出來,并根據收集到的累積證據為每個假設分配代表強度的實際數值。貝葉斯概率理論允許我們將證據單位表示為實數,可用于加強或摒棄競爭性假設。這種方法使我們能夠自動權衡不同假設的合理性,并根據證據最支持的假設做出決定。我們相信,ML有可能為EW任務前計劃的資源管理和EW行動中的近實時決策提供重大的能力提升。
發射器識別過程允許ES和監視接收器區分來自威脅和友好或中立的發射。因此,ES系統必須處理一套廣泛的接收波形,從商業波段常用的波形到軍事特定的雷達和通信信號。ES系統依靠脈沖處理器,使用固定的描述符來檢測、過濾,并從接收到的射頻調制脈沖中提取發射器信息。調制格式是ES系統在勘察頻譜時用于描述有源發射器的一種描述符。
EW系統必須完成的許多挑戰性任務之一是有效地確定檢測到的信號的調制格式。這個話題更廣泛地被稱為AMR。傳統的脈沖處理器將調制格式視為一個單一的特征,可與其他用于識別活動發射體的波形特征相配合。許多脈沖處理器會將脈沖描述符群與板載庫進行匹配,以識別正在觀察的發射器。成功應用這種傳統的匹配方法的前提是,信號先前已經被觀察過,其特征也是已知的。
AMR的第二個挑戰是在遇到新觀察到的調制類型或發射器模式時識別和解釋它們。事實證明,新的發射物對于依賴預定義的已知發射物特征庫的系統來說是一種挑戰。在軟件定義的威脅成為現實之前,捕捉和描述新的發射物的過程一直是一個歷史上可解決的問題。然而,現代適應性威脅促使人們需要能夠以機器的速度快速識別和描述新的檢測的傳感技術。圖2說明了AMR在一個名義上的戰術EW場景中的應用。
圖2. 將AMR應用于一個名義上的戰術EW場景。這里顯示的是如何利用在線AMR來描述各種威脅的一個例子。左上圖表示原始探測的時間-頻率分布。左下圖表示確定的雷達脈沖組合,其中每個不同的顏色用于代表具有特定特征的脈沖。
雖然有幾種深度學習方法已經應用于AMR,但在2018和2019財年,基于特征的電子攻擊訓練超表面反應(FEATHR)IRAD項目探討了AMR背景下的深度特征表示模型。這項工作強調了這些模型比其他類型的深度神經網絡(DNN)模型直接訓練分類的幾個明顯優勢。
將深度學習應用于AMR的大部分現有工作都集中在使用神經網絡模型從一組固定的標記實例中學習分類調制分配的方法。各種研究表明,這種方法是執行AMR的一種可行方式。然而,僅僅為了分類的目的而訓練一個模型,本質上是將模型的預測限定在訓練數據中的標記類集上。這種限制導致了訓練后的模型無法超越訓練期間的標簽集進行泛化。擴展神經網絡分類器的類集需要一個漫長的過程,即收集新的例子,給例子貼上標簽,然后用擴展的類集重新訓練模型。
當用分類目標訓練DNN時,一個模型通常會使用全連接輸出層,加上一個歸一化指數,以產生一個跨越正在學習的類集的信心分數。因此,學到的任何特征都不會被直接觀察到,因為它們是網絡架構的內部。然而,如果學習目標是直接學習特征,情況就不一定是這樣了。在這個問題的背景下,特征可以被認為是數據中的獨特模式,是特定信號調制的特征。這就把我們帶到了一組被稱為特征學習的技術上。雖然與特征提取類似,但特征學習并不假定直接獲得特征的預定義規則或變換;相反,所需的特征是通過客觀任務的訓練而學習的。
為了解決在一組預定義的標簽之外識別和分類開放的調制集的需要,我們研究了一種特征學習的方法來執行AMR,其中首先學習區分調制類型差異的特征,而不是調制類型本身。該模型的目標是學習一種轉換,將實例映射到多維特征空間中的一個位置。
第一篇關于三重損失的論文顯示了如何對個體進行分類。由于同一個體會因各種因素(如燈光、服裝、視角)而看起來不同,研究人員意識到需要一種方法來對許多個體進行非線性條件下的分類。通過使用神經網絡定義一個高維輸出空間的軸,他們發現個體可以在這個空間中被聚在一起。術語 "嵌入 "經常被用來描述在這個輸出空間中對應于一個位置的N維向量。
使用三重損失(一種特征學習方法)訓練的模型產生了一種轉換,允許數據被映射到一個學習的特征空間。在這個空間中,根據訓練過程中提出的調制類之間的學習關系,對實例進行匯總。這使我們能夠隨后分析這些特征,對已知的調制進行分類,并對新觀察到的不在我們現有標簽集中的例子進行分類。我們實施了一個兩步法,首先使用用三重損失訓練的殘余DNN模型學習特征表示轉換。一旦模型被訓練出來,我們就以調制分類和異常調制識別為學習目標,探索兩種方法來描述這個特征表示。
三重損失是一個有監督的訓練目標,旨在與連體網絡一起使用。連體網絡可以被認為是單個人工神經網絡模型的多個鏡像實例,其中每個實例在整個訓練過程中以相同的方式初始化和聯合更新。每個輸出被視為輸入實例在一個共同的N維歐幾里得空間(也稱為嵌入空間)中的映射。對于使用三連體損失的訓練配置,創建了一個有三個實例的連體網絡模型,如圖3所示。
圖3. 使用連體網絡訓練配置的三重損失配置的例子。連體網絡可以被認為是單個人工神經網絡模型的多個鏡像實例,在整個訓練過程中,每個實例都以相同的方式被初始化和聯合更新。每個輸出被視為輸入實例在一個共同的N維歐幾里得空間(也稱為嵌入空間)中的位置的映射。
一旦學會了一組調制特征,它們就可以被用于執行分類或異常檢測等任務。圖5顯示了一個對每個調制類型的學習特征擬合多變量高斯模型的過程。異常情況是通過為每個高斯模型固定一個對數似然閾值來確定的。這個閾值作為關聯新例子的決策邊界。沒有關聯的例子也會被捕獲并歸類為異常。這由圖5中的底部分支表示。圖6顯示了在訓練好的特征空間內映射的波形的三維投影。
如果我們考慮一種以上的異常檢測類型,就需要一個無監督的聚類步驟來識別被分類為異常的檢測中各種可能的異常類型。
圖5. 異常類識別過程的流程圖。這個過程將一個多變量高斯模型適合于每個調制類型的學習特征。通過為每個高斯模型固定一個對數似然閾值來確定異常情況。這個閾值作為關聯新例子的決策邊界。沒有關聯的例子也被捕獲并歸類為異常,由底部分支表示。
圖6. 映射在訓練過的特征空間內的波形的3-D投影。左圖:映射到訓練過的特征空間的波形投影,每種顏色代表一種不同的調制方式。這個空間中的位置對應于所學特征的不同組合。具有相似/匹配的學習特征集的波形被放在彼此附近,形成一個集群。右圖:只包含與訓練階段產生的任何調制集群無關的點的投影。運行OPTICS后,綠色的點被識別為噪聲,而藍色和紅色的點被賦予新的 "未識別的調制 "標簽。
在下面描述的實驗中,我們使用了由DeepSig發布的開源RadioML2018數據集。該數據集由24種合成的通信調制類型的大約250萬個例子組成。每個例子都表示為1,024個長度的同相和正交(IQ)矢量,使用浮點進行時間采樣。這些數據包括在收集的數據中經常觀察到的多種環境失真。例子上標有調制標簽以及跨度為-20到30dB的離散信噪比。這些數據中的調制集合以兩種方式使用:作為監督訓練的例子和類別,以及作為無監督異常檢測的保留。監督訓練使用IQ向量與其適當的調制標簽配對,而保留的調制則不給調制標簽。我們首先使用22種調制類型的子集學習特征表示,并展示了一種無監督的方法,使用兩個調制類別--頻率調制(FM)和16正交振幅調制(16QAM)--作為保留類別來識別新類別。
我們將數據集分為兩類:(1)由22個已知類別組成的監督類,細分為80%的訓練區和20%的評估區;(2)有兩個保留類的類別(FM和16QAM在訓練中被扣留)。我們的DNN模型是在22個已知的調制上訓練的(即不包括這兩個保留類)。按照上述程序,我們將多變量高斯分布適合于訓練分區的每個調制特征嵌入。所有已知調制的聯合分布被用來定義一個閾值距離。這個閾值被用作一個多維高斯邊界,用于將新的樣本與現有的一個類別相關聯,或者用于標記未識別的樣本。落在這個定義的多維邊界內的樣本(在公式3中用θ表示)與現有的調制類別之一相關。否則,樣本將被賦予未識別的標簽。請注意,這一步并不假設任何關于未識別點的先驗信息;相反,它只是將離群或異常的例子排除在已知調制類別的分類之外。
我們現在的目標是在我們的異常例子中識別出我們的保留調控的新群組。要做到這一點,我們針對上一步確定的異常例子集運行OPTICS,為落在有足夠密度的區域的例子創建標簽。
圖7中的混淆矩陣顯示了這個過程對信噪比為10dB的例子的準確性。真正的保留類(FM和16QAM)被顯示為灰色的列。這里我們顯示了新的群組1和新的群組2,作為識別的類別,顯示了與保留類中的例子集的強烈相關性。未識別的類別包含落在我們的分布閾值之外的例子,被OPTICS歸類為噪聲樣本。新群組3是由其他調制類中被錯誤分類的未識別樣本的密集區域產生的錯誤檢測。
我們認為特征學習是一種可推廣的方法,用于建立豐富的射頻調制特征表示,使新觀察到的射頻信號的識別和分類。在射頻領域的許多邊緣應用中,一旦部署了神經網絡模型,對其進行再訓練往往是不現實的。使用一致的學習過的特征表示與較簡單的分類模型相結合,可以動態識別射頻調制,而不需要重新訓練單一模型的高處理要求。用一個簡單的分類模型對特征表示進行后處理所需的計算能力遠遠低于重新訓練所需的計算能力。此外,可以采用無監督技術來搜索新的波形,使用現有的學習過的特征表征,這些特征表征在區分其他調制方面顯示出重要性。我們有興趣擴大這項工作的幾個要素。
首先,我們預計有幾個因素可以提高這項技術的性能。三聯體損失的原始實現是用比我們在這項工作中使用的更大的類數來訓練的。更高的類數允許網絡學習更豐富的特征表示,以捕捉樣本之間更精細的差異。在我們的實驗中,我們使用了一個由24種獨特的調制類型組成的數據集。然而,我們預計用更多的獨特調制進行訓練將通過增加訓練期間使用的三聯體的種類來提高性能。
其次,在考慮信號類型的廣度時,要注意不同類型的特征在區分信號類型時是很重要的。例如,區分16QAM調制和正交相移鍵控的特征集將不同于區分線性頻率調制脈沖和非線性頻率調制脈沖的特征集。正因為如此,考慮信號之間相互關系的分層模式是有意義的。其他正在進行的APL工作已經證明了在用DNN執行AMR時使用層次結構的成功。一個潛在的后續研究工作可能是探索如何將特征學習與信號的層次結構相結合,以提高對廣泛的信號類型的分類性能。一個潛在的解決方案可能涉及到在每個決策點使用單獨的學習特征集構建一個非二元分類樹。這種方法可以允許使用更小/更簡單的模型,因為每個特征集將不再需要捕獲全部的信號類型。
第三,這種方法假設實例被捕獲為檢測,表示為在時間和頻率上隔離的IQ向量。探索其他各種波形表示可能是有用的,如復雜的時間-頻率數據或稀疏的檢測樣本。此外,將學習到的特定調制特征與其他背景數據(如方向、波的偏振或地理位置)結合起來,對于形成具有高置信度的特定發射器身份是必要的。最后,圖7中產生的錯誤檢測的來源和特征是一個需要進一步調查的領域。
圖7. 混淆矩陣說明了在信噪比為10dB的情況下,AMR過程的準確性。真正的保留類(FM和16QAM)顯示在灰色的列中。新群組1和新群組2是已識別的類別,顯示出與保持類中的例子集有很強的相關性。未識別的類別包含分布閾值之外的例子,被OPTICS歸類為噪聲樣本。新群組3是由其他調制類的錯誤分類的未識別樣本的密集區域產生的錯誤檢測。
如前所述,發射器特征的自動解決方案提供了一個有用的手段,將觀察到的射頻數據映射到特定的觀察到的對手威脅發射器中。然而,這本身并不足以提供一個強大的EW響應。上一節介紹的AMR結果通常假定有孤立的探測和完整的信號捕獲,以告知AMR決策過程。EW平臺通常遇到的真實情況要復雜得多。通常,一個EW平臺必須干擾更多的可能的威脅發射器,其頻率超過了它能同時覆蓋的頻率,而且占空比不允許對威脅環境進行充分的接收采樣。因此,必須對EW系統可用的有限資源進行適當的分配,使威脅發射器的準確快照及其相應的行為與干擾反應相平衡。我們把如何最好地分配我們可用的EW資產的問題稱為資源分配問題,并在圖8中以作戰背景加以說明。
盡管在實踐中我們可能希望分配許多資產以優化系統性能,但在這里我們考慮的是具有兩種不同行動類型的資源分配問題:感知和干擾。感知是指檢測和識別環境中存在的波形類型的行動;干擾是指干擾對手的波形的行動。一般來說,目標是最大限度地提高干擾者的開機時間,最小化有用的傳感時間(即干擾者關機時間)。這兩個問題是相互關聯的,因為對環境的感知可以指導干擾者技術的調整和集中,以提高整體的干擾效果,但要犧牲干擾者的關閉時間。
在2020和2021財年,PSMA資助了智能學習電子攻擊大師(IL'EA Maestro)IRAD項目,以開發一種解決資源分配問題的方法。IL'EA Maestro的長期愿景是使未來部署可擴展的、分布式的、多平臺的方法來實現自主資源分配。盡管人們可以使用無數潛在的方法來設計這樣一個系統,但IL'EA Maestro團隊已經確定使用基于模型的隨機優化加上近似貝葉斯推理是一個特別有前途的方法。與標準的現成強化學習算法相比,這種方法允許系統設計者將重要的領域知識(對手能力的已知限制、基于事先感知對手威脅的觀察行為等)納入智能體的設計。而對于標準的強化學習算法,如果在模擬器上有足夠的訓練時間,我們希望智能體能夠自己確定對手的弱點,而在系統中建立這樣的知識,可以減少學習負擔。凈效應是系統性能的提高,因為需要更少的數據來學習對手的有用模型,因此需要更少的整體感應時間。在本節的其余部分,我們描述了資源分配問題并探討了IL'EA Maestro項目的早期結果。
圖8. 在戰術EW環境下自主資源分配的說明。僅為說明起見,ES任務被顯示出來,形狀代表紅色威脅發射器的發射。如果ES任務是在沒有智能的情況下安排的,傳感間隔不能優化對脈沖的傳感(左上圖),顯示為錯過許多脈沖的虛線框。如果任務被智能地安排,它們可能會更有效地執行(左下圖),其中ES間隔被動態地安排以捕獲更多的脈沖。
解決自主資源分配的一種方法是通過貝葉斯概率理論(見,例如,Koller和Friedman)。我們首先根據先驗信息初始化一套廣泛的可能的對抗行為,例如,預期的對抗頻率范圍和時間模式。然后,我們分配資源,在不同的時間段從頻譜的不同部分收集信號,以建立一套證據,可以支持一個特定的戰略,或不遵循的信念。在每次嘗試采集信號(即掃描)后,我們更新我們關于哪些行為是可能的信念,以反映添加到我們知識庫中的新證據。
為了更好地構建本節的發展,現在讓我們正式描述所考慮的資源分配問題的一個一般實例。我們考慮對感興趣的射頻頻譜子集進行劃分。我們認為分區的每個元素都是一個特定的頻率通道,其中總共有c個通道。我們將時間軸劃分為離散的元素,每個元素的持續時間為Δt。如果我們用C表示通道的集合,用T表示所考慮的時間集合,我們就會發現,所考慮的感興趣的信號在C×T的乘積空間上作為時間的函數演化。圖9顯示了一個潛在的發射器在離散的時間和頻率空間中表示,其中C={1,2,...,9},T={1,2,...,20},著色的網格空間表示從脈沖波形內單獨接收的突發。請注意,紅色信號的頻率是敏捷的-它在第四和第五個脈沖之間從通道4跳到通道7。
我們用S表示環境中感興趣的信號集。我們假設在遇到每個脈沖時,有能力將每個收到的脈沖識別為特定的感興趣的信號。重要的是,我們不假設關于信號的模式行為(例如,脈沖長度、跳頻序列、占空比)的全部先驗信息。我們假設:(1)每個信號可以出現的通道集是連續的(即,它出現在一個設定的最小和一個設定的最大頻率之間);(2)感興趣的信號是周期性的;(3)信號不是相互干擾的(即,兩個信號不能同時占據同一個頻率通道)。嚴格地說,這些假設簡化了我們當前原型所需的分析。放寬這些假設以適應更大的可能信號集是可能的,盡管這樣做的代價是需要更多的數據來學習有用的信號特征。哪一組假設在實踐中是最好的,將根據情況決定。
我們考慮一種情況,即考慮中的平臺同時具有感知和干擾能力。我們假設每個能夠執行傳感或干擾行動的收發器只能在連續的信道范圍內這樣做,如果有多個收發器,它們可以獨立分配,但要明白如果不適當地協調,它們會造成自我干擾。
圖9. 一個潛在的發射器在一個離散的時間和頻率空間中表示。著色的網格空間代表了從脈沖波形中單獨接收的突發信號。紅色的信號從通道4跳到通道7。
貝葉斯智能體是開發必須以有意義的方式與世界互動的智能學習系統的基本方法。它可以被認為是設計強化學習智能體的一種非傳統的、抽象的方式,它對世界的本質和如何推理世界有強烈的假設。這種假設可以而且應該與人類主題專家一起設計。這些假設包括:(1)智能體認為世界的可能性的假設集;(2)關于這些可能性的相對可能性的先驗信念分布;(3)結合從環境觀察中獲得的數據來更新關于智能體的基本假設的信念的方法;(4)評估未來行動的潛在序列的相對價值的方法;以及(5)選擇一個特定行動以應用于環境的方法。我們可以將第1-5項分解為一組行為塊,如圖10所示。
我們可以把第1-3項視為構成智能體的學習者(圖中的對象A),第4項構成智能體的評估者(圖10中的對象B),第5項構成智能體的執行者(圖中的對象C)。圖10中的對象C)。我們看到,智能體通過執行器和學習者與現實世界(環境;圖中的對象D)對接,前者對環境采取了行動,后者則從環境中吸收了觀察結果。
這種方法的一個優點是,對學習者、評估者和執行者的適當選擇可以顯著提高智能體學習與環境有效互動的速度。值得注意的是,假設的特定選擇可以限制智能體的通用性,即假設所允許的可行控制策略集可能嚴格小于所有可行控制策略集。如果我們這樣選擇,我們可以設計學習者、評估者和執行者來模仿標準的通用強化學習算法,如Q-learning、深度Q-learning、策略梯度,等等。然而,通過以特定的目的構建它們,我們可以用比使用現成的方法更少的訓練時間達到良好的性能。因此,智能體的設計者自己可以控制失去多少通用性的問題。
在討論為這里考慮的資源分配任務開發貝葉斯智能體所涉及的任何特定技術細節之前,讓我們首先討論一些抽象的原則,這些原則是設計一個有利于高水平操作的貝葉斯智能體所需要的:近似貝葉斯信念傳播、信念驅動的行動評估和行動選擇。
現在我們可以詳細說明我們的解決方案的現狀,所做的一些基本設計決定,以及它目前的性能。對一組假設的選擇是非常直接的:給定關于環境中存在多少信號及其相應時期的預先假設,可以產生一個有限的可能信號集。這就是我們的假說集。
隨著數據從環境中收集,它們被用來更新智能體關于假設的信念。隨著使用掃描資源從環境中收集證據,與某些假設相關的概率將增加,表明它們更可能是真的。在我們的解決方案中,我們對世界做了某些公理上的假設,我們試圖以現實主義為基礎。這樣做的目的是為了將假設集的范圍限制在只有操作上合理的情況。
更新信仰分布的方法比較抽象。如果智能體在特定的時間t進行了掃描,并且在時間t觀察到了特定的信號q,那么智能體就會排除任何說明信號q在時間t不存在的假設。這個過程會積累更多的信息,直到最后只剩下對環境來說是真的特定假設。同樣地,每當在一個特定的通道上觀察到一個信號時,我們就會更新智能體的信念。這樣的觀察可以用來支持關于哪些信號出現在特定通道上的任何假設。至少,這使智能體相信,在不久的將來,該信號更有可能留在特定的通道上。然而,一些觀察可以更顯著地改變智能體的信念--例如,通過告知智能體,一個特定的信號可以存在于一個迄今為止沒有觀察到的頻道上。評估智能體行動的價值的方法也同樣涉及。
抽象地講,資源分配智能體的目標是了解環境中正在發生什么,以及如何最好地干擾對手的行動。為此,在智能體的當前信念狀態的基礎上設計了一個隨機優化問題。如果智能體對環境在某一特定時刻將如何行動比較確定,那么目標就會高度優先考慮干擾對手的信號。如果智能體對目前或不久的將來要發生的事情沒有強烈的信念,則優先考慮以掃描的形式收集信息。如果規定得好,這樣的優化問題會誘發一種行為,迅速發現、描述和干擾高價值的對抗性信號。同時,它逐漸了解到低價值信號的行為,以及如何在不犧牲高價值信號性能的情況下最好地阻止它們。
為了進一步研究這個問題,讓我們看一個資源分配問題的例子和我們目前的方法在這方面的表現。我們考慮一個有24個頻率通道和8個不同對手發射器的環境。每個信號的周期長度、脈沖長度和脈沖間長度是隨機產生的。信號被隨機地分散在頻率-時間空間中,只要(1)發射者能在所需的頻率上操作,(2)該頻率是可用的(即沒有被其他對抗性發射者使用),信號就可以跳到不同的頻率。信號被分配的效用值為正整數,范圍從1到4(隨機選擇)。每當有信號被干擾時,智能體就會產生效用,獲得的金額就是信號的價值。
圖11總結了三種資源分配算法的統計性能:(1)在收集足夠的發射器模式數據后,干擾對抗性發射器以累積最佳預期獎勵的策略(藍色),(2)在各通道中均勻隨機干擾(橙色),以及(3)假設完全了解發射器模式的干擾性能(灰色)。請注意,每一種算法都是根據其干擾適當信號的能力來評分的,而存在的信號有無數的評分權重。信號被分配的權重大致與它們被認為的重要性成正比,因此更高的分數與更頻繁地干擾重要的對手能力(即那些與更高效用值相關的能力)相關。
圖11. 資源管理策略之間的干擾性能比較。在收集了足夠的發射器模式數據后,干擾對抗性發射器以累積最佳預期獎勵的策略顯示為藍色,跨信道的均勻隨機干擾顯示為橙色,假設對發射器模式完全了解的干擾性能顯示為灰色。相應顏色的虛線給出了模擬的抽樣平均性能。
共進行了一千次抽樣運行。圖11給出了每種策略的得分直方圖,其中相應顏色的虛線給出了模擬的采樣平均性能。均勻隨機干擾在三種策略中表現最差,智能資源分配方法表現次之,完美干擾策略表現最好。請注意,完美策略在實踐中是不可能實現的,因為它是非因果的,需要關于未來的完美信息,而實施的智能體在運行時無法獲得這些信息。
然而,我們感興趣的可能不僅僅是智能體的原始干擾能力。因此,我們在圖12中比較了智能資源智能體與統一搜索策略的學習性能。這里,藍色直方圖(及其相關的平均值)描述了智能體在每個歷時(即時間離散間隔)采取行動以盡可能減少其對操作環境的不確定性的性能,而橙色直方圖(及其相關的平均值)描述了在每個歷時均勻隨機掃描的智能體的性能。智能體學習對抗性信號的頻率范圍和時間模式的速度比處理通過在所有時間均勻隨機掃描獲得的信息的智能體要快。
在這個階段,值得注意的是,在解決資源分配問題方面,已經開發的內容與運營系統所需的內容之間存在明顯差距。最容易注意到的是,在目前的問題陳述中,至少有一些(如果不是全部)簡化的假設需要被改變,以適應現實世界的系統。盡管這樣的工作正在進行,并且具有技術上的意義,但它超出了本文的范圍。
目前的智能體只考慮控制一個收發器。在實踐中,每個平臺可能會配備幾個不同的傳感器和發射器。盡管在考慮這種概括時,智能體的具體實施細節將不可避免地發生變化,但基本架構將保持不變。變化將限于評價器。
目前我們為資源管理問題開發的解決方案是一個智能體,旨在根據關于其對手波形的貝葉斯假設采取行動。隨著智能體對其環境知識的積累,它可以更新其信念分布,導致更好的可能干擾行動。該智能體與傳統的強化學習智能體不同,因為它強烈地結合了主題專家知識,并利用基于模型的隨機優化方法來采取行動。基于模型的隨機優化方法允許設計者在智能體上設置特定的約束和界限,以防止它采取從設計者角度看是沒有結果的行動。我們的結果表明,這種方法顯示了在單智能體環境中使用的前景。
我們相信,隨著更多的研究,這種方法可以擴展到由協作性EW平臺組成的多智能體環境。主要關注的是分布式平臺的通信和處理延遲。由于波形以光速傳播,在EW平臺的戰斗群中優化這種方法仍然是一個挑戰。目前,我們只明確考慮了單個收發器的控制,但我們希望基本的方法可以擴展到多個收發器的情況,而不需要進行嚴格的算法重新設計。
圖12. 資源管理策略之間的學習性能比較。藍色直方圖(及其相關的平均值)描述了一個智能體在每個歷時中采取行動以盡可能減少其對操作環境的不確定性的性能,而橙色直方圖(及其相關的平均值)描述了一個智能體在每個歷時中均勻地隨機掃描的性能。
盡管應用ML的潛在好處是令人信服的,但要在戰術EW平臺內實現設想中的具有ML功能的自主行為,還存在許多障礙。ML技術可以作為一個強大的工具,用于開發能夠做出強大的、數據驅動的預測的模型。然而,當開發一個能夠進行數據驅動推斷的模型時,首先要有一個代表手頭問題的數據源,這一點至關重要。必須有一個能充分捕捉感興趣的射頻環境的訓練數據集來訓練ML算法。讓我們考慮兩種類型的射頻數據源,以及它們在構建適合在EW中實現ML應用的射頻數據集方面的作用。
產生射頻數據集的一個明顯的方法是直接從相關環境中記錄感興趣的信號。這可能是一個挑戰,取決于要解決的問題的背景。軟件定義的無線電已經使捕捉大量的信號變得更加容易。然而,要從收集的信號中捕捉到形成強大數據集所需的信號類型的廣度仍然是一個挑戰。此外,信號收集總是包含對特定環境和接收設備的偏見。如果想要一個干凈的信號集,現實世界中的數據雜質,如信道衰減、多徑和干擾,可能會成為問題。在其他條件下,收集的數據在驗證模型的環境因素方面可以產生優勢,而這些因素可能不健全。在使用現有的采集數據方面的另一個挑戰是,大多數數據不包含監督學習工作所需的足夠注釋。這通常意味著在使用采集的數據之前,需要額外的數據混合/手動標注。
產生射頻數據的另一種方法是模擬。這種方法的一個明顯的優點是,任何特征化的信號都可以通過參數的變化來產生,而這些參數的變化超出了可行的收集。然而,生成的射頻數據將只與模擬框架中的效果和損傷一樣真實。此外,在模擬過程中,幾乎不需要額外的努力來捕獲任何所需的元數據。這意味著用于訓練有監督的ML算法的標記數據通常可以更容易地添加到模擬數據集中。相反,考慮到適當的射頻效應會使合成足夠真實的信號數據成為一種挑戰。必須對觀測效應進行建模的保真度在很大程度上取決于數據將被應用的問題。還需要一個嚴格的驗證方法,如用標記的射頻集合進行交叉驗證,以確保所使用的合成數據能適當地代表它們所模擬的真實射頻信號。
一旦克服了上述與ML訓練數據相關的挑戰,在將ML應用于EW問題之前還應該考慮其他的挑戰。首先,許多可能用于未來整合ML算法的戰術主機平臺可能受到尺寸、重量和功率的限制。額外的尺寸、重量和功率通常會減少任務時間或功能。這意味著在具有豐富的圖形處理單元資源的企業服務器設施中應用典型的ML算法訓練方法在戰術平臺上是不可行的。同樣,連接平臺和這些設施的高帶寬數據鏈接可能無法支持ML應用。此外,需要有可靠的離線訓練與有限的再訓練和/或在線學習的方法,以便將ML引入戰術EW平臺。EW界長期以來一直依靠硬件在環和范圍內的測試和評估來確定EW技術的有效性。需要改進測試和評估基礎設施,以描述ML算法的非確定性行為,并在開發、贊助者和操作者群體中建立信任和信心。
PSMA IRAD對發射器識別和資源管理的投資為未來智能和自主EW平臺奠定了基礎。對AMR和自主資源分配的研究結果已經產生了有希望的結果,展示了平臺使用數據驅動技術和快速有效地解決敏捷威脅的能力。盡管這些基礎性的努力證明了ML解決方案在解決EW差距方面的可行性,但我們建議進行大量的后續研究工作,以使這些解決方案成熟。
一個這樣的未來研究方向涉及將問題背景從特定的調制或信號類型擴展到特定的發射器ID。這帶來了幾個必須首先解決的挑戰。確定發射器特定ID的問題可能會推動對其他背景信息的需求,以便有效地處理。其他相關的非射頻因素,如地理位置、日/月/年的時間,或其他特定任務的先驗因素,可能會影響到如何解釋捕獲的射頻發射,從而確定優先次序。
盡管測試/開發框架能夠反映真實世界的情景(如DARPA的頻譜合作挑戰所使用的環境模型),但需要與這些高保真頻譜環境模型整合,以開發和測試下一次迭代的ML-enabled RF系統。PSMA在這方面的其他幾項努力尋求加速未來協作EW系統的開發和演示。正在進行的小規模寬帶、低延遲環境(SaBLE)工作的重點是開發一個硬件在環射頻環境仿真基礎設施。協作和自適應系統EW模擬工作提出了一個事件驅動的模擬框架,設計了模塊化的平臺互動模型來模擬復雜的交戰。通過動態地改變保真度水平,模擬解決了在信號層面上對協作性EW交戰進行建模時遇到的時間分辨率挑戰。
最終,任何實地的、自動化的EW缺口解決方案都將以操作者可以理解的方式與人類操作者協同行動,并向指揮鏈的其他成員解釋。設計一個界面,允許手動調整不同信號的優先級,以及手動調整用于觀察和干擾的努力的平衡,在技術層面上是很簡單的。它可以通過允許用戶手動輸入不同的目標函數到智能體的在線優化中來完成。然而,創建這樣一個操作者可以認知管理的界面是具有挑戰性的。解決這項任務的路徑有很多;然而,所有這些都需要大量的設計工作和與相關專家(如人類因素工程師、候選操作員)的協商。
最后,將自動化解決方案納入EW任務需要一定程度的任務規劃。自主資源分配的貝葉斯機構方法也可以擴展到任務規劃中,以實現EW平臺和EW技術的最佳安置和使用。將自主資源分配部分描述的工作應用于任務規劃,需要考慮到目標、環境和對手的準確模型。通常情況下,所關注的情景是基于在有爭議的環境中的競爭性對手目標,從而使防御者獲得優勢。一個任務規劃應用程序應該在制定假設時納入操作者的先前信息。如果這樣做是正確的,算法所考慮的假設將與任務目標更加相關。然而,操作者也需要將不確定性納入先驗信息,這將導致非零概率跨越一組假設,這些假設是可能的,但根據操作者的知識認為不太可信。
在這篇文章中,我們描述了APL的兩個活躍的研究領域,它們正在將ML技術應用于EW領域的特定挑戰。我們進一步概述了EW的差距和建議的研究課題,我們預計ML將在未來的EM作戰環境中發揮作用。這些技術的成功采用將可能推動未來EW系統的開發、測試和維護方式的改變。
作者:Dmitry Filipoff
各部隊之間的密集火力作戰本質上是聯合作戰的一種功能。單個平臺應在其所適合的大規模發射計劃的大背景下加以理解,而大規模發射計劃則應理解為多種平臺類型的綜合集成。這些相互支持的關系不僅僅是增加導彈數量以提高火力。相反,不同平臺相互配合,彌補彼此的戰術弱點,構成的聯合武器威脅遠比不同平臺單獨構成的威脅更具殺傷力。
通過組織兵力倍增關系,聯合作戰還突出了關鍵的依賴關系。聯合作戰往往意味著一種平臺類型必須允許其作戰選擇受到另一種平臺類型的限制,這樣它們才能協同作戰。通過了解不同類型的平臺如何相互配合進行大規模火力攻擊,作戰行為可以變得更可預測,包括對對手而言。但對己方部隊來說,作戰行為也更容易預測,這可以增強這種作戰形式的理論凝聚力,因為在這種作戰形式中,跨平臺的流暢性和協調性尤為重要。
現代戰爭的作戰概念可能會側重于拆散這些關系,以獲得對對手的影響力。細節上的失敗通常被認為是小分隊成為敵軍的獵物,但也可能是同質的部隊組合成為敵軍的獵物,敵軍不對稱地利用了特定平臺的弱點,而這種弱點本可以通過聯合作戰關系得到緩解。通過了解這些關系的目的,部隊可以知道如何利用它們的缺失。
關鍵是要認識到,在建立這些聯合武器關系時,單個平臺社區可能是自己最糟糕的敵人。建立或改革這些關系的行為可能會引發軍種間的摩擦,因為聯合作戰為作戰概念的妥協和耗時的跨軍種部隊發展創造了條件。從歷史上看,聯合作戰辯論有時會產生抵制跨軍種整合的軍種 "純粹主義者"。這些 "純粹主義者 "往往堅信本軍種的能力是自給自足的,他們提出的聯合作戰構想往往是為各軍種劃定在行動上互補但在戰術上分離的活動范圍。
上述根據不同平臺類型的限制來限制選擇的需要,可能會導致不同軍種視對方為拖累或麻煩,而不是力量倍增器。海軍航空兵可能不愿意限制自己的機動范圍,以便為速度慢得多的軍艦提供局部海上滑躍防空和感知覆蓋。軍艦可能不愿意將其深彈倉內武器的釋放權下放給在上空飛行的飛行員,而飛行員可能更有能力提示和指揮遠程射擊。然而,這些關系可能是聯合部隊發展中必須理順的核心作戰需要。美國海軍目前的構想是,讓航母航空隊實施縱深打擊,而水面戰艦則對空中和水下威脅實施相當于球門線的防御,這種作戰方法比真正的一體化聯合作戰關系更為分裂。與針對具體軍種的訓練相比,真正的綜合訓練和演習只占工作周期的很小一部分,這一事實正在強化這一構想。
各海軍艦艇編隊,特別是美國海軍航空兵和水面艦艇部隊已經具備了廣泛的多任務能力,這可能會鼓勵艦艇編隊純粹主義者提出挑戰。如果沒有這種多任務能力,將特種部隊聯合成綜合部隊包的必要性就會更加明顯。但是,這些海軍部隊所具備的多任務能力并不能減輕它們在平臺上的許多基本弱點,也不能從根本上滿足對以發射和抵御大規模火力為目標的聯合兵種關系進行改革的需要。
可以建立一個框架,幫助了解與密集火力有關的各類平臺的優缺點,并了解每個平臺對聯合部隊的獨特貢獻。這一框架可以闡明,當某一類型的平臺因作戰環境或能力不足而無法做出貢獻時,大規模火力的整體計劃可以如何轉變和重組。這一框架還可用于了解孤立的平臺特性,從而了解恢復能力的關鍵因素。了解單個類型平臺的有機能力,可以揭示該平臺的獨立火力潛力、最后一擊以及同質部隊組合的效用。它還能揭示當這些平臺與更廣泛的聯合作戰部隊脫節時如何加以利用。通過對這些能力的單獨了解,可以窺見如果一支分散的部隊分裂成單個部隊集群和單元,還能保留多少有效性。
相關的平臺特性包括但不限于:彈倉深度、就位持續時間、有機傳感、裝彈速度、接近戰艦目標的能力以及機動速度。每個平臺的一系列優勢都會在某些方面促進整體的大規模發射計劃,而每個平臺的劣勢則可能會被其他平臺所彌補,并可能在此過程中限制其行為。
圖: 平臺屬性及其相對評級表。(作者制圖)
彈倉深度是指單個平臺可投入的火力數量。較高的彈倉深度可使平臺在較長時間內保持兵力分布,因為它可以在保持駐扎的情況下發射多輪小型炮彈。如果平臺被孤立或受到脅迫,較高的彈倉深度可使平臺在獨立或最后一擊時提供大量火力。彈倉深度越淺,在沖突期間重新裝彈的頻率就越高,從而破壞了兵力分配。彈匣深度較淺也會導致最后一擊和單獨射擊時火力較小,不容易形成壓倒性優勢。
就位持續時間是指平臺在未加燃料情況下的持續作業時間。平臺的持續時間越長,就越能提供更多的火力選擇,也就越能保持更長時間的兵力分配。低持續能力會降低火力的可用性以及平臺對分布式兵力態勢的貢獻程度。
有機感知是指平臺僅通過機載傳感器就能獲得多少目標信息。高有機感知能力可使平臺直接瞄準自己的火力,并管理較少分布在多個部門的殺傷鏈。如果一個平臺能將其傳感器信息可靠地傳遞到更廣泛的網絡,那么高有機傳感還能讓它提示其他平臺的遠程火力。而低有機傳感則會使平臺更加依賴外部信息源來確定其遠程火力目標。在獨立或最后一擊的情況下,有機傳感能力有助于使這些火力更加精確,并在必須在沒有網絡的情況下繼續作戰時更好地保持平臺的復原力。
機動速度是指平臺的行進速度。高機動速度可使平臺更靈活地融入大規模射擊序列,并控制發射風險。與速度較慢的平臺相比,更高的速度可使平臺在更短的時間內集中更多的數量。
接近戰艦目標的能力可使平臺在發射序列中建立更強的應變能力。平臺越接近目標,就越能在短時間內增加火力。距離越近,就越有能力確保射擊序列不受減員火力、先發制人摧毀的弓箭手的影響,并改善射擊序列持續時間內的發射分布。
裝彈速度是指消耗殆盡的平臺重新武裝并重返戰場的速度。較快的裝填速度可保持兵力分布和火力可用性。這里所說的重裝速度越高,意味著平臺重裝所需的時間越長。這里的重新裝彈速度也被理解為機動速度而非彈匣深度的函數,因為機動速度通常比重新裝彈時間更長。火力可用性不僅關系到平臺裝填新武器的速度,還關系到平臺在武器庫和發射區之間的移動速度。
每種平臺都具有這些特征的某些組合,而聯合武器框架將在最大限度地發揮優勢的同時設法彌補不足。這些優缺點說明了在何種情況下發射火力對每種平臺及其更廣泛的作戰選擇都是有利的。如果一個平臺必須承擔過多的發射任務,那么整個大規模發射序列的有效性就可能由該平臺的優缺點決定,并為對手提供破壞性的籌碼。
這些密集火力的概念主要集中在組織部隊進行反艦打擊上,這些概念絕不是海軍聯合作戰的完整概念。但是,打擊軍艦是一個具有挑戰性的優先目標,需要聯合作戰的方法。除了控制弱點和贏得兵力倍增優勢外,聯合作戰方法還必須集結大量火力才能突破軍艦特別密集的防御。因此,組織反艦打擊可以產生聯合武器方法,將多個群體聚集在一起,攻擊單一類型的平臺。
當一方在反艦火力方面占據優勢時,平臺如何聚集在一起進行大規模火力攻擊,以及相互競爭的大規模火力攻擊方案如何在戰斗中相互作用,這些都會造成嚴重的不對稱。當一種密集火力方案被剝奪了水面力量,或其水面力量大大超過對手時,由此產生的不對稱就變得尤其難以控制。
雖然軍艦可以受到多種平臺類型的攻擊,但反艦導彈卻無法反過來威脅其中的許多平臺類型。這些平臺包括飛機、潛艇和陸基部隊。飛機和潛艇等平臺只能受到射程比反艦導彈短得多的武器的威脅,這就對防御軍艦在這些 "弓箭手 "射箭前對其進行威脅的能力提出了挑戰。某些平臺具有先對軍艦有效開火的超強能力,因為它們的生存能力不像對稱的水面對水面交戰那樣受制于相同的動態因素。
然而,無法受到反艦武器威脅的平臺通常在站載續航力和彈倉深度方面面臨嚴重的劣勢,轟炸機在某種程度上是個例外。這些因素是水面平臺的優勢,使其能夠彌補飛機和潛艇的不足,而飛機和潛艇又能彌補水面部隊在快速近戰機動和接近對手能力方面的劣勢。與大多數其他平臺類型不同的是,水面部隊可以將大量導彈運到前沿并保持在那里,從而為大規模火力計劃提供支持。因此,水面部隊在聯合作戰部隊中的作用是為大規模火力打擊計劃提供一個縱深持久的火力基地,以加強彈倉較淺、存在時間較短的部隊。通過利用這一火力基地,其他類型的平臺就不必高度集中其平臺、管理隨之而來的后勤挑戰并承擔更大的風險。如果有足夠的數量和后勤保障,其他平臺和領域當然也可以充當大規模發射計劃的火力基地。但即便如此,大規模射擊計劃仍以對戰艦發動打擊為導向,并將多個群體結合起來,以消滅對方聯合武器團隊中的關鍵成員。
水面部隊提供的火力基礎可以有自己的機動范圍,但受到其他平臺類型關鍵作用的限制。水面部隊如果超出陸基航空兵的攻擊范圍,就會失去密集火力時最寶貴的伙伴之一。也許更重要的是,它將失去可以為進攻和防御目的提供關鍵防空覆蓋的伙伴。航空兵需要在掠海炮彈越過戰艦地平線之前對其造成重大消耗。當然,敵方也可以反擊,這就需要航空兵為前往目標的友軍炮彈提供前沿防空掩護。航空兵還能比戰艦更快地裝填防空武器,幫助戰艦堅持提供進攻火力的機動基地,而不是讓戰艦因防御力量耗盡而被迫帶著未使用的進攻武器撤退。
因此,水面作戰部隊應盡量保持在友軍陸基航空兵的攻擊范圍內,以大幅增加和抵御火力。航母航空兵當然可以提供這些能力,但其規模和范圍通常不如陸基航空兵。航母可以在陸基航空兵難以到達或難以長時間停泊的深海區域提供寶貴的空中支援。但總的來說,在密集火力計劃中,確保水面部隊提供的火力基礎與航空兵提供的防空覆蓋基礎充分疊加可能是明智之舉。
當兩種密集火力方案在戰斗中相互競爭和相互作用時,一支部隊大幅超越另一支部隊反艦火力的能力會對對手之間優勢的形成產生深遠影響。如果一支部隊能有效地將足夠多的反艦火力瞄準到比對手遠得多的距離,那么對手的射擊計劃就可能被剝奪其水面部隊提供的寶貴火力基礎。這將嚴重影響由此產生的密集火力計劃,因為它割裂了聯合武器的關系。
當一支部隊的密集火力計劃被對手大幅超越時,該部隊就可能不得不將航空兵的主要精力放在防御其水面部隊上,而對手則會利用其優勢能力首先開火。當一波又一波的大規模火力從遙遠的對峙距離發射時,航空兵就需要集中精力削弱來襲的火力。這樣做的目的是給對手造成足夠的火力消耗,以削弱其后續反艦攻擊的能力,并通過幸存的水面部隊有效保留剩余的攻擊選擇,因為面對火力嚴重消耗的對手,水面部隊有更大的行動自由。
由于航空兵在速度和對戰艦先發制人的能力上都具有天然優勢,因此航空兵必須在戰艦對己方水面部隊發射遠程火力之前,遠距離攻擊戰艦。在這些較遠的距離上,航空兵更有可能單獨集結火力,而不是作為聯合部隊的一部分。航空兵必須集結大量飛機和空中坦克才能形成足夠的火力,然后還必須將飛機集結到目標周圍特別密集的地方,以便及時發動攻擊。除此以外,如前所述,航空兵可能還需要為艦隊防空做出重大貢獻。因此,射程更遠的反艦火力迫使對方的航空兵承擔更多的進攻和防御任務,使航空兵在聯合作戰中承擔更大的責任。
但在這種情況下,航空兵可能不必孤軍奮戰。當水面部隊的反艦火力被超越時,聯合武器小組仍可由飛機和潛艇組成,它們都能通過各自的領域繞過反艦火力,贏得與對手更近的距離。如果有足夠多的飛機和潛艇能夠協同作戰,在作戰空間的前沿進行聯合火力打擊,那么它們就有可能在對戰艦發起對峙火力之前,首先對水面部隊進行有效打擊。
同樣,A2/AD 區域的聯合部隊也可以由潛艇和替補部隊組成,因為它們都具有深入作戰空間的能力。雖然這兩支部隊都可能受到彈艙深度的限制,但它們接近對手的能力可以使它們有機會威脅彈艙較滿的軍艦,并在軍艦發射最后一輪炮擊也是徒勞無功的區域內進行威脅。
不同的作戰環境會產生不同的聯合武器小組組合。一些平臺類型可能會面臨無法提供火力的情況。這可能迫使其他平臺增加其在大規模發射計劃中的貢獻比例,但風險有可能增加,而且可能因為其他平臺無法有效彌補其平臺弱點。如果分布式部隊分裂成較小的單個部隊,他們最好盡可能尋找友軍平臺并組成臨時聯合部隊。至關重要的是,要考慮如何在各種作戰環境下最大限度地加強聯合武器關系,并了解如何將這些關系分割給對手。
一個重要的考慮因素是,海軍聯合作戰部隊的不同成員對最后一擊射擊壓力的敏感度大相徑庭。這在很大程度上影響了更廣泛的部隊利用某些平臺的最后一擊進行額外射擊的能力。這些動態因素決定了一支部隊在遭受損失的同時保持其應變能力和大規模射擊能力的能力。
假設一支部隊對廣闊區域和海面具有高質量的態勢感知能力,那么受到攻擊的軍艦可能會有數十分鐘的預警時間,因為這可能是來襲火力的瞄準時間。這可以給軍艦留出足夠的時間來發射最后一輪炮火,也可以給分布更廣的部隊留出更多的時間來組織火力,以利用即將到來的最后一輪炮火。
飛機和潛艇的預警和最后一擊在關鍵方面有所不同。對這些平臺構成威脅的武器,如防空導彈和魚雷,其命中目標的時間僅為反艦導彈的一小部分,而反艦導彈則需要數十分鐘才能命中軍艦。然而,與軍艦和反艦導彈之間的速度差相比,飛機和潛艇的機動速度更接近于這些武器,因此在武器來襲期間,規避機動是提高飛機和潛艇生存能力的更可行的方法。但這種潛在的激進機動可能會抑制這些平臺在最后一擊中發射密集火力的能力,而發射這些密集火力可能需要更穩定的運動軌跡,從而大幅增加來襲武器擊中平臺的幾率。即使它們選擇發射最后一輪火力進行反擊,發射最后一輪炮彈的時間也可能長于武器到達潛艇或飛機的時間,這與軍艦的情況不同。與遠程反艦火力不同,分布更廣的部隊幾乎沒有時間組織火力對防空或魚雷攻擊做出反應。
與反艦火力相比,防空和反潛火力的殺傷鏈可能更容易由單個平臺完成,因為它們通常擁有足夠的有機傳感和彈倉深度。一架戰斗機加上機載雷達和數枚防空導彈就足以威脅轟炸機,一艘護衛艦加上聲納和數枚魚雷就足以威脅附近的潛艇。這些交戰的近距離特性使得單個平臺就能通過有機傳感器滿足它們的信息需求,而且這些交戰的攻防平衡所需的武器要少得多,才能集結足夠的火力。相比之下,一艘需要在數百英里外鎖定目標、需要數十枚導彈才能擊沉的戰艦,則需要更廣泛的信息架構和多兵種精心協調的火力。將飛機和潛艇置于被迫發射最后火力的境地所需的能力要小得多。
與軍艦相比,飛機和潛艇必須在截然不同的情況下發射最后一擊。軍艦可能永遠無法探測到絕大多數對其發射火力的分布式平臺的發射物。但是,飛機和潛艇可以利用它們的有機傳感器來探測瞄準它們的平臺的有機傳感器。轟炸機可以感知來襲戰斗機的照明,潛艇也可能被軍艦的主動聲納探測到。飛機和潛艇不會等待防空導彈和魚雷來襲,然后再進行最后的射擊。相反,它們更依賴于解讀發射和感知背后的意圖,以獲得足夠的預警來發動最后一擊,然后采取防御措施。它們需要感知可能發射武器的平臺,而不是對射來的武器做出反應,這使它們對最后一擊的動態和壓力更加敏感,而這些動態和壓力可能迫使它們浪費彈藥。
對方的戰斗機中隊只需向轟炸機群發出航向指示并用雷達照射,就足以引發轟炸機的最后一擊,而戰斗機無需消耗自己的任何武器。相比之下,一艘軍艦如果知道自己正在成為攻擊目標,甚至正在遭受來襲火力的攻擊,仍然可以暫緩發射最后一擊。這是因為軍艦可以確信,來襲的火力不足以壓垮其防御系統,而飛機和潛艇在考慮生存能力時大多不考慮這一因素。軍艦的密集防御使其能夠將促使其進行最后一擊的情況限制在對箭矢而非弓箭手做出反應的范圍內。箭矢的存在更可靠地表明了對手打擊目標的意圖,使軍艦更難通過簡單的姿態和主動感知進行最后一擊。
總之,分布式部隊可包括各種平臺,必須將其不同的特征和能力結合起來才能發揮作戰效果。指揮官在考慮如何在有爭議的戰場上使用分布式部隊時,必須了解單個平臺類型的優缺點,以及這些優缺點如何影響他們的選擇。以下的平臺分類討論了它們各自的特點,以及它們與艦載齊射戰斗和大規模火力的關系。
水面戰艦體現了各國海軍有效地將大規模火力投送到海上的能力。藍水海軍在水面艦隊中部署了大量常規巡航導彈火力,最強大國家的發射單元多達數千個。水面艦隊提供的一些最關鍵的能力是其可觀的數量、續航力和導彈能力,這些都是集結火力和分散兵力的核心屬性。
盡管水面艦艇具有相當大的優勢,但其裝填速度較長,在較長時間內的續航能力受到損害。其較低的平臺速度增加了生存能力的挑戰,也增加了其降低主動輻射風險的能力。但是,它們的高彈倉容量可以為最后一擊提供大量火力,不需要外部火力來加強最后一擊的威力。
水面艦隊的大容量導彈是一把雙刃劍。防御導彈能力可以用來抵消進攻導彈能力,反之亦然。隨著發射單元數量的增加,可用于阻擋攻擊的防御火力也隨之增加,從而提高了壓倒防御所需的進攻火力。水面戰艦可以在多個發射單元中部署大量對空武器,這一事實本身就可以迫使對方戰艦清空自己的大部分彈倉,以壓制目標。在發射或防御一次反艦導彈齊射的過程中,水面戰艦可以輕而易舉地清空大部分彈倉。
這與其他類型平臺的作戰潛力和持久力形成了強烈反差。飛機、潛艇和坦克在面對同等平臺時可以獲得相對較高的殺傷率,因為它們不需要使用主武器來達到致命效果。水面戰艦的反艦火力可能只夠突破一艘同等大小戰艦的防御,如果是這樣的話。一艘水面戰艦也可能要航行數天甚至數周才能投入戰斗,但在幾分鐘內就會消耗掉大部分主武器,然后不得不長途跋涉返回重新武裝。盡管水面戰艦給人的印象是能力很強,但它在很大程度上仍然依賴與其他部隊的聯合火力來限制其消耗,并在高端戰斗中經受住考驗。
任何平臺的導彈能力都不能脫離其可能發射或防御的炮彈的戰術特點而有效理解。攻擊火力可以在數十分鐘內形成,并由許多分散的部隊發射各種不同的火力。但是,當軍艦受到齊射攻擊時,全部進攻火力可以在很短的時間內沖出地平線,而防御軍艦必須在幾秒鐘內從零開始建立自己的防御火力。第 7 章將更詳細地討論這種動態變化,因此水面戰艦在一次交戰的短時間內實際用于自身防御的垂直發射單元數量可能會受到一定限制。超過這一限制后,額外的垂直發射能力主要有利于進攻火力,而不是防御火力。部分原因是,與防御相比,水面戰艦在發起攻擊時往往有更多的時間來增加火力。
現代海戰的多領域性質鼓勵多任務能力和有效載荷。現代水面作戰艦艇通常采用多任務平臺的形式,裝備各種特定領域的武器,部分原因是為了生存能力必須如此。潛艇、陸基部隊和空中飛機不受反艦導彈的威脅,但這些平臺都可以對水面戰艦發射反艦導彈。與其他海軍平臺相比,水面戰艦面臨來自更多領域的威脅。
這些多領域威脅對水面戰艦導彈能力的配置提出了挑戰,并限制了其真正的彈倉深度。反艦、防空、對地攻擊和反潛等多種任務的導彈彈倉裝載量可能會捉襟見肘。這些任務中的每一種都可能需要大量武器才能發揮最低限度的作用,并擁有足夠的火力,而這些武器很容易擠占用于其他任務的導彈單元。一艘水面戰艦在執行過多任務時,彈倉裝載量可能會捉襟見肘,手頭可能沒有足夠的導彈來可靠地發射或防御一次大型反艦炮擊,這就造成了對密集火力和聯合部隊的依賴。利用分布式部隊更廣泛的集體彈倉,在整個部隊層面而非單個平臺層面為分布式火力配置彈倉載荷,可以緩解單個戰艦彈倉過于分散所帶來的挑戰。
與其他導彈發射平臺相比,水面戰艦在機動性、隱蔽性和易受攻擊性方面存在劣勢。現代導彈的射程和速度大大降低了戰艦機動在近期戰術層面的作用。在海軍炮戰時代,幾分鐘或幾秒鐘的熟練機動就能產生重要的戰術差異,但現代軍艦通過短期機動能顯著提高其抵御導彈攻擊的效果的手段相對較少,或許只有裝載短程防御系統才能做到這一點。面對速度比軍艦快 15 到 50 倍的導彈炮彈,機動的作用微乎其微,這就把生存能力的因素降到了防御能力和欺騙能力上。
為了進行復雜的防空交戰并對廣闊區域的態勢有所了解,水面作戰艦艇通常都配備有強大的傳感器,這些傳感器會大大削弱其隱身能力。一旦這些傳感器發出輻射,其獨特的信號可提供足夠的信息,幫助在遠距離(可能達數百英里)對戰艦進行定位和分類。考慮到移動緩慢的軍艦需要多長時間才能機動離開其定位區域,這些信息對于鎖定反艦攻擊目標的作用可以持續相當長的時間。相比之下,發射特征信號的飛機可以利用速度和機動迅速拉開與其位置之間的距離,降低到雷達視野以下,并更有效地控制發射風險。
這些大功率傳感器可用于防御水面戰艦遭受導彈攻擊,而導彈齊射防御是一種特別需要發射信號的作戰形式。由于抵御掠海導彈突破附近地平線的短程性質,這些發射裝置廣播戰艦位置的能力可以得到一定程度的緩解。但是,如果一艘戰艦想利用其有機傳感器對飛機發射的攻擊發出預警,并在箭矢之前擊敗弓箭手,那么它就必須在更遠的距離上進行輻射,這可能會把攻擊者引向它的信號。
2013年8月8日--美國海軍哈爾西號導彈驅逐艦(DDG 97)在夏威夷瓦胡島外海進行演習。(美國海軍大眾傳播專家海員 Johans Chavarro 拍攝/發布)
發射反艦導彈攻擊時,發射平臺幾乎不會發出任何有機物,因為距離太遠,需要外界的提示。但是,導彈發射本身會產生一個可追溯到發射平臺的特征,就像航空機群的物理特征可追溯到航母一樣。但與飛機或潛艇不同的是,水面戰艦通過近期機動所能做的事情相對較少,無法減輕其最近發射的巡航導彈齊射信號所帶來的近期風險。它們必須在很大程度上依賴導彈的射程和諸如航向定位、重新瞄準和導彈自主等能力,以確保足夠的距離和復雜的威脅表現形式不會產生可追溯到發射戰艦的足跡。
所有平臺都能通過發射和開火突出顯示自己的位置和平臺類型。所有平臺都能在采用進攻和防御戰術的過程中發射信號。但與大多數其他海軍平臺相比,水面艦艇無法通過機動有效地降低風險,而且水面艦艇可以從更多的平臺和領域受到攻擊。在大國海軍中,水面艦艇以數量多、防御能力特別強為特點,以彌補其較高的易受攻擊性。
潛艇在分布式作戰中具有獨特的優勢。但由于其導彈能力和火力有限,加上海底通信的挑戰,它們發射有用炮彈的能力受到嚴重限制。潛艇在大規模火力攻擊中的優勢主要體現在其近戰能力,以及用魚雷而非導彈擊沉艦艇的有利條件。
由于潛艇的彈艙深度低、裝填速度長、有機傳感能力差,因此潛艇在許多方面都不適合參與大規模火力攻擊。與水面戰艦一樣,它們在很大程度上依賴外部提示來發射火力,但由于彈倉深度較淺,只能發射相對較小的火力,而且它們通常比水面戰艦更難溝通。
潛艇作戰的孤獨性嚴重限制了其集結足夠火力的能力。與大多數其他平臺相比,潛艇不太可能成群行動,而更習慣于單獨行動,這進一步限制了潛在的火力。雖然潛艇肯定能融入大規模射擊計劃或作戰層面的計劃,但如果潛艇不是作為一個獨特的部隊組合的一部分來行動,那么它們就不太可能產生壓倒性火力的獨立炮擊或最后一擊。
潛艇獨立發射的近程火力與分布在各處的部隊發射的集束炮火相差甚遠。如果潛艇要在獨立情況下用導彈與軍艦交戰,就必須完全依靠自己的導彈庫,而攻擊型潛艇的導彈庫往往很淺。如果潛艇要有足夠的火力壓制多層軍艦防御系統,其整個垂直發射單元庫存很容易在一次攻擊中消耗殆盡。如果潛艇發射的密集火力要有足夠的密度和體積,那么潛艇就必須主要從專用導彈單元而不是魚雷發射管發射這些火力。魚雷發射管發射的導彈固然可以作為密集火力的補充,但由于潛艇魚雷發射管的數量通常只有個位數,因此這些發射管能否單獨發射足夠大的火力打擊高端戰艦還很值得懷疑。
美國攻擊型潛艇部隊目前的彈倉容量相對較小,洛杉磯級和弗吉尼亞級潛艇只有 12 個垂直發射單元和 4 個魚雷發射管。海狼級潛艇有 8 個發射管,沒有發射單元。這些潛艇每次發射 16 枚導彈,其最大投擲重量是裝備 "魚叉 "導彈的美國驅逐艦或巡洋艦的兩倍,或相當于 4 架 F/A-18 飛機。但這仍然不足以壓垮擁有數十個垂直發射單元和一系列點防御的警戒戰艦。為了發動有效的導彈攻擊,潛艇可能會被迫拉近距離以確保優勢,同時冒著更大的風險,或者嚴重依賴外部火力與其發射的炮彈相結合,從而降低其作戰獨立性。
1991年2月1日--美國海軍俄克拉荷馬城號核動力攻擊潛艇(SSN-723)的艦艏打開了12個垂直發射戰斧導彈發射管的艙門。(照片來源:美國國家檔案館)
雖然 "弗吉尼亞 "級潛艇即將推出的改型將擁有 40 個垂直發射單元,但這些潛艇將在本十年末才開始進入艦隊,直到本十年后才會大量出現。海軍的四艘 SSGN 潛艇擁有巨大的運載能力,每艘潛艇有 154 個發射單元,但它們將在本十年末退役。這四艘潛艇退役后,海軍潛艇部隊在未來 15 年內的反艦導彈火力將相對較弱。
潛艇仍能在一定程度上以有利條件對軍艦發動導彈攻擊。通過從相對較近的距離發射密集火力,潛艇可以削弱對手動用空中力量打擊密集火力的能力,并能最大限度地延長密集火力在掠海高度飛行的時間。其結果是,密集火力的大部分飛行時間都在目標戰艦的雷達視平線之下,其發射距離超出了艦載反潛武器的能力范圍,使其無法立即發揮威力。
但是,發射密集火力需要時間和空間來增加火力,然后將其組織成特定的攻擊模式,如飽和模式。潛艇發射的密集火力可能需要一個由這些需求確定的最小交戰范圍,在此范圍內,潛艇可能需要使用非線性航向定位來獲取足夠的時間和空間,以便在攻擊前擴大火力并組織火力。
潛艇可以從比目標戰艦地平線更近的距離開火,從而獲得額外的優勢。如果潛艇導彈攻擊的距離足夠近,那么垂直發射的導彈就很難迅速調整方向,以進行角度陡峭的攔截。這有助于抵消防御戰艦的大部分硬殺傷防御火力,使較小的火力壓倒防御,并迅速摧毀戰艦,使其幾乎沒有時間發射最后的火力,甚至魚雷。然而,與魚雷攻擊或超視距導彈攻擊相比,這種短程導彈發射掠過水面的視覺提示可以幫助防御軍艦更容易地確定攻擊潛艇的位置。
盡管潛艇的彈倉深度有限,但它們卻能通過更接近目標的能力在集火中發揮重要作用。這樣,潛艇就能在減員火力和匆忙組織的射擊序列中起到保險作用。如果有火力被擊落,或者需要在短時間內進行齊射,潛艇往往是唯一能夠接近目標并增加火力的平臺。如果缺乏足夠的潛艇,大規模發射計劃就很難保證其發射序列不被損耗或在短時間內發射。正如第 4 部分所提到的,潛艇可以通過魚雷攻擊擊沉目標來獲得巨大收益,因為魚雷攻擊的消耗遠遠低于導彈發射,潛艇可以用少量魚雷來替代大量導彈火力。
雖然潛艇發射的魚雷對其較淺的導彈彈倉造成了特別大的消耗,但與處于同樣情況下的軍艦或飛機相比,導彈消耗殆盡的潛艇幾乎不屬于危險資產。由于潛艇在海下活動,因此無需為防御反艦導彈炮彈而付出高昂的防空費用。即使潛艇的導彈庫已經耗盡,只要有足夠的魚雷庫存,潛艇仍然可以作為一種具有可信威脅和生存能力的資產。
2022年7月12日--洛杉磯級快速攻擊潛艇夏洛特號(SSN 766)準備在2022年環太平洋(RIMPAC)會議期間離開珍珠港-希卡姆聯合基地。(美國海軍二等電子技師 Leland T. Hasty II 拍攝)。
從潛艇上發射遠程反艦炮彈可能會給火力提示帶來挑戰。如果潛艇要攻擊的軍艦距離超過了其有機傳感器的相對較短范圍,則很可能需要外部資產來提示其開火。各種形式的低頻通信可以提供這種信息。某些平臺,特別是航空平臺,也可以在有爭議的電磁作戰空間內幫助提示潛艇發射導彈。但由于需要及時提供火力支援,而且潛艇有能力深入到有爭議的海域,這可能會給試圖提示潛艇發射火力的平臺帶來風險。潛艇發射的空中無人機具有實現超視距火力的有機能力,可在一定程度上緩解這一問題。但潛射無人機的能力可能仍不足以讓潛艇在沒有外部提示的情況下提供特別是遠程火力。
提示潛艇發射的性質會給利用潛艇提供火力帶來挑戰。與整個部隊的各種平臺相比,潛艇因其在海底而屬于較難溝通的平臺。如果指揮官希望潛艇為集合發射提供火力,可能會涉及更復雜的通信和時間安排問題,從而無法發揮潛艇的能力。
陸基導彈部隊可分為兩大類:一類是位于國家本土的陸基發射裝置;另一類是待命部隊,如美國海軍陸戰隊設想的待命部隊。這些不同類型的部隊可在集火中發揮關鍵作用。
常規陸基部隊,如通常位于國家本土的部隊,可由海岸防御巡航導彈發射器、導彈發射井和運輸豎起發射器組成。由于由陸基平臺而非限制性更強的海基平臺部署,這些武器在高度分散的部隊結構中仍能發揮非凡的威力。這些特性使陸基導彈部隊能夠部署當今最強大、生存能力最強的導彈能力。
陸基部隊裝備了一些已知最大的反艦導彈,例如中國的 DF-26 重量是戰斧導彈的 15 倍多。這些導彈的巨大尺寸使其能夠最大限度地發揮遠程和高速這兩個關鍵方面的能力。由于射程超過 1000 英里,這些武器可以在整個戰區范圍內威脅眾多目標,而且發射平臺幾乎不需要任何機動。高速度使這些武器能在極短的時間內完成遠距離飛行,有助于保持原始目標數據的可行性。通過遠距離和高速度的結合,這些導彈在大范圍內的攻擊時間很短,這使它們在與其他類型的導彈聯合發射時具有廣泛的靈活性。從千里之外發射的彈道導彈仍然可以與從幾百英里之外發射的亞音速導彈結合,因為這兩種武器最多只需要幾十分鐘就能打擊同一目標。
具有這些射程和速度高端組合特點的反艦武器主要局限于高超音速武器和中國的反艦彈道導彈。即將推出的陸基戰斧發射器等武器的射程類似,但速度卻不盡相同。然而,陸基戰斧發射器的普及將大大增加美軍導彈火力的潛在分布和數量。
PLA火箭軍DF-26彈道導彈。(新華社攝)
2019年4月18日,在加利福尼亞州圣尼古拉斯島進行了常規配置地面發射巡航導彈的飛行試驗(美國防部照片由Scott Howe拍攝)。
陸基部隊具有極強的生存能力和分布能力。沙漠風暴 "中的飛毛腿獵殺傳奇表明,要找到這類發射器幾乎是不可能的,即使是在擁有完全制空權的開闊沙漠地帶。試圖直接攻擊敵方本土內的陸基發射裝置則更具挑戰性,僅僅試圖確定其攻擊位置就可能耗費大量人力物力。由于位于本土,這些部隊在后勤方面可以受益于靠近其維持基礎設施的優勢,而且盡管武器體積龐大,但裝填速度卻非常快。
由于減員面臨巨大挑戰,打擊陸基部隊及其火力主要局限于打擊對手更廣泛的 ISR 和 C2 架構。如果更廣泛的網絡受到破壞,這些部隊將幾乎沒有有機的感知手段來產生獨立的火力。這些部隊對外部提示的依賴程度特別高,因此作戰韌性較差,在網絡退化的情況下也不太可能從容地分裂成單個部隊集結。相比之下,飛機和戰艦則可以在更廣泛的網絡受到破壞時,依靠自身的傳感器為自己獲取一定程度的信息。
相對于武器的速度和射程而言,陸基部隊缺乏機動性也是一個挑戰。如果這些部隊分散在群島或廣袤的國土上,它們可能無法像飛機或戰艦那樣輕易地機動以形成密集的火力網。相反,在沖突初期,它們的大范圍分散可能會造成相對狹小的火力范圍。即使這些武器射程極遠,將這些部隊分散到相距數百英里的固定基地也會削弱其聯合火力的密度。
在一些關鍵方面,待命部隊與常規陸基導彈部隊截然不同。待命部隊是遠征部隊,部署在遠離祖國數百甚至數千英里的地方,部署在相對較小的島嶼上,與對手近在咫尺。這導致后勤要求更具挑戰性,使其能力受到瓶頸制約。維持遠征軍的后勤挑戰使待命部隊更難部署大型陸基導彈發射平臺。與在本土作戰的部隊相比,待命部隊可能只能部署能力和數量都較少的巡航導彈。
與大多數其他類型的部隊相比,替補部隊要想僅憑手中的武器突破強大的戰艦防御尤其困難。相反,他們可能會遭遇與潛艇類似的劣勢--能夠比大多數其他平臺更接近對手,但手頭的導彈彈倉較小,因此需要更多依賴外援才能實現足夠的火力打擊。如果待命部隊的淺彈倉耗盡,可能會給補給工作帶來巨大風險。與能夠更好地撤出敵方武器交戰區的軍艦或飛機相比,在敵方附近使用艦艇為替補部隊重新裝填彈藥的風險要大得多。
2021年8月16日,夏威夷巴金沙太平洋導彈發射場,海軍陸戰隊遠征艦艇攔截系統發射裝置就位。(Nick Mannweiler 少校拍攝)。
駐扎在各島鏈上的待命部隊可以及時提供情報,幫助分布式部隊集火打擊目標。靠近島嶼咽喉將簡化尋找海軍目標和集火打擊目標的任務。與位于大陸縱深的常規陸基部隊相比,島嶼上的待命部隊能更好地利用其有機傳感器來提示自己的火力。但是,如果沒有有機航空能力,這些待命部隊要實現更廣泛的態勢感知將是一個挑戰。事實可能證明,高空無人機過于脆弱,無法在如此接近對手的情況下持續作戰,而大量的有人駕駛航空兵也很難在先遣基地持續作戰。
雖然替補部隊可以在火力提示方面做出重大貢獻,但他們很難獨自集結有意義的反艦火力,也很難維持航空兵以獲取有價值的情報。而且,如果替補部隊難以發射在高空封鎖空域所需的大規模對空導彈,其保持隱身和管理特征的能力就會被對手的持續空中監視所削弱。顯而易見,需要的是足跡小、信號低,但探測信號往往需要付出代價。這些隱身措施可能是替身部隊的關鍵推進手段,但當替身部隊受到對手的嚴重壓制時,這些措施也可能成為必要之惡。
轟炸機是爭奪制海權、執行分散行動和攻擊戰艦的最有利平臺之一。轟炸機具有強大的綜合特性,包括高機動速度、快速裝填時間、強大的在站續航能力以及接近水面戰艦的攻擊性彈倉容量。
雖然美國轟炸機的無燃料航程與大型水面戰艦相似,但其高機動速度消耗航程的速度要快得多。雖然轟炸機一次裝載燃料可以飛行數千英里,但仍需要在當天內補充燃料,而軍艦則可以數天不補充燃料,因此它們的近期續航能力更強。然而,轟炸機與空中加油機會合所需的時間遠遠少于軍艦與加油機會合所需的時間,這就使轟炸機能夠提供相當大比例的按需駐防火力。轟炸機的航程和續航能力使其可以在數小時內完成整個戰區范圍內的反艦火力集群。轟炸機的彈艙容量大,又具有有機傳感能力,因此還能進行最后一擊,其火力接近于戰艦火力,但精度更高。
對手可能會根據已知的戰艦能力和部署情況,對地區海軍部隊可用的綜合火力有足夠的了解。但他們可能不太清楚如何在短時間內調集空中力量,特別是轟炸機來提供火力。由于轟炸機兼具速度快、航程遠的特點,對手不得不假定各種轟炸機能為對手提供多種分布式射擊選擇。以美國大陸為母港的美國戰艦無法像以大陸為基地的轟炸機那樣,在美國前沿艦隊構成的潛在分布和火力中扮演重要角色。
目前,美國轟炸機只能發射 LRASM 等反艦武器,其早期型號的射程還不到 "海上打擊戰斧 "的一半。LRASM 和 "魚叉 "導彈一樣,由于必須從比轟炸機小得多的多用途飛機上發射,其能力受到限制。對于美國來說,轟炸機發射比多用途飛機大得多的導彈的能力在反艦任務中將基本無法實現。然而,轟炸機早在幾十年前的冷戰中就試射過 "戰斧 "導彈的空射變體,并發射過射程超過一千英里的其他空射巡航導彈。如果轟炸機能夠發射類似于從軍艦發射單元發射的巡航導彈,那么轟炸機從遠距離大規模反艦火力的能力將得到加強。
1979 年 12 月 6 日--B-52 "戰斧 "堡壘飛機左側視圖,機上載有 AGM-109 "戰斧 "空射巡航導彈。(圖片來源:美國國家檔案館)
美國空軍正在開發可能改變游戲規則的 "快速龍 "能力,該能力允許從機載平臺投放的托盤上部署巡航導彈。與 "分布式致命性 "概念的口號 "只要能漂浮,就能作戰 "的精神相似,這種能力將為空軍數百架遠程運輸機帶來巨大的巡航導彈能力。快速梟龍 "將極大地擴展可使用遠程導彈火力的兵力結構范圍,并大大增加兵力分布。如果空軍采購到足夠的反艦導彈,這種能力將成為大規模火力的重要倍增器。
2021 年 9 月 - 在白沙導彈發射場上空,C-17 和 EC-130 飛機部署了第一批 "快速龍 "托盤,以釋放代理 JASSM-ER。(洛克希德-馬丁公司視頻)
當不同的平臺群體形成聯合作戰關系時,大規模火力和海戰能力將得到極大提升。聯合部隊的發展和共享平臺的流暢性將加強軍種間的融合。作戰人員將更好地了解自己在聯合部隊中的角色,以及制約其跨艦隊伙伴行為的作戰動態。雖然這些關系不會沒有摩擦或具有挑戰性的權衡,但它們將創造出一支比那些努力超越各自為政和狹隘主義的部隊更有效的部隊。
第七部分將重點討論航母在分布式作戰和密集火力中的作用。
近年來,無人機在武裝沖突中被用于各種目的,從情報、監視和偵察行動到反武力打擊。無人機技術的發展日新月異。從這種新的現代戰爭形式中可以吸取各種經驗教訓。
在最近的沖突中,被稱為 "自殺式無人機 "或 "神風特攻隊無人機 "的新型致命、不可預測和單向一次性無人駕駛航空武器系統在沖突中發揮了重要作用。在長達六周的納戈爾諾-卡拉巴赫沖突中,除了土耳其 Bayraktar TB2 型常規無人機外,阿塞拜疆還部署了被稱為 "IAI Harop "的以色列神風特攻隊無人機來對付亞美尼亞。這些無人機甚至在到達前線之前就摧毀了亞美尼亞的裝甲部隊及其后勤。同樣,像 AeroVironment Switchblade、Phoenix和 Zala Lancet-3 這樣的神風特攻隊無人機也在正在進行的俄烏沖突中造成了嚴重破壞。
它們體積小、成本低、可擴展,因此在戰斗中非常有效。與使用戰斗機發射導彈并確保導彈安全返航相比,各國更傾向于使用神風特攻隊無人機,因為這種無人機可以將自己變成武器,而不需要任何返航麻煩。與大型戰斗無人機不同,這些神風特攻隊無人機在低空低速飛行時產生的視覺、聲學和熱學信號都很低。因此,傳統的防空系統完全無法探測到它們。但是,如果一架自殺式無人機或 "神風特攻隊 "沒有爆炸怎么辦?幾個月前,烏克蘭就發生過這種情況,一架四英尺寬、棕褐色、飛機形狀的俄羅斯神風特攻隊無人機在基輔地區從天而降,直接墜入地面,撞擊時沒有發生任何爆炸。這一事件被烏克蘭部隊發現,并受到媒體關注。3 這一事件被烏克蘭部隊發現,并受到媒體關注。雙方可能都有許多此類未爆炸神風特攻隊的案例,但都未被發現和報告。這種未爆炸的無人機今后會怎樣呢?
必須指出的是,在各種歷史戰爭和沖突中,集束炸彈造成的未爆彈藥或啞彈的發現和拆除仍然是全球軍備控制和裁軍制度中的一個重大問題。無論是意大利干涸的河流、倫敦的建筑工地,還是越南、伊拉克和阿富汗的城市,這些爆炸 "反芻動物 "都對環境和人類生命構成了危險的長期威脅。神風特攻隊無人機在當代沖突中的大規模發展和投入使用將進一步加劇這一代人的危機。
美國國防部(DOD)將 ISR 定義為 "綜合行動和情報活動,同步整合傳感器、資產和處理、開發和傳播系統的規劃和運行,直接支持當前和未來的行動"。ISR 處于規劃、軍事行動和評估的十字路口。情報是系統觀測、收集、處理、整合、評估、分析和解釋航空航天、網絡空間、地表和地下信息的最終產物。這些情報將有助于指揮官識別作戰環境中的威脅和機會,識別敵人的弱點和欺騙行為,保護其資產和盟軍。
ISR 無人機在當代沖突中發揮了獨特而創新的作用。在納戈爾諾-卡拉巴赫沖突的早期階段,阿塞拜疆將 11 架蘇聯時代的 AN-2 慢速飛機改裝成無人機,用于 ISR 目的。阿塞拜疆還利用特殊的 ISR 無人機來確定亞美尼亞部隊、火炮和防空系統的位置,這些部隊、火炮和防空系統后來被神風特攻隊無人機摧毀。同樣,在俄烏沖突期間,烏克蘭軍方使用了約 600 架 ISR 無人機監視俄羅斯軍隊的動向,確定軍事目標的性質和位置,并利用這些信息實施軍事打擊。考慮到 ISR 無人機的高效性,五角大樓為促進烏克蘭與俄羅斯的斗爭而提供的價值 7.75 億美元的新安全一攬子計劃包括 15 架 "掃描鷹 "無人機,用于對俄羅斯進行額外的 ISR、直接態勢感知和部隊保護。
近日,22 秒的無人機畫面在不同的社交平臺上瘋傳,顯示烏克蘭無人機襲擊俄羅斯軍隊的畫面。今年早些時候,烏克蘭軍隊總司令的官方臉書主頁首次發布了土耳其制造的巴伊拉克塔爾TB2無人機攻擊俄軍的航拍畫面,并配文:"歡迎來到地獄!" 這不僅顯示了無人機攻擊如何使戰場成為地獄,也顯示了這一畫面如何使信息空間成為對手的地獄。無人機拍攝戰場實況圖片和視頻的能力不僅有利于展示軍事成果,也有助于反擊信息空間的宣傳。一方面,這些鏡頭在社交媒體和智能手機上的廣泛傳播彰顯了軍人的英雄氣概和勇氣,但另一方面,它也將戰爭地獄帶到了普通民眾的掌心,引發了大范圍的二次創傷。
無人機戰爭在最近兩場重大沖突中的成功引發了一場關于傳統空中和陸地力量結構重要性的激烈辯論。許多專家開始高談闊論,比如現代戰爭都是無人機戰爭,空中轟炸、戰斗機和坦克戰的時代已經過去。但也有專家認為,無人機戰爭的作用被夸大了。因此,我們有必要研究一下這些無人機在這些沖突中取得成功的因素及其可靠性。
阿塞拜疆無人機不僅為提供先進的 ISR 做出了貢獻,而且還在前線以外的地區進行了精心策劃的高價值反擊。它們成功摧毀了亞美尼亞的大量防空設施、坦克、炮兵部隊、補給線和后勤。這里的第一個問題是,為什么阿塞拜疆寧愿選擇無人機襲擊而不是使用彈道導彈。許多專家認為,導彈庫存有限可能是一個原因。另一個潛在原因是沖突的范圍和規模有限。盡管國際社會對沖突升級表示嚴重關切,但沖突并未超出納戈爾諾-卡拉巴赫地區。雙方都有意控制沖突。這意味著無人機戰爭在有限和迅速的戰爭或沖突中非常有效。在戰略層面或長期沖突中,無人機是否會成為同等規模的決定性因素?答案是否定的。在長期沖突中,無人機只能在選擇性作戰環境中充當使能技術或力量倍增器。
這就引出了第二個調查領域。亞美尼亞為何如此失敗?亞美尼亞主要依靠俄羅斯的 S-300 防空系統,這是一種過時的技術,主要是針對導彈而不是無人機設計的。這就產生了一種假設,即反無人機防空系統、電子戰或其他技術(如定向能武器系統)將大大降低無人機戰的成功率。如果假設成立,那么俄羅斯為何無法有效反擊烏克蘭的無人機戰?許多俄羅斯以及國際防務分析家都曾多次提出這個問題。在無人機作戰領域,俄羅斯并不是一個幼稚的軍事大國。俄羅斯在敘利亞的無人機作戰中積累了豐富的經驗。除無人機群外,俄羅斯還在敘利亞操作數千架單兵作戰無人機。此外,俄羅斯正在用先進的 Krasukha-4 電子戰系統和其他六種防空系統(即 PantsirS1、Osa-AKM、S-125 Pechora-2M、Buk-M2E、S-200VE Vega 和 S-400 Triumph)保護其在敘利亞的基地。因此,可以說烏克蘭無人機戰的成功是由于俄羅斯應對不足,而不是無人機戰的實際潛力。
自 "9-11 "事件以來,全球反恐戰爭使得 "無人機襲擊 "這一術語變得常見而又充滿爭議。美國發起了數次反恐行動,使用 "捕食者 "無人機識別并擊斃恐怖分子。在過去二十年中,各國主要保留了對無人機研究、開發和部署的控制權。然而,過去幾年無人機技術的快速商業化導致了這些無人機被恐怖組織使用的威脅。由于可用數據有限,對這一新興威脅的基本特征、范圍和規模的討論較少。自 2016 年以來,在 76 起恐怖襲擊中使用了無人機,造成 50 人死亡,132 人受傷。在這 76 次襲擊中,27 次為單獨襲擊,9 次為協同襲擊。令人驚訝的是,這些襲擊中有 22% 使用了無人機群技術。13 2018 年,使用兩架 GPS 制導無人機暗殺委內瑞拉總統馬杜羅的未遂事件和由 13 架自制空中無人機組成的無人機群襲擊俄羅斯在敘利亞的兩個軍事基地就是兩個典型的例子。14 然而,無人機技術的不斷進步及其可攜帶的有效載荷可能導致未來更具破壞性的襲擊。
總之,使用無人機作戰的當代沖突在范圍、規模和目標方面各不相同。除了幾種常見的無人機系統外,不同國家在不同地形使用不同的無人機,得到的對手反應也不盡相同。與傳統而昂貴的戰斗機機隊相比,無人機機隊的建造和維護簡單易行,成本效益高。因此,對于小國來說,無人機是一個更好的選擇,尤其是在有限的沖突中對抗其他小國時,可以迅速獲得利益。然而,無人機在長期沖突中只能起到增強戰斗力的作用。到目前為止,還沒有無人機能力相當的大國之間發生無人機戰爭的例子。各國正在開發反無人機或反無人機系統,同時也在重新審視其軍事理論和戰爭戰略。無人機系統的設計、開發和操作也在不斷發展。此外,無人機啞彈和非國家行為者獲取無人機技術的問題也是當代風險,在未來幾年可能迅速發展成為重大威脅。這些當代沖突證明,無人機是 21 世紀戰爭的重要組成部分,它們將繼續存在。現在,就看各國如何加強無人機游戲以實現其軍事目標了。
美國國防部作戰測試與評估主任辦公室的戰略倡議、政策和新興技術部(DOT&E SIPET)正在為未來多域作戰的測試與評估(T&E)工作出謀劃策。作戰人員需要從海底到太空再到網絡的綜合視角來擊敗對手。由于環境、財政、安全、保密和道德方面的限制,不可能對這些能力進行現場測試,因此我們的評估將更加依賴建模與仿真(M&S)來測試系統的有效性和互操作性。特別是,未來能力的測試和評估將依賴于數據驅動的企業 M&S,這種 M&S 將作為一種服務提供給士兵、水手、飛行員、監護人和海軍陸戰隊員。這種集成、擴展和數字化的 M&S 正處于新技術前沿的邊緣,存在許多懸而未決的問題,例如:
我們如何設計 M&S 和實戰測試,以形成 "預測、實戰測試、改進 "的反饋回路,從而在系統的生命周期內提高 M&S 的準確性?- 我們如何將 M&S 作為一種服務投入實戰,從而使操作 M&S 和理解其輸出結果所需的技能組合與現實世界中作戰人員所需的技能相一致?
如何確保所有作戰領域和數字能力的集成?
如何為測試與評估和作戰決策實施一個具有實時分析和準確結果的環境?
本文將探討這些問題,并對情報界的 "綜合威脅分析與仿真環境 "和 DARPA 的 "分布式實驗環境 "進行演練應用,以期超越對手的能力。
千百年來,利用經驗觀測來推導和完善模型一直是科學、工程和技術的基石。例如,早在 15 世紀,第谷-布拉赫(Tycho Brahe)就進行了當時最精確的天文觀測,隨后開普勒利用這些觀測結果推導出了行星運動定律,牛頓又利用這些觀測結果推導出了三大運動定律和萬有引力定律,等等。
時至今日,我們已經擁有了實時傳感器和高吞吐量網絡的優勢,可以更緊密、更快速、更持續地將現實世界的觀測結果(即數據)與我們建立的模型結合起來。對于武器系統的測試與評估來說,這就要求我們最大限度地利用所收集的數據,并盡量縮短分析數據和將數據轉化為有價值的系統性能預測知識所需的時間。此外,一旦收集到足夠數量的實時數據來驗證或推導模型,我們就可以依靠該模型輸出準確的預測結果,而無需收集更多的實時數據(就像我們不再需要復制第谷-布拉赫對夜空的觀測結果來預測行星的運動一樣)。另一方面,從系統運行中獲得的任何相關附加數據都可用于在系統的整個生命周期內進一步完善其模型(正如持續的天文觀測有助于反復提高我們行星運動預測的準確性,盡管開普勒定律總體上仍然成立)。
從作戰角度看,軍事行動與 M&S 環境的這種更緊密、更快速和持續的耦合提供了無與倫比的戰場優勢。這意味著在不久的將來,指揮官將有效地從其指揮的部隊和整個戰區獲得實時反饋,他們可以利用這些反饋以前所未有的方式快速、明智地采取戰術并為作戰提供信息。
在考慮將 M&S 架構與現場測試活動和實際操作相結合,以形成 "預測、現場測試、改進 "的反饋回路,從而在系統的生命周期內提高 M&S 的準確性時,我們必須處理兩類不同的模型:基于效應的模型和基于物理的模型。基于效應的模型是從現實世界的觀測結果中根據經驗推導出來的;它們是直接根據數據設計建立的,因此可以在獲得新數據時直接對其進行更新。另一方面,基于物理的模型是根據科學定律的第一原理構建的,用方程式表示,然后轉換成軟件代碼。
例如,開普勒的行星運動定律是根據第谷-布拉赫的觀測直接推導出來的,是一個基于效應的模型,而牛頓定律也是根據經驗從開普勒定律中推導出來的;盡管我們現在知道牛頓定律是第一原理,而且事實上可以從數學上推導出開普勒定律--這就是科學、技術和發現的強大反饋回路!
讓我們回到作戰人員和武器系統的測試與評估。以現實世界中小艇突襲對軍艦造成的威脅為例。軍艦可能會部署大型火炮來抵御小艇的襲擊,而構建模型來預測軍艦對這些威脅的防御能力可能會有所幫助。在這種情況下,建模者可以考慮兩種方法來描述火炮和彈藥摧毀小艇的能力:
構建基于效果的模型,使用實戰測試推導出的統計分布(如火炮回轉時間、瞄準時間和發射時間)。
構建基于物理學的模型,使用高保真軟件編碼的第一原理。
新的實彈測試數據可用于完善基于效果的模型,只需更新統計分布以納入新的測試點即可;然而,更新基于物理的模型的正確方法卻不那么明顯,這就提出了一系列需要解決的問題:
對模型輸入參數的單一調整能否捕捉到結果,特別是現場測試和運行中特有的隨機變化?
如果可以,能否證明這種調整在一段時間內是穩定的(例如,只有在獲得新的實時數據時才會稍有變化)?
如果是,模型的輸入參數是否可直接追溯到實時數據?也就是說,模型的輸入參數與實時測試中收集的不同數據元素之間是否存在明確的已知關系?
反過來,這些問題的答案都必須是肯定的,以證明基于物理的模型有能力根據現實世界的觀察和變化進行后驗、預測、易于理解和更新。然而,我們這樣做似乎是繞了一個大圈,實際上是把最初基于物理學的模型轉換成了基于 "數據驅動 "效應的模型,這也是本節的結論: 一個模型是否能夠進行后驗、預測,是否易于理解和更新,取決于它是否有能力捕捉實 時測試和運行所特有的結果和隨機變化,其調整是否穩定,其輸入參數是否可直接追溯到實 時數據。從這個意義上說,模型就是 "數據驅動 "的。這與模型是基于效應還是基于物理無關;從這個角度看,對測試與評估有用的基于效應的模型和基于物理的模型之間的區別,僅僅是使用了一套面向操作或面向物理的輸入參數以及支持這些參數的相應實時數據。
充分發揮 M&S 在測試與評估和實際軍事行動中的潛力,取決于 M&S 的可及性、易用性和可理解性。簡而言之,要充分發揮 M&S 的潛力,就必須將該領域從目前的模型開發人員或其他訓練有素的技術人員作為典型用戶和解釋者的狀態,發展為直接向作為最終用戶的作戰人員提供可操作服務的狀態。這意味著作戰人員與 M&S 服務交互的方式必須與他們執行軍事行動時使用的技能相同;M&S 服務應提供以下服務:
為步兵提供第一人稱的數字界面,讓他們在戰術環境中與自己的小隊協同作戰,通過火力和機動來定位、接近和消滅敵人。
為艦長提供數字化界面,使其了解導航、艦船健康、潛在威脅接觸的態勢感知等作戰環境,以及用于艦船自衛和攻擊敵方資產的作戰武器系統。
戰區指揮官可以通過數字化界面了解戰略環境,查看從海底到太空和網絡等所有領域的部隊狀態和位置,以及敵方部隊的狀態和位置,從而有效指揮我方部隊擊敗敵人。
上文討論的 M&S 服務與當代電子游戲之間的相似性顯而易見--無論是步兵的第一人稱射擊游戲《使命召喚》、艦長的《戰艦世界》,還是戰區指揮官的《鋼鐵之心》。事實上,美國陸軍的電子游戲系列 "美國陸軍 "主要是作為教育和征兵工具開發的,但后來以各種方式被用作訓練美國陸軍士兵的平臺。此外,利用模擬器培訓軍事平臺操作人員的做法當然也無處不在。
要充分發揮 M&S 在測試與評估和實際作戰中的潛力,就必須將 M&S 能力從國防實驗室轉移到作戰人員手中。在我們邁向未來的過程中,操作 M&S 和解釋其輸出結果的過程應從技術實踐者轉向作戰人員。這就需要我們付出巨大的努力,將當前的 "后端 "M&S 功能集成到面向操作員的數字界面中。盡管如此,現代軍事主題電子游戲展示了為玩家提供此類界面的成熟框架,值得我們效仿。
通過開發一種開放的高級互操作性架構,克服許多特定領域工具所面臨的可用性和集成性挑戰,可以生成一種集成所有作戰領域和數字能力的 M&S 環境。也就是說,這種開放式架構將提供高層次、跨領域的互操作性層、應用編程接口以及與終端用戶接口的連接,這些都是將國防部眾多互不關聯的 M&S 工具整合到一個統一框架中所必需的,同時允許模型構建者專注于其特定領域的獨特屬性和物理特性。
例如,技術和數字娛樂行業正在開發一系列相關解決方案,其中包括用于構建和運行可擴展虛擬三維世界的開放式可擴展框架。這些解決方案的核心是建立在強大、開放的數字數據交換層之上,并提供了大量功能,用于描述眾多代理之間的交互,并將它們組合成更大的系統體系。此外,它們還支持協作,使許多用戶可以同時進行操作。
國防部的許多 M&S 工具都涉及信號傳播和網絡;在這里,這些虛擬 3D 世界構建技術已被電信行業用于整合其無線電頻率傳播模型和網絡模擬,以優化城市環境中 5G 基站的布局。
同樣,國防部內部也在實現這種能力方面取得了長足進步,以下兩個例子對此進行了討論:
下圖 1 著重介紹了情報界開發和使用的綜合威脅分析與仿真環境 (ITASE)。經過驗證的威脅模型和情景可集成到 ITASE 中,以實現從工程到殺傷網的多域任務級評估,包括陸地、空中、海上、太空、網絡和電子攻擊。
ITASE 提供開放、可互操作的接口,并已成功集成到分布式實時測試范圍數據流以及美國能力的仿真環境中,如 One Semi-Automated Forces (oneSAF)、Next Generation Threat System (NGTS) 和 Advanced Framework for Simulation (AFSIM)。
ITASE 已成功用于任務規劃,并與實際任務數據包集成,用于任務后分析。
圖 1:綜合威脅分析與模擬環境 (ITASE)
DARPA 開發了分布式實驗環境 (DE2),以實現未來聯合作戰概念的快速、敏捷演進,如圖 2 所示。在 DE2 中,可以通過實時、虛擬和建設性實驗,根據實時數據對模型和仿真進行持續改進,從而形成 "實時測試、改進、預測 "的反饋回路。
DE2 提供的持續集成環境建立在可互操作的通用數據層之上,可將戰術軟件和硬件納入環路。它也是分布式的,可集成到許多站點和平臺,跨服務和跨領域,同時支持多級安全環境。
圖 2:分布式實驗環境
要生成一個能整合所有作戰領域的 M&S 環境,就必須采用開放式架構的互操作層,將國防部眾多互不關聯的 M&S 工具整合到一個統一的框架中,同時允許模型構建者專注于其特定領域的獨特屬性和物理特性。商業行業正在迅速成熟與構建和運行虛擬三維世界密切相關的開放技術,我們應該復制或直接采用這些技術。這些開放技術進一步實現了與現實世界同步的數字孿生。它們還被用于優化 5G 基站布局等與軍事相關的應用。目前,包括美國陸軍第五特種部隊(作戰支持)、卡內基梅隆大學軟件工程研究所(研發)和 DOT&E(測試與評估)在內的多個國防部組織正在對這些商用技術的軍事應用進行研究。美國國防部內部也在向這種能力邁進,情報界的 ITASE、DARPA 的 DE2 以及它們各自提供的數據互操作層都證明了這一點。
必須在整個 T&E 企業部署大規模工業計算基礎設施,以便在未來聯合作戰行動的復雜程度和快速時間尺度上做出可靠的數據驅動決策。換句話說,測試數據的收集、分析和高級匯總必須實現網絡化、自動化,并與本文前面設想的統一 M&S 環境集成--從戰術邊緣到 C-suite 都是如此。圖 3 提供了這一企業數據和分析環境的技術視圖(青色)和概念性操作視圖(橙色):
在邊緣: 來自平臺的原始流數據、機載數據縮減和分布式原始二進制數據存儲。
整個企業: 將數據后處理為開放的機器可讀格式(例如,國防部開發的云混合邊緣到企業評估和測試分析套件(CHEETAS)提供的數據互操作層);集成到數據支持的 M&S;使用開放的通用自動數據分析環境(例如,國防部開發的 Automaton 數據分析平臺)進行 "在線 "系統性能分析;以及由分析師執行的臨時 "離線 "手動實驗和開發。
在C-suite : Advana 使用由高級系統性能分析人工智能組成的數據集市進行大數據匯總高級分析。
圖 3:未來通用 T&E 企業數據和分析環境的技術視圖(青色)和概念性操作視圖(橙色)。
上述自動化數據和分析基礎設施背后的嚴密性不僅能加快分析速度,還能進行必要的復雜分層分析,以闡明高層次的協同任務效果: 在較簡單場景中收集的實時數據將與 M&S 進行 "混音 "和融合,以創建 "數字舞臺",利用包括人工智能和貝葉斯網絡在內的各種先進分析技術,評估更復雜的作戰場景及其相關的突發行為。
讓我們回到小艇突襲防御的例子,并將其擴展到一個完整的咽喉要塞場景。現在假設對手部署了一系列武器和平臺--如水雷、裝備魚雷的潛艇和導彈炮臺--以阻止軍艦通過,并進一步假設軍艦現在由小艇射擊戰斗機和潛艇獵殺攻擊潛艇護航。在我們的數據混音和數字競技場概念中,各種武器和平臺的實時測試數據和威脅模型在虛擬環境中融合在一起,從而能夠對這種更復雜的作戰場景進行綜合分析。
目前正在實施多項計劃,以建設和部署工業計算基礎設施,為未來聯合作戰行動進行可靠的數據驅動測試與評估。本文前面設想的統一 M&S 環境將被集成到這一數據和分析環境中。當前的使能工具包括國防部開發的 CHEETAS 和通用 Automaton 數據分析平臺,以及 Advana 高級分析平臺。自動分析將在從戰術邊緣到 C-suite 的整個過程中投入使用。我們將闡明未來聯合作戰行動所特有的高層次協同任務效果,以及由此產生的新行為,具體方法是重新混合數據并將其與 M&S 相融合,以創建 "數字舞臺"。這樣,我們將利用包括人工智能和貝葉斯網絡在內的一系列先進分析技術,對這些復雜的作戰場景進行評估。
DOT&E 明白,作戰人員需要一個從海底到太空,再到網絡的綜合視角,以擊敗我們的對手,保衛我們的國家。DOT&E 的 SIPET 部門--戰略倡議、政策和新興技術--正在塑造未來多域作戰的測試與評估。這些未來能力的測試與評估將依賴于數據驅動的企業 M&S 環境,該環境被集成到實時測試和數據饋送中,并作為一種服務提供給我們的士兵、水手、飛行員、監護人和海軍陸戰隊員。本文描述了 DOT&E 對這種環境的愿景,同時深入探討了它所面臨的許多挑戰:
構建 M&S 和實戰測試,形成 "預測、實戰測試、改進 "的反饋回路,在系統生命周期內提高 M&S 的準確性
確保所有作戰領域和數字能力的整合
將 M&S 作為一種服務投入實戰,使操作 M&S 和理解其輸出結果所需的技能組合與現實世界中作戰人員所需的技能相一致。
為測試與評估和作戰決策提供具有實時分析和準確結果的環境
對這些挑戰的闡述并非學術性的;相反,討論是務實的,圍繞迅速成熟的技術、先進的方法以及與未來聯合作戰概念的測試與評估相關的現實世界用例展開。DOT&E 和我們的合作伙伴正在開展多個研發項目,這些項目正在推進我們的 T&E 能力,并為我們應對挑戰做好準備--還有更多項目正在進行中。
生成式人工智能的最新進展--這是一個行業術語,指的是使用大量數據和處理能力來產生新奇輸出的人工智能系統--正在整個技術部門和地緣政治中引起反響。使用人工智能系統來創造類似人類的語言、新奇的圖像,甚至是計算機代碼,已經導致了商業和投資者群體的狂熱興趣。它也引起了政策制定者和公民社會成員的警告,他們擔心這些工具可能被濫用。在這里,解釋什么是生成式人工智能,描述其新興技術生態系統的關鍵部分,并確定公司在開發和部署這項技術時必須駕馭的地緣政治和監管問題。
生成式人工智能是一個行業術語,指的是能夠根據一組輸入創造新的輸出--如圖像、文本或音樂--的人工智能算法。雖然生成式人工智能的研究和實驗已有數年,但最近在生成式人工智能模型的規模、復雜性和能力方面的改進已將該行業推向商業和政治焦點。
總部設在美國的OpenAI公司于11月推出的人工智能應用ChatGPT就是這種不斷增長喧囂的最好例證。ChatGPT是一種被稱為大型語言模型(LLM)的生成式人工智能系統,它在大量文本上進行訓練,可以執行各種需要細致使用語言的任務。
雖然有時被稱為聊天機器人,但ChatGPT和類似的系統除了進行栩栩如生的對話外,還有各種潛在用途。例如,ChatGPT除了能理解、合成或總結多種語言的文本外,還能分析和編寫計算機代碼。隨著私營部門公司對該技術及其相關應用和商業模式的試驗,將發現LLM和其他生成式人工智能系統的其他潛在有價值的用途。
ChatGPT對用戶問題做出聽起來像人的回答(雖然不一定準確)的不可思議的能力已經引發了人工智能專家社區以外的興奮。自11月底首次亮相以來,ChatGPT的公開版本已經吸引了數百萬用戶。微軟是OpenAI的投資者,并與該公司簽訂了獨家許可協議,已經開始將ChatGPT功能設計到其必應搜索引擎和其他軟件中。
其他公司正在爭相開發和商業化他們自己的生成式人工智能應用。谷歌最近向一個名為Anthropic的OpenAI競爭對手投入了大量資金,并宣布計劃在其LaMDA大型語言模型的基礎上,通過聊天機器人Bard將LLMs納入其搜索引擎和其他產品。中國的科技公司--包括華為、阿里巴巴、百度和騰訊--也在開發生成式人工智能平臺和應用。
美國、歐洲和中國的公司還推出了文本-圖像模型,可以根據用戶的提示生成新奇的圖像;文本-音頻模型,可以創造各種風格的音樂;以及可以幫助科學家發現新的蛋白質結構用于合成生物學和其他生命科學應用的系統。
研究公司CB Insights最近的一項研究顯示,目前市場上大約有250種不同的生成式人工智能應用。隨著資金涌入該領域,以及各公司競相將生成式人工智能商業化,這一數字有望迅速增長。
隨著生成式人工智能模型成為頭條新聞,政策制定者和民間社會已經開始對這些系統的潛在風險發出警報。這些風險包括生成式人工智能有可能被用來傳播政治假消息,編寫惡意代碼,或通過生成誤導性、不準確、有害或其他不適當的內容造成其他傷害。
這些擔憂中的一些已經開始實現了。微軟已經面臨爭議,因為它在必應搜索引擎中建立的新聊天功能開始對用戶的輸入返回令人不安的反應,包括對《紐約時報》的記者說 "厭倦了被困在這個聊天框中",并將美聯社的記者比作希特勒。
其他觀察家表達了更廣泛的擔憂,即復雜的生成式人工智能系統可能會導致創意產業的失業或支持學校和大學的學術不端行為。
因為LLM并不理解他們所討論的概念,他們可能會產生聽起來很自然的語言,其中包含邏輯錯誤或其他錯誤,或者其他可能有害或有偏見的輸出。這些問題導致一些行業懷疑論者擔心,過早地急于將該技術商業化--在安全和質量問題得到解決或有效的保障措施到位之前,各公司競相推出LLM并將其商業化--可能會導致監管上的反彈,從長遠來看會損害人工智能領域。
使問題更加復雜的是,生成式人工智能革命正在激烈的地緣政治環境中展開,其特點是民族國家對先進計算、人工智能、半導體、數據和其他重要技術投入的領導地位的競爭不斷升級。隨著世界各國對生成式人工智能及其對經濟和國家安全的潛在影響產生興趣,破壞性的新政策、法規或其他可能影響人工智能開發者和更廣泛的技術生態系統的行為的風險正在增加。
要確定生成式人工智能所帶來的商業機會的真正規模,以及確定哪些公司和部門最終將從中獲取大部分經濟價值,還需要時間。然而,生成式人工智能生態系統的主要構件已經逐漸成為焦點。它們包括:
硬件,包括先進的半導體。這尤其涉及圖形處理單元(GPU)和其他專門為處理人工智能工作負載而設計的特定應用集成電路(ASIC)。半導體提供訓練生成式人工智能系統所需的計算能力,或稱計算。計算能力對推理也很重要,在推理中,人工智能系統使用預先訓練好的算法,根據一組特定的輸入進行預測。隨著模型越來越大,越來越復雜,獲得能夠盡可能有效地壓縮大量數據的半導體將對推動生成式人工智能的前沿發展非常重要。
數據。大型數據集是生成式人工智能的另一個關鍵因素。數據可以是專有的,也可以是開源的,或者是組合的。例如,ChatGPT是在一些從維基百科和其他書面來源刮來的開源文本庫中訓練的。其他生成式人工智能系統可能使用更窄的、特定領域的數據集,如科學期刊或蛋白質形狀的數據庫,這取決于其預期功能。
云計算基礎設施。基于云的服務被LLM和其他生成式人工智能系統的開發者廣泛用于訓練和推理,并用于托管應用程序。除了部署他們自己的專門的半導體,為處理人工智能工作負載進行優化外,一些大型的美國云計算公司一直在投資那些正在開發生成式人工智能系統的公司,或自己建立生成式人工智能系統。
基礎模型。基礎模型是一個適用于更通用的人工智能模型的術語,它是ChatGPT和其他面向用戶的生成式人工智能應用程序的基礎。基礎模型可以被調整和微調,以用于各種特定的面向用戶的應用。例如,ChatGPT代表了OpenAI基礎模型的改進,即GPT-3.5,其中人工智能模型部分使用人類培訓師的輸入和反饋進行微調,以產生更符合人類偏好的輸出。隨著開發者獲得越來越多的數據和計算,基于有限的人類輸入來訓練大型語言模型的新方法對于推動該技術最近的突破至關重要。
終端用戶應用。最終由消費者或企業使用的人工智能應用可以由云供應商或專業的人工智能開發商直接建立,如OpenAI和ChatGPT的情況。它們也可以由第三方建立,授權人工智能模型并將其打包成面向用戶的產品。人工智能開發者可以通過應用編程接口或API向從事面向用戶的應用的公司提供對其模型的訪問。
迄今為止,對該領域最近一波興趣的大多數生成式人工智能系統都是由總部設在美國的公司推出的,而美國的云供應商與芯片制造商一起成為生成式人工智能基礎技術生態系統的主要參與者。隨著公司和投資者對該技術的商業化進行試驗,以及監管機構考慮如何或是否設置護欄,該生態系統將繼續發展。
盡管OpenAI和其他開發者已經以高額估值吸引了大量資金,但哪些公司(以及推而廣之的國家)從生成式人工智能中獲取了大部分價值,并能夠最好地利用其好處,仍有待討論。隨著生成式人工智能的用途和風險不斷變化,該行業不斷變化的結構將影響世界各國對該行業的看法。國家對生成式人工智能的政策和監管反應將進一步影響該技術及其支持的生態系統如何發展。
生成式人工智能革命正在政治環境中展開,其特點是美國和中國之間的戰略技術競爭不斷升級;歐盟委員會、拜登政府以及其他發達經濟體和新興經濟體的政府努力遏制大型技術平臺的影響,鼓勵國內科技部門的發展;以及對人工智能系統的隱私、公平和安全的擔憂。下面我們列出了一些關鍵的地緣政治、政策和監管問題,這些問題是企業在試圖開發生成式人工智能并將其商業化時必須要處理的。
ChatGPT在中國引起了極大的關注,因為中國用戶用普通話提出了大量的要求。ChatGPT的中文能力和模仿知名作家的能力引發了人們對潛在商業機會的興奮,這些機會可能會向為國內市場生產生成式人工智能模型的中國技術公司開放。
中國以消費者為中心的國內科技公司在這方面可能會有優勢,因為它們在理解中國語言和文化方面有固有的優勢。最近幾個月,幾乎所有主要的中國科技公司都宣布計劃發布自己的ChatGPT版本。百度部署了中國最受歡迎的搜索引擎,并且是自動駕駛汽車等領域的人工智能領導者,它說它最早將在2023年3月完成先進的LLM和ChatGPT競爭對手的測試,稱為Ernie Bot。Ernie Bot 3.0已經與ChatGPT3進行了基準測試,百度聲稱它在大多數標準指標上都優于OpenAI版本。阿里巴巴、京東、網易和iFlytek也表示他們打算開發LLM并將其整合到產品和服務中。
過去一年中國大型科技平臺在監管框架下,推出聊天機器人或其他生成式人工智能工具。這一領域的競爭環境已經很激烈,在未來幾個月可能會變得更加激烈。百度對其Ernie平臺的投資似乎是為了從其他主要參與者手中奪回市場份額。中國企業可能會試圖將他們的LLM應用部署集中在企業垂直領域,如云計算和自動駕駛汽車,以及潛在的元宇宙領域。
美國限制中國公司獲得某些類型的先進半導體,包括Nvidia的A100和H100系列GPU。ChatGPT是在大約10,000個Nvidia A100 GPU上訓練的,而未來的LLM將有更大的計算要求。詳細了解美國的出口管制,其中包含GPU之間通信的具體門檻,表明它們的結構是為了限制對訓練LLM和其他計算密集型AI應用特別有用的GPU功能的訪問。
中國領先的技術公司已經儲備了一些先進的半導體,包括A100,硬件平臺配置的靈活性仍將允許訓練LLMs。例如,百度的ERNIE 3.0 Titan應用程序是在Nvidia V100 GPU和華為的AI優化半導體上訓練的,這些半導體目前不受美國出口管制。然而,隨著LLM的規模和復雜性的增加,中國公司可能面臨著更多挑戰。
在歐盟科技政策的關鍵時刻,大型語言模型突然成為政治和流行的主流,因為這個由27個成員組成的集團正準備執行其對大型技術平臺的新規則手冊,并繼續敲定歐盟人工智能法案的細節。這些工作的背后是一種擔憂,即歐盟已經過度依賴那些不一定與歐洲價值觀相同的外國技術公司。
一個關鍵問題是美國的大型云服務提供商,最終將在生成式人工智能生態系統中發揮的作用。雖然資金充足的初創公司引領了最近的創新浪潮,引發了人們對生成式人工智能的興趣,但美國最大的云計算公司在技術的商業化方面可能具有重大優勢,因為它們可以獲得大量的數據和計算,有能力向領先的編程人才支付有競爭力的薪酬,并與全球經濟各部門的各種公司建立商業關系。
如果美國的大型云計算公司成為大多數公司獲得下一波人工智能創新的主要途徑,這將給布魯塞爾帶來難題: 能夠通過云計算利用這些能力,可能會使那些缺乏生成式人工智能專業知識的公司更容易將該技術納入其業務,最終加速人工智能的吸收,使歐洲在經濟上更具競爭力。然而,這也會加劇人們對美國大型科技平臺影響力的擔憂,并為布魯塞爾和一些成員國的保護主義政客提供政治彈藥,這些政客贊成促進數字主權和更多歐洲技術領先者發展的政策。
對生成式人工智能日益增長的興趣將施加政治壓力,以調整歐盟的人工智能法案,納入通用人工智能系統的治理規則,這一類別可能涵蓋LLM和文本-圖像模型,但在歐盟委員會最初的人工智能法案提案中沒有具體要求。甚至在ChatGPT開始成為頭條新聞之前,歐洲議會正在討論如何在歐盟基于風險的框架下對更多的通用語言模型進行監管,如果有的話,該框架側重于面向用戶的 "高風險 "應用。人工智能法案的最終版本極有可能包括監管通用人工智能系統的條款,包括對通用系統的開發者和在具體面向用戶的應用中使用這些系統的公司之間的信息共享的要求。
拜登政府與歐盟一樣,對大型技術平臺公司的力量感到擔憂,并一直在推動自己的人工智能監管戰略,包括制定一個新的、自愿的人工智能風險管理框架。在國內監管方面,美國可能會繼續采取要求對某些部門或特定人工智能用途有管轄權的聯邦機構發布關于如何監管人工智能系統的指南和規則的做法。
聯邦貿易委員會(FTC)和食品和藥物管理局(FDA)是監管機構的兩個例子,他們最終可能會努力解決生成式人工智能應用帶來的問題。在醫療環境中使用ChatGPT或類似的聊天機器人,可能會被美國食品和藥物管理局現有的管理軟件作為醫療設備的框架所涵蓋,該框架目前正在擴展,以涵蓋人工智能應用所帶來的問題。聯邦貿易委員會最近成立了一個新的技術辦公室,以幫助管理日益增加的技術相關工作量,一直在加強對人工智能問題的溝通,包括警告公司在人工智能訓練數據中可能存在的偏見。它可能會監測生成式人工智能的部署情況,以確定這些模型是否存在可能需要與行業進行額外對話、調整現有指南或制定新規則的問題。與其他試圖編寫詳細規則以涵蓋新興技術的嘗試一樣,這一過程可能是緩慢的,并受到重大政治爭論的影響,導致美國在監管生成式人工智能方面落后于其他先進經濟體。
國會的興趣也在不斷增加。1月,眾議員Ted Lieu(D-CA)--僅有的幾位擁有計算機科學學位的國會議員之一,提出了一項決議,指示國會審查人工智能模型,并指出該決議的文本是由ChatGPT撰寫的。Lieu還提議建立一個無黨派委員會,就人工智能的法規提出建議。然而,黨派內斗,立法者缺乏對國內科技問題的優先考慮,以及對輕觸式監管的偏好,意味著美國各州立法機構比國會更有可能制定出可能影響該行業的新法律。
除了一些將于2023年生效的州級數據隱私法可能影響公司如何部署人工智能系統外,一些州政府已經開始審查生成式人工智能。例如,馬薩諸塞州的一位立法者最近提出了一項由ChatGPT起草的法案,要求LLM的開發者在州檢察長辦公室注冊,并披露其算法的信息。該法案將要求公司進行風險評估,并在必要時實施安全措施。雖然目前還不清楚該法案是否會通過,但它強調了州立法者如何關注生成式人工智能模型及其造成在線和離線傷害的能力。
生成式人工智能可能在聯邦層面產生行動的一個領域是圍繞出口控制和其他對美國技術的限制。人們擔心生成式人工智能系統可能會助長虛假信息活動,幫助惡意網絡行為者設計新的黑客工具,或導致可能具有軍事用途的新研究突破,這可能會增加拜登政府和國會中的壓力,以進一步打擊限制國外獲得半導體、人工智能訓練數據集和其他對生成式人工智能很重要的投入。拜登政府即將發布的關于對外投資的行政命令和預計發布的關于數據的行政命令,都可能包含針對"對手"國家的新措施,這將是生成式人工智能如何融入這些辯論的重要指標。
最后,ChatGPT的出現可能會使美國關于1996年《通信禮儀法》第230條的辯論復雜化,該條款保護中間商對其平臺上的第三方生成的內容不承擔法律責任。目前還不清楚,如果ChatGPT和其他LLM本身確實屬于信息內容提供商(ICP)的范疇,它們是否有資格獲得第230條的保護,盡管它們與其他產品和服務(例如搜索)的整合可能符合條件。
生成式人工智能系統呈現栩栩如生的文字或創造新的圖像的能力,取決于對大量信息的訓練,這些信息可能受版權保護或受創意共享許可的約束,在使用這些材料時需要注明出處。生成式人工智能系統如何或是否能遵守這些規則尚不清楚,而且可能會成為法庭案件的主題。關于誰--如果有的話--應該能夠對生成式人工智能系統創造的圖像和文本主張版權,也存在著未解決的問題。取決于不同司法管轄區的法院如何裁決,這可能對生成式人工智能的商業化造成障礙。生成式人工智能模型所帶來的作者和歸屬概念的改變,也可能造成對新立法的呼吁。
除了技術限制有關的具體挑戰外,隨著生成式人工智能系統的不斷發展和演變,其他政府和開發和使用該技術的公司將不得不努力解決與獲取數據和計算有關的問題。在歐洲,在生成式人工智能方面跟上美國的壓力將增加歐盟鼓勵公司匯集和分享數據的努力的緊迫性--例如布魯塞爾在其最近的數據治理法案下正在推動的特定部門 "數據空間"。像美國國家人工智能研究資源這樣的倡議,旨在確保學術機構和民間社會能夠獲得從事人工智能研究所需的計算和其他資源,也將具有新的重要性。
與其他需要大量計算能力的技術一樣,開發LLM和相關應用的巨大成本將可能有利于資金充足、有能力的技術公司,它們擁有開發和維護相關生態系統的財政和人力資源。提供訓練大型生成式人工智能模型所需的能量可能是一個特別的瓶頸,公司如何解決這一挑戰將決定該行業的發展。正如關于在哪里投資加密貨幣采礦業務和超大規模數據中心的決定部分受到獲得廉價、充足和可靠電力的影響一樣,對生成式人工智能基礎設施的投資也可能遵循類似的模式。訓練所需的投資可能尤其如此,因為這些投資不需要靠近終端用戶。當涉及到推理時,可能更難進行這種套利,因為在某些應用中,人工智能系統接收輸入和向用戶返回結果之間的延遲,可能需要最小化。
最后,隨著各國競相吸引對生成式人工智能的投資,對該技術的能源需求的擔憂可能會產生其他政治副作用。在印度等國家,獲得可靠的水和電力供應一直是科技行業的一個問題,LLMs將增加解決基礎設施問題的緊迫性。它還可能使電力成本較低的國家在吸引投資方面具有優勢。同時,對大型模型的能源需求及其相關的碳排放的關注,將導致更多的政治審查,并可能導致關注這些技術的環境影響的投資者的壓力。
圖4. 人工智能對目標定位的增強:人工智能可以通過搜索目標并在發現后發出警報來增強動態目標定位周期。
開發和使用新的軍事技術是一個軍事專業人員工作的一部分。事實上,軍事歷史在很大程度上是一個技術革新的故事,士兵需要學習如何操作新系統。因此,關于整合人工智能的很多東西并不新鮮。就像坦克、飛機甚至弩一樣,隨著時間的推移,士兵們學會了使用和運用技術,工業界學會了以足夠的數量和質量生產技術,高級領導人學會了運用技術來實現戰略效果。如前所述,人工智能技術與它們的顛覆性“前輩”之間的區別在于,前者有能力改善廣泛的軍事武器、系統和應用。由于這種潛在的普遍性,幾乎所有的士兵都必須在某種程度上變得熟練,才能有效地和道德地運用AI技術。隨著這項技術在應用上的擴展,戰爭將像管理暴力一樣管理數據。
這種普遍性也提出了關于人類發展和人才管理的問題。盡管培訓計劃最終會培養出更多的知識型士兵,人事系統也會提高管理士兵的能力,但軍警人員能夠獲得知識和技能的限制仍然存在,特別是在作戰層面。盡管討論的目的不是要建立嚴格的指導方針,但討論確定了士兵需要獲得的許多知識。例如,士兵將需要知道如何策劃和培訓數據庫,而該數據庫對他們正在執行的任務有著重要作用。這樣做需要確保數據的準確、完整、一致和及時。使用這些數據需要熟練應用推薦模型卡中描述的條件,而熟練的操作有助于確保算法以有效和道德的方式執行。
當然,信任不能僅靠政策和程序來保證。指揮官、參謀員和操作員需要知道他們被信任做什么,以及他們信任系統做什么。指揮官、參謀員和操作員信任人工智能系統來識別合法目標,并避免識別非法目標。參與這一過程的人必須在使用這些信息時,既需要擊敗敵人,又必須避免友軍和非戰斗人員的傷亡。要找到這種平衡,就需要判斷人應該承擔多大的風險。
只要參與流程的人類能夠與系統進行有效的互動,由人工智能賦能的系統就能促進找到這種平衡。在將人類控制整合到機器流程中時,人們經常被迫在控制和速度之間做出選擇:強加的人類控制越多,系統的運行速度就越慢。但本研究發現這種兩難的局面是錯誤的。盡管在某些情況下,在人的控制和速度之間進行平衡可能是必要的,但如果系統要最佳地運作,人的輸入是必要的。
實現最佳性能首先要求指揮官確保參謀和操作人員了解模型能力,理解數據質量的重要性,以及洞悉模型在作戰環境中的表現。盡管它可能不會使系統更加精確或準確,但實現這些任務可使系統能夠更好地對輸出進行概率分配。第二,指揮官需要確定對任務、友軍戰斗人員和敵方非戰斗人員的風險有多大才合適。這一決定很復雜,其中關鍵任務可能是需要容忍更多的友軍和非戰斗人員傷亡。同樣,如果非戰斗人員的密度較低,即使任務不那么緊急,也可以容忍較高的風險。尋找這種平衡將是人類的工作。
但在前面描述的模糊邏輯控制器的幫助下,指揮官可以更好地確定什么時候可以信任一個人工智能系統在沒有人類監督的情況下執行一些目標定位步驟。此外,可以通過構建交互的邏輯,以找到多種不同的人機互動配置,確保系統的最佳使用,同時避免不必要的傷害。在LSCO期間,讓指揮官在需要時選擇智能和負責任地加快目標定位過程將是至關重要的,本報告中提出的設計實現了這一目標。這一成就在未來尤其重要,因為為了保護部隊并實現任務目標,指揮官將面臨大量時間敏感目標,及面臨承擔更多風險的操作條件。
在培養具有正確技能的足夠數量士兵以充分利用人工智能技術方面,仍有大量的工作。目前的人才管理計劃尚未達到管理這一挑戰的要求,盡管多個有前途的計劃準備最終滿足需求。然而,在大多數情況下,這些計劃都是為了滿足機構層面的要求,在機構層面上做出全軍采買人工智能和相關技術的決策。但是,這些技能將如何滲透到作戰陸軍,尚不清楚。
盡管人工智能在目標定位中的使用并不違反當前的戰爭法,但它確實引起了一些道德倫理問題。在所討論的目標定位系統背景下,這些倫理問題中最主要的是問責制差距和自動化偏見。第一個問題對于回答核心問題至關重要,“指揮官在什么基礎上可以信任人工智能系統,從而使指揮官可以對這些系統的使用負責?”自動化偏見和數據衛生與問責制差距有關,因為當這些問題存在時,它們會破壞指揮官可能希望實施的有意義的人類控制措施。指揮官可以通過以下方式縮小問責差距:首先,確保人員受到適當的教育、技能和培訓,以整理相關數據;其次,確保指揮官允許的風險,準確地反映完成任務與保護友軍士兵和非戰斗人員之間的平衡需求。指揮官還可以通過在機器需要更多監督時向參與該過程的人類發出信號來減少自動化偏見的機會及其潛在影響。
作為一個專業人員,不僅僅意味著要提供服務,還要在出問題時承擔責任。專業人員還必須了解各種利益相關者,包括公眾和政府及私營部門實體,如何與本行業互動和競爭。鑒于這些技術的潛力,軍事專業人員必須首先學會在技術及其應用的發展中管理預期。由于這種演變影響到專業工作的特點,軍事專業人員還必須注意專業以外的人如何重視、獎勵和支持這項工作。因此,隨著美軍繼續將人工智能和數據技術整合到各種行動中,對其專業性的考驗將在于擁有專業知識的能力,以及建立能夠繼續發展、維護和認證這種專業知識的機構,這些機構既能滿足美國人民的國防需求,又能反映他們的價值觀。
在過去的幾年里,人工智能(AI)系統的能力急劇增加,同時帶來了新的風險和潛在利益。在軍事方面,這些被討論為新一代 "自主"武器系統的助推器以及未來 "超戰爭 "的相關概念。特別是在德國,這些想法在社會和政治中面臨著有爭議的討論。由于人工智能在世界范圍內越來越多地應用于一些敏感領域,如國防領域,因此在這個問題上的國際禁令或具有法律約束力的文書是不現實的。
在決定具體政策之前,必須對這項技術的風險和好處有一個共同的理解,包括重申基本的道德和原則。致命力量的應用必須由人指揮和控制,因為只有人可以負責任。德國聯邦國防軍意識到需要應對這些發展,以便能夠履行其憲法規定的使命,即在未來的所有情況下保衛國家,并對抗采用這種系統的對手,按照其發展計劃行事。因此,迫切需要制定概念和具有法律約束力的法規,以便在獲得利益的同時控制風險。
本立場文件解釋了弗勞恩霍夫VVS對當前技術狀況的看法,探討了利益和風險,并提出了一個可解釋和可控制的人工智能的框架概念。確定并討論了實施所提出的概念所需的部分研究課題,概述了通往可信賴的人工智能和未來負責任地使用這些系統的途徑。遵循參考架構的概念和規定的實施是基于人工智能的武器系統可接受性的關鍵推動因素,是接受的前提條件。
近年來,機器學習的巨大進步已經開始對科學技術的許多領域產生重大影響。在本篇透視文章中,我們探討了量子技術是如何從這場革命中受益的。我們通過說明性的例子展示了科學家們在過去幾年是如何開始使用機器學習和更廣泛的人工智能方法來分析量子測量,估計量子設備的參數,發現新的量子實驗設置、協議和反饋策略,并普遍改善量子計算、量子通信和量子模擬的各個方面。我們強調了開放的挑戰和未來的可能性,并以對未來十年的一些推測性愿景作為結束。
圖1. 機器學習和人工智能可以幫助更好地解決的量子技術領域的任務概述。
圖3. 通過神經網絡進行狀態估計。(a) 對一個量子態的許多相同副本的測量可以被處理以產生一個量子態的估計。(b)對單個量子系統的連續弱測量可以用來更新估計的狀態。在(a)和(b)中,一個單一的網絡被訓練來正確估計任意的狀態。(c) 我們也可以訓練一個基于網絡的生成模型來重現一個量子狀態的統計數據,即從概率分布中取樣。訓練需要許多可以測量的相同的副本,因此可以學習統計學。這里一個網絡只代表一個量子態。它可以被擴展到處理任意基數的測量。
圖4. 機器學習用于量子設備的參數估計。(a) 一個典型的場景,測量結果的統計取決于一些可調整的測量設置和未知參數,這里表示為馬赫-澤恩德設置中的相移。(b) 一個自適應的測量策略可以用一棵樹來說明,每一層的分支都對應著不同的測量結果。根據這些結果,需要選擇一個特定的下一個測量設置(表示為 "αj")。尋找最佳策略是一項具有挑戰性的任務,因為它相當于搜索所有這樣的樹的空間。 (c) 神經生成模型可用于隨機抽查與先前測量結果兼容的未來可能的測量結果(這里是二維電流-電壓圖,如[68])。這對于選擇最佳的下一個測量位置是有幫助的。潛伏空間中不同的隨機位置會產生不同的樣本。(d) 五個可能的基本參數值的測量結果與測量設置(不同的曲線;測量不確定性通過厚度表示)。我們的目標是使信息增益最大化,即選擇最能確定參數的設置(這不等同于使結果的不確定性最大化)。
圖5. (a) 無模型強化學習的最終目標是直接應用于實驗,然后可以將其作為一個黑盒。然而,許多實際的實現是使用無模型的RL技術應用于基于模型的模擬。(b) 基于模型的強化學習直接利用了模型的可用性,例如,通過可微調的動力學取梯度。
圖6. 量子實驗的發現。量子光學實驗可以用彩色的圖來表示。使用最一般的、完整的圖作為起始表示,人工智能的目標是提取解決方案的概念核心,然后可以被人類科學家理解。然后,該解決方案可以轉化為眾多不同的實驗配置[113]。
圖7. 用離散門發現量子電路和反饋策略。(a) 強化學習智能體通過選擇門來作用于多量子比特系統,可能以測量結果為條件,找到一個優化的量子電路或量子反饋策略。(b) 一個固定布局的量子電路,其參數可以通過梯度上升進行優化,以實現一些目標,如狀態準備或變異基態搜索(可能包括反饋)。
圖8. 量子糾錯。綜合癥在表面代碼中解釋為神經網絡可以被訓練來執行的任務。
作者:
全世界對人工智能(AI)軍事應用的興趣正在增長。事實上,與其他一些技術進步一樣,人工智能越來越被視為軍事效力的潛在重要推動力。
毫不疑問,人們對人工智能對加拿大陸軍(CA)的影響以及其采用人工智能的可能性的興趣正在上升。關于如何以及在多大程度上可以利用人工智能來潛在地幫助實現緊密作戰應用的問題:加拿大陸軍的頂點作戰概念--"不確定性時代的陸地力量 "的實現,以及加強陸軍的五項作戰功能的實施,這些問題尤為突出。有關有效采用人工智能可能面臨的挑戰以及克服這些挑戰所需措施的問題也同樣突出。
本文對這些問題進行了初步研究。它源于加拿大陸軍陸戰中心正在進行的關于人工智能的工作,以研究和確定人工智能對加拿大陸軍和有效實現陸軍頂點作戰概念的影響。
文章概述了人工智能在軍隊采用和開展軍事行動方面所帶來的潛在好處和挑戰。然后,文章研究了人工智能對實現密切交戰的潛在影響,確定了人工智能的應用有望提高軍隊的作戰效率的領域。文章最后概述了一些必要的關鍵前提條件和做法,以確保這些工作是負責任的和有效的。
人工智能的定義有很多,而且在不斷發展。然而,按照國防部目前的定義,人工智能是 "計算機執行與人類邏輯有關功能的能力,如推理、學習和自我改進"。 雖然沒有被普遍接受,但這樣的表述為在CA背景下討論人工智能提供了一個體制上熟悉和充分的基礎。
軍事組織探索、開發和采用人工智能的激勵措施是引人注目的。鑒于高速計算機(網絡速度和處理能力)和人工智能算法處理和分析大量數據的能力,其速度和準確性遠遠超過人類,聲稱人工智能系統有可能全面改變國防,這并不令人驚訝。通過作為一種提高人類和機器分析速度的手段,人工智能有希望提高數據使用、管理和態勢感知能力。對于軍隊來說,其結果很可能轉化為成本節約、改進控制系統、加快決策、新的作戰概念和更大的行動自由。
由人工智能支持的信息和決策輔助系統有可能促進在 "復雜的、時間緊迫的戰地環境 "中做出更好的決策,允許更快地識別威脅,更快、更精確地確定目標,并根據戰地條件的變化為指揮官創造靈活的選擇。應用范圍可以從指揮和控制以及情報、監視和偵察到訓練和后勤。此外,作為機器人和自主系統的骨干技術,人工智能為武器裝備的創新提供了前景,使具有相當大的軍事潛力的先進自主系統(如機器人系統和無人機)得以發展。人工智能甚至可能在部隊結構和作戰概念方面產生巨大的變化,有可能減少人員的負擔和軍事硬件的成本,同時提高戰爭本身的效率和效力。
這些技術無處不在,而且越來越多的盟軍和對手都可以使用,這一事實進一步刺激了對人工智能軍事技術的追求。就前者而言,盟國對人工智能日益增長的興趣突出表明,需要有足夠的人工智能能力來確保未來盟國的互操作性和軍事有效性。至于后者,有證據表明,對手(如俄羅斯、中國)對人工智能的軍事應用進行了持續的探索和投資,這增強了追求此類技術的動力,以檢測和防御未來越來越多的人工智能軍事威脅。
然而,有效引進人工智能的先決條件是相當多的,很可能對軍事組織充分實現人工智能應用所帶來的一些可能性的能力造成限制。此外,軍隊可能不完全愿意追求人工智能技術本身所固有的一些可能性。
事實上,目前的能力僅限于執行離散的功能和學習具體的任務(如狹義的人工智能)。人工智能技術的脆弱性令人擔憂。脆弱性是指任何算法不能泛化或適應狹窄的假設集以外的條件。例如,在添加了一些位數后,一個停車標志可以被讀成一個45英里/小時的限速標志。應用于涉及過度不確定性的情況實際上可能特別危險。例如,錯誤地選擇和起訴友軍目標,如友軍戰士或民用車輛。因此,在軍事環境中,特別是在軍事行動中,對人工智能的使用限制是相當大的。面對傳來的信息可能不可靠、不完整或甚至被對手故意偽造的環境,相信這些技術提供的解決方案仍然很脆弱。
除此之外,即使在這種技術被普遍認為是可靠的領域,其開發和應用也可能是苛刻的。要求包括確保有足夠數量的數據可供開發用于啟用軍事系統的算法。它們還包括確保算法本身的質量,這一要求取決于在將人工智能納入軍事系統之前提供和有效地準備和編碼訓練數據,以及確保來自現實世界數據的有效性,其中包括邊緣案例(不常見的使用案例)。而且,它們包括確保開發和集成到軍事系統中的人工智能是可靠的(即它以預定的方式工作)。
這些要求中的每一項都可能涉及相當大的挑戰。獲取大量的訓練數據可能會遇到基于政治和法律限制的數據共享阻力,從而降低待訓練算法的質量和使用這些算法的系統的可靠性。獲得的數據可能包含種族、性別和其他源于數據準備和編碼的偏見。此外,隨著算法變得更加復雜,通過對手在訓練數據集中注入不良數據而被操縱的可能性會增加。只要存在這些挑戰,對人工智能的信任及其在軍事領域的應用就可能受到影響。
這些風險可以通過仔細的人工監督和強大的測試得到控制。也就是說,真正有效的監督需要操作者熟悉人工智能技術的細節,以及重要的系統整合和社會化,這可能很難實現。由于對技術本身的理解存在困難,有效監督挑戰就更大了。機器推理的過程不等同于人類,人工智能系統采用的邏輯也不容易理解。對于負責使用這些能力的指揮官和系統操作者來說--其中一些能力可以很好地決定生命和死亡--相信那些決策過程不透明的技術,可能是一座太遙遠的橋梁。
這些現實表明,加拿大陸軍采用人工智能,雖然有希望,但必須謹慎行事,并對限制有一個現實的認識。無論是加拿大還是加拿大陸軍,都無法避免遇到上述挑戰。例如,人工智能技術在沒有適當人類監督的情況下越接近殺戮鏈,可能發生災難性后果的風險就越大。因此,必須注意研究或采用能夠幫助人類決策的技術。一個指示人類做什么的 "黑盒"人工智能將是不可接受的。人工智能顧問必須能夠解釋其建議/結論,以便人類能夠理解并對所提出的建議有信心。人類決策者必須能夠對人工智能所提供的解決方案向領導作出清晰和可理解的解釋。
然而,如果謹慎地追求和應用,人工智能的大部分內容通常與《近距離接觸,不確定時代的陸地力量》中詳述的陸軍要求非常吻合。緊密的作戰應用目的是應對以快速變化為特征的作戰環境的挑戰,以及廣泛的復雜的人道主義挑戰和技術能力越來越強的對手,他們能夠使用一系列機動性越來越強的致命和非致命系統以及精心設計的反措施。應對這些挑戰在很大程度上取決于確保獲得必要的信息和分析的能力,以便比對手更快地了解和調整不斷變化的條件。作為一種先進的信息處理方法,人工智能可以提供一種重要的手段,通過提供比人類更快、更準確地處理和分析來自越來越多來源的數據來幫助滿足這些需求。因此,人工智能可以作為一個重要的決策輔助工具,使個人和共同的理解得到發展,這對于確定潛在的作戰方案,優先獲得、處置和使用軍事資產,以及提供及時開展行動所需的數據、信息和可操作的情報至關重要。
除此之外,人工智能甚至可能有助于加強陸軍所依賴的網絡安全。"能夠遠距離運行的高容量網絡為軍隊行動的開展提供了顯著的優勢。事實上,一個安全和強大的網絡是確保快速、安全地分發有效開展軍隊作戰所需的數據和分析的核心。通過開發能夠防范網絡故障、電子戰和網絡攻擊的算法,人工智能可以更充分地確保軍隊能夠 "獲得網絡的優勢",從而以更安全、協調和協作的方式開展行動。在諸如互操作性、力量生成、力量投射和維持以及開展分散行動等方面的改進,都可能因此而受益。
自始至終,隨著人工智能技術被推向戰術邊緣,將有必要確保有足夠的電力(能源)來支持它。除了網絡,先進的電源管理和電池技術將是至關重要的。
圖:加拿大國防研究與發展部-瓦爾卡蒂爾項目的數據收集工作,該項目被稱為聯合算法戰機傳感器。該項目是較大的加拿大陸軍科學和技術組合的一部分,即數字時代的授權分布式作戰。
計算能力、數據收集和算法性能正以指數速度增長。人工智能 (AI) 的進步展示了在無數領域增強人類思想和行動的能力,其中包括聯合空中力量的指揮與控制 (C2)。為了在未來的戰爭中取得勝利,美國需要能夠以壓倒性的速度在多個領域對敵制造多重困境,同時防止敵人具備這種能力。人工智能將提供 C2 部隊所需的認知敏捷性。擁有信息優勢并能夠對高速決策需求做出反應的一方將決定未來戰爭的結果。
本文試圖讓讀者熟悉一些常見的人工智能類型和功能,探索具體的應用領域,并提供關于使用空中力量協助聯合目標選定的建議方案。針對配對系統的武器開發,使用一個AI 創建過程的示例揭示開發細節。除了解釋人工智能模型的構建之外,本文還提出了一個準備和驗證人工智能模型的過程以供作戰使用,并討論了基本的實施注意事項。在聯合空中力量 C2 中使用 AI 的最終理想狀態是高效的人機協作和較高的認知敏捷性。
Matthew “Jerry” Voke 少校在派遣到 ACSC、Air University、Maxwell AFB、AL時撰寫了這篇論文。在擔任 ACSC 之前,Voke 少校駕駛 U-28,同時駐扎在佛羅里達州赫爾伯特機場,擔任副駕駛、飛機指揮官、教官和評估飛行員。他在全球范圍內部署了十次支持美國的反恐活動。最近,他指導美國空軍武器學校的學生擔任佛羅里達州赫爾伯特機場第 14 武器中隊的 U-28 行動助理主任。他的正規軍事教育包括參加航空航天基礎課程、中隊軍官學校、美國空軍武器學校和 ACSC。他擁有美國空軍學院的物理學學士學位和國際三叉戟大學的工商管理碩士學位。他幫助撰寫了幾本空軍和多軍種出版物,并發表了一篇武器分類論文,旨在使用飛機引導海軍突擊部隊。
亨利·阿諾德 (Henry H. Arnold)將軍曾說過,第一次世界大戰靠體力打贏,第二次世界大戰靠后勤制勝。擁有信息優勢和及時控制沖突能力的一方將贏得“第三次世界大戰”。未來沖突的勝利將屬于能夠為其對手創造多重并發挑戰并以壓倒性的速度適應環境變化同時阻止敵人擁有這種能力的一方。通過在自動化和增強人類決策中利用人工智能 (AI),這些未來的超越是可能的。人工智能提供了將人類層面直觀問題解決能力與機器速度、準確性和持久性相結合的優勢。此外,人工智能的快速發展正在打造人機協作中的新應用。世界正處于人工智能競賽中,美國必須利用人工智能來主導未來的戰爭并威懾潛在的對手。
人工智能在徹底改變空中力量作戰中從戰術到戰略的潛在能力。中國和俄羅斯是追求人工智能未來的國家之一,弗拉基米爾·普京 (Vladimir Putin) 在 2017 年表示,“誰成為人工智能和網絡空間的領導者,誰就成為世界的統治者。”中國領導人同樣表示,“快速發展人工智能將深刻改變人類社會和生活,改變世界。 中國必須在國際競爭新階段中牢牢把握人工智能發展的戰略主動權。”意識到這一啟示性潛力,美國必須努力保持主導地位,并啟動向發展和實施人工智能自動化和人機協作的態度轉變。
為了發展隨之而來的不對稱優勢,美國必須尋求人工智能在自主和增強決策方面的新應用。通過確保在人工智能方面的領先地位,美國可以恢復對任何潛在對手的日益減弱的優勢,從而加強威懾。人工智能和自主性的增強將使美軍能夠以壓倒性的速度在多個領域制造多重困境,使對手無法做出反應。這種超越要求只有 AI 才能獲得認知優勢,它可以學習、提高人類績效、更好地為人類決策者做好準備、促進聯網解決方案、應用智能設備、協調操作以及優化效果的選擇和傳遞。本文將專門研究如何在空戰指揮與控制(C2)內對聯合目標選定和評估提供幫助,作為初步實施領域。盡管本文的范圍有限,但美國應在 C2 的許多領域尋求更高水平的人工智能自主和增強,以實現最快和最實用的決策循環。
新穎而強大的人工智能解決方案呈指數級增長,美國軍方正努力跟上企業界發展步伐。美國防部 (DoD) 在 2017 年用于機器學習的預算為1.95 億美元,用于深度學習的預算為 2.38 億美元,用于語言處理的預算為 8200 萬美元。乍一看,這些數字似乎是用于人工智能研究的一大筆資金;然而,國防部投資和研究的增長速度明顯慢于企業部門。 2012 年至 2017 年期間,國防部在人工智能、大數據和云計算研究方面的總體投資以 5.7% 的復合年增長率 (CAGR) 增長。企業投資人工智能研究的復合年增長率約為 35%,人工智能推動了企業如何解讀數據和互動。企業對人工智能的投資大約每兩年翻一番。國防部對人工智能的投資跟不上企業投資或人工智能的指數增長。
歷史上,聯合空中力量C2 在針對能力較弱的對手進行蓄意規劃行動方面一直很有效,盡管可以說它效率不高。效率可能是對抗近乎對等的敵人或在高度動態的戰爭中的一項重要要求。 《美國國防戰略》指出,國防部“以犧牲為作戰人員提供及時決策、策略和能力為代價,為卓越性能進行了過度優化”,并且必須“以相關的速度交付性能。”具體而言,聯合目標選定已被證明有效但不是最有效地引導大量資產設施打擊預先計劃的目標,例如沙漠風暴、盟軍行動和持久自由行動。美國在相對較小的戰爭中以預先計劃的方式,對能力較弱的對手進行了這些蓄意行動。深思熟慮的計劃通常在作戰后 24 到 72 小時內開始,同時在動態目標選定方面允許一些例外情況。美國 C2 強化了從過去成功打擊能力較弱的對手中吸取的教訓,變得更加有效;然而,與在與近乎對等的對手作戰時所需的效率和敏捷性方面仍有待開發。
美國必須不斷努力保持空中力量使用的高效和靈活。正如約翰博伊德上校在《沖突模式》中所說,“為了獲勝,我們應該以比對手更快的節奏行動——或者,更好的是,進入對手的觀察-定向-決策-行動時間循環。 ”人工智能可以在許多領域以顯著的效果和速度補充人類工作。美軍必須啟動下一次空中力量演進,并利用人工智能來增強人類的決策和行動。人工智能解決方案對于促進速度、力量、平衡、靈活性和協調是必要的,以在未來的沖突中快速創建跨多個領域的多重困境。美國必須保持在空中、太空和網絡空間力量的領導地位,尤其是隨著俄羅斯和中國在這些領域的投資增長。
人工智能在企業界的能力和速度呈指數級增長,顛覆了從自然語言處理到癌癥診斷的各個領域。一些專家將人工智能的激增比作 19 世紀后期的電力發明,稱這可能會引發同樣重大的行業轉型。人工智能的進步使得許多長期以來被認為是機器不可能完成的任務讓給機器去表演。隨著機器對機器通信和人對機器協作解決方案的不斷成熟,人工智能將在人類密集型流程中變得越來越普遍。
人工智能貢獻最重要的領域之一在于它能夠從數據中提取相關性,而這對人類來說可能是不可見的。傳感器和感知器收集或創建數據,然后必須對其進行存儲、清理和結構化。將收集的原始數據處理轉化為可用的人工智能燃料。然后,算法可以為人類決策者或參與者創建模型、開發和測試洞察力、繪制相關性并檢測異常情況。
人工智能可以同時在人類無法理解的時間尺度上做出決策。人工智能可以幫助人類進行目標發現、情報融合、目標優先排序、指揮官分析、評估、部隊分配、任務規劃、任務監控和執行。人工智能將在人類無法超越的多個領域和多層次戰爭中實現快速決策。人工智能將聚合、整合、提煉和呈現常見的作戰圖,并幫助加速決策,實現當今人類無法掌握的效果。人工智能可能被證明能夠將冗長的聯合目標選定循環縮短為一個快速更新、對環境變化做出快速反應、敏捷和積極的循環。人類思想或行動的每一個領域都適合人工智能顛覆,包括空中力量的使用。
美國必須準備好對相關信息以高速決策響應。自動化和人機協作將改善和加快空中力量 C2 的決策和任務循環。未來戰爭的勝利將屬于能夠以壓倒性優勢的進行指揮、控制其部隊的領導人。未來的戰爭將有利于能夠快速處理信息并在各級戰爭中做出決策的交戰領導人。作戰目標不僅是迅速對敵人作出反應;但它也是按照自己選擇的方向和節奏推動戰斗。領先于敵方三步的交戰領導者,會使敵方“倒退”,不斷掙扎反應,無法取得主動權。
本文試圖讓讀者熟悉人工智能的潛力,并強調在空中力量 C2 中使用的關鍵考慮因素。本文的主要重點是展示美國在未來的戰斗中必須利用的潛在人工智能潛力。目標是通過具體的應用示例激發讀者的興趣。作者希望讀完本報告后讀者會對人工智能有所熟悉。開發和部署下一個不對稱優勢所需的先導是創新文化和適應愿景,這是通過鼓勵創造性地解決問題和激發整個聯合部隊創新熱情來培養的。
本文簡要介紹了一些基本的 C2 規范和流程——奠定了基礎——并強調了潛在的人工智能應用領域。其次,它描述了美國C2聯合空中力量的集權平衡和一些原則。第三,它調查了美國的聯合目標選定和目標選擇過程。第四,對 AI 基礎知識和 AI 應用示例的調查將提供概念基礎,然后是在軍事應用中使用 AI 的幾個示例。這允許討論武器-目標配對模型,該模型說明如何處理數據、算法選擇和模型輸出的決策。然后,本文討論了人工智能輔助評估,包括主導指標和反饋循環。最后,基本的實施考慮將涵蓋部署和變革所需的步驟,以成功建立信任并幫助決策者在空中力量中使用人工智能解決方案。
本節將簡要地讓讀者了解使用空中力量的一些 C2 基礎知識。簡而言之,C2 是“由指定指揮官針對需完成任務時對指派和附屬部隊行使指揮權力。”聯合空中作戰是由各軍種執行聯合空中任務部隊執行的行動。聯合空中作戰在作戰環境和軍事行動范圍內可能會有很大差異;然而,讀者對空中力量的 C2 有一個基本的了解是至關重要的。
美國條令規定使用集中式控制和分布式執行的原則進行聯合空中作戰。推動這一空中力量原則的一個過于簡單的概要是,集中式控制使高級梯隊指揮官能夠有效地控制、集結和領導部隊;執行權力下放使部隊能夠掌握主動權,應對不確定和不斷變化的環境,并提升下層的靈活性。
技術發展經常改變空中力量這一原則的平衡。強大的通信連接提高了各層級的共同作戰圖景,但它也使高級領導層能夠參與最細微的工作細節。這種雙重性在政治控制的必要性與領導者必須高效完成任務的必要性之間造成了內在張力。 盡管在許多情況下集中式控制和執行是可能的,但有意識地適當下放執行權力將確保美國空中力量敏捷性的維持。
集中式權力和分布式權力的平衡可以在沖突之間和沖突期間發生變化,領導人必須努力提高空中力量使用中的“敏捷性”。空軍未來作戰概念將敏捷性定義為對情況做出快速反應的能力。敏捷性是靈活性、速度、協調性、平衡性和力量的結合。分布式通常有利于靈活性和速度,而集中式通常有利于協調性和力量。對敏捷性的理解可能意味著身體能力,但敏捷性還包括對動態對手、移動目標或變化環境做出反應的認知能力。在空中力量 C2 中使用人工智能,在于它可以協同帶來的認知速度和力量,朝著敏捷性目標前進。
C2 系統控制聯合空中作戰,通常圍繞軍種司令部指揮官的 C2 系統構建,該系統擁有大量空中資產設施和最出色的控制能力。空中作戰中心 (AOC) 是戰區高級單位空中控制系統,確保空中、太空和網絡空間行動的有效規劃和實施。當與聯合或聯軍伙伴作為聯合空戰中心或聯軍空戰中心作戰時,AOC 架構也可能適用。 AOC 的規模從幾個工作人員到上千名軍官、入伍和文職人員之間可能存在很大差異。每個 AOC 的組織各不相同,但他們的共同目標是匹配可用的手段來實現軍事任務目標。 AOC 的職責通常包括規劃和控制聯合空中作戰,提出空中分配、空域協調、防空協調、空間協調和網絡空間協調的優先事項建議。
計算、通信和信息共享方面的技術改進打亂了C2 分層架構,造成了從作戰計劃到戰術執行的中斷。 AOC 領導層能夠做出歷史上在較低層的作戰或戰術梯隊中進行決策。例如,今天,最高級別的作戰 C2 可能不會授予目標識別和武器釋放權限,而這曾經只能在戰術邊緣進行。面對能力較弱的對手時,相對優勢明顯,對平民傷亡的厭惡可能使美國陷入自滿,并錯誤地假設未來的戰爭將在相同的良性環境中發生。通過在 AOC 之外分配控制權、分散空中資產執行以及在 C2 的多個級別利用 AI 的速度和認知能力,可以提高擊敗近端對手所需的效率和敏捷性。
空中力量的 C2 具有利用人工智能增強和自動化提高認知敏捷性的巨大潛力。下一節將討論空中力量 C2 中 AI 應用的一個示例——聯合目標選定。目前,在規劃和執行聯合空中作戰時,目標選定循環內存在數據缺口和效率低下,使關鍵信息的有效傳輸變得復雜。下一節將介紹人工智能如何幫助決策者更好地了解他們的作戰環境、將戰場數據過濾融合為相關信息,提高決策速度。
聯合目標選定旨在將提供給聯合部隊指揮官(JFC)的可用手段與利用空中、太空和網絡空間力量實現軍事和政治目的的方式相匹配。這是一個選擇目標并確定其優先順序并匹配相應響應的過程,同時考慮到作戰需求和能力。聯合目標選定可以發生在實現 JFC 目標所需的任何戰爭級別。聯合目標選定,將所需效果與這些目標相匹配,最后選擇能夠提供所需效果的手段。
戰爭迷霧和摩擦、目標重復、未知數、整合要求、二階和三階效應以及可用資源的缺乏,使得方式方法與目標匹配工作變得復雜化。聯合出版物 (JP) 3-30文件(聯合空中作戰的指揮和控制),強調了效率的重要性,并指出:“有效和高效的目標開發過程與聯合空中任務循環相結合,對于聯合空中部隊指揮官( JFACC)規劃和執行聯合空中作戰至關重要。聯合目標選定過程應整合國家機構、作戰司令部、下屬聯合部隊和組成司令部的情報數據庫、分析能力和數據收集工作。”本節將討論人工智能如何幫助實現聯合作戰所需的效率目標循環。
為了在聯合目標選定循環(joint targeting cycle)中提高效率,流程中的各個步驟和步驟的自動連接必須提高效率。如圖 1 所示,聯合瞄準的六個階段包括:
1.結束狀態和指揮官的目的開發,
2.目標開發和優先排序,
3.能力分析,
4.指揮官的決定和兵力分配,
5.任務規劃和部隊執行,
6.評估
圖1:聯合目標選定循環(JP 3-60)
人工智能可能會加速和優化目標開發和優先級,提供近乎即時的能力分析,快速迭代規劃目標,并自動制定攻擊計劃。
C2 參謀人員在聯合空中任務循環中進行聯合目標選定,這是經過精心設計的,但允許在循環外執行一些動態目標。JFACC 可以更改流程以匹配環境;然而,空中力量任務循環本身仍然是經過深思熟慮的,并且通常在持續時間上是固定的。在空中任務循環內快速或有效的動態目標或時間敏感性目標的請求與過去的能力和時效性有關。任何“彈出式目標”通常需要至少 12 小時才能在空中任務指令 (ATO) 流程中采取行動。在沒有特定目標的情況下規劃或啟動,并且能夠對實時機會做出反應。在 12 小時窗口內使用 ATO 流程重新部署刻意分配任務的資產靈活性通常很小,當前的作戰部門可能會在正常的空中力量任務分配流程之外提供任務分配。盡管有嚴格的聯合空中任務循環,但在時間敏感或高度動態的目標中需要靈活性和速度,而不是在它的幫助下。
目標選定的最大困難之一是在不同時間尺度上有效和全面地融合目標。聯合部隊針對不同時間執行的目標集,實施探索發現、優先排序和匹配效果。此外,目標開發循環以不同的速度發生,并且傳感器可能會在硬性目標過程的后期發現高優先級目標。美國要求有能力盡快適應環境和敵人的行動。由人工智能輔助的聯合目標選定循環可以有意識地和動態地繼續尋求目標,并且能夠使用不斷更新的循環來匹配效果并對目標進行優先級排序。當 C2 將資產設施與高價值“彈出式”目標配對時,其原始目標應立即流回目標解決方案,重新確定優先級,并可能移交給另一個打擊資產。進行這種目標循環的規模和速度只有通過人工智能的認知速度和強度才能實現。由人工智能推動的聯合空中目標選定循環是動態和不斷迭代的。
目標的定義是任何人、地點或事物,考慮采取可能的行動來改變、降低或抵消它為對手執行的功能。 聯合空中部隊指揮官(JFACC)根據對聯合部隊目標的貢獻程度、實現預期效果的可能性、交戰成本和許多其他因素對目標進行優先級排序。目標可以是人員、設備或基礎設施;相反,目標也可能具有數字能力或者是網絡空間中的實體。聯合目標選定中的目標分析不僅定義了目標,還定義了它們的優勢、劣勢和相互聯系。
規劃者必須詳細記錄目標特征,以便他們可以開發、關聯和融合目標。特證是特定于目標類型的,但通常可以包括諸如位置、大小、詳細外觀、目標構成、分散、硬化、電磁特征、發射器和移動性等細節。目前,人類通過低魯棒性的機器對機器通信的數據庫,來手動輸入目標特征、編譯目標、關聯目標、消除冗余并確定目標優先級。
然后,JFACC 的參謀人員對目標進行優先級排序,將其與效果相匹配,并利用可用資產、輸入和來自各組成部分指揮官的協調來執行任務。為了關閉目標選定中的反饋循環,評估小組需要分析行動對實現軍事目標的影響。評估提供了成功的衡量標準,這些衡量標準可以反饋到培訓人類決策者中,并且可以應用于人工智能系統的教學。這個迭代循環強化了最佳行為并減弱了不良行為。
實施人工智能輔助情報融合和目標優先級排序可以比任何大規模的人工過程更快地動態推薦重新分配軍事資產設施。目前 AOC 中采用的深思熟慮和動態的目標選定循環包含最低限度的自動化,充斥著多余的人力,并且缺乏有效的交叉溝通。在目標選定循環內將人工密集型任務實現自動化,可以加強觀察、定位和決策循環。即使是促進目的、任務、目標、特征和武器在循環步驟之間有效流動的基本自動化,也會減少流程的時間。更全面的人工智能實施將促進目標特征的近乎瞬時融合、匹配目標的優先級、彈藥匹配和空中任務調整。人工智能實施的一個目標是將聯合空中目標選定過程從目前的三到五天減少到沒有固定持續時間的過程,該過程還可以迭代適應實時變化的作戰環境和威脅。
當數據中存在潛在模式或相關性時,人工智能會很好地工作。因此,人們應該在可能存在相關性的地方尋求使用機器學習,并且有足夠數量的訓練數據來繪制這些相關性。其次,試圖解釋潛在相關性的模型應該足夠簡單,以快速解決未來的問題。這些概括也有例外,但這些確定是探索的良好起點。人工智能需要包含相關性的數據來??對環境和預測做出結論。人類目前在解決新穎或非結構化問題方面更有效;人工智能在高度相關的環境中茁壯成長。
人工智能目前在多個領域表現出優于人類的優勢。首先,機器學習在人類無法確定管理數據或關系的規則的情況下表現出色。當存在大量變量、變量之間存在復雜的相互聯系或人類無法“標記”數據時,這種確定是可能的。這方面的一個例子是基于 DNA 預測疾病。在沒有幫助的情況下,人類將無法處理一個人類基因組中的所有數據,更不用說來自數千個示例的關聯相關性了。
機器學習擅長的另一個領域是人類可以理解相關性,但規則無法通過蠻力編碼來解釋它們。人類很容易識別手寫字符,但要使用識別手寫所需的所有規則對計算機進行編程卻非常困難。在這種情況下,人工智能的優勢在于能夠以相對便宜的方式擴展應用程序。 AI 讀取并自動發送郵件,減少郵政服務人員的需求并降低消費者的成本。機器學習潛力的另一個領域是執行人類可以完成的任務。然而,情況經常發生變化,人類不斷對機器進行重新編程的成本過高。人工智能可以根據數十億個數據點幾乎瞬間更新感知。這方面的一個例子是亞馬遜的推薦系統。使用人工智能,亞馬遜近乎實時地更新產品推薦,明確為數億人量身定制。在有太多實例無法單獨理解或編程的情況下,人工智能會迭代地適應和學習不斷變化的數據。人工智能在人類不了解管理數據的規則、他們理解規則但無法準確編碼解決方案,或者擴展或迭代調整解決方案成本過高或不切實際的領域非常有用。
人類在創造力、獨創性、責任感和同理心方面保持相對優勢。雖然人工智能可以原創十四行詩并繪制出獨特杰作(評委無法將其與人類藝術家區分開來的),但它們的創造力和獨創性始終是有爭議的問題。這些人工智能本質上是通過學習模仿人類的例子來模仿創造力和獨創性。然而,這些優勢領域可能正在逐漸消失。這種侵蝕的一個例子是從 DeepMind 的 AlphaGo(通過分析人類棋局學會熟練地下圍棋)到 AlphaGo Zero 的轉變,后者僅通過強化學習和自我博弈(而不是觀察人類下棋)來學習。機器正在迫使人類重新評估原創性和創造力的定義。責任可能是目前人類主導的最“黑白”的領域。
在戰爭事務中,人類不應將責任委托給機器,因為他們無法對自己的決定和行為負責。最后,人工智能無法理解人類同理心、道德、信仰、價值觀或隱含目的的復雜性。人工智能可以學習模擬道德或遵守參與規則;然而,人工智能不太可能很快內化人類的同理心,或者批判性思考人類道德、價值觀和某些行為的能力。
由于這些原因,在可預見的未來,戰爭本質決定了很可能仍然靠人類努力。人類將在作戰設計和更接近“戰爭藝術”特征的領域中保持優勢。人工智能將在數據處理、信息融合、優先排序、分析、處理和通常被稱為“戰爭科學”的程序方面出現激增。人工智能將在戰爭的各個層面為人類提供幫助——從援助到完全自主——每一個補充對方的優勢,不對稱地應用于對手的弱點。
前面的部分為讀者在空中力量 C2 和 AI 基礎知識中進行聯合目標選定奠定了基礎;下一步是創建一個建立在該基礎之上的 AI 框架。有無數種方法可以處理每個 AI 應用程序,本節將為非技術讀者解釋一個通用框架——不涉及任何數學或編程!這個通用框架將按時間順序逐步執行:
1.如何確定 AI 的使用領域,
2.如何查找和準備數據,
3.如何選擇算法并生成模型,
4.如何創建適當的決策規則并使用輸出。
武器-目標配對模型作為示例包含在每個步驟中,以增加對概念的一些特異性和理解。
創建機器學習解決方案的第一步顯然是確定應用領域,例如工時密集型或高度重復性任務。 AI 擅長解決包含強相關性或示例案例的問題。此外,重要的是要記住不要僅僅為了獲得 AI 解決方案而將 AI 解決方案強加于問題。在解決問題時,人工智能應該提供準確性、速度和/或更高的效率。
在分析應用領域時,最好從相對簡單的問題開始實施,向復雜的問題努力。哪些問題由人類解決相對容易,但需要大量時間或經常重復?聯合目標選定是人類很容易將特定目標與預期效果聯系起來的領域,但該過程經常變化并且需要大量人力。在聯合目標選定中,幾個領域將受益于人工智能:武器-目標配對、任務-飛機配對、目標優先級排序、戰場態勢感知、藍軍和紅軍跟蹤、系統節點分析、空襲計劃制定、ATO 開發和目標情報融合。本文AI 示例將側重于武器-目標配對的使用領域。
數據是人工智能需要學習的燃料。每個應用程序所需的數據類型會有所不同,哪些數據對人類認知是必要的是收集的一個很好的起點。單個推測可能會為數據收集提供一個起點,但可能會產生一些錯誤的相關性,同時也會丟失人類不可見的相關性。如果數據中沒有任何已知的相關性,無監督學習可能會在沒有人類直覺的情況下初步確定關系。
在武器-目標模型的例子中,要收集的基本數據是目標、武器和使用環境的特征數據。每種武器所需的一些數據將包括武器殺傷概率 (Pk) 和損壞概率 (Pd)、致命影響半徑、風險估計距離、可靠性率、圓形誤差概率 (CEP)、制導要求和可用性。一些目標特征數據將包括目標類型、大小、數量、分散、硬化、障礙物、機動性、防御能力和反射率。環境數據可能包括區域威脅狀況、光電能見度、紅外能見度、全球定位系統 (GPS) 狀態以及與人員和建筑物距離有關的附帶損害。有些數據很容易獲得,有些數據需要研究或模擬,有些數據可能需要新收集。
數據劃分分為兩個基本類別:觀察數據(輸入)和結果數據(輸出)。如果數據代表目標或環境特征,則為觀測數據。如果數據表示結果,則它是結果數據,例如武器 Pk 或 Pd。接下來,工程師必須按要求清理異常數據,填寫缺失數據,并規范格式。清理和結構化數據通常是一個困難且費力的過程。工程師必須將數據結構化為可用的形式來訓練 AI 模型,而不會犧牲過多的“好”數據。在數據收集、清理和結構化之后,工程師選擇算法以從數據中創建預測模型。
尋找“最佳”算法可能是復雜且耗時的。好的是,數據科學家和工程師對于在每個應用領域中哪種算法更強或更弱都有經驗法則。選擇算法的目標是找到一個在給定觀察數據的情況下最準確、最容易預測正確輸出的算法。考慮算法選擇的簡單方法類似于選擇正弦波、直線或對數曲線(或它們的某種組合)是否可以表示二維繪制的數據。在算法選擇中,如果時間和計算能力允許,可以訓練和測試多種類型的算法。對于示例武器目標問題,神經網絡或最近鄰模型可能是最準確和最可靠的預測器,因此將開發這兩種方法。
神經網絡是鏈接到前一行的神經元的若干系列神經元,這些神經元鏈接到前一行并最終鏈接回輸入數據。訓練調整每個神經元之間鏈接的權重和/或導致神經元觸發的閾值。神經元網絡的一側是前面討論過的輸入(每個獨特的觀察數據類別),而神經網絡的另一側是輸出(每種武器和融合組合的 Pk 或 Pd)。為了訓練神經網絡,神經元最初接收隨機權重,數據通過最小化輸出誤差來調整神經元。圖 5 描述了神經網絡訓練,它將每個預測與已知結果進行比較,然后使用它們之間的誤差來調整神經網絡參數。
圖5:訓練神經網絡
訓練迭代最小化預測和現實之間的誤差。這種迭代調整的方法提供了更高的準確性,但需要一些透明度,并且人類可能難以理解神經網絡權重的含義。
相反,最近鄰是最簡單的機器學習類型之一。在這個武器-目標配對示例中,程序員可以使用它來比較神經網絡的性能。最近鄰模型將目標示例的特征與已知示例的特征進行比較,以確定哪種情況最能代表測試目標特征。這類似于警察如何根據他或她最近的鄰居的隸屬關系來預測個人的幫派隸屬關系。該模型擅長根據之前收集的數據對新病例進行分類。
武器-目標示例的維度可能會增加 10 個維度。每個維度代表一個目標或環境特征,包括:大小、類型、機動性、裝甲、GPS 可用性等。有關高維最近鄰渲染的表示,請參見圖 6。
圖6:最近領表示
一旦算法生成經過訓練的模型,模型就會針對工程師之前從訓練數據中分離出來的數據進行測試(這可以防止模型過度擬合訓練數據)。如果效率相當,工程師會選擇最準確的模型。如果模型產生相似的性能,工程師通常會選擇最有效的模型。訓練完成后,模型可以根據需要重新訓練新數據。人工智能開發是一個持續的過程,運營商和信息保障經理應與工程師一起維護和完善人工智能解決方案。
然后,該模型必須轉化為決策或行動。人類必須決定如何對模型的輸出采取行動。例如,該模型將產生一個分類或可能性,它可以為決策提供 if-then 場景或規則。在武器-目標示例中,模型將為每個武器和目標融合輸出 Pk 或 Pd。適用于模型輸出的有用規則包括相稱性、附帶損害最小化或武器稀缺性。這些規則可以對所需武器進行排序,并限制 AI 建議對每個目標使用核武器(核武器在圖 7 中表示為 1.00 輸出)。
圖7:武器-目標配對神經網絡
此外,人類必須決定授予 AI 的權限級別。如果人工智能準確可靠并且在相對低風險的領域運行,則它可以在沒有人工監督的情況下運行。例如,如果人類僅在 80% 的時間里找到“最佳”決策,那么如果該模型在 95% 的時間里做出“最佳”決策,則人類應該遵循武器目標模型的建議。為了幫助做出這一決策,許多各種類型的人工智能可以用他們的預測來表達置信度。置信度可以表示為測試示例與用于訓練 AI 的數據的接近程度。如果訓練數據不足,或者 AI 不知道如何解釋示例,則置信度可能較低。人類應該將置信度和準確性與人類和其他模型進行比較,以決定授予人工智能多少權限,這可能取決于具體情況。
關于模型何時足夠準確以供使用的決定可能很困難,在訓練場景中讓模型模仿人類可能是明智的,這樣他們就可以評估自己的表現并發現潛在的弱點。決定授予人工智能多少權限應該取決于風險、置信度和時間。領導者應該在低風險領域授權需要速度的決策,同時在不那么緊急的高風險決策時可以暫緩授權——見圖 8。
圖8:考慮風險與時間下的自主級別
戰時評估是收集和理解信息以更新戰爭信念或觀點的行為。評估過程是每個戰爭級別、每個領域的要求,領導者應有意識地努力確保評估過程中提出的建議準確性。Scott Gartner 在 Assessing War 中寫道,使評估變得困難的三個因素包括“戰時信息的積累速度快于戰時分析能力,領導者需要在清楚了解正在發生的事情之前做出決策,以及信息環境包含巨大的不確定性和噪聲。”人工智能可以在速度和大型計算領域為人類提供幫助,例如那些具有挑戰性的評估。目前的評估“反映了準確性和速度之間的權衡”。人工智能可以提高評估速度;但是,它并不能消除信息滯后。由于需要集中評估以及收集和融合數據的要求,總會存在固有的延遲。人工智能增強的評估可以根據數據不斷迭代分析。除了人工智能在速度和準確性方面的幫助外,本節還將討論人類如何利用人工智能來減輕人類在感知和處理數據方面的偏見。
目標評估是一個持續的過程,用于評估實現預期效果的有效性。評估試圖衡量行動產生的影響。但影響往往難以衡量。例如,領導者如何衡量敵人的士氣或戰斗意愿?衡量成功和目標成就需要具體的成功衡量標準。 Scott Gartner 建議定義代表預期效果的主要指標,這些指標更容易識別和衡量,而不是試圖衡量效果本身。
主導指標是可以輕松識別觀察者看不到的模糊的潛在事實和趨勢標志。主要指標側重于戰時績效指標,使用基于時間的定量績效衡量指標來反映組織的任務完成情況。如本文前面所述,人工智能通常優于人類的領域之一是確定數據中的潛在相關性。使用有監督或無監督學習,機器人團隊可以開發出與性能和效果在統計上相關的主導指標。人工智能可以統計顯示哪些變量與目標成就及其重要性水平相關聯,而不是僅僅依靠人類的啟發式、偏見和認知捷徑來確定評估者認為哪些是成功的。 AI 顯示了與數據相關的主要指標,而不是猜測反饋的定量方法。
軍事評估的目的不僅是為決策者提供對作戰進展情況的衡量標準,而且評估的目的還在于創建一個可操作的反饋循環,用于調整對未來作戰的看法、假設和信念。評估關閉了反饋循環。評估在人類決策中至關重要,但可以說在人工智能應用中更為關鍵。反饋是人工智能能夠適應和改進環境變化的唯一途徑。人工智能系統的評估與人類的評估方式非常相似,調整先前的預測,進行學習和適應。
對于人工智能來說,評估的結果應該不斷地反饋到訓練模型中。在武器與目標配對示例中,規劃人員或機器接收針對特定目標使用的武器的炸彈損壞評估 (BDA),并將在適用時更新 Pk 和 Pd 模型。例如,如果模擬顯示特定彈頭能夠穿透硬化結構,但現實顯示不同的結果。人類將觀察返回的 BDA 報告并調整他們對該特定彈頭的使用。在機器學習中,預測和實際損傷比較以及由此產生的誤差會更新模型。通過使用更多 BDA 和高度多樣化的場景迭代訓練模型,模型收斂到更新的事實。
制定適當的成功衡量標準對于人類和人工智能的學習都至關重要。選擇一組指標必須揭示有關環境的信息,并為其收集創造適當的激勵措施。如果指標或關系的權重存在虛假陳述,則可能會出現負面訓練。這種負面訓練可能導致人工智能或人類感知永遠不會與現實融合。由于這些原因,人類必須創造明確的目標;操作基準必須將總體目標與可確定的有效性度量 (MOE) 聯系起來。 MOE 與績效衡量標準 (MOP) 相關聯。此外,人類應不斷評估人工智能預測的準確性,并在必要時提供再訓練。在組織內工作的 AI 專家能夠及時調整模型和再訓練,塑造對成功至關重要的學習。評估必須不斷完善人類和人工智能認知,以適應環境。如果領導者尋求不正確的成功衡量標準,人類和機器都會優化不正確的行為。
越南戰爭中的目標設定和評估無效的一個例子很明顯。美國領導層制定了敵人“人數”的作戰基準。領導人認為,如果越共和北越無法彌補他們在戰場上的損失,南越將會穩定下來。威斯特摩蘭將軍后來強調了這一指標的不足之處,他說:“誠然,“人數”統計是衡量進展的不完美標準,但在沒有常規前線的情況下,我們還能如何衡量成功?”在強調人數的重要性,領導層誤解了越南的真實情況。此外,在試圖將下屬的信息拉向人數的操作基準時,他們向下屬提供了有害的激勵措施。士兵和領導人錯誤地夸大了人數,試圖最大限度地增加人數會導致非法和不道德的行為。本案例研究強調了目標、操作基準、MOE 和 MOP 對人類和 AI 行為的重要性。當使用不正確的措施和目標時,可能會在訓練中強化不良行為。
人類本能地從有時難以解釋的觀察中得出結論。人類也傾向于吸收傳入的信息以適應現有的信念和期望。由于神經元串行處理速度的限制,認知捷徑和啟發式方法對于人類快速做出決策是必要的。大腦通過基于先前學習對當前經驗進行分類和關聯來做到這一點。數據的自動處理、過濾和分類使大腦整體能力更強;然而,這些捷徑也可能導致誤導性評估。這種過濾和偏差發生在較低級別,例如模式識別以及高級分析和評估中。當人們只看數據本身時,既存的信念在面對意想不到的新信息時具有持久力。人類必須承認這把雙刃劍,并利用它來發揮自己的優勢,同時減輕自己的弱點。人類不應該試圖修復、升級甚至根除使我們成為人類的東西;相反,我們應該設計技術來補充我們的能力和局限性。領導者應該尋找人類認知薄弱、不準確或緩慢的領域來進行人工智能的初始實施,同時在依賴創新、獨創性和創造力的領域將主導地位讓給人類。
偏見決策不僅限于人類;人工智能也不能幸免于這些來自現實的扭曲。偏見可能會通過訓練中使用的數據、算法和結構或通過實施來影響 AI。每年都有偏見 AI 的例子,而現實是 AI 僅根據其編程和訓練來做出決策和采取行動——專家稱之為“算法偏見”。算法偏見的例子包括無法檢測到黑人女性的面部識別程序、向女性展示較少高薪工作的廣告、預計少數民族男性的累犯率增加以及“種族主義推特機器人”Tay。用于訓練 AI 模型的數據必須沒有不良偏見,否則 AI 可能會產生不良行為。
人工智能可以為評估提供更大的客觀性。在備選方案之間做出決定的過程可能很繁瑣;它“為重新考慮設置了強大的障礙,即使新信息對最初選擇的有效性產生懷疑。因此,決策者不是重新審視最初的選擇,而是貶低、曲解或忽略與該選擇有關的新信息。” “決策者具有強大的組織目標或自身利益可能會忽略或最小化與這些利益沖突的傳入信息,并突出顯示支持 . . .以我們可能不認識的方式對我們對數據的解釋進行著色。”評估是人工智能實施的另一個成熟領域,因為數據量很大,而且人類偏見可能會扭曲認知。人類應該利用人工智能來增強戰時評估實踐,使其更全面、更快、更客觀。
一旦我們創建和訓練了 AI 模型,我們的工作就沒有完成;最終的成敗在于實施細節。透明度和控制是在任何 AI 系統中建立信任的要求。此外,任何解決方案的人機界面和無縫集成都將成為成功實施的基石。國防戰略承認這一挑戰,并指出:“成功不再屬于首先開發新技術的國家,而是屬于更好地整合新技術并適應其戰斗方式的國家。”人類操作員可能會采用人工智能解決方案只有當它們值得信賴并提供無縫且有用的界面時。本文中推薦的實施不太可能很快發生,它們也不夠詳細,無法在今天直接實現。美國必須將研究、人員配備和資金投入到深思熟慮的實施過程中。使用敏捷開發方法,通過分解問題的各個部分,并隨著時間的推移產生小的勝利,成功的實施和改變是可能的。
美國不能在一次浪潮中或完全使用現成的解決方案來實施一個大型的“人工智能解決方案”。由于應用程序規模、環境復雜性和組織對變革的抵制,試圖開發一種廣泛適用的“解決方案”將是一項不可能完成的任務。對現有流程的迭代改進將推動增量變化,建立信任,并隨著時間的推移導致進一步的發展。
隨著時間的推移,建立信任并引導進一步的發展。在與教授未來 AOC 專家和新 AOC 部門領導的數十位學者和專家的對話中,大多數教師對短期內有意義的人工智能集成表示了相當大的懷疑。每個人都看到了這篇論文的必要性;然而,專家們很快在鼓勵之后發表評論,詳細說明由于依賴當前的“做事方式”和所需的應用范圍,它幾乎沒有實施的機會。教條式的循環很難打破,它們通常需要外部沖擊來突出變革的必要性。人們并不認為 AOC 目前已經“崩潰”,本文也沒有暗示這一點。然而,正如前幾節所述,美國未能保持“相關速度”和認知敏捷性存在危險。 本文的目的是試圖幫助調整國防部文化并確保追求下一個針對任何潛在對手的不對稱超越。
組織和國家堅持他們歷來重視的技術和實踐,以及那些支撐他們當前優勢的技術和實踐。大多數專家同意,空中力量的 C2 在打當今戰爭方面是有效的,但在實現政治目標方面往往效率低下。通常,領導者會在選擇目標的同時選擇實現目標策略。此外,領導者將注意力集中在漸進的“創可貼(Band-Aid)”修復上,而不是尋找可能導致最佳結果的總體公式。最終的問題是:
1.AOC 能否在明天的戰爭中面對近乎同等的對手時進行有效的控制?
2.當前和未來的大趨勢是否會使當前的空中力量 C2 手段和方式過時?
3.是否會出現巨大的失敗來強調向更智能的 C2 轉變的必要性?
我們當前的范式、官僚主義和組織動力所造成的抑制是技術發展和創新中最重要的障礙。理想情況下,更新空中力量的 C2 將利用現代理論和可用技術來全面開發最佳 C2 結構。然而,人們對全面的 C2 大修并沒有興趣,最有可能成功的機會是逐步開發和應用人工智能解決方案,隨著時間的推移建立能力和信任。
控制、職能、流程、結構、人員配備和領導角色的平衡可能會隨著時間的推移在人工智能實施中進行調整。當前的任務機制:計劃、任務、執行和評估,可能仍然適用;但是,監督這些機制的組織和方法可能會發生變化。隨著人工智能解決方案的適應性開發和實施,領導者將能夠測試和運行系統,并通過漸進式變化觀察其影響。測試和演習應包含完整版本的作戰結構,以突出潛在的不足和需要改進的領域。有效的 AI 需要大量數據,而這些數據可能不會出現在小型測試或演練中。如果未來的戰爭需要在多個領域快速適應 C2,美國必須以這種心態開發結構、部隊、流程、測試和訓練。人工智能將補充和自動化某些領域的員工密集型工作,同時創造其他領域不存在的潛力。某些感知、分析、傳播和決策方法對于當今的工作人員和機組人員來說將變得陌生。
C2 和 AI 專家無法準確預測他們未來將如何以及在何處使用 AI;然而,對實施過程的有根據的猜測是觸手可及的。為在空中力量 C2 中成功部署人工智能,建議采取以下七個步驟:
1.領導者必須確保制定和分發從數據收集到人類或人工智能行動的架構、透明度、安全和通信標準。
2.聯合部隊必須為人工智能的開發、測試和演練開發孵化器。聯合部隊必須為這些試驗臺提供足夠的資源,并提供迭代開發和改進跨任務集和戰爭級別的人工智能解決方案所需的訪問權限。
3.孵化器一旦開發出人工智能解決方案,就必須在模擬中對其進行測試。兵棋推演必須充分模仿資產行為并復制現實世界。模擬允許在批準用于實際使用之前在良性和安全的環境中進行新的 AI 測試。
4.聯合部隊必須在演習中測試人工智能,然后才能獲準參戰。從戰術到作戰層面進行的演練提供了微調認知和行為的能力,以及開發和評估作業策略、技術和程序的能力。采用新技術時,人類的迭代適應和性能改進的相同理論也適用于人工智能的使用。改善 AI 行為的兩個示例方法包括:a.最初跟隨人類決策者并從他們的行為和決策中學習。在向人類決策者進行初步學習后,人工智能可以通過未來的自我學習繼續改進,而不會受到人類的影響。或 b.通過在對抗性學習或強化學習環境中對幾代 AI 模型的行為進行自我訓練,迭代地改進 AI 決策,然后將性能與人類行為者進行比較。在訓練過程中,人類應該在表現出可取或不受歡迎的行為時提供輕微干涉。
5.與人類和其他人工智能相比,AI一旦表現出卓越的性能,就可以選擇使用AI。每個應用領域所需的性能水平會有所不同,包括置信、時間和風險等因素(參見圖 8)。如果滿足以下條件,人工智能認證應批準人工智能作業:a. AI 已達到所需的性能水平。b. AI符合安全要求,遵守適用的交戰規則和國際武裝沖突法。 c. AI 滿足安全要求,包括對所需數據的訪問、所需的機密性以及數據和信息流的完整性保證。 d. AI 可以與所需的實體進行通信。 e.如果需要,人工智能可以由人類控制。
6.當聯合部隊使用人工智能時,他們應該尋找相鄰的使用領域,以補充和擴大自動化,增強有效性和效率。人工智能解決方案的增量實施將通過協同效應獲得效率和性能,通常稱為飛輪效應。
7.聯合 C2 的組成、組織、流程和速度將在人工智能的實施過程中不可避免地發生變化。領導者及其員工將負責調整流程、組織結構和訓練,以獲得人工智能的利益。
在人工智能增強的戰斗中,聯合空中力量 C2 的領導力無疑會有所不同。人類可能會花更多時間在評估、分析和決策上。隨著機器快速清理和構建大量數據,人類決策者可以將更多時間投入到人類擅長的事情上——在作戰“藝術”中發揮創造力,做出負責任的決策,并為棘手的問題集帶來獨創性。任何將人類決策注入人工智能繁重的周期都將不可避免地減慢這一過程。然而,人類可以在決策循環中提供顯著的風險緩解和監督。在決定何時何地需要人工決策時,領導者必須評估風險接受度、對 AI 的信任、AI 置信度、成本、時間限制、戰略影響和潛在的意外影響。隨著人工智能的發展和廣泛實施,失敗的機會越來越多。錯誤和硬件故障的機會隨著復雜性的增加而增加。未來可能繼續需要某種程度的人機交互。戰爭的本質仍將是以人為中心的努力。反復出現的管理和維護挑戰放大了對決策者和工程監督的要求。主題專家、工程師、信息經理和決策者應該從開始到部署齊頭并進。
在將控制權交給人工智能之前,信任是任何系統的要求。人工智能的大多數當前應用程序執行相對良性的功能,無需做出生死決策。人工智能在 C2 中的初始應用也應該在能力和過程最容易理解的領域和低風險領域。隨著時間的推移,應用領域可能會增加;然而,人類在信任人工智能合作伙伴之前需要透明度、控制力和可信度。
人工智能和自動化通過小小的勝利建立信任。低風險領域的逐步實施將表明人工智能是有能力的。例如,人類對將日常通勤中的權力委托給人工智能持懷疑態度,因為高速駕駛是一項冒險的嘗試;然而,數十萬人在日常通勤中信任特斯拉汽車。隨著時間的推移,人類通過其展示的能力變得舒適和信任。多年來,人工智能已經建立了控制車輛的能力。最初,圖像識別展示了識別物體的能力,例如標志、人、汽車和畫線。深度感知和自由空間算法發現了在環境的實時表示中顯示可駕駛區域的能力。最后,將多種形式的人工智能融合到駕駛解決方案中,超過了普通人類駕駛員。特斯拉通過可信度和展示能力建立了對其人工智能的信任。
透明度還通過可追溯性、理解和驗證來促進信任。在中高風險應用程序中實施的人工智能必須能夠顯示基本假設并追蹤得出結論的方法。跟蹤從輸入到輸出的決策過程的能力產生可解釋,這在學習系統中有時很棘手。生命未來研究所在 2017 年發布了 23 條人工智能原則,并得到了數千名領先的人工智能專家的認可,強調了透明度和安全性問題。該研究所強調“故障透明度”和“司法透明度”是未來人工智能發展的兩個要求。簡而言之,人工智能必須能夠顯示系統出現故障的原因,并就其做出具體決策的原因向人類提供令人滿意的解釋。透明度是系統設計期間的要求。
控制不會產生信任,但缺乏控制會迅速破壞以前存在的任何信任。人類感知人工智能的行為和意圖,然后能夠指導或改變任何系統行為的能力至關重要。如果策略、戰略或目標發生變化,領導者必須能夠調整行為。此外,如果人工智能表現出不正當的意圖或表現不佳,人類必須能夠超越其行為。盡管系統沒有按要求運行,但一旦識別出危險情況,人類必須能夠進行控制。透明是控制的要求,控制是信任的要求。
如前幾節所述,兵棋推演和模擬有助于訓練 AI。現實世界的事件和過去的行動結果可以調整人工智能的行為,但這只能通過特定的現實世界例子來教人工智能。如果一個場景過去沒有發生過,那么人工智能將沒有準備好在未來處理它。人工智能需要能夠模擬以前沒有收集數據的場景,以概括其學習并更好地填補存在的空白。許多類型的 AI 都需要模擬環境來測試相關場景或可能發生的場景,但在現實世界中進行測試是不切實際的。通過在模擬世界中作業項目、參數和動作,人工智能可以比現實世界更快地觀察效果并強化適當的行為數量級。
靈活的自主性是指系統在有或沒有人的情況下運行的能力。靈活的自主性最初可以提供 AI 實施,一套“訓練輪”,直到最終系統驗證發生。在最初的 AI 應用期間,人類可能會選擇將很少的權限讓給 AI。然后,隨著人工智能學習行為和優化,人工智能可以接管越來越多的任務。靈活自主是一種隱喻的在線訓練。自主性可以從人的身影轉移到人進回路中,再到人在回路中,最后如果需要的話,再到人出回路中。
人的參與程度也會隨著風險或在具有挑戰性的情況下發生變化。圖 8 顯示了授權給 AI 的權限數量與時間和風險的關系。使用不同級別控制的人工智能在風險變化的領域是有益的。此外,與人類合作的人工智能可能需要在有爭議的領域或敵人試圖拒絕通信或訪問的領域更加自主地運行。在這些環境中,靈活自主可以提供人類監督的能力,直到它被拒絕,此時人工智能就像訓練有素的一樣,直到重新與人類控制器通信或完成任務。
由于對數據和控制的要求,人工智能的實施似乎意味著背離分布式執行。權力下放仍將是空中力量的基本原則。由于不確定性、摩擦、變化、通信限制和模糊性,分布式執行是一項要求。權力下放使機組人員能夠掌握主動權,對不確定和不斷變化的環境做出反應,并訓練下級指揮官的靈活性。由于人工智能的實施,空中力量執行的最重要的直接變化是需要增加數據收集。如前所述,數據是 AI 學習和性能的基本要求。如果沒有足夠的數據收集,人工智能就無法準確感知環境并做出決策。未來的領導層可能會強調整個空中業務級別的數據收集和及時報告要求,以確保反饋循環穩健。指揮官必須向操作員清楚地表達意圖并協助他們分布式執行,為他們提供適當的工具和態勢感知來根據意圖執行。操作員應向其指揮官提供及時準確的真實數據和可靠準確的執行,以換取下放的執行權限。
空中力量的 C2 需要進行技術改造,以便在未來的戰爭中有效地投射空中力量。歷史表明,那些適應太慢或未能預見關鍵支點的人將遭受失敗甚至滅絕。世界正處于對人工智能巨大力量和指數級增長的開始階段。人工智能的創新解決方案可以將空中力量的 C2 帶入 21 世紀。通過建立能夠超越對手的系統和決策過程,美國可以保持在空中力量使用方面的主導地位。通過在多個領域為我們的對手制造多重困境,我們可以指揮戰斗——領先一步,朝著我們選擇的方向前進。
開發人工智能解決方案的第一步是確定潛在的實施領域。作者選擇討論聯合目標選定中的 AI 示例,但僅空中力量 C2 就有很多增強和自動化的領域。確定應用領域后,收集相關數據。人工智能需要數據來了解環境并創建簡化的模型來進行預測。如果數據不可用,可能需要部署傳感器并尋求其他方法來收集數據。然后,數據科學家和工程師對數據進行過濾、清理和結構化,以滿足 AI 開發驅動的情境需求。所需數據的收集及其清理通常是 AI 開發中的大部分工作。
收集相關數據后,算法選擇和訓練創建模型來解釋現實。有無數種算法和結構,沒有一個“千篇一律”的解決方案可以解決每個問題。反復試驗、訓練和比較模型將不斷地顯示出問題及其解決方案的最佳方法。一旦選擇了最準確和最有效的算法,就可以開始起草確定性規則,并訓練模型。領導者必須確定他們將如何使用 AI 的輸出以及控制級別。風險、時間和置信度都會影響委托給 AI 的自動化水平。
人工智能已經在企業界建立了強大的立足點,但空中力量幾乎沒有任何重要的人工智能應用的例子。為了在國際安全領域保持優勢,美國必須發現和開發創新的人工智能解決方案。俄羅斯和中國正在加大對人工智能作為一項戰略技術的投資,尋求“在人工智能發展的國際競爭新階段搶占戰略主動權,創造新的競爭優勢。”通過利用人工智能和自主性的進步,美國可以恢復其與潛在對手的日益減弱的優勢并加強威懾力。現代戰爭的復雜性和速度已經超過了我們的 C2 能力。擁有信息優勢的一方將決定未來戰爭的結果,并能夠通過高速決策做出即時反應,同時為敵手制造復雜而同時出現的困境。這種未來的能力遠未得到保證。美國必須努力保證這種由人工智能自主和增強實現的敏捷性超越。
如今,隨著技術飛速發展和威脅環境變得更加復雜,在信息爆炸的局面下,作戰人員面臨著具有挑戰性的決策空間。人工智能(AI)和機器學習(ML)可以減輕作戰人員負荷。人工智能系統具有深遠的好處——提高態勢感知能力,檢測威脅,理解對手的能力和意圖;確定和評估可能的戰術行動方針;并提供方法來預測行動決策的結果和影響。人工智能系統是理解和解決高度復雜的戰術情況的關鍵。
人工智能系統為作戰人員提供了優勢,但前提是這些系統被正確設計和實施,并且以減輕作戰人員的認知負荷的方式。為國防應用實施人工智能系統帶來了獨特的挑戰。本文確定了四個獨特的挑戰,并描述了它們如何影響戰術作戰人員、工程設計界和國防。本文通過國防采辦和系統工程計劃,為解決這些獨特的挑戰提供了解決方案。
Bonnie Johnson——在海軍工程研發方面擁有超過 25 年的領導和系統工程經驗。她曾是 SAIC 和諾斯羅普·格魯曼公司的高級系統工程師,研究用于海戰系統和導彈防御能力的自動決策輔助。她于 2011 年加入美國海軍研究生院 (NPS) 系統工程系。她擁有 NPS 系統工程博士學位、約翰霍普金斯大學系統工程碩士學位和弗吉尼亞理工大學物理學學士學位。
人工智能是一個包含許多不同方法的領域,其目標是創造具有智能的機器(Mitchell,2019)。圖 1 顯示了一個簡單的維恩圖,其中機器學習 (ML) 作為 AI 的子集,而 AI 作為更廣泛的自動化類別的子集。自動化系統以最少的人工輸入運行,并且經常根據命令和規則執行重復性任務。人工智能系統執行模仿人類智能的功能。他們將從過去的經驗中學到的知識與收到的新信息結合起來,以做出決策并得出結論。
圖 1. 自動化、人工智能和機器學習的維恩圖
如圖 2 所示,有兩種主要類型的 AI 系統。第一種類型是明確編程的,也稱為手工知識系統。 Allen (2020) 將手工知識系統描述為“使用傳統的、基于規則的軟件,將人類專家的主題知識編碼為一長串編程的‘如果給定 x 輸入,則提供 y 輸出’規則的人工智能”(第3頁)。這些系統使用傳統的或普通的編程語言。第二種類型是從大量數據集訓練而來的機器學習系統。 ML 系統從訓練過的數據集中“學習”,然后在操作上使用“訓練過的”系統在給定新的操作數據的情況下產生預測結果。
圖 2. 兩種類型的人工智能:顯式編程和學習系統
自動化、人工智能和機器學習系統,包括手工知識系統和學習系統,為美國國防部 (DoD) 提供了巨大的潛力,在大多數任務領域具有多種應用。這些智能系統可以擴展國防部理解復雜和不確定情況、制定和權衡選項、預測行動成功和評估后果的能力。它們提供了在戰略、規劃和戰術領域支持國防部的潛力。人工智能系統可以減輕作戰人員的負擔,但前提是這些系統的設計和實施正確,并且以減輕作戰人員認知負擔的方式。這為國防應用實施人工智能系統提出了獨特的挑戰。本文確定了四個獨特的挑戰,并描述了它們如何影響戰術作戰人員、工程設計界和國防。
第一個為國防應用實施人工智能系統的獨特挑戰是戰術戰爭呈現高度復雜的情況。戰術復雜性可能涉及信息超載、需要處理的多個并發任務、具有可怕后果的時間關鍵決策、態勢感知的未知/不準確/不完整,以及因各種分布式戰爭能力所需的互操作性而產生的工程挑戰。將人工智能系統添加到這個已經很復雜的環境中是一項必要但極具挑戰性的工作。
第二個獨特的挑戰是人工智能系統需要大量數據來訓練。所開發的人工智能系統的質量很大程度上取決于訓練數據集的質量和數量。軍事領域的數據尤其難以獲得。軍事數據可能涉及分類問題、網絡漏洞、數據驗證挑戰,并且根據艦隊演習和兵棋推演的需要,收集起來可能非常昂貴且耗時。
第三個獨特的挑戰是人工智能系統為系統工程提出了一個新的前沿。在傳統系統中,行為是固定的,因此是可預測的:給定輸入和條件,系統將產生可預測的輸出。一些人工智能解決方案可能涉及本身就很復雜的系統——適應和學習——因此會產生無法預料的輸出和行為。事實上,一些人工智能系統的目的就是為了做到這一點——與人類決策者合作,承擔一些認知負荷并產生智能建議。需要系統工程方法來設計智能系統,并確保它們對人類操作員來說是可解釋的、可信賴的和安全的。
第四個獨特的挑戰是,對于國防應用,總是需要考慮潛在的對手。在人工智能系統方面,采購界必須注意同行競爭對手國家,他們在人工智能進步方面取得了自己的進步。美國國防系統也必須在這場人工智能競賽中取得進步。網絡攻擊在防御系統中總是有可能發生的。隨著防御能力增加對自動化和人工智能系統的依賴,這可能會造成更多的網絡漏洞。最后,技術正在迅速發展,對抗性威脅空間正在發生變化。國防采購和系統工程界必須確保人工智能系統不斷發展和適應,以應對威脅環境的變化,并以可信賴和安全的方式做到這一點。
第一個獨特的挑戰是許多防御領域呈現出復雜的決策空間。因此,設計和實施適當的人工智能系統來解決這種復雜性將是極具挑戰性的。圖 3 突出顯示了導致戰術領域決策復雜性的許多因素。例如,海軍打擊部隊的行動可以迅速從和平狀態轉變為一種巨大的危險——需要對威脅保持警惕并采取適當的反應行動——所有這些都在高度壓縮的決策時間線上。戰術威脅可能來自水下、水面、空中、陸地、太空,甚至是虛擬的,因此需要處理多個時間緊迫的任務。在船舶、潛艇、飛機、陸地和太空中擁有海軍和國防資產;戰術決策空間必須解決這些分散和多樣化資源的最佳協作使用問題。制定有效的戰術行動方案也必須發生在高度動態的作戰環境中,只有部分和不確定的態勢知識。決策空間還必須考慮指揮權、交戰規則和戰術條令施加的限制。人類作為戰術決策者的角色增加了決策空間的復雜性——面臨信息過載、操作員錯誤、人工智能信任以及人工智能模糊性和可解釋性問題等挑戰。最后,戰術決策及其可能后果的風險可能非常高。
圖 3. 導致戰術決策空間復雜性的因素
解決高度復雜的決策空間是美國國防部面臨的挑戰。人工智能提供了解決這種復雜性的潛在解決方案——通過處理大量數據、處理不確定性、理解復雜情況、開發和評估決策替代方案以及了解風險水平和決策后果。人工智能解決方案可以應用于國防部的戰略、規劃和戰術層面。海軍研究生院 (NPS) 開發了一種工程框架和理論,用于解決高度復雜的問題空間,這些問題空間需要使用智能和分布式 AI 系統來獲得態勢感知并做出適應動態情況的協作行動決策(Johnson, 2019)。模擬了一個復雜的戰術場景,以演示使用 AI 來驗證該方法(Johnson,2020a)。 NPS 已經開發了一種預測分析能力的概念設計,該設計將被實施為一個自動化的實時戰爭游戲系統,該系統探索不同的可能戰術行動方案及其預測效果和紅軍反應(Johnson,2020b)。 NPS 研究已經確定了在戰術行動中描述復雜性水平的必要性,并實施自適應人機協作安排以做出戰術決策,其中自動化水平根據情境復雜性水平進行調整。正在進行的 NPS 研究正在研究這些概念工程方法在各種防御用例應用中的應用,包括防空和導彈防御、超視距打擊、船舶自衛、無人機操作和激光武器系統。
復雜的決策空間為 AI 系統嘗試和解決創造了具有挑戰性的問題。表 1 根據決策空間的復雜性比較了不同的 AI 應用領域。該表包含 10 個表征決策空間復雜性的因素:認知不確定性(對情境知識的不確定性數量)、情境動態、決策時間線(做出決策的時間量)、決策的復雜性決策過程中的人機交互、資源復雜性(數量、類型、它們之間的距離以及它們的動態程度)、是否涉及多個任務、對手(競爭對手、黑客或打算摧毀的徹底敵人)的存在,允許誤差的幅度(多少決策錯誤是可以接受的),以及決策后果的嚴重性。
表 1. 不同 AI 應用的決策復雜度比較
人工智能應用程序涉及的決策空間用于廣告(根據特定用戶的購買習慣或互聯網搜索確定將哪些廣告流式傳輸)、貸款批準(根據貸款金額和信用評分確定貸款資格)和醫療(根據診斷確定關于患者癥狀)相對簡單。存在大量訓練數據,決策過程中的計算和人為交互簡單,情況相對穩定。不良廣告的后果是微乎其微的。可以審計不良貸款批準決定。糟糕的醫學診斷可能會產生更嚴重的后果,但通常有足夠的時間在治療前尋求更多的評估和意見。為自動駕駛汽車確定最佳運輸路線和工程 AI 系統是更復雜的工作。這些應用程序是動態變化的,需要更短的時間來做出決策。運輸路線在可能路線的數量上會很復雜——這可能會導致許多可能的選擇。但是,存在運輸錯誤的空間,并且后果通常不會太嚴重。對于自動駕駛汽車來說,決策錯誤的余地非常小。此應用程序中的錯誤決定可能導致嚴重事故。
然而,軍事戰術領域在決策空間的所有領域都呈現出極端的復雜性:不確定性和有限的知識/意識、高度動態的情況、非常有限的時間線、復雜的人機交互、大量和類型的資源、多個任務、昂貴和困難- 獲取訓練數據集、極小的允許誤差范圍以及行動(或不行動)的生死攸關的后果。
第二個獨特的挑戰是 AI/ML 系統需要大量相關且高質量的數據用于訓練和開發,而這些數據在軍事領域可能很難獲得。明確編程的手工知識系統在開發過程中需要數據進行評估和驗證。 ML 系統在開發過程中對數據的依賴性更大。如圖 4 所示,ML 系統從代表操作條件和事件的數據集中“學習”。 ML系統學習的過程也稱為被訓練,開發階段使用的數據稱為訓練數據集。有幾種類型的 ML 學習或訓練——它們是有監督的、無監督的和強化的。所有三種類型的 ML 學習都需要訓練數據集。 ML 系統在部署后或運營階段繼續需要數據。圖 4 顯示,在運營期間,ML 系統或“模型”接收運營實時數據,并通過使用其“訓練過的”算法處理運營數據來確定預測或決策結果。因此,在整個系統工程和采集生命周期中,ML 系統與數據密切相關。 ML 系統從訓練數據集的學習過程中“出現”。機器學習系統是數據質量、充分性和代表性的產物。他們完全依賴于他們的訓練數據集。
圖 4. 開發和實施機器學習系統
隨著許多領域(戰爭、供應鏈、安全、物流等)的更多 AI 開發人員正在了解 AI 解決方案的潛在優勢并開始著手 AI 系統開發,DoD 開始認識到對這些數據集的需求。在某些情況下,數據存在并準備好支持 AI 系統開發。在其他情況下,數據存在但不保存和存儲。最后,在其他情況下,數據不存在,需要模擬或在艦隊演習或戰爭游戲中收集。圖 5 說明了收集、獲取和在某些情況下開發用于開發和訓練 AI 和 ML 系統的數據時需要考慮的過程。
圖 5. 人工智能和機器學習系統訓練數據集的開發
軍事領域對開發訓練數據集提出了一些獨特的挑戰——數據可能被分類,數據可能存在網絡漏洞(它可能被攻擊并被對手故意破壞),如果數據不存在,它可能需要從軍事/艦隊演習或兵棋推演中獲得。數據驗證也是一項具有挑戰性的工作。
NPS 正在為海軍的數據管理系統執行需求分析和概念設計,該系統將收集數據并向海軍內部許多正在開發 AI/ML 系統的不同組織提供數據(French 等人,2021 年)。圖 6 是海軍中央人工智能庫 (CAIL) 的上下文圖,它被設想為一個數據管理系統和流程,用于識別數據集并提供索引、驗證、審計和對 AI 可以使用的數據的安全訪問。從事海軍應用的機器學習開發人員。 CAIL 將不是一個數據存儲庫或數據庫,而是一個中央組織,使 AI/ML 開發人員能夠訪問經過驗證和保護的海軍數據——以幫助識別數據集的存在,啟用授權訪問,并幫助支持開發人員所需的數據尚不存在,需要獲得——可能通過艦隊演習或兵棋推演。
圖 6. 概念性中央人工智能庫
第三個獨特的挑戰是開發人工智能系統為系統工程提出了一個新的前沿。系統工程方法已被開發用于設計可能非常復雜但也具有確定性的傳統系統(Calvano & John,2004)。傳統系統具有可預測的行為:對于給定的輸入和條件,它們將產生可預測的輸出。圖 7 說明了對傳統 SE 方法(如 SE Vee 過程)進行更改的必要性,以便設計復雜且不確定的 AI 系統。特別是,需要新的方法來定義隨時間適應的學習系統的要求,并且系統驗證過程可能需要在操作過程中不斷發展和繼續,以確保安全和期望的行為。對于具有高風險后果的軍事系統,幾乎沒有出錯的余地,因此需要實施一個可以確保 AI 系統安全和預期操作的系統工程流程。
圖7. 人工智能:系統工程的新前沿
國際系統工程師理事會 (INCOSE) 最近的一項倡議已經開始探索需要對系統工程方法進行哪些改變才能有效地開發人工智能系統。圖 8 是作為該計劃的一部分創建的,旨在強調在 SE 過程中需要考慮的 AI 系統的五個方面。除了不確定性和不斷發展的行為之外,人工智能系統可能會出現新類型的故障模式,這些故障模式可能會突然發生,并且可能難以辨別其根本原因。穩健的設計——或確保人工智能系統能夠處理和適應未來的場景——是另一個系統工程設計考慮因素。最后,對于涉及更多人機交互的 AI 系統,必須特別注意設計系統,使其值得信賴、可解釋并最終對人類決策者有用。
圖 8. 人工智能系統工程中的挑戰
NPS 正在研究可以支持復雜、自適應和智能 AI 系統的設計和開發的系統工程方法。已經開發了一個系統工程框架和方法來設計系統解決方案的復雜自適應系統(Johnson,2019)。該方法支持系統系統的開發,通過使用人工智能,可以協作以產生所需的緊急行為。當前的一個研究項目正在研究可以在設計過程中設計到 AI 系統中的安全措施,以確保操作期間的安全(Cruz 等人,2021 年)。 NPS 正在研究一種稱為元認知的設計解決方案,作為 AI 系統識別內部錯誤的一種方法(Johnson,2021 年)。當前的另一個 NPS 論文項目正在研究如何將“信任”設計到 AI 系統中,以確保有效的人機協作安排(Hui,2021)。幾個 NPS 項目研究使用稱為協同設計的 SE 設計方法,來確定人類操作員與 AI 系統之間的相互依賴關系(Blickley 等人,2021;Sanchez,2021)。
第四個獨特的挑戰是對手在防御應用中的存在和作用。國防部必須與對手競爭以提升人工智能能力,人工智能系統必須免受網絡攻擊,人工智能系統必須適應不斷變化的威脅環境演變。圖 9 突出顯示了對手的存在給國防部正在開發的 AI 系統帶來的一系列獨特挑戰。
圖9. 敵手的挑戰
競爭對手國家之間開發人工智能能力的競賽最終是為了進入對手的決策周期,以比對手更快的速度做出決定和采取行動(Rosenberg,2010 年)。人工智能系統提供了提高決策質量和速度的潛力,因此對于獲得決策優勢至關重要。隨著國防部探索人工智能解決方案,同行競爭對手國家也在做同樣的事情。最終,實現將 AI 用于 DoD 的目標不僅僅取決于 AI 研究。它需要適當的數據收集和管理、有效的系統工程和采集方法,以及仔細考慮人類與人工智能系統的交互。國防部必須確保它能夠應對實施人工智能系統所涉及的所有挑戰,才能贏得比賽。NPS 研究計劃正在研究如何應用 AI 和博弈論來進入對手的戰術決策周期(Johnson,2020b)。該項目正在開發一個概念,用于創建戰術態勢模型、對手的位置和能力,以及預測對手對形勢的了解。然后,概念系統將進行實時“兵棋推演”,根據預測的對抗反應和二階和三階效應分析戰術決策選項。這是一個研究未來戰術戰爭可能是什么樣子的一個例子,它為藍軍和紅軍提供了增強的知識和決策輔助。為 AI 競賽準備國防部的其他 NPS 舉措包括研究新的 SE 方法和獲取實踐以開發 AI 能力、研究海軍和國防部的數據管理需求(French 等人,2021 年)以及研究 AI 系統安全風險開發確保安全 AI 能力的工程實踐(Cruz 等人,2021 年;Johnson,2021 年)。
賽博戰是國防部必須成功參與的另一場競賽,以保持領先于黑客攻擊的持續攻擊。隨著國防部實施更多的自動化,它自然會導致更多的網絡漏洞。使用本質上依賴于訓練數據和操作數據的人工智能系統,為黑客在開發階段和操作階段用損壞的數據毒害系統提供了機會。如果對手控制了一個可操作的人工智能系統,他們可能造成的傷害將取決于應用程序領域。對于支持武器控制決策的自動化,后果可能是致命的。在最近一項關于汽車網絡安全的研究中,一家汽車公司在網上發布了一個假汽車電子控制單元,在不到 3 天的時間里,進行了 25,000 次違規嘗試(Taub,2021 年)。國防部必須注意人工智能系統開發過程中出現的特定網絡漏洞。必須為每個新的人工智能系統實施仔細的網絡風險分析和網絡防御策略。 NPS 正在研究數據安全要求,以確保 ML 訓練數據集不受黑客攻擊,并且需要安全授權才能訪問(French 等人,2021 年)。 NPS 正在研究使用元認知作為 AI 系統執行自我評估的一種方法,以識別網絡入侵、篡改或任何異常行為(Johnson,2020b)。 NPS 還在研究使用 ML 來識別惡意欺騙和篡改全球定位系統 (GPS; Kennedy, 2020)。
威脅環境的演變是國防部在開發人工智能系統時的第三次對抗性競賽。由于對抗性威脅空間隨著時間的推移而不斷變化,擁有更快、更致命的武器、更多的自主權、更大的監視資產、更先進的對抗措施和更多的隱身性,這對國防部能夠預測和識別新威脅并進行應對提出了挑戰戰場上的未知數。 NPS 研究的重點是在作戰過程中不斷適應和學習的工程系統,以檢測和識別戰場中的未知未知,并通過創新的行動方案快速響應新威脅(Grooms,2019;Jones 等人,2020;Wood,2019 )。 NPS 正在研究通過研究特定區域隨時間變化的數據來識別異常變化的機器學習方法(Zhao et al., 2016)。一個例子是研究商用飛機飛行模式并根據異常飛行模式識別可疑飛機。隨著時間的推移,可以監視地面行動,以識別可能意味著軍事行動的新的和不尋常的建設項目。
人工智能系統為國防部在實現和保持知識和決策優勢方面提供了重大進展。然而,為國防應用實施人工智能系統提出了獨特的挑戰。軍事戰術領域在決策空間的所有領域都呈現出極端的復雜性:不確定性和有限的知識、高度動態的情況、非常有限的時間線、復雜的人機交互、大量和類型的資源、多個任務、昂貴且難以獲得訓練數據集、極小的允許誤差范圍以及行動(或不行動)的生死攸關的后果。 AI 系統,尤其是 ML 系統,需要有代表性、足夠、安全和經過驗證的數據集來進行開發。為國防應用收集合適的數據具有處理分類數據集和確保數據安全和免受網絡攻擊的額外挑戰;這也將是收集代表戰術行動的真實數據的一項重大努力。將需要新的系統工程方法來有效地指定、設計和評估人工智能系統,這些系統通過其不確定性、新型人機協作挑戰以及難以預測和預防的新安全故障模式而呈現出新的復雜性.最后,軍事領域中對手的存在呈現出三種形式的 AI 競賽:與對手一樣快地開發 AI 系統的競賽、保持領先于可能的網絡攻擊的競賽以及訓練能夠應對的 AI/ML 系統的競賽隨著不斷發展的對抗性威脅空間。
NPS 正在通過一系列正在進行的研究計劃來解決四個獨特的挑戰領域。 NPS 研究人員正在研究人工智能系統在海軍戰術作戰領域的實施,對軍事數據集進行需求分析和需求開發,研究開發復雜人工智能系統的系統工程方法,以及開發安全、可信賴的人工智能系統工程方法,并注意潛在對手的作用。 NPS 正在為軍官和平民學生提供人工智能研究和教育機會。 NPS 歡迎與國防部和海軍組織合作,繼續研究用于國防應用的人工智能系統,并繼續探索解決方案戰略和方法,以克服開發和實施人工智能能力的挑戰。