蜂群是戰爭的下一個進化步驟。激光武器系統(LWSs)將是在這個新的戰斗空間中競爭的一種具有成本效益的方法。無人機系統正被用于各個層面,從恐怖組織到世界超級大國,廉價的無人機系統作為采用蜂群戰的一種方式。目前,無人機群已經被用于異質配置,并在軍事演示中被展示出來(Hambling 2021)。作為反擊,國防部必須制定一個具有成本效益的對策,而LWSs具有每次射擊成本低、見效時間短的優點。
隨著通信方法、機器學習和蜂群理論的發展,無人機系統的能力也在增長。它們按重量、范圍和速度的不同組合進行分類。無人機系統執行廣泛的任務類型,包括監視、反制、誘餌、傳感器失效和有效載荷的交付。它們通常由高強度低重量的材料制成,如鋁或碳纖維增強聚合物;然而,最近也在探索使用鎂基復合材料以實現更廉價的制造(Hoeche等人,2021)。容易獲得和廉價的無人機系統使得形成蜂群成為一種具有成本效益的方式。LWS將是準備應對這種新型威脅的有效方式。
通過適當的使用,LWS將成為對廉價的蜂群攻擊的相稱和有效的反應,變得非常寶貴。擬議的每發1美元將使海軍在這些交戰中贏得經濟損耗(Smalley 2014; Perkins 2017)。然而,也有一些需要注意的障礙,如大氣效應、湍流和熱膨脹。LWS還需要能力很強的傳感器和控制系統來精確跟蹤遠距離目標,并在所需的停留時間內保持訓練好的光束。這種需求在海洋環境中被放大了,船舶的湍流和運動使問題更加復雜。戰術官做出的復雜決定是對蜂群戰和LWS使用的另一個關注。在蜂群戰環境中,交戰時間可能短至個位數分鐘。幫助決策者快速過濾大量信息的自動化決策輔助工具將是贏得這些快速小規模戰斗的關鍵所在。這篇論文探討了各種無人機威脅情況和LWS交戰策略,以確定一些關鍵因素。
無人機群可能由同質群或異質群組成。使用同質群可以簡化獲取和使用具有成本效益的蜂群,而異質群則會增加蜂群的復雜性和能力。同質蜂群的操作者可以改變攻擊的規模和隊形。異質蜂群可以利用各種角色的單位,如戰斗機、轟炸機、誘餌、干擾器和偵察兵。改變蜂群的組成可能會對整體的成功機會產生相當大的影響。
使用的LWS交戰策略會嚴重影響交戰的結果。最直接的技術是基于距離的方法,即武器系統僅根據距離來確定目標的優先次序。最短交戰 "算法提供了一個模型,它也考慮了LWS的回轉時間。如果來襲的威脅是一個異質的蜂群,LWS可以采用更復雜的策略,優先考慮蜂群的各種功能,如感知或通信。這些異質性交戰方法將要求防御者對蜂群有大量的了解,因此需要有能力很強的傳感器和數據融合系統。
本論文使用建模虛擬環境和模擬(MOVES)研究所的一個名為 "蜂群指揮官戰術"(SCT)的程序來探索和模擬蜂群戰環境。SCT被用來測試各種蜂群編隊,包括直線、楔形和波浪形楔形。此外,本論文還開發了一種采用誘餌無人機來掩護轟炸機部隊的異質蜂群編隊。對于LWS,本論文評估了一種交戰策略,使轟炸機部隊優先于任何其他部隊。
主要的發現是,最大限度地增加單位之間的角位移的蜂群編隊比緊密聚集的群體更成功。這些結果是由于每個目標之間需要增加LWS的回轉時間。裝甲誘餌方案增加了整個蜂群的存活率,因此也增加了性能。在艦艇幸存的模擬中,轟炸機能夠活得更久,在被摧毀前更接近艦艇。在艦艇被摧毀的模擬中,有更多的轟炸機幸存下來。關于LWS的交戰策略,這一轉變對結果造成了巨大的影響。在艦艇存活的模擬中,交戰時間要短得多,轟炸機被摧毀的距離也遠得多。在艦艇被摧毀的模擬中,交戰持續時間更長,轟炸機群的大部分被摧毀。這些結果強調了利用各種編隊、異質無人機群以及制定LWS交戰策略來對付它們的潛在好處。
圖1. 使用艦載LWS來防御無人機群的威脅。改編自洛克希德-馬丁公司(2020)和愛德華茲公司(2021)。
對手對美國在太空、網絡空間和電磁頻譜上的優勢的競爭的崛起要求海軍陸戰隊的指揮、控制和通信(C3)發生變化。戰術空中指揮中心(TACC)是海軍陸戰隊中最關鍵的C3節點,在海軍陸戰隊的遠征先進基地作戰(EABO)概念下,在有爭議的通信環境中,目前所采用的方式將無法生存。
海軍陸戰隊必須轉變其對通信的概念化和理解,以促進在有爭議的通信環境中的指揮和控制。爭奪電磁頻譜內外的通信途徑將需要預測在通信斷續期間做出作戰決策所需的信息。TACC應該成為一個低可觀察性、小型和移動、具有聯合互操作性的網絡化的C3節點,在對手的武器交戰區內運作。通過這些改變,TACC將成為符合海軍陸戰隊EABO概念的有彈性、有條件的前方海軍空中作戰中心(AOC),并將為海軍-海軍陸戰隊團隊和聯合部隊提供重要的C3能力。
該項目旨在利用強化學習(RL)開發防御性無人機蜂群戰術。蜂群是一種軍事戰術,許多單獨行動的單元作為一個整體進行機動,以攻擊敵人。防御性蜂群戰術是美國軍方當前感興趣的話題,因為其他國家和非國家行為者正在獲得比美國軍方更多的優勢。蜂群智能體通常簡單、便宜,而且容易實現。目前的工作已經開發了飛行(無人機)、通信和集群的方法。然而,蜂群還不具備協調攻擊敵方蜂群的能力。本文使用預先規劃的戰術模擬了兩個軍用固定翼無人機蜂群之間的戰斗。即使在數量多到100%的情況下,也有有效的戰術可以克服規模上的差異。當用于防御艦艇時,這些規劃的戰術平均允許0到0.5架無人機通過防御并擊中艦艇,這超過了阿利-伯克級驅逐艦目前的防御系統和其他研究的無人機蜂群防御系統。這項研究表明,使用某些機動和戰術有可能獲得對敵人蜂群的戰術優勢。為了開發更有效的戰術,使用RL訓練了一種 "智能體 "戰術。RL是機器學習的一個分支,它允許智能體學習環境,進行訓練,并學習哪些行動會導致成功。"智能體"戰術沒有表現出突發行為,但它確實殺死了一些敵人的無人機,并超過了其他經過研究的RL訓練的無人機蜂群戰術。繼續將RL落實到蜂群和反蜂群戰術的發展中,將有助于美國保持對敵人的軍事優勢,保護美國利益。
關鍵詞 無人機蜂群戰術 強化學習 策略優化 無人機 艦船防御 軍事蜂群
現代計算機科學家試圖解決的問題正變得越來越復雜。對于大規模的問題,人類不可能想到每一種可能的情況,為每一種情況確定所需的行動,然后為這些行動編碼讓計算機執行。如果計算機能夠編寫自己的指令,那么計算機科學的世界可以擴展得更大,以完成更困難的任務。這就是機器學習領域。最近的工作為世界帶來了各種照片分類器、計算機視覺、搜索引擎、推薦系統等等。利用機器學習,計算機甚至能夠學習和掌握蛇、國際象棋和圍棋等游戲。有了這項技術,自動駕駛汽車、智能機器人和自主機械似乎不再是不可能的了。
美國軍方一直在推動技術的發展,使其在戰術上對敵人有優勢。利用機器學習來協助美國作戰,將提高軍事能力。非傳統戰爭的最新發展催生了無人駕駛車輛和無人機等自主智能體戰術蜂群。當務之急是,美國軍方必須建立對敵方類似技術的防御措施,并開發出利用蜂群的有利方法。將機器學習方法應用于多智能體無人機群問題,可以為美國軍隊提供對抗和反擊敵人蜂群的能力。
美國軍方一直在探索最新的技術進步,以保持對敵人的競爭優勢。蜂群戰術是目前軍事研究的一個主要領域。美國和其他國家正在尋找使用無人機、船只和車輛與現有蜂群技術的新方法。例如,俄羅斯正在開發令人印象深刻的無人機蜂群能力。[Reid 2018] 伊朗已經創造了大規模的船群。[Osburn 2019] 大大小小的國家,甚至非國家行為者都在利用目前的蜂群技術來增加其軍事力量,與美國抗衡。這種對美國安全的可能威脅和獲得對其他大國優勢的機會是本研究項目的動機。如果美國不發展防御和戰術來對付敵人的蜂群,其人民、資產和國家利益就處于危險之中。這個研究項目旨在使用最先進的RL算法來開發無人機群戰術和防御性反擊戰術。研究當前的RL算法,并學習如何將其應用于現實世界的問題,是計算機科學界以及軍事界下一步的重要工作。該項目旨在將現有的RL工具與無人機群結合起來,以便找到能擊敗敵人機群的蜂群戰術和反擊戰術,改進軍事條令,保護美國國家利益。
本報告首先介紹了促使需要無人機蜂群戰術的當前事件,以及試圖解決的問題的定義。接下來的章節提供了關于無人機、軍事蜂群、強化學習以及本研究項目中使用的策略優化算法背景。還包括以前與RL有關的工作,以及它是如何與當前的無人機和蜂群技術結合使用的。下一節介紹了建立的環境/模擬。之后介紹了目前的成果。建立了兩個不同的場景,并對每個場景進行了類似的測試。第一個是蜂群對戰場景,第二個是船舶攻防場景。這兩個場景描述了實施的程序化戰術,并介紹了這些戰術的比較結果。接下來,描述了RL智能體的設計和RL訓練,并測試其有效性。在介紹完所有的結果后,分析了研究發現,并描述了這個研究項目的倫理和未來方向。
無人駕駛飛行器被廣泛用于監視和偵查。無人機可以從上面捕捉到戰斗空間的狀況。這些智能體非常小,可以快速地去一些地方而不被發現。無人機有能力收集信息并回傳給蜂群的主機或電子中心。蜂群智能體可以使用信號情報和數據收集戰術從敵人那里收集信息。
美國軍方和世界各地的軍隊正在使用蜂群作為一種進攻性威脅。無人機、船只、甚至車輛都可以在無人駕駛的情況下運作,并作為一個單元進行蜂擁,以攻擊敵人。大量使用小型和廉價的智能體可以使小型軍隊在面對美國軍隊的力量時獲得優勢。例如,小船或無人機可以匯聚到一艘船上,并造成大量的損害,如摧毀船只的雷達。作為一種進攻性技術,蜂群是強大的資產,可以作為一種進攻性戰爭的方案來使用。
作為對進攻性蜂群技術的回應,各國軍隊開始研究并使用蜂群作為防御機制,以對付來襲的蜂群和其他威脅。其他的防御性武器系統并不是為了對抗大量的小型無人機而建造的,因此,發射反蜂群可能是對最新的蜂群戰術的一種可行的防御。蜂群也可用于防御單一實體對來襲的武器系統。研究人員正在創造新的方法來建造、武裝和訓練小型無人駕駛飛行器,以便它們能夠成為美國軍隊的可靠資產。
介紹了最近在智能體群體和無人機群的強化學習方面的一些工作。
Cano Lopez等人使用當前的強化算法來訓練四旋翼無人機飛行、懸停和移動到指定地點[G. Cano Lopes 2018]。該系統使用了馬爾科夫決策過程,并實現了強化學習的演員評論法,在飛行模擬器中訓練智能體。這些強化學習方法與我們希望應用于無人機群戰術問題的方法類似。使用Coppelia機器人公司的虛擬實驗平臺(V-REP)作為模擬,訓練無人機飛行。他們的訓練策略能夠實現快速收斂。在訓練結束時,他們能夠保持飛行并移動到模擬中的不同位置。這項工作表明,強化學習是訓練無人機操作的一種有效方法。我們希望在這個項目中使用的方法可以用目前的技術來實現。我們將擴展本文的實驗,在類似的模擬中把RL算法應用于固定翼無人駕駛飛機。然而,我們不是只讓無人機飛行和移動,而是要訓練它們一起工作,并戰略性地計劃在哪里飛行和如何操作。
斯特里克蘭等人利用模擬來測試各種無人駕駛飛行器的戰術,并測試贏得戰斗的決定性因素可能是什么。他們對一個具有戰術的蜂群進行編程,并讓這個蜂群與敵人的蜂群作戰。智能體試圖使用圖8.1所示方法協調對敵方無人機的攻擊。只有當有兩架無人機對抗一架敵方無人機時,這些戰術比單槍匹馬射擊敵人更有效,而且它們與其他成對的無人機之間有足夠的空間。其次,一些特工會飛離敵人,作為保護自己的手段,從不對敵人使用任何攻擊性戰術。[Strickland 2019]
這個項目使用PPO在一個捉迷藏的游戲中使用強化學習來訓練多個智能體。兩個紅色智能體是一個團隊,被指定為尋找者,兩個藍色智能體是一個團隊,被指定為隱藏者。如圖8.2所示,這些智能體在一個有幾面墻和一些積木的開放環境中游戲。智能體可以跑來跑去,對可移動的積木施加壓力。紅隊在看到藍隊時得到獎勵,藍隊在未被隱藏時得到獎勵。兩個智能體都是用自我發揮和策略優化算法進行訓練的。兩隊進行了數百萬次的訓練迭代競爭,并制定了戰術和技術來對付對方的行動。起初,兩個團隊都是漫無目的地跑來跑去,但他們最終發展出一些智能行為來幫助他們獲得獎勵。藍隊學會了如何堵住門,為自己創造庇護所,并從紅隊那里藏起其他物體。紅隊追趕藍隊特工,利用斜坡潛入他們的庇護所,跳到積木上面看墻。這些特工制定的一些戰術甚至比人類程序員指示他們做的更有創意。最重要的是,這些智能體教會了自己如何合作,并為每個智能體分配一個特定的角色,以完成團隊目標。這項研究的結果顯示了強化學習和自我發揮的學習方法的力量。兩個智能體都能發展出智能行為,因為它們之間存在競爭。我們將使用這個項目的框架來解決我們的無人機蜂群戰術問題。將捉迷藏游戲擴展到無人機群戰,將提高強化學習的能力。自我游戲技術在本項目未來工作的RL蜂群對戰部分有特色,該部分詳見第13.3節。[Baker 2018]
在這項研究中,研究人員利用計算機編程和強化學習模擬并測試了無人機群戰術。該小組創建了一個可能的蜂群戰術清單,包括一個簡單的射手,一個將敵人引向隊友的回避者,以及一個將敵人的蜂群分成子蜂群的牧羊人。研究人員隨后創建了一個模擬器來測試這些戰斗戰術。他們收集了關于哪些戰術最有效的數據,甚至在現實生活中的固定翼無人機上測試了這些算法。我們將在研究的第一階段實施其中的一些戰術,并擴大目前可編程蜂群戰術的理論。
這篇研究論文的第二個方面是實施強化學習方法,使智能體能夠制定自己的蜂群戰術。盟軍無人機在殺死敵方無人機時獲得正獎勵,被敵方殺死時獲得負獎勵。敵方蜂群是用研究第一階段的成功單人射手預先編程的。這個項目的目標是讓智能體制定對抗敵方蜂群的戰術。然而,盟軍的無人機學會了應該逃跑,干脆飛離敵人,以避免被殺死的負面獎勵。因為敵人太有效了,盟軍無人機無法獲得足夠的正向獎勵來學習如何攻擊敵人的蜂群。我們將使用強化學習以類似的方式來訓練智能體,然而我們希望獲得更多的結論性結果。為了防止盟軍無人機逃離敵人,我們將對攻擊和殺死敵人的智能體給予比死亡風險更多的獎勵。我們還可以對智能體進行編程,使其保衛像船只或基地這樣的資產。這個研究項目為我們所做的研究提供了一個良好的基礎。[Strickland, Day, et al. 2018]。
該研究項目是近期強化學習和無人機群工作的延續。計算機科學領域一直在開發最先進的強化學習算法,如PPO和SAC,該項目旨在應用于當前的無人機群戰術的軍事問題。
MIDN 1/C Abramoff(2019級)研究了無人機蜂群戰術,并在Python中模擬了微型蜂群對蜂群戰斗。他創建了一個二維空間,用一個點代表蜂群中的每個特工。每個智能體可以向前射擊(在它移動和面對的方向)。被另一個智能體的 "子彈 "擊中的智能體被假定為死亡,并從模擬中刪除。阿布拉莫夫創建了蜂群,并編寫了一個蜂群算法,以便特工能夠作為一個整體蜂擁飛行,而不會發生碰撞、分離或破壞蜂群。一旦智能體真實地成群,阿布拉莫夫探索了各種無人機群戰術,如選擇-最近和分配-最近,并測試了它們對敵人群的有效性。選擇-最近 "允許每個特工瞄準離自己最近的敵人。當蜂群向對方移動時,智能體將根據每個時間點上哪個敵人的無人機最近而改變其目標。分配最近的任務給每個智能體一個任務,以消除一個不同的敵方無人機。任務是根據哪個敵方無人機離友軍蜂群最近來決定的,并在每一幀重新更新。阿布拉莫夫對兩個蜂群的模擬戰斗進行了實驗,以測試哪種蜂群戰術最有效。他還嘗試使用反蜂群戰術進行戰斗,如在蜂群前面派出一個 "兔子 "特工,并分成子蜂群。總之,阿布拉莫夫發現,在他的實驗中,"最近分配 "是最有效的,一些反蜂群戰術也很成功。這些結果不是結論性的,但顯示了在發展蜂群和反蜂群軍事戰術方面的進展。本研究提案將在MIDN 1/C Abramoff的工作基礎上進行擴展,創建一個3-D環境模擬,并改進智能體能力,以代表一個現實的無人機群戰。這個研究提案的環境將有一個更大的戰斗空間,智能體可以采取更多的行動,包括改變高度、武器瞄準和蜂群間的通信/團隊合作。
MIDN 1/C湯普森(2020級)建立了一個三維環境,他用來模擬更多戰術。這個環境比MIDN 1/C阿布拉莫夫使用的更真實地模擬了現實世界的戰斗空間。蜂群要在三維空間中自由移動,并根據現實世界的物理學原理采取相應的行動,即重力和高度以及飛機上可行的轉彎率。圖8.3顯示了湯普森的Python環境模擬。左上角的無人機群被染成藍色,代表盟軍的無人機群。右下角的無人機群為紅色,代表敵人的無人機群。盡管在二維顯示中,每架無人機周圍的圓圈代表高度。在圖8.3中,更大的圓圈顯示了更高的高度,這意味著敵人的蜂群比盟軍的蜂群要高。MIDN 1/C湯普森固定了環境的三維方面,并將無人機融入該空間。他還研究了每架無人機的轉彎率,以確保模擬符合現實生活中的無人機規格。
模擬開始時有兩個由任何數量的無人機組成的蜂群。每隊的無人機都被初始化在比賽場地各自一側的隨機位置上。模擬開始時,兩隊都起飛了。每隊都執行給定的戰術,可以是預先編程的,也可以是智能體學習的。如果進行了多輪比賽,每隊的勝負和平局都會被計算在內。
模擬開始時有兩個任意數量的無人機群。防御隊被初始化在放置在比賽場地中心的飛船中心。這艘船是靜止的,不會還擊,但它會計算它所收到的無人機的數量。進攻隊被初始化在比賽場地的一個隨機位置,該位置距離飛船中心至少有200米。模擬開始時,兩隊都要起飛。每隊都執行給定的戰術,可以是預先編程的,也可以是智能體學習的。如果進行多輪比賽,每隊都要計算無人機擊中飛船的總次數和剩余的防御性無人機數量。
近年來,各國軍隊加強了整合無人駕駛技術的努力,以提高有人-無人駕駛編隊(MUM-T)的能力。由于一些國家的戰斗年齡人口正在減少,軍隊正在轉向容易獲得的、具有成本效益的和復雜的無人駕駛技術。MUM-T擁有巨大的潛力,不僅可以緩解軍隊的人力短缺,還可以提高作戰能力。這篇論文研究了MUM-T在前線的有效性,直至步兵小組支持城市地形的進攻行動。一個基于智能體的模擬被用來模擬有無無人駕駛地面車輛(UGV)支持一個步兵連的MUM-T作戰行動。對超過76,800次的模擬戰斗進行了分析。據觀察,MUM-T概念可以極大地提高戰斗力,通過增加敵人的傷亡來評估。還觀察到UGV的重裝時間、武器精度和自身的力量結構對步兵的殺傷力和生存能力有很大影響。這項分析的結論是,在小單位戰術層面實施MUM-T對提高整體作戰性能有很大潛力。未來,作戰模型可以被整合到未來的軍事演習中,這樣就可以對模擬的結果進行驗證和確認。
隨著復雜技術和創新的使用,戰爭正在日益演變。在全球人力短缺的推動下,各國正在轉向無人駕駛技術以緩解這種短缺并提供作戰能力。因此,通過采用載人-無人小組(MUM-T),利用無人技術來支持前線步兵的潛力很大。
本論文旨在探索MUM-T在進攻性城市場景中的有效性。論文討論、分析和研究了在城市環境中連級無人駕駛地面車輛(UGV)的戰術運用效果。指導這項研究的研究問題包括以下幾個方面:
主要問題:
1.有UGV或UGV支持的步兵小隊的致命性和生存能力如何?
2.在模擬場景中,MUM-T部隊的不同部隊結構的戰斗結果和分析是什么?
次要問題:
本論文使用基于智能體的模擬環境 "地圖感知非統一自動機"(MANA),通過建立一個模擬并對UGV的作戰方案進行分析,再加上影響城市地形中進攻性步兵部隊作戰效率的因素,來研究MUM-T。
該作戰模型包括兩組主要的作戰部隊,以美國陸軍的步兵作戰順序(ORBAT)為模型: (1)由裝備有UGV的友軍步兵連組成的藍方部隊;(2)由作為防御方的對手步兵排組成的紅方部隊。圖1顯示了模擬作戰行動的一個迭代的開始狀態。
圖1. MANA的一個模擬復制的初始狀態的截圖。
共創建了三個不同的實驗設計(DOE),以研究MUM-T能力和概念的關鍵戰斗特征和效果。衡量性能的重點是任務的有效性,重點是確定與殺傷力和生存能力相關的因素。作者對每個DOE采取了迭代的方法,將前一個DOE的一些發現和分析納入下一個DOE。第一個DOE著重于與基線步兵ORBAT相比,最初引入MUM-T的效果。第二個DOE重點關注不同的人力和部隊結構,以研究支持MUM-T的部隊規模的影響。最后一個DOE結合了前兩個DOE的各個方面,并創建了一個近乎正交和平衡的混合設計,以實現一個更全面和結論性的實驗來結束這篇論文。近80,000次模擬戰役,每次涵蓋超過8小時的戰斗,被運行和分析。
在作出魚雷裝載決定時,規劃者必須考慮不同反潛戰(ASW)單位的能力和實力、有限的預算和不同的對手潛艇艦隊。目前,Mk-54輕型魚雷的裝填決定是人工做出的,而且沒有一個系統的方法來處理威脅的不確定性。這項研究試圖通過使用隨機優化來確定美國水面艦艇、固定翼飛機和直升機上裝載魚雷的類型和數量,從而為這些決策提供參考,以面對不確定的潛艇威脅,達到預期的殺傷概率。開發了兩種魚雷分配隨機優化模型(TASOM)的配方: TASOM-1,最小化錯過的潛艇數量;TASOM-2,最小化殺傷概率閾值以下的偏差。為了顯示隨機編程方法比典型的確定性規劃的價值,提出了一個概念性案例,旨在代表一個行動,即反潛部隊在一個區域內巡邏對手的潛艇。隨機生成100個威脅場景,其中部署在該地區的潛艇的數量和級別各不相同。TASOM-2的裝載量明顯優于確定性的平均裝載量。所提出的模型與可訪問的用戶界面相結合,為規劃者提供了一個決策輔助工具,以進行敏感性分析,指導不確定情況下的魚雷分配和預算決策。
反潛戰(ASW)被定義為 "為了不讓敵人有效使用潛艇而進行的行動"(參謀長聯席會議2021年,第IV-10頁)。這些行動包括定位、跟蹤和消滅敵人的潛艇。這項研究的重點是最后一項任務。隨著對手繼續現代化和增長他們的潛艇艦隊,尋求以最佳方式為美國海軍的反潛平臺配備能夠有效瞄準這些潛艇的武器。
ASW主要由海上巡邏機、水面作戰艦艇及其搭載的直升機和潛艇執行。通信限制和水域管理要求通常使潛艇無法與其他類型的平臺協同作戰。假設友好的潛艇將在不與水面和空中資產重疊的區域進行反潛作戰。本報告將不進一步討論潛艇行動。
巡洋艦和驅逐艦都可以從其水面艦艇魚雷發射管(SVTT)和垂直發射反潛火箭(ASROC)系統中發射輕型魚雷。
P-8 "海神 "是一種多任務海上巡邏機。在進行反潛作戰時,它可以配備輕型魚雷,用來對付對手的潛艇。與水面平臺相比,P-8在搜索潛艇時可以覆蓋更大的區域,并且可以在沒有敵人魚雷的威脅下進行交戰。一個P-8中隊由六或七架飛機組成,一個分隊由四或五架飛機組成。中隊和分隊可以在世界各地的美國、盟國和合作伙伴的空軍基地進行部署和行動。
MH-60R海鷹直升機與P-8一樣具有水面平臺的優勢,但可以攜帶較少的魚雷,作戰范圍也短得多。MH-60R分隊可以搭載在Flight IIA阿利-伯克導彈驅逐艦、提康德羅加導彈巡洋艦、獨立和自由級瀕海戰斗艦以及航空母艦上。驅逐艦、巡洋艦和瀕海戰斗艦最多可以搭載兩架MH-60R。
美國海軍必須準備好面對一個非常多樣化的威脅。根據Janes(Janes 2021a)的說法,俄羅斯海軍有27種。
俄羅斯等潛艇艦隊組成的分歧給國防規劃帶來了復雜的挑戰。
Mk-54輕型魚雷可從水面艦艇上的SVTT和ASROC系統發射。在進行反潛作戰時,它也可以被裝載到MH-60R和P-8上。考慮分配由0型、1型和2型變體組成的魚雷庫存。
在這項研究中開發的模型是具有追索性的兩階段隨機模型。具體來說,在第一階段(武器分配)將魚雷分配給反艦導彈部隊,在第二階段(武器目標分配,WTA)將魚雷分配給潛艇。武器分配決定往往是在不完全了解威脅的情況下做出的,這就促使了隨機優化和模擬。
自從Manne(1958)提出WTA問題以來,在武器分配和WTA方面已經做了大量工作。佩奇(1991)開發了一個混合整數編程模型,以獲得火炮系統和彈藥的最佳組合。Jarek(1994)利用模擬得到空戰所需的艦載防空導彈的數量。Tutton(2003)開發了一個使用隨機優化的傳感器分配模型,在不確定的敵方作戰順序下將搜索包分配給目標。Avital(2004)開發了一個兩期的隨機供應鏈模型,以確定在不確定的目標需求下,應該采購多少反艦巡航導彈以及如何分配這些導彈。Uryasev和Pardalos(2004)表明,與隨機對應的決定性武器分配決策相比,缺乏穩健性。Buss和Ahner(2006)開發了一個戰斗模擬,稱為DFAS,用于評估軍隊的未來戰斗系統(Havens 2002)。DFAS是一個離散事件模擬,代表實體運動、探測和武器效果事件。它還包括定期優化,以修訂WTAs。Hattaway(2008)通過考慮雷達和電子傳感器以及海軍軍械,將DFAS調整為海戰應用。Laird(2016)考慮了混合武器,以分配對抗來自空中、地面和地下的蜂群威脅。Cai(2018)使用基于代理的時間階梯式模擬,為城市環境中的進攻行動找到精確和區域火炮彈藥的有效組合。Brown和Kline(2021年)考慮了任務覆蓋范圍而不是目標交戰,以確定VLS艦的最佳武器裝載。不同類型的導彈,每一種都用于不同的任務(打擊、防空或反潛戰),可以被容納在VLS單元中。Adamah等人(2021)建立了一個非線性優化模型,用于確定分配給進行反潛作戰的潛艇的Mk-48重量級魚雷的類型和數量。Templin(2021)考慮了以啟發式方法解決的WTA問題的衍生物,其簡化的假設是只有一個目標要參與。研究的重點是為發射政策提供信息,特別是對威脅使用的導彈的數量和類型。
在上述文獻中的武器分配模型中,與本研究有關的是,注意到Page(1991)和Avital(2004)都使用了指揮官指定的期望成功的閾值;然而,他們在模型中著重于最小化武器成本,并將目標視為總需求。Jarek(1994)和Cai(2018)的模擬為所需的總導彈或彈藥組成提供了一般建議,但沒有提供可作為可操作的裝載計劃的閉合式解決方案。Tutton(2003)的模型將傳感器分配給單位,這與魚雷分配不同,傳感器不在目標上消耗(使用后)。Brown和Kline(2021)考慮的是任務覆蓋范圍,而不是目標,這對問題來說不是一個合適的方法,因為魚雷的使用只是為了與對手的潛艇交戰(或反擊對手的潛艇魚雷)。只有Adamah等人(2021年)涉及魚雷作為武器類型;然而,他們的模型是非線性的,也沒有推薦一個考慮到多個目標的魚雷裝載計劃。
另外,除了DAFS,上面審查的WTA模型只考慮一個射手。雖然希望對不確定的威脅進行計劃,在一個場景中出現不同類型和數量的目標,但Uryasey和Paradalos(2004)對一個場景進行計劃,但對武器的殺傷概率不確定。和其他的模擬工作一樣,DAFS(Havens 2002;Buss和Ahner 2006;Hattaway 2008)并沒有提供一個關于武器應該如何分配給目標或分配給單位的閉合式解決方案。Laird(2016)和Templin(2021)都是為給定的威脅做計劃,并沒有考慮到威脅情況下的任何不確定性。
盡管在武器分配和指派模型方面有大量的文獻,但注意到大多數模型沒有使用隨機優化。此外,目前,魚雷的裝載決定是由人工做出的。這項研究的目標是利用正式的數學優化來幫助魚雷分配決策。具體來說,隨機優化將使決策者能夠對不確定的威脅進行規劃。對威脅構成的不確定性進行規劃是現實的,因為通常情況下,必須在發現敵方潛艇或甚至部署反潛部隊之前作出裝載決定。
同級和近級A2AD系統帶來的威脅影響到戰爭的每個領域。A2AD綜合防空系統(IADS)的預警和制導雷達提醒部隊注意任何即將接近的敵對飛機。小型無人駕駛航空系統(SUAS)蜂群、人工智能(AI)的進步,以及大型遙控飛機(RPA)功能的增加,提供了一種手段,通過欺騙雷達和呈現不明確的威脅畫面來影響敵人的目標定位周期,理論上這將延遲武器的使用,同時為美國(US)和盟友提供目標定位數據。美軍應該能夠利用SUAS和更大的RPA蜂群,或不對稱RPA蜂群(ARS)來呈現和監視敵方的IADS雷達,目的是推遲IADS對友軍的交戰,或使敵方的IADS與價值較低的目標交戰,使雷達和運輸機架設發射器(TEL)都暴露出來,以便于消滅。
同級和近級對手已經建立了極其復雜的反介入和區域拒止(A2AD)系統,試圖限制行為者在其聲稱的主權領土附近實現戰略和戰術優勢。蜂群中的SUAS和RPA提供了一個機會,通過提供能夠模仿其他飛機并改變其配置的誤導性雷達信號來混淆敵人的目標定位周期,從而為其IADS帶來目標定位困境。當代有一些工作在創造模仿特定飛機雷達截面(RCS)的自主目標定位無人機,然而它們模仿的系統已經被取代。更小的、更便宜的、有能力創造多種雷達特征的飛機可以在報告了預警雷達范圍內的特定類型的飛機后產生懷疑,只是該特征的特點發生了巨大的變化。敵人將被迫花費時間和精力來調查潛在的威脅,而不是能夠對他們的第一個跡象作出反應。每個蜂群將試圖模仿另一個RCS,探測并報告針對機群的雷達能量,然后改變編隊或飛行特征以混淆敵人的目標。目前的系統需要人工智能的增強,以便在有爭議的電磁(EM)環境中,在沒有操作員的任何輸入的情況下做出適當的反應。ARS人工智能應該能夠改變配置,以呈現多種類型的RCS,并決定采取何種(如果有的話)機動措施來應對雷達和動能火力。
不對稱的RPA蜂群將為敵方IADS的使用提供大量的資源和決策周期消耗。ARS將在蜂群中進行協調,模仿更大、更具威脅性的飛機的雷達特征,試圖引起采集和瞄準雷達系統的反應。ARS將探測并向雷達采集范圍以外的目標小組報告雷達地點和活動,以使其失效。如果對手向ARS開火,蜂群將有如何反應的選擇,如承受打擊、試圖躲避或重新配置其隊形。在未來與同行或近鄰的沖突中,擁有靈活的選擇來降低敵人的行動決策周期,即使是短暫的,也將證明成功與失敗之間的區別。
在購置海軍平臺的資本有限的限制下,需要應對海上挑戰。像波浪滑翔機這樣的無人平臺可能有助于解決這個問題。波浪滑翔機是一種無人水下航行器,它可以配備一個被動陣列,并可以在感興趣的區域(AOI)保持長時間的部署。它們能夠提供分層防御,防止對手在不被發現的情況下穿越該區域,從而提供低成本、持久性的反潛戰(ASW)解決方案。在2016年由英國皇家海軍領導的 "無人勇士 "演習中,展示了反潛波浪滑翔機成功追蹤一艘載人潛艇的能力。然而,如何部署一定數量的波浪滑翔機來探測一艘過境的對手潛艇的問題仍然相對沒有被探索。本論文旨在開發一個模型,以確定部署的波浪滑翔機的探測能力,該模型考慮了與探測水下接觸有關的變量,在具有聲學挑戰性的水下環境中使用被動聲納,并在部署無人資產方面受到限制。該模型規定了實現特定探測概率所需的波浪滑翔機的最佳數量,并為其在AOI中的位置提供了參考,以盡量減少對手潛艇穿越該區域而不被發現的概率。
為了利用無人系統提供的無數優勢,近年來,它們在軍事行動中的地位越來越突出。無人系統,在這里是指無人水下航行器(UUV),被用于各種任務,如海洋學、反地雷、情報、監視和偵察(ISR),僅舉幾例。最近,UUV在反潛戰(ASW)領域的使用也有所發展。本論文探討了在反潛戰中使用 "波浪滑翔機"--一種配備了被動陣列的UUV。該方案圍繞著反潛波浪滑翔機在AUO中的最佳位置發展,以最大限度地提高探測到穿越該地區的敵方潛艇的概率。開發了一個模型來計算具有特定估計聲納范圍(ESR)的特定數量的波浪滑翔機所累積的探測概率。
為了開發這個模型,使用被動聲納方程闡明了裝有被動聲納的波浪滑翔機的水下探測特性。諸如設備、目標和環境特征等方面的因素被考慮到方程中。還考慮了影響聲音在水下傳播的各種因素,如傳輸損耗和水下噪聲的存在,它阻礙了從目標接收的整體聲音。被動聲納方程和其中涉及的參數被用來計算聲納的性能,稱為優點數字(FOM)和信號過剩(SE),它告訴我們目標發出的信號是否會被波浪滑翔機上的傳感器檢測到(Urick,1967)。此后,Poisson掃描模型(Washburn,2014年),它將探測模擬成一個Poisson過程,被用來制定探測的累積概率的表達。該表達式為橫向范圍函數鋪平了道路,該函數描述了在給定的環境條件下,波浪滑翔機在特定范圍內探測目標的能力。
為了最大限度地提高總體探測概率,探索了將波浪滑翔機置于不同的編隊中--即AOO中的障礙物、扇形、圓形和多障礙物。實驗是通過模擬潛艇穿越該地區周邊的隨機點來進行的。然后改變不同編隊中的ESR和波浪滑翔機的數量,以深入了解特定情況下的最佳位置。通過改變關鍵參數,如目標速度、泊松過程的檢測率和模擬中的FOM,也進行了敏感性分析,以分析它們對總體檢測概率的影響。模擬結果表明,將波浪滑翔機放置在AOO的障礙物陣中,可以最大限度地探測到穿越該區域的海底接觸物的概率。盡管屏障編隊總是比多屏障編隊提供更高的探測概率,但它可以作為一種戰術選擇,使潛艇在較長的時間內處于防御狀態,因為潛艇必須穿越穿插在一起的波浪滑翔機層。探測的概率隨著ESR探測率的增加而增加,而保持所有其他因素不變,則隨著目標速度的增加而減少。
在過去的十年中,空軍和空中機動性司令部(AMC)進行了大量的研究、活動計劃、愿景和范圍文件、作戰概念和路線圖,指出需要改進機動性空軍(MAF)的態勢感知(SA)能力和全球安全指揮與控制(C2)通信。最近,聯合作戰部門正在開發聯合全域指揮和控制,而空軍已經發布了描述敏捷戰斗力(ACE)和相關任務類型指令(MTO)的條令。空軍和聯合作戰部門都在努力解決的基本問題是任務保證。這項研究采用了AMC全球安全指揮與控制-空對地通信能力評估中的機載信息交換要求(IER)綜合清單,并試圖在任務保障方面對其進行描述和優先排序。一個IER框架被提出來,以幫助告知通信差距,并描述在MTO執行期間需要什么類型的決定。任務規劃人員可以根據預期的環境,根據潛在的通信退化情況,建立分支和序列來執行指揮官的意圖。這特別有助于根據飛機指揮官可能需要執行的決定類型進行風險指導。SA數據 "類別中的通信要求是最關鍵的,因為MAF飛機必須與其他飛機協同執行ACE行動。因此,任務保證,如任務基本功能的執行,與SA信息交流最密切相關。
未來的戰場是一個將受到近鄰對手快速變化的技術能力嚴重影響的戰場。在這種環境下的成功將需要簡單易用的系統,它能適應各種情況,并能與其他部隊和系統整合。多域作戰指揮、控制、計算機、通信、作戰系統和情報(MDOC5i)旨在為海軍陸戰隊準備未來的戰場。由于傳統的機器學習技術存在某些缺點,MDOC5i使用矢量關系數據建模(VRDM),為海軍陸戰隊提供適合動態部署的系統。MDOC5i使用全球信息網絡架構(GINA)作為其VRDM平臺。這項研究使用GINA創建了一個無處不在的決策模型,可以根據美國海軍陸戰隊的場景進行配置。該研究實現了無處不在的模型,并通過一個網絡分析用例證明了其功能。這個決策模型將作為所有GINA實施的基礎模型。快速構建和調整基于場景的GINA模型并將這些模型整合到一個共同的框架中的能力將為海軍陸戰隊提供對抗未來對手的信息優勢。
圖. 超圖描繪了構成 GINA 決策模型的關鍵實體。這是圖 3.2 中描述的“決策者信息”部分的細分。影響力的三個主要領域是現實世界、網絡和網絡。本論文中的模型將僅包含網絡類別的一部分,特別是 XMPP 流量。這三個領域應被視為為大規模網絡診斷設計的決策模型的起點。
在最近的沖突中,美國能夠承擔對其敵人的技術優勢[1]。然而,由于美國已經將重點從反叛亂(COIN)行動轉移到與近距離對手的沖突上,這是一種不能再假設的奢侈。美國和國防部必須不斷尋求獲得并保持對近距離對手的技術優勢。所有軍種的指揮官都強調了這一點,包括司令部的規劃指南[2]。網絡戰場是一個日益復雜和快速發展的領域,在戰爭中從來沒有出現過像現在這樣的能力。目前的對手既有掌握該空間的愿望,也有掌握該空間的能力[1]。人機交互(HCI)將是在未來沖突中實現信息主導的關鍵。人機交互融合了計算機科學、認知科學和人因工程,以 "專注于技術的設計,特別是用戶和計算機之間的互動"[3]。我們必須掌握人機交互,以協助指揮官并保持對敵人的優勢
美國海軍陸戰隊(USMC)沒有很好的裝備來在網絡領域取得成功。美國海軍陸戰隊訓練和教育司令部(TECOM)已經將這一能力差距確定為一個主要的問題聲明:"海軍陸戰隊沒有接受過應對同行威脅的訓練,在這種情況下,我們不再享有數量或技術優勢的歷史優勢。為了在未來的戰場上取勝,我們必須提供一個學習框架,以發展適應性和決定性的海軍陸戰隊,并提供訓練環境,以產生能夠產生決定性效果的互操作單位"[4]。
信息技術的進步產生了一個以網絡為中心的應用框架[5],可以幫助縮小能力差距,使美國海軍陸戰隊保持對對手的網絡優勢。
在為滿足指揮官的指導并使美國海軍陸戰隊為網絡戰場做好準備而采取的舉措中,海軍陸戰隊已經建立了多域作戰指揮、控制、計算機、通信、作戰系統和情報(MDOC5i)。MDOC5i是一個基于陸軍網絡信息管理環境(ANIME)的系統,提供了一個以網絡為中心的因果動態數字孿生環境。利用基于實體的模擬,MDOC5i提供以網絡為中心的互操作性和決策模型,可以增強多域作戰(MDO)[6]。MDOC5i計劃 "提供基層開發的技術,使操作人員能夠'推斷和適應'不斷變化的戰斗空間的需求" [7]。MDOC5i確定了需要改進的三個問題領域:互操作性、信息處理和利用,以及文化轉變[7]。
隨著戰場的不斷發展,聯合解決方案將是獲得優勢的關鍵。這些互操作性的解決方案將依賴于網絡和通信能力。互操作性是指與整個服務的各種通信系統相關的所有設備之間的通信能力。因此,目前在互操作性方面的差距需要被彌補,以進行聯合行動。系統之間的互操作性還沒有通過一個標準化的通用方法來實現[7]。MDOC5i認為這個問題的根源在于,當前系統所使用的所有網絡都被認為是彼此獨立的領域,而不是一個統一的作戰指揮和控制(C2)系統[7]。
MDOC5i解決的下一個問題是信息處理和利用。這個問題指的是目前整個海軍陸戰隊沒有能力處理大量的信息。數據通常很豐富,而且隨著傳感器能力的增長,數據會越來越豐富,但很難分析所有的數據并從噪音中分出有用的數據。鋪天蓋地的數據如果不進行適當的分析,對決策過程是無用的,甚至是有害的。這個問題被具體描述為:"當前行動和數據收集的速度超過了我們處理、識別和獲取可操作情報的能力,以快速評估、調整和修改計劃和實時COA,從而優化部隊投射、殺傷力,并實現持久的超額配給"[7]。
為了提高處理越來越多的數據和跟上快速發展的戰場的能力,作戰人員需要關注人機互動。這種關系對于能夠在可操作的時間范圍內將大量的數據轉化為有用的信息,從而做出更好的決定至關重要。更好的人機交互可以幫助確保 "數據處理和決策的速度與行動的速度相稱" [7]。
解決的最后一個問題,即文化轉變,涉及美國防部需要調整其在數據整合和聯合行動方面的重點。雖然國防部致力于為作戰人員提供可操作的情報,但其方法是無效的和低效的[7]。此外,各個軍種制定了自己的就業方法和情報方式,這往往會導致聯合行動的無效性。為了在目前存在的動態戰場上作戰,各軍種必須共同努力,"使能力與任務、標準操作程序、訓練戰術和協議、采購和部署政策以及作戰部隊的整體文化相一致" [7]。
5月9日至5月13日,MDOC5i在海軍陸戰隊空地作戰中心(MCAGCC)二十九棕櫚島與第七海軍陸戰隊進行了演示。這次初步測試的目的是展示MDOC5i所帶來的增強的火力能力,并確定MDOC5i通過提供共同情報圖像(CIP)--共同作戰圖像(COP)和決策支持來增強整個海軍陸戰隊空地特遣部隊(MAGTF)的MDO的可行性。
在MCAGCC Twenty-Nine Palms進行的MDOC5i演習成功地描述了該系統的防火能力。MDOC5i系統使用最先進的掃描機制和瞄準系統,將標準裝備的區域射擊武器轉變為精確射擊武器平臺,能夠在幾乎沒有歸零的情況下有效地攻擊目標。雖然這本身就大大增加了海軍陸戰隊的殺傷力,但增強的火力能力僅僅是MDOC5i概念所提供的效用的開始。底層系統使用全球信息網絡架構(GINA),一個矢量關系數據建模(VRDM)平臺,以使所有通過網絡連接的單位都能獲得準確的COP和CIP。這在戰場上提供了一個優勢,因為所有單位都獲得了意識,并將能夠為共享系統提供輸入,從而產生最準確的CIP-COP。
這些投入可以用來幫助決策和影響有利于沖突空間競爭的活動。
這一過程的關鍵使能部分之一是GINA內的決策模型,它能使人采取行動。在二十九棵樹的演示中,海軍陸戰隊員被展示了使用標準武器系統對選定目標進行第一輪射擊的能力。選定的目標出現在通過網絡連接的所有信息顯示器上。為了實現目標定位,GINA模型接受目標的輸入并將信息傳遞給所有用戶。系統首先決定該目標是一個有效的目標還是一個重復的目標。它通過一個專門設計的決策模型來實現這一目標,該模型將確定的目標與其他繪圖的目標進行比較。如果新的目標在指定的距離內,程序會認為它是重復的。這可以防止信息過載,使指揮官對現有的威脅有最準確的描述,以便更好地決定如何使用武器系統來對付敵人的目標。因此,在這個特定的例子中,輸入的是確定的目標位置,決定的是該目標是合法的還是重復的,決定的標準是確定與其他已經繪制的目標的距離,結果是對威脅的準確描述,使海軍陸戰隊能夠最好地與敵人作戰。
在演示中,決策與識別目標有關,而影響的行動與射擊有關。然而,如前所述,增強射擊能力只是MDOC5i通過基于VRDM的GINA平臺所能提供的好處的開始。創建和采用為指揮官提供最新的CIP-COP并幫助決策的模型將對海軍陸戰隊和國防部(DOD)的所有方面都有用。按照目前的情況,每次實施新的模型時,都需要從頭開始創建新的決策模型。
海軍研究生院(NPS)論文的目的是在GINA平臺上使用VRDM建立一個不可知的決策模型。重點是該模型的普遍性,以便它可以很容易地被塑造為未來的情景。該決策模型擴展了無處不在的數據表概念,以包含關于數據的信息屬性,并允許通過基于屬性的真值表關系實現來自數據屬性和信息屬性(邏輯類型)的知識屬性。因此,模型將數據轉化為信息,然后從已知的真值(既定協議)中獲取狀態和規定過程的知識,然后模型執行相應的過程。這表明了該方法的普遍性,并使任何數據任務的數據轉化為行動。本論文驗證了使用基于模型的配置方法,該方法由數據、真值表和狀態的概念對象組成,可用于人在/在環的自動數據決定-行動,并可在知識管理圖框架內為任何任務進行管理。
建議的模型在通過分析可擴展消息和存在協議(XMPP)消息來確定網絡健康狀況的情況下進行測試。該模型的輸入是可擴展標記語言(XML)消息,旨在復制大規模戰術網絡的數據包捕獲(PCAP)中捕獲的XMPP消息。雖然網絡診斷分類本身很重要,并證明了功能,但主要的效用將在于決策模型的普遍性。因為該模型是不可知的,它可以很容易地被修改以適應一系列所需的場景。務實地說,它可以作為所有其他GINA實施的基礎模型,使海軍陸戰隊實現信息超配。
本論文的假設是,GINA將被證明是一個高效的平臺,在這個平臺上實現一個可以輕松配置的泛在決策模型,以應對多種情況。在這個假設的核心,主要目標是利用GINA架構成功地設計和實現一個無所不在的決策模型。這項任務已經完成,證明了主要假說的正確性。
本論文的問題包括。
1.無處不在的決策模型能否在GINA的界面中實現?
2.GINA是否為機器學習(ML)提供了一個可行的、可操作的替代方案,該模型是否達到了與傳統機器學習技術相同的效果?
3.該模型是否有切實的方面證明比傳統機器學習技術優越?
4.該模型和GINA平臺能否用于大規模網絡流量分析?
與假設一致,第一個問題是最重要的,并且被證明是正確的。所實施的決策模型應該能夠促進并推動未來的工作。其余的問題涉及模型的可擴展性和與傳統技術相比的性能。雖然這兩個概念都沒有直接解決,但該模型提供了肯定的機會來測試這些概念。
為了成功地理解決策模型的實施和它可以應用的規模,有必要了解所涉及的工具。其中一些應用在本論文中直接使用。其他的是在MDOC5i中使用的,對于理解這個模型如何推導到多種情況下是很有用的。這些工具也提供了很好的背景,對未來的工作有好處。
GINA 是一個基于云的、提供可執行建模環境的 VRDM 平臺,該平臺產生的模型能夠進行推理和適應[7], [8]。該架構通過其反思性的、可執行的、基于組件的、與平臺無關的和模型驅動的構造,提供先進的數據、信息和知識的互操作性[9]. 該平臺使用一種語義結構,使應用領域的用戶能夠理解組成的模型組件,并形成具有半知覺行為的系統,這對動態任務需求的適應性和可配置的靈活性至關重要。該創新平臺是松散耦合的,這意味著它可以通過配置創建模型,使用來自遺留系統、現有系統或未來系統的各種輸入[8],而不會破壞或重新編譯。由于概念性的信息對象構造可以臨時引入,并可能存在于任何領域,GINA提供了誘人的可能性,美國防部正在探索這種可能性[2]。
GINA技術由方法論、開發工具和可執行模型的部署平臺組成,可作為軟件程序使用。這些模型不需要被編譯,而是在元數據中定義并實時編譯。該平臺使用通過配置實現的行為、環境和因果的建模概念,以提供定義、操作和互操作性[10]。GINA可以通過其名稱的組成部分進一步理解。"全球 "指的是該平臺通過多層抽象包含了所有的數字表示。"信息 "指的是可以被建模和管理的靜態和動態數據以及互動關系。"網絡 "指的是可以通過模型和圖表顯示、參考和管理的所有互聯關系的數字表示。"架構 "意味著GINA是被使用的系統,專門用于制作行為、背景和因果關系的可執行模型[10]。
第二章將深入討論GINA的優點和特點。
Dark Stax是一個由ANIME開發和使用的工具,能夠以接近實時的速度創建復雜系統的數字孿生體。這些數字孿生體可以用來操作克隆的系統進行數據操作和決策分析。這種聯合有助于數據驅動的決策過程。這個工具能夠創建戰術網絡的克隆,并過濾PCAP數據,為網絡診斷模型創建輸入[10]。Dark Stax工具由Ad Hoc維護和運行。他們對該工具的掌握為首要的人工智能(AI)技術和VRDM技術的結合提供了巨大的效用。
StarUML是一個開源的軟件建模平臺,支持統一建模語言(UML)[11]。它被設計為支持簡明和敏捷的建模,并提供系統疊加的可視化描述[12]。本文使用UML圖來描述實現的VRDM模型的靜態和動態方面。UML并沒有捕捉到VRDM模型中包含的所有細節,但它確實捕捉到了最重要的信息,并提供了模型中連接的清晰疊加。
在這個項目中,它只被用于GINA模型的可視化和文檔化。然而,我們的意圖是使GINA能夠接受UML設計作為輸入。因此,一個系統可以用UML建模并輸入到GINA中,以放棄配置。
Cursor On Target(COT)"是一個互聯網協議和一個基于XML的機器對機器模式,可以被任何系統讀取和理解,使專有和開放源碼系統能夠相互通信"[13]。模擬器在GINA模型中被用來模擬XMPP流量。XMPP消息的樣本在一個文本文件中生成。然后,Cursor On Target Simulator(COTS)模擬器將文本文檔的內容作為XML輸入到GINA。這個XML是決策模型的輸入。
美國海軍陸戰隊正在建設反水面作戰領域的能力,特別是在獲得地基反艦導彈(GBASM)及其相關發射平臺方面。研究為分析與這種新能力相關的部隊結構提供了一種方法。研究方法使用離散時間馬爾可夫模型對GBASM炮組和敵方水面艦艇之間的戰術級決斗進行建模。這些模型有足夠的復雜性來解決關鍵的部隊設計問題,并且對決斗的關鍵特征進行了參數化,以便進行強有力的敏感性分析。
在海軍導彈作戰中,重要的是確定所需的炮彈規模S,以使炮彈有足夠高的概率殺死敵艦。GBASM概念的獨特之處在于,與從水面艦艇上發射導彈相比,它能夠將這種炮彈分散到幾個平臺上,并以更適合特定戰術場景的方式進行發射。在這種情況下,如果有一個大小為K的禮花彈,并將該禮花彈分散到N個平臺上,那么每個平臺在特定的禮花彈中發射?枚導彈,這樣K × N = S。有了這個公式,就能夠分析平臺數量和每個平臺發射的導彈數量在這些配置的殺傷力和生存能力方面的權衡。這為成本-效益分析提供了基礎。
對GBASM炮臺與敵方水面艦艇發生接觸的情況進行模擬。從簡單的場景開始,然后逐漸復雜化。讓GBASM發射器與一艘敵方水面艦艇進行決斗。GBASM一方被稱為藍方,水面艦艇被稱為紅方。最初假定雙方都有足夠的導彈供應,并且交換的時間是有限的,因此可以把供應視為無限的。GBASM以彈丸為單位進行發射,每個彈丸至少包括一枚導彈。在藍方的炮擊之后,紅方的水面艦艇有機會進行還擊。
在所描述的環境中,假設藍方具有首發優勢。鑒于GBASM的引入在沿岸地區造成的不對稱情況,首發優勢的假設并不是不合理的。GBASM是移動的,有可能移動到難以探測的地方,只有在準備開火時才出來。GBASM的目標是保持不被紅方船只發現,直到它成功瞄準紅方船只。一旦紅方船只成為目標,GBASM系統就會開火并移動到一個新的位置。如果沒有關于GBASM移動的完美信息,紅方艦艇將持續處于不利地位。
此外,該模型捕捉到了紅方對藍方的炮擊進行防御措施的能力。這些防御性的反措施是用參數λ來說明的,這個參數是紅方根據泊松分布可以攔截的藍方導彈的平均數量。以這種方式對紅方采取反措施的能力進行建模,說明了隨著藍方導彈規模的增加,紅方采取反措施的能力也在減弱。同樣,也說明了紅方針對藍方分布式發射器的能力下降。紅方殺死藍方分布式平臺的能力用參數?表示,根據泊松分布,紅方在還擊中可以殺死藍方平臺的平均數量。這再次說明,隨著藍方平臺數量的增加,紅方瞄準和殺死藍方的效果有限。
在對該模型的分析中,遇到了幾個關鍵的發現。首先,最重要的是確定理想的炮擊規模S,以提供足夠高的殺死敵艦的概率。這不是一個簡單的 "越多越好 "的問題,因為炮擊規模有一個收益遞減點。正如人們所期望的那樣,還得出結論,增加平臺的數量K可以提高生存能力,從而提高GBASM炮臺的殺傷力。然而,改進的幅度對其他參數很敏感,當炮彈規模足夠大時,改進的幅度通常很小。
該研究的主要產出是創建的模型和對它們進行進一步分析的能力。本論文中任何地方使用的參數值都不是由具體的GBASM系統或潛在的敵方水面艦艇的能力來決定的。因此,結果應該被看作是對參數空間可能區域的探索的概括。這些模型提供了根據有關特定系統的能力進行具體分析的能力。
目前,人工智能(AI)為改造許多軍事行動領域提供了巨大的機會,包括作戰、指揮與控制(C2)、后勤、安全和維護,以提高其整體作戰效率。空中和導彈防御(AMD)是一個特別復雜的任務領域,人工智能的應用至關重要。空中導彈防御任務指的是保衛國土、保護區、地面基地、地面部隊或艦艇免受敵對的空中或導彈威脅。AMD的威脅包括敵對的飛機、無人駕駛飛行器(UAV)或機載導彈。AMD行動的復雜性源于威脅的嚴重性、威脅的意外性、對形勢認識的不確定性以及事件的快速發展,因為作戰人員必須迅速評估形勢,制定適當的行動方案,并最好地利用他們的戰爭資產來應對。美國國防部(U.S. DOD)正在研究使用AI系統(或AI-enabled AMD[AI-AMD]系統)作為AMD作戰人員的自動決策輔助工具,以大大減少他們的認知負荷(Jones等人,2020),使AMD決策更快、更好。
人工智能的一個關鍵方面已經聚集了大量的研究興趣,那就是信任。信任是有效團隊的一個基本原則。它同時適用于人類和人機團隊。信任使團隊成員能夠很好地合作,是有效團隊表現的基礎(Lee and See 2004)。與人工智能系統的成功合作將需要人類對人工智能系統有一個校準的信任和依賴程度(泰勒等人,2016)。
隨著更先進和更快的空中和導彈威脅彈藥的發展和投入使用,操作人員更需要在AMD行動中迅速作出監測。不及時的決策和反應將導致災難性的后果。因此,人工智能是一個可能的解決方案,通過自動決策輔助工具加快和加強決策過程。這些AMD自動戰斗管理輔助工具可以幫助戰術操作人員應對更快的決策周期、大量的數據以及需要觀察的幾個系統或屏幕(Galdorisi 2019)。然而,為了有效地利用人工智能能力的潛力,需要操作員的高度信任。操作員對系統的信任程度低,可能會導致人工智能-AMD系統利用不足,受到不適當的監控,或者根本不使用(Floyd, Drinkwater, and Aha 2016)。這些問題中的任何一個都可能導致操作者的工作量不必要的增加,或者任務失敗的可能性。
論文對信任的定義、人機交互(HMI)的概念、信任因素以及包括AMD殺傷鏈模型、威脅場景、架構、模型和功能在內的概念模型進行了廣泛的回顧。有了這樣的認識,論文提出了人工智能-AMD系統的信任框架,對人機交互和人工智能-AMD系統信任因素的描述。論文最后提出了在人類操作者和AI-AMD系統之間實現校準信任的策略。
信任框架始于對系統背景的分析。圖1顯示了AI-AMD指揮與控制(C2)系統(包括AI-AMD操作員和決策輔助工具)及其他與之互動的子系統的背景圖,這些子系統有助于操作員和AI-AMD決策輔助工具之間信任的發展。背景圖使我們能夠研究各系統之間的相互作用,以及它們對AI-AMD操作員和決策輔助工具之間信任動態的影響。
圖1. AI-AMD系統框架圖。
這篇論文將信任定義為操作者的態度,即AI-AMD決策輔助工具將有助于實現操作者的目標,即在一個以不確定性和脆弱性為特征的作戰環境中迅速摧毀來襲威脅的任務。這種信任的定義表明,它是對操作者相信或感知AI-AMD決策輔助工具的一種情感評估。為了積極地影響信任,操作者必須親自看到并感受到AI-AMD決策輔助行動的優勢。AI-AMD行動涉及很多不確定因素,以及天氣、電磁干擾和地形等環境因素以及不斷變化的威脅的性質所帶來的脆弱性。操作員將預期AI-AMD決策輔助系統按照 "合同 "執行,以處理這些不確定性和脆弱性。這些合同將是人工智能-AMD決策輔助工具應該執行的感知功能或任務,以及執行這些功能或任務的理想表現。
圖2說明了操作員和AI-AMD決策輔助工具之間的信任框架。y軸代表人類對AI-AMD決策輔助系統的信任程度,x軸代表AI-AMD決策輔助系統的能力。綠色的45°虛線表示最佳的信任水平或校準的信任線,其中的信任與AI-AMD的能力相對應,導致正確的利用(Lee and See 2004)。過度信任由最佳信任水平線以上的區域表示,此時的信任超過了系統能力,導致誤用。低于理想信任水平線的區域表示不信任,這時的信任沒有達到系統能力,導致濫用。假設存在一些默認的信任水平(如黃框所示),目標是制定一個策略,以提高AI-AMD輔助決策能力的信任。在使用該系統時,可能會發生違反信任的情況,從而降低操作員的信任。因此,信任修復行動必須被納入,以保持信任在最佳水平。
圖2. 人類操作員和AI-AMD決策輔助工具之間的信任。
基于功能分配的操作員和AI-AMD決策輔助工具之間的人機交互研究表明,操作員和AI-AMD決策輔助工具應該被設計成在大多數殺戮鏈功能中作為一個 "團隊"運作。這引導論文研究了單獨和集體考慮人類和決策輔助的信任因素。對操作員和人工智能-AMD決策之間的人機交互的研究還顯示,操作員的角色已經從手動控制器變成了監督控制器。因此,一個值得信賴的決策輔助工具是很重要的,因為操作者會期望系統的表現符合預期,以幫助操作者更好地履行他的角色。另外,為了進一步幫助減輕操作者的認知工作量,信息的外部表示、決策輔助工具的建議必須易于閱讀和理解。
關于信任因素,本論文提出了一個 "由外而內 "的框架,如圖3所示。論文首先考慮了與操作環境相關的因素,這些因素描述了AMD操作系統的背景。第二,它研究了與組織環境相關的因素,操作人員和人工智能-AMD系統得到了培訓和發展。第三,論文研究了操作人員和人工智能-AMD決策輔助工具之間的交互,以提出與操作人員、人工智能-AMD、單獨和集體相關的因素。
圖3. 建議的信任因素
圖4顯示了擬議的戰略銜接圖,以實現操作者和AI-AMD輔助決策之間的校準信任。對信任定義、人機界面和信任因素的審查表明,該戰略應關注三個關鍵領域:(1)人類對自動化技術和AI-AMD決策輔助系統的集體和個人感知;(2)增強操作員和AI-AMD決策輔助系統的團隊活力;(3)AI-AMD決策輔助系統的可信度,重點是系統開發。該戰略利用DOTMLPF-P框架提出了三個關鍵原則和五個支持原則。首先,軍事作戰人員需要被告知自動化技術的真正能力和局限性,特別是AI-AMD輔助決策。第二,操作員的培訓要求必須增加,以應對新的工作范圍和不斷變化的威脅。第三,必須在人工智能-AMD決策輔助系統的開發中加入新的要求,以提高系統的可感知的可信度。這三個關鍵原則得到了DOTMLPF-P框架其他方面的支持,如組織、領導、人員、設施和政策。
圖4. 實現操作員和人工智能-AMD決策輔助工具之間校準信任的戰略銜接圖