本文介紹了一個使用人工神經網絡的人工智能模型,該模型提供了改善超視距(BVR)空戰飛行員態勢感知的參數。在這種作戰方式中,有必要根據來自傳感器(主要是雷達)的信息做出決策。此外,由于有關敵機系統的信息有時是未知的,而飛行員的決策通常是基于對手的。所提出的模型建議處理這些特征,為在建設性模擬環境中的實體進行行為生成,即模擬人操作系統。我們創建了兩架飛機之間的BVR空戰模擬,每架飛機只有一枚導彈,通過拉丁超立方采樣(LHS)來選擇輸入變量,幾乎均勻地覆蓋所有的范圍。這些飛機有類似的行為,它們的參數只在模擬開始時發生變化。仿真環境生成一萬個空戰場景,改變了三十六個輸入參數,用于案例研究中提出的分析。從這些數據中,我們可以創建監督機器學習模型,大大提高BVR空戰飛行員對進攻情況的態勢感知能力,在這種情況下,參考飛機使用導彈攻擊目標或防御陣地,而不是參考飛機試圖避免敵人導彈向其方向發射。進攻型和防御型模型的準確度分別為0.930和0.924,F1分數為0.717和0.678。因此,這項工作的貢獻是使用機器學習算法來產生有關戰術狀態的反應,以提高飛行員的態勢感知,從而改善飛行中的決策過程。
機器學習(ML),從廣義上講,是一類自動優化參數以處理給定輸入并產生所需輸出的計算機算法。ML的一個經典例子是線性回歸,據此找到一條最適合(通過)一組點的線。最近的一個例子是分類任務,如用 "貓 "這樣的單字來標記一張百萬像素的圖像。
對于許多應用,ML完成了人類可以做得同樣好的任務。然而,ML在兩種情況下大放異彩:1)任務的數量巨大,例如數百萬;2)問題的維度超出了人類思維的理解。一個簡單的例子是同時實時監控成千上萬的安全攝像頭,尋找可疑的行為。也許一個ML方法可以發現異常事件,并只與人類觀察者分享這些視頻片段。更好的是,異常圖像可以被暫時貼上諸如 "1號入口處的蒙面入侵者 "之類的標簽,以幫助保安人員只關注相關的信息。
除了減少人類的負擔外,ML還可以將人類可能無法識別的復雜的相互聯系拼湊起來。例如,一個ML算法可以發現,在一百萬個銀行賬戶中,有五個賬戶的交易似乎是同步的,盡管它們沒有相互發送或接收資金,也沒有向共同的第三方發送或接收資金。
鑒于手持和固定設備的計算資源不斷增加,我們有必要想象一下,ML可以在哪些方面改變戰爭的打法。當然,ML已經對美國陸軍的科學研究產生了影響,但我們也可以很容易地想象到自主車輛和改進的監視等作戰應用。
本文件的主要目標是激勵美國陸軍和美國防部的人員思考ML可能帶來的結果,以及為實現這些結果,哪些研究投資可能是有成效的。
在ARL的許多研究項目中,機器學習目前正在被使用,或者可以被使用。我們列出了一些使用ML或可能從ML中受益的研究項目。我們列出的與ML相關的ARL研究工作絕非完整。
雖然從技術上講,機器學習自19世紀初高斯發明線性回歸以來就一直存在,但我們相信,ML的最新進展將以我們目前無法想象的方式影響軍隊。在本節中,我們概述了我們認為將得到加強的軍隊行動的許多領域,以及可能采用的ML方法的種類。
軍事情報包括信息收集和分析,因為它涉及到指揮官做出最佳決策所需的信息。由于收集的數據量越來越大,處理必須自動化。需要考慮的主要問題是數據的數量、速度、真實性和多樣性。大量的數據(又稱大數據)需要在許多計算節點上對數據進行智能分配。速度要求快速計算和網絡連接到數據流。真實性是對信息來源和異常檢測的信任問題。多樣性相當于使用許多不同的ML算法的不同訓練模型的應用。我們在本小節中概述了不同類型的數據和分析要求。
讓計算機從從各種媒體來源收集到的大型文本數據庫中提煉出重要的概念和文本部分,有很大的好處。最近報道的另一個ML突破是不同語言之間的精確文本翻譯。 軍隊的一個獨特挑戰是翻譯不常見的語言,因此專業翻譯人員較少。在人工通用智能(AGI)領域,一些團體聲稱,自然語言處理將是類似人類認知的基礎。
鑒于人類、傳感器和代理產生的數據的激增,一個很大的問題是,除了證明其收集的直接用途之外,這些數據還包含什么剩余價值。數據挖掘可以是統計學和機器學習的努力,以發現數據中的模式,否則人類操作者就會錯過。
傳統上,異常檢測是通過首先識別已知數據的群組和描述數據的分布來進行的。然后,當新的輸入被處理時,它們被識別為屬于或不屬于原始分布。如果它們在已知分布之外,就被認為是異常的。以下許多類型的異常檢測系統可能對軍隊有用。
網絡入侵檢測:超出常規的網絡流量。McPAD和PAYL是目前使用的軟件中的2個這樣的例子,它們使用了異常檢測。
生活模式異常:人們的視覺和生物統計學上的行為方式與常人不同,表明他們可能正在進行一些對抗性行動。
基于條件的維護:在當前生命周期中,材料/系統在其年齡段不典型的信號。
士兵異常:有理由相信士兵的生物識別技術不正常。
異物檢測:在已知物資數據庫中無法識別的物體的視覺效果。
自動目標識別(ATR)是一個非常成熟的領域,已經使用機器學習幾十年了。
1)目前深度學習的進展將在多大程度上增強ATR?
2)更復雜的算法是否需要更復雜/更耗電的機載計算?
ML是否能對目標的各種欺騙性的混淆行為具有魯棒性?
強化學習在多大程度上可以用來進行實時軌跡調整?
機器學習在機器人學中的應用也是一個巨大的領域。ML應用領域包括傳感、導航、運動和決策。目前,傳感將從計算機視覺的所有進展中受益。導航,除了使用標準的GPS之外,還可以從自我運動中受益,也就是基于自身感知的運動估計。運動可以被學習,而不是規劃,這不僅會導致更快的開發時間,而且還能在新的環境或受損的模式下重新適應(例如,失去四條腿中的一條)。最后,隨著機器人的數量超過人類操作員的數量,機器人將有必要自行決定如何執行其規定的任務。它將不得不做出這樣的決定:"由于電池電量不足,我是否要回到大本營?"或者 "我是否繼續前進一點,然后自我毀滅?"
除了機器人技術,人們最終希望任何系統在損壞或不能滿負荷工作時能夠自我糾正。這需要在某種程度上的智能,以自主診斷缺陷和問題,并利用其可用的資源糾正這些問題。
在通過機器學習來學習自主權的情況下,問題將是:"自主系統將如何應對X情況?" 這里的問題是,對于一個擁有潛在致命武力的系統,我們怎么能確定它只會正確合法地使用武力?我們推測,在機器學習的算法擁有使用致命武力的實際能力之前,必須對其進行廣泛的測試,即使它與人類的環形決策相聯系。
近年來,大量的研究都在研究使用機器學習來自主地玩各種視頻游戲。在某些情況下,報告的算法現在已經超過了人類玩游戲的水平。在其他情況下,仍然存在著處理長期記憶的挑戰。對于美國空軍來說,智能代理已經成功地在以戰斗為中心的飛行模擬器上進行了訓練,這些模擬器密切模仿現實生活。陸軍的問題包括以下內容。
智能代理能否附加到機器人平臺上?
智能在多大程度上可以通用于處理現實生活與視頻游戲中遇到的各種情況?
當我們可能不理解一個訓練有素的代理的邏輯時,我們能相信它的行動嗎?
代理在多大程度上能夠與人類合作?
在過去的十年里,機器學習在網絡安全方面發揮了不可或缺的作用。具體來說,ML可以用于異常檢測,檢測已知威脅的特定模式,并辨別網絡行為是否可能由惡意代理產生。隨著該領域的不斷加強,問題是ML是否能使安全比對手領先一步,因為對手可能利用ML來混淆檢測。
一個長期的設想是,軍隊使用的每一個機械系統都有一些關于系統當前和預測健康的內部感應。相關問題如下。
我們能從有限的傳感器中辨別出一個系統或系統組件的當前健康狀況嗎?
機載ML能否預測一個系統或系統部件在暴露于特定環境或彈道侮辱之后的健康狀況?
隨著基因組序列的數量繼續呈指數級增長,比較在現場獲得的序列所需的計算工作可能變得無法管理。機器學習可以通過對序列進行不同層次的分類來減少必要的比較。
93 近年來,機器學習已經在檢測各種組織中的惡性腫瘤方面取得了長足的進步。94 它同樣可以被用來描述創傷或創傷后應激障礙(PTSD)95,并制定治療計劃。
陸軍的一個重要組成部分集中在對行動、系統、研究和測試的分析上。傳統上,分析人員使用大量的工具,包括機器學習,以多維回歸、聚類和降維的形式。隨著深度學習的出現,一套新的工具應該是可能的,可以更有效地處理需要更復雜模型的大型數據集。例如,應該有可能從測試期間拍攝的視頻流中提取特征和物理屬性,這可能超過目前的標準做法。
自適應用戶界面(AUI)和情感計算。ML可以用來確定用戶的心理和/或情緒狀態,并提供適合這種狀態的界面。此外,可變的AUI可以服務于用戶的變化。例如,一些用戶可能喜歡音頻反饋而不是視覺反饋。
推薦系統。最流行的推薦系統之一是根據以前看過的電影的評分來選擇用戶想看的下一部電影(例如,所謂的 "Netflix問題")。對于軍隊來說,可以根據以前的使用情況和庫存核算的反饋來推薦后勤補給的情況。
搜索引擎/信息檢索。傳統上,搜索引擎返回文件的 "點擊率"。新的范式是以簡明的形式回答用戶的問題,而不是簡單的模式匹配。
情感分析。社交媒體上的流量和對環境進行訓練的各種傳感器不僅可以檢測關鍵的關鍵詞或特定物體的存在,還可以推斷出可能的攻擊的可能性。
有針對性的宣傳。傳統上,宣傳是通過散發傳單來完成的,如今,宣傳可以通過社交媒體來傳播。ML的角度是如何以最有說服力的信息向正確的人口群體進行宣傳。此外,重要的是快速檢測和顛覆來自對手針對我們自己的人員/人民的宣傳。
本研究的目標之一是確定當前研究中的差距,這些差距可能會限制ML在軍隊研究和行動中的全部潛力。本節借用了ARL運動科學家Brian Henz博士和Tien Pham博士(未發表)的戰略規劃工作。
傳統上,在一個特定領域采用ML的一半戰斗是弄清楚如何適應現有的工具和算法。對于陸軍所面臨的許多問題來說,這一點更為突出,與其他學術、商業或政府用途相比,這些問題可能是獨一無二的。任何數據分析員面臨的第一個問題是使數據適應他們想要使用的統計或ML模型。并非所有的數據都使用連續變量或者是一個時間序列。離散/標簽數據的管理可能非常棘手,因為標簽可能不容易被轉換成數學上的東西。在自然語言處理中的一個例子是,單詞經常被轉換為高維的單熱向量。另一個例子可能是如何將大量的維修報告轉換為對某一特定車輛在一段時間內的表現的預測。
此外,陸軍的要求超出了典型的商業部門的使用范圍,不僅需要檢測物體和人,還需要檢測他們的意圖和姿態。這將需要開發新的模型。另一個大的要求是可解釋性,正如DARPA最近的一個項目所概述的那樣:是什么因素導致ML算法做出一個特定的決定?在一個真實的事件中,如果一個ML算法在沒有人類驗證的情況下宣布一個重要目標的存在,我們能相信這一決定嗎?
隨著對計算要求高的ML任務的設想,開發人員正在使用多線程、并行和異構架構(GPU、多核)來加快計算速度。ML的分布式實現遠不如GPU版本常見,因為分布式計算中的節點間通信存在固有的網絡瓶頸,而且在單精度浮點性能方面,GPU相對于CPU有很大優勢。除了目前對GPU的強烈依賴,生物啟發式神經計算旨在尋找非馮-諾伊曼架構來更有效地執行ML,并可能更快。這方面的一個例子是IBM的神經形態芯片。97 未來的研究應該關注如何分配ML處理,使節點之間的網絡通信最小化。另外,像聚類這樣的無監督學習算法在多大程度上可以被映射到神經網絡中?
其他需要考慮的事情。
目前的ML軟件(特定的神經網絡)在一個小型的GPU集群中表現最好。
大多數基于非神經網絡的ML算法的并行性不高,或者根本就沒有并行。
另一個軍隊的具體挑戰是分析基本上沒有標記的數據集(例如,用無監督學習)。手動標注集群將是一種半監督學習的形式。
隨著進入偏遠地區或任何遠離基地的地區,軍隊必須限制系統的尺寸、重量和功率。此外,在 "激烈的戰斗 "中,時間是關鍵。例如,人們不能在遭到槍擊時等待作戰模擬的完成。最后,在其他商業發射器占主導地位的地區,或者在限制無線電通信以提高隱蔽性的情況下,網絡帶寬可能會受到很大限制。
在這種倍受限制的環境中,機器學習將需要有效地進行,而且往往是以一種孤立的方式進行。截然相反的條件是使用大型數據庫訓練大型神經網絡,這往往是最先進的機器學習功力的情況。商業部門正在開發自動駕駛汽車,據推測將使用低功耗的計算設備(如現場可編程門陣列、移動GPU)進行自主駕駛、道路/障礙物檢測和導航。然而,陸軍將有更多的要求,包括自主傳感器和執行器、態勢感知/理解、與人類的通信/合作,以及廣泛的戰場設備。這將需要多幾個因素的計算能力和特定算法的硬件,以實現最佳的小型化和低功耗。
在混亂的環境中,操作環境預計會有比通常密度更高的靜態和動態物體。此外,人們完全期待主動欺騙以避免被發現。我們也希望能夠開發出足夠強大的算法,至少能夠意識到欺騙,并相應地調低其確定性估計。
基于CNN的目標分類的突破可以部分歸功于每個物體類別的成千上萬個例子的可用性。在軍隊場景中,某些人和物體的數據可能是有限的。人們最終將需要one-hot99或multishot分類器,其中幾個有代表性的數據條目就足以學習一個新的類別。到目前為止,最好的選擇是 "知識轉移",通過調整以前訓練的模型的所有參數的子集來學習新的類別。我們的想法是,由于需要優化的參數較少,修改這些參數所需的數據也較少。
即使對于我們可以產生大量圖像的目標類別(例如,友好物體),我們也需要訓練自己的模型,以便從每個類別的潛在的數千張圖像中識別軍隊相關類別。軍隊還使用商業車輛中通常不存在的其他傳感模式(例如,熱能和雷達)。因此,需要為這些非典型的傳感設備訓練模型。從根本上說,非典型傳感設備可能需要新的神經網絡拓撲結構以達到最佳的準確性和緊湊性。
一個值得研究的有趣領域是將模型和模擬與機器學習相結合。有很多方法可以做到這一點。例如,ML可以用來推導出模擬的起始參數。此外,ML還可以用來處理模擬的輸出。一個耐人尋味的新領域是開發基于物理學或類似物理學的模擬,使用類似ML的模型/方程。一個這樣的應用是預測 "如果?"的情景。例如,"如果我跑過這棵樹呢?接下來會發生什么?"
機器學習在傳統上被認為是人工智能的硬性(即數學)表現形式。有可能最終,所有的人工智能任務都會被簡化為數學。然而,就目前而言,一些智能任務似乎更多的是基于推理或情感。對于之前描述的方法中的任務,ML并不能充分解決以下軟性人工智能的特點。
人類并不總是完全按邏輯推理,但他們也有能力將不完整的信息拼湊起來,做出 "最佳猜測 "的決定。幾十年來,對這種行為進行編碼一直是一個挑戰。
情緒似乎是驅動人類達到某些目的的動機/目標功能。例如,快樂可能會導致不活動或追求生產性的創造力。另一方面,恐懼則可能會導致忍氣吞聲。計算機是否需要情感來更有效地運作,還是說它們最好擁有100%的客觀性?這既是一個哲學問題,也是一個未來的研究方向。不過現在,毫無疑問的是,在人與代理人的團隊合作中,計算機需要準確地解釋人類的情感,以實現最佳的團體結果。
與人類的互動性是陸軍研究未來的首要關注點。一個類似的問題是,不同的計算機系統之間如何進行交流,而這些系統不一定是由同一個實驗室設計的。研究的一個領域是用計算機來教那些在這方面有困難的人進行社會交流。 再一次,對于人與代理的合作,代理將需要能夠參與社會互動,并在人類的陪伴下遵守社會規范。
創造力通常被認為是隨機合并的想法,與新的元素相結合,由一個鑒別功能決定新創造的項目的功能和/或美學。在某些方面,創造力已經被某些計算機實驗室所證明。例如,為了設計的目的,計算機可以被賦予某些方面的創造力。
人工智能的最終目標是將許多狹義的智能算法合并成一個統一的智能,就像人類的頭腦一樣。75鑒于許多狹義的人工智能任務已經比人類的某些任務要好,即使是早期的所謂人工通用智能(AGI)也可能具有一些超人的能力。AGI的一個主要目標是將目前由人類執行的某些任務自動化。
如果不提及許多哲學家的猜測,機器學習將最終能夠改進自己的編程,導致能力的指數級提高,也許會遠遠超過人類智能,那么機器學習的研究就不完整了。這些設想既是烏托邦式的104,也是烏托邦式的105。希望超級智能能夠解決世界上的許多問題。
在這項工作中,我們回顧了機器學習的不同類別,并描述了一些更常用的方法。然后,我們指出了一小部分關于ML在ARL中的應用的例子。最后,我們預測了ML在未來可以應用于軍隊的各個領域,并概述了為實現這一結果需要解決的一些挑戰。我們希望這份文件能夠激勵未來的研究人員和決策者繼續投資于研究和開發,以充分利用ML來幫助推動美國陸軍的發展。
疲勞是導致水域事故的一個已知因素,降低了操作效率,并影響了作戰人員的健康。戰士認知狀態的實時反饋將允許提高對能力/限制的認識,并根據戰士的準備情況作出適應性決策。使用機器學習(ML)和可穿戴技術的疲勞檢測/預測項目旨在開發一種ML算法,能夠檢測出副交感神經系統(PNS)的變化,這些變化通過使用商用現成(COTS)腕戴設備檢測,進一步可分析認知疲勞。收集了30名參與者(包括一些現役軍人)執行可量化的警戒任務的生物識別數據集,并對操作者的表現指標和認知負荷進行了注釋。麥克沃思(Mackworth )時鐘是一項廣泛用于心理測量研究以量化認知參與和疲勞的警覺性任務,它的變體被用來生成定量的操作者績效指標和離散的認知負荷狀態。在有注釋的生物識別數據集上訓練和驗證了ML模型,以:1)回歸操作者任務表現的準確性,以及2)對認知負荷/任務難度進行分類。一個訓練有素的卷積神經網絡(CNN)回歸模型能夠預測麥克沃思鐘任務表現的準確性,平均絕對誤差在2.5%以內。此外,一個單獨的CNN分類器模型達到了86.5%的二元任務類型分類準確率,不同類型的任務對應著較高和較低的認知負荷。該研究與開發(R&D)工作的下一階段將包括與海軍有關的任務(即船舶導航、軌道管理和其他站崗任務)的額外測試活動,參與者僅包括現役人員。這項工作的最終目標是提供一個可穿戴設備和配套的軟件,能夠檢測和預測各種與海軍有關的任務的認知疲勞,目的是優化作戰人員的表現,以減少用戶的錯誤或最大限度地提高性能。
美國陸軍工程研究與發展中心(ERDC)的研究實驗室目前正在開發仿真工具,以協助開發可選擇的載人、遠程操作和完全自主的車輛,重點是地形與車輛的交互,特別是在冬季地形條件下。其他ERDC實驗室與地面車輛系統司令部(GVSC)一起,重點研究保證位置、時間和導航,該司令部正在進行開發可選擇的載人和自主平臺的研究,主要集中在車輛內部的硬件和軟件,很少強調外部安裝的地形傳感器或冬季操作環境。美國陸軍寒冷地區研究和工程實驗室(CRREL)在冬季和極端環境下進行車輛機動性研究,這在模擬和開發可選的載人和自主車輛方面是需要的。這項工作的范圍是調查人工智能和機器學習對冬季條件下運行的軍用車輛的適用性。本文描述了實現這一目標的初步努力。
自主車輛在民用方面的應用正在成為現實。在智能駕駛輔助方面,第三級車輛自主性(智能巡航控制、行人識別、自動剎車、盲區傳感器、罕見的交叉交通警報、避免碰撞等)已在商業和私人車輛上使用多年。第四和第五級自主性(有監督的自主性和完全無監督的自主性)目前正在試驗中。盡管在民用領域取得了重大進展,但軍用車輛的自主性仍然是一項相當具有挑戰性的任務。軍用自主車輛的主要區別是:非公路運行、未知地形的運行,以及在開放空間完全重新規劃路線的可能性。這種環境要求智能自主控制算法和環境感知與工業界的民用應用不同。具體來說,需要解決先進的和當前的地形感知、檢測無法通行的路線、確定可通行的替代路線和車輛在空地上的改道,以及針對特定地形條件和車輛的最佳車輛控制等任務。提交的工作描述了在解決其中一些挑戰方面的最新進展。結果表明,其中一些挑戰可以通過機器學習和人工智能算法成功解決,從而為軍用車輛的人工駕駛提供實質性幫助。
絕大多數關于自主車輛的文獻都是在城市條件下的駕駛。非公路車輛沒有道路指引其軌跡,也沒有一致的駕駛地面,還必須考慮不平坦的三維地形、三維方向。這主張使用更復雜的人工智能方法,如PilotNet卷積神經網絡,最近通過攝像機記錄72小時在不同城市條件下的成功駕駛,并使用這些數據作為訓練集,來教車輛自我轉向(Bojarski等人,2017)。另一方面,在不使用神經網絡的情況下,收集了大量關于傳統自動車輛控制的知識。例如,DARPA 2005年挑戰團隊的獲勝者沒有使用神經網絡,而是依靠更傳統的自動控制算法來自動控制他們的機器人斯坦利(Thrun等人,2006)。為了利用這些知識,同時又與越野作業的挑戰性要求相關,我們建議實施一種混合方法,將人工智能和經典控制方法結合起來。
具體來說,我們建議使用神經網絡來持續確定和更新車輛行駛的地形類型,以及車輛的 "臨界值",即車輛沿途必須遵守的行動限制,如允許的最大速度、最大的加速和減速率,以及車輛的范圍和最大的轉向率。將使用兩種人工智能算法。一個用于自動地形分類,另一個用于預測由第一個算法確定的地形類型的關鍵控制值。通過使用神經網絡來預測臨界值,車載自主控制系統不需要專門考慮所有的地形類型和方向,而是適當地定制,以便根據當前的駕駛條件實時調整。圖3概述了模型的結構。當前的地形估計、地形類型和條件、期望的軌跡和車輛狀態將被用來預測速度、最大加速/減速率和轉向的關鍵約束。這些值將作為傳統的剎車/油門的比例積分衍生(PID)控制器和轉向的模型預測控制(MPC)控制器的目標值。然后,實際的車輛狀態將被評估,地形、臨界值和路線將被相應地更新,直到車輛到達預期的目的地。
圖3. 擬議的混合自主控制方法的結構:使用神經網絡預測給定地形類型、車輛方向、地形和表面條件的臨界值,并設置為自適應MPC或PID控制器的目標。
?在日益復雜的軍事行動環境中,下一代兵棋推演平臺可以減少風險,降低作戰成本,并改善整體結果。基于具有多模態交互和可視化能力軟件平臺的新型人工智能(AI)兵棋推演方法,對于提供滿足當前和新興戰爭現實所需的決策靈活性和適應性至關重要。我們強調了未來作戰人-機器交互的三個發展領域:由人工智能引導的決策指導,高計算力下的決策過程,以及決策空間的真實呈現。這些領域的進展將使有效的人機協作決策得以發展,以滿足當今戰斗空間日益增長的規模和復雜性。
關鍵詞:決策、交互、兵棋推演、人工智能、增強/混合現實、可視化
在傳統的兵棋推演中,指揮官利用一個共同的基于地圖的作戰地形,并在軍事決策過程(MDMP,方框1)中模擬各種因素的組合如何產生行動方案(COA)、可能的反擊行動、資源使用估計和預測結果(美國陸軍,1997年,2014年,2015年)。在幾天或幾周的時間里,MDMP過程導致了一套精煉的COAs,它對作戰環境做出了一定的假設,包括地形、天氣以及戰區資產的可用性和能力(即塑造支持主要作戰行動的活動)。
方框1. 軍事決策過程(MDMP) | |
---|---|
MDMP是美國陸軍解決問題的理論方法,從接到任務開始,到生成作戰命令結束。MDMP被用作一種工具,幫助指揮人員審查眾多的友軍和敵軍的作戰行動。MDMP的7個步驟在規劃新任務、擴展行動和執行訓練演習所需的決策過程中灌輸徹底、清晰、合理的判斷、邏輯和專業知識(美陸軍,1997年,2015年)。 | |
指揮官在接到任務后啟動了MDMP。在MDMP的第1步中,所有的工作人員和關鍵的任務參與者都被告知任務和待定的規劃要求,包括進行MDMP的可用時間量。確定進行任務分析所需的工具,并收集與任務和作戰區有關的文件。步驟2,執行任務分析,建立對任務的全面理解,包括關鍵的事實和假設,形成擬議的任務說明和任務分析簡報,為制定COA做準備。 | |
MDMP的第3至第6步著重于制定COA以進行分析和比較。這些步驟包括:第3步,制定COA;第4步,COA分析(兵棋推演);第5步,COA比較;第6步,COA批準。COA是對一個已確定的問題的潛在解決方案。每個COA都要使用篩選標準來檢查其有效性,如在既定的時間框架、空間和資源限制內完成任務。COA的選擇過程通常涉及到兵棋推演,它試圖在考慮到友軍力量和敵人能力的情況下,將行動的順序流程可視化,同時考慮到行動區域內平民的影響和要求(美陸軍,2014)。戰術模擬(兵棋推演)方法的好處是突出了作戰行動的優勢和劣勢。這往往是一個反復的過程,對作戰行動方案進行評估,然后根據需要進行修改,直到出現一個或多個具有最高成功概率的作戰行動方案來完成任務目標。 | |
在一個具體的行動方案得到指揮部的批準后,MDMP的最后一步是制作行動指令,這是一份給下屬和鄰近單位的指令,旨在協調所有參與任務的組織的活動。這一步驟涉及到所有受命令傳播影響的組織之間的積極合作,并建立起對局勢的共同理解。 |
盡管MDMP幫助指揮官了解作戰環境和考慮作戰方法,但這個過程有很多局限性,如時間密集、假設僵化、跨場景訓練的機會有限,以及將人工智能(AI)指導納入決策過程的機會很少。傳統上,一項任務的成功與指揮部執行MDMP的能力直接相關。然而,鑒于當今多域作戰(MDO)的復雜性增加(Feickert,2021年),有大量的任務指揮系統和流程,與行動相關的所有活動的整合和同步變得越來越困難,甚至到了人為無法完成的地步。由于MDMP的缺陷而導致的規劃專業知識的缺乏,可能會導致不同步和不協調的行動,從而最終導致士兵的生命損失。
MDMP中沒有具體描述戰斗空間的可視化能力,但它顯然在決策過程中發揮著重要作用。最近,集成了先進可視化能力的新系統和新技術已經被開發出來,它們可以提高態勢感知,從而增強決策過程。美陸軍的例子包括Nett Warrior(Gilmore,2015),它使下馬戰士能夠直觀地看到附近的友軍和敵軍,同時根據當地的地形協同規劃戰術任務。盡管這項技術將無線電和數字地圖擴展到了下馬戰士,但它缺乏一個底層的人工智能引擎來提供決策幫助。戰斗空間可視化和交互平臺(BVI,前身為增強現實沙盤,ARES)是陸軍技術的另一個例子,它能夠為任務規劃提供分布式協作,具有從任意視角和廣泛選擇設備的共同作戰畫面的二維和三維可視化能力(Su等人,2021)。BVI架構的制定是為了拉入外部計算服務,如分析管道、模型和人工智能引擎。美陸軍研究實驗室正在努力將這些類型的服務納入BVI,包括用于加強決策支持的人工智能。
目前,MDMP并沒有將人工智能指導納入整體任務規劃方法中。美陸軍的自動規劃框架(APF)(Bailey,2017)開始通過將自主技術插入MDMP工作流程來解決人工智能輔助決策問題。指揮人員可以通過APF的數字規劃呈現、規劃創建和規劃監控工具,在任務規劃和COA開發期間獲得背景援助。任務執行和估計能力通過監測任務的規劃和實際進展,為改進決策跟蹤和支持活動提供自動協助。盡管APF為MDMP引入了基本的自動化水平,但它缺乏Nett Warrior和BVI所提供的先進的可視化和用戶互動能力。
提供地面部隊自動化和用戶可視化能力的是美陸軍最知名的兵棋推演平臺--半自動化部隊(OneSAF),為計算機生成的地面部隊提供建模和模擬能力(PEO_STRI, 2022)。OneSAF提供了半自動和全自動的軍事實體(即士兵、坦克、直升機和綜合單位)的建模,在類似真實世界的戰斗空間中以不同的保真度來支持特定的應用和場景。OneSAF主要用于訓練,并與目前的任務指揮系統具有互操作性。它可以使用多分辨率的地形和詳細的實體相關數據庫來模擬廣泛的作戰環境。然而,OneSAF對地形和實體系統的高保真建模的優勢使得它的設置和運行成本很高。它受到老化系統的限制,而且眾所周知,士兵需要大量的培訓來學習如何操作模擬,使用起來很困難(Ballanco,2019)。OneSAF的復雜功能并不適合開發人工智能能力,以實現快速和敏捷的戰士-機器決策。
除了MDMP和上面提到的陸軍平臺外,最近將人工智能納入決策過程的工作包括一些方法(Goecks等人,2021a),在模擬人類決策過程方面取得了一些成功。一般來說,人工智能在決策變量有限的問題上取得了一些成功,如資源分配(Surdu等人,1999)、飛行模擬器(Drubin,2020)和更簡單的場景。正在進行的挑戰包括需要提高人工智能的能力,以解決有多個行為者、不完整和可能沖突的信息、不斷變化的單位行動和環境屬性的復雜決策,以及需要將這些決策的后果在許多空間和時間尺度和領域內可視化。
以下各節描述了對MDMP的潛在改進。"未來軍事決策過程所需的進步"一節概述了支持MDO決策的三個研究領域,并以圖表形式描述了這些研究領域與軍事理論決策方法之間的關系。"未來軍事決策過程所需的進步 "一節中的小節對每個研究領域進行了更深入的討論。"展望推進人-人工智能團隊決策的交互技術 "一節概述了未來的作戰人員-機器接口(WMI)的發展方向,重點是與決策有關的人-人工智能團隊的跨學科研究。
軍事決策過程在支持MDO復雜決策方面的局限性,突出了在三個研究領域的改進需要。首先,有必要將人工智能產生的指導和輔助決策支持納入MDMP。這既包括進一步開發和整合人工智能到戰斗空間決策規劃,也包括進一步改善人工智能決策過程的可解釋性和透明度(Chen等人,2018)。第二,有必要在戰略層面以及戰術邊緣,盡可能地將決策分析與高性能計算(HPC)的力量結合起來。這將能夠利用HPC系統的力量來支持建模、分析和計算時間,同時整合和同步來自所有戰區領域的信息。最后,有必要利用先進的可視化技術,如混合現實技術,對決策空間進行更準確和互動表述。不是簡單地在一個固定的時間尺度上顯示地形的二維渲染,而是需要可視化不同領域的決策是如何相互作用的,并利用混合現實技術來提高理解的吞吐量,并產生平面顯示不可能的洞察力。
除了MDMP之外,其他更廣泛適用的支持戰斗性問題解決的軍事理論包括:DOTMLPF[例如,學說、組織、訓練、物資、領導、人員和設施;(美陸軍,2018年)],這是一個確定差距并為當前和未來作戰要求提出設計解決方案的框架;以及METT-TC[例如,任務、敵人、地形和天氣、部隊、可用時間和民事考慮;(美陸軍,2019年)],這是一個結構化框架,用于捕捉任務相關因素的狀態,以便在軍事行動期間進行共享評估。這些理論定義了MDO戰場的信息背景,構成了應用于上述三個研究領域的軍事決策的核心基礎。如圖1所示,在為人類和人工智能指揮開發復雜軍事決策空間的新表述時,研究進展和MDO相關理論相互借鑒、相互啟發、相互加強(美陸軍,2010)。
圖1. 新型作戰人員-機器交互(WMIs)和人工智能輔助決策所需的三個研究發展領域,以支持和加強基本的MDO理論[右下圖來源:Lebsack(2021)]。
需要新的人工智能支持的WMI,以利用人工智能決策方面正在取得的進展,并為復雜的適應性決策的人工智能學習作出貢獻。在簡化的戰斗空間中測試人工智能決策輔助工具是開發過程中重要的第一步,也是將人工智能納入更成熟的戰斗空間平臺(即BVI、OneSAF)的前奏。開發用于決策輔助實驗的人工智能測試平臺可以在MDO中產生能力越來越強的潛在COA建議。圖2顯示了陸軍開發的兩個人工智能測試平臺的例子。
圖2. 兩個ARL人工智能測試平臺的例子。左邊:ARL Battlespace(Hare等人,2021)( //github.com/USArmyResearchLab/ARL_Battlespace )。右邊:ARL的Simple Yeho測試平臺。圖片由C. Hung制作。
人工智能測試平臺能夠開發出匯集所有領域信息的AI,并計算出人類和AI智能體的風險和預期回報。圖2的左側顯示了ARL戰斗空間測試平臺(Hare等人,2021年),它是從頭開始開發復雜決策的新型人工智能的理想場所。它對戰斗空間的抽象強調了軍隊相關場景下的核心推理原則,在這種情況下,用蜜罐進行網絡欺騙。較小的網格空間使人工智能的學習和發展能夠集中在不確定性下的復雜推理,有多個友好和敵對的agent。圖2的右側顯示了ARL的Simple Yeho測試平臺,它提供了將人工智能開發與更多真實世界場景中的默契推理結合起來的能力,有多個基于地形的海拔高度、視線范圍、障礙物、樹葉(隱蔽)、道路和城市區域。紅色陰影和黑色線條表示任務的起點和終點、左右邊界以及人工智能建議的路線。這種額外的真實性使其能夠與MDO理論相結合,包括DOTMLPF和METT-TC,并使人工智能與自然的、機會主義的士兵行為共同發展。這兩個人工智能測試平臺都可以擴展為傳統和沉浸式混合現實WMI開發平臺。
使用漸進式和可擴展的人工智能測試平臺,可以調查現有人工智能的幾個基本限制,特別是對于具有不確定性的復雜和適應性決策,以及人類和AI智能體的協作和對抗。對多智能體的協作和對抗性決策進行建模可能特別復雜,因為其遞歸性質,其他智能體是模型的一部分(Goldman,1973;Grüning和Krueger,2021),需要對決策特征、個性化的價值、風險規避、記憶和注意力進行動態和不斷發展的估計。這些具有高度不確定性、復雜性和動態性的情況是人類擅長的領域,適當設計的交互界面和人工智能測試平臺的人機協作可以提供加速和更有效的決策。對于有效的團隊合作,新穎的WMI應該幫助作戰人員篩選復雜的信息,并幫助人工智能發現決策的隱含規則。下面,我們提供了關于人機協作如何有效的案例。
多域兵棋推演中需要的復雜決策是開發有效人工智能決策輔助工具的直接挑戰。最近人工智能在圍棋、國際象棋、Minecraft和大富翁等游戲中的成功(Silver等人,2017;Goecks等人,2021b;Haliem等人,2021)是基于對世界現有狀態有完整了解的游戲(即 "開放 "游戲),而兵棋推演平臺通常包括關于作戰環境的不完整(如星際爭霸)、不確定或欺騙性信息(Vinyals等人,2019)。不確定性也可能來自變化的物理學或其他環境規則,正如在《憤怒的小鳥》中所探索的那樣(Gamage等人,2021)。由于世界狀態、不同行動者的狀態以及所采取的行動不確定性,知識的缺乏使得人工智能agent難以計算未來行動的風險回報情況(Cassenti和Kaplan,2021)。不確定性也限制了人工智能估計其他行為者的風險回報概況的能力,而這是計算有效的博弈論策略所需要的。人工智能被可能的最優和近似最優選擇的廣度所淹沒(Lavine,2019),即由于信息有限而選擇錯誤的選項,這種情況并不罕見,因為人類在制定有效探索隱藏信息的策略時,采用啟發式方法進行有效的選擇和預測(Gardner,2019)。為了幫助發展人工智能的隱性知識和探索能力,新型的WMI需要有效地解釋和展示決策景觀,以使作戰人員能夠快速和自然地瀏覽可能的選擇,同時使人工智能能夠在不施加認知負擔的情況下從人類的決策中機會主義地學習(Lance等人,2020)。這種機會主義學習可以包括:例如,凝視跟蹤,以捕捉吸引人類興趣和意圖的視覺區域和未標記的目標。它們還可以包括建立在自然的士兵選擇行為基礎上的行動者批評方法,以改善人工智能對人類專家在不確定、不完全信息和欺騙的情況下如何優先考慮某些選擇的學習,這取決于任務相關的背景。
開發人工智能的WMI的另一個基本挑戰是如何有效地整合和顯示MDO中所有五個領域的信息,特別是空間和網絡,因為這些領域的信息具有不同的時空尺度(Gil等人,2018)。對于網絡,決策的規模和速度可能比人類處理和理解的能力更快,需要人類的輸入來指導半自動化的決策,以及實施進攻和防御性欺騙策略的人工智能。WMI需要能夠以這樣的方式顯示決策圖景,即可以解釋一小部分最優和接近最優的決策策略(例如,圖3中的決策樹)。這應該包括對關鍵agent在不確定情況下的未來狀態和風險回報情況的估計(Hare等人,2020),以使有效的博弈論決策能夠被共同開發和相互理解。
圖3. 在頂部,是BVI網絡戰術規劃器應用程序中友軍與敵軍戰爭場景的三維視圖。三維視圖提供了一個比二維視圖更真實的決策視角,例如,顯示友軍(藍色)和敵軍(紅色)機載預警系統(AEWs)和周圍地形的海拔。這使得快速審查可能的視線和相對于周圍地形的感應。下面是人工智能的導航決策樹,為人工智能計算的幾個關鍵選擇的風險/回報概況以及它們如何映射到地形上提供透明度。這種抽象的決策空間還可以整合非空間決策,例如網絡欺騙。虛線表示與友方AEW的通信聯系和對敵方AEW的可能干擾。圖片由C. Hung制作。
這些挑戰為有效的WMIs設計提供了參考。也就是說,我們需要有能力從不同的來源(包括從其他國家的決策輔助工具)提取信息,以及一個能夠承載整合這些信息的計算能力的架構,同時還要處理基礎的人工智能計算(用于學習和部署)。我們還需要共同開發一個界面和算法設計,以適時地利用人類和人工智能agent的優勢并減少其局限性。
在復雜的決策過程中,需要大量的計算能力來處理和記錄所有組件、實體和狀態空間。從積累的動態狀態空間的數據集中建立過去、現在和預測模型,需要利用HPC資源來產生分析性的見解,并在決策背景下創建有用的表述。
實施HPC分析工作流程的一種方法是使用持久性服務框架(PSF)。PSF是一個最近可用的分布式虛擬化解決方案,它可以通過一個基于網絡的前端實現對HPC服務的非傳統訪問,而不像傳統的HPC環境,計算節點在特定的時間段內以批處理模式分配給用戶。此外,PSF提供對數據、數據庫、容器化工具集和其他托管平臺的分布式連續訪問(Su等人,2021)。
在一個PSF方法的例子中,一個模擬引擎連接到PSF,用于記錄人類和人工智能做出的所有決定。這允許分析在任務規劃和COA開發過程中發生的決策行為,以及識別決策模式和戰略,以開發競爭性和現實的兵棋推演場景。一個戰斗空間可視化平臺可以托管在PSF上,并使用消息傳遞協議來更新所有連接的設備接口。來自模擬引擎的狀態信息可用于生成戰斗空間和參與作戰單位的圖形表示。
使用PSF方法并利用HPC資源,可以實施人工智能輔助決策機制,利用大數據攝取和分析,同時可供地理分布的用戶用于協作決策工作和 "永遠在線 "的個性化培訓和紅色團隊。連接到PSF托管服務器的各種混合現實顯示模式可以支持一系列作戰場景,從戰略層面的指揮和控制到作戰邊緣的更多移動戰術使用。
用圖形表示各級行動的軍事決策戰略需要新的可視化方法,這些方法可以應用于以規則變化、認知狀態、不確定性以及個人偏見和啟發式方法為特征的動態環境(Dennison等人,2020;Hung等人,2020;Raglin等人,2020)。戰斗空間的視覺表現應該在技術上盡可能準確和逼真,但又保持在人類可以理解和解釋的認知水平(Kase等人,2020;Larkin等人,2020;Hung等人,2021)。融合了混合現實技術的先進可視化方法有可能更好地表現多領域戰爭的變化特征及其不斷變化的威脅和動態環境。隨著最近混合現實可視化設備的技術進步,成本降低,硬件的可靠性和實用性顯著提高,混合二維和三維可視化方法現在已經成為可能。
由多個二維顯示器組成的混合現實方法增強了更先進的三維可視化能力,可以為指揮人員提供理解復雜的兵棋推演狀態空間所需的洞察力(Su等人,2021)。當需要一個共享的戰斗空間表示時,可以通過在不同的可視化模式上實現多個協調的視圖來實現協作的戰略規劃模式,以根據分布式指揮人員的輸入進行互動更新。
BVI(Garneau等人,2018)平臺表示地理空間地形信息和地圖圖像,允許指揮人員建立和修改戰術任務規劃和COA。作為一個數據服務器,BVI將地形和作戰數據分發給支持多種可視化模式的客戶端應用程序,包括頭戴式顯示器設備、基于網絡的界面、移動安卓平板設備和混合現實設備(例如,HoloLens 2、Oculus Quest)。
例如,圖3(頂部)顯示了位于加利福尼亞州圣貝納迪諾縣歐文堡國家訓練中心的高分辨率地形上的友軍與敵軍的兵棋推演場景(Wikipedia, 2021)。與MDMP期間經常使用的傳統2D地圖顯示相比,戰斗空間的3D視圖可以從多個觀察角度提供更豐富的用戶體驗。三維視圖,在BVI的網絡戰術計劃器(WTP)中,將地形和人工特征的空間信息以及由MIL-STD 2525C符號描繪的單位位置可視化(美國防部,2014)。可以想象,地理空間視角,如BVI提供的視角,支持決策者對動態戰斗空間環境的理解。與可導航的人工智能增強的決策空間(圖3,底部)搭配,組合的視角可以使人們更好地理解視覺空間依賴性、影響和因果關系、估計的風險和價值、不確定性以及復雜決策的欺騙性。將這種以地理空間和決策為中心的視角與人工智能相結合,可以提供必要的廣度,以協調物理行動與網絡和其他非空間領域的行動,跨越多個時間尺度,并具有快速適應變化的任務目標的靈活性。
人工智能和人-人工智能團隊的快速發展需要WMI同步發展。隨著新型人工智能對有價值的COA產生更好的預測,并能更好地處理復雜的決策,它們也必須利用人類的專業知識,學習如何處理具有高度不確定性、欺騙、隱性知識和博弈論的決策。相反,人工智能的推理必須既抽象又能與兵棋推演環境相聯系,以實現透明和信任,同時又不造成過度的認知負擔。基于三維混合現實的WMI可以利用和增強人類固有的三維認知和預測能力(Welchman等人,2005;Kamitani和Tong,2006;Kim等人,2014;Boyce等人,2019;Krokos等人,2019),如果設計得當,其交互將感覺自然,同時擴大顯示多個領域的信息的能力,同時使AI能夠適時地從用戶的決策中學習。
我們強調了三個關鍵的發展領域,即人工智能引導的決策指導,支持這種指導的計算基礎設施,以及決策透明度的混合現實表現的發展。這些領域的進步需要跨越許多不同學科的專業知識。新的人工智能發展需要融合神經科學、心理學和數學的思想,以克服復雜決策中長期存在的問題的瓶頸。這包括跨時間尺度的學習和變化環境下的災難性遺忘,以及更具體的兵棋推演問題,如具有不確定性、欺騙和博弈論的多Agent決策。計算基礎設施也需要發展,因為計算能力和數據框架對于在戰術邊緣產生人-人工智能團隊的共同操作圖來說都是必不可少的。為了有效地開發,應該通過一個共同的框架來抽象出專有的限制和軟件的依賴性,并為使用和故障排除提供清晰的文檔,以使學術界、政府和工業界更好地專注于解決人與人工智能的合作問題。這個通用框架應該包括有效的信息傳遞,同時提供靈活性和適應性,以滿足人工智能開發和人類用戶在訓練和實際使用環境中的需求。最后,交互技術的開發本身需要跨學科的協同專業技術。一個基礎性的問題是如何壓縮信息使之被用戶有效地理解,以及如何最好地利用用戶的互動來進行機會主義學習。人類的大腦并不處理所有的感官信息,而是對世界進行預測和假設,以便在信息不完整的環境下節約計算。一個有效的WMI應該同時預測潛在的決策結果以及個人用戶的期望和假設。此外,人工智能決策輔助工具必須估計用戶的默契,使其能夠提供最相關的信息和最有希望的選擇,這些信息來自整個作戰領域。
信息作戰和指揮與控制(C2)是美國陸軍可以向盟友和伙伴提供的兩種能力。在未來的作戰環境中,不僅要為動能作戰做準備,而且要為混合作戰和以信息為重點的戰爭做準備。這需要在復雜和默契推理的人工智能能力方面取得進展,在能夠提供持續訓練、分布式混合決策和大數據分析系統方面取得進展,以及在人與人工智能協作決策和機會主義學習方面取得進展,以實現人工智能的持續進步和人與人工智能的共同適應。這些進展中的每一項都需要跨學科的計劃性努力,以克服復雜的技術挑戰,創造新的決策原則、理論和理論方法,包括持續開發綜合測試平臺和技術,以實現政府、學術界和工業界的合作和協同發展。
自軍事航空業誕生以來,美國軍方一直對遙控飛機感興趣。今天的無人機系統(UAS)通常由一個無人駕駛飛行器(UAV)和一個地面控制站組成。自20世紀90年代,隨著MQ-1 "捕食者 "的推出,無人機系統在美國軍事行動中已變得無處不在。
美國軍方目前采用了幾種不同的大型無人機系統,包括
此外,其他幾個報告的項目計劃要么正在開發,要么目前正在進行試驗。這些計劃包括空軍的B-21突擊機和空軍的RQ-180。
當國會履行其監督和授權職能時,它可能會考慮與無人機系統有關的幾個潛在問題,項目相關的幾個潛在問題,包括
在美國軍方,遙控飛行器(RPV)最常被稱為無人駕駛飛行器(UAV),被描述為單一的飛行器(帶有相關的監視傳感器)或無人駕駛飛行器系統(UAS,或無人機系統),通常由一個飛行器與一個地面控制站(飛行員實際坐在那里)和支持設備組成。當與地面控制站和通信數據鏈相結合時,無人機形成了無人機系統或UAS。
美國國防部(DOD)對無人機的定義,并延伸至無人機系統,是指涵蓋下列特征的飛機:
根據國防部的定義,彈道或半彈道載具、巡航導彈和炮彈不被視為無人機系統。
無人機系統的作用和任務已經隨著時間的推移而演變,從收集情報、監視和偵察到執行空對地攻擊任務。此外,一些分析家預測了無人機系統的未來作用,如空對空戰斗和戰斗搜索和救援。然而,對無人機系統的未來概念和任務的詳細討論超出了本報告的范圍。
無人機系統在第一次世界大戰期間首次進行了測試,盡管美國在那場戰爭中沒有在戰斗中使用它們。美國在越南戰爭期間首次在戰斗中使用了無人機系統,包括AQM-34 Firebee,這一系統體現了無人機系統的多功能性。例如,"火蜂 "最初在20世紀50年代作為空中炮擊靶機飛行,然后在20世紀60年代作為情報收集無人機飛行,并最終在2002年被改裝為有效載荷。
美國軍隊在科索沃(1999年)、伊拉克(2003年至今)和阿富汗(2001年至今)等沖突中使用無人機系統,說明了無人機的優勢和劣勢。(下面討論的MQ-1 "捕食者 "進一步體現了這些優勢和劣勢)。當無人機系統執行歷史上由有人駕駛飛機執行的任務時,它們經常獲得媒體的關注。與有人駕駛飛機相比,它們似乎還具有兩個主要優勢:(1)它們消除了飛行員的生命風險(見關于MQ-4C的討論);(2)它們的航空能力,如續航能力,不受人類限制的約束,并使用對人類來說可能太危險的固有不穩定設計,改進低可觀察技術。此外,無人機系統可以通過執行不需要飛行員在駕駛艙內的 "枯燥、骯臟或危險 "的任務,潛在地保護飛行員的生命。這些任務的例子包括1999年由B-2轟炸機執行的30小時長航時任務(枯燥的任務);空軍和海軍的B-17飛機穿過核云收集放射性樣品(骯臟的任務);以及在存在主動威脅的情況下進行的情報監視和偵察飛行,如便攜式防空系統或綜合防空系統(危險任務)。
此外,無人機系統的采購和操作可能比有人駕駛的飛機更便宜。然而,較低的采購成本可能會與國防部的意見相權衡,即無人駕駛平臺比有人駕駛平臺更有可能發生A類事故,即造成250萬美元的損失、生命損失或飛機毀壞的事故(表1)。當比較事故率時,即以每10萬小時飛行的事故報告,以便對不同類型的飛機進行比較,與有人駕駛的飛機相比,無人駕駛的飛機發生A級事故的可能性要高92%;當MQ-1的事故率從無人駕駛的子類別中刪除時,與有人駕駛的飛機相比,MQ-9和RQ-4發生A級事故的可能性高15%(見表1)。雖然與無人駕駛平臺相比,有人駕駛飛機通常有更多的A類事故,但這一結果可能是由于有人駕駛飛機的數量更多。
表1. 1998至2021財年的軍用飛機失事和毀壞率
國防部通常使用三種模式來操作無人機系統:(1)政府擁有和操作的系統,(2)政府擁有但由承包商操作的系統,以及(3)承包商擁有和操作的系統。當無人機系統首次被引入部隊時,國防部使用了承包商擁有和操作的模式,因為國防部培訓軍事人員來操作這些新型飛機。在培訓了足夠的人員后,國防部過渡到了政府擁有和經營的模式。然而,國防部對分配給承包商運營的飛機(包括政府和承包商擁有的飛機)的任務類型進行了限制,將這些類型的行動限制在情報、監視和偵察的作用。
最早進入軍隊服役的無人機系統之一是MQ-1 "捕食者",當時國防部在1996年選擇了空軍來操作 "捕食者"。根據空軍的說法,"捕食者 "的設計目的是 "向作戰人員提供持久的情報、監視和偵察信息,并結合打擊能力"。20作為國防部高級研究計劃局(DARPA)合同下的先進概念技術示范機,"捕食者 "在1995年仍作為技術示范機進行了首次作戰部署,支持北約對塞爾維亞的空襲。從1999年3月到7月,"捕食者 "在科索沃上空飛行了600多架次,進行實時監視和戰損評估。2001年9月,"捕食者 "被部署到阿富汗,在2001年9月11日的恐怖襲擊之后,為支持 "持久自由行動 "提供長期的情報、監視和偵查。美國軍隊對 "捕食者 "的廣泛使用促進了其他密切相關的無人機系統(如下所述)的發展,這些系統旨在執行各種類型的任務。盡管 "捕食者 "于2018年3月9日正式退役,但美軍目前的大部分無人機系統機隊都是基于相同的技術,包括源自 "捕食者 "的機體。
“捕食者”由加利福尼亞州圣地亞哥的通用原子航空系統公司開發,以其綜合監視有效載荷和武器裝備能力幫助定義了無人機系統的現代作用。捕食者的主要功能是對潛在的地面目標進行偵察和目標獲取。為了完成這一任務,"捕食者 "配備了450磅的監視有效載荷,其中包括兩臺電子光學(EO)相機和一臺用于夜間的紅外(IR)相機。這些攝像機被安置在車頭下的球狀炮塔中。掠奪者 "還配備了一個多光譜瞄準系統(MTS)傳感器球,它在EO/IR有效載荷中增加了一個激光指示器,使掠奪者能夠跟蹤移動目標。此外,"捕食者 "的有效載荷包括一個合成孔徑雷達(SAR),它使無人機系統能夠在惡劣的天氣中 "看到"。捕食者的衛星通信提供了超越(地面)視距無線電的操作。
MQ-1捕食者的物理特征:"捕食者"是一種中高度、長壽命的無人機系統。它長27英尺,高7英尺,翼展48英尺,有細長的機翼和一個倒 "V "形的尾翼。"捕食者"通常在10,000到15,000英尺的高度運行,以便從其視頻攝像機獲得最佳圖像,盡管它能夠達到25,000英尺的最大高度。每輛飛行器可以在離其基地500多海里的地方停留24小時,然后返回家園。"捕食者"的飛行員和傳感器操作員從地面控制系統中駕駛飛機。
2001年,作為一項輔助功能,"捕食者 "配備了攜帶兩枚地獄火導彈的能力。以前,"捕食者 "識別目標并將坐標轉發給一架有人駕駛的飛機,然后與目標交戰,但增加反坦克彈藥后,無人機系統能夠對時間敏感的目標發動精確攻擊,并將 "傳感器到射擊 "的時間周期降至最低。因此,空軍將 "捕食者 "的軍事名稱從RQ-1B(偵察型無人機)改為MQ-1(多任務無人機)。
在 "捕食者 "作戰成功后,陸軍和空軍都開發了變種飛機,包括MQ-1C "灰鷹 "和MQ-9 "收割者"(下文討論)。這些飛機使用了原來的 "捕食者 "機身,同時增加了發動機功率和武器裝備。
以下各節概述了國防部目前選定的無人機系統項目。
除了RQ-170 "哨兵 "是一個公認的機密無人機系統項目外,這些選定的系統都有國防部發布的選定采購報告,其中提供了詳細的信息和系統特征。表2提供了這些選定的無人機系統的特征摘要。
表2. 選定的無人駕駛飛機的特征摘要
MQ-1C“灰鷹”(圖1)是MQ-1 "捕食者 "的陸軍衍生產品。根據陸軍的說法,MQ-1C“灰鷹”為作戰人員提供了專用的、有保障的、多任務的無人機系統能力,涵蓋所有10個陸軍師,以支持指揮官的作戰行動和陸軍特種部隊及情報和安全指揮部。 陸軍表示,MQ1C灰鷹能夠以150節的最大速度在25,000英尺的高度飛行至少27小時。它可以攜帶四枚地獄火導彈,以及光電傳感器、合成孔徑雷達和通信中繼器。根據2021財年選定的采購報告,陸軍的MQ-1C“灰鷹”在2019財年飛行了超過494,000小時,實現了92%的戰斗行動可用性。
圖1. MQ-1C “灰鷹”
陸軍總共采購了204架飛機,其中11架是訓練飛機,13架是 "戰備浮動飛機"(即備件)。平均采購單位成本(基本上是每架飛機的成本)為1.275億美元。36 陸軍在2018年8月完成了MQ-1C "灰鷹 "的作戰測試和評估,目前在15個陸軍連隊運營該無人機系統。
MQ-9 "死神"(圖2)--以前是 "捕食者B"--是通用原子公司對MQ-1 "捕食者 "的替代。根據空軍的說法,MQ-9 "死神 "是一種中高海拔、長續航時間的無人機系統,能夠進行監視、目標獲取和武裝對抗。盡管MQ-9 "死神 "借鑒了MQ-1 "捕食者 "的整體設計,但MQ-9 "死神 "長13英尺,翼展長16英尺。MQ-9 "死神 "還采用了900馬力的渦輪螺旋槳發動機,比MQ-1 "捕食者 "的115馬力發動機功率大得多。這些升級使MQ-9 "死神 "能夠達到最大50,000英尺的高度,240節的空速,24小時的續航時間,以及1,400海里的航程。然而,MQ-9 "死神 "與其前輩最不同的特點是其軍械能力。MQ1捕食者能夠攜帶兩枚100磅的地獄火導彈,而MQ-9死神可以攜帶多達16枚地獄火導彈,相當于陸軍阿帕奇直升機的有效載荷能力,或者混合500磅的武器和小直徑炸彈。在2018日歷年,MQ9 "死神 "總共飛行了325,000小時--其中91%的小時,即約296,000小時,是為了支持作戰行動而飛行的。
圖2. MQ-9 "死神"
2021年1月,通用原子公司披露了MQ-9 "死神 "的一個新的海上反水面戰變體。據報道,MQ-9B "海上衛士 "配備了聲納浮標投放(投放旨在識別潛艇的傳感器)和遙感能力(很可能是指 "海上衛士 "用于搜索水面艦艇的合成孔徑雷達),目前正在太平洋地區進行測試。
根據2020財年選定的采購報告,空軍已與通用原子公司簽訂合同,在該計劃的有效期內建造366架MQ-9 "死神"。按2008年美元計算,平均采購單位成本為2230萬美元(或按2022財年美元計算約為2800萬美元)。在2022財年,空軍沒有要求采購任何MQ-9 "死神",但眾議院軍事委員會在其標記中授權額外采購6架飛機。
由波音公司制造的MQ-25 "黃貂魚"(圖3)旨在為海軍的航母航空隊提供空中加油。根據海軍的說法,MQ-25將率先實現有人和無人操作的整合,展示成熟的復雜的海基C4I[指揮、控制、通信、計算機和情報]無人機系統技術,并為未來多方面的多任務無人機系統鋪平道路,以超越新興威脅。MQ-25的要求是解決基于航母的加油和持久的情報、監視和偵察能力的需要。
MQ-25 "黃貂魚 "由一個飛行器和一個控制系統組成,旨在適合航空母艦。它的首次飛行是在2019年9月進行的。MQ-25 "黃貂魚 "目前正處于采購過程的工程、制造和設計階段,海軍計劃在2023財政年度開始采購。根據2021財年的選定采購報告,海軍打算采購76架飛機,平均采購單位成本為1.21億美元。海軍在確定將加油作為其第一個航母上的無人機系統任務之前,研究了幾個無人戰斗飛行器概念。
圖3. MQ-25 "黃貂魚"
諾斯羅普-格魯曼公司的RQ-4 "全球鷹"(圖4)是美國空軍目前投入使用的最大和最昂貴的無人機系統之一。RQ-4 "全球鷹 "集成了多樣化的監視有效載荷,其性能被廣泛認為可與大多數有人駕駛的間諜飛機相媲美或超越。RQ-4全球鷹長47.6英尺,重32,250磅,與一架中等規模的公司飛機差不多大。根據空軍的說法,RQ-4全球鷹的飛行高度幾乎是商業客機的兩倍,可以在65,000英尺的高空停留超過34小時。它可以飛到5,400海里外的目標區域,在60,000英尺高空徘徊,同時監測一個伊利諾伊州大小的區域(近58,000平方英里)24小時,然后返回。RQ-4 "全球鷹 "最初被設計為一種自主的無人機,能夠根據預先編入飛機飛行計算機的輸入進行起飛、飛行和降落;然而,空軍通常在任務控制飛行員和傳感器操作員的配合下操作這些飛機。
圖4. RQ-4 "全球鷹"
RQ-4全球鷹目前以三種配置部署。Block 20、Block 30和Block 40:
20號機被稱為戰場機載通信節點(BACN,發音為 "bacon"),充當地面部隊的通信中繼。目前有四架飛機采用這種配置。
30號機使用合成孔徑雷達(SAR)、光電/紅外(EO/IR)傳感器、增強型綜合傳感器套件(EISS)和機載信號情報有效載荷(ASIP)的組合。Block 30的初衷是為了取代U-2間諜飛機。目前有20架Block 30飛機正在服役。
40號機整合了具有地面跟蹤能力的多平臺雷達技術(可跟蹤地面部隊的雷達,類似于E-8C JSTARS飛機)。10架Block 40飛機正在服役。
截至2016財年的選定采購報告,RQ-4全球鷹已經飛行了14萬小時(其中10萬小時支持作戰行動)。2014年,79.7%的飛機可用于執行任務。2014財年的平均采購單位成本為1.228億美元(或按2022財年調整后的美元計算為1.411億美元)。總統的2022財年預算請求重申了空軍計劃在2021財年退役所有Block 20飛機,并在2022財年退役所有Block 30飛機。
海軍的MQ-4C "海神"(圖5)也被稱為廣域海上監視(BAMS)系統,它以 "全球鷹 "Block 20機身為基礎,但使用不同的傳感器,與P-8 "海神 "有人駕駛飛機一起支持海上巡邏行動。根據2020財年選定的采購報告,"安裝在MQ-4C天龍上的任務傳感器提供360度的雷達和光電/紅外覆蓋"。報告稱,海軍打算在2020年10月達到初始作戰能力,并在2021年5月做出全速生產的決定。在2019年的年度報告中,作戰測試和評估主任表示,海軍結束了對該飛機的作戰評估,這支持了早期的實戰決定。MQ-4C "海獅 "的平均采購單位成本在2016財年為1.461億美元(或在2022財年約為1.626億美元)。
圖5. MQ-4C "海獅"
2019年6月,伊朗軍方在阿曼灣擊落了一架MQ-4C "海獅",國防部稱其為BAMS飛機。根據海軍的新聞簡報,這架飛機當時正在該地區飛行,監測霍爾木茲海峽是否有伊朗對商業航運的威脅。國防部官員表示,"這次襲擊是在最近國際航運和商業自由流動受到威脅之后,試圖破壞我們監測該地區的能力。" 當時,特朗普政府似乎考慮對伊朗摧毀一架美國飛機進行報復性打擊,但據報道,在回應一架無人駕駛飛機的損失時,升級風險是不值得的。
盡管RQ-170 "哨兵"(媒體也稱之為 "坎大哈的野獸")被公開承認存在,但關于它的大部分信息都是保密的。RQ-170 "哨兵 "首次在阿富汗上空被拍到,但據說也曾在韓國作戰,它是一種無尾的 "飛翼",比美國目前的其他無人機系統更隱蔽。 據報道,一架RQ-170 "哨兵 "在2011年5月1日對奧薩馬-本-拉登的駐地進行了監視和數據中繼。伊朗政府在2011年12月2日聲稱擁有一架完整的RQ-170 "哨兵",因為它被指控侵入了伊朗領空。
RQ-170 "哨兵 "由洛克希德-馬丁公司制造,翼展約65英尺,長近15英尺,由一臺噴氣式發動機驅動。它的上翼表面似乎有兩個傳感器托架(或衛星天線外殼)。雖然該機具有像B-2隱形轟炸機那樣的固有的低可觀察性混合機翼/機身設計,但RQ-170 "哨兵 "的常規進氣口、排氣口和起落架門表明其設計可能沒有完全針對隱形進行優化。
根據空軍的說法,"RQ-170哨兵是空軍正在開發、測試和投入使用的低可觀察性無人駕駛飛機系統(UAS)"。 沒有進一步的官方狀態。
盡管其他無人機系統項目正在開發中,但它們在很大程度上是保密的,因此有關它們的信息并不公開。這些項目包括B-21 "突襲者"(據說是一種能夠進行遠程駕駛的載人轟炸機)和RQ-180。2021年12月4日,空軍部長弗蘭克-肯德爾透露,空軍打算在2023財政年度啟動兩個新的無人機系統項目,但沒有其他信息。
B-21 "突襲者"
即將推出的B-21 "突襲者 "不是一個純粹的無人機系統;這種遠程轟炸機預計將由遠程或機上人員操作。B-21(圖6)打算在常規和核方面發揮作用,有能力穿透先進的防空環境并在其中生存。預計它將在20世紀20年代中期開始服役,建立一個由100架飛機組成的初始機隊。B-21將駐扎在德克薩斯州的戴斯空軍基地、密蘇里州的懷特曼空軍基地和南卡羅來納州的埃爾斯沃思空軍基地,其中埃爾斯沃思是訓練基地。
圖6. 對B-21的渲染圖
B-21是圍繞三個具體的能力而設計的:
1.一個大而靈活的有效載荷艙,能夠攜帶目前和未來的各種武器裝備。
2.航程(盡管是保密的)。
3.預計每架飛機的平均采購單位成本為5.5億美元(2010財政年度),這是公開宣布的,以鼓勵競爭廠商限制其設計。
盡管空軍已經發布了轟炸機的藝術效果圖,但具體設計仍然是機密。
為了實現5.5億美元的目標,單位成本被指定為采購戰略中的一個關鍵性能參數,這意味著達不到這個價格就會失去投標資格。(該價格是基于采購100架飛機;數量的變化可能會影響實際的單位成本)。在授標公告中,空軍透露,諾斯羅普公司中標的獨立成本估計為每架飛機5.11億美元,相當于2016財年的5.64億美元。空軍表示,截至2021年的平均采購單位成本在2010財政年度為5.5億美元,或在2022年為6.7億美元。
RQ-180
據報道,另一個正在開發的無人機系統項目是RQ-180,據說是一種轟炸機大小的無人機系統。 2014年6月9日,前空軍負責情報、監視和偵察的副參謀長羅伯特-奧托中將說,空軍正在 "研究RQ-180遙控飛機,以使其更好地進入有爭議的空域,在那里,無人駕駛的RQ-4全球鷹和有人駕駛的U-2S平臺是很脆弱的。" 關于RQ-180的其他細節幾乎沒有公開發布,空軍也沒有正式承認該計劃。
本節討論了國會在考慮國防立法時可能出現的問題,包括與載人系統的成本比較,缺乏后續的記錄項目,組織管理,與現有部隊結構的互操作性,以及出口管制。
在2021年6月的一份報告中,美國國會預算辦公室(CBO)研究了有人和無人的情報、監視和偵察(ISR)飛機之間的成本、可靠性和出動率。值得注意的是,CBO確定RQ-4全球鷹每飛行小時的成本約為18,700美元,或載人P-8海神的62%,后者可執行類似任務,每飛行小時的成本為29,900美元。報告還指出:
與P-8相比,RQ-4全球鷹預計每年多飛行356小時
RQ-4全球鷹的預計壽命為20年,而P-8的預計壽命為50年
RQ-4全球鷹的采購成本為2.39億美元,而P-8海神的采購成本為3.07億美元(約為該載人平臺采購成本的78%)。
同樣,其他UAS飛機的購置成本和每飛行小時的成本也比有人駕駛飛機低。然而,UAS飛機通常比有人駕駛飛機有更高的事故率。國會在比較飛機系統時可以考慮這種權衡--較低的成本與較高的風險。
在伊拉克和阿富汗沖突期間,美國軍方每年購買數百個無人機系統,主要是MQ-1 "捕食者 "和MQ-9 "死神",但也有RQ-4 "全球鷹 "和MQ-4 "海獅"。當這些沖突結束后,采購量驟然下降。例如,各部門在2012財政年度采購了1211架中型或大型無人機系統,但到2014年,每年的數量下降到54架無人機系統,而且這個數字還在繼續下降。2022財年的預算報告要求采購6套UAS。
國防部沒有對這一變化進行正式的評論;然而,有幾個因素可能影響了這一下降趨勢。一個是在伊拉克和阿富汗沖突期間獲得的許多無人機系統共享類似的技術,軍方可能沒有設定新的要求來納入新技術。另外,盡管那些第一代和第二代無人機系統在寬松的空中環境(如伊拉克和阿富汗的環境,那里沒有對手的空軍或防空部隊)下運行良好,但在與先進的防空部隊和飛機的近距離沖突中,它們會面臨更大的挑戰,而這些飛機越來越成為美國國防規劃的一部分。國防部也可能在更先進的技術(如噴氣動力無人機系統)成熟時,有意識地在采購方面采取戰略暫停。最后,許多無人機系統的開發被認為在這一時期轉移到了不被承認的機密系統。因此,國防部的采購可能沒有如此急劇下降,而是從非機密或公認的機密項目轉移到公共預算文件中看不到的非公認的機密項目。
盡管大多數美國軍用無人機系統是基于MQ-1 "捕食者 "機身的,但各軍種都有無人機系統項目。在授權和監督方面,國會可以考慮以下問題。誰應該管理國防部無人機系統的開發和采購?這些項目中至少有一部分的管理應該集中起來嗎?如果是這樣,國防部的中央機構應該設在哪里?
前空軍參謀長諾頓-施瓦茨將軍提出:"理想情況下,你想做的是讓美國政府以一種能夠讓我們獲得最佳能力的方式。一個例子是BAMS[MQ-4 Triton]和[RQ-4]全球鷹。為什么海軍和空軍要有兩個獨立的倉庫、地面站和訓練管道,來處理本質上是相同的飛機和不同的傳感器?我認為我們雙方有很多機會可以更好地利用資源。" 蘭德公司2013年的一項研究發現,從歷史上看,聯合載人飛機項目并沒有帶來生命周期的成本節約,但通過一個辦公室管理多個項目而不完全合并這些項目可能是可能的。
無人機系統在與有人駕駛飛機執行任務時帶來了潛在的互操作性挑戰,因為飛行員并不直接在飛機上,而是位于機場上,用于起飛和降落,或者位于美國的一個設施。例如,UAS飛行員依靠攝像機或傳感器與編隊中的有人飛機進行視覺接觸。在過去的20年里,陸軍和空軍都展示了將無人機系統整合到其行動中的方法;最近,陸軍在其2021財政年度的項目匯合中試驗了新的概念。然而,海軍和海軍陸戰隊在將無人機系統整合到他們目前的機隊和行動中的經驗有限,特別是在航空母艦和兩棲艦上的大型無人機系統。隨著新的無人機系統的開發,以及使用這些飛機的新概念,有人駕駛的飛機和無人機系統將如何整合仍有待觀察。同樣,目前還不清楚與空域沖突有關的問題在多大程度上會給國防部帶來挑戰。
美國通過多邊出口管制制度和國家出口管制來控制無人機系統的出口。
導彈技術管制制度
導彈技術管制制度(MTCR)"尋求限制 "核生化武器擴散的風險,"通過管制可能有助于此類武器運載系統(除有人駕駛飛機外)的貨物和技術的出口"。1987年由美國和其他六個國家成立的MTCR,每年舉行幾次會議,目前由35個伙伴國組成,是一個非正式的自愿安排,其伙伴國同意對一個包含兩類受控物品的附件適用共同的出口政策準則。伙伴國根據國家立法執行這些準則,并定期交流有關出口許可證問題的信息,包括拒絕技術轉讓。MTCR準則適用于武裝和非武裝無人機系統。
第一類MTCR項目是最敏感的,包括 "能夠在至少300公里范圍內運送至少500公斤有效載荷的完整無人機系統,其主要的完整子系統......以及相關的軟件和技術",以及為這些無人機系統和子系統 "專門設計的 "生產設施。伙伴國政府應 "強烈推定拒絕 "此類轉讓,無論其目的如何,但可在 "罕見情況下 "轉讓此類項目。 該準則禁止出口第一類物品的生產設施。制度伙伴在授權出口第二類物品方面有更大的靈活性,其中包括不太敏感和兩用的導彈相關部件。這一類別還包括完整的無人機系統,無論有效載荷如何,射程至少為300公里,以及具有某些特征的其他無人機系統。
MTCR準則指出,各國政府在考慮MTCR附件物品的出口請求時應考慮六個因素。(1) 對核生化擴散的關注;(2) 接受國 "導彈和空間計劃的能力和目標";(3) 轉讓對核生化運載系統的 "潛在發展意義";(4) "對轉讓的最終用途的評估",包括下文所述的政府保證;(5) "相關多邊協定的適用性";以及(6) "受控物品落入恐怖團體和個人手中的風險"。 " 該準則還規定,如果伙伴國政府 "根據所有可用的、有說服力的信息 "判斷該物品 "打算用于 "核生化武器的運載,則強烈推定拒絕轉讓MTCR附件中的任何物品或任何未列入清單的導彈。
此外,MTCR準則指出,如果出口國政府不判斷擬議的第一類無人機系統的轉讓是用于核生化運載,政府將從接受國獲得 "有約束力的政府對政府的承諾",即 "未經 "出口國政府的同意,"該項目或其復制品或衍生品都不會被再次轉讓。出口國政府還必須承擔 "采取一切必要步驟,確保該物品只用于其既定的最終用途 "的責任。此外,政府只有在得到 "接受國政府的適當保證",即接受國將只為其既定目的使用這些物品,并在未經出口國政府事先同意的情況下不修改、復制或重新轉讓這些物品的情況下,才可批準轉讓 "可能有助于[核生化]運載系統 "的物品。伙伴國政府的出口管制必須要求在政府通知出口商此類物品 "可能全部或部分用于......載人飛機以外的[核生化]運載系統 "的情況下,授權轉讓未列入清單的物品。這些限制被稱為 "全面 "管制。
其他多邊出口管制制度
其他多邊制度限制可能使無人機系統開發核生化有效載荷的技術的出口。例如,核供應國集團管理與核有關的出口,而瓦森納安排在常規武器和某些兩用貨物和技術方面發揮著類似的作用。澳大利亞集團是與化學和生物武器有關的技術的類似組織。
美國的出口管制
從2017年開始,美國向MTCR合作伙伴提交了一系列建議,以放寬該制度對某些無人機系統的出口準則。 這些政府以協商一致的方式作出決定,但沒有同意采納任何這些建議。2020年7月24日,特朗普政府宣布了一項新的無人機系統出口政策,將 "精心挑選的MTCR第一類無人機系統的子類,其飛行速度不能超過每小時800公里(大約每小時500英里),視為第二類",從而克服了MTCR對這些系統的 "強烈拒絕推定"。美國已經向法國、意大利、日本、德國、韓國、西班牙和英國出口了MTCR第一類無人機系統。
美國商務部工業與安全局(BIS)2021年1月12日的最終規則實施了對美國兩用許可程序的相關修改。BIS向國會提交的2020財政年度報告指出,取消了所有2020年MTCR會議,并解釋說,美國單方面采取這一政策是因為 "在可預見的未來,MTCR沒有進一步進展的場所"。 國務院的一位官員說,該提案 "仍然是我們在MTCR中的一項優先努力,但這--與其他許多事情一樣--受到了旅行限制的阻礙",該限制是為了應對COVID-19病毒帶來的風險。MTCR成員在2021年10月舉行了一次全體會議,但沒有通過美國的提案。
美國對無人機系統的出口施加了一些其他限制。美國務院負責管理對軍用無人機系統和其他國防物品的出口管制;這一制度的法定依據是《武器出口管制法》(AECA;P.L. 94-329)。該法第71(a)條要求國務卿保持一份MTCR附件中所有不受美國雙重用途管制的物品清單。美國出口管制法》還限制了原產于美國的國防物品的用途,并禁止未經美國政府許可向第三方轉讓此類物品。2018年出口管制法》(P.L. 115-232,B副標題,第一部分)為總統提供了廣泛而詳細的立法授權,以實施對兩用物品出口的控制,包括兩用無人機系統和相關組件。美國關于兩用物品出口的法規包含對無人機系統的全面控制。
美國政府還實施了一些法規,以確保原產于美國的無人機系統的接收者將這些物品用于其申報的目的。根據2019年5月國務院的一份概況介紹,美國將轉讓軍用無人機系統,"只有采取適當的技術安全措施"。 國務院和商務部都會進行最終監測,以確定接受國是否適當地使用出口物品。概況介紹說,一些軍用無人機系統 "可能要接受強化的最終使用監測",以及 "額外的安全條件"。根據國務院的概況介紹,美國轉讓MTCR第一類無人機系統也 "應要求與 "美國政府就該系統的使用進行定期磋商。
先進作戰管理系統(ABMS)是美國空軍創建下一代指揮和控制(C2)系統的最新計劃項目。ABMS建議使用云環境和新的通信方法,使空軍和太空部隊系統能夠使用人工智能無縫共享數據,以實現更快的決策。空軍將ABMS描述為其創建物聯網的努力,這將使傳感器和C2系統相互分解(與空軍傳統上執行C2的方式相反)。該計劃是空軍對國防部全域聯合指揮與控制(JADC2)工作的貢獻,重點是使國防部的作戰決策過程現代化。
ABMS最初的設想是取代目前指揮空戰行動的E-3機載預警和控制系統(AWACS)(圖1),但后來有了更廣泛的范圍。前空軍負責采購的助理部長威爾-羅珀指示,該計劃應減少對指揮中心和飛機的關注,而是創造數字技術,如安全云環境,在多個武器系統之間共享數據。羅珀博士表示,2018年國防戰略所設想的有爭議的環境迫使空軍重組ABMS項目。2021年5月,空軍副參謀長大衛-奧爾文將軍在DefenseOne的一篇文章中說:"ABMS究竟是什么?它是軟件嗎?硬件?基礎設施?策略?答案是都是"。換句話說,空軍將ABMS設想為一個采購項目,它既要采購東西,又要實施其他非開發性的工作,該部門認為這些工作同樣重要:指揮和控制空軍的新技術。
自ABMS成立以來,國會已經對下一代C2系統的發展表示了興趣。空軍表示,ABMS是一個非傳統的采購項目。因此,國會對空軍替換老舊系統的方法和試驗新興技術的方法提出了質疑。
迄今為止,空軍已經進行了五次活動,以展示其希望最終投入使用的新C2能力。2019年12月,空軍在其第一次ABMS "on-ramp"(空軍用來表示演示的術語)中,展示了從陸軍雷達和海軍驅逐艦向F-22和F-35戰斗機傳輸數據的能力。這次活動還展示了空軍的統一數據庫(UDL),這是一個結合天基和地基傳感器追蹤衛星的云環境。
2020年9月,ABMS進行了第二次"on-ramp"。這第二次上線演示了通過使用超高速武器作為防御手段,探測和擊敗一個飛向美國的模擬巡航導彈。此外,ABMS還展示了 "探測和擊敗破壞美國太空行動的手段"的能力。根據空軍的新聞稿,"70個工業團隊和65個政府團隊 "參加了這次活動。
空軍在2020年9月下旬舉行了第三次"on-ramp",以支持珍珠港-希卡姆聯合基地的 "勇敢之盾 "演習。在這次活動中,空軍展示了使用KC-46加油機通過將數據從較老的第四代戰斗機轉發到較新的第五代飛機,如F-22,來執行戰術C2。2021年5月,空軍表示,為KC-46采購通信吊艙將是ABMS項目的第一個能力發布。空軍說:"在戰斗中,無論如何,郵機將需要在作戰附近飛行,支持戰斗機,因此將它們作為指揮和控制系統,無論是作為主要的還是彈性的備份,都是有意義的。"
2021年2月在歐洲舉行了第四次"on-ramp"。根據新聞稿,空軍由于預算限制而減少了這次活動規模。這第四次將包括荷蘭、波蘭和英國在內的盟國聯系起來,進行聯合空中作戰。據美國駐歐洲空軍司令哈里根將軍說,這第四次活動測試了美國和盟國用F-15E飛機發射AGM-158聯合空對地對峙導彈(JASSM)執行遠程打擊任務的能力(見圖2),同時利用美國和盟國的F-35飛機執行空軍基地防御任務。
本預計2021年春季進行第五次"on-ramp"在太平洋地區,但由于預算限制,取消了這次活動。
2019財年國防授權法案(NDAA)指示政府問責局(GAO)評估ABMS計劃。在2020年4月的一份報告中,GAO向空軍總設計師建議采取四項行動來提高項目績效。
1.制定一個計劃,在ABMS開發領域需要時獲得成熟技術。
2.制作一個定期更新的成本估算,反映ABMS的實際成本,每季度向國會匯報一次。
3.準備一份可購性分析,并定期更新。
4.正式確定并記錄參與ABMS的空軍辦公室的采購權力和決策責任。
空軍助理部長同意了所有的建議。前空軍參謀長David Goldfein將軍不同意這些建議,他指出GAO的分析沒有反映機密信息。美國政府問責局表示,它可以接觸到機密信息,這些額外的信息并不影響其分析和建議。
根據GAO關于ABMS的同一份報告,空軍最初確定由空軍總設計師(普雷斯頓-鄧拉普),來協調空軍每個項目執行辦公室的ABMS相關工作。GAO對這種管理結構可能導致ABMS缺乏決策權表示擔憂。然而,在2020年11月,羅珀博士選擇空軍快速能力辦公室作為ABMS項目執行辦公室。首席架構師辦公室繼續開發全軍的架構(即軟件和無線電如何能夠相互連接),以支持ABMS。
國會已經對ABMS系統的發展表示了興趣。下面的清單總結了國會在前三個NDAA中的行動:
2019財政年度NDAA(P.L. 115-232):
2020年國防部(P.L. 116-92):
FY2021 NDA (P.L. 116-283) :
2021財年國防撥款法案(P.L. 116-260 C分部)將ABMS的資金從要求的3.02億美元減少到1.585億美元,理由是 "不合理的增長和預先融資"。
在ABMS的整個發展過程中,國會對在確定合適的替代物之前退役舊的C2系統如JSTARS和AWACS表示關注。國會還指示空軍制定傳統的采購理由,如成本估算和需求文件,以確保國會和軍方都了解要采購的東西。這些行動反映了美國政府問責局的建議。
使用ABMS方法分解指揮和控制的風險是什么?
空軍應如何平衡創新、實驗與采購成熟技術?
ABMS提供了哪些傳統指揮與控制系統無法提供的機會?
利用6.8軟件和數字技術試點計劃預算活動代碼中的新預算授權靈活性,ABMS是否會受益?
由HAVELSAN公司開發的虛擬環境中的部隊(FIVE)模擬器軟件,利用各種虛擬戰爭設備(如武器、傳感器和通信工具等),以安全和具有成本效益的方式提供全面的戰術和行動訓練環境。目前,管理FIVE實體的行為模型高度依賴于由現場專家和系統工程師開發的基于規則的行為。然而,FIVE軟件的基于規則的操作需要密集的編程和現場專家的指導,因此是高度勞動密集型。此外,這項任務的復雜性和負擔隨著場景的復雜性而大大增加。此外,具有基于規則的行為的虛擬實體對其環境有標準和可預測的反應。因此,在這項研究中,我們通過強化學習技術和其他機器學習技術,即FIVE-ML項目,提出了從基于規則的行為到基于學習的自適應行為的過渡研究。為此,我們主要對空對空和空對地兩種情況下的六個虛擬實體進行了基于強化學習的行為模型訓練。據觀察,用強化學習訓練的虛擬實體主導了現有的基于規則的行為模型。在這些實驗中,我們還發現,在強化學習之前,利用監督學習作為起點,可以大大減少訓練時間,并創造出更真實的行為模型。
今天,培訓將使用飛機的飛行員是最重要的。用真實的飛機訓練飛行員是相當困難的,原因包括空域法規、過高的成本和訓練中可能出現的風險,以及創造真實世界場景的復雜性,包括對手或盟友使用的真實防御和戰爭平臺。飛行員訓練中使用的飛行模擬經常與戰術環境模擬結合在一起工作。通過這些戰術環境模擬,飛行員通過控制高保真飛機模型在許多低保真實體的存在下完成場景的訓練。這些低保真資產由計算機創建和控制,通常被命名為計算機生成的部隊(CGF)[1],它們是代表空中、陸地或海上防御或攻擊系統的自主單位。
CGFs被用于人員部署的準備過程、戰術訓練或新戰略的開發。CGFs需要為每個應用(或每個場景)進行不同的編程。這些由傳統方法創造的力量會導致非適應性和不靈活的行為模式。這導致學生在靜態編程的資產面前接受模擬訓練,降低了訓練的質量。當需要新的場景時,需要專家來創建新的場景。此外,由于情景創建將使用經典的控制分支進行,在創建新情景的過程中,考慮所有的可能性往往是不可行的,即使是可能的,也是一項相當有挑戰性的任務。由于這些原因,人們越來越需要更真實的虛擬環境和新的場景來適應不斷變化的世界,以模擬飛行員候選人自己的任務和敵對部隊的當前能力和戰術。
在這項研究中,提出了向以人工智能為導向的行為建模過渡,而不是傳統的特定場景建模,以此來解決前面描述的問題。換句話說,虛擬實體將被轉化為能夠學習的動態虛擬實體。但這些虛擬實體在訓練過程中需要考慮許多情況。首先,他們必須學會對他們用傳感器感知到的環境因素作出適當的反應。然后,它必須識別他的隊友和敵人,并根據他們的等級信息和附加在他們身上的彈藥類型采取行動。它應該能夠與他的隊友合作,采取團隊行動。
為虛擬資產添加智能的機器學習的首選方法是強化學習(RL)[2],其根本原因是:實體將采取的行動有延遲的后果。近年來,與傳統的控制方法相比,RL被認為是解決復雜和不可預測的控制問題的新方法,并在許多領域得到利用,如機器人、計算機視覺、自動駕駛、廣告、醫學和保健、化學、游戲和自然語言處理[3]-[9]。自從將深度學習引入RL概念(即深度RL[10])后,文獻中的研究得到了提升,如許多具有挑戰性的計算機視覺和自然語言處理任務[11]-[15]。
為了這個目的,在這項研究中(即FIVE-ML),已經實現了從HAVELSAN FIVE軟件的基于規則的行為模型向基于RL的行為模型過渡的第一階段實驗。從這些實驗中可以看出,用RL算法訓練的智能虛擬實體在空對空和空對地的情況下都優于HAVELSAN現有的基于規則的實體。此外,模仿學習[16]、[17]和RL的聯合實施也取得了成功,這加快了FIVE軟件的完整過渡過程。
可以預見,通過學習飛行員候選人的選擇來開發新策略的模擬將把飛行員培訓帶到一個非常不同的點。當項目完成后,將設計一個新的系統,允許在其領域內培訓更多裝備和專業的戰斗機飛行員。一個現有的基于規則的場景系統將演變成一個可以自我更新的系統。因此,飛行員候選人將有機會針對智能實體發現的新策略來發展思路,而不是滿足于該領域的專家的知識和經驗。此外,從一個經過大量努力準備的場景機制,計算場景自動化機制將使整個過程自動化。
步兵模擬(IWARS)是一個實體級的戰斗模擬,通常用于估計使用不同裝備(包括手榴彈和榴彈發射器)造成的作戰效能差異。當一枚模擬手榴彈在IWARS中爆炸時,對附近人員的影響是通過查詢一個高分辨率模型預先計算出的喪失能力的概率值來確定的。這個值取決于許多因素,因此需要一個大的查詢表,可能會超過數據庫的最大容量。為了解決這個問題,創建了一個神經網絡輸入選項,讓分析師有機會使用高度壓縮的數據而不犧牲準確性或運行時間。以前的壓縮技術要么不太準確,要么提供較低的壓縮率。
這項研究是在2019財年進行的,是題為 "機器學習技術協助生成項目級性能估計,用于班級和士兵級作戰評估 "的研究的一部分。該研究的另一半將在另一份報告中討論。在這一半的研究中,梯度增強的決策樹被用來成功地預測人類主題專家(SMEs)的代理決定。(當所要求的系統沒有數據時,一個類似的系統通常被用作代用。) 訓練有素的決策樹模型可以用來為未來的數據請求建議代理,減少滿足這些請求所需的時間并提高所提供數據的準確性。
步兵模擬(IWARS)是一個實體級的戰斗模擬,重點是下馬的士兵、班和排,通常被陸軍用來估計使用不同裝備造成的作戰效率的差異。特別是,IWARS被用來比較不同手榴彈和榴彈發射器的有效性[1, 2, 3],幫助指導這些系統的開發和采購。
當一個模擬的手榴彈在IWARS中爆炸時,對附近人員的影響是通過查詢一個高分辨率模型預先計算出來的喪失能力的概率(P(I))值來確定的。P(I)值取決于許多因素,包括目標的姿態、防彈衣和任務(攻擊或防御),以及彈藥的下落角度、爆炸高度、爆炸到目標的范圍、爆炸到目標的方位角和爆炸后的時間。由于有這么多的因素,P(I)查詢表可能非常大。事實上,一個高分辨率的查詢表往往太大,無法裝入IWARS數據庫的最大容量約150兆字節。
為了解決這個問題,分析人員可以將IWARS數據庫分成更小的部分。例如,對12種新型空爆手榴彈的分析可以通過建立12個IWARS數據庫來進行,每種手榴彈一個數據庫。如果描述一種手榴彈的殺傷力數據太大,或者在特定情況下需要一種以上的手榴彈,但只有一種手榴彈的殺傷力數據可以放入一個數據庫,那么這種策略就會失敗。此外,即使這種策略是可行的,也有缺點:任何額外的數據庫變化都必須被鏡像12次,而且數據庫的大小會降低IWARS和數據庫編輯工具的速度。
另外,分析人員可以通過使用低分辨率的P(I)數據來規避數據庫的大小限制。這通常是通過刪除某些突發高度和突發到目標的范圍,并將突發到目標的方位角組的P(I)值平均化來實現的。這降低了模擬的準確性,也降低了對結果的信心。
本文的目的是記錄這個問題的一個新的解決方案,這個方案在所有情況下都有效,而且幾乎沒有精度損失或模型運行時間的增加。它可以描述如下:
1.訓練人工神經網絡來學習P(I)值。然后,神經網絡的參數值將對原始P(I)數據進行編碼,從而對其進行壓縮。
2.在IWARS中重新創建這些神經網絡,以便在需要時估計P(I)值。