亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

準確的軌跡和目標定位是為決策者提供執行任務信心的關鍵。越來越多的不同情報來源的多種情報、監視和偵察(ISR)資產被用來提高跟蹤定位的準確性,因此需要開發利用異質傳感器數據流的方法,以更好地估計目標狀態。常用于目標狀態估計的算法之一是卡爾曼濾波(KF)算法。如果其協方差矩陣是對傳感器測量的不確定性的準確近似,該算法表現良好。此研究補充了美國海軍正在進行的人工智能/機器學習(AI/ML)工作,定量評估了使用ML模型預測傳感器測量噪聲進行KF狀態估計的潛力。使用計算機模擬來生成單個目標的傳感器軌跡,并訓練一個神經網絡來預測傳感器的誤差。混合模型(ML-KF)能夠在目標位置估計中比使用歸一化傳感器誤差的基線KF模型的性能好大約20%。進一步研究用外部環境變量作為輸入來增強ML模型,有可能創建一個能夠在不同環境下運行的自適應狀態估計系統。

處理和利用多種情報數據流的能力對于實現卓越的戰斗空間態勢至關重要。美國海軍,特別是海軍信息部隊(NAVIFOR),正在探索人工智能(AI)/機器學習(ML)技術的有效性,以協助數據融合并提供快速和及時的共同作戰圖像(COP)/共同戰術圖像(CTP)分析。一個重點領域是過濾來自不同傳感器系統的數據,以提供對戰斗空間中目標的改進的狀態估計。這是一項關鍵任務,因為準確的跟蹤和瞄準是為決策者提供執行任務信心的關鍵。

本論文旨在評估整合人工智能/ML算法和技術的可行性,以過濾異質數據集,提高開發COP/CTP時的軌跡估計的準確性。卡爾曼濾波法(KF)及其變種經常被用來估計戰斗空間中目標的位置。然而,估計的準確性會受到外部條件變化和對目標假設的違反的極大影響。

Gao等人(2020年)、Jouaber等人(2021年)和Ullah等人(2019年和2020年)的研究表明,在標準KF中集成一個學習模塊,以提高狀態估計的準確性。這項研究使用一個神經網絡(NN)來學習與傳感器測量相關的測量不確定性的變異性。這些變異性的存在是由于外部因素的變化,如天氣狀況,這些因素并沒有直接作為KF算法的狀態模型。這有可能提高我們的COP/CTP,特別是當外部因素動態地影響我們的傳感器融合系統時。

我們使用一種定量的方法來評估選定的人工智能/ML算法在過濾目標位置數據集方面的準確性。我們假設,在KF模型中加入學習模塊將超過標準的KF模型,并對目標位置提供更好的估計。為此,我們設計了一個三階段的數據管道(圖1)。

圖 1. 評估跟蹤過濾算法的方法。

首先,使用模擬軟件生成傳感器數據--Command。現代行動(CMO)由Matrix Games(Matrix Games, 2022b)開發。使用了一個由來自不同情報領域的多個對峙傳感器和一個單一目標組成的場景。第二,開發了兩套模型--使用KF算法的標準基線模型,以及使用嵌入KF算法的神經網絡的另一套模型(我們稱之為ML-KF模型)。這個神經網絡是一個在訓練數據集上訓練的學習模塊,用來估計KF的傳感器測量噪聲。我們在可能的不同超參數中進行超參數搜索,以提高每個傳感器的ML模型的性能。在最后階段,兩個模型的性能被評估為估計目標狀態位置的準確性。

我們的研究結果表明,整合ML模型來估計標準KF算法的傳感器測量誤差矩陣,可以顯著提高目標狀態估計的準確性,在5%的置信度下約為20%。綜上所述,我們的貢獻有以下幾點。

  1. 我們開發了一個ML操作管道,從模擬中攝取數據來訓練、驗證和測試機器學習模塊,以便隨后部署在KF系統中。該方法、數據集和生成的模型是可重現和可復制的,因為用于該開發的代碼庫和框架是完全開源的。

  2. 我們已經證明,嵌入標準KF算法的學習模塊可以比標準KF模型改善狀態估計。ML-KF模型能夠產生一個傳感器測量誤差矩陣來更新KF算法對傳感器測量的概率信念,從而改善KF的估計。

  3. 我們之所以能夠訓練KF模型中使用的學習模塊,只是因為我們的仿真系統提供了一個實戰范圍可能無法提供的地面真實目標狀態。這證明了使用模擬來開發ML模型并隨后將其部署在現場的潛力。

我們的研究使用ML模型來預測標準KF算法的傳感器測量誤差。我們的ML-KF模型能夠在5%的置信度下明顯優于我們的基線模型,表明使用ML-KF模型將改善目標位置狀態估計的性能,緩解了異質傳感器數據流中不存在傳感器測量的不確定性時的性能問題。換句話說,在沒有傳感器數據的不確定性測量時,嵌入KF的ML能夠預測不確定性并動態更新KF算法的參數。

這個概念驗證有可能使用更復雜的方法進一步擴展。我們提出了未來研究的三個關鍵領域。1)通過包括在KF中沒有直接建模或使用的其他參數(如戰斗空間的天氣狀況),來提高ML-KF模型的可推廣性。2)使用時間序列方法對目標的時間運動進行建模,從而提高嵌入KF中的學習模塊的預測能力。3)使用ML模型進行多目標數據過濾(JDL 2級),通過包括分類任務來對跟蹤數據進行分類。

隨著國防部越來越多地將重點轉移到ML的應用上,我們認為,這種在數據過濾中的應用將能夠增強現有的數據過濾方法,并消除替換這些方法的費用。例如,通過增強現有的COP/CTP數據過濾算法,我們將能夠對目標進行更準確的狀態估計,從而對目標在COP/CTP中的位置提供更高的信心。這種ML-KF模型攝取異質數據流的能力也是一個強大的工具,可以使情報分析員的工作自動化,他們經常需要在不同的情報領域交叉參考他們的來源。通過改進我們的作戰人員可用的成套工具,他們在應對任何對手時將更具殺傷力。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

(圖:作家兼戰略家彼得辛格(左)于 2018 年 11 月 1 日在一個未命名的空軍設施與一名軍官和一名國防部文職人員討論新技術。人工智能和腦機接口等進步將改變陸軍作戰的方式。)

長期以來,決策一直是戰爭的核心。最近,戰爭的節奏、規模、不透明性、非線性和連通性的增加對當代決策過程提出了越來越多的挑戰。在未來,這種變化將同時增加及時和有效決策的重要性,同時進一步加劇許多指揮官的認知和決策挑戰。指揮官將尋找結構不良、高度復雜的問題的解決方案,這些問題延伸到空中、陸地、海上、信息、網絡和空間這六個領域。隨著新技術和新應用的實現,未來的事態對復雜性構成了潛在的增長,并將以指數級的速度增加。人類的學習,甚至是最老練的指揮官的直覺能力都無法跟上不斷變化的戰爭特征。要想把贏得戰斗的洞察力帶到未來,必須對人類的認知、決策過程進行改進,或對其進行增強。

決策能力和現有支持的割裂造成了分析性決策過程、指揮官的直覺和有效決策之間日益擴大的能力差距。當前和未來的環境表明,有必要開發更加靈活的決策支持工具,以阻止這種差距,并為指揮官重新獲得決策優勢。在一個不透明和復雜的環境中有效地預測未來幾場戰斗的能力將是成功的關鍵。同時,在一個能夠迅速使以前的計劃失效的動態環境中,理解并首先做出反應的能力對于奪取和保持主動權至關重要。

復雜性科學和混沌研究已經與類似的問題進行了斗爭,并為軍事指揮官的突發挑戰提供了相關的見解。計算機建模和人工智能(AI)方面的工作已經取得了巨大的進展。在許多游戲中,計算機已經超越了人類的決策能力。

從人工智能的主導地位中適應和發展,國際象棋中的人機團隊已經達到了決策的新巔峰,將提前數個回合評估未來動作的算法的卓越戰術與人類的戰略能力相結合。目前美國與人工智能和決策有關的國防努力似乎集中在大數據和數據分析上。然而,如果沒有一個改進的軍事決策框架,就不能利用預測性分析。否則,增加的數據和分析只會加劇理解日益復雜和動態的作戰環境的挑戰。

軍事決策過程(MDMP)雖然在分析上是合理的,但其結構并沒有跟上未來環境的步伐。沖突的速度將超過工作人員處理分析貢獻的能力。

用人工智能對MDMP進行修改和增強,將創造一個過程,以更快的速度產生對環境的理解,并以物理信息的框架為基礎。行動方案的制定將不會像現在這樣,從一個理想的最終狀態向后發展,在理論上運用方法和手段來創造一個想象的未來。由人工智能支持的MDMP將從當前狀態向前工作。它將通過友軍和敵軍決策樹的可能分支向前探索,走向各種環境和敵軍的行動路線,通過最小化風格的決策樹,將其作為適應性代理來實現。替代行動的未來將通過可行性的出現來建立,并通過優化作戰功能的貢獻來完成,固有的區別,然后由人機團隊的人類部分來判斷是否合適和可接受。重新設想的人-機MDMP將與未來的操作環境保持同步,通過以接近機器的速度操作來保持相關性,使人能夠在日益濃厚的戰爭迷霧中獲得卓越的視野。

指揮官雖然得到參謀部的支持,但最終還是利用自己的能力進行決策。當指揮官在進行問題解決以制定對其工作人員或下屬的指導時,他們基本上是在進行 "手段-目的分析,這是一個尋找手段或步驟的過程,以減少當前情況與預期目標之間的差異"。即使是直覺,即對一個事件或數據的突然有洞察力的解釋,也以類似的方法發揮作用。"盡管表面上突然閃現的洞察力似乎產生了問題的解決方案,但研究表明,人們在解決洞察力問題時使用的思維過程最好被描述為一種漸進的、手段-目的的分析。" 領導者認識到相似性,并將其與個人和所研究的歷史聯系起來,從而獲得洞察力。心理學家、經濟學家和諾貝爾獎獲得者丹尼爾-卡尼曼(Daniel Kahneman)用這樣的描述來解釋內部的、經常是半意識的過程:"產生印象、直覺和許多決定的心理工作在我們的頭腦中默默地進行"。數學物理學家、科學哲學家和諾貝爾獎獲得者羅杰-彭羅斯描述了一種無意識的思想發展和對這些思想的有意識判斷。

MDMP有一個類似的、不亞于人類的動態。參謀部通過行動方案(COA)的制定產生備選方案,并由指揮官決定。然而,在行動方案的制定過程中,正如在手段-目的推理中一樣,用于簡化計算的啟發式方法以及一些神經心理學上的缺陷,限制了選擇并注入主觀性。歸根結底,目前MDMP內部的COA開發過程仍然需要大量的頭腦風暴來解決。

與主觀開發選項形成對比的是基于衡量和計算的選項開發,而這一過程將由人工智能支持的程序執行。通過一些基于現有信息和過去沖突的數據的計算,可以對比出AI賦能的MDMP會提供的建議。

對2008年俄格戰爭期間的決策和計劃進行評估,在與歷史上的決策、行動和結果進行對比時,可以深入了解人工智能驅動的MDMP的好處。以下是人工智能驅動的MDMP背后的邏輯和過程

俗話說,如果情報是用來推動機動的,那么對戰場的情報準備的產出必須作為COA發展的起點,使友軍COA的創建能夠實現對對手的不對稱,并執行對對手行動最有利的行動。

從對敵方力量的評估中,可以根據具體的任務變量來確定所需的友軍力量。要做到這一點,需要一種衡量對手戰斗力的方法。有許多復雜程度不同的方法來確定一個代表戰斗力的數值。

人工智能程序可以使最繁瑣的系統變得可行,所以它不像參謀部那樣受到復雜性的限制,特別是在時間有限的時候。雖然這個例子使用了戰區分析模型(TAM),但TAM并不是重點。指揮官、參謀部或學說推薦的任何東西都可以使用。

在2008年俄格戰爭爆發前,俄羅斯部隊在北奧塞梯駐扎。這些部隊可以按地點轉化為戰斗力值。例如,在馬米森山口附近的俄羅斯部隊可以按其組成部件進行統計,如人員、T-72主戰坦克、2S3自行火炮和BM-21多管火箭炮系統。

圖 1. 俄羅斯軍隊戰斗力計算

圖1中顯示的戰斗力范圍可以告知所需的戰斗力,這些戰斗力來自于格魯吉亞部隊的位置,用藍色矩形標注,以便在各種可能的情況下擊敗這支俄羅斯部隊。圖1中描述的兩種情況是俄羅斯使用西面的馬米森山口或東面的羅基隧道(帶箭頭的紅線)。

與戰斗力計算一樣,從計算機建模中得出的計算結果可以用來預測基于部隊和手段的相應相關性的傷亡。在這里使用的算法中,戰斗力是根據地形和任務類型對每種能力或系統進行調整。一旦對戰斗力進行了調整,該模型描述了在部隊比例為1:1時的傷亡分布情況,有一條非線性曲線,在戰斗力比例大約為4.4:1時趨于平緩,顯示了一個粗略的收益遞減點。這種計算方法不能提供 "任務成功 "的百分比機會,但可以提供預期戰損和傷亡的迭代,顯示雙方的戰斗力如何隨著時間的推移而受到影響。必須對將導致失敗或撤退的戰斗力損失做出假設,但這是一個很好的例子,說明人類的洞察力可以被迫提供具體的情況。從這些計算中出現的洞察力的開端是,1:1的比例仍然是消耗性的,而2:1的比例有可能在兩次反復中增長到2.4:1然后是4.5:1。這就形成了一種機制,在時間上尋求有利的戰斗比例,可以決定性地改變平衡。這不是一個水晶球,而是現有的最佳估計,能夠由工作人員有條不紊地進行,或由程序以機器速度進行。由于戰爭是一種明顯的人類努力,因此可以將士氣或本例中未包括的其他因素納入到額外的修改因素中。這種對戰斗力隨時間推移的理解提供了一個關鍵的洞察力,并可以為部隊分配的決策提供參考。在這一點上,可以產生一個對應于特定地點的友軍的有利戰斗力要求。圖2強調了格魯吉亞部隊如果在俄羅斯入侵路線上的起伏地形中進行防守時的理想戰斗力。

隨著南奧塞梯局勢的升級,格魯吉亞總統米哈伊爾-薩卡什維利于2008年8月7日為軍隊確定了三個目標。他指示他們 "第一,阻止所有軍車從俄羅斯通過羅基隧道進入格魯吉亞;第二,鎮壓所有攻擊格魯吉亞維和人員和內政部崗位或格魯吉亞村莊的陣地;第三,在執行這些命令的同時保護平民的利益和安全"。正如格魯吉亞國家安全委員會秘書亞歷山大-洛馬亞后來所證實的,"我們行動的邏輯是解除茨欣瓦利郊區的射擊陣地,并試圖通過繞過茨欣瓦利,盡快向羅基隧道靠近"。這一指令和支撐格魯吉亞軍事反應的邏輯為本文中繼續發展人工智能的COA提供了一個有益的對比。

圖2. 兵力比的正反饋循環

前面分析的圖1中的俄羅斯部隊是后來試圖通過羅基隧道進入格魯吉亞的第一梯隊部隊。被描述為向格魯吉亞部隊和村莊開火的部隊在茨欣瓦利附近活動,由奧塞梯人組成,由俄羅斯和奧塞梯 "維和 "營協助,人數增加到830人,大約300名雇傭兵,以及更多的大炮。由于他們有相當多的步兵,不同的任務,以及從茨欣瓦利城市中心倉促防守的地形,通過以前使用的相同方法,他們的戰斗潛力被計算為60。

談到格魯吉亞部隊和繼續發展他們最有利的行動路線,格魯吉亞第二、第三、第四和第五步兵旅以及戈里的一個單獨的坦克營的戰斗力和位置,作為計算的起點。他們與俄軍的距離和旅行時間,或關鍵地形,都可以計算出來。將這些信息與之前概述的俄羅斯部隊和之前討論的兵力比例知識結合起來,就可以利用目標編程,從數學上優化從每個格魯吉亞地點到羅基隧道或茨欣瓦利的戰斗力,以滿足有利的兵力比例,同時最大限度地減少總的旅行距離,從而最大限度地減少時間和后勤要求。

圖3. 戰斗潛力優化Python計劃的結果和建議的第4旅的分步任務組織結果

圖3左上角的優化程序結果顯示,格魯吉亞的戰斗力分配足以達到2:1的兵力比,以對抗進攻的俄羅斯部隊。對于第4步兵旅,建議在各目標之間分配戰斗力,后續的優化程序是按作戰功能確定各目標的不同作戰系統的數量,如圖3右上方所示。其結果是以理論為基礎的理性選擇解決方案,并通過在后期MDMP的COA分析步驟中為裁決戰爭游戲而保留的計算類型形成。人工智能支持的MDMP所實現的是使用詳細的分析來告知行動方案的最初發展,防止未來對次優COA的路徑依賴。

這種輸出就像分析數據以創造信息。合并這些信息的組成部分可以創造出知識,指揮官或參謀部可以對其運用智慧。這種方法不是像直覺所注入的那樣擁有不可解釋的因素,而是可以解釋的,并且可以在指揮官的具體規劃指導下進行修改。在這種情況下,裝甲、步兵和炮兵在進攻和防守中的有效性,以及丘陵和城市地形,都被納入優化的考慮范圍,輸出結果將炮兵優先送到羅基隧道。這一建議,雖然源于算法,但遵守人類的軍事判斷,認識到在城市中使用火炮的相對困難,以及步兵的相對優勢。毫不奇怪,行動后的審查指出,格魯吉亞的炮兵在丘陵地帶對付前進中的俄羅斯縱隊是有效的。

同樣,在這種修改中,通常為COA分析的后期步驟保留的計算類型被應用于COA的最初發展。正如加里-卡斯帕羅夫所描述的與計算機合作的好處一樣,人類也可以將作戰藝術應用于已經納入科學的概念。

許多計算可以被整合到程序中,以減少認知負擔,讓工作人員進步到更高層次的人工分析,其中一個例子就是時間。對于建議的每條路線,可以進行計算,根據車輛數量和其他變量確定更準確的時間。

將上述初級人機開發的COA的輸出與格魯吉亞國家安全委員會對其一般行動方案的闡述相比較,突出了人工智能支持的MDMP可以提供的優勢。人工智能的建議將一支更強大的格魯吉亞部隊引向羅基隧道,同時向茨欣瓦利投入部隊。很可能更早和更多地將部隊投入到羅基隧道附近的防御中,會極大地擾亂已經被渠化的入侵俄羅斯部隊,并阻止他們將火箭系統移到茨欣瓦利的射程內,并通過隧道將彈道導彈炮組進一步嵌入格魯吉亞,這對俄羅斯人來說是決定性的。

到目前為止,修改后的方法已經建立了一種發展 "下一步行動 "的方法,其基礎是對友軍和敵軍戰斗力的理解,這種戰斗力如何受到任務類型和地形的影響,以及部隊在移動和機動接觸中的時間關系。地面部隊的這些例子必須自然延伸到所有領域的戰斗力和效果的應用。這種技術能夠同時分析各個領域,并為跨領域效果的整合提供一個機制。近距離空中支援的架次可以被整合到地面領域,以便在地面戰斗的關鍵地點和時間提供更好的戰斗力比率。此外,在進行空對空作戰計算時,可以將地面防空資產納入空對空計算的因素。圖4顯示了通過羅基隧道進攻的俄羅斯地面部隊和推薦的格魯吉亞地面部隊的戰斗力,另外還強調了如何將俄羅斯的蘇-25戰斗機或格魯吉亞的SA-11系統納入其中。這為在領域內和跨領域進行的作戰行動創建了一個多維框架,并提供了一種同步匯合的方法。當一個領域的條件發生變化時,對其他領域和行動的影響可以在開始大大超過工作人員計算的復雜程度上進行。

隨著核心COA的制定,每個作戰功能的最佳整合可以通過算法來確定。例如,有了通往目標的路線和距離,以及燃燒率和其他規劃因素,可以計算出支持概念的要素。

這個例子表明,有能力在多個領域整合所有作戰功能的規劃。有了充分的細節說明COA的完成和廣度,現在可以把解釋轉向深度。為了在作戰層面創建一個在時間和空間上都有深度的COA,它必須提前預測幾個交戰,以實現相對優勢的位置,并尋求實現轉化為成功的失敗機制。而之前的過程主要是將現有的軍事理論或學術研究進行算法連接的創造,它們很難實現超越即時決策的飛躍,并創造出作戰藝術。對于這一點,現有的人工智能提供了適用的例子。

國際象棋人工智能中使用的基本微分法對所有棋盤上的處置方式提前兩步進行打分,包括行動和反應,然后根據程序對分數進行比較,分數最差的那個選項被修剪掉。在排除了未來兩步棋中最差的選項后,剩下的最佳選項被選中。修剪和消除的過程可以防止出現這樣的情況:人們可以在最近的一步棋中拿下一個低價值的棋子,但在下一步棋中又會失去一個高價值的棋子。該算法基于每一步后續棋重復這一過程。在許多程序中,該算法會分析更多的未來棋步,以指數形式增加棋盤的處置,以評估和排列潛在的棋步。為了簡化計算機的計算,一個被稱為阿爾法-貝塔修剪的過程可以在明確它們不會是最佳選擇時刪除分支,并停止評估它們。根據已經證明的根據力量和手段的相關性來評估軍事編隊的能力,可以看到即使是簡單的國際象棋人工智能方法也可以成為發展作戰藝術的基礎。

圖4. 多域COFM框架

當使用決策樹和國際象棋人工智能的最小算法時,程序會對棋盤上的大多數或所有的替代性未來進行評估,并產生一個可比較的值。俄羅斯軍隊最初從西邊的馬米森山口進攻,而不是從東邊的羅基隧道進攻,就是一個選項的例子。這將產生一個不同的動作,格魯吉亞部隊需要對此作出反應。除了國際象棋人工智能中棋子的總價值外,還經常使用位置的修改器。對每一方的剩余棋子進行估值的方法在概念上類似于之前用于分析俄羅斯和格魯吉亞部隊的戰斗力的TAM計算方法。而不是單個棋子的價值,將考慮軍事編隊的戰斗力。這種機制設計起初似乎是以消耗為重點,保留友軍的戰斗力,消除對手的戰斗力,并根據價值來確定優先次序。從一開始看起來非常機械的東西中出現的顯著特征是在時間和空間上創造和連接有利的力量比例,實現不對稱性,以大量消耗對手并保存友軍的戰斗力。簡而言之,它創造了作戰藝術。

當以這種方式對格魯吉亞的多個行動方案進行比較時,就會出現與圖3中描述的不同的行動方案。由于通往羅基隧道的旅行時間的變化,以及對交戰的預測是如何沿著各自的決策樹展開的,因此確定了對通往羅基隧道的部隊的改變,如圖5所示。

當人工智能支持的COA開發過程繼續向前搜索時,在Troitskye的俄羅斯第503摩托步槍團(MRR)和在Khankala的第42摩托步槍師和第50自行火炮團被確定為需要考慮的俄羅斯作戰力量。以最小的方式,在最初決定在羅基隧道和茨欣瓦利之間分配部隊之前,沿著決策樹進一步考慮這一事件。一旦理解了時間上的力量以及二階和三階效應,就會發現一個非直覺性的決定,即與戈里的坦克營和第比利斯的第4旅一起向羅基隧道進攻,這是由于預測到俄羅斯第二梯隊部隊在未來的行動。

圖 5. 俄羅斯-格魯吉亞聯合決策樹和進化

如圖3所示,如果俄軍同時開始行動,格魯吉亞部隊的原始部署無法及時趕到羅基隧道進行防御。然而,當動用哥里的坦克營或第4步兵旅時,一支有利的部隊能夠在迪迪古普塔或爪哇附近進行防御,使俄軍在山丘上保持渠化,有足夠的戰斗力來預測俄軍的進攻會被擊敗。這種防御可以抵御俄軍第二梯隊的第503摩托化步兵師,但不能抵御緊隨其后的第42摩托化步兵師,圖5右上方描繪的是第503步兵師。正因為如此,格魯吉亞的防御部隊如果要完成他們的任務,就需要在503摩托化步兵師到來之前向隧道進行反擊,以在嚴重的渠化隧道處進行防御。有了這些從復雜中出現的聯系,格魯吉亞的領導層可以及時思考并產生贏得戰斗的洞察力。

建立可用COA的算法過程在很大程度上緩解了因時間不足而產生的差距,同時為MDMP引入了一定程度的學術嚴謹性,否則可能只是主觀評估,而這種評估中隱含著所有未知的危險。

在目前的作戰環境中,往往沒有時間來制定多個作戰行動方案,對所有制定的作戰行動方案進行戰爭演習,應用作戰行動方案評估標準,然后確定一個推薦的作戰行動方案。有了人工智能支持的MDMP,COA分析和比較就被烘托出來,并最大限度地利用現有的技術,所有這些都是在傳統的工作人員可以收集到的工具。

通過COA分析和COA比較步驟合并和修改COA開發步驟,以利用當前人工智能能力的速度、力量和洞察力,將提高預測多種替代性未來和選擇的能力,使指揮官不僅能夠在三維空間中思考,而且能夠在時間中思考。鑒于時間越來越稀少,了解時間,并擁有在多個領域與之合作并通過它的工具,可能是人工智能提供的最大優勢。

其他領域的人工智能工具已經展示了它們在提供快速、一致和準確計算的任務方面的能力。為了具有價值,人工智能不需要自主運作或復制有生命的人。人工智能只需要彌合當前規劃和決策工具的適用性與人類認知在復雜適應性系統中的有效性之間不斷擴大的差距。處理復雜性的適度改進,即使只是減少導致錯誤的認知負擔,也會確保比無助的指揮官有決策優勢。

在人工智能支持的MDMP的意義上更進一步,人工智能可以在第一次迭代后半自動地完成MDMP,幾乎連續地進行完整的MDMP過程,沒有疲勞感,納入每一個新發展。一個持續的人工智能運行的MDMP將提供關于部隊當前位置和行動的反饋。近乎實時的反饋將使我們能夠跟蹤下屬單位的當前行動、控制措施的遵守情況和進展。

其次,近乎連續的MDMP可以通過評估根據當前條件應該執行什么COA來預測分支,甚至預測隨著條件的變化,未來決定性交戰的設置。持續的人工智能支持的MDMP將與敵人而不是計劃作戰。一個人工智能支持的過程將有額外的好處,即為任何新出現的COA整合資源,同步和優化所有領域的效果,并使過渡到一個新的分支計劃更加可行。這種能力將在使部隊迅速適應在未來動蕩環境中的混亂邊緣茁壯成長方面取得不可思議的進展。

付費5元查看完整內容

人工智能(AI)是一項具有廣泛用途的新興技術。《美國防戰略》強調了人工智能對軍事行動的重要性,以使美國保持對其近似競爭對手的優勢。為了充分實現這一優勢,不僅要在戰術層面,而且要在戰爭的作戰層面整合人工智能。人工智能可以最有效地融入作戰計劃的復雜任務,方法是將其細分為其組成部分的作戰功能,這些功能可以由狹義的人工智能來處理。這種組織方式將問題減少到可以由人工智能解析的規模,并保持人類對機器支持的決策的監督。

引言

人工智能是一套新興的、變革性的工具,有可能幫助軍事決策者。美國國家戰略將人工智能(AI)納入戰爭。《2020年國防授權法》11次提到了人工智能。國防戰略強調了利用人工智能和機器學習方面的商業突破的重要性。人工智能的軍事用途是保留國家安全的一個引人注目的方式。創造工具來支持戰術行動,如摧毀敵軍和從一個點導航到另一個點,具有顯著和可見的效果,使他們在資源有限的環境中在政治上可以接受。它們在訓練和測試方面的可重復性,使它們在采購過程中成為人工智能系統的快速贏家。然而,戰術行動的范圍和時間是有限的。僅在戰術層面上整合人工智能,忽視了在作戰層面上發生的決定性影響。

作戰,也就是實踐者將戰術行動轉化為戰略效果的層面,取決于領導者做出正確決策的能力。聯合部隊海事部分指揮官(JFMCC)的艱巨任務是制定計劃,將戰區戰略和聯合部隊指揮官(JFC)的目標結合起來,通過決定性的海軍交戰來塑造環境。在人工智能的快速認知能力的幫助下,JFMCC將能夠制定并更徹底地分析行動方案(COA)。這些品質對于未來的沖突是必要的。

人工智能必須在戰爭的各個層面進行整體集成,以充分實現其優勢。除了局部的、短期的戰斗,它還需要應用于主要的行動和戰役,涉及整個戰區的數月或數年。在戰爭的戰役(作戰)層面上的實施,放大了為實現戰略目標而進行的有序交戰和同步行動之間的協同作用。除了技術發展之外,行動上的整合將刺激政策和理論的建立,以使作戰人員有意愿使用人工智能。隨著使用人工智能的經驗的增加,其采用率也會增加。為協助海軍作戰計劃而實施的特定人工智能技術可能與那些用于計算射擊方案或在被拒絕的淺灘水域規劃路線的技術不同。然而,在作戰層面的接受度將推動戰術上的使用。

在JFMCC層面,人工智能系統網絡將為決策者提供決定性的優勢,將專注于作戰功能的獨立的人工狹義智能(ANI)單位統一起來將實現最顯著的好處。首先,人工智能解決方案比它們的通用人工智能(AGI)同行更適合于軍事問題的解決。其次,戰爭的性質促使有必要在作戰層面上整合人工智能。最后,雖然有許多方法可以整合,但沿著功能線這樣做會帶來最顯著的好處。不僅在技術意義上吸收人工智能,而且描述其在政策、理論和培訓中的使用,將使海軍能夠充分使用它,并在與我們的戰略競爭對手的競爭中獲得優勢。

如何在海戰領域整合人工智能?

目前人工智能在海上行動中的最佳應用是將復雜的海上行動問題分解成子問題,由人工智能來解決,并組合成COA建議。解決小問題的人工智能需要更少的訓練數據,有更直接的邏輯,并且可以連鎖起來解決更重要的問題。麻省理工學院人工智能實驗室前主任羅德尼-布魯克斯(Rodney Brooks)認為,創建動態環境的符號表示是困難的或不可能的。然而,特定任務的智能體可以利用足夠的傳感器數據智能地行動,更重要的是,可以連貫地互動。通過將簡單的活動連鎖起來,失敗的風險很低,更復雜的問題就可以得到解決。多個簡單的行動可以在低認知層平行運行,并將其輸出結合起來,為更高層次的復雜活動提供支持。這種結構的優點是允許軍事工程師開發和訓練人工智能,以首先解決可操作的問題。對人工智能開發者來說更具挑戰性的功能可以保留只由人類決定的方法,直到他們產生解決這些問題的專業知識。與其等待一個完整的系統,部分系統將提供一個臨時的邊際優勢。

鑒于人工智能可以通過將問題分解成更小的決策來最好地解決問題,問題仍然是如何劃分這些問題。重述作戰任務的一個模式是將它們分成作戰功能:指揮和控制(C2)、通信、情報、火力、運動和機動、保護和維持。這些作戰功能為開展有效行動提供了基礎。它們為一個行動提供了采用手段實現其目的的方法。因此,與決定如何實施這些功能以實現目標的決策者一起使用人工智能是很自然的。

如同應用于海上作戰戰爭,最低層的決策支持系統將由感知環境的活動組成:探測艦艇、飛機和潛艇;燃料水平;天氣;以及其他客觀的戰斗空間數據。通過將外部輸入限制在特定的、低層次的任務上,該系統將最大限度地減少對抗性例子或旨在消極操縱自動系統的數據的風險。中間層將把下層的輸出與作戰目標和因素結合起來,如時間、空間和力量的限制,以提供解決問題的方法和作戰功能。由于上層的對抗性數據注入的威脅較小,這些系統可以使用深度學習。深度學習是機器學習的一個子集,它不像其他形式那樣需要高度格式化的數據,但計算成本會更高,而且容易受到欺騙。深度學習將增加這一層的人類互動,并暴露出更復雜的關系。最高層將把C2流程應用于其他六個業務功能,以產生業務建議。中間層的每個功能人工智能將向其他功能人工智能和最高C2層提供建議。中間層的人工智能對復雜的數據和相鄰單位及C2功能的建議進行理解。

如果將中間層人工智能納入規劃和指導、收集、處理、分析和傳播的情報周期,將促進收集資產的更好分配。判斷對有限的收集資產的請求以滿足行動和戰術信息需求是JFMCC關注的一個問題。在收集計劃期間,人工智能可以使用已知的對手軌跡、地點、個人和組織來定義和優先考慮指定的利益區域(NAI)。在執行過程中,人工智能可以根據優先級驅動收集路線,就像企業用它來規劃送貨路線以減少勞動力、燃料和維護成本一樣。采集計劃者可以通過增加對手監視點的位置和范圍來減少反偵查的風險。在C2層面,指揮官和情報官員可以利用收集成果來證明更多的JFMCC收集資產和COA的修改。這種方法適用于其他功能。

人工智能可以在部隊部署不斷變化和對手存在不確定的環境中改善維持能力。相互沖突的要求使如何使用有限的后勤資產來滿足作戰人員的需求的決策變得復雜。后勤單位較低的生存能力促使人們決定是將它們帶入被對手防御系統拒絕的區域,還是將戰斗飛船引離目標。人工智能可以利用軍事和民用運輸的可用性、預先部署的庫存和供應商的響應能力來制定船舶和飛機需求的解決方案。企業利用人工智能準確預測需求,并分辨出影響運輸和倉儲的采購模式。維持型人工智能可以使用這個過程的一個變種,來計劃在高級后勤支持站點(ALSS)或前方后勤站點(FLS)的材料堆放。它可以決定如何以及何時使用穿梭船和站立船來運送到攻擊組。機器學習將使用燃料、食品和武器庫存、威脅環、戰備水平和維修時間來訓練維持人工智能。維持型人工智能可以提供比人類單獨完成的更有效的量化解決方案,并將其反饋給其他功能區和C2高層。

C2層將對來自下層的決定進行仲裁,并提供一個統一的建議。就像一個軍事組織的指揮官一樣,它將把其副手AI的建議合并起來。人工智能過程的早期階段使用傳感器數據和其他客觀信息來確定指揮官的方向;決定行動方案需要建立對戰斗空間的理解,這是一種更高層次的欣賞。戰斗空間的可變性和模糊性將使這一層的人工智能元素最難開發。最終,該系統將作為一個可信的智能體,壓縮指揮官負責的信息量。壓縮的信息減輕了時間有限的決策者工作時的疑慮負擔,使她能夠向下屬單位發出更及時的命令。

圖1說明了基于這些原則的系統的擬議架構。以對手預測為例,許多單一用途的ANI將在最低層結合原始傳感器和單位報告數據。它將評估敵方單位的最可能位置。公司分析評論、社交媒體和論壇發帖的情緒,以確定產品的滿意度。同樣地,這個系統將通過公開的言論和秘密的報告來確定對手的意圖。它將評估當前和歷史天氣模式,以評估氣候對敵人行動的影響。這三個輸入和其他信息將被功能情報ANI用來形成對敵方COA的評估。同樣,火力節點將使用敵人的組成、JFC的優先級和預測的彈藥可用性來產生目標指導。中間層節點將橫向傳遞他們的評估,以完善鄰近的建議,如部隊保護水平。獨立的功能建議也將直接反饋給C2層,以創建整體行動方案。

圖1. 海上人工智能系統的擬議架構

建議

首先,利用聯合人工智能資源的優勢,針對海軍的具體問題修改標準組件。擅長開發軍事人工智能系統的工程師的稀缺性將限制新系統的開發。美國防部的人工智能戰略具體規定了建立通用的工具、框架和標準,以便進行分散的開發和實驗。使用這些現成的組件,為人工智能決策網的所有子系統創建低級別的系統和標準接口。將海軍的資源集中于采購和實施用于海事具體決策的中層和高層系統。避免技術上令人著迷但無效的解決方案,并通過將職能領域的專家與設計團隊相結合來保持解決海事問題的目標。

第二,創建并維護可通過機器學習攝入的作戰數據數據庫,以訓練海軍人工智能。實施能夠在海上作戰中心(MOC)讀取和集中匯總基本作戰數據報告的技術和工藝,如燃料狀態、導彈裝載量。開發記錄和定性評分作戰決策結果的方法,如對手態勢的變化、傷亡修復率和公眾對行動的反應。將輸入與作戰決策和結果聯系起來的數據庫將加速開發符合現實世界標準的系統。

第三,將人工智能的使用納入政策和條令。條令應該編纂人工智能可以被整合到戰爭戰役層面決策中的領域。明確地說,關于情報、行動、火力、后勤、規劃和通信的海軍作戰出版物應說明人工智能在決策過程中產生優勢的地方和方式。描述海上聯合行動的聯合出版物應明確說明如何將JFC的要求解析為JFMCC的AI系統。如果國防部和海軍的政策對指揮官因整合人工智能的決策建議而產生的責任量進行了定性,那么他們在使用人工智能時就可以采取經過計算的風險。讓指揮官和作戰人員掌握使用人工智能的戰術、技術和程序將加速其在艦隊中的應用。

付費5元查看完整內容

這個頂點項目評估了使用區塊鏈技術來解決一些挑戰,即越來越多的不同的傳感器數據和一個信息豐富的環境,可以迅速壓倒有效的決策過程。該團隊探討了區塊鏈如何用于各種國防應用,以驗證用戶,驗證輸入人工智能模型的傳感器數據,限制對數據的訪問,并在數據生命周期內提供審計跟蹤。該團隊為實施區塊鏈的戰術數據、人工智能和機器學習應用開發了一個概念設計;確定了在戰術領域實施區塊鏈所涉及的挑戰和限制;描述了區塊鏈對這些不同應用的好處;并評估了這個項目的發現,以提出未來對更廣泛的區塊鏈應用的研究。該團隊通過開發三個用例來實現這一目標。一個用例展示了區塊鏈在 "輕數據"信息環境中的戰術邊緣使用。第二個用例探索了區塊鏈在電子健康記錄中對醫療信息的保護。第三個用例研究了區塊鏈在使用多個傳感器收集化學武器防御數據方面的應用,以支持使用人工智能和機器學習的測量和簽名智能分析。

未來針對同級或近級對手的大規模作戰行動,除了更傳統的空中、陸地、海上和空間等物理領域外,還將涉及網絡空間領域。數據和信息在這個連續體中的每一個點上所發揮的作用都不能被低估。此外,同時在多個領域進行有效溝通和協調的能力--擁有必要的指揮和控制--取決于可獲得的和可靠的信息。美國陸軍正在起草一份新的陸軍學說出版物3-13,標題為 "信息","將信息的軍事應用與所有作戰功能、部門和戰爭形式聯系起來"(美國陸軍聯合武器中心2022,2)。陸軍如何在戰場上保持優勢的這些轉變,強調了數據和信息作為戰爭工具的關鍵作用。

這個頂點項目的主要目標是探索區塊鏈在與國防部相關的各種情況下的使用。首先,該團隊研究了目前關于區塊鏈和相鄰主題的工作,如物聯網(IoT)、大數據、人工智能(AI)和機器學習(ML)。研究揭示了一個名為 "戰場物聯網"(IoBT)的新興概念。Tosh等人(2018)寫道,IoBT可以滿足 "對分散框架的強烈需求......以服務于戰場環境的目的"(2)。Kott、Ananthram和West(2016)強調了與IoBT可用性、保密性和完整性相關的幾個網絡安全挑戰,而Tosh等人(2018)討論了區塊鏈技術如何有利于IoBT架構。

除了網絡上的無數設備(如IoBT),數據存儲是管理數據的另一個關鍵方面,無論是現在還是未來以去中心化信息為標志的環境。區塊鏈,當與數據存儲機制的使用相結合時,可以幫助IoBT設備及其數據的可用性、保密性和完整性。該團隊研究了使用戰術數據結構作為 "鏈外 "數據存儲機制的潛力。數據結構使數據的發現、治理和消費自動化,使用戶能夠在他們需要的時候和地點訪問數據,而不需要對數據的存放地點有任何了解。數據結構是一種機制,可以將眾多的數據管理源連接在一起,以促進數據的可訪問性--無論其位于何處。這些數據管理源可以是傳統的數據庫、數據湖(IBM 2018),或數據倉庫(IBM 2021)。因此,戰術數據結構可能是一個可行的解決方案,以促進跨作戰人員功能和任務指揮系統的數據訪問(Patel等人,2021)。

這項研究的洞察力與現有的概念重疊,如數據生命周期和國防部的共同決策框架:觀察-定向-決定-行動(OODA)循環。數據生命周期一般有四個階段:數據創建(或生成)、數據閱讀(或消費)、數據更新(或修改)和數據刪除(或歸檔)。這些階段幾乎適用于任何類型系統中的每一種數據。了解在生命周期的每個階段與數據的互動如何影響數據的固有可靠性是很重要的。追蹤數據在這個數據生命周期中的運動提供了數據來源,這使得潛在的數據消費者能夠確定數據的可靠性和有效性。隨著決策者在實施OODA循環框架中使用數據(以及對該數據的下游分析,例如在人工智能的協助下),數據出處的關鍵性變得很明顯。區塊鏈的使用可以提供數據可靠性的內在保證,這反過來又減少了OODA循環的時間,改善了決策。

接下來,該團隊開發了一些通用的系統工程架構,以說明區塊鏈如何解決數據出處并確保這些數據的信任。這個過程確定了從各種用戶(例如,如數據所有者和消費者)到需要的軟件系統,以及數據結構,和Hyperledger Fabric(HLF)網絡(即區塊鏈組件)的各種行為者。此外,可能需要幾個應用編程接口(API):一個訪問API,一個數據出處API,和一個企業API。利用區塊鏈提供可靠的數據出處的總體重點是提供一種新的方法,運營商可以跟蹤設備和數據的編輯者。

然后通過開發三個用例來擴展這個架構,每個用例都有其特定的架構,這進一步說明了區塊鏈的實施可以如何運作,并評估其效用和局限性。這些用例使團隊能夠探索區塊鏈在驗證用戶、驗證輸入人工智能模型的傳感器數據、限制對數據的訪問以及提供整個數據生命周期的審計跟蹤方面的潛力。

在第一個用例中,我們探討了區塊鏈如何在戰術邊緣促進安全和可信的數據傳輸,以利用遠程火力。第二個用例在更多的操作背景下提供了一個例子,區塊鏈提供了一個審計跟蹤,以實現一個強大的電子健康記錄(EHR),可以在醫療服務的連續過程中的任何點進行訪問。最后,該團隊的第三個用例是管理來自現場傳感器的數據流,并進入人工智能模型,以支持特定類型的情報(例如,用于化學防御工作的測量和簽名情報(MASINT))。這個用例既有業務背景,也有戰略背景,并展示了區塊鏈如何確保輸入人工智能模型的數據是有效和可靠的。

雖然這些用例利用了一個簡化的架構來促進區塊鏈的名義應用,但它還是展示了這項技術在解決或至少緩解當前和未來管理和保護大量數據的挑戰方面的真正潛力。該團隊能夠探索在區塊鏈上和區塊鏈外存儲數據的選項。這些選擇表明,區塊鏈技術如何能夠適應具體情況--不僅是在戰略、作戰和戰術背景下,而且是在各軍種之間,以滿足其獨特的任務需求。未來的聯合部隊在生成和消費數據方面需要精明,這些數據對于確保戰場上的優勢是必不可少的,但在武裝沖突之間的和平時期也是至關重要的,但競爭激烈。

付費5元查看完整內容

計算思維和數據科學的進步導致了人工智能系統的新時代,這些系統被設計來適應復雜的情況并開發可操作的知識。這些學習系統旨在可靠地理解情況的本質,并構建關鍵的決策建議,以支持自主和人機團隊的運作。

同時,數據的數量、速度、種類、真實性、價值和變異性的不斷增加,使這些新系統的復雜性受到影響--在其開發和實施方面造成了挑戰。對于支持具有較高后果的關鍵決策的人工系統來說,安全已經成為一個重要的問題。需要有方法來避免故障模式,并確保只允許期望的行為。

元認知是一種解決策略,它能促進人工智能系統內部的自我意識,以了解其外部和內部的運行環境,并利用這些知識來識別潛在的故障,實現自我修復和自我管理,以實現安全和理想的行為。

人工智能戰爭決策輔助工具通過增強戰斗空間知識、解決不確定性、推薦戰術行動方案、制定交戰戰略來支持作戰人員決策。

付費5元查看完整內容

態勢感知是作戰人員的必需能力。一種常見的監視方法是利用傳感器。電子光學/紅外(EOIR)傳感器同時使用可見光和紅外傳感器,使其能夠在光照和黑暗(日/夜)情況下使用。這些系統經常被用來探測無人駕駛飛機系統(UAS)。識別天空中的這些物體需要監測該系統的人員開展大量工作。本報告的目的是研究在紅外數據上使用卷積神經網絡來識別天空中的無人機系統圖像的可行性。本項目使用的數據是由作戰能力發展司令部軍備中心的精確瞄準和集成小組提供的

該報告考慮了來自紅外傳感器的圖像數據。這些圖像被送入一個前饋卷積神經網絡,該網絡將圖像分類為有無無人機系統。卷積模型被證明是處理這些數據的第一次嘗試。本報告提供了一個未來的方向,以便在未來進行擴展。建議包括微調這個模型,以及在這個數據集上使用其他機器學習方法,如目標檢測和 YOLO算法。

付費5元查看完整內容

疲勞是導致水域事故的一個已知因素,降低了操作效率,并影響了作戰人員的健康。戰士認知狀態的實時反饋將允許提高對能力/限制的認識,并根據戰士的準備情況作出適應性決策。使用機器學習(ML)和可穿戴技術的疲勞檢測/預測項目旨在開發一種ML算法,能夠檢測出副交感神經系統(PNS)的變化,這些變化通過使用商用現成(COTS)腕戴設備檢測,進一步可分析認知疲勞。收集了30名參與者(包括一些現役軍人)執行可量化的警戒任務的生物識別數據集,并對操作者的表現指標和認知負荷進行了注釋。麥克沃思(Mackworth )時鐘是一項廣泛用于心理測量研究以量化認知參與和疲勞的警覺性任務,它的變體被用來生成定量的操作者績效指標和離散的認知負荷狀態。在有注釋的生物識別數據集上訓練和驗證了ML模型,以:1)回歸操作者任務表現的準確性,以及2)對認知負荷/任務難度進行分類。一個訓練有素的卷積神經網絡(CNN)回歸模型能夠預測麥克沃思鐘任務表現的準確性,平均絕對誤差在2.5%以內。此外,一個單獨的CNN分類器模型達到了86.5%的二元任務類型分類準確率,不同類型的任務對應著較高和較低的認知負荷。該研究與開發(R&D)工作的下一階段將包括與海軍有關的任務(即船舶導航、軌道管理和其他站崗任務)的額外測試活動,參與者僅包括現役人員。這項工作的最終目標是提供一個可穿戴設備和配套的軟件,能夠檢測和預測各種與海軍有關的任務的認知疲勞,目的是優化作戰人員的表現,以減少用戶的錯誤或最大限度地提高性能。

付費5元查看完整內容

本報告從技術角度對一份有關人工智能(AI)系統輔助空軍指揮和控制(C2)的潛力的報告進行了分析。作者詳細介紹了10個 C2 問題特征的分類法。他們展示了結構化訪談協議的結果,該協議能與主題專家一起對 C2 流程的問題特征進行評分。使用問題分類法和結構化訪談協議,作者分析了10個推演和10個 C2 流程。為了演示 C2 問題的分類法和結構化訪談協議,他們隨后將其應用于由空戰管理人員執行的傳感器管理。

作者隨后轉向了8項人工智能系統解決方案能力。至于 C2 問題的特征,他們創建了一個結構化協議,以便對給定的人工智能系統的解決方案能力進行有效和可靠的評分。使用解決方案分類法和結構化訪談協議,作者分析了10個人工智能系統。

作者提供了有關專家小組設計、實施和結果的更多細節,由該小組在8種解決方案能力中擇一處理10個問題特征中的每個特征。最后,作者展示了3個技術案例研究,針對各種 C2 問題演示了廣泛的計算、人工智能和人工解決方案。

目錄

第一章 問題特征分析

第二章 解決方案能力分析

第三章 專家小組設計、實施和其他結果

第四章 評估人工智能解決方案的指標

第五章 案例研究 1:主空襲計劃

第六章 案例研究 2:自動目標識別與學習

第七章 案例研究 3:人員恢復的人機協作

附錄 A 人工智能歷史

附錄 B 閉環自動目標識別的數學細節

付費5元查看完整內容

美國的空中優勢是美國威懾力的基石,正受到競爭對手的挑戰。機器學習 (ML) 的普及只會加劇這種威脅。應對這一挑戰的一種潛在方法是更有效地使用自動化來實現任務規劃的新方法。

本報告展示了概念驗證人工智能 (AI) 系統的原型,以幫助開發和評估空中領域的新作戰概念。該原型平臺集成了開源深度學習框架、當代算法以及用于模擬、集成和建模的高級框架——美國國防部標準的戰斗模擬工具。目標是利用人工智能系統通過大規模回放學習、從經驗中概括和改進重復的能力,以加速和豐富作戰概念的發展。

在本報告中,作者討論了人工智能智能體在高度簡化的壓制敵方防空任務版本中精心策劃的協作行為。初步研究結果突出了強化學習 (RL) 解決復雜、協作的空中任務規劃問題的潛力,以及這種方法面臨的一些重大挑戰。

研究問題

  • 當代 ML 智能體能否被訓練以有效地展示智能任務規劃行為,而不需要數十億可能情況組合的訓練數據?
  • 機器智能體能否學習使用攻擊機、干擾機和誘餌飛機的組合來對抗地對空導彈 (SAM) 的策略?干擾機需要離地空導彈足夠近才能影響它們,但又要保持足夠遠,以免它們被擊落。誘餌需要在正確的時間分散 SAM 對前鋒的注意力。
  • 是否可以建立足夠泛化的表示來捕捉規劃問題的豐富性?吸取的經驗教訓能否概括威脅位置、類型和數量的變化?

主要發現

RL 可以解決復雜的規劃問題,但仍有局限性,而且這種方法仍然存在挑戰

  • 純 RL 算法效率低下,容易出現學習崩潰。
  • 近端策略優化是最近朝著解決學習崩潰問題的正確方向邁出的一步:它具有內置約束,可防止網絡參數在每次迭代中發生太大變化。
  • 機器學習智能體能夠學習合作策略。在模擬中,攻擊機與 SAM 上的干擾或誘餌效應協同作用。
  • 經過訓練的算法應該能夠相當容易地處理任務參數(資產的數量和位置)的變化。
  • 很少有關于成功和不成功任務的真實數據。與用于訓練當代 ML 系統的大量數據相比,很少有真正的任務是針對防空飛行的,而且幾乎所有任務都取得了成功。
  • 對于涉及使用大型模擬代替大型數據集的分析,所需的計算負擔將繼續是一個重大挑戰。針對現實威脅(數十個 SAM)訓練現實能力集(數十個平臺)所需的計算能力和時間的擴展仍不清楚。
  • 建立對人工智能算法的信任將需要更詳盡的測試以及算法可驗證性、安全性和邊界保證方面的根本性進步。

建議

  • 未來關于自動化任務規劃的工作應該集中在開發強大的多智能體算法上。RL 問題中的獎勵函數可以以意想不到的方式徹底改變 AI 行為。在設計此類功能時必須小心謹慎,以準確捕捉風險和意圖。
  • 盡管模擬環境在數據稀缺問題中至關重要,但應調整模擬以平衡速度(較低的計算要求)與準確性(現實世界的可轉移性)。
付費5元查看完整內容
北京阿比特科技有限公司