海軍艦艇是由多個組織組成的復雜機構,這些組織必須在不影響效率和戰備狀態的情況下順利交互和外部交流。隨著后勤挑戰的增加和技術推動響應時間的增加,因此引入最先進的計算方法至關重要,用于分析互聯系統和針對不同事件進行分析。
美國海軍研究生院專家引入了一個名為LAILOW的框架:學習、優化和兵棋推演。LAILOW利用復雜機構中多個來源產生的數據,基于數據挖掘、機器學習和預測算法,分析和發現模式、規則和異常。接著LAILOW的輸出結果可以用來優化業務流程和行動方案。展示了使用LAILOW框架的三個用例。使用LAILOW框架,搜索主要艦艇設備維護和供應系統的脆弱性,以進行困難測試,并相應地提出彈性和新穎的解決方案。詞法鏈接分析(LLA)作為LAILOW的一部分,以提高與C4I系統相關的海軍艦艇關鍵部件失效概率的預測精度,用于NAVWARSYSCOM的預測風險備用矩陣(PRiSM)產品中。還展示了LLA對財務受限工作隊列(FRWQ)中的優先項目與基線計算的比較。
現代多領域沖突日益復雜,使得對其戰術和戰略的理解以及確定適當行動方案具有挑戰性。作為概念開發和實驗 (CD&E) 的一部分的建模和仿真提供了新的見解,以更快的速度和更低的成本比物理機動更易實現。其中,通過計算機游戲進行的人機協作提供了一種在各種抽象級別模擬防御場景的強大方法。然而,傳統的人機交互非常耗時,并且僅限于預先設計的場景,例如,在預先編程的條件計算機動作。如果游戲的某一方面可以由人工智能來處理,這將增加探索行動過程的多樣性,從而導致更強大和更全面的分析。如果AI同時扮演兩個角色,這將允許采用數據農場方法,從而創建和分析大量已玩游戲的數據庫。為此,我們采用了強化學習和搜索算法相結合的方法,這些算法在各種復雜的規劃問題中都表現出了超人的表現。這種人工智能系統通過在大量現實場景中通過自我優化來學習戰術和策略,從而避免對人類經驗和預測的依賴。在這篇文章中,我們介紹了將基于神經網絡的蒙特卡羅樹搜索算法應用于防空場景和虛擬戰爭游戲中的戰略規劃和訓練的好處和挑戰,這些系統目前或未來可能用于瑞士武裝部隊。
建模和仿真有助于德國武裝部隊后勤的數字化,必須提供靈活性和穩健性等因素,以識別后勤鏈中的風險和弱點。 ESG,作為一家擁有多年軍事經驗的德國軍事技術公司,我們展示了成功的仿真和分析項目(例如,“以歐洲戰斗機為例,預測德國空軍的作戰能力”或“基于仿真的醫療救援鏈分析”),并提出進一步的行動方向,例如基于仿真的分析,以優化軍事供應鏈中的加法生產或自主系統的最佳概念。通過對軍事供應鏈使用后勤仿真,可以檢查和優化其穩健性和可持續性。這種基于數據的決策支持方法(工具 AnyLogic,德國聯邦國防軍基于仿真的分析指南和模型檔案)。它聚焦于一個關鍵問題,例如“在某些參數/因素/影響下,系統的材料運行準備情況如何更高概率的為在未來發展,以及什么可以提高系統的性能?”如本講座所述那樣提供各種優勢。
圖2-1 模型開發流程
圖2-2 系統結構
在工業資產運行過程中出現的異常情況可能表明存在退化和故障,隨著時間的推移,會導致不期望的行為、運行條件的喪失以及系統的最終崩潰。預測性維護技術負責監測系統的狀態,以便在初始階段對這些異常情況進行檢測,從而以最佳方式安排維護任務。本文介紹了一種基于機器學習的人工智能技術的海軍資產預測性維護解決方案。為此,使用了由船舶實時收集并通過控制中心傳輸的傳感器(溫度、壓力等)的信息。所開發的系統(SOPRENE)能夠從我們軍艦上的發動機的歷史數據中預測不同的故障模式或異常運行狀況的發生。此外,該系統的使用可擴展到大型艦隊,該解決方案已使用Spark分布式環境來實現,以促進預測的分布式計算。
維護成本是工業運營成本的一個重要部分。在某些情況下,如在冶金行業,這些成本可以達到總生產成本的15%-60%。此外,其中三分之一的投資由于不必要的或不正確的活動而被浪費。然而,維護是至關重要的,因為系統的故障會導致巨大的財務成本。
在過去,由于不可能處理大量連續的數據流,所以在很多情況下,只能使用統計技術。然而,今天的預測性維護則遵循更先進的理念:
與其依靠這些行業統計數據(如平均故障間隔時間)來安排維護活動,不如對系統進行實時監測,以確定其狀態和真實狀況。目前的計算能力允許處理更多的數據,以及使用更復雜的技術來進行預測、檢測異常情況和對系統進行可能的診斷。因此,預測性維護可以理解為基于系統的當前狀態或條件以及根據運行歷史進行的未來預測的預防性維護。
這項研究工作介紹了在SOPRENE項目中開發的預測性維護系統在海軍艦艇發動機上的應用。擬議的系統已經分析并使用了分布式環境中的機器學習技術。在這個意義上,所考慮的方法論可以根據Ran等人的說法來劃分。
步兵模擬(IWARS)是一個實體級的戰斗模擬,通常用于估計使用不同裝備(包括手榴彈和榴彈發射器)造成的作戰效能差異。當一枚模擬手榴彈在IWARS中爆炸時,對附近人員的影響是通過查詢一個高分辨率模型預先計算出的喪失能力的概率值來確定的。這個值取決于許多因素,因此需要一個大的查詢表,可能會超過數據庫的最大容量。為了解決這個問題,創建了一個神經網絡輸入選項,讓分析師有機會使用高度壓縮的數據而不犧牲準確性或運行時間。以前的壓縮技術要么不太準確,要么提供較低的壓縮率。
這項研究是在2019財年進行的,是題為 "機器學習技術協助生成項目級性能估計,用于班級和士兵級作戰評估 "的研究的一部分。該研究的另一半將在另一份報告中討論。在這一半的研究中,梯度增強的決策樹被用來成功地預測人類主題專家(SMEs)的代理決定。(當所要求的系統沒有數據時,一個類似的系統通常被用作代用。) 訓練有素的決策樹模型可以用來為未來的數據請求建議代理,減少滿足這些請求所需的時間并提高所提供數據的準確性。
步兵模擬(IWARS)是一個實體級的戰斗模擬,重點是下馬的士兵、班和排,通常被陸軍用來估計使用不同裝備造成的作戰效率的差異。特別是,IWARS被用來比較不同手榴彈和榴彈發射器的有效性[1, 2, 3],幫助指導這些系統的開發和采購。
當一個模擬的手榴彈在IWARS中爆炸時,對附近人員的影響是通過查詢一個高分辨率模型預先計算出來的喪失能力的概率(P(I))值來確定的。P(I)值取決于許多因素,包括目標的姿態、防彈衣和任務(攻擊或防御),以及彈藥的下落角度、爆炸高度、爆炸到目標的范圍、爆炸到目標的方位角和爆炸后的時間。由于有這么多的因素,P(I)查詢表可能非常大。事實上,一個高分辨率的查詢表往往太大,無法裝入IWARS數據庫的最大容量約150兆字節。
為了解決這個問題,分析人員可以將IWARS數據庫分成更小的部分。例如,對12種新型空爆手榴彈的分析可以通過建立12個IWARS數據庫來進行,每種手榴彈一個數據庫。如果描述一種手榴彈的殺傷力數據太大,或者在特定情況下需要一種以上的手榴彈,但只有一種手榴彈的殺傷力數據可以放入一個數據庫,那么這種策略就會失敗。此外,即使這種策略是可行的,也有缺點:任何額外的數據庫變化都必須被鏡像12次,而且數據庫的大小會降低IWARS和數據庫編輯工具的速度。
另外,分析人員可以通過使用低分辨率的P(I)數據來規避數據庫的大小限制。這通常是通過刪除某些突發高度和突發到目標的范圍,并將突發到目標的方位角組的P(I)值平均化來實現的。這降低了模擬的準確性,也降低了對結果的信心。
本文的目的是記錄這個問題的一個新的解決方案,這個方案在所有情況下都有效,而且幾乎沒有精度損失或模型運行時間的增加。它可以描述如下:
1.訓練人工神經網絡來學習P(I)值。然后,神經網絡的參數值將對原始P(I)數據進行編碼,從而對其進行壓縮。
2.在IWARS中重新創建這些神經網絡,以便在需要時估計P(I)值。
同步使用針對所有社會職能中的特定漏洞而定制的多種權力工具,以實現協同效應。混合作戰入侵者將尋求利用目標國家的弱點。每一個混合戰爭入侵者可能有獨特的能力,可用于打擊目標國家。戰爭的“奇襲”原則可能是混合攻擊成功的最大因素。
現代多域沖突日益復雜,使得對戰術和戰略的理解以及對適當行動方案的確定具有挑戰性。作為概念開發和實驗 (CD&E) 的一部分,建模和仿真以比物理操作所能達到的更高速度和更低成本提供了新的洞察力。其中,通過計算機博弈進行的人機協作提供了一種在各種抽象級別模擬防御場景的強大方法。然而,傳統的人機交互非常耗時,并且僅限于預先設計的場景,例如,就預編程的條件計算機動作而言。如果博弈的一方可以用人工智能來處理,這將增加探索行動過程的多樣性,從而導致更強大和更全面的分析。如果AI同時扮演兩個角色,這便能夠使用數據農場方法創造并分析一個包含大量博弈的數據庫。為此,我們采用了強化學習和搜索算法相結合的方法,這些算法在各種復雜的規劃問題中都表現出了強大的能力。這種人工智能系統通過在大量現實場景中通過自我優化來學習戰術和策略,從而避免對人類經驗和預測的依賴。在這篇文章中,我們介紹了將基于神經網絡的蒙特卡羅樹搜索算法應用于防空場景和虛擬戰爭游戲中的戰略規劃和訓練的好處和挑戰,這些系統目前或未來可能用于瑞士武裝部隊。
在這項工作中,我們研究了人工智能系統,特別是基于神經網絡的蒙特卡羅樹搜索算法,以支持地面防空 (GBAD) 領域的規劃、培訓和決策。我們將人工智能應用于商業 (COTS) 兵棋推演“Command: Modern Operations(CMO)”,以探索復雜的決策空間,并生成新紅軍行動方案。這將挑戰藍軍作戰人員的預案,并促進新技術、戰術和概念的發展。
上述應用程序涉及兩個主要軟件組件。首先,需要有要模擬場景的規則和物理約束的模型(所謂的模擬器),其次,在模型所代表的沖突中控制一個或兩個參與者的 AI 算法。本節介紹了這兩個組件及其集成。在當前場景中,博弈的一方由 AI 智能體進行,而另一方則由游戲引擎本身通過預先編寫好的條件動作進行控制。具體來說,AI 控制攻擊的紅色戰斗機,而游戲引擎控制藍色防空炮組。
圖2-1: Command: Modern Operations兵棋推演平臺的用戶界面
圖2-2:Command: Modern Operations兵棋推演平臺回合制博弈模式
圖 4-1:經過訓練的紅色智能體在藍色防空系統范圍內的示例軌跡
美國加州大學與美國航空太空公司聯合從系統的視角提出了支持復雜空間系統、博弈和決策支持系統(DSS)的高級建模、仿真和分析(MS&A)方法。MS&A 方法還涉及支持美國國防采辦生命周期的基于能力的方法,重點放在授前采辦階段,并結合博弈論和兵棋推演來采購復雜的國防空間系統。作者概述了在復雜的防御系統系統環境中設計、分析和開發政府參考系統架構解決方案,相應采購策略的現有模型和工具。雖然提出的 MS&A 方法側重于國防空間系統,但這些方法靈活且穩健,可以擴展到任何民用和商業應用。?
基于需求和基于能力的方法的描述
支持美國國防部國防采辦生命周期的 MS&A 框架
SOSE CONOPS 評估的 MS&A 方法
【引 言】
軍事領導人利用戰場情報和環境信息及時做出戰略和戰術決策,以推進他們的作戰目標,同時試圖否認對手的行動。基于計算機的兵棋推演模擬程序對戰場空間事件進行建模,以幫助決策制定,因此領導者可以從眾多選項中選擇一個更優化的選項,以有效地完成目標。
戰爭是一個充滿不確定性的領域,戰爭中的決策因素籠罩在各種不確定性的迷霧之中。因此,戰爭迷霧是軍事行動參與者所經歷的態勢感知的不確定性。其目標是定義霧的存在位置,并允許分析師在AFSIM等虛擬兵棋推演框架中操縱霧效果。
圖1. 信息環境:該圖展示了應用信息相關能力來實現影響力
這項研究探討了戰爭場景中不確定性的領域,以尋找霧源,這可能會阻礙決策過程,這些過程記錄在三篇提交的期刊文章中。
文章[1] “使用并行搜索算法導航敵方競爭區域(Navigating an Enemy Contested Area with a Parallel Search Algorithm)" 通過在地圖上找到敵方單位位置的配置來探索霧,這會導致并行搜索算法的最大加速。算法優于并行算法,這些結果表明敵方位置的霧可用于破壞搜索和任務分配過程。
文章[2] “AFSIM 中的戰爭霧效果建模(Modeling Fog of War Eects in AFSIM)”[2] 創建了霧識別和操作方法 (FIMM)將霧引入傳感器和通信,并開發霧分析工具 (FAT) 以將 FIMM 實施到用于驗證的高級仿真、集成和建模框架 (AFSIM)。傳感器和通信有助于指揮官感知戰場上的敵軍。霧會扭曲指揮官對形勢的感知,這會扭曲決策過程并導致任務失敗。
文章[3] “將霧分析工具應用于AFSIM 多域 CLASS 場景(Applying Fog Analysis Tool to AFSIM Multi-Domain CLASS scenarios)”利用 FAT 研究霧效應在多個作戰域中的影響,并使用趨勢來支持 FAT 在多域操作中有效且有用的想法FAT 在多個領域的有效性鞏固了這樣一種觀點,即識別和操縱傳感器和通信中的霧對于為軍事模擬分析人員提供選擇以改善兵棋推演中的決策是有效的。
【問題與動機】
軍事領導人必須考慮跨多個作戰領域的大量信息,以便及時做出決策并推進任務。模擬模型試圖真實地模擬戰爭場景以分析行動方案并選擇最佳路徑。在戰爭模擬中提供用于查看不確定性級別或霧的選項的方法可以進一步提高戰爭模擬的真實性。該方法需要對霧源的一般定義以及如何操縱源進行模擬分析。多域分析方法的實現驗證了該方法在查看對未來場景的影響方面的有效性。
問題源于需要為多域作戰的軍事領導人創建決策輔助工具。美國空軍正在研究一種直觀的傳感網格概念,該概念使用來自多個平臺的融合傳感器數據為決策者提供有關競爭環境的信息。傳感網格為戰略和戰術層面的領導者提供了獲得和保持對抗對手的決策優勢。網格假設傳感器收集信息并通過通信鏈路將其傳輸到集中處理實體。領導人希望盡可能準確地描述環境,因此霧源的識別以及霧如何影響決策過程允許軍事分析人員在處理信息并將數據發送給決策者時考慮霧。
決策代理與傳感網格概念相似,但代理提供決策能力,而不是為人類決策者提供決策輔助。在基于環境信息收集、處理和形成決策時,決策代理可以將霧合并到行動過程 (COA) 分析中。在 COA 中考慮霧可能會改變哪個選項被認為是最佳的。對多個域的霧的識別和操作允許一種更現實的方法來形成決策和決策輔助。
【研究路線圖】
以下路線圖提供了總體研究目標。
1. 識別兵棋推演場景中影響指揮官決策過程的不確定性來源。
2. 創建一種方法來識別和操縱兵棋推演中的不確定性,使用傳感器進行數據收集和數據傳輸通信。
3. 為現有兵棋推演模擬開發工具,以實施該方法并驗證其影響。
4. 分析多域場景,以驗證該工具在擾亂所有作戰域的決策過程中的有效性。
該路線圖側重于霧效應的識別和處理。并行搜索文章側重于尋找兵棋推演場景中的不確定性來源。介紹FIMM和FAT的論文針對的是第二項和第三項。上一篇文章提供了支持第四項的結果。本文介紹的每篇文章都以期刊格式顯示。
【結 論】
當決策者沒有關于環境的完整信息時,兵棋推演中的戰爭迷霧就會出現。霧源于對敵人、敵人意圖和敵軍缺乏了解。霧也可能來自自然環境和友軍的行為。例如,一個在整個地圖上搜索目標的單元可能在多次搜索后變得筋疲力盡。搜索目標的多個單元可能會劃分搜索時間。霧識別和操縱方法(FIMM)提供了一種在與傳感器和通信鏈路相關的兵棋推演中操縱霧效應的新方法。霧分析工具 (FAT) 在高級模擬、集成和建模框架 (AFSIM) 中提供了 FIMM 的實現。將霧引入傳感器和通信鏈路會影響指揮官從信息收集平臺接收的信息,并將其傳播到效應生成平臺。霧的引入和操縱可能會導致指揮官失敗。較高水平的霧效應往往會導致較高的故障率。在分析各種多域場景時也會出現這種趨勢。
【未來工作】
與順序算法相比,搜索算法的測試套件將收集更多結果來分析地圖配置如何影響并行算法的加速。測試套件需要地圖生成器來隨機排列地圖上的圖塊,同時保持假設有序。
FAT 是 AFSIM 分析人員為模擬運行更改不同級別的霧的便捷工具。但是,FAT 的使用是高度手動的。該過程可以轉換為測試套件,其中該工具自動采用 AFSIM 場景并找到傳感器對象和通信對象,以不同的霧級別和運行次數模擬每個對象,并提供有關成功/失敗的統計報告率。該測試套件可以消除尋找使用 FAT 的標準化方法的需要,并且可以對每個場景進行唯一處理。
將 FAT 集成到 Warlock 應用程序將允許實時分析霧效果。分析師將能夠實時更改霧效果值并查看它如何影響場景的成功。具有實時分析的 FAT 可用于細粒度的戰術策略測試。
?標題
On games and simulators as a platform for development of artificial intelligence for command and control
期刊
Journal of Defense Modeling and Simulation (JDMS)
美國國防建模與仿真學報
作者 Vinicius G. Goecks, Nicholas Waytowich, Derrik E. Asher, Song Jun Park, Mark Mittrick, John Richardson, Manuel Vindiola, Anne Logie, Mark Dennison, Theron Trout, Priya Narayanan, Alexander Kott
機構
美國陸軍研究實驗室
摘要
游戲和模擬器可以成為一個有價值的平臺,可以執行復雜的多智能體、多人、不完善的信息場景,與軍事應用有很大的相似之處:多個參與者管理資源并做出指揮資產的決策,以保護地圖的特定區域或中和敵方部隊。這些特征通過支持開發具有復雜基準的算法和快速迭代新想法的能力,而吸引了人工智能 (AI) 團體。人工智能算法在《星際爭霸II》等即時戰略游戲中的成功也引起了軍事研究界的關注,旨在探索類似技術在軍事對應場景中的應用。
本文旨在架起游戲與軍事應用之間的橋梁,討論了過去和當前游戲和模擬器以及人工智能算法如何適應模擬軍事任務,以及它們如何影響未來戰場方面所做的努力。
本文還研究了虛擬現實和視覺增強系統的進步如何在與游戲平臺及其軍事相似之處的人機界面中開辟新的可能性。
關鍵詞
人工智能、強化學習、兵棋推演、指揮控制、人機交互、未來戰場