模擬環境中的逼真行為是必要的,尤其是在訓練模擬器的空對空戰爭中。與有限狀態機(FSM)等以前的技術相比,有了行為樹這一新框架,行為可以變得更加逼真、模塊化、靈活和可擴展。人工運算符或智能體通常是靜態構建的,這意味著一旦它們以特定方式構建,就不會改變其行為,因此在對它們進行一些練習后,就很容易預測它們的行為。即使是靜態構建的智能體,其行為也會變得非常復雜,它們必須能夠以合作的方式應對環境和其他智能體。利用新的算法和框架,這些智能體及其行為可以不斷學習新的戰術進展,并在不同的可能交戰技術之間進行切換,以挑戰人類操作員。智能體可以變得更智能、更逼真,幫助人類飛行員訓練新的戰術方法。該技術將在未來幫助設計人員看到新的模式,并創建可在多種場景中重復使用的通用行為。
在本論文中,一種名為遺傳算法(GA)和遺傳編程(GP)的人工智能技術將作為一種優化算法,用于搜索解決方案空間,并在名為戰術模擬(TACSI)的模擬環境中演化人工行為。模擬場景是兩個智能體之間的超視距(BVR)搏斗,其中對手使用靜態行為,而學習型智能體將針對靜態行為進行訓練。BVR 場景的設置是兩個智能體以相同的起始位置、高度和武器裝備(即四枚 BVR 導彈)面對面開始。學習智能體必須學習動作空間(即可用動作)和動作的工作原理,然后將其應用到狀態空間(如識別目標和發射導彈)。然后,當一個或一組解決方案滿足要求時,生成的解決方案將在新的場景設置中進行評估和測試,在新的場景設置中,位置、方向和高度都是隨機的。在新的設置中測試智能體,可以分析其適應性。
從結果中可以看出,所有解決方案都有一個缺陷,即過于被動。算法很難設計攻擊序列,但逃離和機動序列卻不難設計。每種行為的模擬測試也表明了這一點,大多數情況下都以平局告終。
第 2 節將介紹 BT 框架的歷史、包含的不同節點類型以及 BT 框架的優缺點。第 3 節將向讀者深入介紹人工智能,并介紹機器學習(Machine Learning),這是一種通過獎勵和將輸入映射到輸出來智能訓練智能體的技術。第 4 節將介紹進化計算(EC)和選擇開發的算法。所選技術稱為遺傳算法和遺傳編程。第 5 節將介紹系統架構、組件以及與 TACSI 的集成。第 6 節將展示四種不同解決方案在斗狗場景中的模擬評估。第 7 節將討論算法、框架和評估。第 8 節將介紹本論文在倫理和道德標準方面的合理性,第 9 節將介紹未來的工作。
本文展示了本研究第一部分討論的 L-V-C 模擬框架的實施。在空戰 TTP 的測試與評估 (T&E) 中演示了該框架的實施。TTP 由描述飛機飛行員如何協調行動以實現空戰目標的規則組成。在演示中,TTP 規則分別在 C、V 和 L 模擬階段反復制定。在 C 階段,在不考慮人機交互(HMI)中人類行為影響的情況下,確定與飛機存活概率(Ps)和擊落概率(Pk)相關的最優規則。在 V 階段,通過評估 Pk 和 Ps 的適用性,以及有關飛行員態勢感知、心理工作量和 TTP 規則遵守情況的人機交互措施,對最佳規則進行修改。在 L 階段,使用 F/A-18 飛機和合格的戰斗機飛行員來評估在 C 和 L 階段開發的 TTP 是否能在真實環境中實現可接受的 Pk、Ps 和 HMI 測量。
如圖 1 所示,L-V-C 仿真框架分為 C、V 和 L 三個階段。在第一個 C 階段,初始 TTP 的定量規則被實施到 C 仿真中,敵機被設定為遵循初始場景中確定的行為。進行 C 模擬運行,直到找到最大殺傷概率(Pk)和滿足生存概率(Ps)=1 約束條件的機器性能(MP)最優值(見第 1 部分)。C 階段不考慮僚機的態勢感知 (SA)、腦力勞動負荷 (MWL)、標準性能 (NP) 或人機性能 (HMP) 輸出。有關 SA、MWL、NP、HMP 及其測量的完整說明,請參見第 1 部分。如果因 Vor L 階段的 SA、MWL、NP 或 HMP 輸出不可接受而重復 C 階段(見圖 1 中從 V- 和 L 階段到 C 階段的虛線),則通過最小化 (Pk-Pkref)^2 放寬原始優化標準,其中參考殺傷概率(用 Pkref 表示)根據 V- 或 L 階段的結果以及之前 C 階段獲得的 Pk 最佳值進行選擇。通過分析前一個 V 或 L 階段的結果,選出在新的 C 階段應調整其值的定量規則。
第一個 V 階段既考慮初始 TTP 的定性規則,也考慮源自 C 階段的 MP 最佳定量規則。如果重復 V 階段,則定性規則源自前一個 V 階段或 L 階段(見圖 1 中從 L 階段到 V 階段的虛線,以及從 V 階段到 V 階段的虛線)。
僚機作為參與者在 V 仿真中飛行,而所有其他飛機則作為構造實體在仿真中執行。記錄僚機的 NP、SA、MWL 和 HMP 輸出。Pk 是根據模擬開始和結束時敵機存活率估算的,Ps 是根據模擬開始和結束時友機存活率估算的。友方建設性實體被設定為遵循 TTP T&E 前幾個階段得出的規則,敵方建設性實體被設定為遵循與 C 階段相同的情景。參與者的任務是遵循定向定性規則和 MP 最佳定量規則。參與者不會被告知情景是如何展開的。
如果在 V 階段結束時 Pk 和 Ps 不盡如人意,則會確定可修改的規則,以改進總體 HMP 輸出。如果 Pk 和 Ps 都令人滿意,則目標是確定可改善 NP、SA 或 MWL 的規則。如果修改了定量規則,則 TTP 返回 C 階段,而不修改定性規則(見圖 1 中從 V 階段到 C 階段的虛線)。如果定性規則被修改,則重復 V 階段,對參與者的定性規則進行精煉的口頭描述(見圖 1 中從 V- 到 V 階段的虛線)。只有當建構實體的定性規則影響到參與者遵守規則的能力時,才會對其進行調整。
每次重復 V 階段時,都會將 NP、SA、MWL、Pk 和 Ps 與前一個 V 階段的結果進行比較,目的是找出模擬的 Pk、Ps 與 NP、SA 和 MWL 分數之間的顯著差異。一旦 V 階段的結果令人滿意,就會獲得模擬環境中的 HMP 最佳規則,TTP T&E 就會進入 L 階段。
在 L 階段,先前確定的 HMP 最佳規則將在真實環境中進行評估。L 階段使用真實的飛機和飛行員。參與者的任務是遵循 V 階段確定的 HMP 最佳規則。所有其他飛行員作為輔助飛行員,遵循前一階段使用的建設性實體規則。以 Pk 和 Ps 衡量的 HMP 輸出以及參與者的 NP、SA 和 MWL 分數將被記錄下來。這里,Pk 和 Ps 的估算方法與 V 仿真相同。對 V 階段和 L 階段的結果進行綜合比較。如果 L 階段的 Pk 和 Ps 是可接受的,并且 NP、MWL 和 SA 的得分沒有明顯低于 V 階段的得分,則結果是平衡的。如果情況并非如此,則以與 V 階段相同的方式確定可能需要修訂的規則。然后,根據對規則進行定性或定量調整的需要,將 TTP 返回 C 階段或 V 階段(見圖 1 中從 L 階段到 C 階段和 V 階段的虛線)。如果 V 階段和 L 階段的結果平衡,則 TTP T&E 結束。下一節將演示 L-V-C 模擬框架的實施。
本文介紹了一種新的 L-V-C 模擬框架,用于開發空戰戰術、技術和程序(TTP),從而推進了實戰(L)、虛擬(V)和建構(C)模擬方法。在該框架中,戰術、技術和程序(TTP)是在獨立的 C、V 和 L 模擬階段反復開發的。這樣既能利用每類模擬的優勢,又能避免純 LVC 模擬的挑戰。C 階段在不考慮人機交互(HMI)的情況下,根據飛機的存活概率(Ps)和擊落概率(Pk)提供最佳 TTP。在 V 階段,通過評估 Pk 和 Ps 的適用性,以及有關飛行員態勢感知、心理工作量和 TTP 堅持性的人機交互措施,對最佳 TTP 進行修改。在 L 階段,使用真實飛機來評估所開發的 TTP 是否能在真實環境中實現可接受的 Pk、Ps 和 HMI 測量。該框架的迭代性質使 V 階段或 L 階段能夠揭示 TTP 的缺陷,并將不完善的 TTP 返回 C 階段或 V 階段進行修訂。本文是兩部分研究的第一部分。第二部分展示了該框架在作戰使用的 C- 和 Vs 模擬器以及真實的 F/A-18C 飛機和飛行員中的應用。
關鍵詞:空戰、人為因素、人機交互、實時-虛擬-建構、心理工作量、性能、模擬、態勢感知、測試與評估
本文是兩部分研究的第一部分。在第 1 部分中,介紹了用于 TTP T&E 的實時-建設性-虛擬(L-V-C)模擬評估框架。在第 2部分中,使用實際使用的 C 和 V 模擬器以及真實的 F/A18C 飛機和合格的戰斗機飛行員演示了該 L-V-C 框架的使用。與 LVC 模擬不同,L-V-C 框架并不試圖混合不同的模擬類別,因此避免了 LVC 模擬所面臨的挑戰。建議的框架由獨立的 C、V 和 L 階段組成,在這些階段中,TTP 在給定的空戰場景中反復發展。在 C 階段,不考慮 TTP 的定性規則,但使用 C 仿真來確定 TTP 定量規則的 MP 最佳值。在 V 階段,采用這些最優定量規則,并改進定性規則的口頭描述,直到使用 Pk 和 Ps 衡量的 HMP 輸出足夠,且 NP、SA 和 MWL 分數可接受為止。這樣,在模擬環境中就得到了由定量規則的 MP 最佳值和定性規則的 HMP 最佳描述組成的 HMP 最佳規則。最后,使用這些 HMP 最佳規則對 TTP 進行 L 階段的 L 模擬評估。如果 HMP 最佳規則在現實生活中的使用能產生適當的 HMP 輸出,且 NP、SA 和 MWL 分數可以接受,則 HMP 最佳規則可用于實際操作。換句話說,根據 Pk 和 Ps 得出的運行 HMP 最佳規則可確保實現飛行的主要目標,同時在實際環境中 NP、SA 和 MWL 仍可接受。這樣,即使最終使用任務的要求和復雜程度超過了 TTP T&E 期間的要求和復雜程度,也能在人類能力和限制方面保持理想的安全系數。
L-V-C 模擬框架的一大優勢在于其迭代性。也就是說,如果需要修改定性規則,可以在 L 階段或 V 階段之后重復 V 階段。或者,如果需要修改定量規則,TTP 可以從 V- 或 L 階段返回 C 階段。在 L 階段和 V 階段,HMP 輸出,特別是 SA、NP 和 MWL 分數,為檢測 TTP 可能存在的缺陷和確定如何改進 TTP 提供了強有力的工具。此外,如果需要,TTP T&E 需要反復進行 C 仿真,V 階段和 L 階段的這些分數還可用于生成修改后的優化標準和 C 階段應用的約束條件。最終的 TTP 在 MWL、NP、SA 和最終的 HMP 輸出之間實現了很好的平衡,這反映了飛行的主要目標。
圖 2 顯示了由 C、V 和 L 三個階段組成的 L-V-C 模擬框架。在使用該框架之前,必須根據 TTP T&E 的總體目標,定義初始 TTP 及其使用場景。情景描述了所涉及的友機和敵機及其主要目標。TTP 是一種描述友機如何在特定場景中以最佳方式實現其目標的方法。TTP 通常以相對于敵方飛機的時間表的形式向飛行員簡要介紹。場景中使用的飛機和系統均以 C- 和 V- 模擬建模。這些模型必然是對現實的不完全抽象。不過,這并不會對 L-V-C 框架構成重大挑戰,因為 TTP T&E 的 L 階段是使用真實飛機和系統進行的。初始 TTP 的定量規則值和定性規則描述均基于現有的最佳假設和實踐。L-V-C 模擬框架用于確定部分或全部規則的作戰 HMP 最佳值或描述。它可用于確定整個飛行、一個要素或單個飛行員的運行 HMP 最佳規則。
使陸軍能夠更快地模擬下一代地面作戰平臺和任務有效載荷在實際操作條件下的性能
通過士兵的持續反饋,更快、更經濟地試驗、改進和探索多種設計方法
量化下一代平臺,確定技術差距和能力投資機會,以支持需求開發和地面車輛決策
在戰術環境中工作的士兵、急救人員和野戰人員越來越多地使用移動系統為任務提供支持。然而,動態環境、有限的計算資源、斷開的間歇限制(DIL)、網絡連接和高度壓力對戰術環境中的移動系統構成了挑戰。
前向部署、可發現、基于虛擬機 (VM) 的 com 節點,可托管在車輛或其他平臺上,以提供
高級任務工程:殺傷網用例
AuroraXR 是一個提供互操作性和數據同步功能的框架,可滿足陸軍和美國國防部其他網絡增強現實、混合現實和虛擬現實系統的使用要求。AuroraXR 提供了從現實世界中的傳感器和外部系統與虛擬環境中的用戶和系統建立雙向信息共享的機制。與游戲行業通常使用的網絡解決方案不同,AuroraXR 是專為戰術網絡架構設計的,在這種架構中,帶寬非常寶貴,連接性也無法保證。本報告將詳細介紹 AuroraXR 的目的、子系統和安全功能,以及部署該軟件的未來目標。
圖 1 不同的身臨其境技術在真實環境和全合成環境之間的位置描述
像 GPT-3 這樣的大型語言模型 (LLM) 在國防領域有著廣泛的潛在應用。以下是LLM在國防相關領域的一些應用方式:
大型語言模型可用于識別社交媒體數據中可能與國家安全相關的模式和趨勢。例如,它們可用于監控社交媒體平臺,以發現動亂或政治不穩定的跡象。
大型語言模型還可用于分析各種來源的新聞文章,以識別新出現的威脅和趨勢。例如,它們可用于監控新聞文章,以發現恐怖活動或網絡攻擊的跡象。
大型語言模型還可用于分析政府報告和其他官方文件,以識別潛在威脅和趨勢。例如,它們可用于分析情報機構或軍事組織的報告,以識別新出現的威脅。
大型語言模型還可用于生成這些數據的報告和摘要,幫助決策者更輕松地理解信息。例如,它們可用于生成每日或每周報告,介紹可能與國家安全相關的新興威脅和趨勢。
在現代空戰中,超視距(BVR)交戰越來越頻繁。飛行員面臨的主要挑戰之一是機動計劃,這反映了他們的決策能力,并能決定成敗。為確保采用虛擬BVR空戰模擬的飛行員訓練取得成功,計算機生成部隊(CGF)的高精度水平至關重要。要實現這一目標,不僅要充分復制和模擬實體的物理特性,還要使其具有接近人類的行為。在本文中,我們提出了應對這些挑戰的總體概念: 首先,我們引入飛行運動動態模型(飛機、導彈、箔條)以及干擾器。然后,我們分析典型的超視距空戰的工作流程,將其分為攻擊、自衛和決定。在此背景下,我們引入行為樹作為這些任務的建模方法,并解釋其優點。進一步的計劃包括在未來由人類控制的對手飛機(飛行員)與CGF對飛的實驗活動中驗證和確認CGF的行為。最后,我們對未來的工作進行了展望,我們打算在包含多個自由度的任務中采用強化學習。
目的:應用綜合決策支持關鍵--評估框架(IDSK-EF)后的任務工程(ME)來評估能力,并為概念、科技、P&E、PoR、CPM和操作領域的決策提供信息。
概念:任務工程研究確定/驗證了任務能力差距和擬議的技術解決方案。IDSK-EF將能力評估作為框架,為整個概念到實戰的決策提供信息。
科學和技術(S&T)開發技術解決方案
原型開發與試驗(P&E)使技術解決方案得以實施
收購計劃(PoR)開發、獲取操作能力
能力組合管理(CPM)管理能力組合的實戰化