美國國防部致力于推行基于模型的系統工程(MBSE)以加速并優化復雜系統的采辦流程,但尚未提供關于如何全面實施MBSE的指導方針。這催生了以下研究機遇:選取國防部通用流程,基于現有文獻構建MBSE方法論,按該方法生成模型,記錄建模成本,并通過訪談模型接收方評估其投資價值。本研究針對聯合前沿指揮控制(C2)能力評估(CBA)報告的差距分析與特征描述階段,開發了包含12個步驟的方法論。研究識別出13個數據組:系統資源、條件、問題陳述、能力、聯合能力領域、度量、度量屬性、三類任務以及三種滿足關系。建模總耗時149.6小時,其中69.8小時用于數據結構與本體構建,79.8小時用于具體實例建模。軟件工具、培訓與人工總成本略低于20,000美元。利益相關者訪談表明,模型在可追溯性、迭代便利性與重用性方面的效益遠超構建成本。未來研究方向包括:調整分析技術、將建模工作擴展至CBA流程其他環節,以及與任務工程模型集成。
世界正變得日益復雜且高度互聯。這一趨勢的直接結果是,無論公共部門還是私營機構,獲取競爭優勢的難度都在持續增加。系統工程(Systems Engineering, SE)學科通過幫助工程師思考如何實現期望的涌現行為并減少非預期后果,為解決這一挑戰提供了方法論支撐。傳統系統工程實踐還通過系統化分析設計決策的影響,有效管控項目成本超支與進度延誤風險。
近年來,計算機算力的提升催生了IBM Rhapsody、Catia Magic系統之系統架構師等數字化系統工程建模工具。此類概念建模工具通過強制邏輯一致性、術語標準化及關系圖可視化等優勢(Henderson與Salado,2021;Maurandy等,2012),以傳統文檔無法實現的方式賦能系統工程師。將此類工具與建模方法學及語言相結合的應用實踐,即基于模型的系統工程(Model-Based Systems Engineering, MBSE)(Delligatti,2013)。MBSE實踐者普遍認可其在可追溯性、完整性與信息可訪問性方面的顯著提升,以及返工、錯誤與成本的顯著降低(Campo等,2023;Henderson與Salado,2021)。
美國國防部(DoD)正致力于構建基礎設施、流程與培訓資源以支持采辦專業人員獲取MBSE效益。此類使能活動的投入對組織能否成功實施MBSE并實現生產力躍升至關重要,但高成本特性使得預算分配策略尚不明晰。這引出一個關鍵實踐問題:國防部是否應在系統完成設計階段進入維護期后推進MBSE轉型?
本研究通過選取國防部戰術空中控制小組(TACP)現代化項目作為案例,在其開展能力評估(CBA)過程中探索上述問題。該項目辦公室需評估現有資源能否滿足未來作戰需求,本研究將重點分析MBSE如何支持這一進程。
當前,美國防部已將戰略重心從中東反恐作戰轉向應對南太平洋地區同等級/近同等級對手的沖突。這一轉型迫使眾多進入里程碑C后的項目重新評估其武器系統是否適配國防部未來需求。許多系統已進入運維階段且原始設計針對不同任務場景,國防部要求項目辦公室實施調整以支撐動態任務需求。
除任務轉型外,國防部正推進數字工程范式變革。眾多工程師致力于開發跨企業適用的流程體系。MBSE的新興特性為研究提供了廣闊空間——許多國防部流程尚未制定MBSE實施指南,為實踐者留有探索余地。本研究聚焦任務轉型與數字工程轉型的交匯點,探究如何優化MBSE在能力評估中的支持作用。
本研究通過四項來源的內容分析構建能力評估(CBA)建模方法論:CBA流程、任務工程流程、能力組合管理(CPM)以及系統建模語言(SysML)的權威教材。研究者隨后應用該方法論為"聯合前沿C2能力評估"具體用例創建模型,并跟蹤建模工作所需的資源投入。最后通過訪談評估模型對CBA流程的影響,嘗試歸納該CBA模型的優勢與不足。
本研究提出一種針對動態武器目標分配(DWTA)問題的強化學習(RL)框架,該組合優化問題具有軍事應用背景。動態武器目標分配是靜態武器目標分配問題(WTA)的擴展,通過引入時間相關要素以模擬戰爭的動態特性。傳統WTA解決方法包括簡化模型、精確算法和啟發式方法,但這些方法面臨可擴展性與計算復雜性挑戰。本研究提出包含時間階段的DWTA數學模型,支持多階段戰略規劃。該模型被構建為帶有約束條件的非線性整數規劃問題,確保武器分配方案在時間維度上的可行性。為應對大規模DWTA的計算挑戰,論文采用深度強化學習(DRL)算法——特別是深度Q網絡(DQN)與行動者-評論家(AC)算法——來學習高效的武器分配策略。所提出的強化學習框架通過多種問題場景驗證,證明其能在合理推理時間內提供可行解決方案,適用于時效性要求高的應用場景。結果顯示,強化學習方法在約束編程精確算法的對比中表現更優,且隨著問題規模擴大優勢愈發顯著,凸顯了其在DWTA問題中實際應用的潛力。
武器目標分配(WTA)屬于組合優化問題(COP),其目標是通過戰略性分配武器至目標以最大化對敵毀傷效果。隨著新型武器系統的發展及其使用復雜性的提升,WTA的重要性日益凸顯,凸顯出對高效算法管理多樣化武器的迫切需求(Kline等人,2019a)。然而,Lloyd與Witsenhausen(1986)證明WTA問題屬于NP完全問題,表明不存在已知的多項式時間算法。這一復雜性導致計算量隨問題規模擴大或條件復雜化而急劇增加。
WTA問題可分為靜態與動態兩類。動態武器目標分配(DWTA)考慮武器使用的時間依賴性(Kline等人,2019a),而靜態武器目標分配(SWTA)被視為原始WTA問題,也是DWTA在時間階段數為一時的一種特例。本研究通過引入多時間階段擴展原始WTA問題,形成DWTA框架。這一改進使得可用資產可被戰略性地分配,從而隨時間推移達成理想的終局狀態。它反映了戰場場景中決策的動態性——每次交戰的成果將影響后續決策。有效的武器-目標分配規劃需適應這種動態環境。具體而言,必須考慮武器的可用性限制,因為并非所有武器均可無限使用,它們可能需要在下次交戰前補充彈藥、人員或燃料。
因此,本研究中提出的DWTA模型包含每次武器分配后的準備時間。該方法通過強調周密規劃與資源管理優化決策流程,確保武器分配在考慮后續交戰需求的前提下實現高效配置。
本研究采用強化學習(RL)解決DWTA問題。自Bello等人(2016)提出以來,RL已成為應對組合優化問題的前沿方法。與監督學習不同,RL無需標記數據進行訓練,而是通過基于獎勵的學習機制實現優化,這使其特別適用于組合優化問題。具體而言,本文對比了采用深度強化學習(DRL)算法的模型。DRL在缺乏真實數據或獲取成本高昂的大規模組合優化問題中表現優異,因其可利用神經網絡等近似函數并從獎勵信號中學習。DRL模型可通過學習參數高效解決問題,無需從零開始求解每個問題。此外,由于學習基于仿真器生成的獎勵,DRL能適應問題條件變化而無需重構數學模型。
本研究實施了兩類代表性DRL方法:深度Q網絡(DQN)與行動者-評論家(AC)算法。DQN是基于價值的算法,旨在近似特定狀態下采取行動的預期獎勵,通過最大化該價值學習最優行動策略。相比之下,AC算法結合了基于策略與基于價值的方法,通過"行動者"直接學習特定狀態下的最優行動,而"評論家"評估行動者決策的有效性。本研究通過對比同一DWTA場景下采用相同訓練方法的DQN與AC算法性能,旨在分析不同算法的結果差異。該方法有助于深入理解各類DRL算法在不同DWTA配置下的表現差異。
論文后續結構安排如下:第二章綜述前人研究并闡明本研究與前人工作的差異;第三章定義DWTA框架;第四章闡述方法論;第五章展示實驗方法與結果;第六章為全文結論。
在現代戰斗中引入機器人與自主系統(RAS)似乎是不可避免的,其優勢顯而易見,如降低風險和擴展人員。本研究選擇了異構無人飛行器(UAVs)的持久偵察作為研究范圍,這也是比較突出的應用之一。盡管在開發先進硬件和算法方面做出了不懈努力,但在現實世界中仍缺乏實際應用。根本原因似乎是最先進的算法不足以應對軍事環境中的高動態性和不確定性。
目前,軍方使用基于意圖的指揮與控制(C2)來應對這些挑戰,因為它們與作戰有著內在的聯系。因此,將 C2 的通信原理轉換為適用于 RAS 的數學方法似乎大有可為,而基于意圖的協調就是這種轉換的結果。為了能夠應對高動態性和不確定性,提出了三項要求。首先,需要有靈活性,以便就地修改解決方案。其次,需要對不可靠的通信具有魯棒性;第三,需要可擴展性,以確保在更大的感興趣區(AOI)和更大的無人機團隊中也能保持性能。
單智能體偵察問題(SARP)和多智能體偵察問題(MARP)是訪問頻率和覆蓋水平方法的緊湊組合,用于持久偵察。根據多機器人系統(MRS)團隊合作和組織方面取得的進展,提出了一種協調方法。這種協調方法將 MARP 的 AOI 劃分為更小的不相交子集,這樣每個無人機就可以獨立解決不同的 SARP。這項研究的主要貢獻在于,這種協調方法基于意圖發揮作用,實現了所需的靈活性、魯棒性和可擴展性。為此,它構建了一個監督員層次結構,在重疊子集上執行分布式合作。該分布式問題使用新穎的復雜并發約束(CCB)來解決,CCB 是并發前向約束(ConcFB)的調整版本,適用于具有復雜局部問題的分布式約束優化問題(DCOP)。此外,在分支與價格的定價步驟基礎上,通過將列生成應用于重新制定的 MARP 版本,生成了一個下限來對所獲得的解決方案進行基準測試。
基于意圖的協調在面對 AOI 的擾動時表現出了靈活性。特別是當變化比較分散時,無需立即修改整個解決方案。此外,如果由于通信失敗而先發制人地終止合作,則可觀察到針對由此產生的次優子集的魯棒性。特別是對于層次結構中的較高層次,次優解決方案可以由較低層次的解決方案進行部分修正。最后,對于越來越大的問題實例,該方法的計算時間呈亞線性增長。因此,基于意圖的協調提供了一種令人興奮的方法,即使在更具挑戰性的環境中也能保持 RAS 的性能。
圖 1.1: 將多智能體偵察問題(MARP)的 “感興趣區域”(AOI)分割成更小的、互不關聯的單智能體偵察問題(SARP)的示例
從根本上說,假定持久偵察可以通過求解多智能體偵察問題(MARP)來實現最優化,但考慮到軍事環境的挑戰,這并非易事。盡管如此,為了獲得良好的解決方案,本論文嘗試將基于意圖的 C2 原則轉換為一種數學方法,命名為基于意圖的協調。這種協調方法旨在將 MARP 分割成更小的單智能體偵察問題(SARP),并分別求解。圖 1.1 顯示了無人機在不相交的 AOI 子集中聯合優化路徑和單獨優化路徑之間的差異。
圖 1.2:求解方法的總體描述。不是求解 MARP 達到最優,而是將 AOI 劃分為更小的子集,以便單獨求解更小的 SARP。使用基準方法對結果進行比較。
圖 1.2 顯示了總體結構。在給出 AOI 的情況下,基于意圖的協調為多個 SARP 創建子集。合并后的結果應類似于 MARP 的最優解,這可以使用特定的基準方法進行評估。因此,本論文的主要貢獻可以列舉如下:
強調在現實作戰環境中使用傳統求解方法執行各類偵察任務的基本問題(第 2 章)。
將 SARP 和 MARP 表述為緊湊模型,結合頻率和覆蓋水平方法用于持續偵察(第 3 章)。
為了生成嚴格的下限,使用列生成法對 MARP 進行了松弛的重構求解,其中包括頻繁求解初等最短路徑問題(ESPP)。由于 MARP 的結構,必須包括循環距離,以及其他一些針對具體問題的調整,以改進前向標注[3](第 4 章)。
通過描述基于意圖協調的分布式分層框架,解釋基于意圖的 C2 的轉換(第 5-2 節)。
實施模糊 C-Means(FCM)[4],并增加后處理插值方法,對相關扇區特征進行權衡聚類,以降低問題的復雜性并適應傳感器的異質性(第 5-3 節)。
制定一個任務分配問題,在智能體之間細分聚類,作為自上而下的啟發式來創建子集。任務分配包括任務效用度量和新穎的二次任務依賴性約束,以適應有限的能力(第 5-4 節)。該方案被擴展為適用于分布式分層框架的合作方案(第 5-5-2 節)。
為了解決分布式合作公式,對并發前向邊界(ConcFB)[5] 算法進行了調整,以適應復雜的局部問題,從而形成復雜并發邊界(CCB)(第 5-5-5 節)。
全面分析,包括參數和組件性能,以及針對軍事環境的具體定量評估。(第 6 章)。
該項目建立在美國國家航空和航天局高級數字顧問合作技術(ADAPT)項目(前身為遠程建議和協助(RAA)工具包)的基礎上。開發 RAA 套件是為了填補禁止美軍隨同伙伴部隊行動的政策空白。ADAPT 將 RAA 技術從直接行動任務集擴展到所有潛在任務類型。NPS 研究小組建議開發 JOCTAK,這是一種統一的 TAK 解決方案,可匯總并顯示來自用戶和傳感器網絡的關鍵相關信息。與 ATAK 相似,JOCTAK 有可能在單個操作員層面顯示特定任務和傳感器信息,但也能匯總和即時分析來自整個作戰區域多個單元和傳感器的數據和信息。這種能力提供了作戰層面的 COP,有助于指揮官、參謀人員和戰術人員及時做出決策。除了將眾多信息流匯總到一個單一的綜合系統外,它還將遠程建議協助概念重新用于大規模殺傷性武器行動。集成的 TAK 系統將允許不屬于國防部或不在聯合行動中心的核專家和大規模殺傷性武器專家在應對大規模殺傷性武器行動時為美軍和伙伴部隊提供遠程建議和協助。
第二章回顧了重要的背景信息、指導條令以及對 TAK 及其以往使用情況的熟悉。第三章討論了 TAK 系統作為大規模殺傷性武器 C4I 系統的應用,包括一系列小故事,說明其對戰術級作戰人員和作戰級指揮的附加價值。第四章詳細介紹了為確定 ATAK 系統的能力差距而進行的迭代實驗過程,以確定在聯合作戰中心開發和擴大 TAK 的使用范圍需要做些什么。第四章還包含對開發 JOCTAK 的建議。第五章是結論,討論了在大規模殺傷性武器聯合信息與制造 C4I 解決方案總體框架下有關研究問題的發現。
現有的軍事創新模式假定軍隊內部普遍抵制變革,因此需要外部影響來誘導軍事創新。在這些方法中,技術與創新之間的復雜關系通常是通過將技術的重要性降到最低或將技術與創新的社會過程分開來解決的。然而,這些方法難以反映技術與軍事創新之間新出現的動態關系,因此可能會造成國家資源的浪費和不必要的血腥戰爭。重構技術與軍事創新之間的關系,可以為軍隊顯然無法將技術與戰略目標相結合的問題提供新的見解,并為未來更有效的調整提供依據。
本文利用建構性科學與技術研究概念的見解,建立了一個新的軍事創新模型:在此稱為技術三位一體。技術三位一體描述軍事社會技術系統的方式突出了軍隊內部的變革與創新。該模型描述了條令、物資和 “軍事知識”(一個與戰爭行為的社會建構真理有關的新概念)如何相互作用,在軍隊內部產生變革和創新。在構建該模型并深入探討其在二戰前美國陸軍裝甲戰發展中的應用--該模型正是從這一案例中發展而來的--之后,論文探討了技術三位一體的邏輯延伸,以建立一個演繹框架,并據此檢驗該模型的普適性。美軍在越戰結束前的核武器創新為該模型提供了戰略層面的檢驗,而美國、俄羅斯、以色列和阿塞拜疆武裝無人機的開發和使用則為技術三位一體提供了當代創新的檢驗。這三個案例共同表明,從技術三位一體的角度來構建技術與軍事創新之間的關系,可以為軍事領導人采取具體行動提供參考,這些行動涉及最有可能在未來沖突中發揮作用的技術類型,以及如何管理軍事創新以增加實現戰略目標的機會。
圖 2. 技術三位一體三要素是將適用于軍隊的每種不同形式的技術相互聯系起來而形成的。
美國國防部(DoD)正迅速與各軍種合作,從多年期(如 7-10 年)傳統采購計劃轉向基于商業行業的軟件開發方法。雖然商業技術和方法為快速部署任務能力以應對威脅提供了機會,但商業技術是否適用于滿足水面作戰系統的實時要求尚不清楚。這項研究建立了技術數據,以驗證當前商業技術的有效性和適用性,從而滿足國防部作戰管理系統的硬實時要求。有學者進行了類似的研究;然而,微服務、容器和容器編排技術當時還未出現在國防部的雷達上。該領域的最新知識將為國防部未來的路線圖和投資提供參考。將采用基于任務的方法,利用任務工程為應用研究設定背景。已經建立了一個假設的但與業務相關的海峽過境方案,以便在評估假設時為確定實驗參數提供背景。將系統模型聯合起來形成一個系統架構,并利用云計算環境中的數據收集數據進行定量分析。
本文件編排如下:
第 1 章(導言)討論了擬議研究背后的理論體系,討論了本研究的目的,并確定了要解決的問題。
第 2 章(研究背景)介紹了文獻綜述,并討論了以往研究的局限性。
第 3 章(方法論)討論了方法論方法,闡明了任務工程背景,提出了預測和假設,并討論了原型測試環境的開發和實例化。
第 4 章(結果)討論統計分析結果。
第 5 章(討論)概述了研究結果,并討論了研究意義和局限性。
第 6 章(結論)介紹了本研究對工程管理與系統工程(EMSE)"知識體系 "的貢獻,并對未來研究提出了建議。
該項目為與使用無人系統支持分布式海戰(DMO)有關的作戰概念和系統設計決策提供信息。研究通過系統地改變仿真模型中的系統設計特征和作戰活動,支持對無人系統(UVC)進行能力級分析。分析結果表明,UVC 可提高各種無人系統的作戰可用性(Ao)和使用時間(TOS),因為它可隨時進入維護、加油和重新武裝設施,而無需長時間前往岸基設施或分布式支援艦艇。在比較使用 UVC 的配置與在自適應兵力包 (AFP) 中分配無人系統支持的配置時,單個無人系統的 Ao 提高了 6% 到 31%。仿真模型分析確定了 UVC 架構,其中包括至少 8 個無人機發射回收站、至少 3 個船舷托架和至少 5 個甲板井托架,以最大限度地提高 Ao。
在支持分布式海上作戰(DMO)時,無人系統有可能發揮兵力倍增器的作用,在提高殺傷力的同時降低有人系統的風險。然而,無人系統到岸基維護、加油和重新武裝設施的轉運時間減少了可用于支持執行 DMO 的自適應兵力包(AFP)的總體駐扎時間(TOS)。本項目研究了無人水面艦艇 (USV)、無人水下航行器 (UUV) 和無人機 (UAV) 在美國海軍現有艦艇上的集成問題,該艦艇已被重新改裝為無人載具 (UVC)。在本報告中,"UxV "一詞用于描述無人系統這一類別。
如 Van Bossuyt 等人(2019 年)所述,項目團隊采用了系統定義、系統建模和系統分析的通用系統工程流程序列。在系統定義過程中,項目團隊重點開發了作戰概念(CONOPS),并定義了 UVC 的系統要求。系統建模活動的重點是構建 UVC 的離散事件仿真模型。在系統分析階段,團隊利用所開發的模型來評估 UVC 的各種設計參數對每種無人系統類型的運行可用性(Ao)的影響。
A. 系統定義
在系統定義階段,從自上而下和自下而上的角度開發和考慮了 UVC 要求。從自上而下的角度來看,團隊分析并確定了滿足總體任務有效性目標所需的能力,而與任何現有的候選平臺無關。從自下而上的角度來看,團隊評估了一艘登陸直升機船塢(LHD)艦,以確定該平臺可實現的最大 UVC 能力。通過查閱文獻和分析利益相關者的需求,項目團隊確定了 UVC 的以下關鍵能力:指揮與控制 (C2)、UxV 發射、UxV 維護和 UxV 回收。根據設想,UVC 將包括著陸甲板無人機發射和回收站、無人機維護/布防/燃料艙、用于大型 USV/UUV 操作的船舷艙或站,以及用于小型 USV/UUV 操作的井甲板艙。
B. 系統建模
項目構想將 UVC 視為針對地面和岸上敵對兵力實施 DMO 的 AFP 的一部分。UVC 的作用是支持 UxV 對敵方岸基導彈基地進行偵察和打擊。在打擊階段之前、期間和之后,UxV 提供全天候的情報、監視和偵察(ISR)、目標定位和戰損評估服務。UVC 的總體目標是通過消除到岸基支持設施的較長運輸時間來增加 UxV 的全時服務時間。為實現這一總體目標,研究小組選擇 "航程 "和 "持續停留時間 "作為性能指標(MOP),并選擇 "UxV 任務時間"、"UxV 停機時間 "和 "維護灣利用率 "作為效果指標(MOE)。
設計并開發了一個離散事件仿真模型,用于分析 UVC 設計參數對 MOP 和 MOE 的影響。該模型是通過 ExtendSim10 建模程序開發的。該模型包括 UxV 發射和回收、UxV 維護活動以及 UxV 重新武裝和加油活動。UxV 的發射時間表和總模擬運行時間是根據擬議的 UVC CONOPS 制定的。目前,該模型并未考慮 UxV 的損失或故障;這是未來可能開展工作的一個領域。模型的主要輸出是每種 UxV 的 Ao。
C. 系統分析
為了廣泛探索實驗空間,同時減少試驗總數和模型運行時間,我們專門設計了一個填充空間的拉丁超立方設計。每次試驗重復模擬 30 次并收集結果。合并所得的 Ao 值,得出每個試驗的統計平均值。
分析結果表明,UVC 可隨時提供維護、加油和重新武裝設施,而無需在岸基設施或分布式支援艦艇之間進行長時間的轉運,從而改善了每種 UxV 的 Ao 值和 TOS 值。對于任何特定的 UxV,通過增加 UVC 發射、回收和維護站的數量,從而消除或減少這些服務的排隊時間,可獲得最大的 Ao。分析表明,UVC 在設計時應至少配備 8 個無人機發射/回收站、至少 3 個船舷托架和至少 5 個焊接甲板托架。這些參數沒有確定上限,這也是未來研究的一個潛在領域。
有趣的是,雖然 UVC 的存在改善了大型無人水面艦艇(LUSV)的航速,但 UVC 的實際設計似乎對 LUSV 的航速沒有影響。這可能是由于 LUSV 的假定任務持續時間長,假定維護間隔長,因此不可能出現任何排隊現象。單個船側停泊區似乎足以為多艘 LUSV 提供服務,但即使是單個船側停泊區,也可通過消除到岸基設施的轉運時間來改善 Ao。
人工智能解決方案在陸軍野戰應用中的使用將在很大程度上依賴于機器學習(ML)算法。當前的ML算法需要大量與任務相關的訓練數據,以使其在目標和活動識別以及高級決策等任務中表現出色。戰場數據源可能是異構的,包含多種傳感模式。目前用于訓練ML方法的開源數據集在內容和傳感模式方面都不能充分反映陸軍感興趣的場景和情況。目前正在推動使用合成數據來彌補與未來軍事多域作戰相關的真實世界訓練數據的不足。然而,目前還沒有系統的合成數據生成方法,能夠在一定程度上保證在此類數據上訓練的ML技術能夠改善真實世界的性能。與人工生成人類認為逼真的語音或圖像相比,本文為ML生成有效合成數據提出了更深層次的問題。
人工智能(AI)是美國國防現代化的優先事項。美國國防部的人工智能戰略指示該部門加快采用人工智能并創建一支適合時代的部隊。因此,它自然也是陸軍現代化的優先事項。從陸軍多域作戰(MDO)的角度來看,人工智能是解決問題的重要因素,而MDO是建立在與對手交戰的分層對峙基礎上的。雖然人工智能本身沒有一個簡明和普遍接受的定義,但國防部人工智能戰略文件將其稱為 "機器執行通常需要人類智能的任務的能力--例如,識別模式、從經驗中學習、得出結論、進行預測或采取行動--無論是以數字方式還是作為自主物理系統背后的智能軟件"。這句話的意思是,當機器在沒有人類幫助的情況下獨立完成這些任務時,它就表現出了智能。過去十年中出現的人工智能解決方案的一個重要方面是,它們絕大多數都符合模式識別模式;在大多數情況下,它們根據經過訓練的人工神經網絡(ANN)對相同輸入數據的輸出結果,將輸入數據分配到數據類別中。具體來說,深度學習神經網絡(DNN)由多層人工神經元和連接權重組成,最初在已知類別的大量數據上進行訓練以確定權重,然后用于對應用中的實際輸入數據進行分類。因此,機器學習(ML),即自動機(這里指DNN)在訓練階段學習模式的過程,一直是一個主導主題。事實上,DNN在計算機視覺領域的成功是商業和政府部門加大對人工智能關注和投資的原因。訓練算法和軟件開發工具(如tensorflow)的進步、圖形處理器(GPU)等計算能力的可用性,以及通過社交媒體等途徑獲取大量數據,使得深度學習模型在許多應用中得到了快速探索。
在監督學習中,人類專家創建一組樣本來訓練ML算法,訓練數據與實際應用數據的接近程度對人工智能方法的性能起著重要作用。將ML模型應用于軍事問題的主要瓶頸是缺乏足夠數量的代表性數據來訓練這些模型。有人提出使用合成數據作為一種變通辦法。合成數據集具有某些優勢:
然而,最關鍵的問題是在合成數據或混合合成和真實數據上訓練ML模型是否能使這些模型在真實數據上表現良好。美國陸軍作戰能力發展司令部陸軍研究實驗室的研究人員和合作者使用合成生成的人類視頻進行機器人手勢識別所獲得的初步結果表明,在合成數據和真實數據混合的基礎上進行訓練可以提高ML手勢識別器的性能。然而,并沒有普遍或分類的結果表明,當全部或部分使用合成數據進行訓練時,真實世界的ML性能會得到一致的提高。因此,有必要進行系統調查,以確定使用合成數據訓練ML方法的可信度。我們有理由假設,合成數據在提高ML性能方面的有效性將受到實際應用領域、合成數據與真實數據的保真度、訓練機制以及ML方法本身等因素的影響。合成數據與真實數據的保真度反過來又取決于數據合成方法,并提出了通過適當指標評估保真度的問題。以圖像為例,合成數據訓練的ML方法的性能與人類視覺感知的真實場景的保真度是否成正比并不清楚。有可能數據的一些關鍵特征對于ML的性能比那些影響人類感知的特征更為重要。組織這次陸軍科學規劃和戰略會議(ASPSM)的一個主要目的是讓合成數據生成、人工智能和機器學習(AI & ML)以及人類感知方面的頂尖學術界和國防部專家討論這些問題。會議的技術重點主要是圖像和視頻數據,反映了組織者在計算機視覺和場景感知方面的任務領域。
根據上一節提出的問題,會議圍繞三個主題展開:
1.人類的學習和概括: 人類可以從最小的抽象和描述概括到復雜的對象。例如,在許多情況下,觀察一個物體的卡通圖像或線描,就足以讓人類在真實場景中識別出實際的三維物體,盡管后者比卡通圖像或線描具有更復雜的屬性。 這遠遠超出了當前人工智能和ML系統的能力。如果能夠開發出這種能力,將大大減輕數據合成機器的負擔,確保真實數據的所有屬性都嚴格保真。這個例子也說明了一個事實,即用于訓練ML模型的合成數據生成研究與提高ML模型本身的能力密切相關。因此,這項研究的重點是探索人類和動物的學習,以啟發ML和數據合成的新方法。
2.數據合成方法和驗證: 大多數應用ML方法的領域都有針對其領域的數據合成技術和工具。游戲平臺提供了一個流行的視頻合成商業范例。問題是如何評估特定領域中不同合成方法的性能。顯然,我們必須確定執行此類評估的指標或標準。通常情況下,合成工具的作者也會就工具的性能或功效發表聲明。驗證將是評估此類聲明的過程。本研究的目的是探討指導合成和驗證過程的原則。合成技術的例子包括基于計算機圖形的渲染器(如電影中使用的)、基于物理的模擬(如紅外圖像)和生成模型(目前傾向于基于神經網絡)。
3.領域適應挑戰: ML中的領域適應是指使用一個領域(稱為源領域)的數據訓練ML模型,然后將ML應用于不同但相關領域(稱為目標領域)的數據。例如,使用主要為民用車輛的源圖像數據集訓練識別車輛的ML算法,然后使用訓練好的算法識別主要為軍用車輛的目標數據集中的車輛。在使用合成數據進行訓練時,它們通常構成源域,而實際應用數據則是目標域。本次會議的重點是確定和討論有效領域適應中的關鍵問題和挑戰。
ASPSM的審議分四次會議進行。第一天的兩場會議討論了前兩個主題。第二天的第一場會議討論第三個主題,第二場會議在三個主題下進行分組討論。ASPSM兩天的日程安排分別如圖1和圖2所示。從圖中可以看出,每個主題會議首先由該領域的學術專家進行40分鐘的主講,然后由大學專家進行兩個20分鐘的講座。隨后由來自學術界和國防部的專家組成的小組進行討論。最后一個環節是分組討論,與會者可以討論與主題相關的各個方面。
麻省理工學院電子工程與計算機科學系的Antonio Torralba教授在第一分會場發表了關于人類學習與泛化的主題演講。他的演講題目是 "從視覺、觸覺和聽覺中學習",深入探討了深度學習方法如何在不使用大量標注訓練數據的情況下發現有意義的場景表征。舉例說明了他們的DNN如何在視覺場景和環境中的聲音之間建立聯系。讀者可參閱Aytar等人關于這一主題的代表性文章。
同樣來自麻省理工學院的James DiCarlo博士的下一個演講題目是 "視覺智能逆向工程"。他將 "逆向工程 "定義為根據對行為的觀察和對輸入的反應推斷大腦的內部過程,將 "正向工程 "定義為創建ANN模型,以便在相同輸入的情況下產生相應的行為。他的研究小組的一個目標是建立神經認知任務的性能基準,人類或其他靈長類動物以及ML模型可以同時達到這些基準。他的演講展示了大腦處理模型如何適應ANN實現的初步結果,并提出了ANN通過結合這些適應密切模擬人類行為,進而準確描述大腦功能的理由。
第一場會議的第三場講座由加州大學伯克利分校的Jitendra Malik教授主講,題為 "圖靈的嬰兒"。這個題目也許是指最早的電子存儲程序計算機之一,綽號 "寶貝",其創造者之一受到了阿蘭-圖靈的啟發。馬利克教授首先引用了圖靈的觀點:與其創建一個模擬成人思維的程序,不如從模擬兒童思維開始。從本質上講,這意味著創造一種人工智能,通過與環境互動以及向其他人工智能和人類學習來學習和成長。這被稱為具身機器智能。馬利克教授認為,監督學習本質上是處理靜態數據集,因此顯示了在精心策劃的時間點上運行的非實體智能。具體而言,他認為監督訓練方法不適合創建能夠提供人類水平的世界理解,特別是人類行為理解的人工智能。Malik教授介紹了 "Habitat",這是一個由他和他的合作者開發的平臺,用于嵌入式人工智能的研究。在隨后的小組討論中,與會人員討論了演講者所涉及的主題,以及與機器人學習和當前兒童智力發展模型相關的主題。
第二部分“數據合成:方法和驗證”以一個題為“學習生成還是生成學習?”,作者是斯坦福大學的Leonidas gu教授。在研究用于訓練ML的合成數據生成的動機中,他指出可以減輕大量人工注釋訓練數據的負擔。他的前提是,無論合成數據是用于訓練ML還是供人類使用,其生成效率和真實性都非常重要。不過,他表示其他質量指標還沒有得到很好的定義,需要進一步研究。他舉例說明了在混合合成數據和真實數據上訓練ML時,ML的物體識別性能有所提高,但他也承認很難得出可推廣的結論。
卡內基梅隆大學的Jessica Hodgins博士發表了第二場會議的第二個演講,題為 "生成和使用合成數據進行訓練"。演講展示了她的研究小組生成的精細合成場景。利用從真實場景到合成場景的風格轉移過程,她的研究小組創造了一些實例,說明在混合了大量風格適應的合成數據和一些真實數據的基礎上進行訓練的ML方法的性能優于僅在真實數據集或僅在合成數據集上進行訓練的方法。性能提高的原因在于風格轉移克服了合成數據集與真實數據集之間的 "分布差距"。
第二場會議的最后一場講座由加州大學伯克利分校的Trevor Darrell教授主講。他的演講題為 "生成、增強和調整復雜場景",分為三個部分。第一部分詳細介紹了演講者及其核心研究人員開發的一種名為 "語義瓶頸場景生成 "的技術,用于根據地面實況標簽合成場景。該技術可進一步與通過生成過程生成此類地面標簽的模型相結合。Azadi等人對該技術進行了詳細描述。 第二部分涉及增強和自我監督學習。發言人提出,當前的對比學習方法在合成增強數據時建立了不變量,而這些不變量可能是有益的,也可能是無益的。例如,建立旋轉不變性可能有利于識別場景中的花朵,但可能會阻礙對特定方向物體的有效識別。演講者介紹了他的研究小組考慮具有特定不變性的多種學習路徑的方法,并展示了與現有技術相比性能有所提高的結果。 第三部分介紹了一種名為 "Tent"(測試熵)的技術。其前提是DNN應用過程中遇到的數據分布可能與訓練數據不同,從而導致性能下降。因此,需要對DNN參數進行實時或測試時調整,以防止性能下降。Tent技術通過調整權重使DNN輸出的測量熵最小化來實現這一目標。演講者隨后用常用數據集展示了該技術相對于先前方法的改進性能。隨后的小組討論涉及合成方面的挑戰,尤其是紅外圖像方面的挑戰。
第二天的第三場會議以 "領域轉移的挑戰 "開始。約翰霍普金斯大學布隆伯格特聘教授Rama Chellappa博士發表了題為 "解決美國防部實際問題的綜合數據期望與最大化"的演講。演講首先回顧了過去二十年來國防部處理合成圖像的多個項目的歷史。他提出了一個重要論斷,即如果在合成過程中考慮到真實數據的物理特性,那么真實數據和合成數據之間的領域轉換就會減少。Chellappa教授還就領域自適應表示法提供了快速教程,涵蓋了正規數學方法以及較新的生成對抗網絡(GANs)。演講者及其核心研究人員開發的基于GAN的方法可以修改合成數據的分布,使之與目標分布相匹配。講座舉例說明了這種方法優于之前的非GAN方法。
佐治亞理工學院的Judy Hoffman教授發表了題為 "從多個數據源進行泛化的挑戰 "的演講。她考慮的問題是在模擬中學習模型,然后將模型應用于現實世界。她指出了四個挑戰: 生成、列舉、泛化和適應。發言人介紹了應對這些挑戰的幾種不同方法。具體來說,用于泛化的特定領域掩碼(DMG)方法通過平衡特定領域和領域不變特征表征來生成一個能夠提供有效領域泛化的單一模型,從而解決多源領域學習問題。
第三場會議的第三位也是最后一位演講者是波士頓大學的Kate Saenko教授,他的演講題目是 "圖像分類和分割的Sim2Real領域轉移的最新進展和挑戰"。Saenko教授延續了前兩場講座的主題,介紹了視覺領域適應的歷史,并探討了領域和數據集偏差問題。在糾正數據集偏差的不同方法中,講座詳細討論了領域適應。特別重要的是,Saenko教授及其合作者開發的技術能夠顯示合成到真實的適應性,就像從游戲引擎到真實數據一樣。隨后的小組討論提出了幾個有趣的問題,包括訓練域和測試域的不同,不是感興趣的對象不同,而是對象所處的環境不同,例如訓練時軍用車輛在沙漠環境中,而測試時則在熱帶植被背景中。
三個主題的分組討論同時進行。在 "人類學習與泛化 "分組討論中,首先討論了 "人類如何學習?"、"ML模型如何模仿人類過程?"以及 "合成數據如何實現這些過程?"等問題。從童年到青春期和成年期,學習和成長之間的關系成為關鍵點。其他被認為有助于人類學習的因素包括人類心理、情感、同時參與多維活動、記憶以及解除學習的能力。
關于 "數據綜合: 方法與驗證 "分論壇確定了數據合成的幾個問題,特別是圖像和視頻。主要問題涉及結合物理學的有用性、視覺外觀保真度與成本之間的權衡、保真度的衡量標準、保真度本身的重要性以及當前技術(包括GANs技術)的局限性。據觀察,合成圖像和視頻生成至少已有幾十年的歷史,但大多數產品要么是為視覺效果而設計,要么是為再現物理測量而設計(例如,紅外模擬中的輻射剖面)。它們并不適合用于ML培訓。提出的另一個問題是,合成的二維圖像必須與物體和環境的底層三維幾何圖形保持一致。還有人提出,能夠在特定的感興趣的環境中生成大量合成數據,可以作為第一道工序測試新的人工智能和ML方法,而不管這些方法是否能夠在真實數據中很好地工作。
專題3 "領域轉移挑戰 "的分組討論確定了MDO所需的關鍵人工智能能力,即從孤立學習到機器與人類之間的聯合或協作學習。會議還討論了在多種數據模式下同時訓練ML的聯合學習。人們認識到,這些領域的工作才剛剛開始。分組討論的牽頭人強調,需要向士兵明確說明基于人工智能的系統在特定情況下將會做什么。這引發了對系統魯棒性的討論。分組組長向ASPSM聽眾提供了討論摘要。
根據本次ASPSM的討論,我們確定了以下值得陸軍進一步進行科技投資的領域:
1.支持多模式互動學習的合成技術和數據集。與當前流行的捕捉 "時間瞬間 "的靜態數據集(如農村環境中的車輛圖像)相比,有必要開發更能代表支持持續學習的體現性體驗的模擬器,就像我們在人類身上看到的那樣,并實現對世界更豐富的表征。混合方法(如增強現實)也可將人類監督的優勢與合成環境的靈活性結合起來。
2.學習和合成因果關系和層次關系的算法和架構。最近的一些方法,如基于圖的卷積神經網絡,已經在學習空間和時間的層次關系(如物體-部件和因果關系)方面顯示出前景。鑒于在現實世界中收集和注釋此類數據的復雜性,合成數據的生成可能特別有用。識別層次關系是一般國防部和戰場情報分析的關鍵要素。
3.支持持續、增量、多模態學習的算法和架構。深度強化學習方法被成功地用于訓練虛擬或機器人代理的相關行動策略,如捕食者與獵物之間的相互作用。基于模仿的方法承認學習的社會性,通常讓代理與(通常是人類)教師合作學習新策略。這些類型的交互式持續學習可進一步與多模態學習(即融合來自多個傳感器的數據)相結合,以實現更豐富的世界表征,使其更穩健、更具通用性。同樣,在這一領域難以獲得大量經過整理的數據,這也為探索合成引擎提供了動力。
4.學習物理或具備相關物理領域知識的算法和架構。在許多領域(例如紅外光下的物體感知),從圖像感知和合成圖像需要了解世界的基本物理特性,例如光與材料之間的相互作用。然而,當前的深度學習模型缺乏這種物理知識。開發賦予ML物理領域知識的技術對這些系統的性能至關重要。
5.具有豐富中間表征的領域適應技術。為了縮小真實數據和合成數據之間的領域差距,必須進一步推動當前建立領域不變中間表征的趨勢,特別是使用語義詞典和生成式對抗網絡。能夠理解數據底層結構(如光照、旋轉、顏色)的表征更有可能成功抽象出合成數據中不重要的細節。
6.深入了解ML模型內部表征的方法,以及合成表征與真實表征的比較。網絡剖析技術 "打開 "了深度學習模型的隱藏層,允許解釋網絡中的每個階段正在學習哪些特定概念或其更細的方面。這些技術揭示了具有真實輸入和合成輸入的DNN的內部表征,有助于識別所學內容的關鍵差異,從而找到克服這些差異的解決方案。
為期兩天的虛擬ASPSM吸引了眾多美國防部科學家和工程師、頂尖學術專家以及科技項目管理人員的熱情參與。多學科的討論強化了這樣一種觀點,即開發用于訓練ML方法的生成合成數據的改進方法與理解和改進ML方法本身是分不開的。一個特別重要的需求是了解ML方法,尤其是當前的學習架構,是如何創建場景的內部表示的。另外兩個重要領域是:1)理解人類學習與ML世界中可能存在的學習之間的異同;2)多模態數據--從合成和ML的角度。我們預計近期國防部和學術研究人員將在本報告確定的領域加強合作。
認知方法在幾乎所有方面可提高現有雷達的性能,這導致了近年來研究的激增,空軍雷達建模和仿真(M&S)工具的一個關鍵差距是缺乏針對分布式全適應雷達(FAR)系統的全面、動態分布式雷達情景生成能力。截至2015年初,所有的研究都是在理論上推進概念,并通過模擬檢驗其性能,或者最多使用預先錄制的數據。沒有關于實驗驗證概念的報告,主要是因為還沒有開發出測試它們的必要硬件。然而,為了確定應用認知處理方法的真正性能潛力,這一步驟是至關重要的。為了解決這個問題,俄亥俄州立大學(OSU)電子科學實驗室(ESL)的認知傳感實驗室(CSL)與Metron公司、空軍研究實驗室(AFRL)和空軍科學研究辦公室(AFOSR)一起,已經開始了一項研究計劃,從分析和實驗上開發和檢驗認知雷達處理概念。
CSL設計并建造了認知雷達工程工作區(CREW),這是世界上第一個專門用來測試完全自適應和認知算法的雷達測試平臺,Metron和OSU開發了一個認知FAR系統的理論框架,在單一傳感器和目標的目標探測和跟蹤范圍內確定了關鍵的系統組件并進行了數學建模。我們一直在開發建模、模擬、分析和實驗能力,以證明FAR系統比傳統的前饋雷達(FFR)系統取得的性能改進。我們從OSU的軟件定義雷達(SDR)系統的模擬場景和預先記錄的數據開始。我們現在有能力利用CREW演示認知雷達跟蹤系統的實時操作。
這個項目的目標是為分布式FAR雷達開發一個基于MATLAB的M&S架構,從而能夠在模擬的、以前收集的和實時的流式數據上進行算法開發和測試。在第一階段,我們開發了一個基線FAR M&S架構,該架構采用面向對象編程(OOP)方法在MATLAB中編碼。它包括一個控制感知-行動(PA)周期運行的FAR引擎和確定下一組傳感參數的軟件對象;從傳感器獲取數據;處理數據以跟蹤目標;存儲和顯示傳感和跟蹤過程的結果。我們開發的模塊實現了模擬和預先錄制的SDR數據實例,以及實時和模擬的CREW數據實例。
第一階段開發的FAR M&S架構允許在模擬和實驗CREW數據源之間,以及在驅動傳感的FAR算法之間進行透明切換。輕松交換傳感和處理對象的能力將允許快速開發和測試認知雷達算法,通過構建M&S功能來避免重復工作和 "單點 "解決方案。它將使工業界、學術界和空軍的研究人員之間的合作成為可能,因為不同研究人員開發的算法可以使用一致的模擬、收集的數據和實驗室條件進行測試和比較。
美國負責采購和維持的國防部副部長辦公室(OUSD A&S)的任務是快速和低成本地向作戰人員和國際合作伙伴提供和維持安全和有彈性的能力。現在迫切需要開發適應性采購框架(AAF),以加快軟件開發和采購流程,加強作戰概念(CONOPS),如分布式海上作戰(DMO)。國防部(DoD)必須利用與國防戰略和全球威脅的性質相聯系的數據驅動的分析來塑造AAF,并擴展新的能力來應對新的威脅。威脅和能力共同演化矩陣(TCCM)解決了這一要求。威脅是一種能力試圖處理的問題。一種能力是代表威脅的問題的解決方案。共同進化算法探索了一些領域,其中一個能力或能力組合的質量由其成功擊敗一個威脅或威脅組合的能力決定。TCCM有可能在新的和有爭議的環境中系統地優化、推薦和共同演化能力和威脅。我們展示了一個關于幫助項目執行辦公室(PEO)使用從公開來源匯編的非機密數據對特定領域DMO的能力和威脅進行戰役的用例。
不僅美國防部負責采購和維持的副部長辦公室(OUSD A&S)有必要制定采購戰略,而且整個國防部也有必要應用數據驅動的分析以及與國防戰略和全球威脅的性質相聯系的創新和適應性作戰概念(CONOPS),并為作戰人員擴展新的能力。
例如,為了提高部隊的總體戰備能力,并在廣泛的行動和沖突頻譜中隨時投射戰斗力,海軍需要靈活的指揮和控制(C2)組織結構來滿足CONOPS。例如,DMO是海軍的一個CONOPS,而遠征先進基地作戰(EABO)是美國海軍陸戰隊(USMC)的一個CONOPS。DMO和EABO都是海戰現代化的新興作戰概念。PMW 150是PEO C4I的C2系統項目辦公室,也是C2解決方案的主要提供者,它的工作重點是將作戰需求轉化為海軍、海軍陸戰隊、聯合部隊和聯軍作戰人員的有效和可負擔的作戰和戰術C2能力。PMW150的任務是 "以創新的方式滿足相關能力的操作要求,使作戰人員能夠保持C2的優勢"(Colpo,2016)。
另一方面,美國艦艇的海上行動,特別是在沿海地區,將繼續存在爭議和危險;因此,當務之急是發展DMO和EABO,以實現統一的行動愿景。DMO的目的是在有爭議的環境中支持國家和戰略目標。DMO的概念不僅將進攻性打擊視為在戰斗中獲勝的主要戰術,而且還將欺騙和迷惑敵人的能力確定為在有爭議的環境中獲得成功的關鍵任務。目前的工作重點是將現有的平臺、系統和能力與DMO的具體戰術相結合,以實現海上戰略和作戰目標。DMO被定義為 "通過使用可能分布在遙遠的距離、多個領域和廣泛的平臺上的戰斗力來獲得和保持海上控制所必需的作戰能力"(海軍作戰發展司令部[NWDC],2017)。
DMO作為海軍和海軍陸戰隊資產運作的一個概念,其發展源于分布式殺傷力(DL)模型(Popa等人,2018)。DMO的概念采用了DL的擴展觀點,由三個支柱組成:通過網絡射擊能力提高單個軍艦的攻擊力,將攻擊能力分布在廣泛的地理區域,并為水面平臺分配足夠的資源,以實現增強的作戰能力(Rowden, 2017)。DMO還強調在所有領域,包括空中、地下和網絡戰,都需要更有彈性和可持續性的水面平臺。DMO的未來觀點是成為以艦隊為中心的戰斗力,通過整合、分配和機動性,允許在多個領域(有爭議的空中、陸地、海上、太空和網絡空間;國防部,2018)同時和同步執行多種能力和戰術,以便在復雜的有爭議的環境中戰斗和獲勝(Canfield,2017)。因此,DMO不僅包括傳感器、平臺、網絡和武器的傳統戰爭能力,而且還延伸到隨著新技術發展的其他戰術。DMO概念使用涉及ISR、機器學習(ML)和人工智能(AI)的先進探測和欺騙,特別是使用無人系統來增強進攻性戰術行動的能力;因此,通過潛在地利用平臺、傳感器、武器、網絡和戰術的不同組合,可以在所有海上領域放大一支多樣化但統一的部隊的戰斗力。
DMO的概念包括詳細的能力,如反措施、反目標和反介入的戰術。反措施是旨在轉移威脅的防御性能力。反目標可能是進攻性能力、欺騙性戰術和轉移威脅的作戰演習。欺騙性戰術包括無人資產群、機械和物理反措施、電子干擾和限制電磁輻射,或排放控制(EMCON)。反介入是為了消除威脅。
傳統上,基線部隊結構由一組固定的友軍艦艇和飛機組成,排列成行動組,包括航母打擊組(CSG)、遠征打擊組(ESG)、水面行動組(SAG),以及各種獨立的可部署單位,如EABO的遠征海軍部隊。
DMO的行動要求包括能力、人力、維護和供應等資源,需要仔細分析、計劃和執行,這需要正確的數據戰略、分布式基礎設施和深度分析。威脅與能力協同進化矩陣(TCCM)的技術概念解決了DMO和EABO行動的要求。威脅是一種能力試圖處理的問題,包括其復雜性和緊迫性。一種能力是代表威脅的問題的解決方案。來自ML/AI社區的協同進化算法探索了一些領域,其中能力或能力組合的質量由其成功擊敗威脅或威脅組合的能力決定。戰爭游戲模擬中使用的協同進化算法類似于國防應用中廣泛使用的蒙特卡洛模擬,只是它們參與了預測和預報、優化和博弈(minmax)算法等ML/AI。DMO和EABO概念要求處理不斷變化和發展的威脅的能力和資源網絡的靈活性和進化。
圖 1. 每個節點都使用 CLA 注意:每個節點的內容和數據可能包括能力;首先需要對能力進行索引、編目和數據挖掘。
圖 2. TCCM 和兵棋仿真的概念
美國國防科學委員會博弈、演習、建模和模擬(GEMS)工作組的任務是審查國防部使用GEMS工具的現狀,并提出改進GEMS工具的建議,以充分發揮其在國防部企業中從行政到作戰的潛力。GEMS工具和能力為測試新想法和概念、設計新系統并制作原型、模擬軍事行動、進行地緣政治分析以及提供培訓以提高作戰人員的準備和表現提供了具有成本效益的創新方法。工作隊認為,在當今與大國競爭回歸有關的高度競爭和動態戰略環境中,這種能力越來越重要,技術進步使全球環境監測系統的能力比過去更加強大和有用。
雖然美國防部有一些GEMS的卓越和創新,但特別工作組注意到,國防部缺乏必要的整合、資源和人才來獲得GEMS的全部利益。尤其缺乏的是將GEMS的洞察力有效地整合到高級領導對國防需求和采購項目的決策中的機制。
鑒于GEMS工具的廣泛性以及它們的不同適用性,特別工作組選擇將重點放在五個廣泛的應用領域(數字工程、訓練、實驗和演習、行動建模和分析以及戰略博弈),如圖ExS-1所示,以及它們之間的相互依賴關系。
圖ExS-1:GEMS應用領域
任務組在這五個應用領域以及兩個交叉主題領域提出了建議:基于技術的推動因素和GEMS治理。
數字工程:美國防部正在努力推進數字工程(DE)。例如,各軍種內部一直在推動使用數字工程來考慮新的系統概念;但廣泛采用數字工程仍然是一項正在進行的工作。特別工作組注意到,已經采用嚴格的數字工程的組織獲得了可衡量的好處,并強烈建議在整個企業中加速采用數字工程。此外,這種能力為國防部全面利用GEMS工具和有效地大規模生產作戰能力提供了必要的基礎。特別工作組認為,國防部全面采用DE并不要求對采購過程進行實質性的改變;然而,它將需要一些調整,特別是國防部的評估和審查過程,以便在虛擬測試中獲得DE的全部附加值。另外,虛擬測試依賴于嚴格的紀律,在所有工程活動中使用經過驗證的工具和來自權威代表的數據。這意味著國防部的工程師必須熟練掌握DE的方法、紀律、工具和技術。扶持和支持這支隊伍將需要國防部投資于必要的信息基礎設施,特別是在一系列工程任務中實現更大的自動化。
培訓:各軍事部門的培訓能力長期以來一直受益于GEMS工具和創新的使用,這些工具和創新幫助刺激了幾十年前開始的培訓革命,對美國的軍事優勢做出了重大貢獻。特別工作組注意到,在模擬、建模、虛擬現實(VR)和人工智能(AI)的推動下,軍事部門的第二次訓練革命正在進行中,但它注意到聯合部隊的訓練需要大幅改進。雖然作戰司令部(CCMD)努力保持聯合訓練,但現實情況是,大多數CCMD演習是由對特定場景最負責的軍事部門領導的--因此訓練具有特定軍種的味道。為了讓潛在的對手面臨多種困境,并使他們的計劃變得復雜,聯合部隊必須進行訓練,以便在所有領域內進行協作和同時作戰。為此,特別工作組建議集中精力激勵各軍事部門使其訓練更加聯合--更加代表 "我們將如何作戰",確保各軍事部門之間必要的網絡連接以支持聯合訓練,并建立強大的全領域聯合訓練能力。工作隊還建議不斷努力加強其分布式訓練能力,確定具體的模擬訓練,在主要的訓練中心提供高質量的訓練,但可以從家庭駐地進行操作。與其他GEMS能力一樣,實現這種聯合和全域訓練的能力將需要持續的行政級別領導和多年的充足資源。
實驗和演習:美國防戰略(NDS)委員會報告呼吁 "通過實驗、演習和訓練驗證新的作戰概念以實現戰略優勢"。特別工作組贊同這一呼吁,并得出結論,國防部必須在聯合軍事部門/合作伙伴層面重振基于概念的實驗,以應對同行競爭對手帶來的長期挑戰。特別工作組注意到,聯合概念實驗在國防部已經成為一門失傳的藝術。特別工作組建議重振這種能力,采用一種基于運動的方法,更迅速地提供新的作戰方式和新的能力來應對當前和新出現的作戰挑戰。特別工作組建議采用運動式方法,產生一個反饋循環,反復完善概念和能力,在這個過程中盡早剔除失敗,同時將完善的概念和能力反饋給下一階段的實驗。特別工作組進一步建議,將聯合作戰問題和想法注入正在進行的軍種實驗中;國防部應在軍事部門之外贊助聯合概念實驗;并為軍種和CCMD(特別是美國印太司令部(USINDOPACOM)和美國歐洲司令部(USEUCOM))的實驗運動和演習提供額外支持。
行動建模和分析:國防部目前的行動模型被用來為投資決策提供信息,特別是在各軍事部門之間;然而,這些模型在關鍵領域存在不足。特別是,它們沒有有效地解決國防部所處的多領域安全環境的復雜性,而且它們沒有能力提供快速分析以告知決策者。特別工作組還發現,國防部領導層對行動建模的支持和信心不一。因此,特別工作組的建議側重于發展補充性戰役分析,更加強調及時、簡單、定性/定量的模型,同時也投資于下一代行動建模能力,利用包括人工智能和機器學習領域的技術進步。需要提高這些能力,以灌輸對這些工具的有用性的信心,為投資決策提供信息。工作隊還建議在發展基于情景規劃的聯合作戰概念(CONOPS)方面做出更有力的努力,以推動戰役建模和分析,并為資源分配提供依據。
戰略博弈:美國在冷戰期間很好地利用了戰略博弈技術--在一個長期的分析區間內進行 "移動-反移動 "評估。最近的努力集中在眼前的威脅上(例如,恐怖主義),戰略博弈已經成為分析當今更大和更長期挑戰的一個很少使用的工具。現在,美國面臨著先進的大國對手,其技術能力和經濟實力可以與我們匹敵。為了應對這些挑戰,國防部需要重振其戰略博弈。工具的好壞只取決于使用它們的參與者。有效的戰略博弈將需要高層領導認真參與博弈本身。特別工作組建議利用新的技術和分析發展來重建戰略博弈能力,以更好地了解地緣政治的變化、對手的目標以及對手在大國競爭時代對美國行動和舉措的潛在反應。特別工作組指出,在開發新的博弈工具方面存在利用技術進步的機會--包括社會、金融和通信網絡的算法分析、因子樹、定量建模和分布式博弈技術,以更有效地支持戰略博弈。特別工作組還承認,與大國對手的有效競爭將需要一個整體的政府方法,國防部應率先將戰略博弈擴展到美國政府的相關部門。
基于技術的促進因素:雖然GEMS工具受益于許多領域的技術進步(如不斷提高的計算能力、人工智能/機器學習),但特別工作組重點關注兩個相關技術--游戲引擎和合成環境。商業化的游戲引擎可以加速GEMS工具的開發,強大的合成環境可以提高數字模型的效用。特別工作組注意到,國防部的一些組織已經在使用這些技術,但主要是以臨時的方式使用。因此,建議的重點是:建立一個基礎設施,以實現和激勵重復使用,從而在降低成本的同時加快進展;確保承包商在產品采購(或重大升級)期間建立的符合要求的合成環境可供整個部門重復使用。采用更好的數據分析方法來生成大規模的事后報告,將有助于從游戲、實驗和演習以及原型設計中獲得最大價值。
GEMS管理:特別工作組注意到,雖然工業界的成功案例表明,需要持續的、自上而下的領導和管理來實現變革,并實現GEMS工具的潛在效益,但國防部的管理結構并沒有促進整個企業的做法。鑒于整個國防部顯然需要進行文化和技術變革,必須建立一個更加協調的管理結構。這一領域的建議集中在促進GEMS互操作性和可重復使用性的行動上,以及建立一個由高級領導人領導的治理結構,并為指導國防部的建模和仿真(M&S)企業提供適當的權力和資源。
本報告中的大多數建議是文化和技術轉型的起點,如果美國防部要從GEMS工具中獲得全部利益,就必須進行這種轉型。雖然特別工作組對已經開展的GEMS行動表示贊賞,但結論是,如果美國防部要充分利用GEMS在上述應用領域潛在的改變博弈規則的力量,全企業的努力是必不可少的。
在這個大國競爭的新時代,美國防部(和美國政府)面臨著復雜的選擇,需要有分析性的選擇;對決策速度和敏捷性的需求從未如此迫切。在這方面,特別工作組的結論是,國防部必須大幅提高其全球環境監測系統的能力,以跟上其競爭對手的步伐并有效地應對威脅--今天和未來幾年。要做到這一點,需要整個企業的文化變革和技術變革。在美國今天所處的高度競爭和動態的國家安全環境中,需要一個強大的GEMS工具箱來為國防部的決策提供信息。然而,如果國防部要實現GEMS的潛力,該部的高層領導必須負責提供愿景、支持和持續的資源,以實現所需的變革。本報告為國防部提供了一個路線圖,以充分利用GEMS工具,實現更好的決策、更智能的演習和實驗,并最終實現更強大的軍事力量。