模擬作戰需要了解友軍和敵軍在既定友軍目標和可信敵軍目標方面的進展情況。在美國防部(DoD),這些目標的結構是分層的,從國家戰略層面一直到戰術層面。軍事評估旨在回答兩個主要問題: 1)是否創造了所期望的效果?對模擬作戰評估方法的研究很少。一些主要的評估應用領域是教育和游戲,它們為模擬軍事作戰評估提供了有益的借鑒。本研究從美國防部政策和這些領域的研究中總結出模擬作戰評估方法的幾個理想特征。在根據這些特征建立價值層次結構之后,本論文提供并評估了幾種可用于模擬作戰的候選方法--貝葉斯企業分析模型(BEAM)中現有的 "戰斗力與戰斗脆弱性 "方法、貝葉斯網絡、價值思維和線性規劃。每種替代方案的評估都是通過其在小型作戰模擬中的應用來進行的。然后,從 "價值思維 "和 "線性規劃 "中創造出一種替代方案,其評估結果優于其他四種方案。論文最后對線性規劃進行了總結,并提出了未來研究的想法。
與真實戰爭類似,作戰模擬需要了解友軍和敵軍的進展情況。這種知識將潛在的模擬停止條件擴展到時間之外,并允許分析與時間、資金和資產態勢相關的進展情況。雖然記錄資產的損毀和消耗品的使用情況可能會提供有價值的分析結果,但指揮官通常更關心的是一個更廣泛的問題,即這一場景是贏了還是輸了?要回答這個問題,模擬必須包含一定的勝負定義。要做到這一點,最簡單的辦法就是完成既定目標。戰斗模擬必須能夠評估作戰環境,并報告實現或未實現這些目標的進展情況。從具體的目標(如摧毀敵方所有港口)到較為抽象的目標(如實現海軍優勢),模擬中的單一作戰評估方法應具有足夠的通用性,以便在面對多種不同的勝負定義時,為勝負問題提供答案。本論文提供了這樣一種方法,可用于模擬戰爭的戰役級戰斗評估。
評估的一個直接定義是 "使用數據來證明既定目標和目的是否真正實現的過程"(1,第 554 頁)。在國防領域,美國參謀長聯席會議(JCS)將評估定義為 "在軍事行動中衡量運用聯合部隊能力的整體有效性的持續過程"(2)。一般來說,評估是一個用于持續或不斷反饋的詞,旨在改進一個過程。在更正式的場合,評估分為兩類:總結性評估和形成性評估。總結性評估,或有些人稱之為評價,是對表現進行事后審查。總結性評估的例子包括簡單的評分和與基準的比較,以及從過程產出中獲取比較結果的統計或其他分析方法。終結性評估的 "外部"(3,第 19 頁)特征自然會導致其結果的呈現是遙遠的和/或靜態的。終結性評估的一些例子包括年度人事審查和評估、學生考試和業務指標報告。相反,形成性評估關注的是持續的學習過程,目的是在特定過程中提供反饋(4)。在教育領域,形成性評估包括學生與評估者之間的合作,以 "積極創造[學生的]最佳表現"(5,第 242 頁)。形成性評估在本質上是互動的,它的目的是在一個過程結束之前提高學生的表現,利用數據(或經驗)為被評估方提供定制化的幫助。因此,形成性評估還可能包括進度跟蹤或報告。本論文重點關注戰役級模擬戰爭背景下的形成性評估方法。我們對 "如何在計算模擬中進行戰役級戰斗評估 "這一問題提出了建議。
模擬戰爭中的評估方法,尤其是用于軍事訓練或分析的模擬戰爭,應模仿實際決策者對戰爭努力的評估。在實際作戰環境中,軍事下屬和分析人員會準備一份評估報告,供指揮官了解態勢。指揮官利用評估結果為操縱作戰環境提供進一步指導。當我們在模擬作戰中模擬戰爭努力時,評估部分實際上應是下級/分析員評估與指揮官反饋相結合的模型。在第 3.1 節中,我們將這一概念納入了作戰模擬評估方法的價值層次中。此外,我們還提出了一個必要的特點,即評估方法應簡單易懂,便于向指揮官和其他決策者介紹。將評估結果歸納為不同類別(如勝利或失敗)對簡單交流非常有用,第 3.1 節將對此進行更詳細的討論。
作為聯合部隊行動的權威資料,美國聯合司令部的 "聯合出版物 3-0"(2)提供了模仿決策類型的見解。聯合司令部最關心的是 "行動評估",即 "衡量完成任務、創造條件或效果以及實現目標的進展情況 "的過程(2,第 II-9 頁)。聯合司令部聲稱,行動評估應 "從任務式指揮分析開始,由指揮員和參謀人員考慮衡量什么和如何衡量"(2,第 II-9 頁)。對于實戰中使用的計算模型而言,這一步將發生在模型運行之前,分析人員將在運行過程中設定初步目標和任何初始參數。此外,本定義中的 "目標 "是指指導行動方案的目標。目標可以是一個短語,如國防部的國家戰略目標,也可以是單項軍事任務的目標。無論如何,模擬戰爭評估方法中的目標決定了代理指揮官的注意力在哪里,以及他們建議的行動方向。
圖 1 提供了不同層次的戰爭與相應目標之間的嵌套關系。在軍事應用中,圖 1 中紫色箭頭所示的評估框架通常被稱為 "從戰略到任務 "框架(6;7;8)。在該框架中,目標之下是可評估的效果。效果 "是 "行動的結果、成果或后果"(2,第 GL-9 頁)。任務 "被視為軍事行動的最小單元,小到摧毀敵方資產,大到運送物資。有些任務本身就是目標,有些任務支持相應的目標,沒有中間影響。然而,如圖 1 所示,上級目標為下級目標提供依據,而下級目標又指導各級軍事行動。同時,評估是用于提供自下而上反饋的機制。在提供反饋時,評估應回答兩個關鍵問題: 1)"我們是否在[作戰環境]中創造了我們所期望的效果或條件?"和 2)"我們是否按標準完成了任務?(2,第 II-11 頁)。
這兩個核心評估問題的重點自然而然地將模擬戰爭的作戰評估引向形成性領域。盡管分析人員傳統上使用總結性評估方法對這些問題進行追溯性回答,但如果將形成性評估與回答這兩個關鍵問題的意圖結合起來,則可實現被動的模擬作戰環境。利用形成性評估方法,模擬環境(或指揮官)可收到與特定目標相關的作戰環境狀態的實時更新。與進行事后分析相比,形成性評估更接近于實時戰爭工作,即評估對友軍造成的戰損,以及任務匯報和關于敵方單元的情報報告。因此,本論文側重于形成性評估方法。
本論文的其余部分致力于將聯合司令部的作戰評估要求綜合為一個連貫的結構,以便在作戰建模模擬環境中有效部署評估方法。Gallagher 等人(9)利用分辨率定義了不同層次的作戰:系統/工程、交戰、任務、戰役、國防企業和整個政府。聯合司令部的條令規定,每個層次的戰斗分辨率都要分層評估。本論文并不試圖將評估范圍縮小到任何特定的交戰決議;相反,我們提出了一般結果,試圖盡可能廣泛地應用于國防部的各種應用。本研究的重點是回答兩個研究問題:
研究問題
程序化/計算機化模擬的作戰評估方法需要具備哪些特征?
如何在程序化戰爭模擬中進行戰斗評估?
下一章將通過其他主要應用領域介紹評估方法。根據第二章的經驗教訓和聯合司令部的評估指南,我們在第三章構建了一個價值層次。在第四章中,我們介紹了幾種可供選擇的評估方法,并在小型作戰模擬中對其機制進行了研究。然后,我們在第五章對這些替代評估方法在模擬戰爭中的應用進行評估。第五章最后提出了模擬作戰評估方法的建議。我們在第六章中提出了一些結束語和進一步研究的建議。
美軍目前的條令基本摒棄了使用潛艇協同戰術(稱為 "狼群戰術"),原因是 "狼群 "之間和 "狼群 "內部的協調十分復雜。然而,最近的技術進步可能會大大提高在狼群中行動的潛艇之間進行安全通信的可行性。基于智能體的建模用于模擬潛艇在戰時環境下的海上行動。模擬了三種安全通信可用性:潛艇之間無通信、每 10 小時通信一次和持續安全通信。考慮了三種戰時環境:獵殺過境商船的潛艇、在中立航運環境中獵殺過境軍艦的潛艇,以及在中立航運環境中作為水面行動小組(SAG)獵殺過境軍艦的潛艇。效果以 "產量 "來衡量,即目標的平均殺傷數量與 "狼群 "中潛艇數量的函數關系。模擬結果表明,隨著戰時中立航運的增加,"狼群 "戰術的成功越來越依賴于潛艇的安全通信和態勢感知。
圖 1.1. 狼群攻擊階段
由于編隊間和編隊內協調的復雜性,目前的條令已基本摒棄了使用潛艇協同戰術(即所謂的狼群戰術)。最近,自主水下定位、通信和其他技術的進步提高了水下艦艇之間協同作戰的可行性。此類技術的興起要求圍繞更具生存力和殺傷力的水下能力重新思考當前的作戰條令。對這一主題的深思熟慮的探索已經開始,如 Cares 和 Cowden(2021 年)對分布式戰爭時代艦隊戰術的未來進行了仔細分析。重新審視 "狼群 "戰術將為海軍思想家提供價值,因為他們將繼續在未來自主無人系統日益增多的海戰環境中尋找最佳戰略。
仿真用于探索 "狼群 "戰術在七個不同場景中的有效性,這些場景既改變了戰時環境,也改變了潛艇獲得信息的頻率。對模擬輸出進行分析,以確定 "狼群 "戰術的成功率在潛艇與目標環境之間安全通信的不同限制條件下如何變化。考慮了三種安全通信的可用性:潛艇之間無通信、每 10 小時通信一次和持續可用通信。考慮了三種目標環境:獵殺過境商人的潛艇、在含有中立航運環境中獵殺過境軍艦的潛艇以及在含有中立航運環境中作為水面行動小組(SAG)獵殺過境軍艦的潛艇。潛艇被分配到不重疊的水域空間,每艘潛艇都不會離開其分配的水域空間,也不會試圖擊殺其水域空間外的目標。船只進入第一個水域空間,然后前往第二個水域空間,依此類推。潛艇靠近并將其水域內的船只分類為中立或目標。分類完成后,潛艇會殺死被列為目標的船只。潛艇在一個水域發射的武器不會影響其他水域的潛艇,也不會影響航運行為。效果用 "當量 "來衡量,"當量 "的定義是成功擊殺目標的平均數量與 "狼群 "中潛艇數量的函數關系。潛艇沒有后勤限制,沒有彈藥限制,敵方戰艦也不會試圖摧毀任何潛艇。
當潛艇進行通信時,它們會將完美的信息傳遞給艇外實體,而不會失去隱蔽性或被攔截的機會。只有當潛艇探測到目標,但無法在目標離開其水域之前對其實施攻擊時,潛艇才會與艇外實體通信。所傳遞的信息是潛艇無法起訴的目標的位置和未來路徑。只有下一個水域的潛艇才會收到來自艇外入口的信息;它會在確定的時間訪問這些信息。與中立航運有關的信息不會傳遞。因此,雖然存在通信的動機,但通信對平均擊斃目標數量的影響是有限的。在戰時環境下,目標與中性商船到達率之比非常小,通信可最大程度地提高 "狼群 "的性能,使潛艇能夠更好地采取行動,摧毀隱藏在大量中性航運交通中的水面行動小組。
盡管最近在美國防部參謀培訓和兵棋推演模擬中對后勤因素的表現有所進步,但后勤信息系統(IS)的表現仍然不足。許多指揮與控制(C2)系統可通過通用協議(如 OTH-Gold)與仿真集成,但許多后勤信息系統與仿真-信息系統(sim-IS)的集成則需要人力密集的 "人在回路"(HitL)過程。在已實現自動仿真-IS 集成的地方,通常無法仿真重要的社會技術系統(STS)動態,如信息延遲和人為錯誤,從而使決策者無法真實地了解物流 C2 的能力。本研究試圖通過開發和驗證一種通過機器人流程自動化(RPA)進行模擬-信息系統信息交換的新方法,克服傳統模擬-信息系統互操作性方法的局限性。RPA 軟件通過 IS 現有的圖形用戶界面支持 IS 信息交換的自動化。這種 "由外而內 "的 IS 集成方法減少了為自動信息交換而對 IS(或模擬)進行工程更改的需要。除了驗證基于 RPA 的模擬-IS 集成方法的潛力外,本研究還提出了分布式模擬工程和執行過程(DSEEP)覆蓋的建議,以指導模擬-IS 環境的工程設計和執行。
在現代工作場所和戰場上,日益強大的信息系統和相關業務流程的激增,需要有能夠體現信息系統(IS)和相關社會技術系統(STS)動態的人員培訓環境。需要這樣的環境來鍛煉組織流程和信息系統,并培養人員的能力。盡管在仿真支持的人員培訓環境中,一些指揮與控制(C2)系統的表現形式取得了進步,但在表現包括許多后勤信息系統在內的 "人在回路"(HitL)信息系統以及影響這些信息系統如何在作戰環境中填充的 STS 動態方面,仍然存在局限性。現有的模擬和 C2 系統集成手段不足以支持自動模擬信息系統(sim-IS)的信息交換和 STS 動態模擬。
這項研究探索了機器人流程自動化(RPA)如何促進模擬信息系統信息交換和 STS 動態模擬自動化的新方法。研究采用了設計科學研究(DSR)方法,以確定基于 RPA 的模擬-IS 信息交換方法能否支持自動化模擬-IS 信息交換和 STS 動態模擬,以及如何設計和開發這種基于 RPA 的模擬-IS 環境。這些研究問題是通過開發和驗證兩個 DSR 工件來解決的:一個是基于 RPA 的模擬-IS 信息交換架構原型形式的實例化工件,另一個是分布式仿真工程和執行過程(DSEEP)(IEEE Std 1730,2011 年)模擬-IS 環境覆蓋建議形式的方法工件。從 DSR 的意義上講,實例化工件已通過驗證,能夠支持自動模擬-IS 信息交換和指定 STS 動態模擬。模擬的 STS 動態包括時間動態(信息延遲和及時性變化)和信息內容退化(準確性、精確性和完整性變化)。這是通過建模與仿真(M&S)驗證和確認過程實現的,包括在實驗室和現場環境中對實例化工件進行定量和定性分析。
通過在受控實驗室環境中的兩個模擬-IS 環境中對原型的性能進行定量分析,對基于 RPA 的模擬-IS 架構支持自動模擬-IS 信息交換和特定 STS 動態模擬的能力進行了驗證。在一個模擬-IS 環境中,海軍陸戰隊空地特遣部隊(MAGTF)戰術戰爭模擬(MTWS)與海軍陸戰隊通用后勤指揮與控制系統(CLC2S)集成在一起。在另一個模擬-IS 環境中,實體級建設性模擬--聯合沖突與戰術模擬(JCATS)與 CLC2S 集成。在這兩個模擬-信息系統環境中,都使用了圖 1 所示的基于 RPA 的模擬-信息系統信息交換架構,將建構模擬和 HitL 后勤信息系統集成在一起。
圖 1. 基于 RPA 的模擬信息系統信息交換架構
對原型架構在兩種模擬-IS 環境中的性能進行定量分析的結果表明,基于 RPA 的模擬-IS 信息交換方法可支持自動模擬-IS 信息交換和 STS 動態模擬。在時間動態模擬方面,發現及時性和延遲分布的模擬與目標分布充分吻合,每個場景的奇平方擬合度檢驗值都超過了 0.95 臨界值。對信息內容退化的模擬觀察具有實際意義,但不具有統計意義。雖然該架構為模擬信息系統信息交換提供了足夠的準確性和精確性,但確定基于 RPA 的模擬信息系統信息交換的及時性需要考慮所支持的特定模擬信息系統環境。在設計和開發基于 RPA 的模擬-IS 環境時,開發了解決這一問題的技術,并在模擬-IS 環境的 DSEEP 重疊建議中得到了解決。
定量分析的結果是必要的,但不足以支持對基于 RPA 的模擬-IS 架構的驗證。在實地環境中為領域主題專家 (SME) 進行了架構演示,以支持對該工具在支持其預期用途方面的實用性進行定性驗證。演示和隨后的中小型企業訪談結果表明,擬議的基于 RPA 的架構將支持在促進員工培訓的模擬信息系統環境中的預期用途。這包括支持在人員培訓環境中表現更多的 HitL 信息系統的潛力,以及模擬 STS 動態的潛力,否則人力或成本將無法表現。
為 DSEEP 開發的方法工件--模擬-信息系統疊加建議,旨在促進模擬-信息系統環境的設計和開發,這些環境代表了目標集成業務流程和相關 STS 動態,包括使用基于 RPA 的模擬-信息系統信息交換方法。雖然 DSEEP 為分布式仿真環境的工程設計和執行提供了指導,但它并沒有為支持仿真-IS 環境提供必要的指導。本研究針對 DSEEP 重疊中需要解決的問題提出了 43 項具體建議,以指導模擬-IS 環境的工程設計和執行,重點是支持基于 RPA 的模擬-IS 信息交換。這些建議是在設計、開發和驗證基于 RPA 的模擬-IS 架構的同時提出的。提供的許多建議與設計、開發和測試基于 RPA 的模擬信息系統架構原型過程中發現的障礙以及為克服這些障礙而開發的工具和技術直接相關。
除了展示和驗證一種基于 RPA 的新方法,用于 Sim-IS 信息交換和工作人員培訓的 STS 動態模擬之外,這項研究還為設計支持其他領域的模擬-IS 環境提供了新的機遇。基于 RPA 的模擬-信息系統信息交換方法所帶來的低成本、模塊化模擬-信息系統環境,可以支持一種新的兵棋推演環境,增強對現實世界中的 HitL 信息系統以及填充這些系統的綜合業務流程的表現力。它還可以為集成業務流程本身的持續共同發展提供一個靈活的環境。本研究為探索和開發基于 RPA 的模擬信息系統信息交換方法邁出了第一步,該方法可支持在模擬支持環境中增強 HitL 信息系統的代表性,以支持人員培訓和其他重要問題空間。
海軍任務規劃器(NMP)是一種基于優化的作戰計劃工具,適用于設計海軍部署的各級決策者,從戰區級計劃到單個航母打擊群(CSG)或驅逐艦中隊(DESRON)。調度人員的任務過多,卻沒有足夠的艦艇來完成這些任務。該輔助決策系統采用多任務能力艦艇,在給定的規劃范圍內將其分配到任務中,目標是最大限度地提高完成任務的總價值,同時考慮到任務集的地理位置以及艦艇的能力和局限性。以前的版本使用獲得許可的商業軟件和求解器進行優化,并對可供選擇的艦艇部署進行有限的列舉。本論文的重點是通過使用開源軟件和求解器,使所有海軍人員都能使用海軍任務規劃器。此外,它還在優化過程中提供了持久性,允許調度人員在規劃期限內重新配置計劃,并將對之前公布的計劃的改動降到最低。我們還開發了兩種部署規劃方法,即隨機路徑枚舉和網絡流表述,這兩種方法都提高了海軍任務規劃器的任務完成水平。此外,我們還創建了一個 "兵力比護航"參數,允許非作戰艦艇在多艘具備防御能力的艦艇護航下通過危險區域。
海軍任務規劃器(NMP)是一個基于優化的決策支持系統,適用于從海上聯合部隊作戰指揮官(JFMCC)作戰視角到驅逐艦中隊(DESRON)和航母打擊群(CSG)戰術視角的各級海軍規劃決策者。在考慮到多艘艦艇、它們的多種任務能力以及從一個地理區域轉運到另一個地理區域所需的時間之前,在整個規劃范圍內規劃任務已經是一項極具挑戰性的任務。我們還必須考慮到任何需要與支援任務同時完成的前提任務。確定后勤支持,預測在同一規劃范圍內何時何地艦船需要更多燃料和其他補給,也是一項挑戰。這對于 JFMCC 或海上行動中心 (MOC)、DESRON 或 CSG 來說,仍然是一個人工和耗時的過程。
NMP 接收用戶輸入的信息,包括任務、地理區域、可用艦船、綜合任務能力、按任務和艦船能力劃分的商品消耗率。NMP 將有能力的艦船分配到執行任務的地區,從而最大限度地提高完成任務的總價值。NMP 包括一個作戰后勤部隊(CLF)規劃要素,能夠跟蹤艦艇的物資水平,并就何時何地與客戶艦艇開展海上補給(RAS)活動提出建議。NMP 還提供護航和近距離護航選項,允許非戰斗艦艇由防御戰斗艦艇護航,可以是同一區域的一艘防御艦艇護航所有非戰斗艦艇(護航),也可以是同一區域的防御艦艇和非戰斗艦艇一對一護航(近距離護航)。
本研究探討了改進 NMP 的方法,即從未獲批準在海軍陸戰隊互聯網(NMCI)計算機、保密互聯網協議(SIPR)計算機或其他保密網絡上使用的昂貴的特許專有軟件轉向開源軟件。通過將 NMP 轉換為開源代數建模語言,我們消除了所有成本,而且該軟件已被批準或可被批準在安全計算機上使用。求解器也從特許優化軟件轉為開源混合整數編程求解器。
我們還將研究如何改進船舶在區域之間的轉運方式,并增加一種對之前公布的時間表影響最小的時間表變更方式。
NMP 以前計劃從一個區域到另一個區域的船只部署的方法涉及基于堆棧的部分枚舉,這限制了船只探索區域的多樣性。在這項研究中,我們將重點放在通過兩種額外的方法來改變這種區域間探索的多樣性。第一種是隨機路徑生成法;與基于堆疊的部分枚舉法類似,這種方法為每艘戰艦生成一定數量的部署路徑。但是,船只的部署路線是隨機的,這就增加了船只交替路線的多樣性。隨機路徑生成通過增加完成任務的數量來改進 NMP,并通過讓艦船到達 RAS 事件所需的位置來大大減少對商品消耗的懲罰。
我們的第二種方法在 NMP 中添加了網絡流部署模型,允許艦船探索從區域到區域的所有可能路線。與其他路由模型相比,網絡流大大縮短了 NMP 的運行時間,并為我們提供了一個接近最優甚至是最佳的解決方案。我們將隨機路徑生成和網絡流部署模型與基于部署堆棧的枚舉法進行了比較,在我們的韓國行動區域場景中,我們有 695 項任務需要在 15 天的規劃期限內完成。
這項研究專門為航空母艦或兩棲攻擊艦增加了額外的護航功能,因為它們在一個區域內需要不止一次護航。這種兵力配比要求每艘非戰斗艦艇在通過高危區域時都要由多艘具備防御能力的艦艇護航。我們在 NMP 的一個新場景中測試了這一功能,即一支從關島經菲律賓海前往菲律賓宿務的有防御能力的 CLF 護航艦隊。
最后,這項研究為 NMP 增加了優化的持久性,這一調度功能允許用戶在規劃期內隨時隨地增加或減少任務和/或艦船,并且只需對原有調度進行少量修改即可完成任務。這極大地減少了因命令過多艦船進行過多計劃調整而造成的動蕩、信息傳遞和混亂。
隨機部署路徑生成、網絡流部署模型和持久性的加入使 NMP 有了顯著的改進。隨機部署路徑生成顯示,在某些情況下,目標函數的增幅高達 45%,而對 500 萬條可能路徑的采樣率不到 1%,即對 1,058,826,559,993 條可能部署路徑的采樣率為 0.000019%。我們的網絡流部署模型探索了超過一萬億條可能的部署路徑,取得了最佳結果,使我們在某些情況下的目標值提高了 50%。與基于堆棧的枚舉法和隨機路徑生成法相比,網絡流部署模型的求解時間最快,大多數場景的求解時間都在一小時之內。
當前用于自動規劃的戰斗模擬軟件開發在其方法中沒有考慮到戰爭迷霧。這使得他們的輸出不太現實,因為在現實世界的規劃中不可能有精確的敵人位置。人工智能控制的部隊應該能夠在沒有信息的情況下運作,而這些信息在相同的情況下是人類無法獲得的。本文提出了一種AI智能體在給定典型情報的情況下預測和評估敵方兵力位置的方法。我們還提出了一種方法來匯總這些位置的風險影響。我們在一個戰斗模擬環境中展示了這些技術,并評估了它們在多個戰斗場景中的表現。結果顯示了戰斗模擬中不確定性的重要性,并說明我們的風險匯總方法是有效的。
在將人工智能(AI)技術與作戰模擬相結合時,重要的是要將戰爭迷霧的考慮因素包括在內并加以考慮。目前的自動規劃方法依賴于對敵方部隊位置的完美了解,使得人工智能控制的智能體行動不太現實。為了使智能體的行為更加自然,人工智能兵力應該接受與人類指揮官在類似情況下可用的相同類型和數量的信息并采取行動。這將要求人工智能依賴對其對手和環境條件的理解,就像人類一樣。
這篇論文著重討論了人工智能在模擬環境中處理戰爭迷霧的能力的兩個方面。第一個方面是人類對提交給人工智能的關于敵人和環境的知識的表述。這包括敵人的優先級和程序,以及環境因素,如能見度和視線。第二方面是當給定這些知識時,人工智能可以預測戰霧中可能的敵人位置,并評估可能的敵人編隊的風險影響。
關于第一個方面,我們審查了人工智能在模擬環境中跟蹤對手和戰術注釋的方法。我們發現有必要將戰斗地形離散為一個導航圖。這個導航圖將有支持實體運動的邊和可以被注釋的節點,為人工智能代理提供戰略信息。我們還確定了在戰斗模擬環境中對單位幾何的戰術評估技術。
然后,我們發現適用于檢查軍事決策過程(MDMP)中進行的分析,特別是由戰斗空間情報準備(IPB)產生的產品。IPB的輸出包括將已知的對手戰術分層到當前的作戰環境中,以產生一個預期的敵人行動路線(ECOA),如圖1所示的態勢模板。
節點的戰術注釋可以看作是圖1中所示的頂層敵人威脅模型。當這些注釋被應用于地形的導航圖(環境層)時,其結果是將ECOA編碼到模擬中。然后,我們可以評估潛在的敵人位置與編碼的ECOA有多大的一致性。
我們把這種評估稱為編隊評分函數。這個評分函數是讓人工智能預測和評估戰爭迷霧中風險的起點。該函數產生一個數字分數,它取決于一個給定的敵方編隊在保持理想的單位幾何形狀和火力掩護的同時瞄準目標優先事項的能力。分數越高,表明越符合編碼的ECOA的要求。我們把一個能使給定評分函數最大化的編隊稱為預測。
不幸的是,識別一個最大化的編隊并不是一項微不足道的任務,因為它涉及到多個實體平衡幾個競爭性因素以產生一個分數。我們采用的方法是將未被發現的實體隨機放置在地形上的可能位置,讓它們爬到對陣型得分貢獻最大化的位置。通過幾輪的隨機放置和爬坡,產生了候選陣型集,每個陣型都是評分函數的局部最大值。每個編隊由一組不同的敵人實體位置和導航圖中節點的相關威脅值組成。
然后,我們使用吉布的典型集合方程,將候選集合中的每個編隊視為實際敵方編隊可能處于的一種 "狀態"。這使我們能夠為候選集合中的每個編隊計算出一個概率值。然后,我們可以根據每個編隊的計算概率來匯總其節點威脅值。這使我們能夠將可能的敵方陣地的估計風險表示為一個單獨的圖,我們稱之為不確定性威脅圖。由于該圖僅由現有的情報產品和觀察結果產生,它不依賴于人類指揮官無法獲得的無關信息。
本論文介紹了我們在WOMBAT XXI(WXXI)中對這些方法的實施和評估,WXXI是一個用Unity 3D游戲引擎構建的輕型戰斗模擬環境(圖2)。
使用WXXI的單位模板和真實世界的地形表現,我們進行了60次模擬戰斗,跨越三個不同層次的敵軍陣地信息。這些戰斗模擬了攻擊一個藍軍排,對抗一個靜態的紅軍小隊。在第一種情況下,我們將藍方的知識限制在一組探測到的紅方防御者。在第二種情況下,我們使用檢測到的紅色防御者和一個陣型評分函數來產生一個不確定性威脅圖,以估計實際的紅色陣型。在最后一個場景中,藍色被賦予了關于紅色陣地的全部信息。在每場戰斗中,我們都收集了關于藍方和紅方的傷亡、零散交換率(FER)和任務完成情況的數據。我們發現,當藍方得到紅方陣地的估計時,他們的表現與得到實際陣地時相當。表1提供了在三個戰斗場景中收集到的定量數據。
論文中預測和不確定性建模的新方法在自動計劃和改善兵棋推演中人工智能控制的兵力方面有很大的應用潛力。論文還提供了運動到交戰行動的進一步測試實例,并提供了一種使用編隊評分功能的計劃識別方法。最后,我們為WXXI作戰模擬環境貢獻了附加功能。
為了使多域作戰的概念取得成功,聯合部隊之間需要有一種共同的語言,而且這一概念決不能以犧牲在現有領域的機動性或通過創造一個新的領域來放棄單一領域的主導地位。并非所有的問題都需要一個僵化的理論來克服,多領域作戰需要模糊性,以最大限度地發揮其潛力。如果不這樣做,就有可能使概念僵化,使概念的效用受挫。
在美國陸軍和聯合部隊中,最近出現了實施多域解決方案以克服新出現的戰略和戰術挑戰的勢頭。應對這些挑戰的首要機制是制定理論,讓各部門承認并提供跨領域的效果以支持彼此。迄今為止,這一努力遇到了挑戰,因為聯合部隊有定義方面的挑戰,并且最終必須默許在零和資源環境中以犧牲自己的能力為代價來發展支持其他部門的能力。這項任務在最好的情況下是具有挑戰性的,在最壞的情況下是無法實現的。此外,產生一個解決方案本質上增加了與執行有關的復雜性。然而,重大的理論改革是沒有必要的,多領域合作的有利影響最好通過內在的模糊性來體現。
為多域作戰提供一個激烈的理論解決方案既無法實現,也沒有必要。允許思想上的模糊性提供了機會,使各部門能夠保持主要領域的主導地位,這對于多領域合作和跨領域的成功來說是必要的。它還允許制定與特定情況相關的解決方案,利用創造力,而沒有在零和資源環境中進行資源競爭的風險。各部門之間的同步性可以通過更加集中和一致的語言來克服,并通過使用現有的基礎設施來實施變革而不產生重大動蕩,使美國的軍事優勢保持不變,并能夠確保美國持續的全球力量投射。
無人駕駛地面車輛(UGVs)可用于軍事領域,以減輕士兵承擔的風險,以及為體力要求高、枯燥或危險的任務提供解決方案。雖然使用UGV有好處,但也有需求和限制。本論文探討了最終用戶--瑞典武裝部隊的一個輕步兵營--對于為城市地形中的軍事行動而設計的UGV在功能方面的要求。這是通過一個帶有焦點小組的探索性案例研究來完成的,來自第31游騎兵營的士兵和軍官使用兩種不同的UGV原型來完成任務。隨后是半結構化的小組討論,探討了需求、限制和要求。然后,通過主題分析方法對收集的數據進行分析。
主題分析的結果發現,焦點小組的要求有幾個重復出現的意見。這些要求被分為四類:(1)速度,(2)用例,(3)圖像生成的傳感器,以及(4)自主功能。總之,本論文在四個類別中共確定了13個需求。總而言之,這些要求意味著用于城市地形的軍事行動的UGV必須能夠跟上沖刺的士兵,提供視覺掩護,能夠與附近的物體互動,有幾個高質量的傳感器和強大的自主功能,使士兵能夠專注于控制UGV以外的其他事情。
一個持久的、精確的和適應性強的安全應用是有效的部隊保護條件(FPCON)的必要組成部分,因為美國的軍事設施已經成為恐怖主義和暴力行為的常見目標。目前的軍事安全應用需要一種更加自動化的方法,因為它們嚴重依賴有限的人力和有限的資源。目前的研究開發了一個由嵌入式硬件組成的離網部署的聯合微調網絡,并評估了嵌入式硬件系統和模型性能。聯合微調采用集中預訓練的模型,并在一個聯邦學習架構中對選定的模型層進行微調。聯合微調模型的CPU負載平均減少65.95%,電流平均減少56.18%。MobileNetV2模型在網絡上傳輸的全局模型參數減少了81.59%。集中預訓練的MNIST模型開始訓練時,比隨機初始化的模型的初始準確率提高了53.94%。集中預訓練的MobileNetV2模型在第0輪訓練時表現出90.75%的初始平均準確率,在75輪聯合訓練后,整體性能提高了3.14%。目前的研究結果表明,聯合微調可以提高系統性能和模型精度,同時提供更強的隱私性和安全性,以抵御聯邦學習攻擊。
聯合全域指揮與控制(JADC2)是將知識和信息迅速轉化為決策和行動的藝術和科學。它試圖通過所有的通信環境,在所有的戰爭領域整合所有的服務。本報告所描述的研究從海軍的角度出發,實現JADC2的概念化。一個比較性的案例研究被用來分析一個以海上為重點的聯合特遣部隊(JTF)的指揮和控制(C2),該部隊涉及跨軍種的綜合火力和灰區行動。主要結果強調了衛星通信對聯合特遣部隊整合的重要性,并闡明了在拒絕、降級、間歇或有限(DDIL)通信環境下出現的關鍵通信鏈接矩陣。這個DDIL通信矩陣可作為JADC2的優先需求集。建議的中心是確定這些要求的優先次序;闡明和傳播在DDIL環境中可以理解和實施的明確的指揮意圖;練習任務指揮、戰斗節奏擴張和邊緣C2;記住人仍然是JADC2中最重要的因素;以及發展JADC2成功所需的新知識、教育、培訓和實踐。
JADC2試圖解決所有領域和部門的C2的許多挑戰,但它需要周到的概念化,特別是從海軍的角度。一個比較性的案例研究被用來分析一個以海上為重點的聯合特遣部隊的C2,該部隊涉及綜合火力和灰區行動。基準案例代表了地理上分布的航母打擊群(CSG)、水面行動群(SAG)、空軍(AF)聯隊和海軍陸戰隊遠征部隊(MEF),通過常規的C2,以充分的通信能力聯合行動。對比案例描述了這個沒有衛星通信的聯合特遣部隊。
對這些案例的比較分析暴露了許多C2方面的挑戰,并有助于概念化JADC2如何必須支持作戰和戰術層面的戰爭,沿著通信能力的連續體。這一分析還提供了對C2要素的洞察力,這些要素遠遠超出了技術的范圍;特別是組成聯合特遣部隊的人員、流程和組織,以及必須流動的知識、信息和數據,使他們相互聯系。
該分析使我們能夠應用代表最新技術水平的理論,并將代表知識管理、組織和C2實踐水平的工具和技術應用于聯合特遣隊的組織和行動。這也使我們能夠從對聯合特遣部隊行動的分析中獲得新的知識,從而有可能轉化為增強和完善海軍C2組織和方法。
主要結論強調了衛星通信對于實現聯合特遣部隊整合的重要性。這尤其適用于地理上分散的服務,尋求以綜合方式進行互操作。此外,通過對DDIL環境的分析,出現了一個關鍵通信鏈路的矩陣。這個DDIL通信矩陣可以作為JADC2的優先需求集。
海軍、空軍和海軍陸戰隊在CSG和SAG、AF翼和MEF內的戰術行動在DDIL環境中并沒有像他們尋求跨軍種綜合火力和行動的聯合和作戰對應方那樣受到很大影響。細節仍然超出本文件的分類水平。
此外,優先考慮的JADC2需求集涉及的不僅僅是技術。事實上,所有組織級別的指揮官都需要表達和傳播明確的指揮意圖,這些意圖在DDIL環境中可以被理解和執行,而各級下屬必須能夠理解并將這種意圖轉化為所需的行動。這需要實踐: 各級組織的指揮官和各級單位都需要在任務指揮和戰斗節奏擴張下進行長時間的操作練習,就像綜合潛艇作戰那樣。此外,這些指揮官和單位需要通過非常低的帶寬DDIL通信模式來練習綜合行動,這就闡明了邊緣C2的一個令人信服的案例。
最后,人仍然是JADC2中最重要的因素。在DDIL環境中,地理上分散的聯合行動可能與大多數軍事人員遇到的各種教育、培訓和經驗大相徑庭。這為額外的教育、培訓和經驗提供了一個使用案例,以發展和完善有效戰斗所需的必要技能和能力。
此外,這種行動可以促使人們重新思考標準操作程序(SOP);技術、戰術和程序(TTP);作戰命令(OPORD);以及類似的明確知識。關鍵是要預測、發展和完善那種豐富的、基于經驗的隱性知識,這種知識需要滲透到從甲板到指揮部的所有組織層面。這種隱性知識--一旦獲得和完善--可以指導對SOPs、TTPs、OPORD和類似文件的有效反思。
像海軍研究生院(NPS)這樣的海軍教育機構是按照這些思路進行反思的一個重要場所,戰術訓練小組也是如此: 海軍研究生院可以開發和教授適當的知識,而戰術訓練小組可以將其轉化為有效的程序和實踐。這可能代表了我們研究者最重要的發現:新的知識、教育、培訓和實踐是JADC2成功的必要條件。
相應地提出了五項建議: 1)使用溝通矩陣來確定本研究中出現的JADC2要求的優先次序。2) 教導和指導組織領導者闡明和傳播明確的指揮意圖,這些意圖可以在DDIL環境中長期被理解和執行。3)通過任務指揮、戰斗節奏擴張和邊緣C2,學習并實踐海軍和聯合行動。4)記住,人仍然是JADC2中最重要的因素。5)通過沿著這些方向繼續學習,以及通過新的教育和培訓課程的開發,發展JADC2成功所需的新知識、教育、培訓和實踐。
有五個建議供進一步研究。
1)通信矩陣指出了有效聯合特遣部隊(JTF)的知識和信息在服務、單位、平臺和地理邊界之間流動所需的關鍵通信環節;它顯示了哪些環節受到被拒絕的、退化的、間歇的或有限的(DDIL)通信影響最嚴重。這為更深入地研究每個環節提供了機會--從相關人員、流程、組織和技術方面。
2)教導和訓練領導者表達和傳播明確的指揮意圖,使其能夠在DDIL環境下長期理解和執行,應該從聯合特遣部隊的戰斗節奏的擴張開始。DDIL可能需要聯合特遣部隊指揮官減少接收知識和信息的頻率,而在指揮和指導下級指揮官和部隊的機會之間,間隔時間也相應延長。訓練和實踐將是必不可少的。這就為開發相應的課程和演習提供了機會。
3)任務指揮可能被理解得相對較好,但仍不清楚在艦隊和各軍種中的實踐頻率和持久性如何。在知識和信息交流不那么頻繁的情況下,聯合特遣部隊和大多數下屬指揮部都會遇到戰斗節奏緊張的問題,而不同層次的指揮部可能會遵循不同的節奏。對于只習慣于24小時節奏的指揮部和部隊來說,這可能需要大量的調整和練習。這就為制定相應的課程和演習提供了機會。
另外,邊緣C2不太可能被很好地理解,然而對于指揮官和部隊來說,通過極低帶寬的DDIL通信模式來整合行動是至關重要的。C2領域已經積累了超過20年的關于邊緣C2的研究,但令人驚訝的是,很少有相應的知識能夠進入海軍的理論和訓練。這為開發相應的課程和演習提供了機會。
4)像JADC2這樣的項目很容易淪為技術工作的組合,這也是慣例。然而,JADC2在實現 "感知-決策-行動 "循環的自動化之前,還有很長的路要走(如果有的話)。這尤其適用于后兩個步驟:決策者和其他人必須對情況有所了解,而戰士和其他人則發起并執行相關行動。循環變得越快--快速循環代表了JADC2的明確期望,DDIL限制變得越差--嚴峻的環境代表了JADC2的明確期望,循環的每一步都變得更有挑戰性。這為進一步研究提供了機會。
5)這些進一步研究的建議都指出了知識差距。有些差距(如2和3)是相對明確的,可以通過開發更多的教育和培訓課程,以及相應的練習和實踐來填補,而其他差距(特別是1和4)則不太明確,需要進一步研究。
許多國家都使用了像“三角洲” (Delta) 這樣的作戰管理系統(BMS),包括烏克蘭,使指揮部能夠共享態勢感知信息;本研究的重點是信息在作戰網絡中的分配。與自然系統類似,螞蟻和蜜蜂等自主代理遵循一套簡單的規則,BMS是一個由基地和電子作戰平臺組成的網絡,在國防條令的指導下,軍事資產作為網絡內的智能體。這種系統的可操作性的原理是基于多個子系統相互作用時每個子系統都是可靠的。然而,潛在相互作用的排列組合會引起不可預測的負反饋或正反饋循環,導致不可預測的和不想要的結果。突現行為的結果是出乎意料的,有時在情報和無線網絡等領域是不受歡迎的。理解突發行為對于理解復雜的工程系統是勢在必行的,并且要提出新的見解,采取切實可行的措施來改善復雜系統的設計和分析。本文介紹了BMS和網絡與用戶定義的系統集成的網絡士兵概念的例子。作者認為,烏克蘭和其他軍隊可以直接從利用元控制論、元元系統模型分析來控制突現。
圖2:作戰管理系統(BMS)的集中式指揮通信網絡
軍隊一直認為有必要將他們的決策建立在成熟的作戰研究方法之上,這些方法試圖在決策過程中為指揮部提供備選方案,對戰役到戰略進行評估。
戰斗傷亡是軍事運籌學的一個研究課題,它應用數學模型來量化勝利與損失的概率。特別是,已經提出了不同的方法來模擬戰斗的過程。然而,它們都沒有為高層指揮提供足夠的決策支持。為了克服這種情況,本論文提出了一個創新的框架,它克服了傳統模型的大部分局限性,并支持最高指揮層的決策:戰略和戰役層,借助于確定戰斗力水平的衰減,通常被稱為損耗(損失),作為評估決策的機制。該框架應用了適應性和預測性控制工程方法來動態調整以適應戰斗的變化,同時考慮到對手的能力和機動性以及產生的效果。此外,它還包括一個學習機制,以改善在高不確定性條件下的決策。
論文報告了對克里特島戰役、硫磺島戰役和庫爾斯克戰役這三場有影響力的二戰戰役框架的實證評估,這些戰役的戰斗類型主要是陸上的。從那時起,這種作戰模式基本上沒有改變。因此,收集到的實驗結果可以推斷到現今的陸地作戰。這本身就構成了一個相關的貢獻,因為大多數關于軍事決策的文獻都缺乏足夠的實驗驗證。
最后,本論文為從業者和研究人員提供了現有文獻的指導,確定了現有決策模型的優勢和劣勢,并為在決策中應用戰斗預測模型提供了參考背景。
這項研究將分析戰場決策模型的現狀,重點是了解應用了哪些類型的決策,這些決策是如何做出的,以及有哪些經驗證據支持這些決策,這將使人們深入了解當前方法的局限性,并能提出新的機制來克服這些局限性。在這個意義上,我們的研究將提出一種方法,以彌補陸地戰場上高層決策自動化的差距,即所謂的戰略和戰役軍事決策。擬議方法的有效性將由一套足夠廣泛的經驗證據來證明,所有這些證據必須具有代表性。
確定了以下目標:
消除蘭徹斯特經典著作的局限性和其他蘭徹斯特在陸地戰場上的影響。
為戰略和作戰軍事決策的自動化提供一個框架。
提供經驗性證據,表明該框架充分適合戰斗趨勢,并能選擇最合適的決策。
指導從業人員和研究人員了解現有決策模型的優勢和劣勢。
本研究旨在分析控制理論在蘭徹斯特戰斗決策模型中的應用表現,以追求陸軍領域的戰略和作戰決策方法。在此基礎上,考慮了以下研究問題(RQs)。
問題1:現有的決策系統對戰役和戰略層面的指揮是否有足夠的支持?
問題2:適應性和預測性控制結構能否有助于克服傳統作戰模式的局限性?
有兩種主要的戰斗分析機制可以替代經典的蘭徹斯特模型:(i)隨機模型和(ii)確定性模型,其中一些是拉切斯特的傳統,例如[KMPS17, JHC17a]。目前,其他方法,如智能代理,正在獲得巨大的發展勢頭,例如,[OT17, ADK17]。這些新模型旨在擴展能力,例如[Kre20, Cou19],并減少以前方法的缺點,例如[Duf17, KLM18]。然而,它們未能成為高層決策的適當基準。
建議的框架克服了蘭徹斯特原始工作的局限性,在[Eps85]中進行了深刻的討論,將戰斗視為一個因果過程,根據蘭徹斯特方程的動態變化和外部行動進行演變。為此,該方法應用了[SR95]中介紹的適應性和預測性控制理論,并結合了不確定性建模技術。該方法的結構包括一組合作工作的模塊,確保決策按照軍事理論連貫地進行。特別是,一組連續的階段觸發了適用戰略的定義、評估和選擇不同的可能COA,以及使模型適應行動的演變。每個區塊代表軍事思維的機制,見圖3.1,其中x(t)和y(t)定義了每個瞬間x部隊和y部隊的戰斗人員數量,x(t+1)e和y(t+1)e是對下一瞬間戰斗人員數量的估計。
實施需要有邏輯過程的能力,應該模擬從預測到行動的決策過程。在這種情況下,新的框架在第四章中被制定和測試(如果它在實際對抗中的應用在性能和一致性方面符合預期,它將是強大的)。
圖3.1:我們框架的架構設計。每個區塊都代表了軍事思維的機制,因此(i)評估將確定要遵循的戰略的戰斗事件,并選擇完成任務的COA,(ii)確定執行任務所需的資源,最后(iii)適應結果。
圖3.2:在新框架中通過順序模型觸發選擇特定COA的主要因素。
圖3.2開發了迭代觸發特定COA選擇的基本要素。預測塊產生預測演變。適應性模塊根據輸出信號(實際情況)與預測信號的差異調整組成模塊的參數,并適當地更新最后執行的COA。專家區塊試圖通過調度區塊修改預測區塊定義的趨勢,從而按照戰斗的需要改變行動路線。值得注意的是,設定點與完成任務有關,行動的發展時間是操作時間,在最好的情況下,有沖突信息的可用數據庫通常是以天為單位的時間演變。
圖3.3:縱軸標識了模型所體現的抽象程度,圓錐體的底圓代表現實或完全沒有抽象,隨著聚合水平的提高,定義指揮水平的變量逐漸抽象出作戰執行的細節。因此,在蘭徹斯特模型的應用水平與戰略-戰役聚合水平相一致,聚合模型涵蓋了戰斗最基本的執行機制,如個體沖突,執行水平受到武器裝備、位置、能見度、后勤等因素的影響。
特別是在克里特島和硫磺島戰役中,我們的驗證目標是根據當前的理論確定可能的最佳行動方案,并與1941年5月20日和1945年2月19日的實際戰役相比,確定它們對對手產生的影響;在庫爾斯克戰役中,我們的目標是通過適應性和預測性控制的動態調整,正確確定戰斗階段,圖4.1。
圖4.1: 實際應用的基本自適應預測控制方案。自適應控制機制使戰斗過程輸出和預測模型輸出之間的差異趨于零,突出了預測塊在每個采樣時間窗口在系統中發揮的雙重作用。