現有的軍事創新模式假定軍隊內部普遍抵制變革,因此需要外部影響來誘導軍事創新。在這些方法中,技術與創新之間的復雜關系通常是通過將技術的重要性降到最低或將技術與創新的社會過程分開來解決的。然而,這些方法難以反映技術與軍事創新之間新出現的動態關系,因此可能會造成國家資源的浪費和不必要的血腥戰爭。重構技術與軍事創新之間的關系,可以為軍隊顯然無法將技術與戰略目標相結合的問題提供新的見解,并為未來更有效的調整提供依據。
本文利用建構性科學與技術研究概念的見解,建立了一個新的軍事創新模型:在此稱為技術三位一體。技術三位一體描述軍事社會技術系統的方式突出了軍隊內部的變革與創新。該模型描述了條令、物資和 “軍事知識”(一個與戰爭行為的社會建構真理有關的新概念)如何相互作用,在軍隊內部產生變革和創新。在構建該模型并深入探討其在二戰前美國陸軍裝甲戰發展中的應用--該模型正是從這一案例中發展而來的--之后,論文探討了技術三位一體的邏輯延伸,以建立一個演繹框架,并據此檢驗該模型的普適性。美軍在越戰結束前的核武器創新為該模型提供了戰略層面的檢驗,而美國、俄羅斯、以色列和阿塞拜疆武裝無人機的開發和使用則為技術三位一體提供了當代創新的檢驗。這三個案例共同表明,從技術三位一體的角度來構建技術與軍事創新之間的關系,可以為軍事領導人采取具體行動提供參考,這些行動涉及最有可能在未來沖突中發揮作用的技術類型,以及如何管理軍事創新以增加實現戰略目標的機會。
圖 2. 技術三位一體三要素是將適用于軍隊的每種不同形式的技術相互聯系起來而形成的。
美國國防部(DoD)和蘭德公司(RAND)等研究機構都記錄了在進行探索性分析以支持能力發展方面存在的戰略差距,這些分析旨在利用技術和條令概念解決方案。進行探索性分析涉及許多方面,從研究技術發展趨勢到對潛在對手能力進行情報評估;歸根結底,創建模型和模擬以探索各種場景的工作是為高級領導人提供分析支持的核心。在這項工作中,總體戰略差距被分解為需要研究的更多重點領域,首先是探索當前整合不同模型的方法,以滿足國會在質量、準確性和可靠性方面的關切;注意到這些方法在探索大型設計或決策空間方面的計算量已變得過于龐大。進一步的意見指出,性能指標的預期值需要復雜和潛在的非線性模型來量化,在不同層次的模型抽象之間使用時,無法提供足夠的可追溯性。此外,當前的模型抽象方法難以考慮與日益復雜的模型或模擬相關的維度增加。這些觀察結果引出了本研究的目標,即制定并演示一種方法,利用降階建模(ROM)方法進行可追溯的模型抽象,在當前的軍事行動建模與仿真方法中有效、高效地捕捉復雜的系統行為。
通過對當前文獻的回顧,得出了對 ROM 的以下要求:需要考慮非線性相互依存關系、潛在的物理現象和隨機效應。提出并完成了一系列研究問題、假設和實驗,以進一步了解和解決已發現的差距。所有這些都為制定降階非侵入式(RONIN)建模方法提供了指導,從而實現了既定的研究目標。與 “查找 ”表或簡單傳遞預期值等傳統方法相比,RONIN 建模方法創建并實施了預測性減階替代模型,可捕獲更多有關行為和交互的信息。最后,為了證明 RONIN 建模方法能夠實現研究目標,我們定義了一個名義上的美國空軍使用案例,并使用國防部標準模擬框架生成了一個全階模型(FOM),該模型輸出了一組響應分布。任務級模型的響應可量化系統行為,范圍從簡單的資產、武器或燃料計數到旨在計算作戰效能的高級指標。本用例模擬了一次壓制敵方防空(SEAD)任務,探索不同的決策和部隊結構如何影響友軍損失和敵方殺傷的總數。最終,使用 RONIN 建模方法創建了一個預測代用模型,該模型能夠重建與原始 FOM 輸出數據靜態一致的輸出分布。
圖 1.1: 國防規劃流程用于將戰略指導轉化為可操作的支出、部隊結構設計和能力發展目標[127]。
軍事創新過程在戰時和平時具有不同的特點。戰時創新有戰場的直接反饋。和平時期的創新必須考慮到各種可能的未來,同時還要面對信息不完善所帶來的不確定性。軍事創新研究表明,實驗為克服這一挑戰提供了工具。現有的學術研究將實驗描述為一個迭代學習的過程,它能產生關于未來戰爭的新數據,并引用了美國航母戰和德國聯合武器演習等歷史實例。
本文認為,要理解實驗如何支持和平時期的創新,這種觀點并不全面。與其說實驗揭示了未來戰爭的本質,倒不如說實驗作為一種建立共識的工具最具價值。和平時期的軍事實驗是一個社會過程,在這一過程中,組織、團體和行動者影響著國防政策子系統內的意識形態競爭。社會過程包括構建知識,并就 "什么是真實的 "和 "什么是有效的 "達成共識。在戰爭期間,這一過程是通過戰場上的共同經驗實現的。在和平時期,這一過程發生在實驗過程中。軍事實驗需要高層領導的支持,但僅靠支持并不能在關鍵群體中達成足夠的共識。為了提高實驗向創新過程的實施階段過渡的可能性,國防政策制定者利用宣傳網絡(由國防政策制定者和政策影響者組成的松散聯盟)在整個國防政策子系統中建立共識。
本論文在三個案例研究中考察了這些論點:20 世紀 80 年代陸軍的摩托化概念實驗、20 世紀 90 年代陸軍的新路易斯安那演習和二十一世紀部隊實驗,以及 20 世紀 90 年代末和 21 世紀初聯合部隊司令部的聯合實驗。就國防政策而言,本文的研究結果表明,國防決策者應集中精力擴大宣傳網絡,將實驗與更廣泛的國防政策子系統聯系起來,以最大限度地發揮實驗的作用。此外,實驗還要求領導者在思想上與新理念保持一致,能夠傳達新理念的價值,擁有可靠的實戰經驗,并參與到宣傳網絡中,將實驗與關鍵群體聯系起來。最后,有效的實驗要求領導者在其職業生涯的早期經常接受必要的教育和體驗。
軍事創新過程
美國陸軍在各級戰爭中都會進行評估,以便更好地了解實現目標的進展情況。陸軍專門進行作戰評估,以衡量軍事力量的使用效果。評估過程是一項反復進行的活動,貫穿整個任務規劃過程。作戰評估的現狀是過去幾十年戰爭中形成的條令和方法的結果。然而,生態系統中的幾個利益相關群體已確定需要進一步發展評估流程。本研究旨在對作戰評估企業進行全面分析,并就架構改進的機會提出建議。
本研究的目的是提供對作戰評估體系的透徹分析,并就改進架構的機會提出建議。研究方法包括文獻綜述、利益相關者評估和訪談,以及在創新企業戰略架構(ARIES)框架內應用系統分析方法,以評估當前狀態條件,并確定未來狀態系統的轉型機會。然后對擬議的未來狀態要素進行分析,以確定在評估過程的多個層面上增加價值交付。
研究確定了可進一步開發的系統設計機會,以更好地為利益相關者提供價值。對主要利益相關者進行更多的能力意識培訓和程序宣傳,也可以推廣更有效的評估產品和服務。最后,對作為信息積累的評估能力的分析支持了有關實施措施的建議,以更好地在系統內獲取和傳播經驗。
研究方法采用了創新企業戰略架構(ARIES)框架的系統工具,并應用了利益相關者網絡理論和系統工程方法。ARIES 框架通過對當前和未來狀態的分析來看待系統差異,從而確定最有利于未來轉型的架構考慮因素。
這項研究通過以下方式探索重新構建系統的機會:
這篇論文提出了一種新的方法來估計非戰爭軍事行動的兵力規模和組成。雖然軍事規劃人員有規劃這類行動的工具,但這些工具大多無法使用或不適合民用。非戰爭軍事行動中最常見的兵力估計工具,即兵力比,是不準確的,而且是基于有問題的假設。這里提出的新方法,即作戰推理,是一種混合方法,它使用多變量的距離測量,以確定哪些軍事行動是相互類似的。利用這些信息,研究人員可以確定類似的案例進行重點比較,從而在質量和數量上改進兵力估計。該方法的實用性在兩種不同形式的大規模殺傷性武器中得到了證明。它被應用于人道主義的軍事干預,為假設的歐盟對利比亞的干預估計兵力。然后,通過估算2021年8月美國撤離阿富汗所需的兵力,將其應用于非戰斗人員撤離行動,顯示了其模仿現實世界決策的能力。該方法產生的估計值比兵力比例方法產生的估計值更準確,而且在這兩種情況下,該方法及其促成的戰役分析都能夠回答重要的、與政策相關的問題。
本文開發并演示了一種估計非戰爭軍事行動(MOOTW)中兵力規模和組成的新方法。雖然軍隊有確定兵力規模的程序,但這些方法往往依賴于機密信息、先進的模擬軟件、規劃人員和反復的定性方法,如兵棋推演,而這些對于民間研究人員來說是不可用的或不切實際的。改進軍方以外的這些行動的分析工具是很重要的,因為MOOTW行動往往具有很強的爭議性:它們往往是有選擇的行動,平民(例如,人權非政府組織雇用的人)可能比軍方本身更關心它們的行為。學術文獻中最廣泛使用的技術,即兵力比例,往往表現不佳,對兵力的組成一無所知,而且不再被列入美國官方軍事理論。
因此,建議采用一種新的方法,即作戰推理,該方法隱含了軍事計劃過程中的見解,為假設的或歷史上的大規模殺傷性武器提出兵力規模和組成的建議,以取代軍隊的專門工具。利用可比行動的數據集,作戰推理選擇那些在軍事目標和作戰環境方面與假設行動最接近的行動。利用這個行動參考集,就有可能對參考集中的案例進行重點研究,以確定投入行動的兵力是否成功地實現了他們的目標,利用這一研究的結果來指導假設行動的兵力規模和組成。由于這些兵力是用軍事計劃方法創建的,因此可以說這樣構建的估計值更接近于一個假想的軍事計劃者會設計的估計值,而且選擇案例來指導分析的標準比將一類行動作為一個整體來看待提供了更好的性能。總的來說,對該模型的基本診斷測試表明,它比文獻中廣泛使用的兵力比率的性能有所提高,而總的來說,由于該方法能夠提供關于兵力組成的更多細節,而不是簡單的兵力規模,因此在性能上有了明顯的改善。
對軍事問題的分析是與政策相關的國際關系研究的一個關鍵領域,實際上也是專注于安全研究的學者的一個核心調查領域。某一地區沖突的可能結果是什么?應該期待一支戰斗兵力有多大的效力?軍隊已經開發了工具和技術來回答這些問題,學術界和政策界的民間分析家也是如此。學科內的學者們正在開發一系列的新方法,并完善現有的方法。歷史最悠久的民用工具之一,戰役分析,最近才被正式化和標準化,但為回答一系列軍事問題提供了有希望的見解(Tecott and Halterman 2021, p. 51-2)。此外,戰役分析的重點是建立簡單的模型,這為整合其他方法學方法和進行多方法研究提供了空間,允許定性的見解指導定量的模型,反之亦然。本研究介紹了戰役分析在回答一個重要的政策問題方面的應用:在特定的軍事行動中,什么水平的軍事力量,以及什么類型的兵力是必要的?它還提供了一個例子,說明該方法可用于MOOTW,這是一種重要的軍事行動形式,相對于其現實世界的重要性,在戰役分析文獻中研究不足。此外,該方法在理論上可以推廣到其他行動:將簡單的量化規則應用于戰役的難度使得該方法對其分析特別有用,但它也可以擴展到其他戰役分析中,或者為側重于常規前線作戰的戰役分析提供有益的補充。
這項研究為平民提供了一個思考兵力規劃或兵力規模問題的新工具:完成一個特定的行動需要多少和哪些類型的兵力。在二十世紀的大部分時間里,這種做法主要局限于軍隊或政府內部的專家,他們可以接觸到機密數據和方法。然而,在冷戰期間,民間學者的新工作打破了軍事分析的常規,為常規沖突中的兵力規劃提供了新的指導方針。這些工作也代表了平民試圖提供透明和可復制的模型來支持他們的論點,將復雜的戰場問題減少到簡單的程度,使偽造成為可能。戰役分析所提供的簡化模型也更容易通過書面或其他展示方式傳達給公眾。然而,這些方法絕大多數都集中在常規軍事行動上,有些學者則擴展到了核戰爭的分析。 較少有戰役分析關注非軍事行動(MOOTW),盡管這類行動在國際體系中越來越常見和普遍,"現在是現代安全環境中的一個固定部分"(Lin-Greenberg 2018, p.84)。
MOOTW的發生率增加,它們對成功的外交政策的重要性,以及這些行動對其他國家軍隊的潛在信號價值,都使它們值得更密切的研究(同上;Pion-Berlin 2016)。隨著戰役分析作為一種方法論的進一步發展和正規化,它也應該被應用到MOOTW上,并且應該開發新的工具來幫助研究者這樣做。這些類型的行動已經成為其他作戰研究方法的對象,包括戰爭游戲(O'Neal Jr 1999;Britt 2021),因此有理由懷疑,戰役分析也可能有助于回答與MOOTW有關的政治或作戰重要性問題。
特別是,在估計MOOTW的兵力規模方面,現有技術還有改進的余地。過去在確定兵力規模方面的嘗試遵循兩種方法,即兵力比率和作戰設計,這兩種方法對民間和學術分析人員來說都有嚴重的缺陷。像James Quinlivan(1995年)開創的兵力比率方法,其假設是有問題的,往往是不準確的,而且對兵力的組成沒有說明(Krause 2007)。最后一點對于兵力規模的確定來說尤其是一個問題,因為兵力的組成也會影響到行動所需的地面兵力的數量。同時,像美國軍事計劃人員所青睞的作戰設計方法,需要一定程度的勞動和反復的戰爭演練,而學術分析人員不可能有這樣的能力。這是一個問題,因為它意味著對這些復雜行動的現實規劃僅限于在軍事規劃人員中工作的專業人士。綜上所述,這些行動在當代國際體系中的重要性,民間分析家缺乏規劃方法,以及像人道主義非政府組織這樣的民間機構對戰爭破壞的興趣,意味著民間分析家需要更好的方法。此外,辯論不僅僅發生在平民和軍隊之間:正如Alan Kuperman所指出的,在盧旺達種族大屠殺之后,軍隊、平民和政府間組織/非政府組織之間經常就什么樣的武力可以防止暴行進行辯論(2001)。解決這樣的爭論需要一種方法論,它可以使用非保密的數據來得出結論。
最終需要的是一種能夠將作戰設計的多變量和定性方法與武力比例方法的明確性和可復制性相結合的方法。這種方法不僅對學術分析有用,而且對非政府組織、政府間組織、智囊團或考慮擬議的大規模殺傷性武器部署的個人也有用。關于部署的可取性、實用性和局限性的辯論可以在歷史數據的指導下進行。這項研究提供了這樣一種方法,它將戰役分析調整為一種新的、基于案例的兵力規模確定方法。
雖然這個詞在軍事專業人員和文職分析人員中已經不常用了,但 "非戰爭軍事行動 "是20世紀90年代用來描述 "大規模、持續作戰行動 "以外的軍事行動(JP 3-07,1997)。這個廣泛的類別包括廣泛的可能行動,包括救援行動、反叛亂或叛亂支持部署、國內部署和維和任務等等。MOOTW可能涉及不同程度的暴力和復雜性的行動,從不使用武力到有致命戰斗危險的部署。
最近的烏克蘭事件和美國與中國之間日益緊張的關系使人們重新關注常規沖突和大國競爭,因此可以說MOOTW已經不再是一個有用的研究類別。然而,從廣義上講,MOOTW仍然是最常見的軍事部署類型,其傾向于解決的沖突類型(國內沖突)仍然是當代國際體系中最常見的沖突形式。此外,MOOTW也是大國軍隊持續關注的對象。MOOTW也可能參與國家和國際對國際體系中新出現的挑戰的回應,如氣候變化和新的移民模式(Bayer和Struck 2019;Sahu和Mohan 2022)。最后,MOOTW可以提供信號信息,影響國家對另一個國家的軍事或外交政策的態度(Lin-Greenberg 2018),所以他們的行為也仍然與大國競爭有關。
這項研究的貢獻有幾個方面。
首先,提供了一種新的方法來估計低于常規戰爭水平的軍事行動的兵力需求。其他研究人員已經開發或改編了常規沖突中的兵力規劃方法,可用于確定此類沖突的兵力需求。常規沖突的模型可以基于數學表達式,如損失率或雙方的相對戰役次序,但低于常規戰爭水平的行動往往有更難定義的目標,導致在建立兵力需求模型時出現更多困難。雖然學者們對常規沖突的關注隨著國際體系中大國競爭的普遍加劇而增加,但國內沖突、維持和平和反叛亂任務以及人道主義努力仍然是當今使用軍事力量的最常見情況。不過,這種方法仍然可以應用于戰爭遺留問題以外的領域,特別是在后勤和ISR等任務方面。只要能對行動進行適當的分類,并能確定對比行動的數據集,行動推理就能為其規劃提供洞察力。
此外,正如冷戰所證明的那樣,激烈的大國競爭并不一定意味著國內戰爭或低于常規戰爭的行動將變得不那么常見。事實上,這類行動可能會變得更加普遍,因為激烈的競爭加上直接沖突的巨大風險導致低于常規國家間戰爭的沖突。無論如何,在這些行動中,更好的兵力規劃工具可以幫助減少任何系統背景下的政策失敗的風險。它們可以幫助分析家和決策者更好地了解這些行動所需的資源,并將其置于一個國家的整體大戰略圖景中。低于戰爭級別的行動有雙重風險,既會將稀缺的軍事資源投入到長期項目中,也會在可能破壞穩定的人道主義災難中無法進行干預。提高計劃此類行動的能力,并批判性地評估政府對必要力量的估計,仍然是改善外交政策實施的一個關鍵目標,特別是在西方國家(Yi 2018)。
該方法的第二個主要貢獻是,它為平民參與有關人道主義部署的辯論提供了額外的工具。這是有必要的,因為有幾個原因。政府或非政府組織中專注于某一特定領域或問題的平民可能比軍官在為MOOTW部署軍隊方面投入更多,因此他們在倡導這種部署時應該有更好的工具來估計軍事需求。鑒于在許多MOOTW情況下需要快速反應,這種方法可以改善規劃過程。即使在像非洲聯盟這樣具有軍事職能的組織內,也可能沒有像那些能夠進行作戰設計的常設規劃人員。一種能夠迅速提供大致準確估計的方法可以加速規劃過程,至少在評估其可行性方面是如此。
最后,提供了一種方法,它將運動分析方法的正式化擴展到新的領域,進一步證明了它作為一種研究方法的前景。盡管過去的學者們在應用競選分析方法和提供使其正規化的嘗試方面做出了令人印象深刻的努力,但競選分析的結構化使用仍然處于起步階段。不僅通過將運動分析方法應用于一個新的問題來推進這一研究議程,而且還展示了運動分析如何與其他方法論的見解相結合來開發新的研究技術和回答新的問題。具體來說,提供了一個例子,說明如何通過識別最相似的案例來選擇案例,作為任何依賴案例結構化比較的運動分析的一部分。
下一章詳細介紹了以前關于兵力規模的文獻中的缺點,并闡述了新方法--行動推理--所需的步驟。它還解釋了操作推理與社會科學中其他方法論之間的理論和方法學聯系。第三章展示了使用該方法來確定一個假設的人道主義行動的兵力規模,而第四章則展示了該方法在非戰斗人員疏散行動中的表現,以估計一個歷史行動的兵力規模。總的來說,這些章節顯示了該方法如何適用于一系列大規模殺傷性武器的情況,并證明了其相對于兵力比率方法的優越性。第五章回顧了這些案例的結論,對該方法提出了改進建議,并得出結論。
戰斗機飛行員通常使用模擬器來練習他們需要的戰術、技術和程序。訓練可能涉及計算機生成的力量,由預定的行為模型控制。這種行為模型通常是通過從有經驗的飛行員那里獲取知識而手工制作的,并且需要很長的時間來開發。盡管如此,這些行為模型由于其可預測性和缺乏適應性而通常是不夠的,教官必須花時間手動監測和控制這些力量的各個方面。然而,最近人工智能(Al)研究的進展已經開發出能夠產生智能代理的方法,在復雜的游戲(如圍棋和《星際爭霸II》)中擊敗人類專家玩家。
同樣,人們可以利用人工智能的方法來組成空戰的高級行為模型,使教官能夠更專注于飛行員的訓練進展,而不是手動控制他們的對手和隊友。這種智能行為必須表現得逼真,并遵循正確的軍事理論,以證明對飛行員訓練是有用的。實現這一目標的一個可能方法是通過模仿學習,這是一種機器學習(ML)類型,代理學習模仿專家飛行員提供的例子。
本報告總結了使用模仿學習技術優化空戰行為模型的工作。這些行為模型被表述為控制計算機生成的部隊的行為轉換網絡(BTN),由下一代威脅系統(NGTS)模擬,這是一個主要針對空域的軍事模擬應用。遺傳算法Neuroevolution of Augmenting Topologies (NEAT)的一個改編版本優化了BTNs,使其行為與飛行員行為的演示相似。與大多數ML方法一樣,NEAT需要許多連續的行為模擬來產生滿意的解決方案。NGTS不是為ML目的而設計的,因此圍繞NGTS開發了一個系統,該系統自動處理模擬和數據管理并控制優化過程。
進行了一組實驗,其中開發的ML系統對BTN進行了優化,以模仿三個簡單空戰場景中的例子行為。實驗表明,NEAT的改編版本(BTN-NEAT)產生的BTN能成功地模仿簡單的示范行為。然而,優化過程需要相當長的時間,計算時間長達44小時或模擬飛行時間為92天。緩慢的優化主要是受NGTS不能快速運行同時保持可靠的影響。這個可靠性問題是由NGTS缺乏時間管理造成的,它可以將代理人的狀態與模擬時間戳聯系起來。為了在更復雜的場景和演示中實現成功的行為優化,人們應該在高可靠性的前提下以比實時快得多的速度模擬行為。因此,我們認為NGTS并不適合于未來的ML工作。相反,需要一個為ML目的設計的輕量級空戰模擬,能夠快速可靠地運行。
戰斗機飛行員通過嚴格的訓練學習并保持他們的戰術技能。相當多的訓練是以模擬為基礎的,在訓練中,受訓者面對友軍和敵軍,他們的行為最好能加速訓練并建立起理想的能力。計算機生成的部隊(CGFs),是自主的、計算機控制的實體,被用來扮演這些友軍和敵軍的角色。理想情況下,在基于模擬的訓練中使用CGF應該提供一些好處,如增加飛行員的訓練可用性,減少訓練中對主題專家(SME)的需求。然而,手動模擬CGF的行為,使其對教學作用有足夠的代表性,這是很繁瑣的,而且已被證明具有挑戰性。因此,目前手工制作的行為模型往往是可預測的,不能適應新的情況或在軍事理論、戰術、技術和程序(TTP)方面表現得很真實。在基于模擬的空戰訓練中保持真實的體驗對于確保受訓者獲得必要的技能至關重要。然而,由于CGF的表現和行為被認為是不足的,中小企業往往在訓練中對CGF進行微觀管理,這是不幸的,因為中小企業的成本很高,他們的時間很寶貴,而且數量有限。
人工智能研究的最新進展已經開發出能夠產生智能代理的方法,在復雜的游戲中擊敗人類專家玩家,如圍棋[1]和星際爭霸II[2]。隨著這些進展,學習用于空戰的指導性和適應性代理行為已成為一個越來越受關注的研究領域。然而,為了發揮作用,飛行員模擬的對手和盟友的行為必須是真實的,并符合軍事理論,而不是,例如,試圖不惜一切代價贏得交戰。該研究領域的一些貢獻集中在強化學習方法上,并且已經顯示出一些有希望的結果。然而,即使仔細設計目標函數,強化學習代理也有可能學習到用于飛行員訓練的次優政策,這意味著他們的行為與根據既定理論和TTP所期望的不同。另一種方法是向ML算法提供專家示范,從中提取飛行員的具體知識,并將其納入代理人使用的行為模型。據我們所知,在空戰領域,很少或沒有先前的研究探討過這種方法。
本報告介紹了基于達爾文自然選擇原則的模仿學習算法被用來產生以行為轉換網絡(BTNs)表示的空戰行為模型。雖然BTNs已經出現在之前使用強化學習的空戰行為建模的相關工作中,但這項工作研究了BTNs是否適合模仿學習。下一代威脅系統(NGTS)被用來模擬BTNs,并進行了評估以考慮該模擬系統對機器學習(ML)的適用性。已經開發了一個ML系統,包括使用NGTS和選定的學習算法成功生產空中戰斗機代理所需的工具和方法。這個ML系統自動處理模擬和數據管理并控制學習算法。簡單的空戰場景被定義,并在使用該ML系統進行的一系列實驗中使用,在這些實驗中產生了反映示范飛行員行為的BTN。
為了限制這項工作的范圍,我們做了一些限定。開發的ML系統不是生產級的,而是一個概念驗證。因此,實驗中使用的場景和試點演示保持簡單。具體來說,這些都是一對一的場景,演示僅限于二維空間的運動。此外,行為演示是基于報告作者手工制作的BTN,而不是由專業飛行員制作的。
本報告是為從事軍事訓練和人工智能相關課題的研究人員準備的,最好具有空戰和行為建模的知識,其組織結構如下。第2章介紹了工作的背景,包括與空戰訓練和模擬有關的概念、人工智能理論和相關工作。第3章涵蓋了實驗中使用的選定的學習算法及其配置,而第4章介紹了構成ML系統的過程和工具。第5章和第6章通過定義空戰場景和行為演示來回顧實驗的設置和執行,并介紹了結果。第7章討論了這些結果,以及ML系統和NGTS的性能。第8章本報告的總結和對未來工作的思考。
圖5.2 第一個場景的總結: 逃亡。CGF從它們的初始位置向對方飛去。一旦藍色飛機進入紅色飛機的導彈射擊范圍內,紅色飛機就會轉身向相反方向逃離。
在決策或推理網絡中進行適當的推理,需要指揮官(融合中心)對每個下屬的輸入賦予相對權重。最近的工作解決了在復雜網絡中估計智能體行為的問題,其中社會網絡是一個突出的例子。這些工作在各種指揮和控制領域具有相當大的實際意義。然而,這些工作可能受限于理想化假設:指揮官(融合中心)擁有所有下屬歷史全部信息,并且可以假設這些歷史信息之間具有條件統計獨立性。在擬議的項目中,我們打算探索更普遍的情況:依賴性傳感器、(可能的)依賴性的未知結構、缺失的數據和下屬身份被掩蓋/摻雜/完全缺失。對于這樣的動態融合推理問題,我們建議在一些方向上擴展成果:探索數據源之間的依賴性(物理接近或 "群體思維"),在推理任務和量化不一定匹配的情況下,采用有用的通信策略,甚至在每個測量源的身份未知的情況下,采用無標簽的方式--這是數據關聯問題的一種形式。
我們還認識到,對動態情況的推斷是關鍵目標所在。考慮到一個涉及測量和物理 "目標 "的傳統框架,這是一個熟悉的跟蹤問題。但是,來自目標跟蹤和多傳感器數據關聯的技術能否應用于提取非物理狀態(物理狀態如雷達觀察到的飛機)?一個例子可能是恐怖主義威脅或作戰計劃--這些都是通過情報報告和遙測等測量手段從多個來源觀察到的,甚至可能被認為包含了新聞或金融交易等民用來源。這些都不是標準數據,這里所關注的動態系統也不是通常的運動學系統。盡管如此,我們注意到與傳統的目標追蹤有很多共同點(因此也有機會應用成熟的和新興的工具):可能有多個 "目標",有雜波,有可以通過統計學建模的行為。對于這種動態系統的融合推理,我們的目標是提取不尋常的動態模式,這些模式正在演變,值得密切關注。我們特別建議通過將雜波建模為類似活動的豐富集合,并將現代多傳感器數據關聯技術應用于這項任務,來提取特征(身份)信息。
研究的重點是在具有融合觀測的動態系統中進行可靠推理。
1.決策人身份不明。在作戰情況下,融合中心(指揮官)很可能從下屬那里收到無序的傳感器報告:他們的身份可能是混合的,甚至完全沒有。這種情況在 "大數據 "應用中可能是一個問題,在這種情況下,數據血統可能會丟失或由于存儲的原因被丟棄。前一種情況對任務1提出了一個有趣的轉折:身份信息有很強的先驗性,但必須推斷出身份錯誤的位置;建議使用EM算法。然而,這可能會使所有的身份信息都丟。在這種情況下,提出了類型的方法來完成對局部(無標簽)信念水平和正在進行的最佳決策的聯合推斷。
2.動態系統融合推理的操作點。在以前的支持下,我們已經探索了動態事件的提取:我們已經開發了一個合理的隱馬爾科夫模型,學會了提取(身份)特征,有一個多伯努利過濾器啟發的提取方法 - 甚至提供了一些理論分析。作為擬議工作的一部分,將以兩種方式進行擴展。首先,打算將測量結果作為一個融合的數據流,這些數據來自必須被估計的未知可信度的來源。第二,每個這樣的信息源必須被假定為雜亂無章的 "環境 "事件(如一個家庭去度假的財務和旅行足跡),這些事件雖然是良性的,可能也不復雜,但卻是動態的,在某種意義上與所尋求的威脅類似。這些必須被建模(從數據中)和抑制(由多目標追蹤器)。
3.數據融合中的身份不確定性。當數據要從多個來源融合時,當這些數據指的是多個真相對象時,一個關鍵的問題是要確定一個傳感器的哪些數據與另一個傳感器的哪些數據相匹配:"數據關聯 "問題。實際上,這種融合的手段--甚至關聯過程的好方法--都是相當知名的。缺少的是對所做關聯的質量的理解。我們試圖提供這一點,并且我們打算探索傳感器偏差和定位的影響。
4.具有極端通信約束的傳感器網絡。考慮由位置未知、位置受漂移和擴散影響的傳感器網絡進行推理--一個泊松場。此外,假設在這樣的網絡中,傳感器雖然知道自己的身份和其他相關的數據,但為了保護帶寬,選擇不向融合中心傳輸這些數據。可以做什么?又會失去什么?我們研究這些問題,以及評估身份與觀察的作用(在信息論意義上)。也就是說,假設對兩個帶寬相等的網絡進行比較;一個有n個傳感器,只傳輸觀察;另一個有n/2個傳感器,同時傳輸數據和身份。哪一個更合適,什么時候更合適?
5.追蹤COVID-19的流行病狀況。誠然,流行病學并不在擬議研究的直接范圍內,但考慮到所代表的技能以及在目前的健康緊急情況下對這些技能的迫切需要,投機取巧似乎是合理的。通過美國和意大利研究人員組成的聯合小組,我們已經證明,我們可以從當局提供的每日--可能是不確定的--公開信息中可靠地估計和預測感染的演變,例如,每日感染者和康復者的數量。當應用于意大利倫巴第地區和美國的真實數據時,所提出的方法能夠估計感染和恢復參數,并能很準確地跟蹤和預測流行病學曲線。我們目前正在將我們的方法擴展到數據分割、變化檢測(如感染人數的增加/減少)和區域聚類。
城市環境的特點,如規模、密度和復雜性,可能使美國陸軍相對于對手的國家或非國家行為者處于不利地位。由于作戰環境的獨特考慮,一個軍團塑造深度戰斗的能力可能會被削弱。如果是這樣的話,軍隊為大規模作戰行動做準備的要求表明,理論中現有的戰術框架可能不足以讓軍團在可接受的后果下滿足未來城市作戰的要求。
本研究使用兩個歷史案例研究了軍團規劃者在城市環境中的作戰藝術應用。盡管大多數文獻都認為在城市中作戰是不可取的,但人口、環境和地緣政治趨勢表明,軍團規劃人員必須擁有必要的認知工具來為指揮官準備城市環境中的選擇。對1989年奪取巴拿馬城的戰役(Just Cause行動)進行有組織的、有重點的比較表明,作戰藝術的要素仍然適用于軍團一級的城市作戰。規劃者仍然必須考慮作戰環境的獨特特點,就像任何作戰地區一樣,以使下屬各師取得成功。
認知方法在幾乎所有方面可提高現有雷達的性能,這導致了近年來研究的激增,空軍雷達建模和仿真(M&S)工具的一個關鍵差距是缺乏針對分布式全適應雷達(FAR)系統的全面、動態分布式雷達情景生成能力。截至2015年初,所有的研究都是在理論上推進概念,并通過模擬檢驗其性能,或者最多使用預先錄制的數據。沒有關于實驗驗證概念的報告,主要是因為還沒有開發出測試它們的必要硬件。然而,為了確定應用認知處理方法的真正性能潛力,這一步驟是至關重要的。為了解決這個問題,俄亥俄州立大學(OSU)電子科學實驗室(ESL)的認知傳感實驗室(CSL)與Metron公司、空軍研究實驗室(AFRL)和空軍科學研究辦公室(AFOSR)一起,已經開始了一項研究計劃,從分析和實驗上開發和檢驗認知雷達處理概念。
CSL設計并建造了認知雷達工程工作區(CREW),這是世界上第一個專門用來測試完全自適應和認知算法的雷達測試平臺,Metron和OSU開發了一個認知FAR系統的理論框架,在單一傳感器和目標的目標探測和跟蹤范圍內確定了關鍵的系統組件并進行了數學建模。我們一直在開發建模、模擬、分析和實驗能力,以證明FAR系統比傳統的前饋雷達(FFR)系統取得的性能改進。我們從OSU的軟件定義雷達(SDR)系統的模擬場景和預先記錄的數據開始。我們現在有能力利用CREW演示認知雷達跟蹤系統的實時操作。
這個項目的目標是為分布式FAR雷達開發一個基于MATLAB的M&S架構,從而能夠在模擬的、以前收集的和實時的流式數據上進行算法開發和測試。在第一階段,我們開發了一個基線FAR M&S架構,該架構采用面向對象編程(OOP)方法在MATLAB中編碼。它包括一個控制感知-行動(PA)周期運行的FAR引擎和確定下一組傳感參數的軟件對象;從傳感器獲取數據;處理數據以跟蹤目標;存儲和顯示傳感和跟蹤過程的結果。我們開發的模塊實現了模擬和預先錄制的SDR數據實例,以及實時和模擬的CREW數據實例。
第一階段開發的FAR M&S架構允許在模擬和實驗CREW數據源之間,以及在驅動傳感的FAR算法之間進行透明切換。輕松交換傳感和處理對象的能力將允許快速開發和測試認知雷達算法,通過構建M&S功能來避免重復工作和 "單點 "解決方案。它將使工業界、學術界和空軍的研究人員之間的合作成為可能,因為不同研究人員開發的算法可以使用一致的模擬、收集的數據和實驗室條件進行測試和比較。
美國缺乏一套專門的人工智能(AI)戰爭的理論。這導致了在戰爭的作戰層面上缺乏對人工智能影響的討論。人工智能的定義通常采用技術視角,不考慮對作戰藝術的影響。提議的作戰藝術的新要素 "抓手(Grip)"解釋了人工智能和人類在兩個方面的基本關系:自主性和角色交換。“抓手”為人工智能戰爭的理論奠定了基礎,除了揭示改變任務指揮理論的必要性外,還提出了作戰的假設。美國空軍陸戰隊的發展以及由此產生的戰爭作戰水平(和作戰藝術)在歷史上有類似的案例,說明關鍵假設如何影響戰場的可視化。去除“人在回路中”的人工智能戰爭的假設,揭示了需要一種新的作戰藝術元素來安排部隊的時間、空間和目的,此外,美國陸軍任務指揮理論需要調整,以使指揮官能夠在各種形式的控制之間移動。
“機器人和人工智能可以從根本上改變戰爭的性質......誰先到達那里,誰就能主宰戰場。”- 美國陸軍部長馬克-埃斯佩爾博士,2018年
預計人工智能(AI)將極大地改變21世紀的戰爭特征。人工智能的潛在應用只受到想象力和公共政策的限制。人工智能擁有縮短決策周期的潛力,超過了人類的理論極限。人工智能也有望執行人類、機器和混合編隊的指揮和控制功能。人工智能在自主武器系統(AWS)中的潛力同樣是無限的:分布式制造、蜂群和小型化的先進傳感器為未來的指揮官創造了大量的配置變化。與圍繞人工智能的技術、倫理和概念問題相關的無數問題,為如何將這項技術整合到戰爭的戰術層面上蒙上了陰影。現代軍隊幾個世紀以來一直在為正確整合進化(和革命)的技術進步而奮斗。美國內戰期間的鐵路技術對 "鐵路頭 "軍隊和格蘭特將軍在維克斯堡戰役中的勝利都有貢獻。25年后,法國人忽視了普魯士的鐵路試驗,給第三帝國帶來了危險,同時也沒能把握住小口徑步槍的優勢。卡爾-馮-克勞塞維茨在《論戰爭》中指出,每個時代都有自己的戰爭和先入為主的觀念。本專著將探討當前的先入為主的觀念和人工智能在戰爭的操作層面的出現。
對作戰層面的討論側重于作戰藝術,以及指揮官和他們的參謀人員如何通過整合目的、方式和手段,以及在時間、空間和目的上安排部隊來發展戰役。在作戰藝術中缺乏以人工智能為主題的討論,增加了不適當地部署裝備和以不充分的理論進行戰斗的風險;實質上是在邦聯的火車上與追兵作戰。美國的政策文件和技術路線圖主要集中在能力發展和道德影響上,而沒有描述一個有凝聚力的人工智能戰爭的理論。但美國和中國在自主行動方面的實驗趨于一致;這引起了沖突的可能性,其特點是越來越多的被授權的人工智能和AWS沒有得到實際理論框架的支持。這個問題導致了幾個問題。美國軍隊的人工智能戰爭理論是什么?大國競爭者的人工智能戰爭理論是什么?有哪些關于顛覆性技術的歷史案例?理論應該如何改變以解釋顛覆性技術?
本專著旨在回答上述問題。它還提出了兩個概念,以使指揮官能夠在戰場上可視化和運用人工智能;一個被暫時稱為 "抓手"的作戰藝術的新元素和一個任務指揮理論的延伸。該論點將分三個主要部分進行闡述。第一節(理論)將證明人工智能需要一個認知工具來在時間、空間和目的上安排部隊,方法是:綜合美國的人工智能戰爭理論,描述中國的人工智能戰爭理論,以及揭示當前文獻中的“抓手”理論。第二節(歷史)是對1973年為應對技術轉變而從主動防御演變而來的空地戰(ALB)的案例研究。第二節將重點討論戰場維度的思想、任務指揮理論的演變以及相關的作戰藝術的正式出現。第三節(新興理論)提出了作戰藝術的新要素,作為一種認知工具,幫助指揮官和參謀部將21世紀的戰場可視化。第三節將把以前的章節整合成一個有凝聚力的模型,讓指揮官和參謀部在時間、空間和目的方面可視化他們與AI和AWS的關系。第三節還將提供一個任務指揮理論的建議擴展,以說明人機互動的情況。
人工智能的復雜性導致了正式的戰爭理論的缺乏;然而,在美國的政策和發展文件中存在著一個初步的美國人工智能戰爭理論。人工智能戰爭理論必須解釋人類和人工智能之間的關系,這樣才能完整。通過作戰藝術和任務指揮的視角來看待人工智能,揭示了自主性和角色互換的兩個頻譜,通過不同的組合創造了人工智能戰爭理論的維度。這些維度,或者說掌握的形式,代表了作戰藝術的一個新元素。同樣,需要將任務指揮理論擴展到一個過程-產出模型中,以實現掌握形式之間的移動。
綜合美國目前的人工智能政策和AWS的發展路線圖,提供了一幅戰略領導人如何看待人工智能的圖景,允許發展一個暫定的戰爭理論。由于缺乏關于武器化人工智能的歷史數據,政策和發展路線圖是必需的,因此本專著中提出的理論是由提煉出來的概念產生的。由于中國的工業和技術基礎的規模,中國被選為對抗模式,預計在10到15年內,中國將超越俄羅斯成為美國最大的戰略競爭對手。
圖文并茂的案例研究方法將被用來分析主動防御和空地戰之間的過渡。該案例研究將整合技術、政策和戰爭理論,以喚起人們對多域作戰(MDO)和人工智能在21世紀戰爭中作用的疑問。第二節的批判性分析側重于理論的發展,而不是其應用。第二節的詳細程度是有限制的,因為它仍然是一個更大(和有限)整體的一部分,因此重點應繼續揭示戰場可視化和認知輔助工具之間的聯系。第三節通過作戰藝術的新元素和任務指揮理論的調整來回答每一節中發現的問題,從而將前幾節連接起來。人工智能缺乏歷史,考慮到人們不能直接分析以前的沖突,以獲得教訓或原則。在這種情況下,任務指揮理論提供了一種間接的方法來理解使人類能夠集中式和分布式指揮和控制功能的機制,以及為什么人工智能缺乏相應的機制會抑制我們感知機會的能力。第三節將把美國現行政策和路線圖中的幾個抓手成分匯總到任務指揮理論提供的框架中。
本專著存在于美國陸軍多域作戰概念的框架內,其理解是解決方案是聯合性質的,因為 "陸軍不能單獨解決問題,概念發展必須在整個聯合部隊中保持一致,清晰的語言很重要。"本專著不能被理解為對MDO中提出的問題的單一解決方案,而是一種幫助實現戰斗力聚合的方法。
關于人工智能的討論充滿了倫理、法律和道德方面的考慮,本專著不會涉及這些方面。本專論的假設是,人工智能的軍事用途在政治上仍然是可行的,而且 "戰略前提 "允許該技術的軍事應用走向成熟。由于運用的變化幾乎是無限的,人工智能的戰術實施將不會被詳細討論,而重點是在作戰層面上的概念整合。一般能力將被限制在與作戰藝術和作戰過程有關的具體趨勢上。
網絡空間行動的早期成功為壓制對手提供了新途徑可能性。隨著美國陸軍開始向多域作戰過渡,他們依賴網絡空間并支持其他領域的行動。一個問題出現了:"軍隊如何將網絡空間行動納入支持其他領域的行動?" 對于如何將網絡行動納入其他領域的行動,目前還沒有有證據支持的實際規劃原則。基于最初的研究,產生了一個假設,即支持戰爭作戰層面的網絡空間行動與物理領域和虛擬信息領域的行動同步。利用美國軍方對作戰層面和作戰領域的公認定義,分析了作戰層面活動的案例研究。通過收集每個案例的以下信息,對盟軍行動以及以色列-哈馬斯沖突進行了分析:戰略背景、網絡空間行為者、網絡空間行動以及網絡空間行動如何支持其他領域的行動。分析的結果是,戰爭行動層面的網絡空間行動通過收集對手的情報來支持其他領域的行動;拒絕或破壞虛擬信息領域的傳遞途徑;以及影響在物理領域的實體。
1806年10月,法軍在耶拿-奧爾斯塔特戰役中迅速擊敗了普魯士軍隊。普魯士軍官卡爾-菲利普-戈特弗里德-馮-克勞塞維茨(Carl Philipp Gottfried von Clausewitz)出席了這次戰斗,這次失敗讓他深感不安和困惑。 普魯士軍隊的人數超過了法國軍隊,但是,法國軍隊的戰術優于普魯士過時的線性作戰方式。克勞塞維茨見證了戰爭的未來,并決心將普魯士軍隊發展成為一支再次讓歐洲羨慕的力量。
2014年7月俄烏戰爭期間,在烏克蘭澤勒諾皮亞村附近,烏克蘭陸軍地面部隊的四個旅準備對俄羅斯邊境附近的分離主義分子的部隊發動進攻。2014年7月11日,一場三分鐘的密集炮擊襲擊了烏克蘭四個旅的人員,并摧毀了烏克蘭第79空中機動旅的一個營。對這次攻擊的分析表明,俄羅斯部隊使用無人駕駛飛行器來定位烏克蘭部隊,并將位置提供給間接火力平臺。從識別到效果的時間如此之快,以至于烏克蘭各旅無法采取保護行動。俄烏戰爭中的這一小段時間非常重要,以至于美國陸軍能力整合中心發起了對俄羅斯新一代戰爭研究,以確定俄烏沖突對未來戰爭的影響。
2015年,在美國陸軍戰爭學院的一次演講中,國防部副部長鮑勃-沃克概述了二十一世紀戰爭的問題,并責成美國陸軍開發空地戰2.0。2018年12月,美國陸軍邁出了理論演進的一步,出版了《2028年多域作戰中的美國陸軍》,以解決陸軍如何在多個層次和領域內作戰的問題。
耶拿-阿爾斯泰特戰役和俄烏戰爭雖然相隔幾個世紀,但都顯示了卓越戰術和行動安排的力量。克勞塞維茨和美國陸軍目睹了失敗,并作出了類似的反應,進行了深入的戰斗研究,以改善他們各自的軍隊。這些研究的成果是對未來戰爭行為的指導性文件。
美國陸軍采用多域作戰作為未來的作戰結構,依靠網絡空間作戰來支持其他領域的作戰。然而,關于如何將網絡行動納入其他領域的行動,目前還沒有基于證據的實際規劃原則。軍事規劃者的問題是如何整合網絡空間行動以支持其他領域的行動而不至于遭遇慘敗。該論點認為,網絡空間行動通過收集對手的情報來支持其他領域的行動;拒絕或破壞虛擬信息領域的傳遞途徑;以及影響物理領域的實體。