馬克-D-維爾圖利上校:“所有的戰爭本質上都是關于改變人類的行為,每一方都試圖通過武力來改變對方的行為。成功需要有能力超越對手,利用來自相對優勢地位的機會。最了解作戰環境的一方能更快地學習和適應,并決定在不確定的條件下更快地采取行動,最有可能獲勝。” -陸軍學說參考出版物(ADRP)3-0,作戰
可以說,信息戰(IO)是美國陸軍理論中被誤解和誤用最多的術語之一--以至于它在很大程度上成為一個無處不在的參考術語,對大多數陸軍來說,它的目的和應用不夠明確。確信,如果要求幾位陸軍領導人和士兵用他們自己的話來定義信息戰,人們會得到幾種不同的、往往是相互矛盾的解釋。在25年前,信息戰作為指揮與控制戰爭(C2W)的一個概念出現后,陸軍學說的多次修改導致了這種混亂。僅在過去11年中,信息戰的定義就發生了三次變化:從關注五種核心能力到信息參與(2007年),再到信息和影響活動(2011年),到目前關注信息相關能力的化身(2016年)。隨著陸軍將其理論重點轉移到針對同行和近鄰對手的大規模作戰行動(LSCO),本卷的目的是幫助領導者和士兵通過歷史案例研究的視角,直觀地了解信息戰。
在聯合和陸軍的理論中,信息戰被定義為 "在軍事行動中,綜合運用與信息有關的能力,與其他行動路線配合,影響、破壞、腐蝕或篡奪對手和潛在對手的決策,同時保護自己的決策。 "在更廣泛的意義上,信息戰支持指揮官通過在信息環境(物理、信息和認知層面)中的活動取得相對優勢地位的能力,以影響對手的戰斗意志;干擾、破壞或篡奪其收集、處理和傳播信息的能力;并最終操縱(欺騙)或破壞對手決策者對作戰環境的理解。戰地手冊(FM)3-0《作戰》很好地描述了信息環境中可能的信息相關能力和效果的廣泛范圍。然而,在過去17年的反叛亂和反恐行動過程中,信息戰在許多人心目中已成為主題和信息、心理戰(PSYOP)/軍事信息支持行動(MISO)或戰略通信/通信戰略的同義詞,其更大的目的已經丟失。在大規模作戰行動的歷史案例研究中,有三條經驗交織在一起:(1)重點是信息,而不是為實現信息而采用的能力;(2)成功的信息戰從開始到執行都是一體化的、同步的、有資源的和指揮官領導的行動;(3)信息戰在其核心是以對手/敵人為中心的行動,為友好的決策者獲得相對優勢。
《美國陸軍大規模作戰行動叢書》中這一卷的標題是《感知即現實》。盡管這可能是一個老生常談的短語,但它的含義對LSCO中信息戰的應用具有重大意義。領導人通過信息直觀地認識和了解作戰環境。作為戰斗力的一個要素,信息使決策成為可能,而信息的傳遞有助于決定性的行動。今天,現代技術已經大大增加了信息的速度、數量和獲取途徑。同時,技術已經使破壞、操縱、扭曲和拒絕信息的重要手段成為可能--對手已經表現出愿意使用這種技術,并取得了巨大的效果。
在《黑暗領土》一書中,作者弗雷德-卡普蘭講述了當時的海軍上將邁克-麥康奈爾的一段軼事。在1992年觀看電影《黑客帝國》時,這位情報部門的負責人體會到了 "一切都與信息有關 "的啟示;誰控制了信息,誰就能主宰競爭和沖突。領導人將資源用于情報收集,以發展局勢并獲得及時做出明智決定所需的足夠信息。同樣重要的是,必須采取措施保護友軍的信息,同時在所有領域開發和執行手段,以攻擊對手獲取、處理和傳播信息的能力。通過這種方式,信息戰能夠準確了解作戰環境,同時破壞或操縱對手的作戰環境。通過信息作戰,對手/敵方決策者的現實應該是最能支持實現相對優勢地位的。理論上的定義從相當限制性的五種核心能力(作戰安全、軍事欺騙、心理作戰、電子戰和計算機網絡作戰)轉變為目前以效果為重點的更廣泛的定義,是朝著正確方向邁出的一步。盡管如此,還需要做更多的工作,以充分獲得信息在LSCO背景下作為戰斗力要素的真正潛力。常識告訴我們,如果信息沒有伴隨著行動,那么當兩者同時存在并相互補充時,就不會在認知上產生同樣的共鳴。行動和信息之間的雙重關系必須成為21世紀 "信息時代"行動的一個永恒主題。然而,將信息戰視為機動或行動的助推器的觀念依然存在。
在談到太空沖突的想法時,現任美國戰略司令部指揮官約翰-海滕將軍評論說,沒有太空戰或網絡戰這樣的東西;只有戰爭。同樣,最近與一位高級領導人談話,他說,如果信息戰爭規劃者有自己的方式,一切都將被視為信息戰。把它翻過來。在LSCO期間,在信息環境中的演習和通過信息環境的演習必須得到與歷史上對陸地領域的傳統演習同樣的關注。演習就是演習,無論采用何種形式的演習,都要通過作戰過程來完成。
最近對聯合學說的修改開始考慮到對信息在沖突中的重要性的認識。就在去年,美國防部長和參謀長聯席會議主席批準了一項快速的聯合理論修改,使信息成為一種聯合功能。最近,聯合參謀部發布了一項關于信息環境下行動的指令--這樣的標題是為了強調作為行動的活動,同時避免使用信息行動這一兩極化的術語。這種強調是在觀察到對手在戰場內外有力地揮舞信息以取得決定性的戰術和戰略結果之后作出的。
在伊拉克和阿富汗,塔利班和基地組織對美國及其合作伙伴發動了無數次交戰,與其說是為了在直接的作戰環境中獲得實際效果,不如說是為了在全世界獲得信息優勢。錄像中的簡易爆炸裝置襲擊雖然具有破壞性,但卻很好地提升了組織的可信度,增強了信徒的戰斗意志,使弱勢人群變得激進,并增加了財政支持。對于LSCO來說,更重要的是,俄羅斯在吞并克里米亞和入侵烏克蘭東部之前、期間和之后的信息對抗活動表明了信息環境中綜合行動的力量,在這種情況下,稱之為信息戰更為恰當。俄羅斯成功地播撒了虛假信息,導致國際社會不信任它所收到的信息,同時還通過網絡空間行動、電子戰和心理行動削弱了烏克蘭的反應。俄羅斯信息戰造成的混亂和誤導對西方決策者產生了麻痹作用--以至于俄羅斯能夠在西方領導人能夠做出可信的反應之前實現其戰略和政治目標。
在LSCO的案例研究中,有一個最后的教訓或主題貫穿始終:信息行動的核心是以對手為中心。17年的反叛亂和反恐怖主義行動導致了以民眾為中心的信息戰,同時幾乎完全取代了該理論中的對手指揮和控制要素。直到最近--實際上是由于對手的成功--這種情況才開始改變。統一的陸地行動發生在一個由平民主導的作戰環境中;他們的存在不能被忽視或繞過。然而,首先,必須打敗對手。
戰爭是人類的努力;它是一場意志的較量。在LSCO期間,信息戰的重點必須是擊敗對手的意志。這可以直接完成,如在沙漠風暴行動中,聯合轟炸和心理戰使數以千計的伊拉克軍隊感到沮喪,導致他們投降。或者更間接地,在"伊拉克自由行動 "中,美國和盟軍運用欺騙、電子戰、物理破壞和網絡空間行動擾亂了伊拉克的指揮和控制,導致伊拉克領導人絕對缺乏對局勢的了解,無法協調防御。正如導言開頭的那段話所說。"最了解作戰環境的一方在不確定的條件下學習和適應得更快,并決定更迅速地采取行動,最有可能獲勝"。
《感知即現實》由11章組成。前10章探討了LSCO期間信息戰的歷史案例研究,而最后一章則考慮了信息戰對LSCO的未來影響。雖然在案例研究中探討了許多與信息有關的能力,但這些案例絕沒有提出明確的說法。出于安全和保密的考慮,一些技術性較強或敏感的能力沒有像我希望的那樣得到深入的處理。這些案例研究涵蓋了從二戰到最近的格魯吉亞和烏克蘭沖突的LSCO。雖然美國在大多數案例研究中表現突出,但也探討了其他國家在信息環境中的行動,特別是俄羅斯聯邦的行動。
在 "大規模作戰行動中的信息作戰邏輯 "中,克里斯托弗-羅威探討了美國陸軍信息作戰理論的演變,從其指揮和控制戰爭的根源到今天普遍認為信息作戰是影響平民的一種手段。羅威上校將美國信息作戰的起源歸結為冷戰時期蘇聯無線電電子作戰理論的發展。美國認識到,它需要類似的理論、組織、訓練、物資、領導、人員和設施(DOTMLPF)解決方案來對抗蘇聯的發展,以及通過信息在現代戰場上占據主導地位的偏離戰略。在幾年的維和、反叛亂和反恐行動中,陸軍將重點從強調指揮和控制轉移到更加以人口為中心的 "人心 "方法。第2章繼續沿用類似的敘述方式。
羅威探討了信息交流的過去,而賈斯汀-戈爾科夫斯基則在《大規模作戰行動中的美國信息戰》中反思了陸軍信息交流的現狀。對未來部隊的挑戰和影響"。在他的章節中,戈爾科夫斯基少校詳細介紹了陸軍信息作戰在理論、組織和領導方面的內部結構性挑戰,并與對手在與美國的競爭中使用信息戰方面的進展相比較。雖然戈爾科夫斯基少校的評估并不積極,但對未來也并非沒有希望。他在這一章的最后提出了一些解決不平衡問題的建議。
第3章對俄羅斯信息戰進行了更深入的分析。美國軍事學院教授Lionel Beehner、Liam Collins上校和Robert Person結合第一手資料和二手研究,探討了俄羅斯系統性地使用信息戰的近期歷史案例--重點是其軍事理論的演變,從2008年的俄羅斯-格魯吉亞戰爭到目前俄羅斯支持的烏克蘭頓巴斯地區的戰役。對俄羅斯信息對抗戰略的這一審視為未來的大規模作戰行動和在信息環境中整合行動以實現戰略效果提供了鮮明的教訓。
邁克爾-泰勒采取了從失敗和成功中都能學到很多東西的方法,分析了二戰中一個不太為人所知的盟軍欺騙行動。在"斯塔基行動",泰勒探討了該欺騙計劃未能使德國領導人相信盟軍在1943年的入侵意圖的原因,以便將德國軍隊留在西部,從而減輕對東部盟軍俄羅斯軍隊的壓力。在下一章中,布蘭登-萊利、邁克爾-基欽斯和馬修-揚杜拉利用1948年的阿以戰爭,闡明了交戰方及其支持者如何將信息磨練成武器,以便在大規模作戰行動中實現預期的軍事、政治和社會結果。在這場戰爭中,在信息環境中運用戰略主敘事來指導作戰和戰術演習被證明是決定性的。
在第6章中,安德魯-惠斯凱曼(Andrew Whiskeyman)重點介紹了越南戰爭期間心理戰(PSYOP)的使用。在簡要探討了越南軍事援助司令部(MACV)的理論、領導、情報和組織基礎之后,惠斯凱曼詳細介紹了在戰爭中最大的地面(雪松瀑布行動)和空降(交界城行動)中心理戰的運用。雖然PSYOP在這些行動中取得了一些成功,但重大的挑戰阻礙了廣泛的支持和行動整合。其中許多挑戰今天仍然存在。
談到最近的行動,接下來的兩章研究了沙漠風暴行動和伊拉克自由行動中的信息交流。首先,羅伯特-希爾更新了多蘿西-丹寧1992年出版的《信息戰與安全》一書的第一章。希爾增加了一種現代方法,并通過在丹寧探索被認為是第一場真正的信息戰爭的文本中使用編輯評論,使信息與當今的作戰環境相關。沙漠風暴。在接下來的章節中,卡明-西卡萊斯提供了本卷中唯一的第一手資料。從2002年4月到7月,作為聯合部隊陸地部分指揮官(CFLCC)的IO規劃者,當時的Cicalese少校在設計信息行動以支持CFLCC的行動意圖方面發揮了重要作用。這一章提供了有關在最高行動級別的LSCO中規劃和執行信息行動的巨大洞察力和經驗教訓。
最后兩個歷史案例研究探討了最近東歐沖突中的網絡空間作戰的要素。本卷第3章從戰略角度研究了俄羅斯聯邦的信息戰,而韋斯利-懷特則記錄了俄羅斯在格魯吉亞、愛沙尼亞和烏克蘭的網絡空間效應的行動和戰術整合。懷特認為,這些沖突是俄軍將網絡空間行動完全融入多領域戰斗的試驗臺--網絡坩堝。在第10章中,Rick Galeano中校、Katrin Galeano、Samer Al-Khateeb、Nitin Agarwal和James Turner中校專注于社會僵尸網絡在支持軍事行動中的應用。通過對烏克蘭和波羅的海地區的僵尸網絡使用情況的詳細分析,他們認為社會僵尸網絡可以被用來促進敘事,改變對觀點流行度的看法,并最終引發支持軍事最終狀態的行為。
本卷最后對未來進行了展望。在最后一章中,詹姆斯-明格斯少將和克里斯托弗-賴查特上校探討了未來信息環境對競爭和沖突期間軍事行動范圍的影響。他們提出了幾個重要的建議,涉及陸軍訓練、組織、理論和領導力等要素,以使指揮官具備信息能力和能力,在未來的作戰環境中獲得并保持相對優勢地位。
本卷的目的是通過探討過去的作戰行動,認識和理解成功和失敗,并從每個作者的角度提供一些經驗教訓,從而運用歷史來激發對未來LSCO中的信息交流影響的討論和分析。
"戰術包括三個相互關聯的方面:完成任務的創新和靈活的手段,在面對有思想和適應性強的敵人時,在不確定的條件下進行決策,以及了解戰斗對士兵的影響。” - 美國陸軍理論出版物(ADP)3-90《進攻與防御》。
《戰術藝術》是陸軍戰術部(DTAC)的一個系列,專注于旅級到軍團級的作戰。本書的讀者是規劃和執行地面作戰行動的戰地級軍官。這本《戰術藝術》第一卷的標題是《大規模作戰行動:師級作戰》。各個章節由DTAC的教員撰寫,然后由戰術系內部或外部的主題專家進行同行評審。未來的章節將有不同的主題,但都將以聯合武器作戰為基礎。
在過去的20年里,對手密切關注著美國陸軍從關注常規的聯合武器機動訓練轉向執行穩定和反叛亂(COIN)行動,主要是在美國中央司令部(CENTCOM)的行動區域。當美國陸軍正在適應這種作戰環境時,對手進行了研究了,并發展了對抗美國認為理所當然的常規作戰優勢能力。美國陸軍決定,為了應對新出現的威脅,它需要一個更新的作戰理論,利用現有的技術、部隊結構和能力。
2017年10月,美國陸軍出版了其頂點理論手冊的新版本,即《作戰手冊》(FM)3-0。這一新理論將作戰重點回歸到針對同行威脅的大規模作戰行動(LSCO),并在作戰框架中增加了鞏固區。隨著這一新理論的出現,需要將陸軍的文化從對穩定和反叛亂行動的關注轉移到重新學習進行LSCO所需的技能上。在整個陸軍中灌輸這種變化的需要造就了像本書這樣的專業著作。
本書有幾個目的。首先,它將有助于向目標受眾介紹從穩定行動到LSCO的過渡。第二,它將幫助讀者了解該師在擴展的戰場上與同行威脅的斗爭。第三,它將促進和支持陸軍戰術部(DTAC)教員的專業發展。
本簡編分為十八個獨立的章節。每一章由不同的作者撰寫,風格和重點各不相同。有的使用歷史小故事來更好地理解讀者,有的則使用圖形或引文;所有的內容都集中在師在大規模作戰行動中如何作戰。
第1章 "師建制的演變"討論了師部在大規模作戰行動中作為戰術總部的主要作用,以及師如何為下屬各旅制定行動,為各旅執行任務提供資源,并在時間、空間和目的方面對行動進行協調、同步和排序。
第2章,"大規模作戰行動:重新學習一個舊概念",描述了有限應急行動和大規模作戰行動之間的特征差異,并研究了一個歷史案例,其中大規模作戰行動的特征表現出來。
第3章 "安全區行動"討論了與大規模作戰行動有關的安全區行動,并提出了潛在的近期和遠期解決方案,以應對在這一有爭議地區的威脅力量。
第4章,"行動框架:啟用節奏和決策",描述了師長如何使用作戰框架來劃分責任區,以及解釋不同活動的目的、資源分配,以及在時間、空間和目的上會發生什么活動。
第5章,"師部鞏固戰果",重點介紹了當前陸軍師在大規模作戰行動后鞏固戰果的理論,以及利用支援區指揮所作為一種手段,將各種必要的戰術任務同步化,以協助師部鞏固戰果。
第6章,"師級情報:深入觀察以贏得近距離",闡述了對師和師長的情報支持的背景和觀點。它討論了情報部門在復興師部中的作用,作為理解情報部門如何支持師長和下屬旅戰斗隊的起點。
第7章,"師級大規模作戰行動中的火力支援:將重點從以反叛亂為中心的火力轉移",分析了當前美國陸軍野戰炮兵的結構、理論、訓練和人員配置。它比較和對比了1942年的戰斗和現在的相似之處,特別關注大規模作戰行動中師級行動的火力作戰功能。
第8章,"師級的信息作戰",根據新版FM3-0定義的統一陸軍作戰概念討論了信息作戰的開展,特別關注了師級梯隊。它討論了師作為最低的戰術梯隊,擁有足夠強大的人員和部隊結構來運用信息作戰的所有方面。
第9章,"美國陸軍航空兵--在大規模作戰行動中設置條件和創造效果",討論了陸軍航空兵作為聯合軍種機動的重要組成部分,必須了解如何在大規模作戰行動中應用、整合和同步陸軍航空兵的能力。它解釋了向FM3-0《作戰》的過渡如何必須在陸軍指揮旅的決定性行動的主要戰術總部--師中最普遍地進行。
第10章,“大規模作戰行動的回歸:渡河行動”,根據新的 FM 3-0《作戰》和對大規模作戰行動的關注,重新審視了執行渡河任務的持久任務要求的理論。以二戰為例,它討論了為領導者準備執行這項艱巨任務的培訓。
第11章,"工兵對大規模防御行動的支持",通過對FM3-0《作戰》中最新理論的研究和歷史實例的使用,解釋了工兵組織的獨特能力如何支持大規模作戰行動的防御行動。
第12章,"進攻中的機動作戰",通過使用一個歷史小故事來研究FM3-0《作戰》中的新理論。本章討論了進攻中的機動性行動,并提供了指揮官和參謀人員在規劃和執行這些行動時在師及以上級別的考慮。
第13章,"過渡:適應師級大規模作戰中的變化",重點討論了與開展大規模作戰行動的師有關的變化。它既研究了從進攻性作戰行動向防御性作戰行動的過渡,也研究了從防御性作戰行動向進攻性作戰行動的過渡。
第14章,"與死神共存:大規模戰斗中的傷亡和后果",承認不可避免地有可能發生大量的傷亡和難以想象的不舒服的后果,特別是在大規模戰斗行動的高強度混亂中。在為戰爭做準備時,我們有明確的義務為最壞的情況做準備。
第15章,"控制混亂:反思任務指揮",是關于在大規模作戰行動中指揮師和軍團。其目的是幫助指揮官和參謀人員思考如何指揮和控制這些編隊與有能力的近似競爭對手作戰。
第16章 "任務指揮與師團作戰 "討論了任務指揮的理念及其在大規模作戰行動中的作用。本章的第一部分探討了任務指揮。第二部分提供了對任務指揮如何被納入大規模作戰行動的理解,同時研究了主動性的理念。
第17章,"大規模作戰行動中的互操作性",用當前的理論術語描述了互操作性,闡明了互操作性的摩擦點,然后簡要地討論了互操作性的層次。讀者將了解到陸軍作為聯合部隊的一部分,是如何對待互操作性的。
第18章,"城市地形中的師級戰斗",解釋了在城市環境中進行大規模作戰行動的師如何履行與在任何其他地形中執行的師相同的職能。然而,這些功能的不同取決于三個變量:城市地形的尺寸、城市地形的密度以及城市地形的高階效應。
斯考克羅夫特戰略與安全中心致力于制定可持續的、無黨派的戰略,以應對美國及其盟友和伙伴面臨的最重要的安全挑戰。該中心支持美國在與盟國、伙伴的合作中發揮領導作用,以及對培養下一代領導人提供指導。
在過去的幾年里,世界各地的軍隊對發展人工智能(AI)的興趣和投資有所增加,以支持一系列多樣化的國防和國家安全目標。然而,對于什么是人工智能,它如何影響美國和中國之間的戰略競爭,以及如何為這個部署軍事人工智能的新時代優化國防工業基礎,仍然缺乏普遍的理解。現在已經到了在人工智能方面見仁見智的時候了,在政策界和技術界之間建立對現代人工智能的共同理解,并在國防部(DoD)和其工業伙伴之間統一觀點和優先事項。因此,本文討論了以下核心問題。
人工智能的能力有可能為美國國家安全和國防帶來改變游戲規則的優勢,包括
對人工智能作為威懾和贏得未來戰斗所必需的關鍵能力,在美國防部內部得到了重視,美國防部在過去五年里對人工智能進行了顯著的投資。但是,五角大樓以外的政策制定者,以及公眾和正在開發人工智能技術的公司,都需要更好地了解當今人工智能的能力和局限性,并清楚地認識到人工智能對國家安全的積極影響和潛在的破壞性影響。
五角大樓對人工智能的興趣也必須從與中國--以及在較小程度上與俄羅斯--的戰略競爭加劇的角度來看待,人們越來越理解在人工智能和相關新興技術方面的落后可能會損害美國軍隊自冷戰結束以來所保持的戰略、技術和行動優勢。一些國防領導人甚至認為,美國已經在軍事技術競爭中輸給了中國。
雖然本文不贊同這種宿命論的觀點,但本文認為軍事人工智能競爭的賭注很大,而且時間很短。
五角大樓臭名昭著的官僚主義、陳舊的采購和合同制度以及規避風險的組織文化,繼續抑制著美國防部引進外部創新和更快地走向廣泛的人工智能整合和采用的能力。解決這種系統性問題是一個很高的要求。但是,為促進美國防部與商業技術部門和創新初創企業的接觸,已經在進行重要的變革,而且似乎有一種共同的緊迫感,即鞏固這些公私伙伴關系,以確保美國持續的技術和軍事優勢。然而,在統一美國防部及其行業伙伴對人工智能發展最具影響力領域的看法,以及闡明和實施共同的技術標準和測試機制以實現可信賴和負責任的人工智能方面,仍有許多工作要做。
國防部必須迅速行動起來,從對人工智能重要性的廣泛認可過渡到創建路徑、流程、實踐和原則,以加速采用人工智能技術所帶來的能力。如果沒有有意的、協調的和立即的行動,美國有可能在利用主導未來動能和非動能戰場的制勝技術方面落后于競爭對手。本報告為美國防部確定了三個行動方案,這些方案可以幫助確保美國軍隊保持其在人工智能領域的全球領先地位,促進更迅速地采用人工智能所需的內部變革,并利用充滿活力和多樣化的美國創新生態系統,包括
本報告是在美國防部采用人工智能努力過程中和全球地緣政治的未來軌跡方面既合適又充滿不確定性的時候發表的。正在進行的烏克蘭沖突使限制獨裁者控制領土、人口、標準和言論的重要性變得非常明顯,而致力于維護長期國際行為規范的聯盟可以在這一努力中發揮作用。因此,作者敦促美國防部在政府層面,并在可能的情況下在工業層面與美國的盟友和可信賴的伙伴進行接觸和整合,以更好地實施本文的三項主要建議。
人工智能為國防政策制定者提供了一個重要的機會。人工智能處理和融合信息的能力,以及將數據提煉為增強決策的能力,可以在一個混亂的、有爭議的環境中撥開 "戰爭的迷霧",在這個環境中,速度是王道。人工智能還可以釋放出新型可損耗和一次性無人系統的可能性,從而增強威懾力。例如,它可以幫助保障美國軍人的生命,為指導沖突地區自主補給卡車的導航軟件提供動力。雖然人類仍然負責對目標做出最終決定,但人工智能算法在幫助情報專業人員識別和追蹤惡意行為者方面正日益發揮作用,目的是 "縮短殺戮鏈,加快決策速度"。
由于美國所處的更廣泛的地緣戰略背景,特別是與中國的戰略競爭,人工智能的發展和整合也勢在必行。中國人民解放軍(PLA)在人工智能方面的預算似乎與美國軍隊相當,而且解放軍正在為同樣廣泛的應用和能力開發人工智能技術,包括訓練和模擬、蜂群自主系統和信息操作,以及其他許多方面,所有這些都可能取代美國的軍事技術優勢。
正如美國國防部長勞埃德-奧斯汀在2021年7月指出的那樣,"中國的領導人已經明確表示,他們打算在2030年之前在人工智能方面成為全球主導。北京已經談及將人工智能用于一系列任務,從監視到網絡攻擊到自主武器"。美國不能落后于中國或其他競爭對手。
為了加快人工智能的采用,五角大樓必須面對它的弊端:一個孤立的官僚機構,它阻礙了有效的數據管理努力,并阻礙了大規模利用美國防部數據所需的技術基礎設施;陳舊的采購和合同流程,抑制了國防部引進外部創新和將成功的人工智能技術原型過渡到生產和部署;以及一種規避風險的文化,與已知的促進創新的開放、實驗和容忍失敗的類型不一致。
目前正在進行一些努力來解決其中的一些問題。直接向美國防部副部長報告的首席數據和人工智能官(CDAO)角色最近被宣布,以合并首席數據官辦公室、聯合人工智能中心(JAIC)和國防數字服務(DDS)。這一重組將美國防部的數據和人工智能工作置于一個屋檐下,以消除重疊的權力,原來的這種權力重疊性使得人工智能項目的規劃和執行變得困難。擴大使用替代性收購方法,像國防創新單位(DIU)和空軍的AFWERX正在彌合與商業技術部門的差距,特別是初創企業和非傳統供應商。盡管如此,一些技術領導人認為這些努力還不夠,警告說 "時間不多了"。
隨著美國國防部轉向大規模采用人工智能,本報告試圖提供有關現代人工智能未解決問題的見解,總結中國、俄羅斯在軍事人工智能發展方面的關鍵進展,并強調整個美國防部一些最引人注目的人工智能使用案例。報告還簡要評估了美國防部與其行業伙伴之間的不協調,這些不協調繼續阻礙五角大樓獲得美國軍隊所需的改變游戲規則的技術,以阻止對手的侵略并主導未來的戰場。
然而,競爭的緊迫性決不能掩蓋對指導美國軍隊進入人工智能時代的道德準則。因此,報告重申,有必要將美國防部的人工智能道德準則有效地轉化為評估可信度的共同技術標準和評估指標,并加強與國防部的行業合作伙伴--特別是初創企業和非傳統供應商在這些關鍵問題上的合作和協調。
在本報告的最后,為政策制定者和整個國家安全生態系統的其他人工智能利益相關者提出了一些考慮。具體而言,敦促美國防部優先考慮安全、可靠、可信和負責任的人工智能開發和部署,調整國防部和行業之間的人工智能發展的關鍵優先事項,以幫助縮小美國防部的人工智能能力差距,并促進領先的國防技術公司和非傳統供應商之間的協調,以加快國防部的人工智能采用進程。
推動美國防部人工智能開發和采用工作的緊迫性在很大程度上源于確保美國及其盟國在軍事技術競爭中超過中國,這種競爭已經主導了兩國之間的關系。俄羅斯的技術能力遠沒有那么發達,但其侵略行為破壞了全球安全,并威脅到美國和北約的利益。
中國已將對人工智能的投資優先用于國防和國家安全,作為其努力成為 "世界級軍隊"的一部分,并在未來的 "智能化"戰爭中獲得優勢--人工智能(與其他新興技術一起)通過 "網絡化、智能化和自主系統和設備 "更完全地融入軍事系統和行動。
雖然中國人工智能相關活動的全部范圍并不廣為人知,但美國安全與新興技術中心(CSET)在2021年10月對343份與人工智能相關的中國軍事合同的審查估計,解放軍 "每年在人工智能相關的系統和設備上花費超過16億美元"。美國國家人工智能安全委員會(NSCAI)的最終報告評估說,"中國的計劃、資源和進展應該引起所有美國人的關注。它在人工智能的許多應用領域處于全球同等水平,而在一些應用領域是人工智能的領導者"。
CSET的審查和其他開源評估顯示,中國的人工智能發展的重點領域,就像美國的一樣廣泛,包括:
這些領域中的每一個進展都對美國在與中國的軍事技術競爭中保持同步的能力構成了挑戰。然而,值得研究的是,中國在兩個領域的進步能力可能對軍事平衡產生特別有力的影響。
(1)整合
首先,人工智能可以通過人為地加強軍事整合和跨域作戰,幫助解放軍彌補作戰準備方面的差距。許多觀察家指出,解放軍缺乏沖突中的作戰經驗是一個關鍵的弱點。盡管從技術角度來看,中國不斷推進的軍事現代化令人印象深刻,但在過去二十年里,解放軍的人員都沒有像美國軍隊那樣在高端沖突中接受過火力考驗。解放軍繼續努力從組織和理論的角度提高其"聯合性",這也是剛剛起步,沒有經過測試。
使用人工智能來提高模擬和兵棋推演的質量、保真度和復雜性,是解放軍糾正這一關切領域的一種方式。新美國安全中心2019年的一份報告指出,"對中國軍事戰略家來說,從AlphaGo的勝利中學到的教訓之一是,人工智能可以在一場可以比作兵棋推演的游戲中創造出優于人類玩家的戰術和策略。"這可以更艱巨地考驗解放軍的決策者,改善指揮決策。事實上,CSET報告發現,在所調查的343份合同中,有百分之六是在模擬和訓練中使用人工智能,包括使用人工智能系統對臺灣突發事件進行戰爭演練。
圖:在美國國防部高級研究計劃局(DAPRA)的AlphaDogfight試驗中,一名作戰的F-16飛行員在虛擬現實模擬器中與Heron系統公司開發的冠軍F-16人工智能代理進行飛行。Heron人工智能代理在連續五場斗狗比賽中擊敗了人類飛行員,結束了試驗。資料來源:DARPA, //www.darpa.mil/news-events/2020-08-26
注重人工智能整合以減少經驗中的感知漏洞也適用于作戰和戰術訓練。2021年7月,中國出版物《環球時報》報道說,解放軍空軍(PLAAF)已經開始在飛行員的空戰訓練中部署人工智能作為模擬對手,以 "磨練他們的決策和戰斗技能,對抗快速計算的計算機"。
除了虛擬模擬,中國還旨在利用人工智能來支持飛行員在真實世界飛機上的訓練。在2020年11月播出的中國中央電視臺(CCTV)節目中,中國L-15教練機的總設計師張弘指出,訓練飛機上的人工智能可以 "識別每個飛行員在飛行中的不同習慣。通過管理它們,我們將讓飛行員更安全地成長,在未來獲得更多的戰斗能力"。
值得注意的是,解放軍空軍2021年7月的人工智能與人類的斗狗類似于美國國防部高級研究計劃局(DARPA)2020年9月的AlphaDogFight挑戰賽,在一系列五次模擬斗狗中,一個人工智能代理擊敗了人類飛行員。 同樣,美國在2021年9月宣布與訓練和模擬公司Red 6簽訂合同,將該公司的機載戰術增強現實系統(ATARS)--該系統允許飛行員駕駛真實世界的飛機,使用增強現實耳機與人工智能生成的虛擬飛機進行訓練--整合到T-38 "塔隆"訓練器中,并計劃最終在第四代飛機上安裝該系統。由于中國軍隊正在利用人工智能來提高戰備水平,美國防部不能落后。
(2)自主性
中國人工智能發展的第二個重點領域是自主系統,特別是蜂群技術,其中幾個系統將獨立運行或相互配合,以混淆和壓倒對手的防衛系統。中國對發展蜂群技術的興趣和能力已經得到了很好的證明,包括2017年6月創紀錄地發射了118架小型無人機組成的互聯蜂群。
據報道,2020年9月,中國電子信息研究院(CAEIT)從一輛改裝的東風猛士輕型戰術車上發射了200枚固定翼CH901徘徊彈藥群。2022年2月在阿布扎比舉行的2022年無人駕駛展的調查顯示,不僅中國的參展陣容強大--中國航空技術進出口總公司(CATIC)和中國北方工業公司(NORINCO)都有大型展館,而且還將重點放在 "協作"行動和智能蜂群。
圖:2月在阿布扎比舉行的UMEX 2022展會上展示的協作式蜂群無人機的一個例子。
對蜂群的興趣并不限于無人駕駛飛行器(UAVs)。據《環球時報》報道,中國也在發展部署自主無機組人員水面飛行器(USVs)群的能力,以"攔截、圍攻和驅逐入侵目標"。 2021年11月,中國公司云洲科技--它在2018年進行了一個由56個USV組成的蜂群的演示--發布了一段視頻,顯示六個USV進行了 "合作對抗",作為將一艘有船員的船只從中國水域移走的一部分。不難想象,這種合作對抗可以如何針對美國或盟國的海軍船只,甚至商業船只進行部署,以發展或維持海上控制。這種能力在灰色地帶的突發事件中尤為強大,在這種情況下,升級的擔憂可能會限制反應的選擇。
在人工智能的投資和能力方面,俄羅斯落后于美國和中國。因烏克蘭戰爭而實施的制裁也可能給俄羅斯的科技部門帶來巨大損失。盡管如此,美國國家決策者不應低估俄羅斯以不對稱的方式使用人工智能技術來破壞美國和北約利益的潛力。俄羅斯國防部有許多自主性和人工智能相關的項目,處于不同的開發和實驗階段,涉及軍事機器人、無人系統、蜂群技術、預警和防空系統、ISR、C2、后勤、電子戰和信息操作。
俄羅斯軍事戰略家認為,在未來的戰場上,更大的自主權和人工智能具有巨大的潛力,可以加快信息處理,增強決策,提高態勢感知,并保障俄羅斯軍事人員的生命安全。自主和人工智能系統的發展和使用也在俄羅斯軍事理論的更廣泛背景下進行討論。其理論重點是利用這些技術來擾亂和破壞對手的指揮和控制系統以及通信能力,并利用非軍事手段在戰爭初期建立信息優勢,從俄羅斯的角度來看,這包括與美國和北約等對手的非軍事沖突時期。
俄羅斯人工智能的發展軌跡是不確定的。但是,由于持續的制裁,俄羅斯很可能會在微電子方面越來越依賴中國,并在與美國的技術競爭中進一步落后。
五角大樓對人工智能的興趣和緊迫性既是由于技術發展的速度加快,也是由于它所能帶來的變革性能力越來越強。事實上,人工智能正準備從根本上改變軍隊思考、準備、執行和維持行動的方式。根據大西洋理事會以前的報告大綱,"五次革命 "框架對人工智能在五個廣泛的能力領域的潛在影響進行了分類,下面的圖3說明了人工智能可以通過不同的方式增強人類的認知和身體能力,融合網絡和系統以獲得最佳效率和性能,并在信息空間中迎來一個網絡沖突和混亂的新時代,以及其他影響。
圖3:跨越未來軍事能力發展的五個廣泛目標的人工智能優先發展項目概述。
邁向完美的態勢感知:感知、處理和認知
即將到來的設計時代:制造、供應鏈和物流
超能力平臺和人員:人機性能增強
連接性、致命性和靈活性:通信、導航、目標定位和打擊
監控、操縱和武器化:網絡和信息作戰
美國防部目前有六百多項與人工智能相關的工作正在進行中,其愿景是將人工智能融入國防部任務的每一個要素--從作戰行動到支持和維持功能,再到支撐龐大的國防部企業的商業運作和流程。美國政府問責局(GAO)2022年2月的一份報告發現,國防部正在追求人工智能的作戰能力,主要集中在"(1)通過情報和監視分析識別目標,(2)向戰場上的作戰人員提供建議(如在哪里移動部隊或哪種武器最適合應對威脅),以及(3)增加無人駕駛系統的自主性。 "國防部的大多數人工智能能力,特別是與作戰有關的努力,仍處于開發階段,尚未與具體的系統接軌或整合。而且,盡管在實驗中取得了明顯的進展,并在作戰行動中部署人工智能能力方面取得了一些經驗,但在廣泛采用方面仍然存在著重大挑戰。
2021年9月,空軍第一任首席軟件官尼古拉-沙伊蘭辭職,以抗議官僚主義和文化挑戰,這些挑戰減緩了技術的采用,阻礙了美國防部以足夠快的速度與中國有效競爭。在沙伊蘭看來,20年后,美國及其盟友 "將沒有機會在一個中國擁有巨大人口優勢的世界中競爭。"后來,他補充說,中國基本上已經贏了,他說,"現在,這已經是一筆交易了。"
沙伊蘭關于美國與中國進行無用競爭的評估肯定不是整個美國防部都認同的,但它反映了許多人認為在該部門規避風險和深思熟慮的文化中缺乏緊迫感。
JAIC的負責人Michael Groen中將同意,"在國防部內部,必須發生文化變革。"然而,他也吹捧了美國的創新能力,并強調建立了一個人工智能加速器,并最終確定了一個聯合共同基金會(JCF),用于人工智能的開發、測試和在國防部各實體之間共享人工智能工具。"支持云的JCF是向前邁出的重要一步,將允許基于共同標準和架構的人工智能開發。這應有助于鼓勵各軍種和國防部各部門之間的共享,并且根據JAIC的說法,確保 "國防部一個人工智能倡議的進展將在整個國防部企業中形成勢頭。"
雖然取得的進展值得贊揚,但仍然存在障礙,這些障礙延緩了人工智能能力的采用,而這種能力對于在不久的將來遏制威脅,以及應對中國在這十年及以后的競爭挑戰至關重要。
下面的三個案例研究提供了美國防部人工智能工作中出現的技術、官僚主義和采用方面的進步的例子。這些案例還強調了阻礙美國在與中國以及在較小程度上與俄羅斯的軍事技術競爭加劇的情況下,充分運用其國家創新生態系統的能力的持久性問題。
圖4:聯合人工智能中心(JAIC)的人工智能采用階段。
五角大樓最重要的現代化優先事項之一是聯合全域指揮與控制(JADC2)計劃,該計劃被描述為 "將所有軍種的傳感器連接到一個單一網絡的概念。"根據美國國會研究服務部的說法,"JADC2打算通過從眾多傳感器收集數據,使用人工智能算法處理數據以識別目標,然后推薦最佳武器(包括動能和非動能武器)來對付目標,使指揮官能夠做出更好的決策。 "如果成功的話,JADC2有可能消除各軍種C2網絡之間的孤島,這些孤島以前減緩了整個部隊的相關信息傳輸。因此,產生更全面的態勢感知,指揮官可以據此做出更好和更快的決定。
2021年12月,有報道稱JADC2跨職能小組(CTF)將成立一個 "AI for C2 "工作組,該工作組將研究如何利用負責任的AI來加強和加速指揮和控制,這加強了負責任的AI對該項目的核心作用。
2022年3月,美國防部發布了其JADC2實施計劃的非保密版本,用參謀長聯席會議主席馬克-米利將軍的話說,此舉代表了實施JADC2 "不可逆轉的勢頭"。
然而,觀察家們強調,在按照保持(或恢復)感知、處理和認知方面的優勢所需的緊迫時間表實施JADC2方面,有幾個持續的挑戰。特別是相對于中國而言。
圖5. JADC2的邏輯圖反映了與國防部JADC2實施計劃相關的復雜性和雄心。資料來源:美國國防部。
數據安全和網絡安全、數據管理和共享問題、與盟友的互操作性以及與軍方網絡整合相關的問題,都被認為是認識到JADC2方法的宏偉前景所面臨的挑戰。一些人還強調,這種包羅萬象的雄心也是一種挑戰。哈德遜研究所的布萊恩-克拉克和丹-帕特認為,"當今威脅的緊迫性和新技術帶來的機遇要求五角大樓領導人將JADC2的重點從美國軍事部門的需求轉向作戰人員的需求。
可以肯定的是,在人工智能開發和整合項目中,不一定要避免宏偉的野心。然而,采用的途徑將需要在難以實現的、官僚主義的、耗時的和昂貴的目標與開發能夠在美國部隊面臨的更直接的威脅時限內提供能力和優勢的系統之間取得平衡。
2021年9月,空軍部長弗蘭克-肯德爾宣布,空軍已經 "首次將人工智能算法部署到實際作戰的殺傷鏈中,這表明部署人工智能的時代確實已經到來。"根據肯德爾的說法,將人工智能納入目標定位過程的目的是 "大大減少人工識別目標的人力密集型任務--縮短殺傷鏈并加快決策速度。" 成功使用人工智能支持目標定位是人工智能發展的一個里程碑,盡管在更全面地采用人工智能的作用方面仍然存在道德、安全和技術挑戰。
例如,2021年美國防部的一項測試強調了人工智能的脆弱性問題。根據Defense One的報道,測試中使用的人工智能目標定位在人工智能不得不從不同角度破譯數據的環境中只有大約25%的時間是準確的,盡管它認為它有90%的時間是準確的,這表明缺乏 "適應一套狹窄的假設之外條件"的能力。"這些結果說明了今天的人工智能技術在安全關鍵環境中的局限性,并加強了在一系列條件下對人工智能進行積極和廣泛的現實世界和數字世界測試和評估的必要性。
人工智能目標定位的道德和安全也可能構成對進一步采用的挑戰,特別是隨著對人工智能算法的信心增加。空軍的行動涉及自動目標識別的輔助作用,協助 "情報專家"--即人類決策者。當然,國防部有一個嚴格的目標定位程序,人工智能的目標定位算法將是其中的一部分,再往前想,自主系統將必須通過這一程序。然而,即使它們是這一程序的一部分,并被設計用來支持人類的決定,高錯誤率加上對人工智能輸出的高度信任,有可能導致不理想或嚴重的結果。
與中國和俄羅斯日益激烈的競爭正在信息和網絡領域上演,對美國安全以及美國經濟、社會和政體具有真實、持久和破壞性的影響。
對于網絡和信息行動來說,人工智能技術和技能是未來進攻和防御行動的核心,突出了人工智能在信息領域的危險性和前景。
人們對智能機器人、合成媒體的威脅越來越關注,例如描述沒有發生過的事件或聲明的逼真視頻或音頻制品,以及能夠創造出令人信服的散文和文本的大型語言模型。雖然虛假信息是一個需要社會和整個政府應對的挑戰,但國防部無疑將在管理和應對這一威脅方面發揮關鍵作用--由于其在美國政治和社會中的突出地位,其職能作用的性質,以及其持續活動的影響。
人工智能在五角大樓和其他美國政府檢測機器人和合成媒體的努力中處于領先地位。例如,DARPA的MediaForensics(MediFor)項目正在使用人工智能算法來 "自動量化圖像或視頻的完整性"。
然而,鑒于合成媒體通過社交媒體的傳播速度,人們對這種檢測的速度表示擔憂。正如聯合參謀部首席信息官丹尼斯-克拉爾中將所觀察到的,"機器和人工智能贏得其中一些信息運動的速度改變了我們的游戲......數字化轉型、預測分析、ML、人工智能,它們正在改變游戲......如果我們不匹配這種速度,我們將使其達到正確的答案,而這種正確的答案將完全不相關。"
正如上面的討論所示,美國防部在成功部署人工智能信息管理和決策支持工具的基礎上,有一系列廣泛的人工智能相關舉措,處于不同的發展和實驗階段。隨著重點轉向整合和擴展,加快這些采用工作對于保持美國在與中國的戰略競爭中的優勢以及有效遏制俄羅斯至關重要。
在這一節中,本文強調了美國防部與其工業伙伴之間關系的一些不協調,這些不協調可能會導致失去創新和有影響力的人工智能項目的機會,擴大使用替代采購方法的積極影響,以及日益緊迫的調整過程和時間表,以確保美國軍隊能夠獲得未來戰爭的高水準技術能力。此外,本節還討論了國防部實施道德人工智能原則的方法,以及與可信和負責任系統的標準和測試有關的問題。
盡管國防部已經發布了一些高級別文件,概述了人工智能發展和部署的優先領域,但市場滿足,甚至理解這些需求的能力還遠遠不夠。最近,IBM對來自全球國防組織的250名技術領導人進行了調查,揭示了國防技術領導人和國防部如何看待人工智能對組織和任務的價值的一些重要差異。例如,只有約三分之一的受訪技術領導人表示,他們認為人工智能對軍事后勤、醫療和健康服務以及信息操作和深層假想有重大的潛在價值。當被問及人工智能支持的解決方案對商業和其他非戰斗應用的潛在價值時,不到三分之一的人提到了維護、采購和人力資源。
這些觀點與國防部在人工智能方面的目標有些不一致。例如,包括設備維護和采購在內的軍事后勤和維持職能是國防部實施人工智能的首要任務之一。Leidos與退伍軍人事務部的合作也說明了人工智能在醫療和健康服務方面的潛力。最后,隨著人工智能在虛假信息運動中的使用已經開始,正如上一節的討論所強調的那樣,迫切需要開發技術措施和人工智能支持的工具,以檢測和反擊人工智能驅動的信息行動。
國防部及其行業伙伴基于各自的問題集和任務,有不同的優先事項和激勵措施。但是,對人工智能發展的有價值和關鍵領域的不同觀點可能會導致失去有影響力的人工智能項目的機會。也就是說,即使五角大樓和它的工業伙伴在人工智能方面意見一致,有效的合作也常常被一個笨拙的官僚機構所阻撓,這個機構常常被傳統的流程、結構和文化束縛。
國防部的預算規劃、采購、收購和簽約流程,總的來說,不是為購買軟件而設計的。這些 這些體制上的障礙,再加上復雜而冗長的軟件開發和合規條例,對小型初創企業和非傳統供應商來說尤其困難,因為他們缺乏資源、人員和事先的知識,無法像國防部的主要部門那樣駕馭這個系統。
國防部清楚地意識到這些挑戰。自2015年以來,國防部長辦公室和各軍種已經建立了幾個實體,如DIU、AFWERX、NavalX和陸軍應用實驗室,與商業技術部門,特別是初創企業和非傳統供應商對接,目的是加速提供同類最佳的技術解決方案。同時,國防部還采取了其他值得注意的措施,以促進使用替代性的采購和合同,這為構建和執行協議提供了比傳統采購更大的靈活性。這些包括 "其他交易授權、中間層采購、快速原型設計和快速投入使用以及軟件采購的專門途徑"。
DIU一直處于使用其中一些替代性采購途徑的前沿,從商業技術部門采購人工智能解決方案。空軍的AFWERX還與空軍研究實驗室和國家安全創新網絡合作,創新地利用小企業創新研究(SBIR)和小企業技術轉讓(STTR)資金,以 "提高項目的效率、有效性和過渡率"。例如,在2021年6月,美國空軍SBIR/STTR人工智能投標日向關于 "可信人工智能,這表明系統是安全、可靠、強大、有能力和有效的 "主題的提案提供了超過1800萬美元。
這些都是朝著正確的方向邁出的步伐,而且確實變得更容易獲得國防部的研究、開發和原型制作資金。然而,及時獲得生產資金仍然是一個重大挑戰。這個 "死亡之谷 "的問題--研究和開發階段與一個既定的、有資金記錄的項目之間的差距--對于非傳統的國防公司尤其嚴重,因為風險資本對初創企業的資助周期與將一個項目納入國防部預算所需的時間之間存在差異。
五角大樓明白,彌合 "死亡之谷 "對于推進和擴大創新至關重要,并在最近啟動了快速國防實驗儲備,以處理這些問題。然而,使預算規劃、采購和簽約流程與私人資本的步伐相一致所需的系統性變化,需要國會采取行動,并可能需要數年時間來實施。在實施這些改革方面的延誤正在損害國防部獲得尖端技術的能力,而這些技術在未來的戰場上可能是至關重要的。
確保美國軍隊能夠使用安全可信的人工智能和自主系統,并按照國際人道主義法律使用這些系統,將有助于美國保持其競爭優勢,以對抗俄羅斯等對人工智能的道德使用承諾較少的專制國家。強調值得信賴的人工智能也是至關重要的,因為國防部的大多數人工智能項目都需要人機合作和協作的元素,它們的成功實施在很大程度上取決于操作者對系統的足夠信任和使用。最后,國防部和行業伙伴之間就可信和負責任的人工智能的共享標準和測試要求進行更密切的協調,對于推進國防部人工智能的采用至關重要。
除了國防部現有的武器審查和目標程序,包括自主武器系統的協議,該部門還在尋求解決倫理、法律和政策的模糊性,以及人工智能更具體的風險。2020年2月,五角大樓通過了五項道德原則來指導人工智能的發展和使用,呼吁人工智能是負責任的、公平的、可追溯的、可靠的和可治理的。為了將這些原則付諸實踐,國防部副部長凱瑟琳-希克斯發布了一份備忘錄,指示采取一種 "整體的、綜合的和有原則的方法 "來整合負責任的人工智能(RAI),包括六個原則:管理、作戰人員的信任、產品和采購生命周期、需求驗證、負責任的人工智能生態系統和人工智能勞動力。
同時,2021年11月,DIU發布了其負責任的人工智能指導方針,響應了備忘錄中對 "工具、政策、流程、系統和指導 "的呼吁,將道德的人工智能原則納入該部門的采購政策。這些指導方針是在國防部人工智能項目中操作和實施道德的具體步驟,建立在DIU在預測健康、水下自主、預測性維護和供應鏈分析等領域的人工智能解決方案的經驗上。它們的目的是可操作的、自適應的和有用的,同時確保人工智能供應商、國防部利益相關者和DIU項目經理在人工智能系統生命周期的規劃、開發和部署階段考慮到公平、問責和透明度。
國防部人工智能項目的成功將在很大程度上取決于確保人類發展并保持對其智能機器隊友的適當信任。因此,國防部對可信人工智能的強調越來越多地體現在其一些旗艦人工智能項目中。例如,2020年8月,DARPA的空戰進化(ACE)項目吸引了大量的關注,因為一個人工智能系統在模擬的空中斗犬比賽中擊敗了空軍的一名頂級F-16戰斗機飛行員。 ACE的一個關鍵問題是 "如何讓飛行員足夠信任人工智能并使用它",而不是讓人類與機器對決。ACE選擇了斗狗場景,很大程度上是因為這種類型的空對空戰斗包含了許多成為戰斗機飛行員群體中值得信賴的伙伴所必需的基本飛行動作。讓人工智能掌握作為更復雜任務基礎的基本飛行動作,如壓制敵方防空系統或護送友軍飛機。根據ACE項目經理的說法,AlphaDogfight試驗是 "關于增加對人工智能的信任"。
人工智能的發展速度很快,因此很難設計和實施一個足夠靈活的監管結構,以保持相關性,同時又不至于限制性太強而扼殺創新。與國防部合作的公司正在尋求符合國防部人工智能道德原則的人工智能系統的開發、部署、使用和維護的指導方針。這些行業伙伴中的許多人已經采用了他們自己的可信和負責任的人工智能解決方案的框架,強調了安全、安保、穩健、彈性、問責制、透明度、可追溯性、可審計性、可解釋性、公平性和其他相關質量等屬性。
圖:2021年10月19日,在亞利桑那州尤馬試驗場,一名美國陸軍士兵使用戰術機器人控制器來控制遠征模塊化自主車輛,作為準備 "聚合項目 "的練習活動。在 "聚合項目21 "期間,士兵們試驗了使用這種車輛進行半自主偵察和再補給。無論是在戰場上還是在戰場之外,對自主和半自主車輛等人工智能能力的信任對于成功至關重要。
目前,對于什么是道德或值得信賴的人工智能系統,沒有共同的技術標準,這可能會使非傳統的人工智能供應商難以設定預期,并在官僚機構中穿梭。國防部不直接負責制定標準。相反,2021年國防授權法案(NDAA)擴大了國家標準與技術研究所(NIST)的任務,"包括推進人工智能的合作框架、標準、指導方針,支持開發人工智能系統的風險緩解框架,并支持開發技術標準和指導方針,以促進值得信賴的人工智能系統"。2021年7月,NIST在制定其人工智能風險管理框架時,向利益相關者發出了信息請求,旨在幫助組織 "將可信性考慮納入人工智能產品、服務和系統的設計、開發、使用和評估"。
對這一挑戰沒有簡單的解決方案。但是,讓政府、行業、學術界和民間社會的利益相關者參與進來的合作過程可以幫助防止人工智能的發展走上社交媒體的道路,在社交媒體上,公共政策未能預測到虛假信息和其他惡意活動在這些平臺上造成的風險和損失,而且反應緩慢。
與標準相關的是與測試、評估、驗證和確認(TEVV)相關的挑戰。測試和驗證過程是為了 "幫助決策者和操作者了解和管理開發、生產、操作和維持人工智能系統的風險",對于建立對人工智能的信任至關重要。國防部目前的TEVV協議和基礎設施主要是針對主要的國防采購項目,如船舶、飛機或坦克;它是線性的、順序的,而且一旦項目過渡到生產和部署,最終是有限的。然而,對于人工智能系統,"開發從未真正完成,所以測試也是如此。"因此,像人工智能這樣的適應性強、不斷學習的新興技術需要一個更加敏捷和迭代的開發和測試方法,正如NSCAI建議的那樣,"將測試作為需求規范、開發、部署、培訓和維護的持續部分,包括運行時監測操作行為。"
建立在開發、安全和運營(DevSecOps)的商業最佳實踐基礎上的綜合和自動化的開發和測試方法,更適合于人工智能/ML系統。雖然JAIC的聯合基金有可能實現真正的人工智能DevSecOps方法,但在整個國防部擴大這種努力是一個重大挑戰,因為它需要對當前的測試基礎設施進行重大改變,以及更多的資源,如帶寬、計算支持和技術人員。也就是說,如果不開發更適合人工智能的新測試方法,不調整當前的測試基礎設施以支持迭代測試,將阻礙大規模整合和采用可信和負責任的人工智能的努力。
上述關于標準和TEVV的討論概括了現代人工智能系統對現有國防部框架和流程的獨特挑戰,以及商業技術公司和國防部對人工智能開發、部署、使用和維護的不同方法。為了加速人工智能的采用,國防部及其行業伙伴需要在具體的、現實的、與操作相關的標準和性能要求、測試過程和評估指標上更好地保持一致,并納入道德的人工智能原則。一個以可信和負責任的人工智能為導向的國防技術生態系統可以促進最佳做法的相互交流,并降低非傳統供應商和初創公司所面臨的官僚主義和程序性障礙。
充分發揮人工智能推動成本和時間效率的能力,支持人類決策者,并實現自主性,將需要更多的技術進步或開發新的作戰概念。下面,我們概述了優先努力的三個關鍵領域,以更成功地將人工智能納入整個國防部事業,并確保美國能夠阻止威脅,并保持對其競爭對手和潛在對手的戰略、戰役和戰術優勢。
與中國日益激烈的戰略競爭,精湛的技術和強有力作戰能力,以及與私營部門快速的技術開發和整合速度的比較,都給國防部帶來了壓力,使其更快地走向人工智能系統的實戰。在人工智能發展中鼓勵更大的風險容忍度,以便在大規模采用人工智能方面取得進展,這有很多好處。但是,僅僅為了 "超越 "中國而匆忙部署容易受到一系列對手攻擊的人工智能系統,并且很可能在作戰環境中失敗,這將被證明是適得其反。
指導美國軍隊的道德準則反映了對遵守戰爭法則的基本承諾,而此時,一些獨裁國家對人權和人道主義原則很不重視。同時,國防部對新能力的測試和保證采取了嚴格的方法,旨在確保新武器的使用是負責任的和適當的,并盡量減少事故、誤用和濫用系統和能力的風險,因為這可能會產生危險,甚至是災難性的影響。美國與許多盟友和伙伴共享的這些價值觀和原則,在與專制國家競爭時是一種戰略資產,因為它們正在部署人工智能軍事系統。為了鞏固國防部在這個領域的優勢,我們建議采取以下步驟。
美國防部應將DIU的“負責任的人工智能指南”納入相關的提案請求、招標和其他材料中,要求承包商展示他們的人工智能產品和解決方案是如何實施國防部的人工智能道德原則。這將設定一套共同和明確的期望,幫助非傳統的人工智能供應商和初創公司在五角大樓的提案過程中游刃有余。最近有國防部為項目制定收購類別的先例,要求工業界調整其開發過程,以滿足不斷變化的國防部標準。例如,在2020年9月,美國空軍為所有采購工作制定了e系列采購指定,要求供應商使用數字工程實踐--而不是原型--作為他們激勵行業接受數字工程的一部分。
美國防部的行業合作伙伴,特別是非傳統的人工智能供應商,應積極與NIST合作,因為該機構繼續努力制定標準和指導方針,以促進可信賴的人工智能系統,以確保他們的觀點為后續框架提供信息。
本文提到的有效采用人工智能的挑戰包括人工智能的脆弱性和對手旨在破壞人工智能算法的網絡攻擊可能性。克服這些挑戰將需要國防部繼續致力于提高國防部人工智能系統測試和評估的速度、種類和能力,以確保這些系統在更廣泛的不同環境下發揮預期功能。其中一些測試需要在真實世界的環境中進行,但基于模型的模擬的進步可以使人工智能系統的性能在數字/虛擬世界中得到越來越多的驗證,減少與這種測試相關的成本和時間。
圖:人工智能可以極大地重塑未來的戰場。為了實現這一愿景,美國防部必須采取關鍵步驟,有效利用人工智能。資料來源:美國陸軍。
此外,美國防部還應該利用國防部研究與工程副部長(USDR&E)的測試實踐和優先事項,以確保計劃和部署的人工智能系統能夠抵御對手的攻擊,包括數據污染和算法損壞。
美國防部應利用盟友和外國合作伙伴來開發、部署和采用可信的人工智能。這種性質的參與對于協調人工智能發展和使用的共同規范至關重要,這些規范遏制并對抗中國和俄羅斯的獨裁技術模式。擴大現有合作模式和建立新的伙伴關系的途徑可以包括以下內容:
i. 加強對道德、安全和負責任的人工智能的重視,將其作為全日空防務伙伴關系的一部分,通過評估成員方法的共同點和差異,確定未來聯合項目和合作的具體機會。
ii. 與 "五眼"、北約和AUKUS伙伴交叉分享和實施聯合道德項目。除了支持互操作性,這將增加視角和經驗的多樣性,并有助于確保人工智能發展工作限制各種形式的偏見。正如本項目所采訪的一位前將軍所指出的,"多樣性是我們確保可靠性的方式。它是必不可少的。"
iii. 擴大與不同能力和地域的盟友和合作伙伴的聯系,包括印度、南非、越南,以探索雙邊和多邊研發工作和技術共享計劃的機會,解決可信和負責任的人工智能的技術屬性。
如果不與廣泛的技術公司建立密切的伙伴關系,國防部將無法實現其在人工智能方面的雄心壯志,并與中國通過軍民融合采購技術創新的模式進行有效競爭。這包括與五角大樓有長期聯系的國防工業領導人,處于全球創新前沿的技術巨頭,尋求擴大其政府投資組合的商業技術參與者,以及處于人工智能發展前沿的初創企業。但是,國防部的預算規劃、采購、收購、簽約和合規流程可能需要從根本上進行重組,以有效地與這個充滿活力和多樣化的技術生態系統的整體接觸。
系統性變革是一個緩慢而艱巨的過程。但是,拖延這一過渡有可能使美國軍隊在利用人工智能承諾提供的優勢方面落后,從作戰速度到決策主導權。同時,以下行動可以幫助改善與行業伙伴的協調,以加快國防部采用人工智能的努力。
國防部應評估其溝通和外聯戰略,以澄清和精簡圍繞該部門在人工智能方面的優先事項的信息。
國防部應與技術公司合作,重新審查他們對某些類別的人工智能解決方案的潛在價值的評估,包括但不限于后勤、醫療和健康服務以及信息操作。
國防部應實施NSCAI的建議,加快對采購專業人員的培訓,使其了解采購和簽約的全部可用選擇,并激勵他們使用人工智能和數字技術。" 此外,這種采購人員培訓舉措應確保采購專業人員充分了解國防部的人工智能倫理原則以及可信和負責任的人工智能的技術層面。國防部的道德準則可以作為這種培訓的基礎。
在中短期內,美國防部將不會建立全新的人工智能系統,而是將人工智能整合到一系列現有的軟件和硬件系統中--從網絡防御架構到戰斗機到C2。因此,實施人工智能的進展也將取決于簡化國防部一直在爭取的創新和尖端技術的初創公司和非傳統人工智能供應商與負責將新能力整合到傳統系統的國防部門之間的合作。
NSCAI建議確定 "國防部門與非傳統公司合作的新機會,以便在現有平臺上更快地采用人工智能能力。"我們贊同這一建議:改進國防部門與非傳統公司之間的協調可以幫助確保人工智能解決方案是強大的,有彈性的,與作戰相關的,以及引導有前途的原型穿過 "死亡之谷"。
毫無疑問,從概念到實踐可能是很棘手的。本文的研究顯示,在將創新的新技術從實驗室轉移到記錄項目中采用的主要挑戰在哪里,人們的觀點存在著很大的分歧。初創企業傾向于認為系統集成商抗拒參與,而初創企業可能被認為缺乏對收購過程的理解,以及開發的技術難以整合到記錄項目中,或難以擴大規模。
彌補這一差距將需要政府采取新的方法來解決非傳統供應商對知識產權的擔憂。大多數人不愿意放棄敏感技術的所有權,這些技術主要是賣給國防市場以外的客戶。這也將涉及到國防部幫助小企業通過加快網絡認證和運營授權(ATO)過程等步驟來瀏覽聯邦采購流程,以及幫助有興趣的公司為國防部的不同組成部分開發使用案例。這種積極的促進作用將幫助那些通過研究和開發撥款與國防部合作的非傳統供應商更有準備地與系統集成商達成合作。
最重要的是,優化大型系統集成商和小型創新者的利益,將需要國防部在連接小型公司和那些正在運行的項目方面發揮更積極的對話者作用。目前,國防部在要求公司合作方面存在一些可以理解的猶豫,主要是擔心觸犯聯邦采購條例(FAR)。但是,正如本項目采訪的一位行業專家所認為的,國防部可以更積極地了解《聯邦采購條例》所允許的內容,并幫助公司建立聯系,特別是為了滿足特定的采購優先權或計劃。
在過去的幾年里,對人工智能的興趣和投資已經獲得了動力。這在國家安全和國防界尤其如此,因為戰略家、政策制定者和行政人員在不斷上升的地緣戰略競爭中尋求決定性的優勢,并為以復雜性、不確定性和最重要的速度為特征的未來操作環境做準備。人工智能現在是美國和中國之間軍事技術競爭的中心,這兩個國家以及世界上其他國家的軍隊都已經在部署人工智能系統,目的是為了主導未來的戰場。
美國不能冒落后于中國的風險--在人工智能的創新方面,在人工智能的采用方面,在人工智能全面融入國防事業方面,都不能。迫切需要解決一系列技術和官僚程序以及文化問題,迄今為止,這些問題已經抑制了國防部采用人工智能的步伐。具體來說,國防部應優先考慮以下問題。
建立對人工智能的信任:國防部的人工智能努力主要集中在增強人類理解、決策和效能的技術上,而不是取代人類。因此,在人類和他們的智能機器隊友之間建立信任和信心是成功開發和部署軍事人工智能的一個關鍵方面。
制定和實施可信和負責任的人工智能標準:目前,對于什么是可信和負責任的人工智能,還沒有共同的標準或系統性能要求。因此,五角大樓及其行業伙伴必須與NIST等機構合作,制定和實施與作戰相關的標準、測試流程和評估指標,其中包括道德的、可信賴的和負責任的人工智能原則。這將有助于將成功的人工智能研究原型推進到可投入生產的解決方案中。
促進美國創新生態系統和國防工業基地的優化。將尖端的人工智能技術引入國防部還需要五角大樓減少國防部采購過程中經常出現的官僚主義挑戰,特別是對于那些在傳統國防工業基地之外的創新公司。開發新的手段來支持和激勵這些公司的參與,并促進領先的國防技術公司與初創公司和非傳統供應商之間的行業內伙伴關系將是至關重要的。
吸引盟友和合作伙伴。正如本文開頭所述,烏克蘭戰爭加強了盟友和合作伙伴在執行地緣政治規范和標準方面的重要性。未來人工智能的發展和采用也可能是如此。國防部不僅將受益于工業界和國家安全界的合作,還將受益于與盟友和外國伙伴的合作,以確保建立和頒布規范和標準,從而實現可信、負責和可互操作的人工智能開發和部署。
本報告是在對人工智能的國家安全和國防影響進行為期八個月的研究項目的最終成果。
瑪格麗特-科納耶夫(Margarita Konaev)是大西洋理事會斯考克羅夫特戰略與安全中心前沿防御業務的非常駐高級研究員。此外,她還擔任喬治敦安全與新興技術中心(CSET)的分析副主任和研究員,對人工智能的軍事應用和俄羅斯軍事創新感興趣。她也是新美國安全中心的兼職高級研究員。在此之前,她是西點軍校現代戰爭研究所的非駐地研究員,弗萊徹法律和外交學院的博士后研究員,以及賓夕法尼亞大學佩里世界之家的博士后研究員。在加入CSET之前,她曾在Gartner公司的營銷和溝通部門擔任高級負責人。
科納耶夫博士對國際安全、武裝沖突、非國家行為者和中東、俄羅斯和歐亞大陸的城市戰爭的研究已經在《戰略研究雜志》、《全球安全研究雜志》、《沖突管理與和平科學》、法國國際關系研究所、《原子科學家公報》、《法律戰》、《巖石上的戰爭》、現代戰爭研究所、外交政策研究所以及其他一系列機構和組織發表。她擁有圣母大學的政治學博士學位,喬治敦大學的沖突解決碩士學位,以及布蘭代斯大學的學士學位。
泰特-努爾金(Tate Nurkin)是OTH情報集團的創始人,也是大西洋理事會斯考克羅夫特戰略與安全中心的高級研究員。
在2018年3月建立OTH情報集團之前,努爾金在IHS Markit的簡氏公司工作了12年,擔任各種職務,包括管理簡氏國防、風險和安全咨詢業務。從2013年到他離開,他擔任戰略評估和未來研究(SAFS)中心的創始執行主任,該中心提供有關地緣政治、未來軍事能力和全球國防工業的全球競爭的思想領導和定制分析。
實質上,努爾金的研究和分析特別關注中美競爭、國防技術、未來軍事能力和全球國防工業及其市場問題。他還擅長設計和提供替代性未來分析活動,如情景規劃、紅色團隊和兵棋推演。
他曾在聯合管理服務公司、SAIC的戰略評估中心以及博思艾倫公司的建模、模擬、兵棋推演和分析團隊工作。2014-2018年,他在世界經濟論壇的核安全全球議程委員會和國際安全未來委員會連續任職兩年,該委員會的成立是為了診斷和評估第四次工業革命的安全和防御影響。
努爾金擁有佐治亞理工學院薩姆-納恩國際事務學院的國際事務科學碩士學位,以及杜克大學的歷史和政治學學士學位。
全域作戰 (ADO) 是美國軍事聯合概念的演變,旨在應對戰略對手,他們希望利用戰爭的新興特征來破壞和克服美國在日益復雜和全球戰場上的優勢。ADO作為一個概念很重要,因為它同時認識到作戰環境的復雜性以及對手打算如何在其中實現戰略優勢。這個概念描述了美國陸軍如何在鞏固成果的同時,使聯合部隊能夠防止、拒絕和利用對手。隨著多域作戰環境的出現和美國陸軍尋求在未來獲得并保持持久的優勢,繼續發展ADO概念將至關重要。
兵棋推演繼續作為軍事組織的一項關鍵職能和工具。兵棋推演工具根據玩家的決定,以不同程度的現實和抽象來模擬過程和后果。兵棋推演理論對美國陸軍領導力的開發至關重要,因為它提供了一個過程,通過抽象的機制將關鍵的決策還原成一個反復的過程,使人們能夠探索失敗并獎勵學習,以做出更合適的決策。兵棋推演是測試ADO概念的關鍵因素,也是培訓和教育未來領導力的關鍵方法。
ADO的關鍵是發展理解概念和作戰環境的能力。ADO推演允許領導者和軍事理論家學習和探索作戰環境,包括對手與美國和盟軍在作戰環境中的能力。設計一個關于ADO作戰概念的兵棋推演工具,可以創造一個框架,在這個框架內,領導者可以練習規劃、執行和反思關鍵因素。這篇論文提出了一個概念證明,即通過教育和培訓,重點關注陸軍的ADO規劃和執行的作戰方法,以促進未來的領導力開發。
戰爭是永遠存在的。在某種不同程度上,行為者總是為沖突做準備或參與沖突。戰爭的特征和現代戰爭的概念在時間上無情地向前推進。美國的戰爭專家和政策制定者主要認為,全域作戰(ADO)是未來的戰爭概念。全域作戰代表了美國軍隊在2020年和不久將來的現代聯合作戰概念和方法。這一概念將空中、陸地、海洋、網絡空間、電磁和太空領域整合在一起,進行跨時空的規劃和同步執行。ADO固有的復雜性要求領導者對跨領域的能力、規劃和執行有一定的了解。
從戰術層面開始的領導力開發路徑限制了聯合和作戰經驗。對ADO的理解和更好的執行需要領導者在經驗發展的早期學習規劃和實施新生的概念。到目前為止,真實世界的親身體驗是最好的,但很難復制,在聯合作戰中更是如此。兵棋推演提供了一個補充教育和培訓的工具,利用機械原理來幫助對問題和決策過程的理解框架。一個全面的兵棋推演工具對于ADO中未來作戰領導力的開發是至關重要的。
本報告的目的是展示兵棋推演如何為美國陸軍在ADO中的角色開發和領導力培養提供方法。該研究旨在為對ADO感興趣的領導人提供一個基礎,并通過兵棋推演進行開發和教育。本報告展示了兵棋推演如何模擬ADO的概念,以指導和促進教育。兵棋推演的目的包括跨越時間和空間,通過所有領域來規劃和管理軍事行動,同時在與ADO相關的各個階段納入作戰藝術和科學元素。兵棋推演模型應能適應任何場景,并采用模塊化設計,允許根據需要強調背景。設計者根據現有的作戰框架,通過在至少兩個主要對手之間的偶發階段來開發兵棋推演工具,從而實現反思和討論。本報告提供了一個概念證明,即作為進一步開發的基線Theatrum Belli,并解決了陸軍理論中關于兵棋推演的一個重要空白。
在陸軍兵棋推演中,ADO的概念和理論存在一個重大的空白。很少有現有的模型能以現代的方式將所有的五個戰爭領域都納入其中,以適當地呈現ADO的要素。此外,美國陸軍缺乏一個模擬的、標準化的模型來最好地描述從師到戰區陸軍在作戰層面執行 ADO。美國空軍和美國海軍目前正在開發一個以ADO為導向的兵棋推演,但仍然沒有納入大量的地面部隊。本報告提出了一種兵棋推演的設計,能夠在作戰層面上對ADO的規劃和執行的領導力進行教育和開發。鑒于該兵棋推演的主要目標,設計者必須承認該模型和研究的局限性。
第一手和真實世界的經驗是最好的學習環境。然而,在作戰層面為ADO創造一個真實世界的訓練環境,在時間、物質和人員上的成本可能是令人望而卻步的。兵棋推演是一個有明確目標的模型,它準確地描述了至少兩個對立面之間的一些戰爭要素。為了實現這個明確的目標,必須對設計的因素進行優先排序。該模型只模擬了現實和戰爭的某些部分,優先用于實現兵棋推演的目標。設計的細節越精確、越全面,它就越復雜。兵棋推演通常會犧牲不同程度的精確性來實現簡單性,以減輕參與者所需的時間和精力成本。設計的目的是在ADO上進行指導,這也帶來了其他的限制。兵棋推演可以通過多次迭代來教授類似的學習目標,但對現實的每一次抽象都意味著模型的應用在任何時候都只能解決這么多問題。
兵棋推演的獲取和可用性是對擬議的兵棋推演的關鍵限制。兵棋推演中的任何機密材料都會大大降低大多數專業軍事教育(PME)項目的準入門檻。由于缺乏機密材料,該設計不可避免地掩蓋了ADO固有的某些方面。這使得一個用于訓練和教育目的的模型能夠得到更廣泛的傳播,甚至可能包括盟軍部隊。此外,該模型的擴大傳播鼓勵了PME之外更廣泛的參與,這可以進一步創新和調整未來的迭代。除了所討論的本報告的局限性外,設計過程的范圍更好地定義了設計方法。
本報告的兵棋推演設計范圍提出了一個課堂環境的概念說明,以補充ADO的學習。因此,重點支持實現具體的學習目標,只需要教師和學生的必要時間和努力。一個兵棋推演如果吸收了太多的時間,無論是學習操作還是執行本身,對任何有時間安排的人來說都會成為一種負擔。為了解決參與者的注意力問題,兵棋推演的模式必須是高效和簡短的,但仍然包括促進學習目標的機制。教員通過兵棋推演來管理學生的注意力,并需要利用剩余的時間來發揮綜合作用,而不是讓學生筋疲力盡。為了補充高級軍事研究項目(AMSP)的課程,設計應該以研討會的環境為基線。這種形式可以擴展到旅以上梯隊的工作人員,在幾個小時內執行迭代,而不是全天的事務。設計的迭代性質適合于情節性的場景,參與者可以用默認的標準跳入和跳出場景,或者在不同的情節之間進行進展,以實現持續的連續性。這是對兵棋推演范圍的一般性介紹,本報告將在后面對其設計背后的理論作進一步的詳細說明。
本報告的引言闡述了論文和主要目的,確定了重大差距,以及兵棋推演設計的局限性和范圍。下一節涵蓋了所研究的文獻、理論、概念和以前的兵棋推演,以及它們對擬議設計方法的應用。
圖4. 在MDO框架中強調的軍事問題。
在未來的軍事行動中,通過協調多智能體系統(MAS)來實施戰略機動以獲得對對手的優勢,是一個很重要的途徑。最近探索MAS協作的工作主要集中在識別、分類、驗證、實施,以及通過多智能體強化學習(RL)來研究新興的協作方式。強化學習方法可以通過探索和利用選定行動來響應特定環境中的突發行為,這有可能抑制對抗性協作,反過來又可以為各種情報、監視、目標獲取和偵察任務提供機會窗口。本報告簡要介紹了RL領域的突出工作及其在自主戰略機動協作式MAS中的潛在應用。
美國陸軍現代化激增是由對手在多個領域(如陸地、海洋、空中、網絡、電磁和空間)對美國構成的威脅所推動的,這對美國利益的威脅超出了常規戰爭。預計未來的戰斗將在這些復雜的多領域環境中進行,人工智能(AI)將指導與人類士兵一起協同工作的機器人Agent的戰術、技術和過程(TTPs)。這些機器人將聚集在一起,形成智能多Agent團隊,與人類士兵有效協作,完成任務。
美國陸軍作戰能力發展司令部(DEVCOM)陸軍研究實驗室(ARL)的基本研究計劃(ERPs)構建了開發和實施智能多Agent系統(MAS)的具體計劃路徑。此類陸軍計劃為美國國防行動提供了關鍵研究問題的答案,這些問題匯聚在一起,指明陸軍未來司令部的現代化努力方向。人工智能用于自主機動性(AIMM)和新興超限技術(EOT)是ERP的例子,明確側重于使下一代戰車具有自主感知、學習、推理、規劃和機動能力。這些未來的自主系統將與人類智能體合作進行預測和規劃,并通過戰場上的自主機動(AIMM)和保護(EOT)向士兵提供支持。本報告重點關注需要進行的自主協作,以使多智能體系統(即人類、智能體或人類和智能體混合)在未來的軍事行動中取得成功。
集成和協調的MAS將需要技術的進步,重點是超越我們目前的能力,以有效地對付同等裝備的對手(同行或接近同行)的協作戰略機動性。一個直接的挑戰是開發能夠以良好協調方式自主和智能地工作的智能體團隊。這種能力要求智能體在執行關鍵任務時與士兵一起觀察、定位、決定和行動(OODA-Loop)。雖然新的努力促進了對多智能體范式中情報的一般理解,但目前對情報的解釋并不明確。最近的文獻表明,基于強化學習(RL)的方法可能為實現這種技術進步提供了一條可行的途徑,本文介紹的一系列工作就是證明。
在本報告中,介紹了RL領域的貢獻,以及它們在軍事環境中的潛在應用--特別是通過戰略編隊機動來抑制對手的協作,以實現戰場上的超越。最小化、限制或完全抑制對抗性多Agent行為中的協作是探索和執行在模擬情況下通過RL實驗得出戰略機動的一種手段。此外,協作的戰略機動可以通過各種RL方法學習,以告知防御部隊創造機會或優勢窗口的潛在途徑。
為了在模擬環境中通過戰略機動的RL方法實現MAS協作,我們首先介紹了近年來一些最突出的RL研究。最近在RL領域的進展(如alphago)促進了更復雜的多智能體強化學習(MARL)算法在現實世界應用。此外,近年來也有一些框架來實現多智能體協作。這些努力加在一起,可以為開發和實施多機器人協作提供一條道路,以便在為未來戰場設計的多機器人系統中實現戰略機動。
在下面的章節中,對近年來突出的RL方法進行了分類和概述,并表明這些方法與DEVCOM陸軍研究實驗室目前的研究和開發項目相一致。具體來說,本報告的重點是確定戰略機動的特定算法的優勢和劣勢。此外,對選定的RL方法類別進行了分類,以深入了解戰略機動的潛在實施,并考慮到情報、監視、目標獲取和偵察(ISTAR)任務。
簡單地說,戰略機動可以解釋為一組智能體協調他們的行動,通過戰勝對手來實現一個共同的目標。破壞,是戰略機動的一個特例,可以表示為對對手協作戰略機動的抑制。因此,戰略機動一詞的使用意味著至少存在兩個對立的或敵對的雙方,他們處于動態的斗爭中,通過限制、抑制或以其他方式破壞對手的協調或戰術,并強加自己的協作戰術來獲得對對方的優勢。
在本節中,提供了一個對抗性的交戰場景,其核心是使用選定的遠程資產,這些資產本質上破壞了友好部隊的交戰。圖1顯示了一個圖例,描述了與所述多域作戰(MDO)情景相關的選定資產和部隊的軍事符號學。根據MDO理論,在武裝沖突中,對手的遠程反介入和區域拒止(A2AD)火力系統可以被用來拒絕友軍在戰區的機動自由(見圖1)。這是通過將情報、監視和偵察(ISR)資產與致命性和非致命性火力相結合來實現的,以攻擊戰略和行動支持區的友軍指揮結構、維持能力和部隊編隊。這些地區是近距離地區作戰資產(如部隊和裝備)的傳統集結地(見圖2)。對手有能力在友軍后方深處識別和攻擊目標,導致這些實體在地理上與戰術支持區和近距離區分離,這有效地提高了友軍的損耗率,即所謂的對峙。鑒于前線部隊與戰略和作戰機動支援相分離,敵對勢力可以利用這種友軍孤立無援的情況,將其消滅。
圖1 友軍(BLUEFOR,左)和敵軍(OPFOR,右)部隊的資產和資源。在所描述的MDO情景中,假設BLUEFOR和OPFOR的所有資產都是自主化的編隊。
圖2 敵軍(OPFOR)使用遠程導彈和火箭炮干擾或破壞友軍(BLUEFOR)戰略支援區的維持行動,這使得友軍無法以有利的條件與近距離地區的敵軍機動部隊交戰。為了應對這一戰略,BLUEFOR執行反擊任務,以摧毀位于深火區的OPFOR遠程火力系統(藍色箭頭)。從深層機動區的BLUEFOR SOF發出的三叉箭頭代表了一種 "破壞 "戰術,它打破了對手的隊形和節奏。
圖3 壓制(S)或解除(N)敵方遠程火力系統和ISR資產,使友軍能夠穿透敵方的A2AD保護傘。這使友軍能夠在近距離地區擊敗敵人,并使機動指揮官有能力利用他們的成功,迅速將部隊轉移到深度機動區,摧毀(D)脆弱的敵方資產并追擊撤退的敵軍。F表示 "固定",可有效減緩敵軍的行動。粗箭頭代表部隊移動的方向。
MDO理論規定了擊敗對手A2AD能力的計劃(即對峙),以便戰略和作戰機動能夠使前沿部署的友軍以有利的條件與對手交戰(即穿透和瓦解A2AD系統以利用機動自由)。在這里,我們只關注友軍(BLUEFOR)野戰軍和軍團與敵方A2AD系統交戰時的滲透和瓦解部分,這可能需要在未來的戰斗中使用自主MAS。此外,據推測,圖1中友軍(BLUEFOR)和敵軍(OPFOR)的所有符號都將包含自主化的編隊(例如,機器人戰車、自動瞄準系統、地面和空中的機器人ISR資產)。圖2和圖3分別顯示了利用這種符號學與自主化編隊進行戰略機動的情景圖。
如圖2所示,敵對的A2AD火力系統通過攻擊戰略和作戰支持區來創造對峙局面。友軍火力和防空部隊從太空和高空監視(未顯示)接收有針對性的情報,在狹窄的時間窗口內打擊高價值目標(即多管火箭系統[MLRS]),以減少對手的位置調整。除了監視之外,還可以采用戰略刺激--打擊來穿透和瓦解對手的遠程火力系統。
在ISTAR任務中,MARL可以通過利用敵軍理論和敵軍行動中的局部觀察,戰略性地照亮和跟蹤敵軍目標的位置。此外,經過MARL訓練的具有自主能力的編隊,結合高度機動和分散的空中和地面火力,可以開始壓倒對手的遠程防空。友軍可以利用經過訓練的MARL方法來利用對手的TTP,進行防空和地面火力的戰略機動。這些具有自主能力的編隊根據從戰略空基刺激收集的監視數據選擇地理位置。隨著對手的遠程火力系統被消滅,戰略和作戰支援部隊能夠向前方的作戰部隊推進(機動)(見圖2)。
敵軍利用ISR資產識別作戰支援區的友軍資產,并從作戰縱深火力區用遠程火力系統(即多管火箭炮)攻擊友軍。這些敵方火力擾亂了友軍在該地區進行傳統支援行動的能力,這反過來又導致這些活動在離部隊前線更遠的地方進行。這通過擴大戰場和緊張的補給線而造成地理上的對峙。此外,這還允許敵方機動部隊以有利于敵方既成事實的條件與近距離地區的友軍作戰。根據MDO的理論,為了消除對峙,友軍的炮兵系統必須在敵軍的火力和ISR資產部署之前識別、交戰并摧毀它們。友軍SOF通過破壞補給和指揮與控制(C2)節點以及為聯合火力提供目標數據來協助這項工作。這在敵人的A2AD保護中創造了缺口,可以被機動指揮官所利用。在這種覆蓋下,友軍機動部隊穿透并利用近距離和深層機動區域的缺口。
在作戰區,近距離和縱深地區的聯合部隊的戰略編隊可能是自主啟用的編隊(即MAS),利用MARL訓練的策略來利用對手的TTP(來自理論)、本地觀察和ISR收集的信息。如圖2所示,聯合部隊將協調其ISR和遠程精確火力的能力,為前沿部署的BLUEFOR部隊提供支持。在戰略和作戰單位的支持下,擁有自主能力的前線部隊可以在近距離和縱深地區進行協調,以分離和擊敗敵方資產。這將促進消滅敵對的前沿機動部隊(OPFOR),使遠程火力系統容易受到地面攻擊(瓦解),如圖2所示。
聯合火力(即友軍或BLUEFOR)壓制或消滅對手的遠程火力系統,使友軍機動部隊能夠進入并擊敗近距離區域的作戰部隊(見圖3)。然后,友軍機動部隊利用這一優勢,在深度機動區(見圖3中的D區)摧毀敵方的助推器。這將導致剩余的敵對機動編隊從近距離區域撤出,并在深層機動區域建立一個新的戰線。這個過程不斷重復,直到達到戰略目標或打敗OPFOR。這些協調活動在理論上可以通過人類士兵和自主多智能體系統之間的合作來實現。此外,鑒于目前正在積極研究開發和部署這種自主系統,預計未來的戰場將需要考慮像這樣的場景來規劃戰略機動。
本節提供了一個可以應用MARL方法訓練自主化編隊的場景;然而,在這種復雜的MDO環境中執行的具體RL方法還沒有經過測試,或者可能還不存在。下一節闡明了與利用RL方法為未來的MDO交戰訓練MAS有關的一些挑戰。
在這項工作中,我們將重點聚焦到可以指導MAS克服與軍事防御MDO中戰略機動相關挑戰的RL方法。從技術上講,RL是機器學習(ML)的一個分支,它超越了從數據中建立精確的預測,通過在環境中產生行動來展示學習。這種學習的展示可以被認為是一種決策形式,但更準確的描述是通過狀態空間探索進行戰略行動選擇。
RL智能體在獎勵函數的基礎上進行學習(或訓練),最終確定在當前情況下(即該智能體在環境中的狀態),哪一個是智能體要選擇的最佳行動。例如,RL智能體可以與環境互動,產生與獎勵掛鉤的經驗,這將形成學習的策略(即一系列的狀態-行動對)。然而,在后面的章節中強調,目前的RL方法可能還不夠成熟,無法克服與人類類似的適應性相關的挑戰,以便在新情況或環境中進行智能決策。盡管RL算法有其缺點,但它們似乎是在軍事防御MDO中實現協調的MAS執行戰略機動的最有希望的途徑之一。
在多智能體任務中,協作通常是定義不清的,而且經常被用來表示一組智能體在某些合作任務領域中成功地執行了任務。在以前的工作中,開發并采用了各種新方法來測量執行合作任務時智能體行動之間的相互依賴性,以確認這些智能體事實上已經學會了協作。對協作的確認是確定MAS有能力與其伙伴合作的先決條件,而不是簡單地采取導致某種程度的優化行動。雖然在某些情況下,最佳行為可能是可取的,但如果任務以某種不可預見的方式發生了變化,一個簡單的最佳行為的智能體可能會在戰場上導致災難性的損失。因此,未來防御行動的MAS必須具有明確協作的能力。
在本節的其余部分,描述了與開發戰略機動MAS有關的一些挑戰,其中時間尺度、能力和局部目標可能有很大的不同(例如,MDO),但需要某種程度的協作。此外,假設更大程度的靈活協作可以促進任務執行的改進(例如,更快、更少的損失、非直觀的策略、有效處理不斷變化的能力/團隊組成)。
隨著環境在動態戰場上的變化,敵對雙方(至少)可能需要重復規劃和預測,以便1)跟上,或2)領先于對手的規劃和預測。經過RL訓練的MAS能夠學習這種動態的規劃和預測循環。另外,如果學習智能體建立了一個關于對手協作行動的適當模型,然后采取行動破壞這種協作,也可以實現這一目標。
在一個理想的情況下,一個被選來指導MAS行為的算法將學會處理環境、對手戰術和能力、自身能力(獲得新的能力或失去以前的能力)、團隊組成(例如,改變合作者)和局部目標的變化。然而,大多數最先進的(sota)方法受到經驗的限制(正如許多RL方法的情況一樣)。此外,在大多數模擬中,團隊的能力和組成通常是固定的,不能為算法提供足夠的數據來操作和處理任何上述的特征變化。因此,在選擇一種算法來指導旨在產生戰略機動的MAS的行為時,必須考慮新的或動態的事件、行為、資產和實體。
總之,目前的算法方法在復雜的軍事防御MDO環境中沒有達到所需的能力。目前的缺點可以分為三類。1)數據要求,由于情況的新穎性,數據是有限的,數據集不足以產生準確的預測,或者數據以某種方式被污染(例如,嘈雜、臟亂或對手的改變),2)有限的計算資源,以及3)算法不能泛化到訓練期間遇到的情況之外(例如,不同的目標、改變的能力或修改的團隊組成),導致狹隘或脆弱的MAS解決方案。
在下一節中,我們將更詳細地討論RL的缺點,以闡明如何克服這些問題,為軍事防御MDO環境提供解決方案。為此,我們介紹了現有的RL算法的分類法。這一努力應提供對有前途的RL技術更好的洞察力,這可能有助于確定最終應用于美國國防MDO的可行途徑。
學習算法的可擴展性是MDO中軍事任務的主要關注點之一,特別是因為這種任務可能需要大量的智能體來完成一個目標。此外,軍事任務可能涉及多個子任務,每個子任務都有自己的子目標,從而進一步復雜化了場景。在MDO中,預計一個子目標由無數復雜的戰略演習組成,這需要MAS的快速計算,以及使用最小計算資源(如在戰術邊緣計算)的最佳(或至少足夠)戰略。因此,一個可擴展的RL算法必須考慮到:1)環境和任務的復雜性;2)智能體(伙伴和對手)的數量,以便每個智能體能夠在通過RL學習過程中收集經驗時正確選擇行動。
環境復雜性(即智能體的狀態和行動空間的大小)可以指環境的狀態空間中可用的狀態數量,以及該環境中智能體可用的行動方案數量。RL算法的可擴展性是指在足夠復雜的狀態和行動空間中,在合理的時間和計算能力內計算最優策略的能力。環境的復雜性還包括納入額外的智能體(例如,擴展到MAS),其中狀態空間被放大以考慮到額外的智能體,而行動空間的大小被乘以該之智能體的數量。
通過使用狀態-動作對的表格來解決RL的可擴展性問題是不實際的,因為連續的領域會使表格無法維持,而且在合理的時間內同時更新所有智能體的表格條目是不可行的。即使有足夠大的計算資源(如過多的計算機內存)來包含所有的狀態,在每個狀態-動作對之間的學習也會太慢。與利用表格跟蹤狀態-動作對相反,一個解決方案是使用非參數函數近似器(例如,權重為參數的深度神經網絡)來近似整個狀態空間的值。然而,函數近似器必須是可微分的,這樣就可以計算出一個梯度,以提供參數調整的方向。
有兩種方法來訓練值函數近似器:1)增量方法和2)批量方法。增量方法使用隨機梯度,在梯度方向上調整近似器的參數,使估計值和目標值之間的誤差最小。然而,增量方法的樣本效率不高,因此不具備可擴展性。相比之下,批量處理方法從一組經驗中保存數據,并使用它們來計算函數近似值估計和目標值之間的誤差。批量方法與傳統的監督學習有共同之處,即結果是已知的(例如,數據被標記),計算近似值的估計值和實際結果值之間的誤差。這種類型的批量學習通常被稱為經驗重放。重復這個過程將導致最小平方誤差的解決方案。最近一個成功的經驗重放的例子是用深度Q網絡(DQN)玩雅達利游戲演示的。盡管函數近似法在復雜的環境中顯示出了成功,但如果不考慮額外智能體的加入(即非平穩性或部分可觀察性),單靠這種方法不太可能足以訓練出MDO場景的MAS。
與價值函數近似法相比,策略學習方法依靠策略梯度(PG)的計算來明確優化策略,而不是間接依靠價值函數。與函數近似方法相比,PG具有更好的收斂特性。PG方法比價值近似方法更受歡迎的主要原因是它們能夠在高維和連續的行動空間中有效(即在復雜環境中可擴展)。在蒙特卡洛(MC)策略梯度(例如REINFORCE算法)中,實際回報(選擇行動)與一個分數函數相乘,以計算梯度。該梯度被用于策略調整(通過改變參數值)以找到最大的回報行動。MC策略梯度具有高方差,收斂速度慢,因為它使用智能體的狀態-行動對在不同時間的整個軌跡來獲得一個返回值。另一種可能超越傳統函數近似方法缺點的解決方案是利用 "演員評論"方法。
在演員-評論家方法中,PG方程被修改為使用價值函數的近似值,而不是使用真實的行動-價值函數乘以分數(如REINFORCE算法)。這表明行為者按照評論者所指向的方向調整策略,以便使總的累積獎勵能夠達到最大。評論者的這一策略評估步驟可以通過使用組合值近似方法(即MC、時差-TD(0)和TD(λ))來完成。為了減少策略梯度的差異,可以使用一個優勢函數。優勢函數告訴我們,與一般的狀態值函數相比,一個行動比另一個行動(Q值)好多少。這意味著評論者必須估計Q值。一個有效的方法是使用TD-error,它是優勢函數的無偏樣本,評論者對一組參數進行近似。TD(λ)資格跟蹤也可用于評論者估計不同時間步長的值。有趣的是,MC(高方差)和TD方法可以與行為人一起使用,隨著時間的推移(即收集的經驗)修改策略。
由于MDO涉及軍事任務,RL算法必須有能力與許多其他智能體協調,以實現最佳的戰略機動,因此MAS的算法必須能夠與大量的智能體和異質資產一起擴展。算法的另一個重要能力是處理復雜狀態空間(即許多智能體)和多領域環境的大量觀察能力。在接下來的章節中,我們將討論在MDO中使用不同種類的RL算法對戰略機動的影響。
無模型算法可分為非策略性和策略性算法,其中狀態行動空間可以是連續的或離散的。在這一節中,討論了無模型算法的優勢和劣勢,以及它們如何與戰略機動相一致,從而實現MDO的目標。這一分析的目的是為尋找在MDO環境中實現戰略機動性的潛在算法方法提供方向。
深度Q網絡(DQN)是一種單一的RL智能體算法,它被訓練用來玩行動空間離散、狀態空間連續的Atari 2600游戲。DQN使用一個用Q-learning訓練的卷積神經網絡,從高維輸入(連續圖像)中學習。
DQN算法是一種有效的樣本方法,因為它利用所有收集到的經驗來提取盡可能多的信息。DQN足夠強大,可以使用相同的超參數進行訓練,玩六種不同的Atari游戲,其中智能體在其中三個游戲中的表現比人類專家更好。
然而,DQN的一個缺點是,在理論上不能保證訓練好的神經網絡實現穩定的Q值預測(即在不同的獨立模型中,訓練好的策略可能會有很大的差異)。
鑒于DQN本質上是一個單一的RL智能體模型,它應該不足以在MDO中進行戰略機動。在MDO中,多智能體RL算法可能更適合,因為智能體在執行時間內典型的分散化,允許智能體彼此獨立運作。此外,DQN的原始實現只利用了四個觀察序列來學習Q值,這對于MDO中的戰略機動來說是不夠的。多個資產的戰略機動通常不能在如此短的時間間隔內被捕獲。事實上,這是DQN在評估的三個Atari游戲(即Q*bert、Seaquest和Space Invaders)中與人類相比表現不好的主要原因。然而,存在一些DQN的變體來解決這個問題和其他弱點。
Bootstrap DQN就是這樣一個變體,它學習了一個Q網絡的集合,以提高采樣效率,并克服了傳統DQN的不足之處。行動消除是另一種與DQN一起使用的方法,以解決大的行動空間。帶有記憶類型的DQN(即循環神經網絡)也可以用來處理部分可觀察性。如果一個智能體需要為完成任務而導航環境,這種方法就特別有用。另外,分布式DQN返回一個分布信息,可用于評估策略風險和減少最佳解決方案周圍的方差或噪音。
盡管DQN及其修改后的變體在處理比簡單的Atari游戲更復雜的任務方面很有前途,但DQN方法本質上缺乏一個多智能體預測機制來進行協作戰術,而這是MDO中戰略機動的需要。此外,DQN在大多數情況下計算量太大,無法用于軍事相關環境。最后,DQN算法方法對未見過的例子(例如,伙伴的新行為或環境中出現的實體/障礙)缺乏足夠的適應性。
在現實世界中,大多數常規任務涉及連續狀態和行動空間。然而,DQN只考慮離散的狀態空間和低維的行動空間。處理連續狀態和行動空間的DQN的另一種方法是深度確定型策略梯度(DDPG)方法。DDPG通過結合價值函數近似和確定性策略梯度(DPG),推進了DQN方法的進展。DDPG利用行為批判的方法,可以克服連續空間的復雜性。這種無模式、非策略預測和控制算法可以執行物理控制任務(如車桿、靈巧的操縱、腿部運動或汽車駕駛)。
另一種使用深度神經網絡的方法是信任區域策略優化(TRPO)。這種方法直接構建一個隨機策略,而不需要演員-評論者模型(不要與環境模型混淆,這將使其成為一種基于模型的方法)。與TRPO類似,引導式策略搜索(GPS)不需要角色評論模型,而是使用軌跡引導的監督式策略學習以及一些額外的技術(例如,減少視覺特征的維度,在網絡的第一層增加機器人配置動態的信息)。因此,GPS的數據效率很高,如果需要的話,可以改編成DDPG。另一方面,PILCO首先學習一個概率模型,然后找到一個最佳策略。PILCO在某些問題領域具有很高的數據效率;然而,它的計算量很大。此外,D4PG對DDPG算法提出了一些改進:分布式評論者更新、分布式并行演員、N步返回和經驗重放的優先級,以實現對不同類別任務的更穩定和更好的解決方案。
從戰略機動的角度來看,DDPG算法的主要缺點是它被設計成一個完全分散的單一智能體算法(即獨立學習者)。因此,DDPG算法不便于在多智能體場景中進行協作。因此,使用DDPG所產生的戰略機動將不會產生協作的團隊行為。此外,DDPG不具備處理基于角色的多目標任務的能力,而這是軍事行動中戰略機動的要求。
RL智能體互動對于戰略機動的人工智能系統至關重要,不同的智能體可能需要組成團隊來抑制對手的戰略合作或抑制對手的協調。Q-Learning和PG方法分別受到非平穩性和高方差的影響。為了克服這些問題,多智能體深度確定性策略梯度(MADDPG)算法擴展了一個演員評論家方法,這使得它可以通過集中智能體訓練而對多智能體系統發揮作用。MADDPG框架采用集中式評論家家進行訓練,并在測試期間部署分散的演員。一個評論者(每個智能體都有一個)接收每個智能體的策略,這允許開發具有潛在不同獎勵功能的依賴性策略(例如,MADDPG允許訓練具有相反獎勵功能的對抗性團隊)。相反,演員(即策略網絡)在訓練和測試期間只擁有本地知識。演員(通過訓練)在與評論者評價一致的方向上反復改進策略。
MADDPG的一個主要弱點是,對Q函數的輸入隨著環境中智能體數量的增加而增加(不可擴展)。這給MDO中的戰略機動性帶來了問題。如果智能體需要被替換、添加、修改或移除,可能需要進行再訓練。在戰略機動中,智能體可能需要定期轉換角色或改變能力,這對MADDPG適應軍事領域構成了重大挑戰。此外,頻繁的再訓練將使快速戰略機動變得不可能。縮短訓練時間將減少邊緣的計算負荷,使快速戰略機動成為可能。MADDPG不能適應這種極端情況。對于軍事應用,希望有一個強大的對手或智能體模型,以便使作戰時間最大化(即有足夠的時間來執行戰略機動)。
為解決其可擴展性問題,對MADDPG的一個潛在修改是形成智能體集群,為集群而不是每個智能體單獨學習一個策略。在發生新事件的情況下,可以推遲重新訓練的需要,因為從理論上講,一個智能體集群將有一套處理動態情況的可變能力。此外,這將避免隨著智能體的修改或新智能體的引入而增加Q函數的輸入空間。然而,問題來了。我們怎樣才能將一個任務分解成部分獨立的子任務,并使最優分組策略的退化程度最小?
雖然MADDPG可以形成一組異質的多智能體策略,能夠完成不同的任務,但這種方法不能很好地擴展到十幾個智能體。隨著智能體數量的增加,策略梯度的方差會呈指數級增長。因此,這種方法不太適合MDO中的戰略機動,在這種情況下,必須考慮到40多個異質智能體的對抗情況。克服這一可擴展性問題的方法是均值場多智能體RL算法,該算法計算鄰近智能體Q值的均值估計,當智能體之間的鄰近互動變得復雜時,可能導致高誤差率。此外,進化種群課程算法的設計是為了通過將遺傳算法方法與RL相結合,使MADDPG具有可擴展性。隨著MADDPG的進步和該方法所顯示的成功,可以想象這些算法的進步會導致在模擬實驗中對MDO內的戰略機動性進行強有力的演示。
與MADDPG不同的是,反事實多智能體(COMA)方法對所有智能體使用一個集中的評論家,但被設計用于離散的行動空間。COMA比MADDPG更具可擴展性,但它可能導致一套同質的策略,在智能體能力充分不同、局部目標不同或獎勵函數不同的情況下可能失敗。與MADDPG類似,Minmax多智能體DDPG(M3DDPG)比MADDPG的原始版本增加了一項改進,允許智能體制定更穩健的策略來對抗對手(即具有對立獎勵結構的競爭游戲)。然而,M3DDPG仍然無法處理異質智能體被引入系統的情況。
在具有連續狀態和行動空間的環境中實施算法,有時需要利用常見的技術來操作輸入或輸出,如離散化狀態和行動空間或將離散的策略輸出轉換為連續輸出。轉換策略輸出的一個例子是OpenAI多智能體粒子環境中MADDPG的實現。在這個例子中,離散的策略組件被用來計算連續的行動。從另一個角度來看,多智能體轉化器軟雙Q學習算法將連續行動空間離散為一組速度和角速度控制,然后可以在運動模型中使用。盡管這些技術允許在連續環境中使用這種算法,但這些算法方法沒有用連續信息進行訓練,這可能會限制它們在物理環境中進行戰略機動的功效。
最近的一個基于價值的MARL算法系列在非常復雜的《星際爭霸2》模擬環境中被證明是相當成功的,其中根據智能體的本地Qa值學習了一個集中的聯合行動值Qtot。然后通過線性argmax算子從Qa中提取一個分散的策略。這種非常簡單而有效的分解方法避免了學習聯合行動值,而聯合行動值的規模并不大。如果增加新的智能體或用新的能力替換智能體,仍需進行再訓練。然而,與MADDPG相比,它更具有可擴展性,因為單個Q值僅從局部觀察中學習,避免了通過學習因子化的Qtot來學習聯合行動值。但是,當有超過40個智能體時,這個系列的算法的可擴展性可能會受到挑戰。為了使其更具可擴展性,已經提出了基于角色的算法RODE,其中智能體的角色是根據他們對環境的影響對他們的行動進行聚類來確定。該算法對于大量的智能體顯示了非常有希望的結果。
對于戰略機動,RODE算法是非常有前途的,因為各組智能體可以被分配到不同的角色,其中角色可以基于他們的行動和對環境的影響或任何其他固定的行為(對于盟友或甚至敵人)。然后,該算法可用于不同群體的戰略角色轉換。由于不同角色的行動空間受到限制,該算法收斂得非常快。這種算法也適合于基于角色的技術的戰略使用,這可能會在未來的工作中進行研究。即使RODE是非常可擴展的,我們也不清楚當新的智能體將被添加到環境中時如何調整它;需要學習一個集中的策略以實現最佳協作。
與RODE算法相比,一種可擴展的多智能體強化學習方法部署了一種熵-規則化的非策略方法來學習隨機價值函數策略,實驗表明它能夠擴展到1000多個智能體。如前所述,可擴展的RL算法關注環境的復雜性--系統或團隊中的智能體越多,狀態空間越大。RODE是有限的,因為它使用一個集中的策略,當更多的智能體被引入到環境中時必須重新訓練。多智能體轉化器軟雙Q學習算法是一種集中訓練的非策略學習算法(即共享一個中央經驗重放緩沖器),其執行是分布式的(即每個智能體根據其本地觀察做出自己的控制決定),而不是來自中央控制器。由于這種分布式的方案,當智能體被添加或從系統中移除時,團隊不受影響,繼續執行他們的策略。
在可擴展性方面,訓練大型MAS(即許多智能體)是很困難的,而且已經表明,即使是最先進的算法也不能為復雜的MARL任務學習到高性能的策略。多智能體變換器軟雙Q學習通過在訓練期間利用啟發式方法緩解了這一可擴展性問題,該方法允許在較小的智能體集合上訓練策略(例如,在目標追蹤場景中,四個智能體追蹤四個目標),并且該策略已被證明可以在執行中與更多的智能體一起工作而不需要任何調整(即用1000個智能體測試和評估)。訓練和執行過程中使用的啟發式方法使算法能夠解決智能體數量的巨大分布變化:它基本上將測試時的大型復雜觀察空間縮減為接近智能體策略最初訓練的內容。從軍事角度看,這種提法是戰略機動的理想選擇,因為現場的智能體可能會在原地丟失或獲得,可能要考慮額外的戰略信息。一個靈活和可擴展的算法提供了MDO中所需要的能力。
由于一些因素,包括科技進步,美國的對手正在變得更加先進。在未來的MAS自主戰爭中,協作的戰略機動可以為國防軍帶來某些優勢。在這篇文章中,我們討論了一些最突出的RL算法,以發現訓練MAS的可行候選策略,這些MAS可以有效地進行戰略機動,從而在未來潛在的軍事行動中打開機會之窗。本文描述了RL方法的分類法,并對最突出的RL算法進行了概述。研究發現,由于訓練和測試因素的不同,大多數RL算法缺乏處理與未來潛在沖突相關的復雜性的能力。
DEVCOM ARL ERPs為開發和實施智能MAS提供了一個規劃性的路徑。鑒于陸軍研究項目為美國國防行動提供了關鍵研究問題的答案,AIMM和EOT ERPs特別促成了研究,可以為協作的自主MAS提供一個路徑,可以克服與1)環境,2)對手戰術和能力,3)自身能力(即,獲得新的能力,失去以前的能力,或能力被改變),4)團隊組成(例如,增加、刪除或交換隊友),5)戰略團隊定位、進入、導航(機動)以支持部隊并壓倒對手,以及6)任務目標。最近,AIMM和EOT ERP在這一領域的工作闡明了衡量MAS協調性的方法,并允許開發一個框架來訓練和測試執行各種任務的MAS的協調性,此外還評估了利用一系列集中訓練技術的新算法方法。
此外,還需要進行更多的調查,以闡明有利于在ISTAR任務和其他交戰場景中利用MAS的軍事戰略。在淺顯的情況下,將完全自主的MAS送入高風險情況(即預期因果率高的情況)是可取的;然而,由于目前的技術限制,僅僅期望MAS能夠在沒有人類監督或干預的情況下完成任務是不夠的。因此,在未來的工作中,將進行研究以確定一套強有力的交戰方案。最后,這項工作將導致自主MAS的最終整合,以便在未來的軍事行動中盡可能地協調戰略機動。
在多域作戰(MDO)概念的影響下,空中力量界的戰略思維正在發生巨大的變化。20世紀90年代,武裝部隊廣泛進行了 "轉型 "工作,目的是改善各軍種之間的協調。到了2000年,轉型工作的目標和目的發生了變化,改善協調的愿望促使各軍種和聯盟伙伴之間進行更深入的行動整合。MDO將轉型目標推向了最終融合各作戰領域的能力,以便能夠以更快的行動速度實現同步效果(Jamieson和Calabrese,2015)。然而,并非所有國家都清楚如何準確地將美國的MDO愿景納入他們自己的理論和作戰概念,或如何解決可能產生的整合和互操作性挑戰(Townsend,2019)。
MDO的預期目標是加快軍事行動的步伐,并允許在作戰環境中產生更多的協同效應。多領域整合有望優化作戰優勢,以便對敵對部隊的決策環路施加壓力。同時,MDO也意味著聯合作戰方法需要相當大的演變和必要的改變,因此它的影響將隨時對友好部隊產生同樣深刻的影響。正如法國防空和空中作戰司令部(CDOA)副司令路易斯-佩納少將所指出的,MDO代表了 "思考空軍在未來如何規劃和進行空中作戰的機會"(Pena,2020)。可以肯定的是,MDO將是塑造未來空中作戰和作戰概念的一個強有力的因素,然而需要克服一些復雜的概念、技術和戰略挑戰。
未來的作戰飛機被設想為 "連接中心 "和 "機載數據融合服務器",與作戰云相連,為聯合或聯盟部隊的分布式單位提供實時多領域信息。這些下一代作戰飛機被預先部署,以承擔目前空軍分配給機載預警和控制(AWAC)飛機的相同角色。自從Link 16的到來,AWACS已經成為空中作戰的一個關鍵節點功能,在最近幾十年里,通過在聯合和聯盟戰役中實現徹底改善的態勢感知和指揮、控制和通信(C3)能力,AWACS被證明對西方的空中優勢很有幫助。
聯盟環境下的互操作性挑戰正在被重新規劃,并將隨著新的作戰飛機和平臺的引入而出現新的方向,但目前還沒有明確或現成的解決方案來彌合理論和作戰概念的差異,或在聯盟環境下進行技術整合,因為聯盟中的空軍部隊各自帶來自己的能力、工具和平臺。
在未來,數據融合和中繼功能將變得更加分散,并越來越多地轉移到作戰飛機本身,它們將能夠協調無人機群,例如,穿透敵人的防空設施或提供動能效應。通過新一代數據和通信網絡的新工具和更快的決策,作戰飛機將作為關鍵的指揮和控制(C2)節點,在多領域空間內運作。因此,空戰行動將不再與一組有順序的任務相關聯,而是與基于對方部隊活動并對其作出高度響應的單一連續的非分割化機動和效果相關聯。
圖:信息系統互操作性層次(LISI)模型
空戰的特點是更加明智地應用武力經濟,利用速度、飽和度和隱身性("V2S"--速度、飽和度、隱身性)的結合來壓倒對方的部隊,以實現戰斗空間的優勢。這些未來的概念依賴于一個系統的方法,其核心是指揮、控制、通信、計算機、情報、監視和偵察(C4ISTAR),每個單獨的軍力矢量同時作為傳感器和效應器發揮作用。與數據融合、自動化、機器人和人工智能(AI)有關的能力對于實現 "頻譜優勢"--在整個作戰范圍內的優勢至關重要。
空戰將逐漸變得更加依賴多領域態勢感知和信息主導權。然而,作為中央庫或大腦單一的、總體性的作戰的前景在聯盟環境中帶來了復雜的問題。與這種作戰云的永久連接會給聯盟部隊的組成部分帶來明顯的脆弱性。雖然在力量集中和效率方面有優勢,但同樣的權力集中和對一個中央云的依賴會產生災難性的行動自由損失。敵對勢力的目的是阻礙通信并對傳感器網絡使用誘餌,在這樣一個良性的網絡空間和電磁戰的背景下,"一環 "作戰云可能導致其使用用戶群的行動癱瘓。
在考慮這些風險時,圍繞作戰云概念的關鍵使能技術的成熟度存在著嚴重的問題。收集、分析、存儲和傳輸數據的信息系統和技術都會受到敵對勢力的入侵威脅和復制,以提高其反介入/區域拒止(A2AD)的有效性(Orlin, 2021)。大數據是分布式C2要素之間作戰圖像(CROP)的基本必要條件,如果沒有人工智能,就無法適當地加以利用,由于人工智能容易被操縱和欺騙,其使用仍然存在問題。
預測性維護是未來空戰平臺的本源,并將通過網絡不斷進行交流,它在戰爭空間中提供了一個新的攻擊漏洞,并有可能成為嚴重的目標(Hitchens, 2020)。對潛在的軟件缺陷和限制的利用將為敵對勢力在欺騙、規避和突襲行動方面創造機會。針對通信和傳感器網絡的先進干擾,針對作戰云的進攻性網絡戰行動(Gros,2019年),以及對空間資產的依賴,在地面或空間資產被摧毀或關鍵數據鏈被破壞的情況下,會帶來嚴重的風險(法國國防和國家安全戰略評論,2017年)。
無人機技術的擴散和作戰系統的數字化已經迫使歐洲的空軍和他們的姐妹服務部門集中投資于網絡空間對抗措施,并 "加固 "平臺、資產和操作基礎設施,以確保通信節點和發射器不被破壞。這種努力將加速和加強,因為軍事競爭者的目標是數據和數據連接能力,跨越更廣泛的攻擊面,擴展到所有連接到同一云的聯盟或盟國部隊。因此,多域作戰網格的這種內在風險強調需要考慮在 "一環 "設計之外的聯盟環境中開發用于MDO的未來作戰云。
在歐洲,空軍之間的行動整合一直在穩步推進--北約因素是一個重要因素,但絕不是在加強歐洲空軍之間互操作性方面取得進展的唯一驅動力。然而,歐洲空軍的格局仍然具有相當大的多樣性,目前服役的1,900多架作戰飛機的不同類型就說明了這一點。
由美國主導的F-35項目匯集了包括英國、荷蘭、丹麥、挪威、比利時和意大利在內的一些歐洲國家。F-35作為第五代作戰飛機為歐洲引入了一個新的模式和互操作性標準,這將與它的運營商一起,在未來幾年內對整個歐洲空軍的互操作性努力和計劃起到強有力的作用。然而,大多數F-35用戶繼續保持更廣泛的戰斗機隊--例如,由于F-35在空中優勢任務中的局限性,歐洲臺風戰斗機(Eurofighter Typhoon)可能仍然是英國不可或缺的。出于類似的原因,"臺風 "可能將繼續由意大利、德國和西班牙運營,類似的考慮可能延伸至F-16的運營商,如比利時、丹麥、希臘、荷蘭、挪威、葡萄牙和土耳其。
圖:未來網絡化多域作戰中的互操作性要素
其他歐洲空軍已經獲得了諸如 "鷹獅"-E和 "陣風 "等作戰飛機,"陣風 "具有AESA雷達和數據融合能力,可以被視為事實上的未來歐洲互操作性的標準。芬蘭正在推行其HX戰斗機計劃,有五個作戰飛機平臺積極參與競爭。2040年及以后,歐洲可能會繼續看到下一代作戰飛機的本土化發展,并且隨著它們的發展,新的互操作性標準被插入到采購和作戰計劃框架中。考慮到FCAS(未來戰斗航空系統)和英國 "暴風雪 "的發展,作為例子--這兩個平臺將與遙控和自主系統及中繼器結合,并在基于云的多域數據交換網絡內運行。
因此,空戰行動將不再與一套有順序的任務相關聯,而是與基于敵對部隊活動并對其作出高度響應的單一連續的非分割化機動和效果相關聯。
歐洲空戰機隊現有的和未來可能的多樣性,表面上看可能意味著不必要的能力重復,然而這些方法和能力的同樣差異也在作戰和戰略層面上提供了更大的彈性。在聯盟環境中,目前還不清楚歐洲的空戰機隊將在多大程度上與例如現在進入歐洲作戰服役的F35戰斗機進行互操作。同樣的問題在理論上也適用于FCAS或 "暴風雪",這些圍繞兼容性和互操作性的問題將延伸到未來,特別是與MDO有關的問題。
聯盟環境下的互操作性挑戰正在被重新規劃,并將隨著新的作戰飛機和平臺的引入而出現新的方向,但目前還沒有明確或現成的解決方案來彌合一方面的理論和作戰概念的差異,或在聯盟環境下的技術整合,即組成空軍各自帶來自己的一套能力、工具和平臺進行戰斗。具有諷刺意味的是,多領域整合的基本前提和目的是解決不同領域的不同類型的平臺之間缺乏或低兼容性和協同性的問題,而這些平臺是使用不同的技術標準和系統工程方法開發的。
向MDO的演變意味著空軍面臨新的挑戰,在聯盟環境中為聯合平行規劃引入新的動力。它還提出了調整或取代現有機制的需要,這些機制是為了使聯盟伙伴之間的整合和互操作性達到必要的水平,使他們能夠有效地共同運作。隨著朝向MDO的運動的加速,它提出了一個基本問題。當屬于聯盟和同盟的空軍由于不同的工業和政治考慮而在系統和網絡設計中采用不同的標準時,互操作性是否可能?
這個問題突出了與2040年及以后未來時間框架中的互操作性有關的不確定性,以及在歐洲范圍內已經面臨類似挑戰的當前空戰機隊。歐洲空軍將需要應對作戰層面的聯合整合和融合的要求,這將需要與延伸到國家戰略領域的更高層次的政策考慮相平衡,包括行動自由和戰略自主權。在這種情況下,歐洲空軍將需要根據國家或歐洲的政策方向,與能力項目和互操作性目標進行互動和規劃,這些政策方向是由復雜的體制因素和議程形成的。
一個合理的論點是,在聯盟環境中,空軍之間的分布性和數據融合可能帶來的好處超過了共享作戰云所造成的相關風險或發生作戰癱瘓的可能性。然而,除了純粹的作戰考慮,還有重要的政策問題,這些問題由大戰略和政治前景決定。即使在世界觀相似、經常在聯盟和聯合作戰密切合作的盟友和伙伴之間,國家政策也會有分歧--特別是在危機情況下的軍事活動方面。
繼續努力實現聯盟和盟國伙伴之間的互操作性是有歷史緣由的,包括在作戰云的背景下所暗示的。然而,這些努力必須與維護戰略自主權和獨立評估或軍事活動能力的需要相平衡(Binnendjik和Vershbow,2021)。有時被視為導致 "能力重復 "和浪費財政資源的不同方法以另一種方式提供了優勢,即為國家和聯盟的聯合作戰建立自然的防火墻和復原力。
考慮到聯盟空戰模式的當前和未來的發展,保持一定程度的自主性可能與確保新興作戰云本身一樣重要。這在歐洲尤其如此,因為聯合作戰機隊可能由一系列的平臺類型組成,每個平臺都是根據不同的系統工程、技術和互操作性標準開發的,這與工業和政治考慮有關。同樣的基線挑戰可能會被移植到世界其他地區,如中東或亞洲。與其試圖將空戰機隊劃分為 "第一 "和 "第二 "層次的能力,聯盟和盟國伙伴將需要集中精力克服挑戰,并為傳統聯盟環境中的MDO提供整合能力和互操作性解決方案(Binnendjik等人,2021)。
作者
奧利維爾-扎耶克(Olivier Zajec),畢業于圣西爾軍事學院和巴黎政治學院,是里昂讓-穆蘭大學的政治學教授以及戰略與防務研究所(IESD)的主任。他是EA 4586實驗室和巴黎比較戰略研究所(ISC)的研究員。他還在法國聯合戰爭學院講授戰略理論。他目前的研究興趣集中在國際關系的現實主義理論、跨大西洋防御政策、核政策和戰略以及地緣政治理論。他經常為各種國防和國際關系出版物撰稿:《世界外交》、《國防與國際安全》(DSI)、《軍事資源》、《中國世界》、《沖突》、《國防評論》。
美國防部官網3月17日報道,2022年3月15日,美國防部副部長凱瑟琳·希克斯博士簽署了“聯合全域指揮與控制(JADC2)實施計劃”(2021年9月提交),同一天國防部官網公開了“聯合全域指揮與控制(JADC2)戰略概要”(2021年5月美國防部長簽署發布JADC2戰略,戰略全文為秘密級)。由于JADC2戰略和實施計劃的保密性,從此次放出的“戰略”摘要可看出其實施計劃的大致輪廓。
在當前的全球安全環境中,美國軍隊面臨著敏捷的對手,他們越來越多地試圖通過阻礙,并在可能的情況下拒絕我們(美軍)的指揮和控制(C2)能力來破壞戰略和行動優勢。美國軍隊重新獲得并保持信息和決策優勢的能力是國防部的首要任務之一。
美國國防部 (DOD)聯合全域指揮與控制 (JADC2) 戰略描述了迫切需要集中力量推動部門行動,以增強其的聯合部隊指揮官在所有作戰領域和整個電磁頻譜范圍內指揮聯合部隊所需的能力,以威懾、并在必要時在全球任何時間、任何地點擊敗任何對手。
JADC2 戰略為識別、組織和提供改進的聯合部隊指揮和控制 (C2) 能力提供了愿景和方法,并說明了對手已經關閉了其賴以取得作戰成功的許多能力和方法優勢。作為一種方法,JADC2 支持使用創新技術開發物資和非物資解決方案選項,同時愿意修改現有政策、權力、組織結構和作戰程序,從而為聯合部隊指揮官提供信息和決策優勢。
全球安全環境的快速變化給美國軍隊和聯合部隊抓住、保持和保護我們對對手的信息和決策優勢的能力帶來了新的重大挑戰。此外,我們必須預見到未來的軍事行動將在退化和有爭議的電磁頻譜環境中進行。這些挑戰要求部門作出一致和集中的努力,使我們開發、實施和管理C2能力的方式現代化,以便在所有作戰領域、跨梯隊和與我們的任務伙伴一起取得勝利。
JADC2為塑造未來聯合部隊的C2能力提供了一個連貫的方法,旨在在戰爭各個層次和階段、在各個領域以及與合作伙伴一起,產生感知、理解和行動的作戰能力,以便以相關的速度提供信息優勢。作為一種方法,JADC2超越了任何單一的能力、平臺或系統;它提供了一個機會來加速實施聯合部隊進行C2的方式中所需要的技術進步和理論變革。JADC2將使聯合部隊能夠使用越來越多的數據,采用自動化和人工智能,依靠安全和彈性的基礎設施,并在對手的決策周期內采取行動。
這一戰略的成功實施需要整個國防部(DoD)的明確決心。為此,JADC2戰略闡明了 "感知"、"理解 "和 "行動 "這三項指導性的C2功能,以及另外五條持久的努力方向(LOEs),以組織和指導提供JADC2的物資和非物資能力。這些工作重點包括 (1)建立JADC2數據企業;(2)建立JADC2人力企業;(3)建立JADC2技術企業;(4)將核C2和通信(NC2/NC3)與JADC2相結合;以及(5)使任務伙伴信息共享現代化。
這一戰略得到了JADC2戰略實施計劃的支持,該計劃確定了JADC2的最終狀態、關鍵目標和任務,并通過既定的部門授權、論壇和程序來同步和簡化工作,以確定JADC2能力的優先次序、資源、開發、交付和維持。現有的軍種和機構的開發和采購過程通常會產生特定領域的能力,無法滿足全領域C2的作戰需求。JADC2的方法將覆蓋這些現有的程序,目的是促進跨領域、聯合能力的發展。
該戰略提供了六項指導原則,以促進整個DoD在提供物資和非物資JADC2改進方面工作的一致性。這些原則是 (1) 信息共享能力的改進是在企業層面上設計和擴展的;(2) 聯合部隊C2的改進采用分層安全特性;(3) JADC2數據結構由高效、可發展和廣泛適用的通用數據標準和架構組成;(4) 聯合部隊C2必須在退化和有爭議的電磁環境中具有彈性;(5) 部門開發和實施過程必須統一,以提供更有效的跨域能力選擇;以及,(6) 部門開發和實施過程必須以更快速度執行。
JADC2戰略的結論是,迫切需要使用一個全企業的整體方法來實施物資和非物資的C2能力,以確保聯合部隊指揮官在整個競爭過程中獲得并保持對全球對手的信息和決策優勢。
JADC2戰略闡明了國防部為支持美國國家安全利益而推進聯合部隊C2能力的方法。國防戰略指示聯合部隊 "獲得并保持信息優勢,特別是在網絡空間、太空和電磁波譜方面"。將JADC2從指導聯合/整合能力發展的概念變為現實的巨大任務需要一個清晰的愿景、有效的戰略和靈活的流程。JADC2的成功實施將產生更好的聯合部隊C2能力,并需要加速應用技術解決方案來發展C2能力,以及調整管理政策和作戰程序。
圖1 JADC2邏輯圖
JADC2提供了一種方法來開發作戰能力,以在所有領域和合作伙伴的各個層面和階段感知、理解和行動,以相關的速度提供信息優勢。
圖1描述了實現全域C2的復雜性:聯合部隊指揮官依靠多年能力開發和實施的指導、技術、程序和能力,以便在行現實世界任務中使用有效的C2任務。
JADC2尋求優化信息的可用性和使用,以確保指揮官的信息和決策周期相對于對手的能力運行得更快。這種整體觀點將聯合部隊指揮官確定為軍種和機構C2能力發展工作的主要受益者,并將部門C2能力發展成果集中在提供聯合、全域操作C2性能和熟練程度。為實現這一目標,JADC2將覆蓋現有的基于軍種和機構的C2能力開發計劃框架,這些計劃目前向聯合部隊提供以領域為中心且經常重復的信息和決策管理能力。
這種“疊加”方法是一種協作方法,其中所有C2能力開發利益相關者都支持JADC2作為優化開發資源和優先級以及最大化作戰成果的統一方法。
JADC2戰略通過(1)聯合部隊指揮官在作戰環境中“感知”、“理解”和“行動”的需要,以及(2)使用五個職能領域來組織其改進聯合部隊C2的方法重點或LOE,以指導改進的C2聯合部隊能力的開發和實施。在這種方法中,JADC2整合了現有的部門、軍種、機構和運營需求和能力開發流程,以塑造未來物資和非物資C2能力的交付。
該戰略的實施由JADC2跨職能團隊(CFT)監督,該團隊是國防部副部長特許機構,由來自作戰司令部、軍種、國防機構、聯合工作人員和OSD工作人員。識別和實施優先C2改進的主要方法是執行JADC2實施計劃。
“感知和集成”是發現、收集、關聯、聚合、處理和利用來自全域(友好的、敵對的和中立的)數據的能力,并將信息作為理解和決策的基礎進行共享。JADC2通過使用聯合數據架構的各種情報傳感和信息共享網絡,支持聯合部隊和任務伙伴共享創新數據,利用遠程傳感器、情報設備和開放資源感知、集成全域內外信息,使聯合部隊指揮官能夠獲得信息和決策優勢。
“理解”指的是分析信息,以便更好地理解和預測作戰環境、對手的行動和意圖、以及自身和友軍的行動。JADC2將利用人工智能和機器學習幫助指揮官快速決策,其將直接從傳感基礎設施中提取、合并和處理大量數據和信息,以保證對作戰環境的可靠、持續、實時了解,并在整個聯合部隊和任務伙伴之間共享。這將要求聯合部隊調整和更新現有的戰略、戰役、戰術級的指控流程和能力,同時這些規程和技術的進步將大大增強聯合部隊在降級環境中的作戰能力。
“行動”指的是向聯合部隊及其任務伙伴做出決策并分發的過程。JADC2將使用規劃和決策支持工具,并依托先進、彈性和可靠的通信系統、無障礙和全面的信息基礎設施以及靈活的數據格式,確保快速、準確和安全地傳遞決策。同時,JADC2將使用任務式指揮的方法,下屬指揮官通過了解高級指揮官的行動意圖,可按照原則被授權自主采取行動,同時保留在通信中斷時或行動緊急情況下采取行動的能力。
JADC2戰略圍繞五個LOE組織,以指導部門在提供JADC2能力方面的行動,如下所示:1)數據體系;2)人力資源體系;3)技術體系;4)與核C2和C3集成;5)使任務伙伴信息共享現代化。每個LOE都由一個主要責任辦公室指導,該辦公室由高級標志/SES人員代表,他們有權通過其聯合能力委員會提出問題并與聯合需求監督委員會互動并提供支持。JADC2戰略實施計劃中描述了其他JADC2治理細節。
數據是一種戰略資產,必須由聯合部隊有效管理,使其能夠抓住、維護、并保護信息和決策優勢。為了加快決策速度,聯合部隊和我們的任務合作伙伴必須能夠發現和訪問來自所有作戰領域的任何數據和信息。以下關鍵數據標準化目標將直接影響聯合部隊指揮官管理和使用數據的能力:
作戰環境中不斷增加的數據和信息可用性有可能使聯合部隊收集和匯總此類信息的技術手段不堪重負。現有的組織結構和決策流程正在被趕超,需要新的方法來確保聯合部隊指揮官抓住機會和保持優勢的能力,從而加劇了這個問題。
LOE2特別關注人類在C2能力方面的表現,并解決了創新人工智能和機器學習工具的使用問題。反過來,此類創新將推動制定預先確定的、預先批準的、事件驅動的、捆綁式授權的需求,以實現快速、相關的決策從戰略層面到戰術邊緣。這可能需要改革、重新調整或創建具有結構、敏捷性和資源的組織,以更有效地融合聯合部隊及其任務伙伴的物理和信息力量,使他們能夠對聯合信息優勢(JIA)進行有效控制操作。 該LOE還解決了培訓和教育領導者精通所有作戰領域作戰所需的專業發展。它將指導和支持JADC2政策、作戰概念(CONOPS)、條令以及戰術、技術和程序(TTP)方面的發展,以優化通過JADC2新能力獲得的優勢。為此,兵棋推演、實驗、演示、評估、訓練和演習的設計必須集中在競爭和沖突期間作戰的C2方面。同樣,國防部員工必須精通識別制度變革,以實現和維持改進的JADC2能力開發流程和產品。
該LOE解決了增強的共享態勢感知、同步和異步全球協作、戰略和作戰聯合規劃、實時全球部隊可視化和管理、預測部隊戰備和后勤、動態和非動態聯合和遠程實時同步和整合?射程精確火力,以及評估聯合部隊和任務伙伴表現的增強能力。
聯合部隊指揮官需要具有足夠速度和帶寬的安全的全球通信網絡,以滿足國家司令部和作戰司令部的作戰需求。LOE3解決了JADC2生態系統的傳輸基礎設施,并提供了基本的最低功能確保持續C2能力所必需的,包括通信系統的彈性和多樣性、多級安全性以及消除單點故障。這些經過網絡強化的先進技術將顯著提高指揮官組織、理解、計劃、決定、指導和監控所有聯合部隊和任務伙伴在所有領域以及在電磁頻譜使用退化和競爭期間的所有行動的能力。
在適當的情況下,JADC2方法將與核C2和通訊。
聯合部隊指揮官通過與任務伙伴共享態勢感知,不斷努力建立和保持對作戰環境的共同理解。當來自每個合作伙伴的C2系統的數據可以被每個其他批準的合作伙伴訪問、查看和采取行動時,就可以實現理想的任務合作伙伴系統集成。然而,新興任務、大型聯盟和不斷發展的技術為實現這一目標帶來了持續的障礙。歸根結底,JADC2系統互操作性對于以速度、精度、相關性和安全性進行聯合和合作作戰至關重要。該LOE力求擴大和提高聯合部隊在所有類型的聯合作戰中交換信息和協調行動和效果的能力。
JADC2方法的實施遵循以下總體原則。
在戰略層面設計和擴展信息共享能力
JADC2基于戰略層面設計和操作,依賴多個戰略節點和通信支撐網絡,提供傳遞重要信息所需的帶寬、功能和安全的全球鏈接能力。
安全
聯合部隊C2必須采用以強大網絡防御為先導的分層防御,以阻止可能威脅企業運營的惡意活動。聯合部隊必須有明確的政策指導、足夠的權力、充分的訓練、及時的情報以及在全球競爭環境中進行安全C2所需的技術。國防部必須在日常行動中采取戰時思維例如,邊打邊訓練并培養知識淵博的領導者和受過訓練的員工,以使用他們所掌握的工具和權威。
通用數據和互操作性標準
聯合部隊數據結構必須由高效、可演進和廣泛適用的通用數據標準和架構組成,并具有標準化的關鍵接口和服務,以便在具有各種不同類型的大型環境中訪問、聚合、管理、存儲、處理和共享數據合作伙伴和運營。
在降級的環境中保持彈性
聯合部隊必須能夠在降級或有爭議的C2環境中以最低限度的指導行動,指揮官和參謀人員必須在傳感和通信受到嚴重影響或完全癱瘓以及對手意圖不明確的情況下進行積極訓練。
在能力建設中保持統一
國防部必須改進其指揮控制能力開發和實施流程,以便更容易地采用跨域優先事項和解決方案選項。JADC2 CFT是部門能力開發人員討論、識別、協作和推薦機會的場所,以改進軍種和作戰領域內的C2信息共享和互操作性。
快速交付JADC2能力
國防部必須繼續發展其當前的C2開發和采購方法,并調整現有方法以更快地產生所需的能力。
全球安全環境的變化,包括針對美國的不斷增加的惡意行動和信息技術的廣泛進步,為聯合部隊帶來了緊迫的挑戰和機遇。JADC2戰略通過推進互連和企業范圍的方法來提供支持全球一體化作戰的物資和非物資能力,從而應對這些挑戰和機遇。這些能力將直接和顯著提高指揮官獲得和保持信息和決策優勢的能力。
JADC2戰略闡明了一種企業方法,用于在所有作戰領域和整個電磁頻譜中改進聯合部隊的C2。它解決了人類決策的獨特方面,并尋求新的機會來增強C2的認知方面。該戰略確定了關鍵的C2功能,即感知、理解和行動,以及組織和指導改進的C2能力的開發和實施的五個努力方向。
JADC2方法成功的核心是JADC2 CFT。該機構將協作推動整個國防部可衡量的積極變化,以實現全域C2所需的能力、能力、持久性和全球影響力。
今天,人們普遍認為,信息就是力量,雖然這個眾所周知的公理看起來很老套,但近年來,聯合部隊在信息戰(IW,information warfare)環境中經歷了快速變化。軍事資產被賦予聯合部隊或其組成部門,在網絡空間領域的新興工具和作戰云概念的支持下,越來越多連接在部隊范圍或部門間產生。在幾乎任何人都可以進入的信息環境中,實現主導地位目標,在一個跨越物理世界和虛擬世界的新興超級連接現實中面臨新的復雜挑戰。聯合部隊在進攻和防守方面都沒有單獨的責任或權力,這種二分法在新出現的作戰環境中尤為突出,在這種情況下,越來越多的行為者和參與者變得越來越明顯。因此,在聯合和分布式跨域作戰中,未來的網絡攻擊方法將需要從根本上改變和重新調整,以響應聯合部隊作戰空間性質和范圍的根本變化。
聯合部隊調整系統、網絡和作戰方法以在未來的競爭環境中實現優勢,需要對諸如 "信息環境 "和 "信息戰 "本身等分類法所推斷的內容進行重新概念化。即使在今天,我們也應該問自己,什么是IW,它與聯合部隊的傳統軍事行動和活動有何不同,以及它將如何影響全域指揮和控制結構?在為未來建立一支靈活而有彈性的戰斗部隊(包括網絡空間領域)的更廣泛努力中,網絡攻擊的定位是什么?這些都是令人困惑的問題,必須考慮 "權力"的重要因素是如何因信息革命而發生變化的。重新思考當今世界的大戰略是理解聯合部隊必須在理論、規劃和行動方面調整其未來方法的關鍵。越來越多的人以新的和新穎的方式測試和使用IW,聯合部隊使用IW的頻率和復雜性也越來越高,且這種情況只會加快。
信息中蘊含著巨大的力量,雖然 "傳統 "的軍事方法強調并尋找 "新 "的IW效果,但這些可能并不反映聯合部隊的最佳解決方案,也不能提供必要的優勢,因為網絡空間與計劃和作戰周期的融合正在進行中。IW的范圍、性質和特點已經擴大,然而IW在戰術、技術和程序(TTPs)以及大戰略本身的層面上仍然是一個模糊不清、定義不明的概念。信息革命導致了新的組織和行為者的形成,以及商業甚至非國家行為者在聯合部隊 "虛擬 "作戰領域中的重要性日益增加。因此,越來越多的人需要把這些在信息環境和網絡空間范圍內活躍的、最終影響到聯合部隊如何成功執行任務的、日益增長的、不同的利益相關者和行為者集合起來。
變得更有活力和反應能力的目標將要求聯合部隊在其互動和影響或被影響的信息環境中,產生一個更 "真實 "的IW威脅和風險的戰略和行動畫面。安全模式從軍事主導的格局轉移到一個新的格局,這個格局更加分散,跨越了更大深度和廣度的利益相關者和合作伙伴,這說明了在戰略和作戰層面上,網絡攻擊具有不連貫性。要真正理解戰略和作戰環境中正在發生的變化,關鍵是要理解近年來國家權力結構中發生的巨大變化。具有諷刺意味的是,很少有一個正式的政府部門或機構或作戰單位只關注信息力量,負責控制和分配這種權力。然而現實情況是,信息力量被稀釋在一系列的機構和組織中。
隨著聯合部隊向跨領域綜合作戰能力的轉變,這些能力本質上是由信息領域促成的,而信息領域從本質上講是一個不透明的領域,模糊了物理世界和虛擬世界,因此越來越需要在與空戰或陸戰相同的水平上認識IW。
試圖現在聲稱或圍繞什么是信息力量的要素設定界限,對聯合部隊和類似的其他部隊來說,都將是徒勞的。這有令人信服的理由,即處理分類學和組織關系,以及無法為IW任務設定明確的界線和資金。針對越來越多的政府和軍事機構的任務,只會阻礙一個連貫的、綜合的國家信息主導戰略的發展,在這個戰略中,整個軍隊,特別是聯合部隊是多個組成部分中的一個。在過去,聯合部隊或其組成部分的作戰C2僅由 "他們 "各自的指揮部負責,他們有自己的通信系統,但現在情況不一定如此。例如,問一下,誰在戰略層面上控制著信息力量和信息資源?如果不是聯合部隊,那么聯合部隊怎么可能成為IW的關鍵C2機構?
如果反擊敵對勢力的行動是海陸空部隊的任務,那么影響 "他們 "行動的網絡攻擊的性質和范圍已經擴大,他們今天將如何處理這些任務?戰斗網絡的設計是可靠的、有彈性的和嚴格的,在某些情況下,它們是唯一的通信手段,但在多領域背景下,敵對勢力為了破壞、降低或延遲今天的行動,還可以在許多方面進行網絡攻擊,例如物流和供應鏈。隨著聯合部隊向綜合跨域作戰能力的轉變,這些能力本質上是由信息領域促成的,而信息領域的性質是不透明的,模糊了物理世界和虛擬世界,因此越來越需要在與空戰或陸戰相同的水平上認識IW。
這一點尤其正確,因為大多數聯合部隊的行動預計將發生在高度競爭和分布式的環境中,在這種環境中,IW將是競爭空間的一個固有特征。然而,隨著預算的限制,威脅的增加,以及更多的行為者出現在這些空間中,聯合部隊的指揮官發現他們處于一個關鍵的決策點。聯合部隊將需要產生新的方法、手段和目的來快速處理大量的信息,并與更多的合作伙伴、客戶和這些信息資源和數據庫的消費者一起這樣做。作為綜合布線的一部分,信息管理、連接和流動將成為核心任務要素,聯合部隊將需要向一個更加綜合和相互依存的現實轉變,以便將信息領域新的關鍵作戰要素和層次納入其規劃和作戰周期。
IW的范圍、性質和特點已經擴大,但在戰術、技術和程序(TTPs)以及大戰略本身的層面上,IW仍然是一個模糊不清、定義不明的概念。
對于聯合部隊來說,解決其重點是否應該更多放在進攻性或防御性IW上的問題將是至關重要的。許多人同意,聯合部隊應該發展并保持進攻性和防御性IW能力的平衡,但前者有更多的限制。最終,聯合部隊將需要通過明確其未來的IW目標、能力和目的的范圍來解決這些問題,考慮長期的戰略需求,但要理解什么是對其在短期內有效執行作戰任務而絕對必要的戰術。
信息戰活動將越來越多地使用或依賴商業網絡,或以重要方式與商業網絡互動。這些網絡和工具將阻礙聯合部隊利用傳統的電子戰工具和網絡戰行動。作戰規劃者將需要在IW方面與全新的參與者、網絡、系統和其他因素進行斗爭。聯合部隊將不再在真空中規劃任務,而是越來越需要了解、意識到并與更多的機構和商業行為者進行行動協調。這將是一個非常復雜的挑戰,需要制定必要的合作框架,以允許聯合部隊與情報機構、第三方后勤供應商、聯盟伙伴的各種部隊元素等進行有效的協調和信息流動。
我們可以從很多方面來考慮影響IW未來方向的因素。首先,IW是否存在真正的作戰要素?如果有,誰擁有它,它的控制和影響范圍是什么?任何聯合部隊的IW戰略都不應該只是國家權力工具的一個子集,而應該與之完全融合,跨越所有領域,包括陸地、海洋、空中和太空。隨著聯合部隊學會更無縫地同步效果,對信息環境的支配將成為其整體成功的關鍵。IW將需要從規劃開始就嵌入到所有的活動中,而不是在最后才 "添加 "或孤立地規劃。聯合部隊將需要研究它打算產生什么效果,然后為此選擇適當的武器或行動。從理論上講,真正的跨領域的全方位瞄準應該提供一種可供選擇的動能效果,甚至是純粹的信息效果,作為備選方案。
這將如何影響聯合作戰環境中的C2,以及在認識到信息戰的發展現實、范圍和需求以及所需能力的情況下連接作戰力量的目標是至關重要的。要問的硬問題是:"我們到底在什么方面不能控制?在IW方面,我們到底不能控制什么?在這里,我們需要考慮外國和國內團體網絡行動日益增長的作用和重要性,以及網絡攻擊實際上是一個轉型的概念而不是一個固定的概念。IW不能被孤立,需要分布在安全和情報架構的所有元素中,聯合部隊與之互動并共同運作。新的分類法再次證明了這種方法的必要性。例如,與其把活動稱為IW,為什么不把它們僅僅標為行動?將信息作為力量要素或武器使用并不新鮮,盡管它是聯合部隊指揮官武庫中相對較新的工具,但如果戰場準備得當,這也是一種需要使用的武器,就像其他工具一樣。
信息時代不僅承諾在傳感器和射手、有人駕駛和無人駕駛車輛之間實現超級連接,而且在更廣泛的范圍內,包括后勤、情報和平民本身,因此,在向前發展的過程中,聯合部隊在IW環境的能力規劃方面應該遇到什么?聯合部隊在多領域或全領域作戰中實現信息優勢的目標,將需要在網絡武器中使用復雜的新方法和工具,來作為更廣泛的信息資源和信息力量生態系統的一部分。聯合部隊進行的網絡攻擊將需要與合作伙伴進行更密切的協調,例如,開展欺騙和網絡行動,甚至與假新聞和宣傳活動。
像勒索軟件這樣的威脅將在一端延伸到供應鏈伙伴,另一端延伸到有意識形態動機的非國家行為者。這種將信息環境分成越來越小的子群體的做法,為試圖在完全真空的情況下發展網絡武器創造了巨大的挑戰,對于聯合部隊和一個國家擁有的其他力量工具來說也是如此。事實證明,并且將在未來幾年內繼續強調,IW對于聯合部隊作戰和C2的有效性至關重要,尤其是在作戰云支持的環境中。未來軍事力量的部署和使用將要求聯合部隊的規劃者和作戰者更多地了解情況,更多地進行合作,更多地依賴信息環境中的合作伙伴,如果他們要超越傳統的 "內部 "方法并產生最佳的IW效果解決方案。
作者
埃德溫-"利"-阿米斯蒂德(Edwin “Leigh” Armistead)博士是一名美國退役海軍軍官,他撰寫了關于信息作戰(IO)的博士論文,并撰寫/編輯了關于這一重要主題的三本書。2006年,他參與建立了國際網絡戰爭與安全會議(ICCWS),//www.academic-conferences.org/conferences/iccws/ ,這個年度活動為該領域的學者、研究人員和從業人員提供了一個網絡平臺和論壇,以討論、探索和發展信息戰爭與安全的理論和實踐方面。他還是第9.10工作組(ICT在和平與戰爭中的應用)的副主席和《信息戰雜志》(JIW)的主編--這是美國唯一的雙盲、同行評審的信息戰(IW)學術雜志。
該項目支持美國陸軍戰爭學院保持一個公認的領導者,并在與美國陸軍和全球陸軍應用有關的戰略問題上創造寶貴的思想。該項目于2018年由美國陸軍訓練與理論司令部總部要求,描述一個新的或修改過的作戰框架,以使陸軍部隊和聯合部隊在多域作戰(MDO)中對同行競爭者成功實現可視化和任務指揮。
由此主要形成一個在2019學年進行的學生綜合研究項目,該項目涉及4名美國陸軍戰爭學院學生和4名教員,由John A. Bonin博士領導。該項目研究了MDO的概念,即它如何影響任務指揮的理念和指揮與控制職能的執行。向MDO的過渡改變了陸軍指揮官和參謀人員在競爭連續體中進行物理環境作戰和信息環境作戰的傳統觀點。
該項目以第一次世界大戰期間美國陸軍引進飛機為案例,研究將新領域納入軍隊的挑戰。該項目還提供了對MDO的概述和分析,以及它正在改變我們的戰斗方式以及軍隊的角色和責任。這些變化將使聯合部隊能夠更有效地進行連續作戰,特別是在武裝沖突之下的競爭中。
向MDO的過渡將需要新的流程,該項目調查了多領域同步周期如何能帶來好處。物質系統、聯合專業軍事教育、聯合和陸軍理論以及總部人員結構將需要改變,因為領導人及其工作人員將需要不同的技能來在這個新環境中運作。
陸軍新興的多域作戰(MDO)概念對最近修訂的陸軍任務指揮理論提出了新的挑戰。美國已經有75年沒有與同行競爭者作戰了;因此,個別軍種在概念上側重于打自己的對稱領域戰爭,而較少注意在其他領域支持其他軍種。隨著技術的變化和國防預算的縮減,各軍種正在迅速失去通過純粹的存在和數量來控制其領域的能力和實力。因此,各軍種需要從不同領域獲得不對稱的優勢,以便在其領域作戰中取得成功。
陸軍的指揮和控制方法是任務指揮。這種方法要求指揮官有能力理解、可視化、溝通和評估關鍵決策、風險以及關鍵情報和信息要求。多域作戰的任務指揮將要求指揮官在多個領域以及指揮梯隊之間和內部保持單領域的卓越和知識。同樣重要的是,指揮官必須創造、確保并維持對其自身決策過程的共同認識。風險分析和關鍵的情報和信息需求過程是必要的,以確保指揮官能夠設定條件,賦予下屬領導權力,并在多個領域的范圍內影響分布式行動。因此,為了滿足這些新的要求,需要有新的框架來理解和調整多領域的指揮關系和人員結構。
這些新的框架將需要一個多領域的同步化進程,為指揮官提供一個確定新需求并為其提供資源的方法。與使用軍事決策程序或聯合規劃程序的傳統作戰程序不同,這兩種程序都側重于單一領域的規劃,而多領域同步程序則是在整個規劃和執行周期中,從指揮官和參謀部之間的持續合作中演變而來,跨越所有領域和環境。這種演變創造了對關鍵決策、相關風險以及指揮官認為至關重要的關鍵情報和信息要求的共同理解。
這項研究支持美國陸軍戰爭學院繼續保持在創造與陸軍和全球陸軍應用相關戰略問題寶貴思想方面的公認領導地位。該研究考察了MDO概念的應用,即它如何影響任務指揮的理念以及指揮和控制功能的執行。第一次世界大戰期間飛機的引入提供了一個與當前情況相似的背景,因為1918年的陸軍在如何為大規模的地面行動提供最佳的指揮和控制,以對抗同行的對手,以及如何整合空中對陸地的支持。當陸軍試圖了解如何在多個領域進行整合時,從約翰-J-潘興將軍對飛機的整合中得到的啟示可以說明問題。威廉-米切爾在戰時和戰后的角色說明了我們在試圖執行MDO時可能面臨的一些挑戰,例如在未來大規模地面作戰行動中保衛網絡和空間領域。
對MDO的概述和分析將提供陸軍對該概念的定義,并描述陸軍在競爭連續體中的作用。MDO概念將需要新的組織和人員框架來在沖突連續體的所有方面實施MDO。陸軍不能保持一個靜態的組織;陸軍必須既能在陸地領域贏得武裝戰斗,又能幫助塑造競爭以防止未來的沖突。
武裝沖突以下的行動歷來都是聯合部隊和陸軍的斗爭。陸軍在戰斗中指揮和控制的任務指揮方法將不足以組織在武裝沖突以下對對手的日常競爭。陸軍在競爭期間為聯合部隊執行重要的任務,特別是在信息環境中,這些任務在MDO下將會擴大。
目前的作戰流程專注于單一領域,對于支持特定領域以外的功能適用性有限。我們必須有新的流程,允許所有領域的資產同步,以優化我們的效率,同時將這些資產的風險降到最低。盡管適用于所有級別的指揮部,但擬議的流程主要集中在高級行動和戰略層面所需的規劃和數據收集。
從單一領域到多領域的重點變化,使得聯合部隊和陸軍的理論必須進行修訂和更新。聯合專業軍事教育課程和聯合學說將需要進行調整,以教導下一代領導人如何跨域整合。僅僅了解其他部門是不夠的;指揮官和參謀人員需要了解其他領域的能力如何支持他們的工作,以及他們在支持其他領域方面的要求是什么。長期以來,聯合部隊只是名義上的聯合,每個領域都在為贏得自己的戰斗而戰斗。MDO概念使聯合部隊能夠優化其有限的資源,既能應對危機,又能在最好的情況下防止競爭中的危機發生。
表3-1. 陸戰、空戰、海戰和信息戰的特點
圖3-3. 陸軍的指揮與控制方法。ADP 6-0
圖3-4. 多域作戰框架
圖3-5. 信息環境框架下的多域作戰
隨著美國為大國競爭而重組其軍隊,戰場的有效性將取決于美軍是否有能力超越其近似競爭對手的決策周期。速度是關鍵--軍隊如何快速從其傳感器中收集數據,分析數據,辨別重要信息,將其發送給相關作戰人員并作出最佳反應。一支日益一體化和互操作性的部隊,對共同作戰環境有共同理解,對于軍隊完成能力融合至關重要。
美國防部聯合作戰概念(JWC)描述了全域作戰,并設想了一個聯合殺傷網,它可以通過全域聯合指揮和控制(JADC2)的支持概念,快速有效地將任何傳感器與任何投射能力聯系起來,這就是融合的原則。實現融合要求各軍種之間專注聚焦,確定優先次序并進行協同。美國陸軍將在JADC2中發揮核心作用,因為它為作戰和戰術網絡的發展提供信息;為JWC提供后勤骨干;并在一系列與各部門、機構和國際合作伙伴的合作實驗中測試融合。
議題:隨著美國軍隊為大國競爭而進行的轉型,戰場效率將在很大程度上取決于其超越同行競爭對手決策周期的能力。
聚焦范圍:描述了陸軍和聯合實施JADC2的情況。
觀點:
在2020年以后,美國軍隊必須具有戰略上的敏捷性、反應性和致命性。中國和俄羅斯正在大力投資,以減輕美國在陸地、空中、海上、太空和網絡空間各個領域的能力。
在有可能限制聯合部隊戰略部署和使用其部隊能力的情況下,需要一個現代化的指揮和控制(C2)機構,能夠迅速匯集美國及其盟國的所有能力,以威懾,并在必要時擊敗近鄰和其他競爭對手。
目前的C2項目使用的是幾十年前的平臺,"沒有針對未來沖突的速度、復雜性和殺傷力進行優化"。目前的平臺各軍種不能有效地利用或發送數據、命令給其他軍種,而且它們的結構不能支持實現未來的C2。2018年國防戰略(NDS)強調了C2系統現代化的重要性,指出在退化的環境中未來的戰斗將以速度、更多的自主權和分布式的單位獲勝。
美國防部領導層設想了一個在戰場上沒有界限的未來,圍繞著一個統一的C2系統,其中一個多領域的方法--參與和整合地面、空中、海上、網絡和空間作戰--對于挑戰一個近似的對手是必要的。JWC是一個關鍵的概念,并且正在推動未來的研發和采購,同時也在整合作戰指揮部的審查和服務計劃。因此,該概念的發展是國防部的一個優先事項。
圖:全域聯合指揮與控制(JADC2)通過實時終端用戶報告和協作規劃,協同多個數據源,在國防支持民事當局行動期間,準確地在聯合特遣部隊民事支持(JTF-CS,美軍機構) 可能需要的地方提供支持能力。
注1:聯合作戰概念的四個支持性概念
美國防部JADC2戰略于2021年5月由國防部長勞埃德-奧斯汀批準,闡明了國防部實施JADC2的方法;它將JADC2描述為感知、探測和行動的作戰能力,從而提高從沖突到競爭以及所有領域的互操作性和決策速度。JADC2是一個以數據為中心的持續C2能力框架,它支持JWC,并使聯合部隊能夠迅速匯集有助于威懾的效果,并通過決策優勢使任務取得成功。
JADC2指的是所有聯合C2的實施,包括:
由于速度和規模在未來的戰斗中至關重要,JADC2將建立一個網狀網絡,實時將各部門的數據帶入一個 "可共享的數據湖",將來自所有領域--陸地、空中、海上、太空和網絡空間的傳感器連接起來。利用人工智能軟件、數據庫、處理器和算法,它將把偵察信息轉化為可識別的和優先的目標,比人類分析員更快。目標數據將被發送到處于最佳位置的單位/能力,無論是動能、網絡、電子戰(EW)還是信息作戰(IO)。
JADC2及其網狀網絡可以被看作是一個安全的戰斗互聯網,軍事應用程序在上面進行連接,從所有可用的來源搜尋數據,以迅速將最佳的 "投射 "或 "效應器 "與目標聯系起來。JADC2可以提供無處不在的數據,不同的人類和機械數據可以根據需要使用。歸根結底,JADC2不是一個特定的平臺;它是獲取數據并有效連接。
圖:聯合參謀部的JADC2作戰規劃實驗,允許陸軍、海軍、空軍和海軍陸戰隊的節點共享實時的信息,以實現傳感器與投射的聯系,并將其顯示在一個共同的作戰畫面上(美軍聯合現代化司令部)。
所有軍種都同意需要將JADC2作為一項組織戰略。2020年,陸軍和空軍簽署了一項協議,在2022財政年度(FY22)之前分享數據并制定共同的數據和接口標準;在多次實驗中,他們在這方面取得了成功。此外,陸軍、海軍和空軍在2021年初簽署了一項合作協議,以測試、整合和分享數據開發,以實現JADC2。
陸軍現代化戰略描述了陸軍將如何作戰,用什么作戰以及如何組織起來支持聯合部隊。陸軍致力于發展作戰網絡、技術和概念,通過一系列名為 "項目融合"(PC)的演示和實驗來實現超額匹配并為聯合部隊提供信息。這是一場持續的學習運動,旨在迅速 "融合"所有領域(陸地、空中、海上、太空和網絡空間)的效果,并塑造陸軍的新興理論、組織、訓練、能力、研究和發展以及后勤。
通過實驗和學習,"項目融合"有助于確保軍隊在適當的地方擁有適當的人員、適當的系統、適當的能力,以支持聯合戰斗。——陸軍參謀長詹姆斯-麥康威爾將軍
PC由五個核心要素組成:
每項實驗都通過新的架構、編隊和來自陸軍八個CFT的授權來融合現代化舉措,并深化陸軍現代化舉措的整合。這些努力正在加速2018年國防戰略中概述的現代化戰略,該戰略設想未來的戰斗將在退化的環境中以擁有速度、自主性和分布式能力的單位獲勝。
表:陸軍未來司令部項目融合戰略20-22財年
在亞利桑那州尤馬的 "項目融合2020"(PC20)持續了幾個月,展示了人工智能和機器人技術,包括兩次實彈演示。該實驗由士兵、平民、科學家和工程師設計,在最低作戰水平上測試了融合,以挑戰戰術邊緣的決策過程。其中一項測試使用衛星和無人駕駛航空系統:同時感知空中和地面目標;迅速將數據傳遞給平臺,以打擊目標;并在十幾秒內決定性地摧毀該目標。
圖:2021年10月19日,在亞利桑那州尤馬試驗場,被分配到第82空降師的美國陸軍一等兵丹尼爾-坎達爾斯使用戰術機器人控制器來控制遠征模塊化自主車輛,為 "項目融合"做準備。在2021年項目融合期間,士兵們試驗使用該車輛進行半自主偵察和再補給(美國陸軍中士馬里塔-施瓦布攝)。
對實現JADC2能力的另一個貢獻是陸軍繼續倡導將其從聯合(joint)擴展到 "結合(combined)"--CJADC2--因為任何網絡都需要包括盟友和合作伙伴。陸軍在亞洲和歐洲有著深厚的軍隊間關系,應該站在這種重要努力的最前沿。認識到這一點,陸軍21/22財政年度的PC戰略將參與范圍擴大到了結合伙伴和盟友,增加了指揮層級并使之多樣化,并推動了現代化概念和技術的極限。
注2:項目融合(Project Convergence):項目融合是聯合部隊對速度、射程和決策主導權的實驗,以實現超額完成任務,并為聯合作戰概念和全域聯合指揮與控制提供信息。作為一場學習運動,它利用一系列聯合的、多領域的交戰來整合人工智能、機器人技術和自主性,以提高戰場態勢感知,將傳感器與投射連接起來,并加快決策的時間線。因為誰能最先看到、了解并采取行動,誰就能獲勝。
注3:項目融合的五個核心要素
JADC2要求國防部和陸軍進行轉型,特別是在數據管理和共享、網絡支持能力、人工智能在決策周期中的作用以及為實現這些變化而對部隊結構進行調整。陸軍現代化戰略及其現代化優先事項是持續轉型的框架,以使陸軍能夠在多個領域進行部署與聚合效應。
注4:軍隊現代化的優先事項六大任務
一個用于C2的綜合戰斗管理系統需要在數據共享和標準化數據共享接口方面進行通信;然而,許多遺留系統包含數據共享障礙。2021年初,各軍種之間開始認真工作,制定數據標準以連接他們的JADC2項目,并通過 "發現、理解和與所有領域、梯隊和安全級別的合作伙伴交換數據 "來克服這些障礙。
陸軍的網絡CFT正在試驗網絡的現代化,以實現聯合接口、彈性和能力。它的重點是加強地面領域的數據和網絡傳輸能力,連接人工智能和機器學習(AI/ML),開發戰術云和邊緣計算。
國防部正在制定和實施一套初步的實驗和原型設計的核心原則,以統一國家安全事業。聯合部隊已經確定了幾個原型能力,通過將真實世界的威脅數據納入響應計算,在即將舉行的演習中進行測試。陸軍聯合現代化司令部建立了聯合系統集成實驗室(JSIL)--一個使用持久性環境場景的實驗網絡,允許各軍種、工業界和盟友通過幾個網絡測試數據共享能力。這將有助于對JADC2戰略進行可靠的評估。
由美國太空發展局管理的低地球軌道(LEO)衛星將整合各軍種的戰術網絡,以創建一個網狀網絡的傳輸層。計劃于2022年部署的近30顆衛星將提供一種 "作戰人員沉浸 "能力,其中傳感器、投射和戰術網絡可以與戰術通信連接。PC22將利用這些衛星,開發低地軌道能力。
人工智能國家安全委員會報告稱,國防部有必要在2025年前采用、實施人工智能并為其提供資源。人工智能/ML--陸軍的一個優先研究領域--對于在聯合、全域作戰中實現聯合戰場管理系統至關重要。人工智能的進步提高了對新出現的威脅的反應速度和敏捷性,使指揮官和工作人員能夠將精力集中在加速、優化決策上。
建設網絡安全基礎設施是陸軍網絡計劃的一個關鍵方面,它將為統一的網絡帶來速度、訪問和安全。在平衡這些要求的同時,美國網絡司令部正在與行業伙伴密切合作,擴大用于在國防部、情報界和商業網絡之間傳遞數據的安全共享工具,而不存在被破壞的風險。
圖:作為 "項目融合2020"的一部分,飛馬系列戰術自主系統的一部分在尤馬試驗場進行測試。飛馬系統有能力為無人駕駛航空系統(UAS)、地面行駛履帶式車輛,提供監視能力或創建一個地區的豐富詳細的三維地圖。
決策主導權--在技術和融合的作用下更快地做出更好的決策的能力--將使美國軍隊從其對手中脫穎而出。JADC2有助于實現信息主導權,并促進快速融合,實現速度關鍵優勢,這是未來AI/ML競爭的基礎。
目前,每個軍種都在其各自領域內管理C2的復雜性。隨著戰爭的特點變得越來越復雜,聯合部隊必須同時有效地整合五個領域。這需要新的C2方法。JADC2是建立一支能夠完成國防戰略目標的聯合部隊的基礎。國會的支持、持續的資助和軍種間的合作對于成功實施JWC和JADC2至關重要。
陸軍在實現這一聯合網絡的技術、創新和實驗方面處于領先地位。它的PC學習運動已經證明了它有能力使用新興技術和創新概念來實現軍種間和跨域的融合。陸軍的未來司令部、CFTs、作戰能力發展司令部和軟件工廠正在結合士兵的經驗、工業界的資源和科學家的專業知識來發展和提供未來的戰斗力量。通過實驗和聯合協作,陸軍正在使JADC2成為現實,從而增強戰略競爭中的威懾力和沖突中的超強戰斗力。
美國陸軍協會是一個非營利性的教育和專業發展協會,為美國的全部軍隊、士兵、陸軍文職人員和他們的家屬、行業伙伴以及強大國防的支持者服務。美國陸軍協會為陸軍提供聲音,支持士兵。
2021年3月,美國哈德遜研究所國防概念與技術中心發布研究報告《實施以決策為中心的戰爭:提升指揮與控制以獲得選擇優勢》,提出以決策為中心的戰爭將使美軍做出更快、更有效的決策,從而賦予美軍更大的競爭優勢。
自冷戰結束以來,美國國防部(DoD)針對來自主要對手(如中國、俄羅斯和朝鮮等)的巨大軍事沖突發展了相應理論和能力。這些最壞的情況是為了確保美軍也能應對“較少的情況”。然而,這種方法偏重于為大規模、高強度軍事沖突設計的概念和系統,美國的智能對手不太可能向美軍挑起對抗,而國防部可以在力量投射或精確打擊等任務中發揮其優勢。
美國的對手在過去十年中已經發展出了抵消美國軍事優勢的方法,如中國和俄羅斯的灰色地帶或混合行動,這些方法以較低的成本和升級——盡管比傳統的軍事作戰時間更長——獲得目標。因此,國防部應修訂其規劃,提高新方案的優先級,這些方案以不同于戰區范圍內高強度作戰的方式給美軍施加壓力,如通過延長時間、不同程度的升級和規模,以及使用代理和準軍事力量。
中國的“系統破壞戰”概念和俄羅斯軍方的“新一代戰爭”概念是針對美國及其盟友的新方法的代表。雖然它們的制勝理論和方法大相徑庭,但這兩種概念都有一個共同點,即把信息和決策作為未來沖突的主戰場。它們從電子和物理上直接攻擊對手的戰斗網絡,以降低其獲取準確信息的能力,同時引入虛假信息,削弱對手的定向能力。同時,軍事和準軍事力量將通過孤立或攻擊目標的方式向對手提出難題,以中和對手的戰斗潛力,控制沖突的升級。
美國海軍如何重新平衡實施 "馬賽克戰 "部隊的例子
以決策為中心的概念,如系統破壞戰和新一代戰爭,很可能成為未來沖突的重要形式,甚至是主要形式。在冷戰后期,美軍革命性的精確打擊戰方式利用了當時的通信數據鏈、隱身和制導武器等新技術。同樣,以決策為中心的戰爭可能是軍事上利用人工智能(AI)和自主系統的最有效方式,這些技術可以說是當今最突出的技術。
以決策為中心的戰爭的一個例子是國防高級研究計劃局(DARPA)的馬賽克戰爭概念。馬賽克戰爭概念的中心思想是,由人類指揮指導的、具有人工智能功能的機器控制的分列式有人和自主單位可以利用它們的適應性和明顯的復雜性來延遲或阻止對手實現目標,同時破壞敵人的重心以排除進一步的侵略。這種方法與機動戰一致,不同于第二次世界大戰期間盟軍采用的基于損耗的戰略,也不同于冷戰后美軍在科索沃、伊拉克和利比亞沖突中采用的戰略。雖然馬賽克戰爭采用損耗作為給敵人制造困境的一部分,但其實現成功的主要機制是拒絕、拖延或破壞對手的行動,而不是削弱對手的軍事實力,使其無法再有效作戰。因此,馬賽克戰爭非常適合作為現狀軍事大國(如美國)尋求遏制侵略的概念。
在近期兵棋推演中,馬賽克部隊與傳統軍事部隊在任務完成情況的比較
馬賽克戰爭提出了一種部隊設計和指揮控制(C2)程序,與今天的美軍相比,它將使美軍能夠執行更多、更多樣化的行動方案(COA)。馬賽克部隊的分解結構和使用人類指揮與機器控制,將使對手的決策復雜化,縮小其選擇范圍,并施加一系列可能無法解決的困境。通過增加美軍指揮官的選擇權,減少敵方的選擇權,馬賽克戰法將尋求獲得“選擇權優勢”,使美軍能夠做出更快、更有效的決策。
選擇性戰略與以預測為中心的規劃方法形成鮮明對比,在這種規劃方法中,選擇最有可能導致成功的作戰行動方案并迅速實施,通過將與未選擇的作戰行動方案相關的系統和兵力要素分配給其他任務來提高效率。在以預測為中心的模式中,資源的早期承諾必然會限制指揮官今后的選擇空間。
與今天的美軍相比,馬賽克部隊的設計和C2過程可以在選擇權競爭中提供更大的優勢,因為隨著對抗或競爭的進展,可以緩解由于損失或敵方態勢感知的改善而導致的選擇權減少的自然趨勢。例如,“馬賽克”部隊可以更容易地隱藏具有反ISR能力的平臺或編隊,并在以后暴露出來,以實現新的選擇;利用數量更多、規模更小、成本更低的增援部隊;或依靠決策支持工具,允許繼續使用與高級指揮官物理或電子隔離的部隊。
圖:以網絡為中心的戰役空間架構與基于情境的戰役空間架構的特點比較
一支馬賽克部隊也將比今天的美軍更有能力進行縮小對手選擇范圍的行動。通過同時發起許多行動并加速其決策,一支使用人類指揮和機器控制的分布式部隊可以給對手造成足夠的困境,從而排除與作戰相關的數量的《作戰協議》。此外,馬賽克部隊還可以利用諸如分配、佯攻和探測等欺騙技術以及反ISR系統來補充其更大的規模和決策速度,這些技術可以使對手相信某些選擇不可行或不可能成功。
雖然國防部的C3結構,如混合和聯合全域指揮和控制(CJADC2)開始納入決策支持工具,為特派團整合效應鏈,但其目前和近期的實例旨在支持有效的火力投送,而不是持續的可選性。此外,與CJADC2相關的C2和通信(C3)舉措,如高級戰役管理系統(ABMS),需要提前確定架構和組件系統。因此,CJADC2在其能夠提供的可選性方面將受到固有的限制。
圖:C2實施方法的比較
第一步是壓縮空間的表征,重點放在時間的表征上。以一個作戰人員在短時間內的行動為例,在這個例子中,一個作戰人員的任務是收集指定地點的圖像。這在操作上是不現實的情況,只是用一個簡單的案例來說明這個概念。
在C3組合中,國防部已經在通信復原力方面進行了大量投資。因此,大部分新的努力和資源應該應用于C2能力。盡管美國軍方投資于所謂的C2系統,但這些項目主要是操作中心和軟件堆棧,作為在部隊中傳遞數據、信息、命令或權限的基體。盡管對管理部隊來說是必要的,但目前國防部的C2系統——將C2看作是連接——并不是決策支持系統,后者將C2看作是一個過程。
圖:在馬賽克C2方法中采用OODA循環
用于以決策為中心的戰爭的C3能力需要做的不僅僅是實現連接。例如,C2工具將需要生成能創造和維持可選擇性的COA,以提高適應性,并將復雜性強加給對手。為了幫助初級領導人執行任務指揮,C2工具還需要了解哪些單位在通信中,他們在潛在的COAs中的作用,并配置網絡以確保所需單位與適當的指揮官保持一致。為了評估這些要求和以決策為中心的C3的其他要求,本研究采用了多種視角,如下所述。
圖:以預測為中心和以決策為中心的選擇空間隨時間變化的比較
網絡視角:要實現可選擇性和實施以決策為中心的戰爭,就需要有能力使C2結構與現有通信保持一致,而不是試圖建立一個在面對敵方協同干擾和物理攻擊時仍能生存的網絡。這些需求導致了一種混合架構,這種架構將網絡方式與分層方式結合起來,可以被定性為 "異構"。這種拓撲結構將使指揮權與合格的人類操作者占據的節點中具有最高程度的節點相一致。
解決問題的視角:與從頭開始處理每個新情況相比,使用類比推理的問題解決過程可以更迅速地評估潛在的備選方案,由此產生的決策空間的增加可以使指揮官將限制其備選方案的作戰行動協議推遲到最后一刻。此外,如果使用人工智能支持的算法在沒有監督的情況下建立COA,對手可以通過佯攻和探測來影響算法的學習,使系統認為COA是成功的,如果不是對手的行動,實際上會失敗。
圖:來自DARPA PROTEUS計劃的分析和用戶界面,AI輔助規劃
時間視角:可選性的概念適用于多個時間尺度,從戰略到工業能力發展和部隊的戰術行動。C3架構的能力應該有助于擴大每個時間尺度上的努力所帶來的決策空間,而不是僅僅在任務期間。
組織視角:國防部的C3架構不是在真空中存在的。各組織的人員必須通過戰略、工業、作戰和戰術時空的流程來運用這些架構。可選性是在以決策為中心的戰爭中獲得優勢的關鍵,但如果僅僅是派出一支更分散的部隊和使用它的工具,如果這支部隊的使用方式很狹窄,為每個單獨的行動提供最高的成功概率,那么只能稍微增加美軍的復雜性和適應性。需要決策組織和程序,盡可能長時間地擴大指揮官的選擇空間。
今天的戰斗指揮官(CCDR)參謀部缺乏組織和程序,無法為即將到來的任務以各種不同的配置組合部隊。為了能夠在任務時間內組成部隊,國防部可以采用類似于將計算機程序編譯成可執行代碼的方法。軟件指令是用較高層次的計算機語言編寫的,但在軟件被計算機處理器執行之前,需要將其轉換成二進制形式。這種方法將從決策支持系統的COA開始,然后組合適當的單位來支持行動。雖然部隊構成主要是以硬件為中心,但也需要在技術棧的信息層和網絡層進行部隊包的軟件構成。
圖:從人工構成到決策中心戰的任務整合浪潮
美軍將需要采用新的部隊設計和C2流程,以實現以決策為中心的戰爭,但如果不與工具和組織結合起來,以充分利用使用人類指揮和機器控制的更分散的部隊中可能存在的可選性,這些努力將付諸東流。
目前國防部通過CJADC2和相關的作戰概念努力使美軍向更分散的組織和更分散的能力發展,這是實現更以決策為中心的軍事行動方法的重要一步。高級戰斗管理系統(ABMS)和DARPA的幾個項目正在開發C2工具和流程,這些工具和流程將增加指揮官使用這些更分布式部隊的可選性。國防部的部隊設計變革或C3舉措將需要更進一步,以便美軍在面對已經躍升到以決策為中心的戰爭并擁有主場優勢的同行對手時保持可選擇性優勢。
也許更重要的是,將需要新的組織和程序,使CCDR能夠在戰區組成和整合分散的部隊,并改變國防部定義需求和發展新能力的方式。如果不對國防部的需求和部隊發展程序進行重大改革,美軍就有可能在爭奪決策優勢的競爭中落后于對手,從而威脅到其保護美國利益和盟友免受大國侵略的能力。
(參考來源:軍事文摘作者:張傳良)