盡管軍事革命相關論述或存過度炒作之嫌,但人工智能(AI)與自主技術改變戰爭形態的潛力正逐年增長。各國正部署可半自主導向目標的無人機,而AI正提升全球軍事目標鎖定流程效率。此類系統的風險真實且嚴峻——無論源自單體系統或系統集群,化解風險方能充分釋放技術潛能。國防部在載人系統安全研發部署方面經驗豐富,但AI與自主技術帶來新挑戰。作者前期報告曾探討AI與自主系統的新穎性,聚焦其對國防部門測試與評估(T&E)體系的持續及預期影響。AI單體系統特殊性構成挑戰,系統間交互亦然。本報告聚焦自主系統集群(無論是否AI驅動)引入的新漏洞(單體測試中或不存在)。自主平臺間沖突潛力顯著,其互操作性需求亟需跨軍種協同努力。鑒于美國與對手技術研發競速,當前正是為聯合部隊建立技術導向動態框架之機,確保美軍保持整體作戰能力。
本研究結論適用于AI與自主系統全生命周期(含研發及測試評估):
? 研發階段:涉及系統設計與工程技術要素
? 測試評估:涵蓋虛擬/實裝測試的實踐與政策要素
實現系統間真正互操作性需從開發早期至維護階段的全鏈條參與(概念設計者、項目經理至工程師均需介入)。各軍種應任命或授權領導層確保AI與自主系統研發符合作戰概念中的互操作性要求。鑒于作戰概念預設系統在共享環境中的協同能力,領導層應避免研發孤島化,強化預期互操作系統項目間協作。
國防部門應探索制定確保系統互操作性的行為標準(匹配操作員訓練及戰術、技術、程序的標準化程度)。現行技術標準側重接口等要素(機器通信方式),自主系統需建立類人操作員規程的行為標準以實現協調。此類標準應超越通信協議等底層要求,涵蓋共享環境中的預期交互方式(如機動與火力沖突自動化解)。
測試主管部門應協同制定實施T&E政策以確保自主系統兼容性。各軍種需在系統研發早期關注互操作性問題(建立作戰概念中共現項目的關聯),而認證后續互操作性(如本框架所述)屬T&E部門職責。T&E部門應運用通用建模與仿真(M&S)工具強化互操作性(輔以實裝測試)。標準提供顯性互操作路徑,而無需直接協調的M&S資源共享可驅動系統兼容性研發。
在軍事領域狂熱采用新興人工智能(AI)工具之際,公眾卻鮮少討論其潛在風險。盡管美軍投入巨資研發軍用生成式AI(GenAI)工具,但陸軍及聯合部隊至今仍未獲得可靠能力。當前正形成尷尬的AI軍備競賽態勢——技術專長主要集中于私營領域,但商用的"軍民兩用"開發模式無法滿足軍事需求。陸軍亟需以專業買家身份明確需求并主導AI話語權。2025年5月美國陸軍北方司令部(USARNORTH)兵棋推演證明,GenAI具備支持軍事規劃的潛力,但仍需采取區別于商業研發的獨特路徑。軍用GenAI的實際應用需實現三重突破:嚴苛的專項訓練;轉向強化而非替代人類決策的"行動方案主導"模式;通過混合AI模型等技術創新克服算力局限、地理空間理解及記憶存儲缺陷。
GenAI創新生態正在變革。陸軍數字與人工智能辦公室與"全球信息主導實驗"項目協同推進GenAI平臺開發,既激勵私營領域創新,又通過嚴格評估篩選軍用系統。2025年5月,陸軍戰爭學院聯合上述機構,在戰略領導力中心開展首次戰區級機密兵推,測試Scale AI研發的"多納萬"GenAI系統。為期五天的推演集結了北方司令部、陸軍北方司令部、海關與邊境保護局、聯邦調查局、網絡安全與基礎設施安全局及國土安全部逾70名專家。此次實驗驗證了維系陸軍認知優勢所需的產業合作模式。
歷時十個月籌備的推演在機密級互聯網協議路由器網絡集成Scale AI的Llama-3.3-70B-Instruct架構"多納萬"模型。陸軍戰爭學院的核心命題直指要害:GenAI系統能否增強參謀團隊作戰態勢理解力,優化其向戰區指揮官提交的戰役計劃建議?這在傳感器密集部署的戰場空間尤具現實意義。作戰節奏持續加速正壓縮戰略-戰役-戰術層級的決策空間,致使戰略決策往往蘊含戰術意義,反之亦然。雖然利用GenAI驅動人類認知超速運行頗具誘惑,但其可行性及加速認知可能引發的未知風險亟待驗證——此次推演正是為破解這些命題開辟通路。
GenAI在兵推中可扮演四重角色:(1)智囊顧問(認知支持);(2)想定設計(情境構建);(3)裁決系統(主客觀判定);(4)推演架構(流程搭建)。本次推演聚焦首項功能,研究如何運用GenAI增強戰略層級的人類智能。推演過程中雖發現測試其他功能的機遇,研究團隊仍克制地集中稀缺資源(僅有兩套"多納萬"授權)保障核心議程。部分情境顯示,想定開發測試機會反能強化顧問職能(雖未專門驗證,但GenAI在敘事構建與情境設計方面展現出卓越潛力,需深化研究以優化實踐)。
要全面檢驗GenAI在軍級以上梯隊的認知增強效能,理想方案應在相同想定下分設"配置AI"與"未配置AI"的參謀單元進行效果對比。但此次推演未能實施純粹A/B測試——戰略概念與條令司研究團隊在推演前六周才獲得"多納萬"授權。未來需在初始規劃階段即嵌入AI集成方案。
時間約束反而增強了推演真實性。真實的戰區陸軍司令部終日應對戰役行動,若GenAI無法無縫適配人類決策機制必將遭淘汰。因此本次推演中,演習控制組(EXCON)通過嵌入"藍軍"(推演方)戰役計劃組(OPT)來模擬USARNORTH參謀機構運作。當計劃組規劃行動、評估方案、擬訂參謀預判時,EXCON研究員同步向"多納萬"系統提交同類想定問題。EXCON研究員除作為編外參謀外并無預設議程,但其配備的快速分析機制可深度解析戰場態勢、軍事條令及現有作戰文件,從而為計劃組提供增強型態勢認知支持。在規范管理前提下,"多納萬"的響應本可激發深度研討或提升團隊整體態勢感知水平。
美國太空軍(USSF)領導層正采取多元路徑提升組織敏捷性、響應力、效率與效能。鑒于建模與仿真(M&S)技術在太空軍全域的廣泛應用,優化M&S運用成為提升決策、系統研發、采辦、測試、訓練及作戰整體效率的關鍵路徑。數字工程(含數字孿生)是提升太空軍跨組織M&S效能的前瞻性使能技術,但其他變革同樣可行。本報告研究探討太空軍如何在空間系統全生命周期優化M&S應用。
太空軍領導層追求更敏捷、響應迅速、高效能組織。優化建模、仿真與分析(MS&A)應用是提升決策、系統研發、采辦、測試、訓練及作戰整體效能的關鍵路徑。蘭德公司受托制定太空軍戰略,以強化其在空間系統全生命周期運用MS&A的能力。
采用三軌并進策略:
? 生命周期各階段缺口各異:系統設計機構M&S應用深入且專業度高,但需低保真工具開展權衡研究;采辦與系統用戶機構則需系統定義、互操作性及紅藍方模型等定向M&S能力
? 缺口揭示太空軍需加強跨組織協作(含承包商模型數據共享),并強化與空軍部M&S委員會及指導組的協調
? 首要M&S缺口為多保真度模型與數據缺失,次為工具互操作性及紅藍方模型可用性
? 全員需提升數字工程(DE)技能熟練度與M&S能力儲備
? 跨密級模型執行能力系共性短板
? 應對缺口的三大解決方案:跨組織信息數據共享、M&S工具與環境建設、有效建模能力與文檔規范
? M&S標桿組織最佳實踐:高素質人才隊伍、協作支持型文化、項目早期實施數字工程、審慎應用數字孿生、AI賦能M&S同時確保人類決策者對系統設計的掌控理解
太空軍提升空間系統生命周期M&S效能的建議分四維度:
美陸軍旨在加速轉型以確保未來戰爭勝勢。為賦能聯合部隊無縫整合動態陸軍系統、資源及作戰人員,在未來戰場實現壓倒性優勢,陸軍技術基礎概念與基礎設施需同步演進。陸軍術語"野戰技能"(field-craft)描述成功士兵的生存能力,而未來環境要求拓展戰術與技術精通度以應對日益增長的技術素養需求。"技術素養"(techcraft)概念在陸軍術語體系、哲學思想與制度框架中的確立,將保障轉型期對新興戰場形態的全面認知。歷史表明:新興技術將持續改變作戰方式,同時改變士兵作為成功適應性作戰人員所需的基準技能與知識體系。陸軍未來司令部(AFC)將技術素養定義為:"運用現有及新興技術獲取軍事行動與任務中戰術優勢或效能的才能與文化"。
此前技術素養研究通過領導者直接反饋獲取洞見,本次深度研究采用更嚴謹框架分析創新集成成功單位,旨在生成條令、編制、訓練、裝備、領導與教育、人員、設施及政策(DOTMLPF-P)建議。本文系陸軍未來司令部與陸軍經驗學習中心協作成果,聚焦當代陸軍先進軍事技術成功集成背后的士兵特質、領導者行為及部隊文化,系統梳理技術素養經驗與最佳實踐。
與以色列對峙的國家及組織正大規模裝備巡飛彈藥。其低成本與易用性構成顯著、明確且即時的威脅——尤其當以集群形式發動攻擊時。應對此挑戰需投入大量資源提升探測與攔截能力。本威脅分析報告最終提出針對性反制建議。
烏克蘭戰爭、高加索沖突及以色列"鐵劍行動"共同驗證了這類新型武器——巡飛彈藥(全球亦稱"游蕩導彈",以色列媒體稱"爆炸性無人機")的實戰效能。在烏克蘭戰場,巡飛彈藥被用于打擊建筑與高價值目標,造成軍民雙重傷亡。該武器具備大規模量產的低成本優勢,使操作者可對高價值目標發起密集精確打擊。部分配備GPS制導的型號操作極為簡易,無需高水平技術或作戰專長。大規模集群化發射巡飛彈藥的技術能力在當前代系已然存在,其威脅具有顯著性、明確性與即時性三重特征。
"鐵劍行動"期間,針對以色列的巡飛彈藥襲擊既命中民用目標(也門胡塞武裝發射的爆炸性無人機襲擊特拉維夫與雅夫內居民區),也打擊軍事設施(賓亞米納附近的戈蘭尼旅新兵訓練基地、阿拉伯阿拉姆謝及戈蘭高地以軍陣地遭損毀)。標志性事件是2024年4月14日伊朗向以色列目標發射約170架巡飛彈藥(極可能為"沙希德-136"無人機)。得益于以色列空軍及其盟友的強力攔截行動,這些爆炸性無人機未能抵達目標。但需強調的是,當時以色列并未處于全面戰爭狀態,這使得空軍能調集重兵應對無人機群襲擊。
巡飛彈藥體系由自主平臺武器構成,射程覆蓋數公里至數千公里,戰斗部載重3-50公斤,可對預設高價值目標或操作員實時選定目標實施精確打擊。該武器系統歷經五十年發展,由美、德兩國率先研發。其原始應用場景為壓制機動防空系統(SEAD任務——壓制敵方防空作戰)。研發國將巡飛彈藥視為自主戰場機器人,旨在為反制機動地空導彈系統提供經濟解決方案。美、德作為原始開發者早期放棄該構想,而以色列與伊朗洞悉其未來潛力后持續投入研發,最終在1980年代催生以色列航空工業集團的"哈比"(圖1)與伊朗"阿巴比爾"(圖2)等代表性型號。
人工智能(AI)在軍事行動中引發前所未有的不確定性,這在AI賦能的自主武器系統(AWS)與決策支持系統(DSS)中尤為顯著——其不僅影響關鍵戰場決策,更帶來新穎且不可預測的風險。盡管部分風險可預先研判管控,但因系統運行環境的復雜性、動態性與對抗性,諸多風險仍具固有性與不可避免性。即便秉持善意的AI操作員,在嚴格審查與謹慎部署后仍可能面臨不可預見的平民傷亡事件。實踐中,此類事件多被定性為"事故",即國際人道法(IHL)預期容忍的戰爭現實。
本文質疑該假設,主張通過迭代方法可緩解(若非預防)先驗不可預測的AI失效。該方法通過系統整合部署后評估洞見,使決策者能更新對現實使用中暴露的邊界案例及其他"已知未知項"的認知,為未來AI部署提供關鍵依據。我們提出由兩項互補機制——"部署迭代審查"與"部署迭代評估"——構成的迭代評估框架。該框架代表管理不確定性并最小化軍事AI使用中平民傷亡的最佳實踐。初始事故雖或難免,但通過結構化迭代流程(含報告、分析與適配),其復現率可顯著降低。致力于負責任運用軍事AI者應將該框架嵌入作戰規劃與法律合規的核心環節。
關鍵詞:不確定性;人工智能(AI);事故;自主武器系統;決策支持系統;可預測性;武器審查;國際人道法
圖1:迭代評估的可視化操作指南
隨著人工智能(AI)日益深入軍事行動,使用者將面臨加劇的不確定性、不可預測風險及系統脆弱性。諸多挑戰僅在事后顯現——即失效已導致平民傷亡等人道損害后。實踐中此類事件常被歸為"不可避免的事故",作為戰爭必然副產品被容忍。本文挑戰此假設,提出"迭代評估框架"作為軍隊在動態作戰環境中主動緩解AI相關平民傷害的最佳實踐方案。該框架基于兩大基石:一方面承認軍事AI失效初期或難避免,決策者無法預知不可知之事;另一方面強調國際人道法(IHL)精神要求交戰方采取一切可行措施防止可預知風險的傷害重演。為此,迭代評估框架引入雙層機制以支持快速自適應緩解新興AI風險。
本文結構如下:第2節剖析AI系統的高度不可預測性如何削弱傳統質控與風險緩解機制預防重復失效的效能;第3節半技術性解析AI不確定性的多元來源,論證多數源于技術固有屬性——故無法單靠技術手段消除,亦不能通過先驗預防完全解決。為應對此挑戰,本文倡導采納迭代思維:將IHL義務持續貫徹于全周期而非孤立節點。基于此理念,第4-5節分別探討迭代評估在武器審查與目標鎖定階段的應用;第6節整合模型為可視化操作指南;第7節提出將迭代評估嵌入軍事實踐的關鍵建議。
需先行闡明迭代評估框架的性質與目標:刻意選用"框架"而非"規范"或"原則",因其非法定約束性義務(尤其IHL嚴格解釋下),而是決策者在AI研發、測試與部署中可采納的結構化措施集,其核心是迭代優化哲學。該框架既非激進創新——諸多建議已存于當代軍事條令與學術研究;核心挑戰亦非概念新穎性,而在作戰與后勤現實約束下的持續落實。同時應承認其局限:無法消除所有不確定性(此乃軍事行動固有特征),但能通過預防可避免傷害強化IHL遵約。本質上,它旨在減少因決策者缺失理論上可知信息(而非魯莽行事)導致的傷害。
本文預設AI使用者秉持善意,力求遵守IHL并負責任管理不確定性;假定所有IHL要求的測試、審查及攻擊預防義務均已履行;不涉及惡意場景(如故意部署未經驗證的"黑箱系統")。迭代評估旨在補充而非替代這些IHL基礎義務。核心論點是:即使傳統IHL要求完全滿足,采納迭代路徑仍有持續改進空間。
信息戰(IW)已隨時間推移演變為獨立作戰模式,這源于技術持續演進及社會各層面與組織內部海量目標的暴露。信息戰因其自適應特性和無國界特征,能夠在未越境開火的前提下發動戰爭,使問題本質復雜化。最具殺傷力的"聯合作戰"或"多域作戰"(MDO)同樣未能免受信息戰影響,其在戰斗各階段均受沖擊。信息戰拓展灰色地帶范圍的能力與不對稱威脅疊加,顯著加劇政治及軍事體系的決策困局——通過利用社會結構性弱點瓦解聯軍凝聚力,削弱國家作戰能力。聯軍高度依賴傳感器、指揮控制(C2)體系要素、通信及網絡頻譜執行任務,致使其更易在戰爭迷霧中遭受信息戰無形打擊。然而,竭力實施信息戰協同調控以守護己方弱點,可數倍提升聯軍作戰效能:既能減少作戰兵力需求,又可降低戰爭成本,實現"零傷亡"或"低代價"勝利。本文強調核心論斷:"唯有用信息戰方可制衡信息戰"——若能在完全技術優勢下運用該戰法并防護自身弱點,將倍增聯合作戰能力以確保戰略勝利。此外,本文詳析信息戰與聯合作戰本質,最終聚焦信息戰的影響機制及反制措施,尤其結合印度軍隊當前提升聯合作戰能力的進程,探討本土化應對方案。
戰場透明性增強、動能與非動能作戰手段迭代,加之非國家行為體威脅與不對稱戰爭風險,致使現代戰場復雜性激增,傳統戰法亟需技術與條令革新。盡管技術進步提升全域作戰節奏與殺傷力,但武裝力量無縫協同生成最大作戰效能仍不可或缺——唯有在時空維度協同運用國家武裝力量要素,方能以更低成本實現決定性速勝。
聯合作戰作為一種軍事學說,優先強調各軍兵種在統一指揮下整合達成目標。該理念注重跨軍種協同、互操作性與行動同步,以最大化作戰效能,亦可稱為"體系作戰"——要求整合所有能力實現行動統一,其協同效應可催生最大化作戰能力。故聯合作戰實踐者須重視軍兵種協作及非軍事機構在軍事規劃中的價值。
戰爭本質雖不變,但實施方式持續演進。作戰原則須貫穿規劃與執行全程。聯合戰役中的力量平衡及作戰效果,與實踐者時刻守護聯合作戰原則的能力直接相關。然而聯軍對指揮控制(C2)、傳感器、數據與兵力協同的重度依賴,也為信息戰破壞作戰原則、時空維度擊敗聯軍提供可乘之機。為增強聯合作戰韌性及殺傷力,亟需解析信息戰對作戰原則的影響機制。信息戰對核心聯合作戰原則的正負向影響如下:
? 機動性
信息戰通過增強情報收集速度與戰場透明性(BFT),縮短"觀察-調整-決策-行動"(OODA)循環周期,規避無效兵力投送,提升決策與部隊機動效率。反之,信息泄露與敵方欺騙亦將削弱聯軍機動性,遲滯作戰節奏。
? 節約兵力
信息戰提供低成本打擊選項:可在敵時空矩陣任意節點攻擊海量目標,實現零傷亡作戰,從而保存兵力用于關鍵方向,貫徹兵力節約原則。
? 統一指揮
統一指揮旨在確保各目標均由責任指揮官統一協調。信息戰攻防要素既可用于維護指揮統一,亦可瓦解該原則。
? 突然性
突然性指在敵無防備時空節點實施快速打擊,加速作戰節奏并制造敵方崩潰契機。該原則因戰場透明性提升與信息欺騙能力增強而受到顯著削弱。
? 克制用兵
克制原則強調僅使用必要兵力達成目標。信息戰通過降低兵力需求貫徹此原則,減少附帶損傷。
? 合法性
國際國內層面的法理正當性認知,可通過信息戰工具進行輿論引導以維護或破壞。
? 互操作性
作戰力量與裝備的互操作性是聯合作戰協同基礎,依賴無縫通信與實時數據共享——信息戰既可防護亦可破壞該體系。
? 統一行動
達成目標區域最大作戰效能需三軍力量整合,確保兵力在時空與目標維度高度統一。信息戰攻防能力既能促成兵力適時集結,亦可遲滯兵力投送,導致聯軍遭分割殲滅。
? 指揮控制(C2)
作為聯合作戰神經中樞,指揮控制賦予任務執行方向性與靈活性,捕捉瞬時戰機提升作戰節奏——該體系可被信息戰組件徹底瓦解或強化防護。
信息戰對聯合作戰具雙向影響:既可助推任務成功,亦能引發災難性后果。聯軍能力可因信息戰增強或削弱,其效果取決于沖突雙方技術閾值、可用目標及現有/潛在社會斷層線。規劃與實施多域作戰或聯合行動時,上述原則不容忽視——違背將導致整個戰役不可持續。因此,聯合作戰實踐者須全力守護原則體系免遭負面沖擊,同時精準打擊敵弱點以達成速勝。
在軍事研發領域,美軍“聯合全域指揮控制系統(JADC2)”的“任務規劃與執行”需求明確,而利用AI輔助聯合規劃以處理數據支撐人類決策,是此類系統效能提升的核心。然而,還需設計“人類數據解讀機制”以優化協同任務的同步與執行。本研究旨在通過“緊急醫療服務場景”評估互依性任務管理候選方案。研究證實,采用“時間線顯示”界面處理“依賴關系問題”的準確率更高,僅在“狀態問題”類型上其精度未顯著優于其他顯示模式。這表明“時間線顯示”界面設計基于“基爾戈爾的時序區間邏輯關系可視化方法”具有顯著有效性。
團隊效能研究數十年來始終是軍事領域的核心議題。軍方資助或主導的研究揭示了團隊績效的本質特征,完善了績效測量與評估方法,并深化了對團隊構成與組建機制的理解。然而,近期技術進步與近鄰對手能力的躍升正顛覆作戰范式。未來戰爭中,“多梯隊殺傷鏈”——由分散式系統集群與操作員構成——將成為制勝關鍵。這一新范式為軍方帶來一系列獨特的協同挑戰。能否有效閉合對敵殺傷鏈并保持優勢,將完全取決于分布式多域團隊在“人-人”及“人-自主系統”協作、以及快速適應動態戰局方面的能力。
美國國防部計劃通過“聯合全域指揮控制(JADC2)”倡議應對軍事格局演變。JADC2是一項戰略作戰概念,旨在將陸軍、海軍、空軍、海軍陸戰隊及太空軍的傳感器、打擊單元與通信設備——最終包括盟國系統——整合為“網絡之網絡”。JADC2的成功高度依賴從多元數據源快速采集海量信息。盡管人工智能(AI)與機器學習(ML)可高效輔助數據處理與分析,人類仍是關鍵資產——尤其在數據解讀與分布式團隊跨域協同效應生成環節。《空軍條令文件3-99》(2021年)指出,“聯合全域作戰(CJADO)”的作戰效能需通過“動能與非動能能力在正確時空點的同步釋放”實現。例如,2023年“護身軍刀”演習中,參演部隊利用非動能效應在反介入/區域拒止環境中為動能打擊開辟時間窗口。為確保此類效應同步,《空軍條令文件3-99》強調每個分布式作戰單元必須理解總體計劃、自身角色及與其他單元的互依支持關系。本研究目標即開發可視化作戰單元互依關系的界面以促進效應同步。
基于前人關于互依性定義與可視化設計的研究,本文改造“智能多無人載具自適應協同/控制技術規劃平臺(IMPACT)”,使其展示任務時序與互依關系。IMPACT整合自主技術、直覺界面與決策支持工具,支持操作員在基地防御、應急響應等任務中指揮多作戰單元。其任務管理界面通過解析聊天文本數據識別任務指令,若判定與操作員相關,則將任務添加至任務管理器并附詳細參數與“快速反應清單”推薦行動。盡管前期研究已探討不同分布式團隊結構利用任務管理器執行聯合指令的效能,但未涉及任務時序與互依關系的表征。為填補此空白,本研究批判性評估現有設計并開發新界面,以可視化任務歸屬、互依性、時序及狀態信息。
經研究確認,任務管理界面需呈現四大核心要素。首先為任務歸屬——明確團隊中任務責任人對協同至關重要,該信息應易于訪問。其次為時序數據,包括任務計劃啟動/結束時間及持續時間。在JADC2任務中,“任務機會窗口”亦屬關鍵,需確保任務在可接受風險或與階段性資源/預協調行動配合下完成,因此所有任務均納入“最早可啟動時間”與“最晚需完成時間”構成的窗口期。第三為任務依賴關系,其中“任務順序約束”是最基礎形式,需標識任務相對其他任務而非單純依時間執行的關聯性。識別出三類基本順序約束:1) 父任務啟動是子任務啟動的前提;2) 父任務完成是子任務完成的前提;3) 父任務完成是子任務啟動的前提。所有依賴關系均存在“父任務”與“子任務”,后者依賴于前者形成方向性關聯。最后為任務狀態,設計中包含“規劃中”“執行中”“已完成”三種狀態。此外,研究認定需考慮“警報機制”,其觸發邏輯基于任務窗口期與依賴關系,分為兩級警報:在JADC2等復雜環境中,若任務無法在窗口期內完成需調整,界面將觸發“紅色警報”;任何因依賴關系受該警報影響的任務則觸發“黃色警告”。這四大要素被融入現有及創新設計理念,產出兩組數據同源但設計異質的界面供實驗對比研究。
認知戰(CogWar)作為新興概念,已在北約國家與伙伴國引發激烈競爭。其發展主要依托技術進步、人工智能(AI)及社會科學新知識的驅動。此類行動可快速觸達目標受眾的特性,要求必須及時識別攻擊以實施有效應對。若未采用尖端AI算法、集成學習方法及大語言模型(LLMs),指標與預警(I&W)解決方案將無法與認知戰行動抗衡。AI賦能的I&W解決方案潛在問題在于透明度不足與調優缺失。目前,北約技術團隊(負責研究網絡空間認知戰指標與預警)正開發一套框架,用于識別認知攻擊與認知戰行動的可量化指標(和/或LLM驅動指標),以供未來軟件解決方案使用。該框架通過已知輸入保持系統透明度。此外,盡管LLM尚無法創造新知識,但研究人員與從業者可利用此框架預判認知戰未來應用方向,并主動更新相關I&W軟件。
北約技術團隊采用現有形態分析法構建認知戰相關場景,進而識別潛在指標。情報研究領域的大量文獻涉及I&W與預警系統,這些成果將被整合以開發基于場景的認知戰指標統一框架。該框架為持續訓練與更新AI賦能解決方案(用于識別敵方認知戰行動)邁出關鍵一步。
圖:CogWar指標與預警識別框架
本文的主題不是人工智能本身,而是 “人機協作”,或 HMT,它可能是武器演變的一個里程碑。在本文的論述過程中,旨在驗證這個日益“時髦”的術語的含義。這是一個急需關注的問題,因為它正在影響越來越多的研究計劃和研發預算。
軍事領域的現代化導致復雜的機器人技術和數字技術創新在現代軍事行動中的比重日益增加。事實上,機器人技術、人工智能(AI)、認知科學和相關領域的最新技術進步,不僅在數量上增加了機器人在戰場上的使用,而且在質量上提高了機器人的能力。在此背景下,人工智能被視為未來戰場制勝的關鍵因素。因此,全球武裝部隊都在努力將人工智能融入軍事領域,期望越來越多由人工智能控制的部分或完全自主的機器人系統在戰場上的成功運用將為采用這些系統的國家帶來決定性的優勢。
人機協同(HMT)--將機器和人整合為一個團隊--被視為將人類士兵與這些數量越來越多、自主能力越來越強的機器人系統結合起來的最佳方式。事實上,主要由于人工智能帶來的新能力和復雜的機器行為,機器可以被視為隊友。因此,這將是人類與機器之間傳統關系的演變,在這種關系中,機器是人類操作的工具。根據這種觀點,團隊合作將使武裝部隊能夠通過在混合系統中成功地將人類和機器結合起來,從而充分利用人類和機器的最佳方面。對于某些人來說,HMT 是人類在未來更快、數據量更大、自主性更強的戰場上作戰的最佳方式。
然而,一些復雜因素依然存在。作為一套仍在發展中的技術和概念,HMT 經常被誤解,導致其當前和未來能力面臨重大的定義挑戰、風險、混亂、炒作和不確定性。雖然人們對如何成功創建人類團隊有很多了解,但對機器--尤其是具有高度自主性的機器--卻知之甚少,部分原因在于這一概念的新穎性。有關自動化的信任、雙向交流、接口以及更多領域的問題仍未得到解決。此外,由于團隊合作本質上是一種社會活動,因此 HMT 不僅是一項技術工作,也是一項社會工作。然而,很少有人涉及 HMT 流程的這一方面。
因此,由于自主系統正在迅速滲透到軍事領域,軍隊迫切需要全面了解影響 HMT 的問題。與機器合作意味著什么?軍事領域給這項工作帶來了哪些復雜性?團隊合作是否是理解人類與智能機器之間新的互動關系的正確框架?這種新穎的人機交互概念會產生哪些影響?
本文將作為一個跳板,幫助讀者了解 HMT 在多大程度上是一個現實、有用和可操作的框架,可用于構思未來軍事領域的人機互動。本文分為三個部分。第 1 部分將概述學術界和國防領域圍繞該問題的文獻和討論。第 2 部分將分析軍事領域的特殊性是如何復雜化、改變并可能加劇圍繞人機協作愿望的許多現有未決問題的。最后,第 3 部分將深入探討一些建議。
人工智能(AI)在塑造未來技術格局方面舉足輕重。多智能體強化學習(MARL)已成為一項重要的人工智能技術,可用于模擬各個領域的復雜動態,為高級戰略規劃和自主智能體之間的協調提供新的潛力。然而,由于缺乏可解釋性(可靠性、安全性、戰略驗證和人機交互的關鍵因素),它在敏感軍事環境中的實際應用受到限制。本文回顧了 MARL 在可解釋性方面的最新進展,并介紹了新的使用案例,強調了可解釋性對于研究智能體決策過程的不可或缺性。首先對現有技術進行了批判性評估,并將其與軍事戰略領域聯系起來,重點關注模擬空戰場景。然后,引入了新穎的信息論可解釋性描述符概念,以分析智能體的合作能力。通過研究,旨在強調精確理解人工智能決策的必要性,并使這些人工生成的戰術與人類的理解和戰略軍事理論相一致,從而提高人工智能系統的透明度和可靠性。通過闡明可解釋性在推進MARL用于作戰防御方面的至關重要性,該工作不僅支持了戰略規劃,還通過有見地和可理解的分析支持了對軍事人員的訓練。
深度 RL 涉及神經網絡在兵棋推演等復雜和真實世界環境中的決策。然而,由于難以解釋其結果,這些網絡經常被視為黑箱模型。可解釋強化學習(XRL)指的是解釋和理解強化學習模型決策過程的能力,讓人們深入了解在特定情況下采取某些行動的原因。XRL 面臨的挑戰包括與科學評估和操作可靠性相關的風險、缺乏普遍接受的評估指標,以及為復雜任務提供全面解釋的難度[3]。盡管存在這些挑戰,但在軍事行動中,采用有效的可解釋性方法來理解模型輸出對于診斷錯誤、提高模型性能和理解錯綜復雜的智能體行為尤為關鍵。這些方法在建立軍事人員之間的信任、確保安全關鍵任務的透明度以及促進遵守嚴格的操作和監管標準方面發揮著至關重要的作用。在復雜而敏感的軍事場景中,XRL 使指揮官和決策者能夠解釋和證明人工智能驅動的戰略和行動,從而做出更加明智和負責任的決策。此外,精確的可解釋性(即正確可靠的解釋)有助于更好地進行風險評估和管理,改善人類與智能體之間的協調,并支持將先進的人工智能系統集成到現有的軍事框架中,同時保持作戰的可靠性和有效性。空戰模擬涉及復雜的決策過程,智能體必須在瞬間做出決策以實現戰略目標。這些模擬通常涉及眾多因素,包括機動、瞄準、規避威脅、燃料管理以及與其他單元的協調。舉例來說,考慮以下場景:智能體檢測到敵軍導彈來襲。為了反擊,它迅速釋放照明彈并進行桶形翻滾,以迷惑導彈的熱傳感器并躲避敵方的瞄準。在這一場景中,對導彈的觀察是執行釋放照明彈和桶形翻滾動作的重要特征。
本文回顧了 MARL 在可解釋性方面的最新進展,并介紹了一些新穎的使用案例,這些案例突出了 MARL 在模擬空戰場景(圖 1-1)中分析智能體決策過程的關鍵作用。通過研究這些進展,我們強調了可解釋性在理解和改進智能體行為方面的重要性,尤其是在應用于軍事模擬等復雜環境時。我們的論文不僅僅是一份調查報告,它還探討了可解釋性如何加強戰略規劃、促進人類與人工智能的協作,以及確保人工智能在關鍵任務行動中做出的決策值得信賴。通過這些見解,我們旨在證明可解釋 MARL 在高風險場景的研究和實際部署中的緊迫性。
目前有多種結合 RL 和 MARL 的方法,用于訓練空戰場景中的智能體。這些方法不僅限于戰斗機的狗斗機動,還包括無人機群(UAV)和不同類型的飛機(異構智能體)。
小規模交戰中的空戰通常側重于通過 RL 控制飛機,以便在幾乎沒有還擊風險的情況下獲得對對手有利的位置。早期控制飛機的方法包括專家系統或帶有學習分類器的混合系統,而較新的方法則依賴于 RL。為了學習更強的 CoA,使用 RL 方法的模擬空戰方法依賴于更先進的技術,如深度 Q 網絡(DQN)、深度確定性策略梯度(DDPG)、課程學習方法或包含自我博弈的方法,即智能體與自身的副本進行博弈。
另一方面,更大規模的交戰側重于高層次的戰術決策或武器-目標分配,即 CoA 的規劃。在這種情況下,考慮到維度過程,MARL 方法通過利用單個智能體內部的對稱性,尤其適用。在這一領域,有一些使用多智能體 DDPG、分層 RL 或基于注意力的神經網絡的先進方法。我們之前的一項工作包括一個具有注意力機制的分層 MARL 模型,該模型使用近端策略優化(PPO)進行訓練。在我們的工作中,我們還考慮了異構智能體,這在文獻中似乎很少見。加入異構智能體會增加協調的復雜性,因為智能體可能不了解彼此的技能和能力。
現在回顧相關工作部分所回顧的 XRL 類別,隨后將它們與空戰場景的多智能體領域聯系起來,以強調理解人工智能戰術的益處和不可或缺性。前三種方法(策略簡化、獎勵分解和特征貢獻)屬于被動解釋類別。這類解釋側重于短時間范圍,根據即時行為提供反饋。例如,“飛機為什么發射導彈?”這樣的問題可以通過 “對手進入武器交戰區(WEZ)”這樣的即時激勵來回答。這些解釋往往側重于個人行為,而不是更廣泛的戰略考慮。相比之下,積極主動的解釋考慮的時間跨度更長,更適合解釋戰略決策。例如,它們可以解釋為什么在特定情況下,某些擁有特定技能的智能體被設置為防御模式,而其他智能體則采取攻擊性戰術。因果和層次 RL 模型可以提供這類解釋,為空戰中的長期戰略和協調演習提供見解。
在深度 RL 中,神經網絡被用作函數近似器來學習決策函數,可以是策略,也可以是 Q 函數,在我們的分析中,我們側重于前者。策略簡化指的是降低策略的復雜性,使其可以被人類解釋的過程。具體做法包括:以決策樹的形式學習策略,跟蹤每個決策步驟;將學習到的策略作為 “if-then ”規則集(如模糊規則);使用狀態抽象法將相似的狀態分組,降低狀態空間的維度;或使用高級的、人類可讀的編程語言來表示學習到的策略。這些方法的主要優點是簡單易用,因為這有利于產生解釋并增強對系統的信任。在動態相對簡單、智能體較少的環境中,即使是在不可預見(和簡單)的空戰場景中,這些方法也能充分推廣和擴展,以提取有意義的解釋。然而,在任務目標眾多、智能體技能各異的更復雜環境中,這種方法可能就不適用了,因為解釋往往是靜態的。這種方法的主要缺點是模型性能與可解釋性之間的權衡:隨著可解釋性水平的提高,模型的準確性往往會降低。在模擬空戰場景中,逼真度對產生有價值的見解至關重要,因此保持模型的高準確性非常重要。這通常需要復雜的模型,涉及精密的神經網絡、廣泛的超參數調整、先進的訓練算法和高度動態的環境。雖然策略簡化會限制策略表示的類型,從而影響整體性能,但它可以作為一個實用、高效的起點。簡化后的策略可以有效訓練和解釋空戰智能體的基本控制動作,為未來的迭代打下基礎,從而隨著場景復雜度的增加,在可解釋性和準確性之間取得平衡。