澳大利亞是一個領先的人工智能國家,擁有強大的盟友和伙伴關系。澳大利亞已經優先發展機器人、人工智能和自主系統,以發展軍隊的主權能力。澳大利亞承諾對所有新的戰爭手段和方法進行第36條審查,以確保武器和武器系統在可接受的控制體系內運行。此外,澳大利亞已經對人工智能對人權和情報組織的風險進行了重大審查,并承諾在安全和國防領域制定道德準則和框架。澳大利亞致力于經合組織以價值觀為基礎的負責任的人工智能管理原則,并采用一套國家人工智能道德原則。雖然澳大利亞還沒有專門為澳大利亞國防組織(ADO)采用人工智能治理框架;國防科技集團(DSTG)已經發布了 "國防中的道德人工智能方法"(MEAID)技術報告,其中包括管理人工智能軍事應用的道德和法律風險的框架和務實的工具。澳大利亞可以發揮領導作用,將法律和倫理考慮納入其ADO人工智能能力獲取過程。這需要一個政策框架來定義其法律和道德要求,由國防工業的利益相關者提供信息,并提供一個實用的方法來將法律和道德風險緩解戰略納入采購過程。
概述了國防能力發展的指導原則,為未來十年如何發展軍事能力提供信息。
近日,英國國防部發布《國防能力框架》(The Defence Capability Framework),主要概述了國防能力發展的指導原則,為未來十年如何發展軍事能力提供信息。該文件提出,國防能力發展指導原則包括:建立可信威懾力量;發展多域和集成能力;關注戰備可用性和可部署性;重視創新與實驗;加強聯盟;制定平衡且可負擔的國防計劃;減緩和適應氣候變化的影響等。
軍事能力發展—制定裝備計劃
2021-2031裝備計劃(EP)闡明了通過增加國防開支投資來資助的變化,以反映交付綜合審查的變化,同時平衡成本和預算。它詳細介紹了十年計劃,從2021年開始,計劃在設備采購和支持上花費2380 億英鎊,比之前的EP 報告增加480 億英鎊。未來十年的設備采購計劃,將花費1140億英鎊,在此期間將進行許多重大收購,主要是由于綜合審查期間做出的能力規劃決策。然而,它并非一成不變,快速變化的全球安全環境意味著保持投資計劃靈活和適應性至關重要。 EP在十年內有43 億英鎊的凈空,從2025/26 年起,該部門將撥出41億英鎊用于開發和利用新興技術。隨著項目的成熟,這筆資金將持續為開發新技術和創新提供支持。
圖1:顯示總設備計劃的頂級預算(TLB) 十年總支出變化的圖表
圖2:顯示 TLB設備支持十年總支出變化的圖表
圖3:顯示 TLB設備采購十年總支出變化的圖表 國防指揮文件(DCP) 概述了國防部在應對這種不斷變化的環境中的優先事項和方法。本文中概述的優先能力領域就是在此背景下形成的。在這種情況下,軍事能力發展和投資決策方面遵循以下原則。
能力發展指導原則 1:建立可信威懾力量
威懾力是英國國防的基石,威懾的需要將是能力需求的關鍵驅動因素。海上持續威懾(CASD)的交付將繼續發揮至關重要的作用。除此之外,威懾的另一個關鍵部分是在擁有在所有領域有效和靈活的常規力量,從而威懾對手。
能力發展指導原則2:發展多領域和集成能力
為了保持作戰優勢,國防部需要整合所有五個領域、政府以及關鍵盟友和合作伙伴的活動。跨域系統采用通用數據標準、可互操作的網絡系統和開放架構是多域集成的關鍵推動力。更深入地集成的能力將成為未來能力發展的一個關鍵特征,行業合作伙伴對子系統和軟件的集成是實現目標與否的關鍵因素。
能力發展指導原則3:關注戰備可用性和可部署性
從有限的資源中獲得最大的產出并確保武裝部隊能夠超越和戰勝敵人是未來成功的關鍵。為實現這一目標,必須提高平臺可用性和部隊準備情況,利用數據和技術并采用擁有先進的設計、有保障的、環境可持續的和具有成本效益的物流和工程解決方案。
能力發展指導原則3:重視創新和實驗
新和試驗的過程,能夠更好地了解機遇與風險,并從運營商那里獲得反饋,從而加快開發路徑,更早地做出正確的決策并更快地推動創新。即使漏洞利用最初只提供了不到100% 的解決方案,螺旋式開發通常也比后期引入的大部分解決方案要好。
能力發展指導原則5:以人為本
軍民都是國防能力的重要組成部分。為了在信息時代開展業務并及時利用先進技術,需要確保擁有一支多元化、包容性和專業技能的員工隊伍,并制定相關政策以最大限度地提高人才質量,調動其積極性。人機協作和人工智能的使用將使人們“向價值鏈上游”移動。
能力發展指導原則6:加強聯盟關系
聯盟關系是交付國防成果和能力發展的基本要素。北約是英國的國防的基石,英國的能力規劃必須與北約保持一致。北約的中心地位并不意味著“只有北約”,我們必須繼續超越傳統伙伴,進一步提高能力。國防指揮文件提供了我們與其他國家合作優先事項的更多細節,包括能力發展。未來的能力發展將探索早期階段與其他國家合作的機會,增強交互性,建立加強聯盟關系。
能力發展指導原則 7:制定平衡且可負擔的國防計劃
過冗的設備計劃會減慢交付速度,壓縮新功能或創新空間。因此,需要繼續推動物有所值的收購,并保持空間以允許將技術引入運營。在評估替代方案的價值時,開發新能力更廣泛的社會價值,對政府升級議程的貢獻也是重要的考慮因素。
能力發展指導原則8:減緩和適應氣候變化的影響
氣候變化已經對運營環境和國家能力產生影響。需要增強對氣候變化的抵御能力,包括通過減少對石化燃料的依賴,保持和加強運營優勢。后續將通過選擇、評估和調整服務能力以適應氣候變化的影響,并繼續實現2050年凈零排放以減輕其影響。因此,以不斷變化的環境和安全環境為依據,規劃和確保未來的能力決策,將繼續成為關鍵考慮因素。
能力發展指導原則9:國防工業對長期能力優勢的重要性
DSIS強調了英國國防和安全行業的能力對維持長期能力優勢的重要性,而民用工業是未來的關鍵因素。行業憑借其集體經驗、投資、網絡和生產方式,本身就可以被視為一種能力。提高透明度和與行業的合作也是解決持久能力挑戰的基礎。通過這份文件以及持續參與,尋求讓工業界支持與參與,以投資和探索機會,從而更好地發展英國武裝部隊、盟國和合作伙伴需要的威懾力、防御的能力并在必要時擊敗的對手。
持久的能力挑戰和發展重點
未來的能力發展將繼續以威脅形勢為導向,并以運營理念為主導。下面概述的能力優先事項并非詳盡無遺,而是重點關注的領域。隨著威脅和概念的發展,優先級將不可避免地隨著時間而改變。研發投資的結果將改變對技術發展帶來的機遇的理解,指導未來的投資,并可能建立新的重點領域。 本文概述了未來的能力優先事項,以應對持久的能力挑戰。這些優先事項主要描述了“什么”,即國防部有興趣開發什么,但需要工業界提供解決方案共同解決這些挑戰。在國防內部,這些能力優先級將用于為國防層面和各個前線司令部的未來政策、戰略和計劃提供信息;它還將關注未來的投資,無論是通過國防技術開發計劃(DTEP)還是其他途徑。下圖顯示了國防能力框架在闡明“什么”方面與其他闡明“為什么”和“如何做”的國防出版物的關系。
圖4:出版情況
持久能力挑戰1:全頻譜、多領域的情報、監視和偵察(ISR)
挑戰定義
信息將是未來戰爭的核心ISR能力是理解的基礎。必須應對影響在所有領域和環境中開展ISR 能力的當前和新興技術的威脅和機遇。英國的 ISR 能力正日益被對手的反介入和區域拒止能力所壓倒,從而剝奪了開展ISR 行動的能力。隨著對手開發先進的網絡傳感器技術、被動檢測系統、量子傳感以及反ISR 和反 PNT能力,未來戰場空間的能力將受到進一步挑戰。
如何解決
到2030 年,國防將擁有現代化、有能力、有彈性和適應性的ISR系統,并以數據為中心。它將能夠收集所有領域的信息,并使國防部能夠通過在理解上戰勝對手來保持主動權。空間領域的機會將越來越重要,英國將尋求建立ISR“收集”能力信息處理、利用和傳播能力的最佳互補組合,以實現及時決策。
未來能力發展的優先事項
國防將探索先進技術,以提供普遍的、全頻譜、多域的ISR,加速這些技術并將其集成到服務中。同時將尋求行業的支持,將這些技術集成到當前平臺的選項,以及利用收集的數據的系統,并從長遠來看,一起定義未來ISR要求。需要在未來發展以下能力領域:
**加工、開發和傳播 (PED):**能夠處理、利用和傳播信息是確保信息優勢的關鍵。國防部將繼續投資于多源 PED,以更好地分析來自各種來源的數據,創建一個足夠連貫和無處不在的系統,以利用所有情報學科。通過利用人工智能、機器學習和高級數據分析,以最有效和最高效的方式管理、處理、利用和傳播大量數據。
**開源情報(OSINT):**國防部將增加對公開和商業可用信息的利用。改進戰術層面的傳播,提供更大機會并改善與不同合作伙伴的合作情況。提高 OSINT 能力對于鞏固國防部對受眾和影響活動的重視也至關重要。目前英國的 OSINT 能力在合作伙伴中處于領先地位,英國將尋求進一步投資以超越對手。
持久的基于空間的ISR:國防部目前正在資助調查和作戰演示,以提供基于空間的 ISR 能力。探索和發展對天基系統的要求,以了解這些系統如何增強和替代現有的提供 ISR 的方式。利用現有的研發投資并根據國防空間戰略進行開發,研究先進的傳感器、高光譜成像、電光和紅外以及合成孔徑雷達。該能力領域的關鍵決策預計從 2025 年開始。
**下一代自治系統:**從無人駕駛航空系統 (UAS) 到無人駕駛地面車輛 (UGV)、無人駕駛水面艦艇 (USV) 和無人駕駛水下航行器 (UUV) 等自主系統的開發和納入,是未來能力計劃和英國的ISR 能力的重要組成部分。通過對當前研發和預期技術開發的投資,國防將繼續升級現有的,并開發新的、無人駕駛的和自主的系統。Protector UAS 和自主尋雷能力將在其生命周期內進行升級,小型 UAS和替換陸地和海上旋翼飛機的選項是支持ISR 能力的關鍵發展領域。
**海上空中監視和指揮:**英國需要主權海上特遣部隊的情報、監視、采集和偵察 (ISTAR) 能力,以在海軍的 Crowsnest 機載預警系統停止服務時進行取代。國防和安全加速器 (DASA) 已經為替代 Crowsnest 的能力進行了潛在解決方案的競爭,這將為該能力的未來提供決策。
**機載ISTAR:**鑒于未來十年的預期技術發展,國防部希望探索提供彈性和普遍 ISR 的全部選項。目前,Rivet Joint 提供電子監視和偵察能力;預計它將在 2030 年代中期停止使用。E-7 Wedgetail 將于 2023/24 年投入使用,它提供了一種跨越式的、世界領先的機載監視和飛機控制能力,我們將在其生命周期內尋求升級以保持領先地位。
持久能力挑戰2:多域指揮與控制、通信和計算機(C4)
挑戰定義
信息的普遍性和復雜性以及技術變革的步伐正在改變未來的作戰環境,可能會降低C4能力的有效性。對英國通信、網絡、信息系統和平臺的威脅正在加速,這危及提供安全、遠程、彈性和互操作能力所需的能力,以實現多域整合和全球協調效應。C4是一個廣泛、復雜且具有技術挑戰性的領域,其特點是技術的快速進步,由商業信息系統技術和國家行為者的大量投資推動。鑒于此,需要更好地整合,跨領域運作并與其他國家力量工具協同工作。
如何解決
通過發展實現多域集成的能力,以及與盟國和合作伙伴在政府和全球范圍內協調效果,增強多領域C4的能力。
未來能力發展的重點
為了應對威脅,國防部必須開發更具彈性、自主性和可互操作的C4系統。這將通過底層技術實現,以確保行動自由并保護關鍵信息。尋求行業支持,通過應用開放系統架構來實現數字解決方案的更輕松、更低成本的集成,并確保這些系統與盟友和合作伙伴的可互性。這還將涉及與行業合作開發系統,以更好地利用收集的數據。為了應對這一挑戰,將在未來開發以下能力領域:
**多域指揮與控制 (C2):**隨著太空和網絡的新領域變得更加活躍,需要將它們整合到現有的 C2 結構中。 人員是C2 能力的核心,需要能夠利用大量數據來為決策提供信息而沒有壓迫性的運營商,同時打算進一步投資于戰略通信基礎設施以保護 C2 信息并采用人機協作來提高 C2 的速度。在太空領域,已經在未來十年投資超過 1.35 億英來增強太空領域 C2,并將與行業合作伙伴合作,以最好地利用現有技術來實現這一目標。
**國防數字骨干現代化:**國防指揮文件闡述了國防的數字骨干現代化計劃,該骨干支撐著武裝部隊的現代化,并支持國防能力和商業實踐的更廣泛轉型。 正如國防數字戰略中所強調的那樣,數字技術在不斷發展,英國計劃在未來十年內額外投資 16 億英鎊用于支撐數字骨干的人員、流程、數據、技術和網絡。 此外,英國正在投資開發超大規模云,部分原因是為了更好地利用國防收集的大量數據,為提供未來能力和下一代網絡奠定基礎。
**集成作戰環境:**為了增強國防的態勢感知和規劃,需要新的更復雜和集成作戰環境和作戰工具。英國計劃在十年內花費超過 7 億英鎊的陸軍集體訓練轉型計劃 (CTTP) 將數據開發和數字化置于訓練設計和交付的核心。為了改善所有國防合成環境的集成,將進一步投資于一個供所有人操作的通用平臺,從而提高交付的有效性和效率。
**安全衛星通信:**全球、安全的衛星通信對于獨立運營能力至關重要。 未來十年,在天網衛星系統上投資將超過 50 億英鎊,通過投資在全球范圍內提升快速、安全地傳輸大量數據的能力。
**密碼學:**在 SECRET 及以上安全交換信息以支持 MOD的任務和運營需求的能力需要主權、高級加密能力。國防投資將繼續解決遺留問題,同時首先改進并改變向國防提供密鑰(CK)功能的方式。 通過與工業界的密切合作,國防將確保設計和開發下一代英國密鑰功能,以確保技術先進性。
**數據:**國防數據戰略支持國防數字骨干的發展,這將為全面管理和利用數據資產提供基本基礎。國防部數據規則和數據戰略的建立設定了衡量國防所有數據交付和決策的標準。
持久的能力挑戰3:在閾值中確立并保持優勢
挑戰定義
信息的普遍性和技術變革的步伐正在改變戰爭的性質,非常規戰斗的惡意行為越來越多。攻擊者正在改變戰術,在不戰斗的情況下通過使用低于閾值的攻擊來實現目標,從而引發戰斗反應。
如何解決
如國防指揮文件所述,在不斷競爭的時代,必須增加前沿力量來與以提升戰略影響力、加強聯盟關系并預防沖突。
未來能力發展的優先事項
英國需要進一步發展其保護其利益的能力,以及在這一領域競爭和限制潛在對手。為了應對這一挑戰,需要發展以下領域的能力:
**保護重要的國家基礎設施:**保護數據和數字系統免受干擾至關重要。這包括陸海通信和光纖連接,以及基于云的數據存儲。保護可以通過包括加密和網絡能力以及傳統的物理措施來實現。
**特別行動:**特種部隊能力通過綜合審查得到增強,提高了惡劣環境中秘密行動的能力。此外,綜合審查促進了突擊隊和陸地特種作戰部隊的發展和投資,部隊的向前部署能夠支持更廣泛的特種作戰,同時保持與盟友及伙伴共同行動。
**網絡和電磁環境(EME):**進攻性和防御性網絡能力都是未來運營環境中保持戰略優勢的基礎。
**反潛戰(ASW):**為了應對水下戰場日益嚴峻的挑戰,必須利用新興技術和高度成熟的研究來獲得作戰優勢。對 26 型護衛艦和 P-8 Poseidon 的現有投資凸顯了對反潛戰的重視,未來將進一步投資于反潛戰能力。 特別是開發自主系統,利用人工智能和機器學習來連接傳感器并產生更大的集體水下檢測和跟蹤能力。
持久的能力挑戰4:不對稱和硬實力
挑戰定義
俄羅斯等國在高超音速導彈和滑翔器等硬實力方面的發展,對英國和盟國構成了重大挑戰。如果要阻止侵略,必須與盟友和伙伴一起應對,防御全方位的威脅,并提升防御能力。
如何解決
通過投資先進的硬實力能力,并加強投資開發的新技術和能力。為了實現這一目標,需要投資與潛在對手部署的類似的對稱硬實力能力,以保證優勢。
未來能力發展的優先事項
國防部將著眼于增強進攻能力,使這些能力的部署更加有效和敏捷,在部隊防御方面實現階梯式變化,以應對更廣泛的動能和非動能效應。 為應對這一挑戰,在未來將發展以下領域的能力:
定向能武器 (DEW):DEW是一種武器系統,它通過發射高度集中的電磁能(激光或射頻)來破壞、降解或損壞目標。 國防部正在大力投資開發可用于從空中平臺保護到地面防空的多種應用的 DEW 能力。
高超音速和高速武器:英國目前不具備高超音速滑翔飛行器 (HGV) 或高超音速巡航導彈 (HCM) 形式的高超音速武器能力。英國正在尋求更廣泛地發展遠程精確打擊能力,國防部積極投資開發高速武器(HSW)技術的科技計劃
**未來陸地作戰系統(FLCS):**未來士兵計劃中的 FLCS 將使英國陸軍現代化,使其能夠采用新方法并為新能力的變革效應做好準備,包括從整合其他領域的能力,從而使陸軍轉向更加前沿的部署態勢,在沖突閾值以下運行,對發展中的局勢進行預測和快速反應,以實現不對稱的硬實力效果。
**多域集成群(MDIS):**MDIS“游戲規則改變者”計劃正在開發信息架構并促進實驗以實現多域自主集群能力; 一個潛在的用例是幫助在有爭議的環境中訪問和保持機動自由。目前,MDIS 正試圖證明在有爭議的環境中使用遠程和自主系統的可行性,隨著這項技術的成熟,將這一能力領域進一步投資,以證明其概念的可行性。
**海上殺傷力:**通過綜合審查增加的部分投資集中在水面艦隊的殺傷力上。 通過與法國盟友的未來巡航/反艦武器 (FC/ASW) 計劃,在海軍的水面到水面制導武器能力方面實現階躍變化。 這將使皇家海軍從一支以防御為主的部隊轉變為一支更具進攻性的部隊,通過提供提供陸地攻擊和反艦能力的復雜打擊系統。
**未來戰斗航空:**國防司令部文件重申,到 2025 年,將在未來作戰空中系統 (FCAS) 計劃中投資超過 20 億英鎊。在接下來的 10 年中,將為 FCAS 計劃撥款約 100 億英鎊。英國正在探索未來的能力如何創造一個綜合空中作戰系統并進行有效連接。這意味著需要從情報、監視和偵察(ISR)到指揮和控制以及防空全方位的整合利用。目標是在下一個十年中期提供初始運營能力。
持久能力挑戰5:進入和機動自由(FOAM)
挑戰定義
對手正在采用新的作戰方式,采取一系列旨在通過競爭和降低所有領域的作戰環境來剝奪英國進入和機動自由的能力。
如何解決
通過持續的全球參與來確保進入和機動自由,并在持久的基礎上部署更多的力量。
未來能力發展的優先事項
啟用FOAM將確保國防部在需要完成任務時能夠及時運行。尋求利用技術和能力能夠在有爭議和退化的環境中運行,更具生存能力,并利用人工智能和人機協作。國防可以利用并整合到我們現有和未來的能力中。未來可能提供優勢的一些能力領域是:
**定位、導航和定時(PNT):**國防部將繼續支持商業、能源和工業戰略部的 PNT 辦公室和廣泛的跨政府“系統系統”方法,以開發安全和有彈性的 PNT,以滿足更廣泛的社會需求符合規定的 IR 意圖的要求。
**彈道導彈防御(BMD):**綜合審查包括顯著增加研發資金,從而進一步開發具有前景的計劃,例如下一代雷達技術,以探測和跟蹤彈道和高超音速威脅。我們將繼續投資于尖端科學研究和技術,以應對快速發展的威脅的挑戰,并繼續致力于北約的 BMD 雷達。
**反無人機系統(C-UAS):**無人駕駛航空系統 (UAS) 已成為整個沖突范圍內普遍存在的威脅,在規模、能力和控制方法方面存在顯著差異。有意或無意的濫用對英國和海外的國防構成了重大威脅。這種趨勢將繼續下去,對抗各種規模和能力的無人空中系統的需求,將越來越成為以分層方法保護空域的部署部隊的先決條件。為了集中投資并應對最直接的作戰威脅,英國將優先考慮反小型 UAS 能力的發展。
**陸基防空:**展望未來防御威脅,無論是小型無人機系統,還是大型載人系統都變得尤為重要。陸軍在未來十年內將花費約 10 億英鎊,建設陸基防空系統,這是實現防御這些威脅的一個組成部分。新的防空系統投入使用將是分層和全頻譜防空系統的一部分,該系統需要嵌入國防數字骨干網中,以便更好地利用信息來支持決策,更好地應對威脅 。
**空中平臺保護:**部隊保護的一個重要子集是平臺保護,傳統上專注于空中和海上環境,但平臺的作用也越來越重要。需要采用電子戰、誘餌、對抗措施和其他技術來提高平臺在競爭環境中的生存能力,并實現訪問和機動自由。英國計劃進一步投資于空中平臺保護能力,以適應、升級和發展以應對不斷變化的威脅,并確保寶貴的主權工業能力。
**空空加油:**空對空加油 (AAR) 使飛機能夠飛得更遠,飛行時間更長,這對于保持FOAM 至關重要。AAR 能力目前由 Voyager 提供,同時還提供遠程空運; Voyager 機隊由 AirTanker 財團作為一項服務提供。 這項安排將于 2030 年代中期到期。 國防部將 AAR 視為一項持久的要求,并且可能會受益于 AAR 平臺的更高程度的自主性和更廣泛的實用性。
**支持:**通過國防支持戰略 (DSS),正在投資于支持能力。 有爭議的物流預計與在所有領域和氣候、社會和物理威脅的背景下競爭的近乎對等的對手進行潛在的戰斗,分布在一個擴展的戰區。 它假設所有領域都受到威脅,家園不再是避難所,并且將直接針對后勤。 為了解決這個問題,將尋求通過靈活和有彈性的物流來實現支持優勢。 將持續對國防后勤和工程支持能力進行廣泛轉型,以提升國防威懾力,擁有更多的關鍵能力。國防部將通過有彈性的戰略基地、高效的耦合橋和能夠打開和啟用有爭議的戰區的強大使能器來提供支持優勢。
**適應氣候變化:**為了進出和機動自由,需要能夠抵御氣候變化的影響的能力。國防部希望投資于可持續的燃料和替代能源,為英國在戰場上的運營和商業領域的資產提供動力。
國防醫療服務(DMS): DMS 正處于一個轉折點,必須從線性護理途徑轉向醫療支持選項,這些選項更加網絡化、適應性強、可擴展性強,并采用全險方法分層。數據的智能使用和設備的通用性可以為部隊提供更大的醫療支持靈活性。需要對模擬進行投資才能啟用醫療人員。DMS將通過數據驅動的健康網絡提高整體部隊的可部署性,利用可穿戴技術和連接的患者記錄來提供患者健康和護理的端到端圖片。
未來軍事能力優先事項摘要
衡量成功:轉變測試和評估
為了根據指導原則、挑戰和優先事項衡量成功,測試和評估方法需要逐步改變。在承認英國現場試驗能力的價值的同時,需要擁抱一個更加數字化的未來。 有幾個因素正在推動這一變化(見圖5)。需要克服不斷上升的系統復雜性和衛星監視等挑戰,但也存在一些機會,例如在能力生命周期的早期開始進行持續評估,以便在最能利用的時候引入反饋。建模和仿真、數據開發和持續數字評估的采用可以使國防部和供應商具備定義、設計和交付更具適應性、綜合性和威脅優化的軍事能力的洞察力。
圖5:測試和評估企業變革的驅動因素
對于國防工業和更廣泛的英國經濟中的許多公司而言,這種方法已經成為產品和服務開發不可或缺的一部分。挑戰在于將這種方法整合到整個國防企業中,并釋放從部隊設計到能力發展到任務演練等持續、綜合、以威脅為導向的評估的優勢。簡而言之,系統性挑戰是超越接受評估,轉向評估優勢。 在國防指揮文件(2021年)中,宣布在四年內投資6000 萬英鎊,用于測試和評估轉型計劃的第一階段。該計劃目前正在進行中,其初始階段將在2023 年達到頂峰,為現代化測試和評估企業制定去風險藍圖和實施計劃。英國打算在第 2 階段進一步投資,以實施這些計劃并在10 年內實現轉型。這將包括解決實現轉型收益所需的支持性基礎設施、技能、數據、文化、流程、標準、服務和能力。
《軍事中的人工智能和自主:北約成員國戰略和部署概述》報告以及相關文件《附錄A -國家概況》提供了人工智能和自主技術在北約盟國軍事中的作用的高層視圖。這是第一個專門針對北約國家軍事人工智能的學術研究。
該報告概述了每個北約國家在軍事人工智能方面的觀點和雄心,并概述了它們目前對人工智能技術的使用。在附錄A中,報告探討了每個國家在軍事和國防背景下與人工智能的接觸程度,審查了國家人工智能戰略和當前人工智能技術使用的公開來源。
本研究的策略含義如下:
鼓勵負責任的人工智能規范:作為一個基于共識的聯盟,北約在促進安全和軍事人工智能討論方面處于獨特地位,并有機會協調成員國之間的規范建設活動。
人工智能的采用:北約是一個有價值的機制,通過該機制,可以按需向成員國提供能力建設指導和更廣泛的援助。
協作增強抵御能力:加強聯盟合作可能使各國能夠利用能力建設努力,更好地應對與人工智能技術相關的安全挑戰。
維持集體防御:人工智能技術的能力差距不斷擴大,可能導致一些成員國在應對更快的沖突環境方面裝備相對不足,在這種環境中,對手越來越多地利用人工智能和自主系統。
關注未來的互操作性: 豎井式創新為聯盟提出了未來的互操作性挑戰,例如在跨國運營中共享數據和AI應用。
2022年6月15日,英國國防部在倫敦科技周人工智能峰會上發布了《國防人工智能戰略》,旨在“雄心勃勃、安全和負責任地”使用人工智能的戰略和相關政策。本戰略支持創建新的國防人工智能中心(DAIC),以提供前沿技術樞紐,支撐英軍使用和創新相關技術。本戰略概述了以下內容:一是在國防中使用人工智能的新倫理原則;二是人工智能在國防部加強安全和現代化的地位和應用;三是考慮通過人工智能研究、開發和實驗,通過新概念和尖端技術徹底改變武裝技術能力,并有效、高效、可信地向戰場交付最新裝備。該戰略將將成為英國人工智能戰略的關鍵要素,并加強國防在政府層面通過科學和技術獲取戰略優勢的核心地位。
圖 英國國防部發布《國防人工智能戰略》
(本文根據原文編譯整理,僅供交流參考,觀點不代表本機構立場。)
英國國防部人工智能戰略的愿景是:以英國規模為標準,成為世界上最有效、最高效、最可信和最具影響的國防組織:
有效——提供戰場制勝能力和支持,以及英國與盟友關于人工智能生態系統合作的能力;
高效——通過創新使用技術交付能力,進行作戰并實現生產力效應;
可信——基于人工智能系統的安全性和可靠性受到公眾、盟友和人民的信任,根據英國核心價值觀合法合規地使用人工智能;
影響——積極參與合作和引領人工智能技術的全球發展和管理趨勢;
二**、背景和必要性******
英國國防部《綜合評估(2021)》強調指出,國家在人工智能領域的卓越表現是確保英國在2030年前成為“科技超級大國”的核心。英國國防部《國家人工智能戰略(2021年)》指出,人工智能在改寫整個行業的規則、推動經濟大幅增長和改變生活的所有領域方面具有巨大潛力。英國國防部《綜合作戰概念 (2020年) 》描述了無處不在的信息和快速的技術變革如何改變了戰爭的性質。在軍事作戰的各個領域,沖突正變得愈發復雜。新技術產生大量數據,解鎖新的威脅和漏洞,并通過如蜂群無人機、高速武器和先進網絡攻擊等下一代先進能力擴大潛在攻擊的規模。
人工智能技術以及其影響可能會極大地縮短決策時間,使人類理解負擔加重,而且這些在現代戰場中需要快速做出反應。正如《國防司令部文件(2021)》所指出的,“未來沖突的勝負可能取決于所采用人工智能解決方案的速度和效率”。因此信息作戰變得越來越重要。簡而言之,當代國防正在發生一場根本性的劇變,與人工智能相關的戰略競爭正在加劇,因此必須迅速、主動和全面應對。
本戰略闡述了英國將如何應對這一重大戰略挑戰,其應該引起英國國防部的重視,并參與部隊發展和國防轉型,英國國防部需要明確其機構與人工智能相關的要素并采取相應行動,以在后續執行和交付方面發揮關鍵作用。
三、發展途徑
**一是英國國防部需要轉變為“人工智能就緒”的組織。**具體措施是:1)推動文化、技能和政策變革,培訓領導人,提高人員技能,并加強國防人工智能和自主部門的組織能力;2)創建國防人工智能技能框架和新的人工智能職業發展和晉升路徑;3)將數據視為關鍵戰略資產進行管理和應用,建設新的數字主干網絡和國防人工智能中心。
**二是在速度和規模上采用和利用人工智能,以獲得防御優勢。**具體措施是:1)將人工智能視為能力戰略和部隊發展過程中戰略優勢的關鍵來源;2)短期路線采用成熟的數據科學、機器學習和先進的計算統計技術提升效果和生產力,長期路線進行尖端人工智能技術研發;3)采用多學科多技術將人類認知、創造力和責任與機器速度分析能力相結合以評估人工智能系統的脆弱性和威脅;4)與盟友和伙伴密切合作開發創新能力解決方案以應對共同的挑戰。
**三是推動和支持英國國防和安全人工智能生態系統。**具體措施是:1)通過英國工業和學術人工智能的雄厚基礎以及政府的支持建立信心并明確要求;2)視人工智能生態系統為戰略資產,消除行業壁壘,建立更具活力和一體化的伙伴關系;3)促進行業聯系建立新的國防和國家安全人工智能網絡,促進人才交流和共創,鼓勵業界投資國防相關的人工智能研發,并簡化國防數據和資產的獲取。4)促進中小企業,使監管方法現代化,支持業務增長并最大限度地利用國防人工智能相關知識產權促進相關技術商業化。
**四是塑造全球人工智能發展,以促進安全、穩定和民主價值觀。**具體措施是:1)按照英國的目標和價值觀塑造人工智能的發展,促進倫理方法,并影響符合民主價值觀的全球規范和標準;2)促進安全與穩定,確保英國的技術進步得到適當保護,同時探索建立信心和將軍事人工智能使用風險降至最低的機制;3)考慮可能出現的極端甚至事關生存的風險,并積極與盟友和合作伙伴接觸,制定未來的安全政策,尋求建立對話,以降低戰略錯誤、誤解和誤判的風險。
四、優先效果
通過采用人工智能技術實現本戰略目標,使英國武裝部隊實現現代化,并迅速從工業時代的聯合部隊過渡到敏捷信息時代的綜合部隊,國防部將受益于效率和生產率的提高,其期望的優先效果如下:
決策優勢:通過更充足、更分散的決策制定和基于威脅的機器快速響應,提高作戰節奏和靈活性。
效能:通過智能自主提高靈活性、效能和可用性。
解鎖新能力:通過開發新的作戰方式確保作戰優勢,增強軍事效果,保護人民免受傷害。
武裝部隊:減輕部隊負擔,并將人類決策集中在基于獨創性、背景思維和判斷力的高價值職能上。
五、戰略綜述總結****
**六、**結束語
人工智能必須成為未來必不可少的技術,其也促使著英國國防部改變對現代技術的看法,調整其技術方向和戰略需求,全面擁抱世界領先的人工智能解決方案和能力,推進其國防業務中觀念、文化、規劃和交付方面的持久變化,并將其作為國防戰略融入國防領域,以確保英國軍隊成為敏捷信息時代的綜合部隊。
編譯:船の心
END
世界軍事電子領域2021年度十大進展
毫無疑問,今天圍繞人工智能(AI)的最復雜的治理挑戰涉及國防和安全。CIGI正在促進戰略制定:人工智能對軍事防御和安全的影響項目將這一領域的主要專家與來自國防部的40多名公務員和加拿大武裝部隊的人員聚集在一起,討論人工智能對國家安全和軍事領域的力量倍增效應。
這一努力依賴于一系列的四次研討會,以產生關于數據驅動技術如何引發巨大的技術重組的前瞻性思考,這將對加拿大的國防規劃產生深遠影響。具體來說,這些研討會集中在數據治理和政策(道德、云計算、數據準備和互操作性);決策(可信賴性、人機一體化、生物技術和問責制);模擬工具(培訓、兵棋推演、人機合作、機器人、自主和可信的人工智能);以及信息時代的加拿大情報(將人工智能用于情報)。CIGI還主辦了一個研究生研討會,以激勵整個加拿大在全球公共政策、計算機科學和安全等領域學習的新興學者。
本文探討了在人工智能(AI)和機器學習背景下的軍事特定能力的發展。在加拿大國防政策的基礎上,本文概述了人工智能的軍事應用和管理下一代軍事行動所需的資源,包括多邊參與和技術治理。
維持先進軍事能力的前景現在與人工智能的武器化直接聯系在一起。作為一項通用技術,人工智能代表著一種力量的倍增器,有能力重塑戰爭規則。事實上,在核彈頭仍然是一種單一的技術應用的情況下,人工智能有能力支持許多不同類型的武器和系統。正如北大西洋公約組織(NATO)的指導意見所指出的,人工智能和其他 "智能 "技術現在對加拿大及其盟國的未來安全至關重要。
新技術在改變戰爭的性質方面有著悠久的歷史。從馬匹和盔甲的使用到航空母艦和戰斗機的引進,人工智能和機器人只是代表了軍事技術發展的最新階段。常規武器與人工智能和機器學習的融合,必將重塑決策的性質和軍事戰略轉型中的武力應用。
即使當代人工智能系統的能力被限制在機器學習算法的狹窄范圍內,這種限制可能不會持續太久。與神經科學、量子計算和生物技術相重疊的發現領域正在迅速發展,代表了 "智能機器 "進化的未知領域。在這些新的研究領域中的科學和技術發現給加拿大的國防帶來了巨大的風險,但同時也代表著巨大的機遇。
顯而易見的是,新興技術已經成為高度緊張的地緣政治競爭的基礎,它與一系列商業產業和技術平臺相重疊。中國、俄羅斯、美國和其他國家和非國家行為者正在積極追求人工智能和其他前沿技術的軍事應用。競爭的領域包括云技術、高超音速和新導彈技術、空間應用、量子和生物技術以及人類增強。
盡管技術創新一直塑造著國家間沖突的性質,但新興和顛覆性技術(EDT)的規模和速度是前所未有的。加拿大的國防政策反映了這種擔憂,它呼吁使加拿大武裝部隊(CAF)適應不斷變化的地緣政治環境。加拿大國防規劃已著手擴大和發展加拿大武裝部隊,在新的軍事平臺整合中納入下一代偵察機、遙控系統和天基設施。
基于對不斷變化的技術環境的廣泛評估,加拿大國防部(DND)認識到,這個新時代的特點是全球力量平衡的變化。這包括在快速發展的創新經濟中大國競爭性質的變化。就像石油和鋼鐵為工業時代設定條件一樣,人工智能和機器學習現在也可能為數字時代設定條件。
這種規模的破壞是由技術和制度變化的融合所驅動的,這些變化可以以新的和不可預測的方式觸發復雜的反饋回路。在這個新的環境中,人工智能技術將迫使世界各國軍隊投射力量的能力倍增。確定軍事人工智能發展中的護欄對于避免未來危機至關重要。應用減少風險的措施來識別和減輕軍事人工智能可能帶來的一系列風險將是關鍵。事實上,在這些能力完全嵌入世界上目前和未來的軍隊之前,治理人工智能可能會更容易。
從整體上看,這種轉變預示著從初級機器到數據驅動技術和精密電子的巨大轉變。這種物理、數字和生物技術的加速融合代表了一場巨大技術革命的早期階段。在全球范圍內管理這些新興和顛覆性的技術,對于減少未來沖突的風險至關重要。
從人工智能和機器人到電池存儲、分布式賬本技術(DLT)和物聯網(IoT),新興和顛覆性技術(EDT)現在正在激起一個商業創新的新時代。這一巨大的技術變革景觀正在醞釀一場社會和經濟變革,對中央銀行的發展具有巨大影響。正如北約最近的一份報告所指出的(北約新興和顛覆性技術咨詢小組2020),這些技術包括:
→ 人工智能和機器學習。人工智能/機器學習的發展及其對創新的潛在影響。這包括神經形態計算、生成式對抗網絡,以及人工智能從已經收集或尚未收集的數據中揭示出意想不到的見解的能力。
→ 量子技術。正在進行的從量子過程研究中獲得的知識轉化為量子技術的應用,包括量子計算、量子傳感、量子密碼系統,以及在量子尺度上對材料的操縱和開發。
→ 數據安全。用于保障和損害通信、數據交易和數據存儲安全的算法和系統的設計,包括量子證明加密方法、區塊鏈和分布式賬本架構,以及更廣泛的網絡安全領域。
→ 計算功能的硬件。微型化、電力采集和能源儲存方面的進展,包括在全球范圍內提供數字化關鍵基礎設施所需的物理系統(物聯網)和機器人的廣泛使用及其對全球系統和流程的持續影響。
→ 生物和合成材料。從原子/分子層面的材料設計、合成和操作到中觀和宏觀尺度的創新,支持生物工程、化學工程、基因層面的操作、增材制造和AI介導的生成設計。
正如蒸汽機和印刷術激發了工業革命一樣,人工智能和機器人技術現在也在軍事技術的性質和全球力量平衡方面引發了巨大變革。人工智能的興起并非沒有歷史先例,但伴隨著人工智能的變化表明,需要對國防規劃進行更精確的調整,以適應一個數據驅動的時代。
在大國競爭和多極體系的背景下,人工智能已經成為競爭的一個特別焦點。中國、俄羅斯、美國和其他許多國家都在積極追求人工智能能力,并把重點放在國防和安全方面。例如,中國希望到2030年在人工智能方面領先世界,并期望通過利用大量的豐富數據,擴大其在人工智能產業化方面的領先優勢(Lucas和Feng,2017年)。
事實上,數據和數據驅動的技術現在占據了全球經濟的制高點。整個全球數據經濟的競爭已經與大國競爭密不可分(Mearsheimer 2021)。盡管美國和中國的經濟深深地相互依存,但中國在整個歐亞大陸不斷擴大的投資將很快使其成為世界貿易的中心。
技術優勢仍然是北約國家的關鍵支柱,但中國正在迅速趕超。即使美國在人工智能發現方面建立了強大的領先優勢,中國也越來越有可能在人工智能驅動的應用產業化方面占據主導地位。中國不僅有先進的商業能力,而且還有一個連貫的國家戰略。中國的技術部門正在達到專業知識、人才和資本的臨界質量,正在重新調整全球經濟的指揮高度(Lucas and Waters 2018)(見圖1)。
中國產業部署的大部分技術創新都是 "漸進式 "的,而不是 "顛覆式 "的,但現在這種情況正在改變。將新興市場聚集在其軌道上,中國前所未有的經濟擴張現在對世界經濟產生了引力(The Economist 2018)。標志性項目,價值數萬億美元的 "一帶一路 "倡議(世界銀行2018年)為圍繞電動汽車、電信、機器人、半導體、鐵路基礎設施、海洋工程以及最終的人工智能的廣泛戰略轉變提供了一個全球平臺(McBride和Chatzky 2019年)。
毫不奇怪,中國已經是國際專利申請的世界領導者(世界知識產權組織2020)。隨著自主機器(Etzioni和Etzioni 2017)、可再生能源基礎設施、量子通信(?iljak 2020)、增強型腦機接口(Putze等人2020)和天基武器(Etherington 2020)的出現,重新思考加拿大國家安全,特別是加拿大國防的性質的壓力正在增加。鑒于技術創新的步伐不斷加快,以及亞洲作為世界貿易中心的崛起(Huiyao 2019),來自國外的技術的影響可能是巨大的。
圖1:按購買力平價計算的國內生產總值預測(以萬億美元計)
人工智能的概念已被廣泛討論,但該術語的精確定義仍然是一個移動的目標。與其說人工智能是一項具體的技術或特定的創新,不如說它是一個材料的集合。事實上,即使人工智能技術已經成為廣泛的主流商業應用的基礎,包括網絡搜索、醫療診斷、算法交易、工廠自動化、共享汽車和自動駕駛汽車,人工智能仍然是一個理想的目標。
盡管人工智能領域的研究始于20世紀40年代,但隨著機器學習和計算機處理能力的改進,過去十年對人工智能興趣的爆炸性增長已經加速。人工智能的持續進步被比喻為在人腦中發現的多尺度學習和推理能力。當與大數據和云計算相結合時,預計人工智能將通過將 "智能 "人工智能和機器學習系統與第五代(5G)電信網絡(即物聯網)上的大量聯網設備連接起來,使數字技術 "認知化"。
作為人工智能的一個子集,機器學習代表了人工智能的最突出的應用(見圖2)。機器學習使用統計技術,使機器能夠在沒有明確指令的情況下 "學習",推動許多應用和服務,改善一系列分析和物理任務的自動化。通過使用數據自動提高性能,這個過程被稱為 "訓練 "一個 "模型"。使用一種算法來提高特定任務的性能,機器學習系統分析大量的訓練數據集,以便做人類自然而然的事情:通過實例學習。
今天,機器學習的最常見應用是深度學習。作為更廣泛的機器學習家族的一部分,深度學習利用人工神經網絡層來復制人類智能。深度學習架構,如深度神經網絡、遞歸神經網絡和卷積神經網絡,支持一系列廣泛的研究領域,包括計算機視覺、語音識別、機器翻譯、自然語言處理和藥物設計。
圖2:人工智能的層級
安全人工智能位于新興和顛覆性技術(EDT)星座的中心,包括機器人學、基因組學、電池存儲、區塊鏈、3D打印、量子計算和5G電信。在研究層面,美國仍然是人工智能的全球領導者。目前,國家科學基金會每年在人工智能研究方面的投資超過1億美元(國家科學基金會2018年)。國防高級研究計劃局(DARPA)最近宣布投資20億美元用于一項名為AI Next的計劃,其目標是推進上下文和適應性推理(DARPA 2018)。
與過去的原子武器或隱形飛機的技術發展不同,沒有國家會壟斷軍事人工智能。研究人員和領先的商業企業之間廣泛的全球合作意味著人工智能和機器學習的進步可能會在全球范圍內擴散。事實上,人工智能發展的大多數技術進步是由工業界而不是政府推動的。除了市場主導的技術公司,世界各地廣泛的網絡集群正在孵化新一代的商業創新(Li and Pauwels 2018)。因此,許多未來的軍事應用將可能是為商業產業開發的技術的改編。
幸運的是,加拿大一直是人工智能研究前沿的領導者,并繼續通過2017年推出的泛加拿大人工智能戰略下的幾個項目培育一個強大的人工智能生態系統。加拿大政府積極參與人工智能咨詢委員會和各種國際伙伴關系,包括2020年啟動的全球人工智能伙伴關系;人工智能國防伙伴關系,其第二次對話在2021年舉行;以及重疊人工智能驅動的安全和規劃的多邊協議(五眼,北約)。事實上,加拿大的國防政策,"強大、安全、參與"(SSE),反映了加拿大政府對增加年度國防開支的承諾,重點是技術。
目前的聯邦預算包括對人工智能發展的實質性承諾,承諾在10年內投入4.438億美元(Silcoff 2021)。在政府2021年的預算中,1.85億美元將支持人工智能研究的商業化;1.622億美元將用于在全國范圍內招聘頂尖的學術人才;4800萬美元將用于加拿大高級研究所;五年內4000萬美元將旨在加強埃德蒙頓、多倫多和蒙特利爾的國家人工智能研究所的研究人員的計算能力;五年內860萬美元將幫助推進人工智能相關標準的發展和采用(加拿大政府2021年,148)。
人工智能是一個影響廣泛的商業和軍事技術的模糊領域。像電力或化石燃料一樣,人工智能的廣泛應用意味著人工智能和其他通用技術有能力重新配置現代軍隊的步伐和組織(Bresnahan和Trajtenberg 1995)。從整體上看,人工智能代表了國家安全性質的結構性轉變。出于這個原因,SSE設想了一個未來的軍事態勢,更加注重開發、獲取和整合先進的變革性技術,包括網絡和自主系統。
即使加拿大在傳統聯盟(北美防空司令部、北約和五眼聯盟)中的持續作用仍然是國家安全的基礎,EDT正在從根本上改變沖突的性質。正如格雷格-菲夫(2021年)所觀察到的,人工智能作為戰爭工具的崛起與升級加拿大國家安全架構,特別是加拿大情報部門的日益增長的需求相重疊。技術變革和信息爆炸的復合周期,新的技能組合和新的數據分析戰略對國防規劃的演變變得至關重要。
在數字時代,戰爭正日益成為基于知識的戰爭。隨著沖突進入信息領域,軍事規劃開始重新聚焦于信息/虛假信息行動、網絡行動、情報行動和政治或經濟影響行動。事實上,這種混合戰爭作為一種戰爭工具由來已久,其目的是利用宣傳、破壞、欺騙和其他非動能軍事行動,從內部破壞對手(Bilal 2021)。
網絡仍然是潛在對手、國家代理人、犯罪組織和非國家行為者的一個關鍵目標。這包括對通信、情報和敏感信息的嵌入式監視和偵察。正如Amy Zegart(2021年)所解釋的那樣,技術正在通過極大地擴展數據和信息的獲取,使情報的性質民主化。事實上,今天驅動戰略情報的大部分信息實際上是開放源碼情報(OSINT)或在公共領域。
現代軍隊正變得嚴重依賴安全、及時和準確的數據。隨著數據的急劇膨脹,消化它變得不可能。這種數據爆炸正在推動對新的分析模式和新型網絡工具的需求。在數字時代,安全和情報人員需要新的平臺、新的工具和跨領域工作的新OSINT機構。在這方面,人工智能可能特別有幫助。
隨著數據的重要性增加,在廣闊的數字領域的對抗性競爭也在增加。人工智能和機器學習可以通過篩選巨大的數據庫來極大地提高加拿大的國家情報能力。人工智能不是銀彈。人工智能系統不能產生意義或提供因果分析。然而,人工智能和機器學習可以極大地增強人類在管理數據和數據驅動的分析方面的情報能力。
隨著決策者為數據驅動的世界調整其安全態勢,人工智能有望改變軍事沖突的既定模式。DND/CAF面臨的關鍵挑戰之一是數據驅動的網絡重塑指揮和控制系統的速度(Thatcher 2020)。集中式系統的優勢在于其協調人類活動的效率。在指揮系統中,人員和傳感器推動威脅檢測,將信息向決策堆棧上移,以便決策者可以做出適當的反應。數字技術深刻地加速了這個過程。
人工智能在軍事領域的應用可能被證明對傳統的指揮和控制系統具有挑戰性。例如,在美國,五角大樓的第一位首席軟件官最近辭職,以抗議技術轉型的緩慢步伐。在離開國防部職位后的一次采訪中,尼古拉-沙伊蘭告訴《金融時報》,美國未能對技術變革和其他威脅作出反應,使國家的未來面臨風險(Manson 2021)。
除了變化的速度緩慢,軍事指揮和控制系統的集中性意味著單點故障提供了脆弱的攻擊點。指揮機關和自動或人類控制者往往容易受到利用不良或欺騙性信息的對抗性技術的影響,甚至自上而下的決策在適應復雜的突發挑戰方面也會很緩慢。
神經形態計算、生成式對抗網絡(GANs)、人工智能決策支持、數據分析和情報分析方面的新創新在增強軍事行動的結構和進程方面可能會產生巨大影響。機器學習算法的快速發展已經在商業和軍事領域引發了一波投資熱潮。
超越對損耗和動能攻擊的傳統關注,轉向基于加速和適應的新方法,數據驅動的技術可能是促成國家安全性質徹底轉變的關鍵。人工智能不是一種單一的技術。相反,它是一類可以在一系列軍事和商業應用中整合的技術。這些技術不斷演變的基礎是數據。
數字技術現在由數據推動,并將繼續推動創造越來越多的數據驅動的技術--特別是人工智能。數據是訓練人工智能和先進機器學習算法的基礎。數據既是大規模運行的數字系統產生的 "操作廢氣",也是機器對數據輸入作出反應的過程,它現在推動了機器的 "自主性"。
數據驅動的技術支撐著現代社會的核心社會和經濟功能,涵蓋了基礎設施、能源、醫療保健、金融、貿易、運輸和國防。隨著5G網絡的全球推廣,預計在高度健全的全球信息網絡中創建、收集、處理和存儲的數據將出現爆炸性增長。根據市場研究公司IDC的數據,目前全球數據正以每年61%的速度增長(Patrizio 2018)。預計到2025年,數據將達到175 zettabytes(一萬億吉字節),改變數字經濟的性質和規模(同上)。
出于這個原因,DND/CAF將數據提升到國家資產的水平是明智的。這對經濟增長和加拿大國防都至關重要。將數據作為國家資產加以保護和利用,將意味著重新思考目前構成當代數據架構的大型集中式數字基礎設施。可以肯定的是,網絡時代的數據安全應該是分散的和聯合的,以避免集中式系統的脆弱性。
關于技術破壞的傳統預測往往會犯一個錯誤,即假設這種規模的系統變化只是以一對一的方式取代舊技術。在現實中,這種規模的顛覆往往會不成比例地取代舊的系統,使其具有巨大的新的架構、界限和能力(Arbib和Seba 2020)。
正在進行的人工智能武器化正在助長一場全球軍備競賽,有望重塑加拿大國防戰略的輪廓。事實上,世界上許多國家在人員系統自動化、設備維護、監視系統以及無人機和機器人的部署方面已經遠遠領先(斯坦利和平與安全中心、聯合國裁軍事務廳和史汀生中心2019)。從美國到俄羅斯到以色列再到中國,軍事研究人員正在將人工智能嵌入網絡安全舉措和支持遠程手術、戰斗模擬和數據處理的機器人系統。
以先進的物流、半自動車隊、智能供應鏈管理和預測性維護系統的形式將人工智能應用于軍事行動代表了人工智能的近期應用(Perry 2021)。然而,能夠在陸地、海洋、空中、太空和網絡領域針對個人(無論是否需要人類干預)的自主武器的演變代表了軍事沖突的可能未來(見圖3)。事實上,近100個國家的軍隊目前擁有某種程度的武裝或非武裝無人機能力(Gettinger 2019)。
圖3:全球無人機激增
商業無人機技術在采礦、農業和能源領域的縱橫捭闔,正在助長無人機技術的廣泛擴散。正如最近亞美尼亞和阿塞拜疆之間的沖突所表明的那樣,一群相對便宜的自主和半自主無人機可以被利用來壓倒傳統的軍事系統,使一系列當代平臺變得過時(Shaikh和Rumbaugh 2020)。輕型、可重復使用的武裝無人機,如土耳其的Songar(Uyan?k 2021)可以配備一系列有效載荷,包括迫擊炮、手榴彈和輕機槍。最近對沙特阿拉伯的Abqaiq石油加工設施(Rapier 2019)和俄羅斯的Khmeimim空軍基地(Hambling 2018)的攻擊反映了軍事無人機在不同戰場環境中的應用越來越多。
致命自主武器系統(LAWS)被定義為可以在沒有人類授權的情況下選擇和攻擊目標的武器,它被設計為在獨立識別目標之前在指定的行動區域內長期徘徊。多個無人機或機器人可以并行運作,以克服對手的防御或摧毀一個特定目標。開發人員傾向于將致命性武器系統分為三大類,即觀察、定位、決定和行動(OODA)循環(見圖4)。這些類別包括。"循環中的人"、"循環中的人 "和 "循環外的人"。這種區分也被框定為 "半自主"、"受監督的自主 "和 "完全自主 "的技術系統。不幸的是,受監督的致命性自主武器系統和完全自主的致命性自主武器系統之間的區別,可能只是一個軟件補丁或一個監管程序。
圖4:OODA環
隨著致命性自主武器系統和其他數據驅動的技術變得更便宜和更廣泛,它們可能會給廣泛的國家和非國家行為者提供平臺和工具,以新的和破壞性的方式利用人工智能和機器學習。除了收緊OODA循環外,軍事人員將需要了解人工智能在加速OODA循環方面的影響,以確定在特定情況下哪種模式最合適。
鑒于EDT的范圍和規模,認為我們可以簡單地保持從上個世紀繼承的系統和做法是錯誤的。正如英國查塔姆研究所2018年的一份報告所警告的那樣,美國、英國和其他核武器系統正變得越來越容易受到網絡攻擊(Unal and Lewis 2018)。這些擔憂是有根據的。人工智能和EDT的擴散一起,幾乎肯定會通過利用人工智能和自主系統的規模效應,為小國和非國家行為者帶來好處。
對于許多北約國家來說,網絡平臺已經成為多領域行動的關鍵--海、空、陸、網絡和空間。大規模的網絡使得在復雜環境中可視化和協調大量資源成為可能。在5G電信和云計算的基礎上,信息系統現在可以有效地收集、傳輸和處理大量的戰場數據,提供實時數據分析。
連接設備正在成為協調空襲、駕駛無人機、消化戰斗空間的實時視頻和管理高度復雜的供應鏈的關鍵。在英國,國防數據框架提供了一個結構,以解決軍事組織與數據驅動的企業需求相一致的挑戰(Ministry of Defence 2021)。從戰略到通信到后勤到情報,數字平臺現在是協調復雜軍事行動的基礎。數據現在是所有作戰領域的命脈。
在一個數字化的戰斗空間中,每個士兵、平臺和資源現在都是一個復雜軍事網絡中的節點。從20世紀90年代以網絡為中心的美國軍事行動開始,數字技術已經成為先進武器、戰術和戰略的基礎。從戰場態勢感知和自主無人機到精確制導彈藥和機器驅動的心理行動,網絡正在使戰爭進入網絡時代。
在集中式機構對工業時代至關重要的地方,平臺和網絡正在成為數字時代的關鍵。人工智能本質上是一種 "自下而上 "的技術,依靠不斷 "喂養 "大量的數據來支持機器學習作為 "學習引擎"。隨著數字生態系統的激增,網絡平臺和它們所依賴的數據管理系統成為管理不斷擴大的資源和人員的關鍵。
與金融部門一樣,DND應該尋求區塊鏈等DLT,以加速加拿大軍隊的數字化轉型。通過在分散的網絡中橫向分配數據,CAF區塊鏈可以幫助減少官僚化系統固有的限制和脆弱性。DLT提供了一個高度分散的驗證系統,可以確保所有的通信和數據傳輸免受對手的攻擊,同時消除集中式節點的潛在故障。
人工智能在軍事規劃中的應用正在迅速推進,許多國家在部署無人機和機器人方面已經取得了很大進展。事實上,無人機技術的全球擴散正在順利進行中。
世界各地的軍隊正在加速開發或采購攻擊型無人機(見圖5)。俄羅斯的 "閃電"(BulgarianMilitary.com 2021)、西班牙的Rapaz8以及英國、9美國10和以色列11的各種無人機項目共同代表了軍事技術新時代的早期階段。與工業時代的軍事技術不同,無人機可以以低成本獲得,并需要相對較少的技術技能。
無人機群技術涉及微型/迷你無人機/無人駕駛飛行器或無人機群,利用基于共享信息的自主決策。事實上,當代軍用無人機已經可以被設計成在沒有人參與的情況下定位、識別和攻擊目標。利用蜂群技術,數以百計的非武裝無人機可以從現場收集信息,同時用各種武器(即火器、火炮和/或彈藥)引導數以千計的無人機。
正如簡短的視頻 "Slaugherbots "所展示的那樣,完全自主的武器將使瞄準和殺死獨特的個人變得非常容易和便宜。在面部識別和決策算法的基礎上,國家和非國家行為者都可以廣泛使用致命性武器。數以千計的相對便宜的無人機配備了爆炸性的彈頭,有可能壓倒防空系統,攻擊基礎設施、城市、軍事基地等等。
圖5:無人機對比
無人機群壓倒加拿大軍事設施的威脅,以及對關鍵基礎設施的網絡攻擊或在衛星傳感器檢測到威脅時自動發射的高超音速導彈,代表了一個令人不安但越來越可能的未來。從復雜性科學和對昆蟲的研究中產生的,使用無人機來支持 "集群情報 "代表了一個加速戰爭節奏的新工具集。
為了應對這種不斷變化的環境,DARPA提出了 "馬賽克戰爭"的概念。馬賽克戰爭的中心思想是,模塊化系統可以成為應對高度網絡化環境的廉價、靈活和高度可擴展的工具。就像馬賽克中的瓷片一樣,單個作戰平臺可以被設計成高度可配置的。編隊利用分散的代理在 "殺戮網 "上進行重新配置。殺戮網的目標是避免 "單體系統 "的結構僵化。
與傳統戰爭中需要的復雜棋局不同,馬賽克戰爭利用數字網絡,利用模塊的靈活性和增強的決策(時間壓縮)加快動態響應時間。像自然界中的復雜系統一樣,殺傷性網絡使用算法來消除單點故障,通過模塊化設計加速反應時間。
從主導地位(預測)轉向加速反應(適應),"馬賽克戰爭 "旨在支持混合軍事單位,利用 "決策棧 "上下的橫向網絡。人工智能、無人機、傳感器、數據和人員結合在一起,為地面上的作戰指揮官提供支持,使小型編隊能以更快的速度獲得情報、資源和后勤資產。
像 "馬賽克戰爭 "這樣的模塊化系統表明,未來的戰爭將越來越多地利用現在驅動戰爭游戲和模擬的計算、數據分析和算法。推動高度流動、游戲化和不可預測的環境,未來的人工智能系統可以將戰爭加速到一個隨著結果范圍的擴大而變得極其密集的計算速度和節奏。
DARPA最近的AlphaDogfight(2019-2020年)為這一新現實提供了一個窗口。使用復雜的F-16飛行模擬器讓計算機與有經驗的人類飛行員對決,試驗的目的是為DARPA的空戰進化計劃推進人工智能開發者。毫不奇怪,F-16人工智能代理通過積極和精確的機動性擊敗了人類飛行員,而人類飛行員根本無法與之相提并論,五局為零。
人工智能的武器化也在激起對抗人工智能系統的新戰略和方法。正如網絡行動(無論是間諜活動還是攻擊)可以指示計算機網絡或機器以它們不打算的方式運行,對手也可以對人工智能系統使用同樣的策略。這個過程被稱為對抗性機器學習,旨在找出機器學習模型的弱點并加以利用。攻擊可能發生在開發或部署階段,包括通過提供欺騙性輸入(例如,"毒化"數據)或針對模型本身來誤導模型。
這些方法在國家安全環境中特別危險,因為在許多情況下,它們是微妙的,人類無法察覺。此外,具有挑戰性的是,對手不一定需要對目標模型的具體知識或直接訪問其訓練數據來影響它。隨著人工智能系統變得更加普遍,更多的人可以接觸到,對手的吸引力和攻擊機會將增加。
攻擊者可能試圖修改訓練數據或測試數據。這是通過創造對抗性樣本來實現的,這些樣本被故意 "擾亂 "或改變并提供給模型,從而導致錯誤。例如,通過改變洗衣機圖像的分辨率,研究人員能夠欺騙一個模型,將機器分類為 "安全 "或 "擴音器"(Kurakin, Goodfellow and Bengio 2017)。對人的眼睛來說,對抗性圖像看起來幾乎是一樣的。
在國家安全方面,對手可能會試圖使用同樣的技術來暗示武器系統實際上是一個社區中心。如果這是在孤立的情況下發生的,那么這個問題很可能被識別和解決。如果對手的樣本被長期大規模使用,這可能成為一個重大的挑戰,并影響對情報收集系統的信任。
此外,一些對手可能并不精確--或有技能--并可能試圖迫使一個模型對整個類別而不是特定類別進行錯誤分類。由于我們在國家安全環境中越來越依賴計算機圖像,并不總是能夠實時或在有爭議的空間進行驗證,因此在這種攻擊中出現誤判的風險是很大的。
高后果的人工智能系統并不是對抗性攻擊的唯一目標。受對抗性樣本影響的人工智能系統可以包括生物識別,其中假的生物特征可以被利用來冒充合法用戶,語音識別中攻擊者添加低量級的噪音來混淆系統(Zelasko等人,2021)和計算機安全(包括在網絡數據包中混淆惡意軟件代碼)。
由于DND/CAF尋求通過部署人工智能系統來提高效率--如軍艦上的語音助手(McLeod 2019)--必須在部署前評估對抗性使用的風險并制定對策。
除了改變輸入,另一種攻擊方法可用于逆向工程模型以獲取訓練數據(Heaven 2021)。由于機器學習模型對訓練數據的表現比新的輸入更好,對手可以識別目標模型預測的差異,并與包括個人身份信息在內的已知數據相匹配(Shokri等人,2017)。隨著機器學習即服務變得越來越多--而且在許多情況下,被用作開發更復雜的能力的基礎--DND將需要仔細審查國家安全系統的數據泄漏風險。這甚至適用于看似無害的系統,如語音助手。
人工智能系統的弱點的例子很多(Hadfield-Menell等人,2017)。這些例子包括吸塵器將收集到的灰塵彈回它剛打掃過的地方,以便它能收集更多的灰塵,或者數字游戲中的賽艇在原地循環以收集分數,而不是追求贏得比賽的主要目的。雖然這些例子沒有生命危險,但同樣的技術--被稱為獎勵黑客(當一個模型被指示使其目標函數最大化,但卻以非故意的方式進行)--可以被用于更嚴重的效果。
從旨在用固定的訓練數據解決 "單步決策問題 "的機器學習過渡到解決 "順序決策問題 "和更廣泛的數據集的深度機器學習,將使對抗性攻擊更難發現。這種威脅是如此之大,以至于美國情報高級研究項目活動正在資助一個項目,以檢測木馬人工智能對已完成系統的攻擊。令人擔憂的是,政府可能會在不知情的情況下操作一個產生 "正確 "行為的人工智能系統,直到出現 "觸發 "的情況。例如,在部署過程中,對手可能會攻擊一個系統,并在更晚的時候才導致災難性的故障發生。這些類型的攻擊可能會影響到圖像、文本、音頻和游戲的人工智能系統。
正如對抗性樣本可以用來愚弄人工智能系統一樣,它們可以被納入訓練過程中,以使它們對攻擊更加強大。通過對最重要的國家安全人工智能系統進行清潔和對抗性數據的訓練--要么給它們貼上這樣的標簽,要么指示一個模型將它們分離出來--更大的防御是可能的。但是,復雜的對手很可能會自行躲避這種防御方法,而使用額外的戰術進行深度防御將是必要的。
GANs有各種各樣的用例,從創建深度假說到癌癥預后(Kim, Oh and Ahn 2018)。它們也可用于防御對抗性攻擊(Short, Le Pay and Ghandi 2019),使用一個生成器來創建對抗性樣本,并使用一個判別器來確定它是真的還是假的。一個額外的好處是,使用GANs作為防御,實際上也可能通過規范數據和防止 "過度擬合 "來提高原始模型的性能(IBM云教育2021)。
對抗性攻擊和防御模型進行基準測試--如使用GANs--是一種全面的對策,可以對AI系統進行比較。這種方法為制定和滿足安全標準提供了一個量化的衡量標準,并允許評估人工智能系統的能力和限制。
作為這個測試和評估過程的一部分,博弈論可能有助于建立對手的行為模型,以確定可能的防御策略。由于人工智能系統無法在傳統的信息安全意義上進行 "修補",因此在部署前應仔細分析針對國家安全人工智能系統的對抗性攻擊的風險,并定期進行審查。此外,訓練有素的模型--特別是那些關于機密數據和最敏感應用的模型--應該得到仔細保護。
數據驅動的戰爭的速度和范圍表明,我們正在進入一個新的時代,其中致命性武器系統的潛力--無論是否有人類參與--都可能極大地改變全球力量平衡。從殺手級無人機和人機合作到增強的軍事決策(殺手2020),人工智能技術將使世界各國軍隊投射力量的能力大大增加。正在進行的人工智能武器化也與空間武器化相重疊(《經濟學人》2019年),因為低地球軌道(LEO)日益成為軍事監視、遙感、通信、數據處理(Turner 2021)和彈道武器(Sevastopulo和Hille 2021)的操作環境。
人工智能與低地軌道和致命性自主武器系統的興起,代表了全球安全性質的一個關鍵轉折點。為此,世界各地的學術研究人員、技術企業家和公民都對人工智能的軍事化所帶來的危險表示擔憂。正如他們正確地指出的那樣,在規范負責任地開發和使用人工智能的規范和法律方面缺乏國際共識,有可能造成未來的危機。
除了我們在科幻小說中經常看到的對人工智能的夸張描述,重要的是建立適當的制衡機制,以限制人工智能技術可能提供的權力集中。關于管理人工智能和其他數字技術的共同國際規則和條例將塑造未來幾十年的戰爭和沖突的輪廓。在軍事人工智能的發展中制定護欄,對于減少未來沖突的可能性至關重要。
加拿大和其他北約國家積極參與這一討論可能是未來全球和平與安全的關鍵。在發動戰爭的條件(jus ad bellum)和戰爭中的人工智能行為(jus in bello)方面,規范人工智能使用的戰爭法仍有待確定。鑒于美國和中國之間不斷擴大的競爭,需要制定關于致命性自主武器系統的使用及其擴散的條約是再及時不過了。
正如北約所觀察到的,加拿大及其盟國應尋求促進、參與和建立合作機會,以支持開發和應用人工智能和其他EDT的廣泛、全面的架構(北約新興和顛覆性技術咨詢小組2020)。盡管面臨著艱巨的挑戰,全球治理在規范軍事人工智能方面可以發揮重要作用。盡管對人工智能及其武器化有不同的看法,但過去的談判可以作為未來條約的基礎,特別是在定義戰爭規則方面。這包括關于常規武器、核軍備控制、生物和化學武器、地雷、外層空間和平民保護的條約(見圖6)。
到目前為止,《聯合國特定常規武器公約》(CCW)已經監督了一個討論應對自主武器帶來的人道主義和國際安全挑戰的進程。已經提出了一系列監管致命性自主武器系統的潛在方案,包括《特定常規武器公約》下的一項國際條約,一個不具約束力的行為準則,宣布各國承諾負責任地開發和使用致命性自主武器系統。在聯合國之外,2013年發起了 "停止殺手機器人 "運動,目標是完全禁止致命性自主武器系統。
聯合國秘書長安東尼奧-古特雷斯強調了人工智能和其他數字技術的風險和機遇(聯合國2020),并呼吁禁止致命性自主武器系統(古特雷斯2021)。不幸的是,聯合國成員國,特別是聯合國安理會的觀點存在分歧,一些國家認為監管是民族國家的專屬權限,而另一些國家則側重于更多部門的做法。除了人工智能的武器化,在圍繞人權、算法偏見、監控(公共和私人)以及國家支持的或國家支持的網絡攻擊等問題上也存在廣泛的分歧。
對于世界上的主要軍事大國來說,缺乏互信仍然是追求人工智能集體軍備控制協議的一個重大障礙。即使相當多的國家支持提供新的具有法律約束力的條約,禁止開發和使用致命性自主武器,但世界上大多數主要軍事大國都認為人工智能的武器化具有重大價值。鑒于這些分歧,致命性自主武器系統的多邊管理將需要建立信任措施,作為打開政治僵局的軍控進程的手段。
走向平凡的監管 也許制定管理人工智能的政策和監管制度的最具挑戰性的方面是難以準確地確定這些制度應該監管什么。與生物和化學武器不同,人工智能大多是軟件。事實上,人工智能是一個移動的目標:40年前被定義為人工智能的東西,今天只是傳統的軟件。
人工智能是一個模糊的技術領域,影響著廣泛的商業和軍事應用。例如,機器學習算法是搜索引擎(算法排名)、軍用無人機(機器人技術和決策)和網絡安全軟件(算法優化)的成分。但它們也支撐著平凡的行業,甚至兒童玩具(語義分析、視覺分析和機器人技術)、金融軟件和社交媒體網絡(趨勢分析和預測分析)。
與屬于這些平凡的監管領域的產品和流程一樣,人工智能技術不是被設計成最終實體,而是被設計成在廣泛的產品、服務和系統中使用的成分或組件。例如,一個 "殺手機器人 "不是一種特定技術的結果。相反,它是人工智能 "成分 "重新組合的結果,其中許多成分也被用來檢測癌癥或增加駕駛者的安全。
雖然人們傾向于使用一個專門的不擴散鏡頭來監管人工智能,但雙重用途的挑戰仍然存在。與核擴散或轉基因病原體不同,人工智能不是一種特定的技術。相反,它更類似于一個材料或軟件成分的集合。與大多數二元的核不擴散鏡頭相比,可以在食品監管中找到更相關(盡管不那么令人興奮)的監管模式的靈感,特別是食品安全和材料標準(Araya和Nieto-Gómez 2020)。
鑒于對人工智能進行全面監管存在重大的概念和政治障礙,治理仍然是一項艱巨的挑戰。一方面,如果我們把人工智能理解為一系列復制人類活動的技術實踐,那么就根本沒有一個單一的領域可以監管。相反,人工智能的治理幾乎重疊了每一種使用計算來執行任務的產品或服務。另一方面,如果我們將人工智能理解為大幅改變人民和國家之間權力平衡的基礎,那么我們就會面臨重大挑戰。
幸運的是,這并不是民族國家第一次面臨影響全球安全的新技術。在第二次世界大戰之后,世界上最強大的國家--美國、英國、蘇聯、中國、法國、德國和日本--對核武器、化學制劑和生物戰的全球治理進行監督。當時和現在一樣,世界必須采取集體行動來治理人工智能。
與冷戰時期一樣,包括定期對話、科學合作和分享學術成果在內的建立信任措施可以幫助減少地緣政治的緊張。為管理軍事人工智能帶來的風險制定一個共同的詞匯,可以為隨著時間的推移制定更有力的人工智能多邊條約提供基礎。
在這方面,經濟合作與發展組織(OECD)已經公布了其關于人工智能的建議,作為一套政府間標準,于2020年2月啟動了人工智能政策觀察站。加拿大和法國政府還與經合組織一起領導了一個全球人工智能伙伴關系(GPAI),旨在成為一個人工智能政策的國際論壇。GPAI的成員專注于以 "人權、包容、多樣性、創新和經濟增長原則 "為基礎的負責任的人工智能發展。
除了GPAI,一些歐洲國家已經呼吁歐盟成員開始一個關于負責任地使用新技術的戰略進程--特別是人工智能。美國已經邀請盟國討論人工智能的道德使用問題(JAIC公共事務2020)。北約已經啟動了一個進程,鼓勵成員國就一系列道德原則和具有軍事用途的電子技術關鍵領域的國際軍備控制議程達成一致(Christie 2020;NATO 2020)。認識到EDT對全球安全的深遠影響,北約于2019年12月推出了EDT路線圖(北約科技組織2020)。
從整體上看,二十一世紀需要進行正式監管。從長遠來看,這很可能包括尋求與禁止生物武器、化學武器和殺傷人員地雷一樣的人工智能條約。然而,鑒于人工智能的創新速度和世界超級大國之間日益擴大的分歧,就人工智能的全球治理進行談判的機會之窗可能正在關閉。
圖6:人工智能的全球治理
即使在工業時代即將結束的時候,技術創新也在加速進行(Araya 2020)。自從大約80年前誕生以來,人工智能已經從一個神秘的學術領域發展成為社會和經濟轉型的強大驅動力。人工智能在戰爭中的整合被一些軍事分析家描述為一個不斷發展的 "戰場奇點"(Kania 2017)。在 "技術奇點"(Schulze-Makuch 2020)的概念基礎上,人們越來越多地猜測,人工智能和機器人將超越人類的能力,有效地應對算法驅動的戰爭。
人工智能和其他EDT的演變正在將先進的數據、算法和計算能力匯集起來,以 "認知 "軍事技術。在這種新環境下,現代軍隊正變得嚴重依賴提供安全、及時和準確數據的網絡。數據已經成為數字系統的 "作戰用氣 "和驅動 "智能機器 "的原料。隨著數據重要性的增加,在廣闊的數字領域的對抗性競爭也在增加。事實上,數據的真正價值在于其推動創新的數量和質量。
正如北約關于EDT的年度報告(北約新興和顛覆性技術咨詢小組2020)明確指出,要想跟上技術變革的步伐,就必須在技術的開發、實驗和應用方面保持靈活性和快速迭代。整個CAF的創新能力必須是一個更廣泛的創新生態系統的一部分,該系統有效地整合了公共和私人生態系統的研究和實施。這包括與加拿大工業界合作利用雙重用途的GPT的明確目標,以便利用已經存在的技術。
這種多領域的合作在歷史上被定義為國家創新體系(NSI)(OECD 1997)。事實上,NSI政策和規劃可以采取多種形式,從松散的協調到高度整合的伙伴關系。在美國(Atkinson 2020)、中國(Song 2013)和歐洲(Wirkierman, Ciarli and Savona 2018)應用的各種NSI規劃模式表明,在最大化政府-產業-研究伙伴關系方面可以找到大量的經濟和社會回報。政府應通過稅收優惠、采購和研究資金以及戰略規劃,努力建設加拿大的技術能力。但它不能單獨行動。
國家創新必然取決于機構參與者在一個共享的生態系統中進行合作。出于這個原因,一個協調的加拿大國家統計局將需要在推動長期創新的過程中,人們和機構之間的技術和信息的相互流動。鑒于EDT的許多創新是由工業界主導的,推進公私伙伴關系對加拿大軍隊的發展至關重要。對于國防部/加拿大空軍來說,要推進適合數字時代的軍隊,政府、工業界和學術界將需要以更綜合的方式進行合作。
建立一個強大的加拿大創新生態系統將意味著更廣泛的公私合作和持續的知識和資源的再培訓、培訓和孵化。盡管開發尖端人工智能需要人力資本投資,但大多數人工智能應用現在可以通過開源許可獲得,即使核心學習算法可以在公共平臺和整個學術生態系統中獲得。這種 "開放一切 "環境的影響是對封閉的等級制度和深思熟慮的官方機構的實質性挑戰。
政府程序和規劃將需要適應加速的創新生命周期,以配合EDT積極的淘汰周期。除了與網絡技術相關的巨大的不對稱安全風險外,向數據驅動型軍隊的轉變將需要大量關注數據安全和數據治理。與進行傳統的國家間沖突所需的大量成本和規劃不同,網絡攻擊的破壞性影響可以由僅有一臺個人電腦的小團體對關鍵基礎設施發動。鑒于未來不斷增加的挑戰,大型官僚機構(公司、政府、學術和軍事)的設計變化是不可避免的。
除了對新的和不同的知識、資源和專長的需求,加拿大政府和加拿大軍方將需要平衡硬實力和不斷變化的地緣政治格局的需求。在美國占主導地位的時代之外,二十一世紀正被一個以技術民族主義和后布雷頓森林體系為特征的多極體系所塑造。面對一個快速發展的數字時代,國際合作將是確保和平與安全的關鍵。信息共享、專家會議和多邊對話可以幫助世界各民族國家及其軍隊更好地了解彼此的能力和意圖。作為一個全球中等國家,加拿大可以成為推動這一努力的主要伙伴。
國際治理創新中心(CIGI)是一個獨立的、無黨派的智囊團,其經同行評議的研究和可信的分析影響著政策制定者的創新。其全球多學科研究人員網絡和戰略伙伴關系為數字時代提供政策解決方案,目標只有一個:改善各地人民的生活。CIGI總部設在加拿大滑鐵盧,得到了加拿大政府、安大略省政府和創始人吉姆-巴爾西利的支持。
美國陸軍現代化戰略將人工智能(AI)確定為陸軍優先研究領域(PRA)之一[1]。作為美國陸軍作戰能力發展司令部(DEVCOM)科技事業的一部分,DEVCOM-大西洋前沿部隊今年發起了兩項新的人工智能倡議,以促進與外國學術界和工業界在該優先研究領域的合作機會。第一個倡議,即人工智能重點國際虛擬交流系列(AI FIVES)[2],是一個虛擬研討會,為國際組織提供一個平臺,向美國國防部主題專家和利益相關者介紹他們的人工智能研發活動和能力,促進討論和合作。在AI FIVES下促成的演講涉及的主題包括對抗性機器學習;強大和有彈性的人工智能;來自小數據的預測分析;可解釋和可信賴的人工智能;網絡和安全;用于改善態勢感知和決策的人工智能;以及有人和無人的互動和團隊合作。第二項倡議,xTechGlobal - AI挑戰賽[3],是陸軍助理部長(采購、后勤和技術)遠征技術(xTech)獎競賽項目[4]向國際參與者的首次擴展。xTechGlobal-人工智能挑戰賽從歐洲、非洲和中東的非傳統/小型企業技術開發商那里尋求創新的相關技術,以解決強大的人工智能能力問題,從而在嚴重的資源限制下,如計算能力和需求點的帶寬,管理、整合、處理并從不同的數據源中獲取信息,以便快速決策。在一次成功的競賽之后,有機會繼續并擴大xTechGlobal競賽,使之成為由大西洋、美洲和印度洋-太平洋地區不同地域的DEVCOM前沿要素贊助的其他優先挑戰主題。本文將討論這些舉措的起因、結果以及對陸軍更廣泛的人工智能研究活動的貢獻。
美國陸軍作戰能力發展司令部(DEVCOM)是美國陸軍未來司令部的一個主要下屬司令部,是陸軍的科學和技術領導者[5]。DEVCOM由八個主要的下屬單位組成,包括 軍備中心;陸軍研究實驗室;航空和導彈中心;化學生物中心;指揮、控制、計算機、通信、網絡、情報、監視和偵察中心;數據和分析中心;地面車輛系統中心;和士兵中心。除了實驗室和七個中心外,DEVCOM還有三個國際前沿單位。DEVCOM-美洲、DEVCOM-大西洋和DEVCOM-印度太平洋。指揮部為陸軍的六個現代化優先項目提供基礎科學研究、技術開發、工程和分析支持,重點是提供支持多領域行動的能力。
大西洋發展司令部在英國、法國、德國和以色列的國際技術中心(ITCs)安排了科學家、工程師和軍官。國際技術中心的作用是發展與盟友和親密伙伴的關系;與外國政府、工業界和學術界進行技術搜索;通過學術界、工業界和政府的伙伴關系,與外國伙伴確定基礎和應用研究的機會,提供強有力的科學和技術支持[6]。DEVCOM-Atlantic還包括科學和技術的實地援助(FAST)顧問,他們作為作戰司令部的陸軍單位和研究實驗室之間的聯絡人,確定關鍵需求和實驗機會,以支持陸軍的任務。
從2020年開始,DEVCOM-Atlantic發起了兩項新的倡議,以促進其地理區域內以人工智能(AI)為中心的學術界和工業界的合作機會。第一項舉措,重點國際虛擬交流系列(FIVES)為國際組織提供了一個平臺,向美國國防部主題專家和利益相關者介紹他們的人工智能研發活動和能力,促進討論和合作。第二項舉措,xTechGlobal是陸軍助理部長(采購、后勤和技術)遠征技術(xTech)獎競賽項目[4]向國際參與者的試點擴展,其中包括一個人工智能問題聲明。
2020年初,美國海軍發布《人工智能技術安全性》。該報告重點關注對此項技術帶來的安全性問題。美國海軍乃至整個國防部系統,都在嚴肅認真地對待軍事人工智能的發展。2019 年的 2、6、9 月,美國先后公布《國防部人工智能戰略》、《國家人工智能戰略》《空軍人工智能戰略》三大戰略,表明其在國家、軍隊、軍種三個層面的“智能化戰略”全面啟動。可看出美國人工智能在軍事領域的發展態勢日趨激烈
人工智能作為驅動第四次工業革命的重要引擎,深刻影響著經濟產業和各技術學科的發展,為此美國以國家戰略地位提升對人工智能在社會發展各領域( 特別是國防領域) 的動能,以推動人工智能技術的研發。2019年10月,世界經濟論壇發布制定國家人工智能戰略的框架白皮書,創建了最低限度可行的人工智能國家戰略制定框架,指出國家人工智能戰略的制定應考量具有戰略意義的優先事項人口需求資源限制和地緣政治等因素,旨在指導尚未或正在制定人工智能國家戰略的政府。美國多措并舉,繼續把發展人工智能技術作為提升國力維護國家安全的重大戰略,從國家戰略層面強化人工智能技術布局。2019年2月,美國政府科技政策辦公室發布由美國總統特朗普簽發的《維持美國在人工智能領域的領導地位》行政令,提出了美國發展人工智能的政策和原則戰略目標和重點領域,啟動旨在推進美國在人工智能領域領導地位的美國人工智能倡議,指示聯邦政府整合資源,聚力發展人工智能。
同年2月,美國國防部公布《2018年國防部人工智能戰略》的摘要部分( 題為《利用人工智能促進安全與繁榮》) 。該戰略是美國國防部首個人工智能戰略,旨在落實美國政府《國家安全戰略》和《國防戰略》提出的人工智能重要事項,為美國國防部謀求軍事人工智能優勢發展軍事人工智能實戰化能力提供戰略指導。2019年7月,美國空軍推出數字空軍計劃,旨在改進其在數據管理信息技術架構和業務運營方面的不足,使美國空軍保持競爭力。2019年9月,美國能源部成立人工智能與技術辦公室,旨在為美國人工智能研究人員提供聯邦數據模型和高性能計算資源。2019年9月,美國空軍以美國《國防部人工智能戰略》附錄形式發布《2019空軍人工智能戰略》,詳細闡釋在數字時代如何有效管理引導和引領所必須的基本原則職能和目標。2020年初,美國海軍分析中心發布專題報告《人工智能技術安全性———對海軍的行動方案建議》。該報告從當前美國海軍推動軍事領域人工智能技術運用過程中引發的公眾關注進行介紹入手,提出了海軍乃至整個國防部系統在軍事領域接收采用新興技術手段的總體態度與思路。
作為軍事大國,美國對于人工智能軍事作戰賦能的目標非常清晰,強力推動美國頂尖人工智能研究走向新的技術突破,促進科學新成果的發現、增強經濟競爭力、鞏固國家安全。2019年3月,美國參議院軍事委員會舉行主題為國防部人工智能計劃的聽證會,美國國防預先研究計劃局 DARPA、國防創新小組( DIU) 、國防部聯合人工智能中心( JAIC)等機構主管分別發言,闡述所在部門的人工智能項目及運行機制等情況,鞏固并強化了人工智能技術及應用與軍方之間的聯系,保障美國的人工智能軍用化步伐進一步加快。以DARPA為例,DARPA正將投資和研發重點轉向第三代人工智能技術,用于創建能在特定語境下進行推理的機器。資助的主要項目包括終身學習機器( L2M,2017年啟動),可解釋人工智能( XAI,2018年啟動)和機器常識( MCS,2018年啟動)等,探索提高人工智能技術水平的方法,實現語境推理能力。DARPA認為,將這些技術集成到與軍事作戰人員合作的軍事系統中,將有助于在對空間敏感的復雜戰場環境中做出及時決策,了解不完整或者相互矛盾的海量信息,并使用無人系統安全自主地執行關鍵任務。2019年1月,DARPA啟動知識導向型人工智能推理模式( KAIROS)項目,旨在提升面向復雜戰場環境挖掘和理解海量信息中的復雜事件及其相互關系的能力。2019年1月,美國陸軍研究實驗室( ARL)啟動異構戰術環境中的分布處理( DPHTE)計劃,基于霧計算平臺在對抗性軍事環境中為作戰人員提供更多的態勢感知。2019年2月,美國空軍研究實驗室發布多域戰和目標定位支持信息分析項目,旨在開發基于算法戰和人工智能等技術,針對時敏有價值的敵對移動目標進行快速預判和打擊。2019年5月,DARPA啟動旨在將人工智能應用于空戰演變( ACE) 項目,人工智能空戰應用成熟后可替代飛行員完成部分空戰任務。2019年5月,麻省理工學院發布為美國空軍打造人工智能加速器項目,該項目研究領域包括救災和醫療準備、數據管理、維護物流、車輛安全以及網絡還原能力。2019年9月,美國國防部聯合人工智能中心宣布美國軍方網絡安全數據制定新框架,重點為未來人工智能網絡防御體系奠定基礎。2020年初,美國特朗普政府向國會提交2021財年預算申請,加速發展人工智能等技術。提議政府預算從2020財年1560億美元削減至1422億美元,下降138億美元,但預算申請仍強調優先發展“未來產業”,必須加速發展人工智能等技術。其中,500萬美元用于能源部新立“人工智能與技術辦公室”,加強人工智能的項目研發。
隨著人工智能技術的發展,人權倫理、隱私保障、歧視偏見、安全問題等困境日益突出。美國亦在探索中多措并舉,確保人工智能在充分的監督和控制之下發展。特別是在2019年發布的國家級人工智能戰略和2020年初發布人工智能技術安全性報告中,將道德、隱私、安全等問題擺在突出位置,認為應在尊重道德、重視安全的前提下最大限度地發揮其社會效益。
美國推動多項研究,闡明美國合法道德地使用人工智能的愿景和指導原則,引導負責任的人工智能應用和開發。2019年1月,美國國防部要求國防創新委員會制定在戰爭中使用人工智能的道德原則,用以指導軍方在戰爭中使用人工智能技術和武器,并向硅谷科技公司確認其人工智能產品將如何被使用。美國國防部這一舉措被認為旨在形成全球軍用人工智能規范的指導方針,并吸引硅谷科技公司參與防御工作;10月,人工智能原則: 國防部人工智能應用倫理的若干建議推出,被認為是美國對軍事人工智能應用所導致倫理問題的首次回應。2019年1月,美國著名智庫布魯金斯學會發布《自動化和人工智能:機器對人及地區的影響》報告,著重分析了過去近30年間的資助系統與人工智能對行業、就業、地理和人口的影響,并對當前至2030年的趨勢進行了預測。最后針對國家、州和地方的政策制定者提出一個綜合響應框架,為人們理解并規范自動化和人工智能的作用提供參考。
人類歷史上,充斥著軍隊利用技術取得軍事優勢的實例。比如戰車。戰車,是出現在戰場上的第一種車輛裝備,由民間通用馬車提高速度和機動性改進而來,在軍事運用方面取得了顯著的優勢。戰車被描述為當時的“超級武器”。又比如火藥。火藥源起于一個偶然發現,它的出現,使得軍隊能夠駕馭化學反應能量來提高速度與威力,由此徹底改變了戰爭的形態和樣式。再比如內燃機。這種發動機繼承并發展了蒸汽機的優勢,改變了戰爭活動的速度與范圍。對內燃機的應用方案,包括為后勤物流(補給運輸卡車)提供動力以及為潛艇、飛機與導彈賦予持久的遠程監視及打擊能力。對大多數技術手段的接收和運用,一度都曾起到了改變了戰爭樣式的作用。而其中有幾項,更是徹底顛覆了以往戰爭活動的樣式和范圍,其中便包括火藥與核武器。人工智能技術,亦被認為位居此類。此項技術能夠應用于整個戰爭事業的方方面面,大幅提高了戰爭活動的效能與效率。各類人工智能技術,也因其各自獨有的特性而有所區別。首先應注意到,現實世界中人工智能技術應用方案,是用以解決特定領域問題的狹義人工智能技術,而非具備普遍通用性的通用人工智能技術應用方案。人工智能技術在軍事領域的應用,可以與美國軍隊對核武器的運用方式進行類比:安全方面的關鍵性技術領域知識,必須在很大程度上由軍隊文職機構掌握,在很大程度上亦屬技術范疇。
人工智能技術安全性,也與對其信任程度有關。美國軍方運用人工智能技術方面的一個關鍵問題是,軍方人員和美國政府高層領導能否相信這些系統確實有效且不會引發意外問題。2016年國防科學委員會對自主控制技術的研究報告指出:“決定在特定任務中部署運用某系統的個人,必須信任該系統。”在伊拉克和阿富汗的行動表明,負責實施特定行動的指揮官和戰斗/操作人員在不完全了解后果的情況下,不一定會使用某些系統。當某些系統被部署至戰場以滿足緊急需求時(如反簡易爆炸裝置系統或用于提供關鍵性情報的監視系統),一些部隊還是選用了他們已經熟悉的武器系統和情報監視偵察平臺,即便是老系統的功能指標比不上那些已經可以選用的新系統。對人工智能系統的信任度過低是一種危險,會阻止部隊運用他們所需的功能。而另一種危險,則是對某項能力的過度信任。人類傾向于過度信任機器,即便在有證據表明不能夠給予這種程度的信任情況下,也是如此。戰爭活動中的過度信任,也有具體案例。如,2003年,陸軍“愛國者”防空導彈系統曾擊落1架海軍F/A-18飛機,該系統將飛機誤判定為戰術彈道導彈,并向操作人員提出了建議,要求其發射導彈實施攔截。操作人員在沒有獨立核實可用信息的情況下,批準實施了這項建議。這表明,在實際作戰行動中,軍方需要對人工智能給予程度“恰到好處”的信任,不能過熱也不可太冷,避免滑向兩個極端。需要達成的目標,是程度恰當的信任,并且應該讓人來參與決策過程。而這種決策過程,則需要以各種相關能力及對系統功能所具備的經驗與知識為依托。
軍方和政府的高層領導,還應通過政策方針層面的決策對相關軍事行動的性質施加影響,包括確定戰爭活動中應該使用哪些特定的技術手段。這些方針政策,可能會對監管程度構成影響。例如,國防部第3000.09號指令,就要求對某些類型的自主控制系統進行高級別審核。明確戰爭活動中允許使用的技術手段(例如,對白磷(彈藥)運用的限制和使用集束彈藥時相關設定要求以及對其它此類武器具體性能參數的限制要求),并且對某些特定類型作戰行動中的策略原則進行限制。例如,《2013版總統政策指導(Presidential Policy Guidance,PPG)》及《2017版總統政策指導》中,對某些反恐行動的批準與監管流程的總體原則框架進行了明確。這些政策方針原則,有助于確保相關軍事活動符合美國的原則、價值觀及利益。這些政策方針層級的決定,都有反映出對此類系統或作戰行動可靠性所應持有的信任程度的意味。值得注意的是,以上這些實例內容都涉及到了安全性原則問題,而《國防部第3000.09號指令》的目的,就在于避免“意外交戰(inadvertent engagements)”事件的出現(例如致使平民傷亡)。限制白磷彈藥和集束彈藥的目的,還在于減少使用這些武器時給平民帶來的危險。《2013版總統政策指導》中,直接將致使平民傷亡明確列為作戰行動批準程序中的否決條件(no-gocriterion)。因此可以預見,安全性問題,勢必將成為未來高層領導人對于將人工智能技術手段運用于戰爭活動方面所明確的相關指導與指令內容中的一部分。
人工智能技術的巨大進步,也使美國政府產生了對業界新的依賴性。自第二次世界大戰以來,美國政府一直在很大程度上依賴于自身投入的研發資金。然而,人工智能技術方面的研發投資,越來越多地由私營機構所主導。其特征,是過去十年來科技行業的研發支出急劇增加。在圖1中,我們將整個美國政府在網絡和信息技術研發方面的支出與美國排名前五位的高科技公司(亞馬遜、谷歌/阿爾法控股、英特爾、微軟、蘋果)的研發投資進行了對比。如圖1所示,科技行業企業在研發方面的投入明顯更多,而且兩者間的差距正在擴大。2010年,科技行業企業的研發支出,已經是美國政府整體科技研發投資規模的6倍。8年后,企業在這方面的投入規模將激增至美國政府的15倍。總體而言,美國政府在尖端技術方面研究工作的投資面臨著迅速擴大的缺口。這種現狀,為美國政府營造出了一種處于不斷變化中的環境。在這種環境中,與業界的協作,對于美國政府實現其戰略目標必須保持的技術優勢而言至關重要。在這個意義上,人工智能技術安全性應該是業界關注的問題——正如谷歌等公司放棄了對美國政府軍事領域應用方案的支持,并開始運用倫理性審查程序對其內部工作流程進行監測所證明的那樣,美國政府必須與業界協作,依托其幫助解決此類問題。
圖1 美國政府與科技行業企業研發投資差距對比圖
2025 年前,美軍重點是搭起智能化軍隊框架,總體水平處于弱人工智能階段。美軍建設主要圍繞構建“全球監視打擊體系”,以升級水下、網電、空天、全球快速打擊和導彈防御作戰系統為重點,突出發展無人化、隱身化、遠程化作戰平臺,提升“全球公域”介入能力,確保可信的“拒止”和“懲罰”威懾。這一階段,美軍無人系統在數量上將逐步超過有人系統,自主無人系統將成為美軍前沿作戰的重要力量,無形、無人、隱形、靈巧等力量將成為美軍事干預的主要手段。2035 年前,美國初步建成智能化作戰體系,總體水平進入強人工智能階段。美軍建設主要通過發展智能化作戰平臺、信息系統和決策支持系統,以及定向能、高超聲速、仿生、基因、納米等新型武器,對主要對手形成新的軍事“代差”。在這一階段,美軍無人系統的投資將超過有人系統,無人系統建設規模及作戰運用皆居于主導地位。2050 年前,美軍智能化作戰體系將更先進、更完善,總體水平達到超強人工智能階段。美軍在強人工智能、通用量子計算、可控核聚變、納米機器人、再生、創生、腦聯網等技術方面可能取得突破。作戰平臺、信息系統、指揮控制可能全面實現智能化、無人化,更多樣的仿生、基因、納米等新型武器走上戰場,作戰空間進一步向生物空間、納米空間、智能空間拓展,人類進入“機器人戰爭時代”。
有效的項目管理有賴于對風險的細致和精確的量化。根據Kaplan和Garrick(1981)的說法,風險是概率和影響。然而,影響往往是多維的,包括進度維度、安全維度、財務維度或技術維度等。本文打算介紹利用統計科學將多個風險維度合并為一個數值。在美國國家航空航天局(NASA)的許多項目中都使用了一種叫做MRISK的多維風險工具來評估和確定風險和緩解措施的優先次序。此外,本文將總結北約盟軍司令部轉型(ACT)目前的風險管理準則,并將告知北約ACT在風險評估和管理方面可以從統計科學中獲益的潛在方式。
MRISK工具是由博思艾倫咨詢公司在NASA蘭利研究中心開發的。我曾作為MRISK的開發者,通過這篇論文,我旨在提高對定量風險評估的認識,并介紹其在北約ACT的潛在應用。博思艾倫咨詢公司撰寫的MRISK原始論文是美國國家航空航天局的專利,并存放在美國國家航空航天局科學和技術信息(STI)庫中。本文所表達的觀點僅代表我個人,不代表我以前或現在的雇主的觀點或意見。
所有的項目,無論其組織、復雜性、時間框架或目標如何,都會有風險。項目管理協會將風險定義為 "一個不確定的事件或條件,如果它發生,會對一個或多個目標產生積極或消極影響"。一個積極的風險被認為是一個機會,而一個消極的風險被認為是一個威脅。大多數情況下,風險管理意味著威脅管理。鑒于,不可能避免項目威脅,有效的項目管理必須包括成功管理它的方法。特別是考慮到減輕風險的缺陷最終會給聯盟帶來大量的資金,以及戰爭能力發展和進展的潛在滯后,它被證明是項目管理的一個重要組成部分。
風險管理包括風險識別、風險評估和風險應對。風險評估階段的目標是定性和/或定量地評估風險的概率和影響。傳統上,風險評估是定性進行的,這意味著它依賴于對單個風險的概率和影響的判斷。判斷可以基于過去的經驗、可比較的項目、或項目主題領域的專業知識。以這種方式進行的風險評估可以由一個人完成,也可以在一個有不同利益相關者和專家的團隊環境中完成。然而,僅僅是定性的風險評估并不總是充分的。
如果風險評估的主要目的是對風險進行優先排序,以確定哪些風險需要進一步研究和應對,那么定性評估就可能是足夠的。相反,如果風險評估需要高度的精確性和更多的結論性評價,那么定量評估與定性評估一起進行將對項目有益。
?美國國防部已經可以開始應用其現有的國際科技協議、全球科學網絡以及在多邊機構中的作用來促進數字國防合作。本報告將這些選項集合構建為軍事人工智能合作工具箱,可為調整政策、推進研究、開發和測試以及連接人員提供了有價值的途徑。
美國將人工智能 (AI) 的領導地位視為提升其在國際體系中的戰略地位和保持其未來軍事優勢的關鍵。美國的盟友和伙伴網絡是服務于這些目標的不對稱資產,正如旨在讓美國為當前戰略競爭時代做好準備的國家安全和國防政策所確認的那樣。
最值得注意的是,美國國防部 (DOD) 人工智能戰略中宣布的關鍵舉措和國家安全委員會關于人工智能的建議表明了國際參與對人工智能安全、安保、互操作性和與民主價值觀保持一致的重要性。
簡而言之,人們一致認為,加強聯盟和伙伴關系很重要,不僅因為美國在聯盟中行動,而且因為俄羅斯等經常單獨行動。由于技術加速如何推動軍事進步、刺激經濟增長和塑造21世紀的治理模式,人工智能和其他新興技術是與這些近乎同等競爭對手競爭的核心。如果不深化與盟友和伙伴的合作,美國既無法應對大國帶來的挑戰,也無法從塑造人工智能的民主軌跡中獲益。
在此背景下,本報告重點關注通過基于可互操作部隊和尖端技術的強大軍事關系,維護美國及其伙伴和盟國網絡相對于潛在對手的優勢的必要性。國防部已經擁有多種工具可用于深化與其盟國和國際安全伙伴的科技(S&T)合作。但為了充分利用它們在人工智能方面的潛力,該部門需要重新設想并更好地整合它們。
為此,此處的分析將現有的國防科技協議、軍事科技交流和多邊機構的要素構建為軍事人工智能合作工具箱。這項工作不僅僅是為人工智能能力開發集中資源,還包括政策調整;測試、評估、確認和驗證 (TEVV) 管道;研發(R&D)、人員交流;數據共享;和標準化。這里的目的不是提出新的協議,而是回答國防部如何利用其現有的科技合作機制來支持數字時代的軍事合作,確保相關資源和框架在尋求人工智能領導力和未來時不會被利用聯軍成功。
雖然應該承認挑戰,包括圍繞數據交換的敏感性和對技術政策的不同政策觀點,但隨著時間的推移,它們也可以成為合作以減輕這些障礙的動力。換言之,現有工具有助于在政治信任、凝聚力和互操作性方面獲得更多支持,從而使合作有助于應對數字威權主義和技術驅動的國際安全環境變化的共同挑戰。 主要發現是:
雖然軍事人工智能合作的某些方面可能需要新的投資、機制和協議,但這不應該排除現有工具可以用于新用途的多種方式。軍事人工智能合作工具箱之所以有吸引力,正是因為它可以在短期內啟動,滿足與盟友和伙伴盡早建立互操作性和推進人工智能的緊迫性。
Edwin Ho 1, Arvind Rajagopalan 2, Alex Skvortsov 3, Sanjeev Arulampalam 3, Mahendra Piraveenan 1
1 悉尼大學工程學院
2 澳大利亞國防科技 (DST) 集團武器和作戰系統部
3 澳大利亞國防科技 (DST) 集團海事部
本文簡要回顧了使用博弈論對與國防應用相關的決策場景進行建模的文獻。博弈論已被證明是對智能體、實體和玩家的決策過程進行建模的非常有效的工具。它已被用于模擬不同領域的情景,如經濟學、進化生物學和計算機科學。在國防應用中,經常需要對敵對行動者的行動以及試圖躲避或超越對方的玩家進行建模和預測。對競爭者的行動如何影響對方的決策進行建模是博弈論的強項。在過去的幾十年里,有幾項研究應用博弈論的不同分支來模擬一系列與國防有關的情景。本文對這些嘗試進行了有條理的回顧,并從所模擬的戰爭類型、所使用的博弈類型以及所涉及的參與者方面對現有文獻進行了分類。經過仔細挑選,共討論和分類了29篇直接相關的論文。就所模擬的戰爭而言,我們認識到大多數在國防環境中應用博弈論的論文都涉及指揮和控制戰爭,并可進一步分為涉及(i)資源分配戰爭(ii)信息戰爭(iii)武器控制戰爭和(iv)對手監控戰爭的論文。我們還注意到,大多數論文都涉及傳感、跟蹤和大型傳感器網絡,所研究的問題與民用領域的傳感器網絡分析有類似之處。就所使用的游戲而言,我們將審查的論文分為使用非合作或合作游戲、同時或順序游戲、離散或連續游戲以及非零和或零和游戲的論文。同樣地,論文也被分為雙人、三人或多人游戲的論文。我們還探討了玩家的性質和每種情況下的報酬函數的構建。最后,我們還找出了文獻中的空白點,在這些空白點中,博弈論可以被有效地應用于迄今為止尚未用博弈論探索過的場景。所做的分析對博弈論在國防應用中的應用提供了一個簡明的總結,并強調了博弈論在所考慮的情況下的好處和局限性。
關鍵詞: 決策;博弈論;國防科學;地面戰;海戰;空戰;跟蹤;傳感
博弈論已經成為傳統的理論框架之一,用于模擬我們生活中許多方面的重要決策過程。在經濟學、社會科學、金融學、項目管理、計算機科學、公民學和流行病學中都可以找到著名的例子。自從約翰-馮-諾伊曼、約翰-納什等人的開創性工作以來,人們已經充分認識到,在兩方或多方(玩家)之間的復雜互動(游戲)背景下,存在一種最佳策略,可以通向可預測的結果(報酬)。在實際情況下,這種結果往往可以是定量的,可以進行算術運算(成本、感染人數、接種人數等),但往往也可以是定性的(如風險、準備程度、健康狀態等)。
博弈論和相關數學方法的應用最近在國防領域引起了越來越多的關注。這是由兩個驅動因素造成的。首先,博弈論提供了一個自然的框架,通過用量化的術語如報酬、成本、收益或損失、風險等將高層次的政策決定迅速轉化為最佳戰略。這為國防決策者創造了一個統一的平臺,以支持達成一個特定的決定。第二,它提供了一個嚴格的數學框架,用于按照預定的標準評估和優化許多方案。這種迅速的評估往往成為國防作戰背景下的關鍵成功因素,導致在時間壓力下的決策優勢。這也成為國防行動中各種人工智能(AI)能力發展和部署的關鍵步驟。
博弈論在國防領域的應用有著持續和多樣化的歷史,從實時軍事系統的設計(例如,應用于導彈攔截)到支持大型國防投資和收購的戰略決策。關于具體的理論方法和工具及其國防應用有大量的文獻。我們相信,對這些文獻的回顧對于處理作戰分析和數據驅動的決策支持的社區是有意義的。這也是本研究的主要動機。
博弈論通過對形勢的整體和定量分析,加強了軍事戰略和決策過程。對軍隊來說,可用于博弈論分析的潛在情景包括快速增長的自主智能系統的應用,博弈論提供了一個全面的數學框架,大大增強了使用這些系統的人的決策能力。由于其潛力,博弈論的研究正在蓬勃發展,在這個軍事研究領域的文獻中開始出現一些以上的論文。本評論旨在幫助研究人員利用博弈論的知識體系,為國防從業人員開發更智能、更安全的決策系統。鑒于此類研究仍處于萌芽階段,我們通過在現有軍事知識與博弈論提供的新生可能性之間建立聯系,使其成為軍事控制系統中更廣泛理解和考慮的框架。
為了了解博弈論在國防領域應用的最新情況,并分析在這種情況下使用的游戲類型,需要進行回顧。據我們所知,目前還缺乏這樣的回顧,它涵蓋了博弈論在各種軍事領域的不同應用。本文的目標是提出這樣的評論,使人們更好地了解博弈論可以成功應用的眾多國防問題。此外,對不同背景下使用的博弈類型的多維分類,將為研究人員提供在相關問題中應用博弈論的新方法的見解。最后,我們提出了文獻中的空缺,希望能引起更多的研究和開發新的博弈論方法來解決防御問題。
盡管不是太廣泛,但圍繞軍隊中的博弈論的文獻體系已經涵蓋了不同形式的交戰和戰斗的顯著部分。這些論文涵蓋了過去、現在和未來的情況:從潛在敵對情況下的預測策略到對幾千年前軍事對峙的事后分析評估。博弈論已經證明有能力在任何此類軍事場景中發揮作用。然而,快速的技術進步帶來了持續的軍事交戰新領域,其中每一個領域都擁有自己的復雜系統。所涉及的首要領域是追蹤系統(跨越所有領域)、空中戰斗、地面戰斗、國家安全問題、網絡戰爭和空間系統。值得注意的是,博弈論在海軍戰爭中的應用很少,對未來類似領域研究的探索將在后面的評論中討論。在這些領域中,有無數的新的和創新的系統的可能性:不同的代理人,不同的武器,不同的控制結構--這些都可以用博弈論分析來豐富。雖然海伍德(Haywood)和桑霍姆(Thunholm)關于軍事決策中使用的博弈論的論文涵蓋了幾種不同的博弈類型,但似乎還沒有一篇論文涉及到在高性能計算和復雜算法基礎上建立的軍事系統的新背景下,博弈論在各自領域的軍事應用。我們的目標是以這樣一種方式來介紹文獻,即解決博弈論在軍事控制系統中每個關鍵領域的所有功能。
這篇評論經過仔細挑選,詳細參考了總共29篇論文。它強調了每篇分析論文的范圍和效用,從基本的博弈論概念方面介紹了它:玩家、游戲類型、策略和其報酬函數的關鍵參數。它既是一個帶注釋的書目,也是一個理解和規劃該領域進一步研究的框架。它還將列出玩家在每個軍事決策場景中考慮的基本原則,以及這些原則如何影響軍事人員和系統在與敵對玩家競爭或與友好玩家合作時做出的決定。這將使大多數軍事場景有可能被視為游戲,至少可以為熟悉的軍事情況提供一個有趣的新視角。這里審查的29篇論文是由來自國防、學術界和工業界的具有相關背景的專家團隊從Scopus和Google Scholar中挑選出來的,他們可以提供不同的觀點,根據不同的經驗確定最相關的論文。只有用英語寫的論文才被考慮。雖然我們承認沒有進行詳盡的搜索,但據我們所知,這些論文涵蓋了我們在此討論的研究領域的一個重要和有代表性的部分,并充分展示了這一領域的趨勢、重疊和文獻的差距。因此,我們有信心,所提出的分析將在所分析的論文之間進行嚴格的比較,并強調每篇論文的優勢和劣勢,同時也強調利用博弈論來模擬軍事背景下的決策的總體利弊。
本文的其余部分結構如下。第2節將討論我們所回顧的論文所闡述的基本防御原則,并介紹博弈論的基本概念。第3節對文獻進行了調查和分析,并總結了每篇論文中的發現和關聯。第4節根據上一節的觀察,闡述了我們對文獻的多維度分類,同時也介紹了與所回顧的論文相關的引文和其他指標。第5節指出了文獻中的空白,并在此基礎上強調了未來在這一領域的研究機會,特別是在博弈論迄今尚未經常應用的國防研究領域,可以從博弈論的應用中獲益。第6節深入討論了研究結果的實用性和所提交的評論的總體情況。最后,第7節總結了我們的發現和分類,并提供了廣泛的結論。
幾個世紀以來,關于戰爭的意識形態、信仰和知識一直在影響著人類的知識和哲學。孫子、荷馬和馬基雅弗利的偉大作品不僅為軍事決策的本質奠定了知識基礎,而且還為社會學和社會心理學提供了洞察力。軍隊構成了許多文明的核心權力集團,對現有國家的影響力增長和新國家的誕生都很重要。軍隊實時處理沖突,計劃未來,并回顧過去的交戰情況--這些活動中的每一項都會對社會產生影響。因此,本評論有必要涉及多個物理領域的軍事沖突的許多方面,下面將總結每個領域需要做出的主要決定。然而,在所有這些領域中,目標的價值、資源的價值和目標的優先級通常是形成報酬函數和戰略的關鍵參數,而這些參數反過來又定義了我們在建模中使用的游戲。
在本節中,我們將討論國防科學和技術以及博弈論中的概念,這些概念對于理解和分析所提出的細分領域的文獻是必要的。首先,讓我們討論一下本評論中所考慮的國防和國家安全的廣泛領域。如表1所示,它們可以被總結出來。
表 1. 本次綜述中使用的分類系統
如表1所示,在這次審查中,重點主要是 "指揮與控制 "戰爭,在這種戰爭中,決策是至關重要的。然而,指揮與控制戰爭適用于傳統的戰爭領域,如陸戰、海戰和空戰,以及現代戰爭領域,如太空和網絡戰爭。在一個正交的層面上,指揮與控制戰還可以細分為資源分配戰(RAW)、信息戰(IW)、武器控制戰(WCW),以及對手監控戰(AMW)。由于這些概念在我們的文獻分類中被廣泛使用,讓我們先簡單介紹一下。
資源分配戰(RAW):為實現軍事目標而分配軍事資源。
信息戰(IW):操縱信息以實現軍事目標。
武器控制戰(WCW)。控制武器以實現軍事目標。
對方監控戰(AMW)。追蹤敵人的行為以實現軍事目標。
技術是戰爭的決定性力量,而技術對于陸戰來說并不像對于其他領域那樣勢在必行。影響陸戰的技術是相對靜態的,并盡可能避免人力資源的暴露。如今,身體層面的人際戰斗已經不那么普遍了,為更多地關注定位戰略讓路。將博弈論應用于地面戰爭的文獻包括一個強大的武器-目標分配論文庫(涉及現代背景下的武器控制戰和資源分配戰),以及涉及古代地面交戰和游擊戰的論文。在人命脆弱的地方,保護他們是這些游戲中最重要的因素,其次是保護地面資產。
鑒于海軍在全球范圍內投射力量的重要性,關于海戰的公開文獻令人驚訝地少之又少--無論是否應用博弈論。在處理目標追蹤的論文中經常會提到海戰,但關于海軍軍事戰略的討論卻僅限于過時的文獻或對赤裸裸的基本要素的討論。我們將回顧這方面的現有論文,并強調這是一個在文獻中存在相當大差距的領域。
在萊特兄弟發明飛機后不久,空戰就成為戰斗和軍事行動的一個關鍵因素。在一個很少受到障礙物或尺寸阻礙的戰斗媒介中,空戰的性質是快節奏的、直觀的和令人難以置信的險惡,有不可預測的交戰'規則'。在今天,與一個世紀前相比,需要考慮的因素要復雜得多,而且軍事力量在進行空戰時并不缺乏資源--包括人和機器。文獻顯示,由于這種豐富的武器庫,目標和用于交戰的資源的內在和潛在價值在空戰場景中特別重要。在評估作戰策略時,需要對沖突雙方的這些價值做出決定。因此,有幾篇論文討論了博弈論在空戰中的應用。
網絡安全是保護IT系統和網絡不被損壞/破壞/遭受信息盜竊。網絡戰涉及到信息和通信系統被故意攻擊以獲得軍事優勢的概念。盡管幾十年來,網絡安全一直是計算機科學的一個重要領域,但有關網絡戰的文獻卻比較少,而且在任何情況下,都與計算機科學中的博弈論在網絡安全相關領域的應用有很大的重疊。這篇評論介紹并分析了一些專門涉及網絡戰爭的論文。
雖然太空戰的概念已經存在了近一個世紀,但既沒有實際的執行,也沒有建立起一套太空戰的理論策略[31]。然而,這并沒有阻止軍隊追逐星星(字面和形象),并不可避免地導致博弈論的概念被用于太空戰的戰略思維。這目前主要限于衛星網絡,其中游戲的關鍵參數是優化整個網絡的電力使用和信號強度。這個領域仍然相當年輕,在太空的進一步軍事發展似乎是不可避免的,與此相應的處理博弈論在太空戰中的應用的文獻也將增長。
有幾篇論文論述了博弈論在國防領域的具體應用,但卻不能被歸類為分析某類戰爭的論文。在其中一些論文中,重點更多的是放在所使用的技術上:例如,目標追蹤。在另一些論文中,需要進行防御的敵對行為者的性質發生了變化:例如,針對國內恐怖主義威脅而非敵對軍事力量的國家安全行動。有幾篇論文討論了博弈論在這種情況下的應用。
目標追蹤系統。軍事上的目標追蹤是對移動目標的觀察,以及對其位置和動作的監視。這個領域的成功依賴于觀察指標和數據的準確性,以及所有收集到的信息的有效分配和處理。隨著智能目標的出現,軍隊也必須納入預測方法,以保持理想的跟蹤性能。在這方面審查的文獻涵蓋了從跟蹤攻擊導彈到戰區彈道導彈,以及跟蹤未知智能代理到敵機的主題。這一領域中形成博弈的關鍵考慮因素涉及目標是否 "智能"/能否采取規避行動,目標是否會有一個最佳軌跡,以及目標是否會有防御者。博弈論的目標跟蹤應用大多發生在空戰和海戰中,包括水下監視。
國家安全的應用。博弈論經常在國家安全和反恐相關領域找到應用。這包括預測和準備恐怖襲擊,以及保護關鍵人員和地標/其他潛在恐怖活動目標的資源分配方案。雖然潛在目標的價值和攻擊的可能性顯然是制約這一領域博弈回報函數的關鍵參數,但隨后的社會、經濟和政治影響在這一領域的博弈建模中同樣重要。很少有軍事沖突能像后方的沖突那樣被曝光,恐怖襲擊的后果及其對公眾情緒和對安全機構的信心的影響,在建立這一領域的回報函數模型時經常被考慮在內。
博弈論是對戰略決策的研究,最早是作為微觀經濟學的一個分支發展起來的。然而,后來它又被用于不同的研究領域,如進化生物學、社會學、心理學、政治學、項目管理、財務管理和計算機科學。博弈論之所以獲得如此廣泛的適用性,是因為不同學科中普遍存在戰略決策情景。博弈論提供了對特殊行為互動的洞察力,如動物群體內的合作互動、婚姻中的討價還價和交換或蘇格蘭鮭魚養殖者的激勵。一個游戲通常包括兩個或更多的參與者,一組可供這些參與者使用的策略,以及每個參與者相應的一組報酬值(也稱為效用值)(在雙人游戲的情況下通常以報酬矩陣的形式呈現)。
游戲中的純策略提供了玩家如何進行游戲的完整定義。
一個棋手的策略集是該棋手可用的純策略集。混合策略是純策略的組合,其中有一個特定的概率p(0≤p≤1)與這些純策略中的每一個相關聯。由于概率是連續的,所以一個棋手有無限多的混合策略可供選擇。完全混合策略是一種混合策略,在這種策略中,玩家對每個純策略都賦予了嚴格的正概率。因此,任何純策略實際上都是混合策略的退化情況,在這種情況下,選擇該特定策略的概率為1,而選擇其他每個策略的概率為0。
納什均衡的概念是博弈論的基礎。它是戰略博弈中的一種狀態(一組策略),就報酬而言,沒有任何一方有動機單方面偏離這種狀態。純策略和混合策略納什均衡都可以被定義。一個戰略博弈往往可以有一個以上的納什均衡。事實證明,每一個玩家數量有限的博弈中,每個玩家可以從有限多的純策略中進行選擇,至少有一個混合策略的納什均衡。
納什均衡的正式定義如下。假設 (S, f) 是一個有 n 個玩家的博弈,其中 Si 是給定玩家 i 的策略集。因此,由所有參與者的策略集組成的策略配置文件 S 將是,S=S1 × S2 × S3… × Sn。令 f(x)=(f1(x),…,fn(x)) 為策略集 x∈S 的支付函數。假設 xi 是參與者 i 的策略,x?i 是除參與者 i 之外的所有參與者的策略集。因此,當每個玩家 i∈1,…,n 選擇策略 xi 時,策略集 x=(x1,…,xn),給特定玩家的收益 fi(x),這取決于該玩家選擇的策略 (xi) 和其他玩家選擇的策略 (xi-i)。如果任何單個參與者的策略單方面偏差都不會為該特定參與者帶來更高的效用,則策略集 x?∈S 處于納什均衡。正式地說,x? 處于納什均衡當且僅當:
通常情況下,博弈被認為是為了玩家的自身利益而進行的,即使玩家進行合作,那也是因為在他們看來,合作是在這種情況下使玩家的個人收益最大化的最佳策略。在這樣的博弈中,合作行為即使出現,也是由自私的目標驅動的,而且是短暫的。這些博弈可以被稱為 "非合作性博弈"。這些博弈有時被稱為 "競爭性博弈",這是不準確的。非合作博弈論是分析這類博弈的博弈論的一個分支。另一方面,在合作博弈中,有時也被稱為聯盟式博弈,玩家形成聯盟或團體,有時是由于外部對合作行為的強制執行,如果出現競爭,則在這些聯盟之間發生。合作博弈使用合作博弈理論進行分析,該理論預測了哪些聯盟會形成,以及這些聯盟的回報率。合作博弈理論的重點是聯盟之間的剩余或利潤分享,即聯盟由于形成了聯盟而被保證了一定的報酬。通常,在一個系統中進行的合作博弈的結果相當于一個受限的優化過程的結果。
零和博弈是一類競爭性博弈,所有參與者的報酬總額為零。在雙人游戲中,這意味著一個玩家的報酬損失等于另一個玩家的報酬收益。因此,一個雙人零和游戲可以用一個只顯示一個玩家報酬的報酬矩陣來表示。零和博弈可以用最小最大定理來解決,該定理指出,在零和博弈中,有一組策略可以使每個玩家的最大損失最小(或最小報酬最大化)。這種解決方案有時被稱為 "純鞍點"。可以說,股票市場是一個零和游戲。相比之下,大多數有效的經濟交易都是非零和的,因為每一方都認為,它得到的東西(對它自己來說)比它分到的東西更有價值。
在完美信息博弈中,每個玩家都知道所有其他玩家先前行動的全部歷史,以及游戲的初始狀態。在不完全信息博弈中,一些或所有的棋手無法獲得關于其他棋手先前行動的全部信息。
同期博弈是一種正常形式的博弈或廣泛形式的博弈,在每一次迭代中,所有玩家都同時做出決定。因此,每個玩家被迫在不知道其他玩家(在該迭代中)所做決定的情況下做出決定。相反,順序博弈是一種廣泛形式的博弈,在這種博弈中,玩家按照某種預定的順序做出決定(或選擇策略)。例如,如果一方總是有特權提出第一個提議,而其他各方在此之后提出他們的提議或還價,那么談判過程就可以被模擬為一個順序博弈。在順序博弈中,至少有一些玩家在做出自己的決定之前可以觀察到其他玩家的至少一些行動(否則,博弈就變成了同時博弈,即使玩家的行動在時間上并不同時發生)。然而,并不是一定要讓某個棋手可以觀察到之前每個棋手的每一步棋。如果一個棋手可以觀察到每個前一個棋手的每一步棋,這樣的順序博弈就被稱為有 "完全信息"。否則,這個游戲就被稱為 "不完美信息"。
差分游戲通常是廣泛形式的游戲,但不是有離散的決策點,而是在一個連續的時間框架內進行建模。在這種博弈中,每個狀態變量都根據微分方程隨時間連續演化。這種博弈是模擬快速演變的防御場景的理想選擇,在這種情況下,每個參與者都會對某些參數進行自私的優化。例如,在導彈跟蹤問題中,追擊者和目標都試圖控制他們之間的距離,而追擊者不斷試圖最小化這個距離,目標則不斷試圖增加這個距離。在這種情況下,迭代的決策回合對于模擬每個參與者的連續運動和計算來說過于離散。差分游戲是模擬這種情景的理想選擇。
共同利益博弈是另一類非合作博弈,其中存在一個所有玩家都嚴格偏愛的行動方案,而不是其他所有方案。換句話說,在共同利益博弈中,玩家的利益是完全一致的。可以說,共同利益博弈是零和博弈的對立面,在零和博弈中,玩家的利益是完全對立的,所以一個玩家的財富增加必然導致其他人的財富集體減少。共同利益博弈最早是在冷戰政治的背景下被研究的,以了解和規定處理國際關系的策略。因此,把非合作博弈分為共同利益博弈和非共同利益博弈是有意義的,就像把它們分為零和博弈和非零和博弈一樣,因為這兩個概念(零和博弈和共同利益博弈)代表了非合作博弈的極端情況。
信號博弈是一種不完全信息博弈,其中一個玩家擁有完全信息,而另一個則沒有。擁有完全信息的一方(發送方S)通過信號向另一方(接收方R)傳遞信息,而另一方在推斷出隱藏在信息中的信息后將對這些信號采取行動。發送者S有幾種潛在的類型,其中確切的類型t在游戲中對接收者R來說是未知的,t決定了S的報酬,R只有一種類型,這種報酬對雙方都是已知的。
該游戲分為發送階段和行動階段。S將發送M={m1,m2,m3,...,mj}中的一個信息。R將收到該信息,并從A={a1,a2,a3,...,ak}集合中選擇一個行動作為回應。每個玩家收到的報酬由發送者的類型和信息的組合,以及接收者回應的行動所決定。信號游戲的一個例子是啤酒-蛋餅游戲[52],在這個游戲中,玩家B,即接收方,選擇是否與玩家A決斗。玩家A要么很兇,要么很懦弱,而玩家B只想與后者決斗。玩家A選擇喝啤酒或吃乳蛋餅作為早餐。雖然他們更喜歡吃乳蛋餅,但乳蛋餅發出的信息是吃乳蛋餅的人很懦弱的刻板印象。玩家B必須分析每個決定,決斗或不決斗,如何根據玩家A選擇的早餐給他們帶來更好的回報。
行為博弈論將經典博弈論與實驗經濟學和實驗心理學結合起來,并在此過程中放松了經典博弈論中許多不現實的簡化假設。它偏離了諸如完全理性、獨立公理和不考慮利他主義或公平作為人類決策的動機等簡化假設。我們將在這篇評論中表明,與行為博弈論有關的方法在模擬軍事場景方面至關重要,例如在信號博弈方面。
進化博弈論是博弈論在進化生物學領域的應用成果。進化博弈論中提出的一些關鍵問題包括:哪些種群/策略是穩定的?哪些策略可以在其他策略盛行的種群中 "入侵"(變得流行)?在迭代博弈的背景下,玩家如何應對其他玩家獲得或被認為獲得更好的回報?進化游戲通常被建模為迭代游戲,即一群玩家在一個混合良好或空間分布的環境中迭代地玩同一個游戲。
如果一個策略在盛行時有可能阻止任何突變的策略滲入其環境,那么它就可以被確定為進化穩定策略(ESS)。或者說,ESS是指如果一個種群在給定的環境中采用了這種策略,就不能被任何替代策略所入侵。因此,玩家從ESS轉向另一種策略是沒有好處的。因此,從本質上講,ESS確保了一個擴展的納什均衡。對于一個策略S1來說,要想成為對抗另一個 "入侵 "策略S2的ESS,需要滿足下面提到的兩個條件之一,即預期報酬E。
E(S1,S1)>E(S2,S1)。通過單方面改變策略到S2,該玩家將在與另一個堅持ESS S1的玩家的競爭中失利。
E(S1,S1)=E(S2,S1) & E(S1,S2)>E(S2,S2):一個棋手通過轉換到S2,在與另一個堅持ESS S1的棋手對弈時,既沒有收獲也沒有損失,但與已經 "轉換 "到S2的棋手對弈時,棋手最好還是選擇ESS S1。
如果滿足這兩個條件中的任何一個,新策略S2就沒有能力入侵現有策略S1,因此,S1對S2是一種ESS。進化游戲通常被建模為迭代游戲,即群體中的玩家迭代地玩同一個游戲。
需要指出的是,博弈論的其他幾個分支在上面的小節中沒有提到,也有幾個最新的進展沒有提到。博弈論被用于越來越多的不同場景和應用中。例如,博弈論被用來確定電信業中競爭者的市場份額,或沼氣廠的實施和建設。在一些應用中,矩陣博弈的報酬被構建為包含模糊元素,據說這使得建模的場景更加真實。同樣,量子博弈論是一個新興領域,它引入了疊加的初始狀態、初始狀態的量子糾纏和策略的疊加。這里不能總結所有這些進展。因此,本節只對那些在防御文獻中,特別是在我們評論的論文中經常使用的博弈論概念做了基本介紹。因此,對于不熟悉博弈論的讀者來說,以上各小節提出了一個基本的介紹。請看對所提出的概念的更詳細的處理。
在此背景下,我們現在回顧一下現有的涉及博弈論在國防科技領域應用的文獻。
如前所述,在模擬防御場景的游戲中,影響報酬矩陣的主要參數是目標的價值、資源的價值和目標的優先級。除此以外,國防應用中使用的游戲可以有很大的不同,我們將在下面看到。出于這個原因,本節是根據每篇論文所涉及的領域(戰爭類型)來安排的。如果一篇論文涵蓋了一個以上的領域,它將被列入最相關的小節/領域。然而,我們詳細分析了每篇論文所使用的游戲類型、報酬函數的結構方式、可用策略和均衡等。
在與陸戰有關的博弈論應用中,大多數研究都集中在防御性戰爭上,即軍隊決定如何最好地分配他們的地面防御來應對多種威脅。一些研究還關注歷史上的陸上沖突,并提供事后的博弈論分析,揭示了在歷史沖突中一些憑直覺做出的決定是如何具有理性和數學上的理由的。陸地戰爭可能導致非常嚴重的傷亡,因此了解如何最好地減少人員損失是陸地戰爭的一個關鍵組成部分(盡管不是唯一的目標)。很多時候,確定軍事資源的優先次序也是成功的根本,并經常在戰略決策中占據突出地位。此外,在涉及地面戰爭的情況下,經常需要評估對對手、其可能的戰術或地形的了解:可能需要打擊在某些地方插入的空降部隊,或者需要穿越不確定的領土。在每一種情況下,了解一支部隊在什么地方擁有不完善的信息將有助于該部隊做出合理的決定。
有幾篇論文使用博弈論來模擬當前和歷史背景下的陸地戰爭。Bier等人設計了一個博弈,將防御資源最好地分配給一組需要保護的地點/資源。然后,攻擊者必須決定他們如何選擇分割他們的力量來攻擊不同的目標。這個游戲被模擬成一個正常形式的雙人游戲。這個游戲的回報是絕對的,對一個地點i的攻擊要么成功,要么失敗,攻擊方獲得ai,防御方失去di。由于攻擊的命令是在攻擊前確認的,所以攻擊者必須使用一套純策略。這個游戲既可以同時進行,也可以依次進行。也就是說,游戲的進行取決于攻擊者在做出決定之前是否知道防御者如何分配他們的資源。這就導致了理想的策略是讓一些目標不受防御,并通過讓一些地區脆弱來加強關鍵地區的防御。
我們評論的下一篇論文是Gries等人的文章,它全面調查了博弈論原則在游擊戰/顛覆戰中的效用。他們建立的模型的重要因素是:破壞穩定的叛亂分子經常隨機攻擊,造成持續的威脅,必須有一個持續的緩解和檢測策略;戰爭的持續時間是需要考慮的,它將改變分配給目標和資產的價值;時間偏好在設置優先級方面起著關鍵作用,因為對價值的判斷決定了戰略決策,反過來決定成功或失敗。他們提出的博弈模型涉及一個連續的非合作博弈和一個同時的非合作博弈,在每一個博弈中,兩個參與者是游擊隊和政府。對于這些沖突,經濟和社會影響要比軍事損失和收益重要得多,因此在計算結果的價值方面發揮了更大的作用。
游戲特別模擬了每一方尋求與對方和平或沖突的時刻。在這些時刻,政府軍必須考慮每個選項的財務成本,而叛軍則要考慮交戰的優先順序,以及他們將為每個交戰提供哪一部分戰斗力。圖1展示了在破壞穩定的戰爭中從這些時刻出現的決策樹的例子,其中G代表政府的決策,R代表叛軍的決策。
圖 1. 破壞穩定戰博弈,其中突出顯示了政府和叛軍的決策點
Krisnamurthy等人研究了對無人值守地面傳感器網絡(UGSN)動態行為的博弈論控制,以獲取有關入侵者的信息。該網絡中的每個傳感器都能夠以特定的精度接收附近目標的范圍和方位的測量值,然后將其傳輸到本地中心進行數據融合。在這個框架中,雖然更多的傳感器測量值和更大的測量值傳輸量可能會導致更好的目標意識,但這也導致了對有限電池電量的更大消耗的不良影響。因此,應用博弈論的目標是使用一種雙時間尺度的分層方法,對目標意識、數據傳輸和能源消耗進行最佳權衡。
作者證明,傳感器的激活和傳輸調度問題可以分解為兩個耦合的分散算法。特別是,傳感器被視為非合作游戲中的參與者,并提出了一個自適應學習策略,以根據傳感器與感興趣的目標的接近程度來激活它們。這被證明是這個非合作博弈的相關均衡解。接下來,傳輸調度問題,即每個傳感器必須在每個時間點決定是傳輸數據和浪費電池電量,還是等待和增加延遲,被表述為具有懲罰性終端成本的馬爾科夫決策過程。這一表述的主要結果是表明,最佳傳輸策略具有閾值結構,然后用超模數的概念來證明。
有幾項研究用博弈論的棱鏡分析了主要發生在陸地上的歷史沖突。例如,Cotton和Liu描述了兩個中國古代的軍事傳說,并將其建模為信號游戲。在這兩個游戲中,傳說中的軍事領導人面對的是數量和力量都遠遠超過自己的軍隊的強大對手,但他們并沒有撤退,而是準備交戰,表現得就像在設下埋伏。他們的對手在信息不完善的情況下,只能從對手的行動中推斷出一些信息;由于被這些將軍的自信和名聲所嚇倒,對方的軍隊雖然在實際實力上占優,但卻選擇不交戰。通過勇敢而巧妙的虛張聲勢,兩位將軍都通過站在自己的立場上實現了對自己有利的平衡方案。他們通過在沒有直接溝通的情況下制造欺騙來做到這一點,這遵循了前面提到的Beer-Quiche信號游戲的模板。
科頓和劉描述的第一個游戲是 "100個騎士 "游戲。他們描述了這樣一段歷史:一百名漢族騎兵獨自旅行,遇到了一支人數達數千的匈奴部隊。他們可用的策略是撤退或交戰。如果他們撤退,而敵人參與進來,他們很可能會被擊垮和擊敗;如果他們參與進來,而敵人也參與進來,他們將在戰斗中被淘汰。對他們來說,最好的結果是以某種方式迫使敵人退卻。敵人不確定這些騎兵是否與更大的軍隊同行。他們看到騎兵的行動,決定不冒這個險,而是撤退。這種情況被轉化為一個雙人游戲,有兩種策略。如下圖2所示:
圖 2. 100 Horsemen 信號博弈
在圖 2中:
LG代表漢軍李廣將軍的決策點。
GenX代表了敵對匈奴勢力的決策點。
收益被列為(LG,GenX)
λ∈(0,1) 代表將軍的能力,
α 和 β 代表在撤退中喪生的漢族騎兵比例
w 是一個正參數
第二個游戲與第一個游戲非常相似。在這個游戲中,一個小城市由強大的諸葛亮將軍守衛。他得知一支巨大的敵對軍隊正在接近這座城市。他面臨著兩個選擇。他可以逃跑,之后他將脫離城市,并可能被逼近的軍隊追趕,或者他可以留下并保衛城市。如果他選擇后者,而軍隊參與進來,他很可能會失去他的生命、他的軍隊和這座城市。面對這種兩難的局面,他命令他的人躲在視線之外,使城市從外面看起來是空的。他爬上城中最重要的塔頂,演奏音樂。對方的將軍知道梁將軍的經驗和能力,懷疑將軍在空城的塔樓上采取這個不起眼的位置來伏擊他的軍隊,于是他們遠離城市以避免被伏擊。梁將軍在這里有效地發出了兩個信號。第一個是他的聲譽,這個信號包含了他的戰略和軍事力量。第二是他選擇留下來保衛城市。有了這兩點信息,再加上沒有其他關于梁將軍軍隊的下落或規模的信息,對方軍隊選擇了零損失的安全選擇,離開了。這段歷史被模擬成另一個雙人信號游戲,如下圖3所示:
圖 3. 空城信號博
在圖 3 中:
ZL代表諸葛亮將軍的決策點
收益被列為(ZL,反對軍)
λ∈(0,1) 代表將軍的能力,
c代表城市的價值
w 代表 ZL 的軍隊與對方軍隊匹配時的收益
y表示ZL的軍隊比對方軍隊弱時的損失,并且y>c,因為它包括失去城市
這兩段歷史都代表了面對近乎確定的失敗時做出的杰出軍事決策,實際上是將軍們對信號的細微差別有深刻理解的例子,并在戰略互動中做出理性決策,迫使他們取得有利于自己的結果。
令人驚訝的是,盡管海戰在人類歷史上比空戰要早很多,但直接和主要利用博弈論來研究海戰的論文卻相對罕見。萊文利用博弈論的概念研究了前幾個世紀的海戰的各個方面。在18和19世紀,當時的強國建造的戰艦都是沿著船舷放置大炮的。這意味著船只通常只能對其兩側進行攻擊。當以艦隊形式航行時,標準的做法是形成 "戰線",即一列聯軍軍艦沿某一方向航行,使其兩側面對敵人,也擺成一排。然后,兩支平行的對立艦隊可以用大量的大炮攻擊對方。戰線 "戰略被認為是一種納什式的平衡,因為兩支艦隊都不會從進行耙擊(當時的一種戰術,即攻擊艦會試圖駛過對手的船尾,將大炮集中在那里開火,而敵人由于船尾的大炮位置較少,只能做出最小的反應。攻擊艦會同時破壞對手的船尾和一些寬舷)。根據列文的說法,在一支艦隊中,耙網并不是首選,因為這意味著必須先在敵人前面航行,然后轉向它--當船只的速度大致相同,而且操縱困難時,這是個具有挑戰性的任務。由于兩支艦隊都不會從轉向敵人的過程中獲益,也不會領先,萊文得出結論,這種策略--形成一條戰線并與對方艦隊平行航行--是每支艦隊的最佳反應,因此代表了納什均衡。
萊文接著提到了一些戰役,在這些戰役中,英國艦隊偏離了上述策略,向法國和法國-西班牙艦隊正交航行。在萊文提到的第一場戰役中,這可能是沒有計劃的。在第二場戰役--1805年的特拉法爾加戰役中,它是經過精心設計的:英國艦隊分成兩個縱隊,每個縱隊都以正交方向駛向法西戰線,在撞開戰線并開始全面混戰之前,進行了大約45分鐘的猛烈攻擊。英國人繼續孤立了法西艦隊的中間部分,取得了決定性的勝利。萊文認為這兩場戰役都是他論點的反例。然而,在特拉法爾加戰役中,英國的戰略有可能是對法國和西班牙可能形成的正統戰線戰略的最佳回應。英國海軍上將納爾遜勛爵希望阻止法西艦隊逃跑--如果兩支艦隊形成平行戰線,他們就可以逃跑--從而減少他將自己的艦隊組成戰線所得到的回報。此外,他可能估計到法國和西班牙船只的炮擊能力較差,會降低炮擊的效果,從而減少他直接向法國-西班牙艦隊發起沖鋒所獲得的負面獎勵。在他看來,這可能使得非正統的選擇比正統的戰線更能應對法西可能的戰略。雖然萊文沒有明確地將當時海戰中的這些策略歸結為博弈論,但所采用的策略還是可以通過博弈論分析來證明:這是一個沒有正式研究博弈論的 "直覺 "應用的例子。
Maskery等人在2007年(a)研究了使用網絡支持的操作(NEOPS)框架部署反艦導彈的問題,在這個框架中,多艘艦艇進行通信和協調以防御導彈威脅。在這里,導彈威脅被模擬成一個離散的馬爾可夫過程,它們在一個固定的物理空間內的隨機位置出現,并遵從一些已知的目標動力學和制導規律向艦艇移動。裝備有反制措施(CM)如誘餌和電磁干擾信號的艦艇被模擬為瞬時隨機博弈的參與者,其中單個參與者的行動包括使用CM來最大化自己的安全,同時與其他基本上以實現相同目標為目的的參與者合作。這個博弈論問題的最優策略是一個相關的均衡策略,并被證明可以通過一個具有雙線性約束的優化問題來實現。這與tepmaskery2007decentralized提出的一個相關問題但沒有玩家協調的納什均衡解決方案形成對比。本文的一個值得注意的貢獻是,它還量化了實施NEOPS均衡策略所需的溝通量。本文強調了博弈論方法在分析現代戰爭中至關重要的網絡系統的最優策略方面的效用。
在[71]中,Maskery等人2007年(b)考慮了以網絡為中心的特遣部隊對反艦導彈的保護問題。這個模型中的決策者是配備了硬殺傷/軟殺傷武器(反制措施)的艦艇,這些艦艇也被認為是在博弈論環境下制定這個問題的參與者。這些平臺必須就反措施的最佳部署做出獨立的關鍵決定,同時他們也要為保護任務組成員的共同目標而努力。從本質上講,這是一個海軍環境中的分散導彈偏移問題,它被表述為一個瞬時隨機博弈,艦艇可以計算出一個處于納什均衡的聯合反措施政策。在這里,艦艇之間的博弈而不是與導彈的博弈。這種方法自然適合于分散的解決方案,在完全通信不可行的情況下可以實施。此外,這種提法導致問題被解釋為隨機的最短過去博弈,已知存在納什均衡的解決方案。Bachmann等人使用非合作的雙人零和博弈分析了雷達和干擾器之間的互動。在他們的方法中,雷達和干擾器被認為是目標相反的 "玩家":雷達試圖最大限度地提高探測目標的概率,而干擾器則試圖通過干擾雷達來最小化其探測。
Bachmann等人假設在存在瑞利分布雜波的情況下有一個Swerling II型目標,對于這個目標,在不同的干擾情況下,單元平均(CA)和順序統計(OS)CFAR處理器的某些效用函數被描述。這種博弈論的表述是通過優化這些效用函數來解決的,這些效用函數受到控制變量(策略)的約束,對于干擾者來說是干擾者的功率和干擾的空間范圍,而對于雷達來說,可用的策略包括閾值參數和參考窗口大小。由此產生的矩陣形式的博弈被用于解決雷達和干擾器的最佳策略,從中確定雷達和干擾器有效實現其各自目標的條件。
空戰通常是一種正常形式的游戲,在交戰前,根據對武器庫中不同元素的強度的假設和知識,對所利用的資源做出決定。例如,壓制敵方防空車(SEADs)對地對空防御和地對空導彈(SAMs)是有效的,但對戰斗機則沒有用。因此,當軍事人員決定在交戰中使用哪些資源時,他們需要權衡每種資源的價值,以及目標對沖突雙方的重要性。如果攻擊部隊對一個目標的重視程度遠遠超過其實際價值,那么他們增加的資源支出可能會對其整個軍事行動造成損害。在人類通常操作空中武器的情況下,他們各自的能力和技能,以及他們執行任務的可能性,都需要考慮。
關于用博弈論建模的空戰的文獻有限。漢密爾頓為博弈論在多種空戰情況下的應用提供了一個全面的指導。漢密爾頓建議使用博弈論來制定戰略,不僅要基于自己的軍事選擇,還要考慮對敵人行動的預期。博弈論說明了與敵人的不同互動,而不是簡單地考慮哪一方擁有優越的最大努力力量。如今,許多軍隊可以適應即時變化的情況,并根據這些新情況調整自己的行動。因此,漢密爾頓建議首先確定每一方可用的所有戰術選擇。如前所述,將博弈論用于軍事的最基本要素之一是了解每項資產到底有多少價值--詳細說明雙方的庫存和戰略可能性將最好地澄清所有戰略選擇。對于每個選項,漢密爾頓建議分配一個數值--有效性衡量(MoE)。關于效果衡量的決定是很重要的,因為準確的效果衡量將為戰略上的選擇提供基礎。不正確的MoEs會導致不正確的戰略決策,也許還會導致對決策錯誤的原因理解不足。這方面的一個例子(雖然不是在空戰的背景下)是越南戰爭,美國的早期戰略是最大限度地消滅越共士兵。由于越南北部的領導層并不十分重視他們的步兵,美國的戰略最終導致了戰爭的失敗。接下來,漢密爾頓建議計算沖突雙方戰略之間所有可能的相互作用的綜合價值。這將產生一個回報矩陣,從中可以得出每個玩家的最佳或主導戰略,然后得出一個均衡解。因此,在軍事領導人可能參與的任何交戰之前,他們對游戲的預期結果有一個成熟的想法。漢密爾頓在這些準則中加入了一個注意事項,即把軍事行動的長度作為一個整體來考慮。如果資源的替換成本低或數量多,那么可以分配給一次戰役或打擊攻擊的價值就可能很小。然而,根據整個戰役中這種小規模沖突的數量,這些資源可能會變得非常關鍵。
為了說明這些觀點,漢密爾頓將其應用于一個標準的海空導彈和時間關鍵目標的空戰游戲。在這場戰斗中,"藍方 "正試圖消除一些地面目標。為了做到這一點,他們使用了海空導彈。作為回應,'紅方'將發射防空導彈,而防空導彈則要努力避開。然而,在期待這種回應的同時,藍方也有攻擊機,它們可以防御海空導彈并反擊薩姆導彈,但無法攻擊目標。藍方的問題是:目標的價值是什么,應該為目標部署何種比例的海空導彈和攻擊機?同樣,對于紅隊來說:目標的價值是多少,如果有的話,應該發射多少枚防空導彈?漢密爾頓認為,紅方的最佳策略是只在交戰的一小部分時間內開火,這相當于:
最優藍色策略是將部分飛機分配為SEADs,等于:
在這里,
Pks 是 SAMS 摧毀 SEAD 的概率
PkA 是攻擊機摧毀 SAM 的概率
這種提法簡明扼要地預測了在每一種可能的飛機和導彈發射任務下交戰的可能結果。必須指出的是,在實踐中準確量化不同目標和資源的數值是非常困難的。
Garcia等人2019年研究了在海上海岸線上防御兩架敵機的問題,這兩架敵機的主要目標是入侵防御方飛機控制的領土。而防守方則試圖通過試圖在離邊界盡可能遠的地方連續攔截兩架敵機來防止這種情況。這是一個典型的追擊-逃亡場景,代表了機器人、控制和防御領域的許多重要問題。在本文中,Garcia等人將這一問題表述為零和差分博弈,即防御者/追擊者試圖在離被防御的海岸線盡可能遠的地方連續捕獲兩個攻擊者/入侵者,而攻擊者則合作并在他們被對抗之前使他們離邊界的總距離最小。然后,Garcia等人通過解決一組非線性方程,在這個一防二攻的追逃博弈中找到攻擊者和防守者的最優策略。本文討論的合作策略為能力較弱(也許是速度較慢)的代理人在執行任務時提供了一個重要的協調方法。
Garcia等人在2017年考慮了一個空戰場景,即被攻擊導彈攻擊的目標飛機利用防御導彈來保護自己,因為它試圖在防御者達到與攻擊導彈盡可能近的距離時逃離攻擊者。該游戲被稱為主動目標防御差分游戲(ATDDG)。在本文中,作者擴展了以前在這個三方問題上所做的工作,為ATDDG開發了一個閉式分析解決方案,其中防御者導彈如果進入一個半徑為rc>0的捕獲圈內,就可以擊敗攻擊者。此外,盡管攻擊者采用了未知的制導法,而不是假設它是比例導航(PN)或追求(P),本文所展示的閉式最佳狀態反饋解決方案應該是有效的。最后,作者提供了一套目標飛機的初始條件,在這些條件下,盡管攻擊導彈采用了未知的制導法,但如果目標防御者團隊發揮了最佳作用,其生存就會得到保證。
Deligiannis等人考慮了多輸入多輸出(MIMO)雷達網絡中存在多個干擾器時的競爭性功率分配問題。雷達網絡的主要目標是使雷達發射的總功率最小,同時對每個目標達到特定的探測標準。在這個問題上,雷達面對的是智能干擾器,這些干擾器可以觀察到雷達的發射功率,從而決定其干擾功率,以最大限度地干擾雷達。在這里,Deligiannis等人將這個功率分配問題視為一個非合作博弈,參與者是中央雷達控制器和干擾器,并使用凸優化技術解決這個問題。此外,他們還提供了這種情況下納什均衡的存在性和唯一性的證明,在這種情況下,沒有玩家可以通過改變其功率分配來進一步獲利。
同樣,He等人考慮了多態雷達網絡中的雷達對抗問題,其中研究了在存在智能干擾器的情況下聯合功率分配和波束成形的博弈論表述。該網絡中每個雷達的目標是滿足目標的預期探測性能,同時使其總發射功率最小化并減輕潛在的干擾。另一方面,干擾器的目標是調整自己的發射功率來干擾雷達,以保護目標不被發現。首先,He等人研究了功率分配博弈,每個參與者(雷達和干擾者)的策略集由各自的發射功率組成。然后,他們著手解決相應的優化問題,以計算出雷達和干擾者的最佳響應函數,并表明納什均衡的存在和唯一性。接下來,他們再次將有干擾者存在的聯合功率分配和波束成形器設計問題視為非合作博弈,并提出了一種功率分配和波束成形算法,該算法被證明可以收斂到其納什均衡點。
McEneaney等人研究了無人駕駛飛行器(UAVs)對地面目標和地對空導彈(SAM)系統等防御單位的指揮和控制問題。這項工作的動機來自于無人駕駛空中作業場景中對作業計劃和實時調度的要求。該問題被模擬為藍色玩家(無人機)和紅色玩家(包括薩姆導彈和地面目標)之間的隨機博弈。每一方都可能有一些目標:例如,藍方玩家可能試圖摧毀一個戰略目標,同時盡量減少對自己的損害。另一方面,紅色玩家可能試圖對無人機造成最大傷害,同時保護自己不受無人機的攻擊。
無人機的控制策略由一組離散變量組成,對應于要攻擊的具體目標或防空導彈,而防空導彈的控制策略是將其雷達 "打開 "或 "關閉"。請注意,當雷達 "打開 "時,防空導彈對藍方玩家造成傷害的概率會增加,而藍方玩家對防空導彈造成傷害的概率也會增加。這個隨機博弈的解決方案是通過動態編程得到的,并通過一些數字例子加以說明。這項工作的主要貢獻是分析了不完全信息下隨機博弈的風險敏感的控制方法。特別是,這種方法不僅可以處理由于隨機噪聲造成的噪聲觀測,還可以處理觀測中包含對抗性成分的情況。
Wei等人開發了一個用于多個無人駕駛戰斗飛行器(UCAVs)協同工作的任務決策系統。UCAVs的武器是空對空導彈。在論文中,由一架無人駕駛戰斗轟炸機和兩架UCAV組成的紅色UCAV小組試圖打擊一個藍色小組的地面目標。藍隊有自己的一套UCAVs,其目標是擊敗紅隊。一枚特定的導彈對其選擇的威脅的成功取決于攻擊者和威脅之間的距離、它們的相對速度和相對角度。該場景被表示為一個同步正常形式的博弈,團隊的策略與藍隊實體對紅隊實體的分配相對應,反之亦然。在本文中,紅隊或藍隊的回報是基于考慮特定分配的有效性,而這又取決于對立團隊分配分組之間的相對幾何。Dempster-Shafer(D-S)理論被應用,其中D-S組合公式被用來制定報酬。這些為每個策略計算的報酬,然后被放入雙矩陣中,即每個團隊都有一個,并使用線性編程優化方法解決。如果不存在最優的納什均衡,則采用混合策略的方法進行求解。然后,作者開發了一些具有不同幾何形狀的任務場景,并說明了其博弈論分配策略的使用。他們使用包含紅隊和藍隊相互靠近的實體幾何圖形的注釋圖來證明由他們的報酬公式確定的分配策略是令人滿意的。
Ma等人開發了一種博弈論方法,為在超視距(BVR)空戰對抗中相互交戰的多個無人駕駛飛行器(UAV)團隊生成一種合作占用決策方法。由于導彈技術的發展使遠程交戰成為可能,BVR作戰成為可能。在本文中,每一方的團隊首先決定其無人機實體的占用位置(笛卡爾空間中的立方體),然后為每個無人機團隊成員選擇目標。目標是讓每一方獲得最大的優勢,同時經歷盡可能小的威脅條件。零和同步雙矩陣博弈被應用于分析該問題。對于一個給定的無人機占有率,高度和距離的優勢公式,考慮到射程和武器的最低/最高性能標準,用于產生效用函數的報酬值。由于游戲的規模會隨著每隊占用方塊和無人機數量的增加而導致規模的爆炸(從而導致策略的爆炸),作者選擇了在早期作品中為解決大規模零和博弈問題而設計的Double Oracle(DO)算法,將其與Neighbourhood Search(NS)算法相結合,成為Double Oracle Neighbourhood Search(DO-NS)。通過模擬,作者說明,結果顯示DO-NS算法在計算時間和解決方案的質量方面優于DO算法。
Ba?p?nar, Bar??等人的工作重點是使用基于優化的控制和博弈論方法對兩個無人駕駛飛行器(UAVs)之間的空對空戰斗進行建模。在這項工作中,車輛運動用特定的變量表示,任何從一個航點到另一個航點的軌跡規劃都是通過確定滿足平坦輸出空間中的定義條件的平滑曲線來解決的。在確定之后,所有參與描述平滑曲線的變量都可以恢復到原始狀態/輸入空間。其影響是通過減少所需變量的數量來加快任何軌跡優化的解決。然后利用博弈論,兩個無人機之間的空中戰斗被模擬成一個使用最小值方法的零和游戲。也就是說,當對手采取最佳策略時,每一方都試圖使其收益最大化。這里,目標是讓每個無人機直接進入對方身后,并在一定范圍內滿足機載武器有效射程限制。
在[81]中,作者提供了與基于方位角和軸承角的目標追尾程度有關的成本函數,以及與對手在最佳射程的某個閾值內時產生最大得分有關的成本函數。這些成本函數相乘,形成總成本。成本函數被放入一個后退地平線控制方案中,在一個給定的前瞻時間段內,通過選擇控制措施確定的軌跡規劃被執行,在這個時間段內,雙方都使用相反的策略。每個玩家將其對手視為地平線內的可達集,并以此來選擇其控制的選擇,以使其報酬最大化。這個過程每隔幾個控制步驟就會重復一次。與該領域的大多數其他作品不同,作者使用了性能包絡內的全部控制輸入,而不是一個子集(例如,轉彎、保持哈丁、以特定角度左滾、immelman、分裂S或螺旋俯沖),從而指向為每個玩家的策略生成一個更優化的解決方案。文章提供了兩種模擬情況,第一種情況是任何一個無人機都沒有開始處于空中優勢地位,然后行使后退地平線成本函數優化,在最佳射擊范圍內與對手進行追尾。作者表明,在飛行過程中,應用控制時的速度、載荷系數和岸角都沒有違反界限,而且產生了可行的軌跡。在第二次模擬中,無人機最初處于追尾狀態,但不滿足射擊范圍內的標準。被追趕的對手通過應用成本函數進行機動逃跑,而追趕者繼續追趕。在交戰結束時,滿足了射擊范圍內的標準,目標在正前方,但處于一個次優的方面,這導致其逃脫。這些場景被用來證明所開發的控制策略的有效性,從而為兩個無人駕駛飛行器相互交戰提供自動選擇戰斗策略。
Casbeer等人,考慮了這樣一種情景:追擊無人駕駛飛行器目標的攻擊者導彈被兩個與目標結盟的實體發射的防御導彈所吸引,而這兩個實體與目標合作。它從典型的三方博弈情景中延伸出來,在這種情景中,只有一枚防衛導彈與目標合作的攻擊者交戰。作者在此將其稱為主動目標防御差異博弈(ATDDG)。除了計算擴展到ATDDG中的玩家的最佳策略外,本文還試圖確定當目標使用兩個防御者而不是一個防御者時,其脆弱性的降低程度。本文提出了一個受限的優化問題來解決這種情況。結果表明,目標通過選擇與任一防衛者合作,可以更成功地逃脫攻擊者。此外,兩個防御者的存在使攻擊者更容易被攔截。當兩個防御者的導彈處于良好的位置時,都可以攔截攻擊者。
Han等人提出了一個綜合防空和導彈防御(IADS)的問題,即配備攔截導彈(IM)的地對空導彈(SAM)電池與針對城市的攻擊者導彈(AM)交戰。該問題是一個簡化的具有完全信息的兩方零和博弈,有三個階段。這三個階段對應的是防守方為城市配置防空導彈,然后是攻擊方為城市配置導彈,最后是防守方為反擊攻擊方的導彈配置攔截導彈。這個問題的簡化假設是,在一個城市附近只分配一個防空導彈,每個地點只安裝一個。此外,針對每枚攻擊導彈發射的攔截導彈不超過一枚。此外,一個DM只能分配一個IM,每個SAM都有相同數量和類型的IM,而AM是相同的,并且是單發發射的。試圖用廣泛形式的博弈樹、α-β修剪和使用Double Oracle(DO)算法來解決需要保護的六城市網絡的三層博弈。DO算法是一種啟發式算法,不保證能找到次完美納什均衡(SPNE)。我們研究了每種算法達到次完美納什均衡的效率。對于博弈樹方法,得出的結論是,由于問題的組合性,戰略空間的大小被確定為增加到一個難以解決的大小。當應用α-β修剪時,與DO算法相比,本文確定確定SAM電池、AM和IM的數量在計算時間方面沒有很好的擴展。然而,在少數情況下,DO算法確實無法找到SPNE。盡管如此,作者還是更喜歡DO算法,因為它被證明不違反單調性(報酬的增加)和解決方案的質量趨勢(計算時間的非指數增長),即使當問題的規模從6個城市增加到55個城市。
涉及博弈論在網絡戰爭(不同于網絡安全)中的應用的論文很少。其中重要的是,Keith等人[84]考慮了一個多領域(網絡與防空相結合)的國防安全博弈問題。兩個玩家在一個零和的廣義博弈中相互交鋒,一個是防御者,代表一個配備了網絡戰保護的綜合防空系統(IADS),一個是攻擊者,能夠釋放空對地威脅(導彈、炸彈)以及網絡攻擊(針對IADS網絡)。這里,回報被選為預期的生命損失。防守方希望將其降至最低,而攻擊方則希望將其最大化。保護IADS的網絡安全游戲問題被嵌套在物理安全游戲問題中。玩家的行動對應于激活IADS/網絡安全響應節點的分配,對應于防御方的人口中心,以及攻擊方攻擊IADS/相關的網絡安全節點的分配。通過提供不完善的信息,游戲的真實性得到提高;也就是說,防御者和攻擊者并不完全了解節點的脆弱程度。此外,防御者只能概率性地感知節點的網絡攻擊,這意味著其對特定IADS的網絡防御團隊的分配也只是概率性地有效。對于攻擊者來說,它也可以在物理攻擊一個節點后確定其網絡攻擊的有效性。這項工作通過引入綜合領域、代理行動的多個時期以及使玩家能夠不斷地采取混合形式的策略,為推動安全游戲文獻的發展奠定了基礎。作者認為這是第一項在安全游戲中比較蒙特卡洛(MC)和基于折扣和穩健的反事實后悔最小化(CRM)方法的工作。最初,對于問題的小規模版本,以序列形式的線性程序的形式確定防御者的納什均衡(NE)。然后,問題被逐漸放大,以包括更多的人口中心來防御,直到一個上限。這里,引入了一種近似的CRM算法,以減少計算時間,同時盡可能地保留特定策略的最優性。當規模進一步擴大時,引入了折現的CRM,進一步減少了計算時間。
對問題和算法的參數空間進行了探索,以選擇最佳的調整參數,并從算法中提取最佳性能。通過引入有界理性,使參與者的理性受到限制,因此他們不一定做出最佳反應。他們只能管理近似的穩健的最佳響應動作。一個棋手的穩健最佳反應被定義為完全保守的NE策略和完全激進的最佳反應策略之間的妥協。它在棋手的策略中引入了弱點。對于一個棋手來說,他們的策略能夠利用對手的策略的能力被稱為利用。反之,他們的戰略對于對手的脆弱性被稱為可利用性。當運行所有引入的不同算法時,結果顯示納什均衡解是最安全的策略,因為所走的是不被利用的最佳棋步,然而,它并沒有為玩家產生最高的效用。性能圖顯示,穩健的線性程序產生了最高的平均效用和最高的可利用性比率,同時也消耗了最大的計算時間。數據偏向的CFR被認為提供了最好的權衡,它提供了一個高的平均效用,一個有利于開發的可利用性比率,同時以最低的計算時間運行。
在空間戰爭領域,人力資源和風險要少得多,因此重點是網絡力量和獨立自主代理人之間的互動,連接或其他。最終,這些方面的戰爭將以遠遠超出人類認知能力的速度和維度運作。由于交戰中決策的快速性和復雜性幾乎肯定會超出軍事人員的理解能力,博弈論將取代決策者作為整個軟件和控制系統的一部分,并將未來的技術注入到計算時考慮人類/社會因素。隨著對連接性和網絡化的更多關注,這些領域的成功關鍵依賴于有效的溝通渠道和整個系統的共同目標。在這一新興的研究領域,應用博弈論的論文往往關注衛星網絡。
Zhong等人設定了一個雄心勃勃的目標:優化整個衛星網絡的帶寬分配和傳輸功率。他們的研究以討價還價的博弈論為基礎,必須在網絡中的每一個點上實現對干擾約束、服務質量要求、信道條件以及衛星的發射和接收能力的妥協。干擾限制和帶寬限制是在討價還價游戲中需要協商的盈余,每個衛星使用不同的策略來提高其效用/資源份額。這使得復雜性迅速升級,該模型最重要的收獲是將一個問題映射到合作討價還價的游戲框架中。
同樣地,Qiao和Zhao詳細介紹了衛星網絡中節點的有限能量可用性的一些關鍵問題。他們的論文通過一個路由算法的博弈理論模型提供了一個解決方案,并利用它來尋找不均衡網絡流量的均衡解決方案。該模型定位了某些網絡熱點,這些熱點正在儲備大量的能量,并采取措施均勻地分配資源。這是在網絡中多個參與者之間進行討價還價/合作博弈的另一個案例。
由于目標跟蹤是一個成熟的研究領域,我們發現了一些應用博弈論跟蹤問題的論文。其中大多數都有重疊的戰爭領域,并沒有過多強調在某個特定領域的適用性。例如,Gu等人研究了使用傳感器網絡跟蹤移動目標的問題,該網絡由能夠提供一些與位置有關的目標測量的傳感器組成。每個傳感器節點都有一個觀察目標的傳感器和一個估計其狀態的處理器。雖然傳感器之間有一些通信,但這種能力是有限的,因為每個傳感器節點只能與它的鄰居通信。由于目標是一個能夠最小化其被對手探測到的智能代理,從而有可能增加跟蹤代理的跟蹤誤差,這使問題更加復雜。Gu等人在零和博弈的框架內解決了這個問題,并通過最小化跟蹤代理的估計誤差,開發了一個穩健的最小值過濾器。此外,為了處理傳感器節點有限的通信能力,他們提出了這種濾波器的分布式版本,每個節點只需要從其近鄰獲得當前測量和估計狀態的信息。然后,他們在一個有智能目標的模擬場景中展示了他們算法的性能,并表明雖然標準卡爾曼濾波器的誤差會發散,但考慮到對手的噪聲的最小化濾波器可以大大超過卡爾曼濾波器的性能。
Qilong等人同樣解決了跟蹤智能目標的問題,但他們模擬了一個場景,跟蹤者也在追擊,重點是保護目標。此外,目標可以向攻擊者/追蹤者發射防御性導彈。攻擊者對目標和防御性導彈都有一個視線。目標計劃讓跟蹤器慢慢拉近與目標之間的距離,同時進行機動,以了解攻擊者的反應。當攻擊者接近碰撞時,防御性導彈被釋放。然后,目標和導彈進行溝通,利用對攻擊者運動模式的了解,并遵守最佳線性制導法,以摧毀攻擊者。這被模擬為攻擊者、目標和防御性導彈之間的零和競爭游戲。然而,本文還關注了目標和防御性導彈之間的合作博弈,這是一個非零和博弈。對他們來說,報酬是通過最小化的失誤距離(理想情況下等于零--與攻擊者的碰撞),以及引導防御性導彈所需的控制努力來計算。
Faruqi討論了將微分博弈理論應用于導彈制導的一般問題。他們指出,導彈的軌跡遵循比例導航(PN),這是歸航導彈通常使用的制導法。這些系統的性能是由線性系統二次性能指數(LQPI)來衡量的。在微分博弈論方面,他們通過用一組微分方程表示導彈的導航和軌跡來模擬導彈制導問題。這個問題的一般形式是
在這里,
:是玩家i w.r.t 玩家 j 的相對狀態
:是我輸入的玩家
:是玩家j的輸入
F:是狀態系數矩陣
G:是玩家輸入系數矩陣
Q:是當前相對狀態的性能指數 (PI) 權重矩陣
S:是最終相對狀態的 PI 權重矩陣
Ri,Rj:輸入的 PI 權重矩陣
Faruqi 主要專注于兩人和三人博弈,而效用函數是基于導彈和目標之間的相對距離向量建模的。Faruqi 表明博弈論可以有效地用于現代導彈中涉及 PN 的導彈制導任務。
另一方面,埃弗斯利用博弈論分析了對戰區彈道導彈(TBMs)的防御。彈道導彈和核技術的擴散對軍事沖突有著重要的影響,失敗的代價可能導致整個城市的毀滅。由于它們的射程很遠,威力很大,盡管其有效載荷可以有很大的變化,但很難確定其發射位置。在對抗這種威脅時,防衛國確實有一個優勢,那就是通常有一個很長的飛行軌跡,通常分為三個階段,在這期間可以對TBM進行攔截。推進階段標志著發射和TBM上升的大部分時間。助推階段的結束標志著燒毀,之后TBM進入中段階段。這個階段是飛行時間最長的階段,為防御者提供了攔截TBM的最佳機會。在中段階段之后,TBM進入了重返大氣層的終結階段。這是防御者攔截導彈的最后機會。飛行路線如下圖4所示:
圖 4. 戰區彈道導彈的飛行路徑
導彈在合理延長的飛行時間內行駛了很遠的距離。然而,從它的實際地理位置來看,防衛的軍隊或國家只能在飛行的終止階段運用其資源來防御它,在這個階段風險要高得多,失敗的代價也最大。出于這個原因,埃弗斯提出了一種合作戰略,即防守國與周圍的國家結成聯盟,以便它們也能在TBM前往撞擊地點的早期階段嘗試攔截它。因此,游戲被分為兩個小游戲:第一個是合作性的多人游戲,為國家聯盟設計一套戰略,以便在TBM的整個飛行路徑中使用;第二個是防衛國和潛在盟友之間的討價還價和合作游戲。
擊落TBM的合作游戲的基礎是一種叫做 "射擊-觀察-射擊 "的策略。它依賴于一組N個國家使用一組策略--他們的攔截導彈--來攻擊目標,每個導彈都有自己的攔截概率Pi。當TBM飛行時,N國中的每個國家都會發射其導彈Mn來攔截TBM,然后看看它是否成功地消除了威脅。如果它失敗了,下一個國家的導彈Mn+1將被發射。然后,博弈的問題就被簡化為優化整套策略的攔截概率,從而使其具有阻止TBM的可行可能性。博弈論在這里是有用的,因為合作博弈論的原則提供了一個強大的數學框架,通過這個框架可以為一組合作的國家達成一個均衡的解決方案。
埃弗斯描述的第二個游戲是基于與其他國家的談判,以形成一個聯盟。對于這些其他國家來說,參與這個游戲是一種風險,因為它使他們成為攻擊部隊的另一個潛在目標。為了解決這個游戲,防衛國必須準確評估攔截器的成本節約,也就是說,通過防止TBM的影響可以獲得多少收益。隨著這些節省的費用成為合作國家可以分享的盈余,潛在的盟友就如何分享這些節省的費用進行談判,與他們所能提供的攔截資源成正比。
Shinar和Shima繼續研究追擊-規避游戲和彈道導彈防御的零和游戲,即一個高度機動的彈道導彈避開攔截導彈。更具體地說,它在博弈中加入了一個不完美的信息元素,即彈道導彈知道自己正受到反導彈的攻擊,但對其彈道或發射位置知之甚少。在這個游戲中,兩個玩家是彈道導彈和攔截者。如果彈道導彈使用純粹的策略,它很可能會被擊中,因為它要么(a)不能對它所知甚少的對手做出足夠快的反應,要么(b)會以可預測的方式移動,并允許以直接的彈道走向碰撞。因此,彈道導彈的最佳博弈方案是在混合策略中。
混合策略將在其飛行模式中納入隨機性,為一組純策略分配一個概率分布。這些純策略將基于基本的導航啟發法,這些啟發法很可能是攔截器已知的或容易發現的。通過應用少量快速和隨機的策略切換,彈道導彈可以最大限度地發揮其避免攔截的潛力,并將時間計算的復雜性強加給攔截者。
Bogdanovic等人從博弈論的角度研究了一個多目標跟蹤的目標選擇問題。這是多功能雷達網絡中的一個重要問題,因為它需要同時執行多種功能,如體積監視和火力控制,同時有效地管理可用的雷達資源以實現指定的目標。因此,實際上,他們在[92]中處理了一個雷達資源管理問題,并使用非合作博弈論方法來尋找這個問題的最優解。他們在一個框架中制定了這個問題,每個雷達都被認為是自主的;沒有中央控制引擎來通知雷達它們的最佳策略,雷達之間也沒有任何交流。首先,他們考慮了所有雷達對目標有共同利益的情況,對于這個問題,他們提出了一種基于最佳響應動力學的分布式算法來尋找納什均衡點。然后,這個問題被擴展到雷達之間的異質利益和部分目標可觀察性的更現實的情況。對于這種情況,他們采用了相關均衡的解決概念,并提出了一種基于遺憾匹配的高效分布式算法,該算法被證明可以達到與計算量更大的集中式方法相當的性能。
最后,Parras等人研究了一個追求-逃避博弈,涉及無人駕駛飛行器(UAVs)的抗干擾策略。該博弈在一個連續的時間框架內運行,因此是動態的,在微分博弈論的幫助下被解決。在某種程度上是上述工作的高潮,它結合了通信優化、傳感器規避和導航的元素。鑒于無人機需要強大的通信來控制和傳遞信息,這種依賴性使得無人機非常容易受到干擾攻擊。有多種策略來干擾和反干擾這些通信,這可以被認為是一個零和游戲,無人機必須試圖優化其通信能力。通常情況下,干擾者的定位和移動是不確定的,所以這個游戲是一個不完全信息差分游戲。對無人機來說,最重要的回報是避免因干擾而失去通信,它可以通過操縱來對干擾劑的距離進行近似,從而避免它們。
博弈論涉及的國土安全的關鍵部分是網絡安全、模擬恐怖主義威脅和國防合同。隨著計算機科學的許多應用,博弈論很適合用于網絡安全問題。博弈論結合了計算機科學嚴格的數學嚴謹性,以及更多的心理學和哲學元素,如攻擊者的動機和心態,以及網絡安全中人的脆弱性。恐怖主義建模也同樣受益于博弈論的心理學色彩,因為恐怖活動的許多影響是不容易量化的,包括社會、經濟和其他受恐怖威脅影響的領域,所有這些都可以在博弈論的背景下建模。最后,博弈論適合于承包和分包這樣的課題,因為它能有效地捕捉到自私的個人之間的互動,這已經被用來模擬國防承包商的行為。
Litti的論文簡要介紹了傳統的網絡安全啟發式方法如何能更精確地更新,以及博弈論如何能幫助網絡安全工程師設計策略來正確預測、緩解和處理受到威脅的網絡。他開發了一種定性的方法來評估網絡攻擊的潛在風險和成本。雖然是一篇相當短的論文,但它確實提供了一些博弈論在實踐中的網絡安全情境案例。例如,他建立了一個雙人零和博弈的模型來代表攻擊者和安全系統。各個節點都有自己的相互依賴性、脆弱性和安全資產,但通過合作,將攻擊者破壞系統的可能性降到最低。
Jhawar等人提供了一種更具體的博弈論方法,即攻防樹(ADTs),來模擬涉及網絡安全威脅的場景。在這里,ADTs被用來在一個配備了自動防御協議的系統上繪制潛在的攻擊和防御場景。該系統需要全面解決所有可能的漏洞,并產生適應網絡安全攻擊的積極演變情況的反應。目前,ADTs只提供前期的系統分析。擁有一個反應式的網絡安全策略是很重要的,因為攻擊者會不斷改變他們的攻擊策略來進行進攻,所以實時反應的時間可以使系統的防御成功和失敗之間產生差異。在Jhawar等人的文章中,他們建立了一個攻擊者和防御者的簡單游戲模型--黑客和安全網絡管理員。黑客試圖破壞系統的完整性,對于他們的每一步行動,管理員都會根據攻擊者的嘗試設計一個反應性的策略。這種方法最大的效用來自于將長的廣泛形式的游戲轉換為圖形布局的能力,以便于理解和交流。
岡薩雷斯清楚地概述了一個標準的攻守雙方的競爭游戲,然后利用基于實例的學習理論和行為博弈理論。前者將認知信息編譯成一種被稱為實例的表示。每個實例都有一個由情況、決定和效用三部分組成的結構--標準的游戲。然而,這種方法的關鍵是實例之間的互動。基于實例的學習理論利用每個實例的學習結果反饋到下一個實例的情況,希望能在以后的迭代中做出更好的決定。這明顯類似于機器學習中的強化學習技術。另一方面,行為博弈論涉及到設計一種策略,我們評估各種因素,對目標和資源進行更精確的長期評估,使效用分數更接近于反映現實生活的價值。再次,博弈論促進了網絡安全應用中社會信息的獲取,并評估了這將如何影響游戲中雙方的行為。其他關鍵因素包括玩家的動機因素,每個玩家的信息完整性,以及玩家和技術之間的技術限制和低效率。岡薩雷斯強調,在任何網絡安全模型中容納這些因素的重要性將有助于為網絡防御制定更現實和有用的政策。
網絡安全的一個常見用途是用于預防恐怖主義。Hausken等人用一些指導性的博弈論原則涵蓋了恐怖主義和自然災害的建模。恐怖主義和自然災害是通過用反恐怖主義、反災害和反所有災害的投資來進行防御。對這些事件發生的可能性進行預測,防御者必須對每項防御的投資額做出戰略決策。在這些情況的效用函數中需要考慮的成本包括恐怖分子的情報或自然災害的隨機性/環境控制;攻擊/災害的強度,以及恐怖分子和防御者之間對目標價值評估的差異。本分析中使用的博弈論方法抓住了防御者在打擊每個威脅時的努力。根據每個事件的可能性,結合每個防御系統的成本,防御者可以得出資金的最佳分配方案。
Kanturska等人提出了一個嚴格的檢查,即當不同地點的攻擊概率未知時,如何使用博弈論評估運輸網絡的可靠性。該方法傾向于使用最小化算法在多條路徑上分配風險,只要旅行成本相對于攻擊造成的潛在損失較小。這對于評估安全護送貴賓穿越城市的潛在風險很有用。博弈論在這種情況下很有幫助,因為它可以分析攻擊概率未知時的網絡可靠性。
Bier提出了基于博弈論的有用建議,用于政策見解和投資決策、保險單的保費等等。她的工作討論了最弱環節模型:一種將所有資源集中在防止最壞效用情況的策略。這在實踐中通常并不理想,她反而建議考慮用各種防御戰略來對沖這些投資,針對不同的潛在目標。本文考慮了恐怖分子/防御者的博弈,以及安全投資如何改變整個社區的攻擊者-防御者互動的景觀。這主要是通過其自身的范圍研究來完成的,其中一個關鍵的收獲是,恐怖主義緩解系統可以從博弈論中受益,因為它增加了一個額外的考慮,即恐怖分子對任何防御機制的反應。因此,博弈論與對所有系統進行風險和可靠性分析的整體方法相結合,可以對反恐戰略中的所有潛在風險和漏洞進行更全面的評估。
Cioaca研究的問題與前面提到的Bier等人的問題類似,但特別關注航空安全問題。該問題的總結是針對機場安全措施的成本和維持一個穩定而有彈性的防御系統的成本。關鍵的策略是:完全防止攻擊或威脅(通過取消對目標地點的所有訪問或限制航空公司的權限,如果他們沒有遵守規定的準則);管理攻擊的時間維度(攻擊的長度和隨后的恢復時間);了解所有直接和間接的損失(包括傷亡和相關的損害,如污染或感染,受損的二級安全措施,或聲譽/信號的影響);以及緩解、響應和恢復的成本。
該模型是圍繞幾個因素和參數建立的。首先也是最關鍵的是人員損失和物質損失。 H 指人員損失,D 指物質損失,
指分配給相關安全系統的預算。攻擊中最明顯和最直接的損失,這兩種損失在這種攻擊中是非常負面的回報,并且通常比任何防止它們的成本都要高。人員損失 H 難以用數值量化,因此在對資源劃分進行適當評估時,了解如何在不同人群和不同維度上最小化人員損失是該問題最困難的方面之一。物質損失 D 可以用貨幣量化,但這種損害的連續影響通常是造成重大損失的地方。這些損失可能導致基礎設施全面關閉、設施停止運轉、工人失業,甚至可能導致設施的緩慢衰退和完全關閉。這場比賽的第二個主要因素是分配給安全系統的預算
。組織和管理機構將只有一定數量的資源分配給安全系統 T。下一個因素是安全系統組件的數量,因為這將是預算的組成方式。這些組件中的每一個都被劃分為 n 個單獨的系統子組件之一。這些組件被劃分為多個目標
,并且這些目標中的每一個都被分配了一個被攻擊的概率
和一個值
。這可以正式表示為:
對于任何資源劃分系統,Ciaoca 主張建立衡量系統彈性的維度。這分為靜態彈性,資源的有效分配;動態彈性,沖擊后系統的恢復速度,包括長期投資流入。這兩種形式的彈性表示攻擊之前、期間和之后的系統強度。在博弈論方面,Ciaoca 的研究清晰地定義了一個博弈,并結合了無數復雜且相互關聯的參數,勾勒出一個有效且可計算的博弈模型。
我們討論的關于國家安全的最后一篇論文是由 Gardener 和 Moffat撰寫的。本文涵蓋了制定戰略以評估國防承包商及其履行合同義務的潛在績效/能力的概念。用博弈論的說法,這個問題可以用合作和背叛來表達。加德納和莫法特提出了量化方法,國防部可以通過這些方法更嚴格地評估合同和招標方案,從而明智地選擇承包商并保護他們的預算。Gardener 和 Moffat 進一步了解了國防采購項目不同招標階段項目管理的變更要求。他們關注的因素是樂觀的陰謀,由于對項目進度的不合理預期,項目逐漸失控——超過了預算限制和必要的最后期限。通常,這種“陰謀”是為了獲得短期收益,實際上會導致整體損失。所玩的投標博弈不再是關于項目的成功,而更多地是關于利潤資本化,并可能進一步退化為相關國防部與整個承包商行業對抗的兩人博弈。
一些論文在防御環境中使用博弈論,但不能輕易歸類為上述任何類型,或者它們與混合戰有關。例如,Zhang和Meherjerdi研究如何在不同的通信框架中使用博弈論方法來使用和控制多組無人駕駛車輛。將單個無人駕駛車輛的任務分配給多個無人駕駛車輛會產生更有效的任務分配和性能。將勞動力從一輛強大的單一車輛分離到幾輛較小的車輛提供了靈活性、適應性和改進的容錯能力。這種網絡的用途是監視、探索、衛星集群、結合無人駕駛水下航行器 (UUV) 和潛艇、飛機和無人駕駛飛行器 (UAV) 以及協作機器人偵察。從這個列表中可以明顯看出,該策略非常強大,因為它能夠跨多個域組合資源。
同樣,可以注意到,搜索是一種“捉迷藏”游戲,在軍事應用中有著悠久的歷史。該理論是由 Koopman率先在軍事背景下(尋找逃跑目標)提出的,隨后由 Stone 等人的開發,應用包括潛艇狩獵、探雷、救援行動、第一響應者的風險以及危險源的定位。該框架提供了最優的先驗給定檢測模型、目標運動和搜索成本的搜索計劃。搜索成本可能包括搜索時間、逃生概率(對于目標)、暴露風險(對于搜索者)、信息熵或態勢感知(目標位置概率圖)。搜索器可以是移動平臺(UAV、UUV、巡邏艇、直升機、機器人、人),目標可以是靜態的、可移動的、盲目的、無聲的或發射的。在這種情況下,經常使用同時定位和映射(SLAM)算法。這一利基市場的新研究方向(受一些生物學應用的啟發)采用了信息趨向的思想,或基于從環境中提取的信息(熵)增益(零星測量、禁區、搜索者之間的通信)實時控制搜索者的移動。博弈論的原理可以應用在可以建模為“捉迷藏”游戲的環境中。
在上一節中,很明顯,許多論文在多個領域都有適用性,并且使用了無數類型的博弈并為一系列玩家建模。因此,必須以有原則的方式對已審查的論文進行分類。為此,我們使用第 2 節表 1中已經介紹的分類方案。
特別是,可以根據 (1) 戰爭的領域或類型 (2) 論文中使用的一種或多種博弈類型,以及 (3) 論文中建模的玩家的性質對所審查的論文進行分類。該領域可以大致分為傳統(T)或現代(M),更具體地說,可以分為陸戰、海戰、空戰、網絡戰和太空戰。根據博弈是非合作的還是合作的、順序的還是同時的、離散的還是連續的、零和還是非零和,所使用的博弈類型也可以有一個復雜的分類。最后,博弈可以是兩人、三人或多人(多于三人)博弈。所有這些都在表 1中進行了簡要介紹。
在表2中,我們提供了基于上述分類方案的所有評論論文的不言自明、詳盡的分類。
表2.使用表 1 對國防博弈論應用領域的論文進行分類。此處描述的共有 29 篇論文被分類。
我們現在考慮的問題是,在這些論文中,哪些論文引起了研究界的最大興趣,或者導致了后續或相關工作的開展。衡量這種影響的一個通常使用的指標是引文數,雖然這個指標顯然偏向于早期的論文。盡管如此,在表3中,我們展示了所考慮的 29 篇論文的 Google Scholar 引用數。哪些論文被引用次數最多,讀者不言而喻,我們不再贅述。然而,我們強調,引用次數并不是衡量影響力的唯一指標,也不一定是衡量一篇論文在研究領域的影響力的最有效方法。但是,它是一個現成的衡量標準,可以傳達有用的信息。
表3. 已審查論文的 Google Scholar 引用數。谷歌學術引文數據于 2021 年 12 月 18 日訪問。
表3還顯示了每篇論文的原籍國,其定義是出現在相應作者的第一署名中的國家。可以看出,這些論文是由來自美國、英國、澳大利亞、中國、荷蘭、加拿大、以色列、印度、德國、西班牙和羅馬尼亞的研究人員撰寫的。看來,美國、歐洲(尤其是西歐)和中國對在國防科學中應用博弈論有主要興趣,同時我們承認,可能有幾篇用英語以外的語言撰寫的論文,我們沒有考慮。
為了了解在上述分類中描述的不同領域之間是否存在充分的思想交流,我們考慮了在29篇評審論文中,有多少論文引用了同一組的其他論文。表4列出了根據谷歌學術的引用情況。令人驚訝的是,沒有一篇論文被其他被審查的論文引用兩次以上,而且大多數論文根本沒有被這組論文中的其他論文引用。盡管這組論文的總體引用次數是健康的--根據表3,被審閱的論文平均被引用34.97次,而且有幾篇論文被引用超過50次。然而,這些引用大多來自與國防科技有關的論文,這些論文使用各種方法和工具來解決類似的問題,顯然,在國防應用中使用博弈論的研究人員之間幾乎沒有交叉交流。因此,除了我們在下面介紹的文獻中的 "空白 "表明了潛在的研究機會外,還應該強調的是,應該提高對該領域類似工作的認識,這將可能導致在某一特定領域產生的想法被重新用于其他領域和與國防有關的其他應用。
表4. 根據谷歌學術,審閱過的論文中的引用情況。谷歌學術的引用數據是在2021年12月18日訪問的。從該表可以看出,在該領域中相互引用對方的工作是極其罕見的。
審查的論文表明,博弈論可以提供一個統一的框架來分析代理在防御環境中的決策行為。在本節中,我們將簡要討論迄今為止尚未應用博弈論但如果在未來應用將做出有用貢獻的一系列潛在防御場景。
國防高級研究計劃局(DARPA)最近對 "馬賽克戰爭 "的調查就是博弈論未來潛在應用的一個例子。這個想法是在操作多個無人駕駛飛行器的背景下被提到的,并建議在一個'馬賽克'網絡中擁有許多較小的具有成本效益的資源相互連接,這樣,如果幾個單位被摧毀,網絡的整體完整性仍然存在,就像馬賽克即使被移除幾塊瓷磚也能保持其圖像。我們的目標是,這樣一個具有不同能力的龐大資源陣列將能夠以其完整性和復雜性壓倒敵人。它利用并發性的原則來解決由數百萬個傳感器和執行器組成的系統中錯綜復雜的連接問題。這些系統又必須處理系統間的通信。如果成功實施,這樣一個系統的系統可以為軍事戰略家提供一個壓倒性的強大的武器裝備和資源網絡,它可以憑借其動態的規模和復雜性擊敗對手。這種將軍火庫的不同部分結合在一起的方法使每個部分的利益最大化,并重新引入了對資源消耗性的關注,而不是專注于幾件高價值的武器裝備。這反過來又為戰略建立了彈性和適應性,擺脫了重量級的、單一重點的攻擊方法。由于有大量成本較低的資源需要合作以獲得最佳結果,這種情況在一個層面上可以被模擬成多人合作游戲,而與對手的爭斗可以被模擬成多人非合作游戲。可以注意到,"馬賽克戰爭 "的概念本質上類似于更普遍的基于代理人的建模概念,它已經被用于幾個不同的背景,從無齡航空器設計到傳染病動態建模,博弈論已經在其中一些背景下成功使用。
在海戰的背景下,博弈論可以卓有成效地應用的另一個領域是海軍的易損性。在分析海軍的易感性時,海軍艦艇要考慮其環境、運動模式和潛在的對手傳感器,以計算其在秘密移動時被發現的風險。這樣的應用與國防科學中通常研究的跟蹤問題有重疊之處,正如顧氏所解釋的,它描述了使用傳感器網絡的跟蹤。如前所述,這種情況可以被建模為一個雙人非合作性差分博弈,而探測是每個參與者的主要回報參數。
事實上,地基跟蹤問題也可以從博弈論的應用中受益,而到目前為止,這一領域的論文還很少。地面追蹤問題既可能出現在地面軍事應用中(這里歸類為陸戰),也可能出現在國內安全和反恐應用中(這里歸類為國家安全應用),其中安全機構在整個社會中追蹤個人行動的能力--包括他們的位置、社會網絡和動機--是一種關鍵能力。后一種情況可以被模擬為追擊和躲避的雙人游戲,或者也許只是追擊和偵察,目的是不向目標透露追擊的情況,而目標將試圖識別追擊。在這種情況下,從秘密跟蹤中獲得的預測性信息量將是回報。 賽博戰建模是博弈論可以應用的另一個領域,同樣,正如前面相關部分所述,除了主要來自計算機科學領域的論文之外,很少有論文涉及這一領域網絡安全。Kim等人[124] 描述了所有軍事行動不可或缺的網絡戰場景,并強調了物聯網 (IoT) 和腦機接口等新技術范式所發揮的關鍵作用。防御專家越來越需要預測和先發制敵的網絡戰策略。使用新穎的技術接口對涉及網絡戰場景的決策制定進行建模是博弈論可以發揮重要作用的領域。
如上所述,根據表 4 ,在所呈現的文獻中,似乎很少有交叉、思想交流,甚至對其他類似作品的認識,也可能被認為是一個“空白” 。因此,在國防應用中使用博弈論的研究人員之間加強合作是可取的,這將使博弈論方法在多個戰爭領域的重用。
這里有必要討論一下,除了總結現狀和確定文獻中的差距之外,像這樣的評論如何為該領域增加價值。我們注意到,在選定的論文集中,從一篇論文到另一篇論文的引用很少。雖然很難說出其中的原因,但可以看到大多數研究都集中在特定的戰爭領域,如陸戰、海戰或空戰,并試圖解決特定戰爭領域的具體問題。因此,專注于不同戰爭領域的論文不一定被認為是另一篇在國防背景下應用博弈論的論文,而是屬于不同戰爭領域的論文,因此沒有被關注。然而很明顯,這樣的方法可能會導致錯失機會,因為往往沒有考慮到同一套博弈論工具還可以在哪里得到類似的應用。像這樣的一篇評論文章將在一定程度上糾正這個問題。此外,我們可以看到,報酬函數的定義往往是僵化和狹隘的,是基于傳統上被認為是某一類型戰爭的重要參數。例如,陸地戰爭的重點是盡量減少傷亡,而國家安全應用的重點是提高公眾信心。然而,在大多數類型的戰爭中,有一系列的因素促成了最終的回報,從傷亡和軍事資產的損失到公眾信心、間接經濟成本、機會成本、盟國的成本以及政治和戰略考慮。這篇評論文章通過對幾個戰爭領域的報酬結構的廣泛概述,可能會刺激在每個使用博弈論的戰爭領域建立更全面的報酬函數模型。此外,從一般意義上講,這篇評論將有助于強調與國防有關的決策是一個有條不紊的理性過程,可以進行結構化分析,而不是像過去國防界某些部門所認為的那樣是一個直觀的過程[125]。同時,所提出的分析將有助于避免一方面的微觀管理和另一方面的沖動決策[126],而不是鼓勵國防應用中的量化決策過程。
特別是,在作戰和戰術決策過程之外,所提出的評論還具有管理和社會意義。
博弈論的應用對一個國家的國防力量非常有用,不僅在戰術和作戰方面,而且在和平時期的國防資產的戰略管理方面也是如此。例如,出于威懾和作戰準備的目的,軍事資源的戰略布局,如戰艦、潛艇和戰斗機,可以被視為一個合作博弈,或者相當于一個優化問題,可以通過線性編程或非線性編程來解決。同樣,關于戰略軍事設施,如基地、簡易機場、港口,甚至公路和鐵路[127,128]的安置和建設的決策,也可以通過使用合作博弈論對相關情景進行建模來幫助。另一個可以應用博弈論的管理決策過程是后備軍事人員的管理,包括何時征召后備人員。因此,博弈論不僅對做出作戰決策的軍事人員有用,而且對必須做出國防相關決策(包括在和平時期)的文職管理人員和政治家也有用,因為這些決策可能會產生長期的影響。
在國防場景中應用博弈論的社會效益主要來自國家安全的觀點。公眾對國土安全的看法是國防考慮的一個重要部分,對國防開支有相當大的影響。國防和執法部門的決策者在做出國防開支決策時,不僅需要考慮實際的風險和威脅,還需要考慮感知的風險,以及受其影響的因素,如保險費用、對旅游業的影響、信用評級機構的評級、投資者對一個國家的投資意愿、安全措施的實際和感知成本等等。博弈論可以成為一個非常有用的工具,用來模擬這樣一套復雜的因素和參數,以及不同情況下產生的整體回報。反過來說,這種決定一旦做出,顯然會影響國家安全,并反過來影響公眾對國家安全的信心和看法。因此,對風險的感知和國家安全的支出相互影響,博弈論所提供的工具集對于模擬這樣一個復雜的反饋回路非常有用。顯然,公眾的情緒和對事件的看法在戰時情景下也很重要,在戰爭的各個領域做出的決定都會影響公眾的看法,這反過來可能會影響沖突的軌跡。因此,博弈論在國防場景中的應用具有明顯的社會意義。
同樣重要的是,本評論增加了新的見解,對理解指揮和控制戰爭很有幫助。其中一個見解是,智能代理之間的合作和敵對競爭并不像它們乍看起來那么根本不同:事實上,在某種意義上,它們都可以用同一個框架(博弈論)來表示,并且都涉及一些智能參與者、戰略和回報。不同的是,敵對的競爭由非合作博弈論表示,其中一個玩家的報酬增加往往導致另一個玩家的損失(零和博弈是這種情況的一個特例)。另一方面,合作是由合作博弈論來代表的,在這里我們對聯盟進行建模,有時還討論 "公共利益 "的概念。當一個敵對的玩家有可能變成盟友或反之亦然時,這樣的洞察力特別有用。另一個見解是,將防御場景作為游戲來建模的主要困難不是來自于確定可能的戰略或參與者,而是來自于量化的回報。很多時候,我們審查過的論文在量化回報時做了一些假設、簡化和估計,可以設想,這些過程引入的累積錯誤可能已經嚴重改變了游戲的結果,從而使建模變得無效。因此,許多論文在應用博弈論時面臨的主要挑戰是如何準確或合理地模擬報酬。除非像我們在這里所做的那樣,對博弈論的幾個防御性應用進行廣泛的回顧,否則無法獲得這樣的見解,而這些見解對于塑造該領域未來的研究方向非常重要。
博弈論已被證明是一種通用且強大的工具,可用于深入了解許多領域的智能體和參與者的決策過程。在這篇評論文章中,我們詳細闡述了博弈論可以應用于國防科學技術的幾種場景,并簡要回顧了該方向的現有研究。我們根據所研究的戰爭類型、使用的博弈類型和玩家的性質,對 29 篇評論論文進行了廣泛的分類。基于所做的觀察,我們確定了文獻中的空白,即博弈論迄今尚未被廣泛運用,但在未來有很大的潛力被富有成效地運用;我們還討論了博弈論的國防應用在未來可能擴展的方向。
基于領域的分類是采用的主要分類模式,在此背景下,我們將審查的論文分為陸地、空中、海洋、網絡和空間領域。我們還考慮了主要與跟蹤和國家安全有關的論文。對于所考慮的每篇論文,都定義了參與者的數量和角色以及博弈類型,并在可能的情況下討論了策略和收益函數。這項工作的目的是確定最常分析的領域以及經常使用的博弈類型,并利用這些知識來確定文獻中的差距,在國防背景下的各個領域和戰爭類型中相互交流意見。
希望這次審查能產生幾個積極的結果。我們發現了文獻中的空白,并指出博弈論提供的工具集在分析某些戰爭模式時并未得到充分利用。例如,我們指出,使用博弈論分析的海戰論文相對較少。我們還注意到,可以通過應用博弈論來分析新興的戰爭模式,例如馬賽克戰。因此,本次審查可能會導致更多的博弈論方法來模擬這種戰爭模式。此外,我們強調了該領域內的引文網絡非常稀疏:也就是說,在國防應用中使用博弈論的各種研究人員之間的思想交流是很少見的。這篇綜述可能會成為該領域研究者之間合作和相互交流的催化劑。然而,最重要的是,這篇評論旨在向迄今為止尚未使用博弈論的國防科學家強調博弈論在國防應用中的效用,因此將為國防科學家引入一套新的工具,他們可以將其應用于他們的研究.
隨著世界應對和平與穩定面臨的新挑戰,人類的未來取決于我們和平解決問題的能力。雖然這是一個崇高的目標,但權力的投射絕對比實際的武裝沖突要好,后者在許多層面上都會付出很高的代價,博弈論確實可以在決定一些可能發生的“軟沖突”中發揮作用在未來幾年和幾十年里。隨著未來幾年對國防戰略和能力的關注可能會增加,博弈論可以作為一種額外的工具,國防科學家可以在許多抽象層次上使用它來解決部署、感知、跟蹤和資源分配問題。
這項研究是由澳大利亞國防科學技術集團資助的。
略