一個信任模型IMPACTS(意圖、可測量性、性能、適應性、溝通、透明度和安全性)已被概念化,以建立人類對自主系統的信任。一個系統必須表現出這七個關鍵特征,以獲得并保持人類伙伴的信任,形成一個有效的合作團隊,實現共同目標。IMPACTS模型指導設計了一個智能自適應性決策輔助工具,用于人與自主系統互動背景下的動態目標接觸過程。參加控制多個無人資產大規模演習的主題專家的積極反饋表明了該決策輔助工具的有效性。它還證明了IMPACTS模型作為一種設計原則在人機交互團隊之間實現信任的效用。
2021年4月13-15日,北約系統分析研究-151(SAS-151)工作組在陸基場景中基于兵棋推演了中間部隊能力(IFC)。IFC為任務規劃者和作戰者提供了在政治不順利的情況下,在無所作為和使用致命武力之間的響應能力。雖然IFC在概念上類似于非致命性武器(NLW),但它們實際上是在更廣泛的戰略和理論背景下進行的。它們旨在實現有效的升級/降級控制,并在戰術/戰役層面產生最大的影響。
這次推演特別重要,它是SAS-151用來評估IFC對影響任務成功的一系列推演中的第二次。第一次推演涉及北約海軍特遣部隊在一個封閉和有爭議的水道中受到的威脅,并模擬了IFC在海上特遣部隊行動中的使用。本次兵棋推演以海上兵棋推演的成功為基礎,探討中間部隊能力是否可以促進北約特遣部隊指揮官在陸基情景中應對復雜混合威脅的能力。
兵棋推演所使用的場景被設定為北約特遣部隊位于一個負責培訓安全部隊的東道國。四支隊伍(紅色紫色 Vs 藍色綠色盟友)在戰術層面進行兵棋推演。所考慮的戰術情況是藍(北約)/綠(東道國)聯合護行車隊的行動,涉及到敵對叛亂部隊在一個集市上的秘密伏擊,以及當地部隊阻止市民進出綠/藍聯合基地(見圖1)。
圖1.部隊、基地和集市的初始地理分布情況
在這個場景中,紅軍和紫軍使用了各種非常有能力的欺騙和秘密/灰色地帶戰術來阻礙和破壞北約特遣部隊的直升機、基地和車隊行動。這些能力和戰術使叛亂武裝具有明顯的優勢,被用于挑戰北約特遣部隊指揮官的決策。
兵棋推演還考慮了反人員(有目標的個人和人群)和反物資(主要是反無人機系統(c-UAS)和射頻(RF)車輛攔截器)的能力,評估了它們對實現戰術目標的能力影響,同時不影響作戰和戰略目標。
4月13-15日的兵棋最初是作為桌面兵棋進行的。然而,由于各國政府為應對冠狀病毒-19(COVID-19)而實施的旅行限制,決定使用WebexTM視頻和GoogleTM文檔/幻燈片(GoogleTM文檔用于團隊文本聊天,GoogleTM幻燈片用于地圖和游戲,并使用演講者筆記捕捉玩家的動作)的組合來設計和執行虛擬在線兵棋。利用這種虛擬環境,在4月13-15日期間進行了兩次陸上兵棋推演,并考慮了兩種IFC能力選項:選項A基準(無IFC)和選項B近未來IFC(預計未來五年的技術)。
第一場兵棋推演以方案A為基準,北約特遣部隊沒有任何IFC,只有一些傳統的NLW,如CS氣體(催淚瓦斯)和FN-303低致命性壓縮空氣防暴槍。
這些系統包括:主動拒絕系統(ADS);射頻車輛攔截器;手持式和安裝式無人機系統;增強型通用遙控武器(CROW)站(包括:激光炫目器、聲學呼救裝置和亮白燈);以及安裝式遠程聲學裝置(LRAD)。 這些IFC能力不僅可以用來騷擾和警告,還可以在對峙距離內攔截和削弱潛在的威脅。預計這將使北約部隊有更多的選擇來控制(升級/降級)局勢并控制戰略主動權。
總體而言,與海上兵棋推演一致,在使用和不使用 IFC 時,博弈動態存在明顯差異。兵棋推演系列的結果表明,IFC對戰術層面的游戲以及戰略層面的結果都有影響。在兵棋推演期間進行觀察的具體領域包括:升級控制;戰術決策的時間和空間;系統移動性;傳統的 NLW;獲得戰略主動權。
然而,有了IFC,藍軍有能力挑戰紅軍和紫軍造成的戰術困境(即,什么都不做或使用致命武力)。藍軍能夠校準其武力的使用,從而能夠控制事件的升級/降級。
有了更多的決策時間和空間,戰術指揮官就有了關鍵的決策時間和空間來選擇行動方案,以減少附帶損害和平民傷亡。IFC還創造了一種情況,即藍方可以壓制(通常用激光炫目器)紅方的行動,和/或隔離并識別紅方目標,以便進一步進行致命的交戰。
移動和分布式的IFC系統,如ADS(游戲中最通用和最有效的IFC系統),可以消除在幾次藍軍-紅軍交戰中使用致命武力的需要。消除或減少使用致命武力的需要可以減輕武力升級和平民傷亡事件,這兩種情況對特遣部隊在游戲中的努力非常不利。
遺留的無法律約束力武器難題:據觀察,遺留的無法律約束力武器和低致命性武器(如CS氣體)在兵棋推演中表現不佳。除了有限的人群控制做法外,它們的使用對實現控制升級和減少使用武力的總體任務目標沒有什么幫助(CS氣體尤其如此)。
IFC和戰略舉措:IFC的存在使北約和東道國部隊能夠壓制/削弱紅軍的行動,并在較小的即時/保守壓力下有選擇地使用武力。因此,對手在將無害的事件轉化為深刻和重要的信息戰方面不太成功。
綜上所述,北約部隊能夠在戰術層面上將主動權轉移到他們身上。IFC的存在為北約特遣部隊指揮官提供了更多的時間和空間來做出決策。有效使用IFC挑戰了對手的規劃,并減輕了武力事件的升級,特別是那些涉及附帶損害和平民傷亡的事件。
在這樣的環境中,對手(包括國家和非國家)將試圖利用戰爭與和平之間的作戰空間,并通過試圖將交戰保持在常規沖突的門檻以下來模糊軍事和非軍事行動之間的界限,在無所作為或使用致命武力之間有一類反應選擇是可取的。這一點更加重要,因為目前的應對方案在政治上可能不討人喜歡,使對手能夠掌握主動權并保持道德高地。
然而,正如SAS-151系列兵棋推演所顯示的那樣,發展使盟軍和聯軍(以及加拿大軍隊)能夠在沒有武裝對抗的情況下應對復雜的混合威脅的能力正變得越來越重要和必要。
展望未來,SAS-151系列兵棋推演的結果將被用來為北約IFC概念的發展提供信息,這是盟軍司令部轉型的一項優先概念發展活動。最重要的是,兵棋推演的結果將為未來的IFC兵棋迭代提供信息,其中已經計劃進行綜合建模和模擬,以幫助驗證IFC在復雜的多領域環境中的效果和概念。預計聯合作戰場景(已經開發)將被用于概念的完善和驗證,同時可以幫助驗證IFC在其他領域的有效性,如網絡和電子戰在多個領域。
Kyle D.Christensen是加拿大渥太華加拿大國防研究發展部作戰研究和分析中心(DRDC CORA)的戰略分析員,他目前為加拿大聯合行動司令部(CJOC)提供戰略分析建議。他以前的研究崗位包括葡萄牙里斯本的北約聯合分析和經驗教訓中心(JALLC)、加拿大渥太華加拿大聯合戰爭中心(CIWC)以及加拿大渥太華國防總部的海洋戰略局(DMS)。
這張照片被認為是公共領域,并已被批準發布。聯合非致命武器局(JNLWD)的主動拒絕系統(ADS)在進行反人員演示前被擺放好。圖片來源:Andrew Huff 來源:美國國防部聯合中級部隊能力辦公室(JIFCO),非致命性武器項目 //inlwp.defense.gov/Press-Room/Multimedia/Images/igphoto/2001730427/
這張照片被認為是公共領域的,并已被批準發布。長距離眼球干擾器(LROI)"激光炫目器 "在3000米的距離上提供警告效果,在2000米的距離上增加輻照度,以提供對目標的視覺壓制。圖片來源:Todd Getz 來源:美國國防部聯合中級部隊能力辦公室(JIFCO),非致命性武器項目
這張照片被認為是公共領域,已被批準發布。長距離眼球干擾器(LROI)"激光炫目器 "在3000米的距離上產生警告效果,在2000米的距離上增加輻照度,對目標進行視覺抑制。圖片來源:Todd Getz 來源:美國國防部聯合中級部隊能力辦公室(JIFCO),非致命性武器項目
這張照片被認為是公共領域,已被批準發布。聲呼裝置(AHD)將可理解的語音投射到更遠的距離。除了為警告或指導目的遠距離投射語音外,該裝置還能夠發射響亮的音調,以分散或阻止人員接近位置或船只。資料來源:美國國防部聯合中級部隊能力辦公室(JIFCO),非致命性武器計劃
軍事防御現代化規劃通常涉及復雜的系統,必須了解這些系統,以便為設計、規劃、實施和采購決策提供信息。為了獲得對系統的基本了解并確定關鍵的初始參數,仿真實驗可以用來在一個大型參數空間內有效地生成數據。雖然機器學習模型可用于模擬后的分析,以確定關鍵參數,但當目的是為決策者提供支持時,其可解釋性和黑盒性質會帶來挑戰。在本文中,應用了一種可解釋機器學習預測的模型診斷方法,稱為沙普利加和解釋(SHapley Additive exPlanations,SHAP),用于從基于Agent的模擬中獲得數據,該模擬是一個軍事作戰場景。該場景是由加拿大陸軍對其情報、監視和偵察資產進行現代化的舉措所激發的,并對其進行了抽象化,以盡量減少建模系統的復雜性并驗證SHAP的結論。
關鍵詞:基于Agent的仿真,數據耕耘,可解釋機器學習。
軍事防御現代化計劃通常涉及復雜的系統,必須了解這些系統,以便為設計、規劃、實施和采購決策提供信息--這些決策通常與數百萬到數十億美元的預算相聯系。例如,加拿大政府為實現加拿大武裝部隊(CAF)和國防部的密碼能力現代化,撥款范圍在2000萬到4900萬美元之間,為實現CAF輕型和重型后勤車輛能力的現代化,撥款范圍在10億到49.9億美元之間(加拿大政府2020)。
仿真實驗可以幫助對系統的基本了解,找到穩健的決策或方案,并比較不同決策或方案的優劣(Kleijnen等人,2005)。數據耕耘是指利用仿真實驗在一個大的參數空間內有效地增長數據,以支持決策。它是一個跨學科的協作過程,使用快速原型設計、仿真建模、實驗設計、高性能計算以及數據分析和可視化;詳細概述見Horne等人(2014)。數據耕耘過程可以幫助操作仿真模型,學習仿真模型的行為,并確定關鍵信息,包括輸入和輸出之間的因果關系(Sanchez 2015)。實驗設計應該是靈活的,以考慮不同的元模型、數據挖掘和圖形分析技術,因為通常一種單一的方法將不適合全面評估模擬輸出(Sanchez 2015)。
數據耕耘過程最早在20世紀90年代末提出(Horne 1999),此后被應用于海洋領域(Cheang 2016, Dobias and Eisler 2017, Morgan et al. 2018, Kesler 2019)、陸地領域(Kallfass and Schlaak 2012)、網絡領域(Horne and Robinson 2016)和多領域(Huber and Kallfass 2015, Gordon 2019)等各種軍事應用。數據耕耘已被用于研究各種類型的軍事行動,包括戰斗(Kallfass和Schlaak 2012)、人群控制(Kryza等人2012)、傷員疏散(Featherstone 2009)、空襲(Huber和Kallfass 2015)和國土安全,如關鍵基礎設施的保護行動、海洋環境中部隊保護的非致命武器選擇,以及城市恐怖襲擊的應急響應(Lucas等人2007)。
數據耕耘的挑戰之一是模擬后的分析和可視化。這一步的重點是突出有用的信息,提取結論,并支持決策,這需要高度有效的分析技術,以充分利用可能產生的大量數據(Horne等人,2014)。鑒于機器學習模型處理和評估大數據的能力,它們很適合這項任務。然而,許多機器學習模型的黑箱性質可能具有挑戰性,因為主要目標不是預測而是理解模擬。在以前的數據耕耘的軍事應用中,模擬后的分析往往側重于描述性統計(Huber和Kallfass 2015,Horne和Robinson 2016,Dobias和Eisler 2017)或描述性統計和可解釋性模型的組合,如逐步回歸和分區樹(Featherstone 2009,Kallfass和Schlaak 2012,Cheang 2016,Gordon 2019,Kesler 2019)。
與可解釋的模型相比,在黑箱模型中,如神經網絡或隨機森林,不可能直接有意義地檢查其組成部分并獲得洞察力(Ribeiro, Singh, and Guestrin 2016)。然而,這些更復雜的黑箱模型可以實現更高的預測準確性,在可解釋性和準確性之間形成了一種權衡(Lundberg和Lee 2017)。為了應對這種權衡,已經開發了模型診斷方法來解釋任何機器學習模型的預測。在最近的一個數據耕耘的軍事應用中,Amyot-Bourgeois、Serré和Dobias(2021年)對隨機森林模型的輸出應用了互換特征重要性,這是一種模型無關的方法。特征重要性措施表明每個特征,或數據耕耘背景下的模擬參數,在預測感興趣的結果方面的有用程度。識別重要參數有助于簡化決策過程,但除非能夠理解重要參數和感興趣的結果之間的關系,否則價值有限。SHapley Additive exPlanations(SHAP)提供了一種替代包絡特征重要性的方法,也可用于研究特征的價值與對感興趣的結果的影響之間的關系(Molnar 2021)。根植于博弈論的Shapley值,SHAP的計算要求是NP-Hard;然而,基于樹的機器學習模型有一個低階多項式時間算法,也可用于研究特征的相互作用(Lundberg等人,2020)。
本文擴展了Amyot-Bourgeois、Serré和Dobias(2021)的工作,將SHAP作為模擬后分析的一部分,以評估它是否能對一個模擬的軍事作戰場景提供有意義的解釋。在加拿大陸軍(CA)對其情報、監視和偵察(ISR)資產進行現代化的倡議的激勵下,模擬場景也對ISR支持穩定行動進行了模擬,但考慮了兩種ISR資產定位方案,并納入了一種額外的ISR資產類型。該場景在新西蘭國防技術局開發的基于Agent的模擬環境中實施,該環境被稱為地圖感知非統一自動機(MANA)。選擇MANA的部分原因是它的數據耕作能力,可以利用它在廣泛的參數選項空間內運行模擬。該方案在第2節有更全面的描述。關于模擬參數、實驗設計、指標和模擬后分析方法的細節將在第3節介紹。第4節介紹了仿真實驗和SHAP分析的結果。最后,在第5節中提供了一些結論性意見。
仿真場景是一個簡化的小插曲,它是為了證明利用ISR能力來支持加拿大軍隊的各種任務(加拿大公共工程和政府服務部2020)。它代表了一種情況,即加拿大軍隊將與一個多邊伙伴,如北大西洋公約組織(NATO),領導或促進國際和平行動和穩定任務,這是加拿大國防政策 "強大、安全和參與 "的核心任務之一(加拿大政府2017年)。地點是北約的一個成員國受到一個鄰國,一個非北約近鄰對手的入侵威脅。因此,受到威脅的北約成員國援引了北約第5條,并成立了一個北約聯盟來協助受到威脅的國家。北約聯盟(藍軍,BF)監視邊界,并與任何越境的紅軍(RF)交戰。
下面的表1列出了情景中包括的所有小隊,以及每個小隊的地形和初始位置的表述。紅軍試圖到達藍軍總部(藍軍 HQ)。當紅軍向藍軍總部推進時,它進入了藍軍邊境傳感器的探測和分類范圍。在MANA中,探測是指在某一位置感知到特工的存在,而分類是指將探測到的特工的忠誠度分為友軍(藍軍)或敵軍(紅軍)的行為。一旦探測到并被歸類為敵方,邊界傳感器就會將探測到的特工的忠誠度和位置傳達給邊界總部,后者則提示4、5和6小隊(列于表1)向確定的RF位置移動。4號和5號小隊的任務是與紅軍交戰,而由無人駕駛飛行器(UAV)組成的6號小隊的任務是持續跟蹤紅軍并提示藍軍總部進行間接火力支援。如果所有的紅軍都失去了能力,或者達到了最大的時間限制,模擬就會結束。
表1: 基于Agent的模型中每個小隊的描述和初始位置。
選擇用于參數化的自變量是藍軍邊界傳感器的數量、藍軍邊界傳感器的探測和分類范圍(稱為傳感器范圍)、藍軍邊界傳感器探測到的特工被正確分類為紅軍或藍軍的概率(稱為分類概率)、藍軍邊界傳感器對RF傳感器的隱蔽程度(稱為傳感器隱蔽性),以及藍軍無人機的數量。實驗設計遵循網格狀結構,每個設計點重復進行一百次迭代。表2顯示了參數的范圍。
仿真實驗首先進行,同時保持藍軍邊界傳感器的固定位置,如表1所示為雙傳感器情況,而對于單傳感器情況,則位于兩個傳感器之間的中點。然后重復模擬實驗,將兩個傳感器和單個傳感器隨機放置在與兩個固定的藍軍邊界傳感器之間的距離相對應的方框內(同時在雙傳感器情況下保持20個網格的最小分離距離)。在分析部分,這兩種配置的傳感器部署被稱為固定或隨機的傳感器位置。
表2:變量的參數化范圍。
仿真實驗的目的是評估傳感器組合(即給不同傳感器的配置參數,如表2所列)在情景中的性能。已經提出并監測了幾個指標來評估ISR資產的系統,如第一個探測步驟、所有紅軍坦克的平均探測步驟和探測范圍、探測到的紅軍坦克的比例,以及一些藍軍的生存能力和致命性指標(Amyot-Bourgeois, Serré, and Dobias 2021)。在本研究中,在監測到的指標中選擇了兩個衡量有效性(MOEs)的例子進行更徹底的分析:第一個檢測步驟和檢測到的RF坦克的比例。第一個檢測步驟是指從模擬開始到藍軍傳感器第一次檢測到紅軍坦克并將其分類的延遲時間(以用戶定義的時間步長為1到10,000步,后者是模擬的最大分配時間)。檢測到的RF坦克的比例是指至少被藍軍 ISR資產之一檢測到并分類的RF坦克與RF坦克總數的比率,在整個實驗過程中,該比率保持為10。
該場景使用MANA實現,MANA是一種對抽象表示有用的提煉工具(Anderson 2013)。MANA擁有數據耕耘能力,但可同時變化的參數數量限制在兩個,而且只能與相同的固定小隊相關聯。這使得我們無法使用MANA內部的數據耕作能力來生成各種設計點。然而,方案文件被保存為XML文件,不同的相關參數可以使用XML編輯器直接修改。整套設計點是用Python的ElementTree軟件包生成的,并保存為XML文件。仿真是使用高性能計算進行的,因為總的迭代次數上升到接近200萬次,而且事實證明并行化對減少計算時間很有用。然后用Python腳本處理所有迭代的輸出文件,以提取感興趣的MOEs,并將實驗結果整理成便于模擬后分析的格式。
在機器學習中,主要目標是根據一組特征變量來預測結果或目標變量。在數據農業的背景下,場景參數被視為特征變量,MOE被視為目標變量。根據目標變量是分類的還是定量的,機器學習問題被分別稱為分類問題或回歸問題。隨機森林是一種常見的機器學習模型,本研究之所以選擇它,部分原因是它被發現通常表現良好,只需要很少的模型調整(Hastie, Tibshirani, and Friedman 2009, 590)。隨機森林最早是由Brieman(2001)提出的,它由一大組通過引導訓練數據建立的決策樹組成。每次在樹中考慮拆分時,只有一個隨機的特征變量子樣本被認為是拆分的候選人。正是這個特征抽樣過程使樹去掉了相關性,導致這組樹的平均值比單樹模型的變量更少,更可靠(Gareth等人,2017,320)。然后,隨機森林通過多數票或樹的預測平均值對測試觀測值進行分類或預測。
本研究中關注的兩個MOE,即第一個檢測步驟和檢測到的RF罐的比例,是定量的目標變量。耕耘模擬數據以70/30的比例被隨機分成訓練和測試集。然后使用Python的Scikit-Learn軟件包的0.24.1版本(Pedregosa等人,2011)對隨機森林回歸器進行訓練和測試。使用隨機森林回歸器的默認設置,除了將分裂內部節點所需的最小樣本數增加到30,將葉子節點所需的最小樣本數增加到10,并將最大深度設置為10以限制單個樹的大小。在尋找最佳分割時,確定最大特征數的方法也從默認的使用總特征數改為使用特征數的(近似)平方根。在構建隨機森林時通常選擇平方根法(Gareth等人,2017,319)。為了評估隨機森林的回歸者,使用了決定系數(R2)。R2表示擬合度,是衡量未見過的觀察結果被模型預測的程度(Scikit-Learn, n.d., chap 3.3)。它的最佳分值是1,而0分表示一個恒定的模型(即一個模型總是預測預期的目標值,而忽略特征變量)。它也可以是負數,因為一個模型有可能比恒定模型的表現更差。
SHAP方法計算Shapley值,它基于聯盟博弈理論,代表了一個特征值與數據集的平均預測值相比對模型預測的貢獻(Molnar 2021)。SHAP值是局部解釋(即針對單個數據點),可以匯總起來解釋一個模型的全局行為(Lundberg等人,2020)。作為SHAP值的延伸,Lundberg、Erion和Lee(2019)提出了同樣基于博弈論的SHAP交互值,以直接捕捉成對的交互效應。由于隨機森林是一個基于樹的模型,使用Python的SHAP包中的TreeExplainer可以獲得計算SHAP值和SHAP交互值的高速精確算法(Lundberg等人,2020)。0.38.1版的SHAP包提供了一系列的圖形總結,包括SHAP特征重要性。為便于比較,還提供了互換特征重要性,它是用Python的ELI5軟件包0.11.0版本的算法計算的(ELI5, n.d.)。互換特征重要性類似于Brieman(2001)首次提出的用于隨機森林的方法。它通過確定當一個特征不可用時對模型性能(在本研究中用R2衡量)的影響來衡量其重要性。變量的去除是通過在測試集中用自身的隨機置換來完成的。
表3總結了每個MOE以及固定和隨機傳感器位置的隨機森林回歸器的性能。在所有情況下,隨機森林模型都明顯優于常數模型,后者的R2為零。對于第一個檢測步驟,固定和隨機傳感器位置的特征變量解釋了MOE中80%以上的變異。對于檢測到的紅軍坦克的比例,擬合度沒有那么強,固定傳感器位置的特征變量解釋了MOE中略高于60%的變異,隨機傳感器位置的特征變量解釋了MOE中略低于60%的變異。
圖1和圖2分別列出了第一個檢測步驟的排列特征重要性和SHAP特征重要性,以及檢測到的RF坦克的比例。這些方法在識別最重要的特征方面基本一致,盡管在某些情況下確切的排序有所不同,特別是在不太重要的特征中。在圖1(a)中,傳感器范圍是預測第一個檢測步驟的最重要特征。對于固定和隨機的傳感器位置,如果將傳感器范圍從隨機森林模型中刪除,R2將下降到零以下,表明性能比恒定模型差。在圖1(b)中,傳感器范圍也是最重要的特征。對模型輸出的幅度(即預測的第一個檢測步驟)的平均影響由SHAP值的絕對值的平均值給出。尺度與目標,即第一個檢測步驟的單位相同。在圖2(a)中,有兩個特征對預測探測到的紅軍坦克的比例很重要:無人機的數量和傳感器的范圍。請注意,這兩個特征的重要性順序對于固定和隨機的傳感器位置是不同的。在圖2(b)中,同樣的兩個特征被SHAP方法確定為最重要。請注意,在這種情況下,無人機的數量對于固定和隨機的傳感器位置都是排在第一位的。
表3:隨機森林模型的性能得分。
圖1:第一個檢測步驟的特征重要性總結
圖2:檢測到的紅軍坦克比例的特征重要性總結
雖然標準的特征重要性柱狀圖提供了關于一個特征的相對重要性的見解,但正如Lundberg、Erion和Lee(2019)所述,"它們并不代表該特征對模型輸出的影響范圍和分布,以及該特征的價值與影響的關系"。他們提出了SHAP總結圖作為替代方案,圖3顯示了第一個檢測步驟,圖4顯示了檢測到的紅軍坦克的比例。每個點代表一個設計點的SHAP值,并以相應的單個特征的值來著色,藍色代表低值,紅色代表高值。這些特征按其整體影響(即SHAP值的絕對值之和)排序。正(或負)的SHAP值表示與數據集的平均預測值相比,對預測(模型的輸出)有正(或負)的貢獻。
在圖3(a)和圖3(b)中,傳感器范圍的顏色的平滑漸變表明,隨著傳感器范圍的縮小,模型的輸出(預測的第一個檢測步驟)平滑增加。這種行為在模擬中是可以預期的:第一次檢測一般由邊界傳感器完成,當它們的范圍較大時,它們會更早地進行第一次檢測。當傳感器位置固定時,圖3(a)顯示,當有一個邊界傳感器(藍點)時,與有兩個邊界傳感器(紅點)時相比,第一個檢測步驟比平均時間早(負SHAP值)。對模擬的檢查也證實了這一結果:單個固定傳感器的位置傾向于與穿越邊界的紅軍坦克的路徑一致,使單傳感器的情況比雙傳感器的情況有優勢。在圖3(b)中,SHAP值的模式在傳感器的數量上幾乎完全顛倒。當邊界傳感器的位置在每次迭代中被隨機分配時,在固定傳感器配置中,單傳感器情況比雙傳感器情況的優勢被消除了。因此,在這種配置下,從單傳感器到雙傳感器情況下,傳感器區域覆蓋的增加更加有效,紅軍坦克路徑有更大的機會穿過兩個傳感器覆蓋的區域,而不是一個傳感器覆蓋的區域。
圖3:第一個檢測步驟的SHAP總結圖。
圖4顯示了探測到的紅軍坦克比例的SHAP匯總圖。無人機的數量是對全球影響最大的特征。對于這個特征,藍點代表沒有藍軍無人機的設計點,這降低了模型的輸出(預測檢測到的RF坦克的比例)。這種行為在模擬中是預料之中的:一旦藍軍無人機被觸發,它們就會被送到第一個探測到的RF坦克的位置,在跟蹤它的同時,可以探測到其他RF坦克。因此,擁有一些無人機與沒有無人機相比,可以增加探測到的紅軍坦克的比例。同樣,低傳感器范圍也會降低檢測到的紅軍坦克的比例。如圖3所示,較低的傳感器范圍與較晚的第一次檢測步驟有關,無人機在第一次檢測之前不會被觸發。雖然固定和隨機傳感器位置的三個不太重要的特征的排序不同,但傳感器隱身性的右尾巴長,但左尾巴短,表明在這兩種配置中,高傳感器隱身性可以明顯增加探測到的紅軍坦克的比例,但低傳感器隱身性并沒有明顯減少探測到的紅軍坦克的比例。這可以解釋為隱身性更強的邊境傳感器的生存能力更強,導致使用時間更長,有更多機會進行多次探測。
圖4:探測到的RF坦克比例的SHAP總結圖。
SHAP值側重于特征效應,而SHAP交互作用值則可以將特征效應分解為主效應和交互作用。與SHAP值一樣,SHAP交互值的全球影響也可以通過對單個SHAP交互值的絕對值進行總結。圖5和圖6分別列出了第一個檢測步驟和檢測到的紅軍坦克比例的這些總結。每個圖中的比例代表了特征交互作用的相對全球影響。在圖5中,對于固定的和隨機的傳感器位置,傳感器范圍和傳感器數量、傳感器隱蔽性和分類概率之間的相互作用影響最大。在圖6中,對于固定和隨機的傳感器位置,只有一種交互作用的全局影響遠遠大于其他交互作用:傳感器范圍和無人機數量的交互作用。基本的互動模式可以用依賴圖來進一步研究。為了說明這一點,圖7顯示了傳感器范圍和無人機數量的SHAP交互值。兩種傳感器配置的模式相似,并顯示了在可能的傳感器范圍內檢測到的紅軍坦克比例的明顯轉變。對于低于50的傳感器范圍,相對于沒有無人機,至少有一個無人機增加了檢測到的RF坦克的比例。然而,一旦傳感器范圍至少達到50,這種模式就會逆轉。這可以追溯到模擬中的行為:在另一個藍軍小隊或特工(即邊境傳感器或總部)檢測到至少一輛RF坦克之前,無人機不會參與。一旦邊境傳感器的探測范圍足夠大,無人機的額外探測能力對探測到的紅軍坦克比例的影響就會減少。
圖5:第一個探測步驟的SHAP交互值摘要
圖6:檢測到的RF坦克比例的SHAP交互作用值的匯總。
圖7:探測到的RF坦克比例的傳感器范圍和無人機數量之間的SHAP交互效應的依賴圖。
本文的目的是評估SHAP在基于Agent的模擬中的數據養殖上的使用,以改善軍事行動場景的模擬后分析。雖然機器學習模型,如隨機森林,非常適合于大數據,但當分析的主要目標是獲得對系統的基本了解以告知決策者時,其黑箱性質構成了挑戰。SHAP是一種與模型無關的方法,用于解釋任何機器學習模型的預測結果。TreeExplainer的作者Lundberg等人(2020年)提出,結合許多局部解釋(即SHAP值)可以保留 "對模型的局部忠實性,同時仍然捕捉到全局模式,從而對模型的行為有更豐富、更準確的表述"。
提出了標準的特征重要性柱狀圖,使用基于排列組合的算法和SHAP值進行計算,強調這些圖對模型行為的洞察力有限。雖然這兩種計算特征重要性的方法在確定預測兩個感興趣的MOE的前一或兩個特征方面基本一致,但SHAP總結圖、交互值和依賴圖對隨機森林模型的行為提供了更多的了解。SHAP總結圖顯示了模型的預測對不同特征值的變化(例如,隨著傳感器范圍的縮小,預測的第一個探測步驟平穩增加),并確定了極端值的影響(例如,高傳感器的隱蔽性可以大大增加探測到的紅軍坦克的比例)。SHAP的交互值和依賴性圖提供了進一步的洞察力,以了解所發現的兩個最重要的特征對探測到的紅軍坦克比例的綜合影響。SHAP還成功地識別了固定和隨機傳感器位置之間的關鍵差異,證實了在確定傳感器組合時,位置,而不僅僅是傳感器的數量,是一個重要的考慮。使用SHAP可以驗證所發現的見解,因為模擬場景被有意抽象化,以盡量減少其復雜性并保持對戰場動態的直觀理解。這意味著可以根據對實施的直接了解或通過在MANA中交互運行模擬來查看Agent的行為來確認這些見解。
雖然SHAP在改進模擬后的分析方面表現出了顯著的前景,但它解釋了在養殖數據上訓練的機器學習模型的預測。因此,它不是對模擬場景的直接解釋,在機器學習模型性能不強的情況下,可能產生誤導性的結果。對機器學習模型的適當訓練和測試仍然是模擬后分析的關鍵步驟。盡管如此,這項研究仍然可以用來向決策者展示數據農業的潛力,以及它如何利用抽象的模擬實驗幫助人們對一個復雜的系統有基本的了解。這在軍事現代化項目的早期階段可能特別有幫助;研究結果可以用來確定參數或選項,以便進行更詳細的研究。未來的研究將考慮更復雜的場景和更廣泛的機器學習模型。
MAUDE AMYOT-BOURGEOIS是加拿大國防研究與發展部作戰研究與分析中心的初級國防科學家。自2019年以來,她與加拿大陸軍作戰研究和分析小組的同事合作進行各種作戰模擬研究。Maude Amyot-Bourgeois在加拿大渥太華大學獲得物理學碩士學位。她的電子郵件地址是:[email protected]。
BRITTANY ASTLES自2021年1月起擔任加拿大國防研究與發展部作戰研究與分析中心的學生國防科學家。她之前的工作是利用機器學習研究全球恐怖襲擊趨勢和U型分形事件。她目前是地理學碩士的候選人,專業是數據科學。她的電子郵件是:[email protected]
多年來,加拿大國防研究與發展部(DRDC)一直通過一系列的研討會與軍事人員接觸,評估新興技術對概念、能力和投資的可能影響。本文概述了影響評估框架,該框架已被設計并用于調查一些新興技術的影響。該框架包括定量和定性的措施,以及支持任務所需能力要素的正式清單。該框架的應用通過幾個新興技術領域對加拿大陸軍能力要素的評估結果來說明。被評估的新興技術領域包括量子技術、超材料、人工智能、印刷電子學、人體性能增強、合成生物學、增材制造和其他許多領域。結果提供了關于哪些軍事能力領域和作戰功能將受到所審查技術的最大影響的見解。這種方法為部隊開發人員提供了額外的證據,并支持對能力發展計劃和技術路線圖的審查。
對技術、戰爭、政治和經濟之間關系的研究已經多次提出,未來必須在高度不確定的情況下做出決定。偏見塑造了國家和文化對如何預測未來的偏好。正如W.Chin所指出的,未來戰爭方面的文獻往往過度依賴明顯具有決定性軍事技術的簡單化概述[1]。
國防和安全的作戰環境不斷被競爭和沖突所塑造。雖然軍隊在評估未來作戰環境(FOE)的基礎上發展未來部隊,但它也需要評估趨勢和發展對能力的可能影響[2]。盡管大多數官方的FOE出版物包括對軍事力量的關鍵推論和高層影響,但仍然很少有既定的框架來評估新興技術在能力和概念發展方面的可能影響。
2017年,加拿大陸軍委員會批準將近距離接觸[3]作為未來軍隊(AoT)的頂點作戰概念。AoT是一個不斷發展的概念模型,說明加拿大軍隊在未來15年內應該如何配置、裝備和訓練。理想的AoT將被要求更加連接、敏捷、靈活、整合和強大。正如 "親密接觸"所指示的那樣,需要對政治、環境和技術變化進行持續的地平線掃描和觀察,以便對破壞性變化提供更好的預警[5]。作為風險管理戰略的一部分,部隊組建者需要了解技術發展以評估和利用潛在的機會。他們還需要預測和減輕他們在FOE中可能面臨的潛在風險、威脅和作戰挑戰。技術前瞻性和組織敏捷性是機構復原力的關鍵推動因素。技術優勢當然是任務成功的助推器,但創新文化和靈活的系統將是未來陸軍在作戰中成功的游戲規則。
一些軍隊已經采用了著名的基于能力的規劃(CBP)框架,該框架最初由Paul K. Davis[4]開發,用于支持能力和系統的長期戰略計劃。在加拿大,CBP于2005年被加拿大武裝部隊(CAF)采用。CBP是一種系統的部隊發展方法,旨在為最合適的部隊結構選擇提供建議,以滿足政府的優先事項。CBP過程評估了通過情景分析得出的能力目標。然后,通過對當前和計劃中的能力進行分析,確定并驗證能力的不足和過剩。它支持首選部隊結構的發展。CBP是一個使用場景的過程,這些場景松散地位于FOE中,以評估現有能力在多大程度上可以保持運作,并在不同場景下對任務的成功做出貢獻。CBP過程的主要結果是識別和記錄可能威脅到任務成功的能力差距和缺陷。CBP是關于評估現有軍事能力的準備程度、生存能力和維持能力。
傳統上,新興技術的趨勢是作為FOE的一部分來考慮的,從FOE中推導出一些情景來 "測試 "現有的軍事能力。評估新興技術的綜合方法需要考慮三種不同的應用背景。
機會:新興技術能否被塑造來解決差距和不足,提供新的能力或新的手段來實現效果?
風險:新興技術能否代表新的威脅,需要出口控制或技術保護計劃,加速我們自己技術的淘汰,或降低我們的能力?
環境:新興技術將如何塑造作戰環境?鑒于全球都能獲得新技術,我們在未來的物理和數字環境中會面臨什么?
CBP是在未來部隊結構的設計中創造機會和減少風險的藝術。
文獻中描述了在國防背景下評估新興技術的幾種方法。
顛覆性技術評估游戲(DTAG)是一種方法,最初由北約SAS-062和SAS-082任務組開發[6-8]。DTAG最適合于探索新興技術在軍事場景中的使用如何可能改變行動方案和結果。DTAG使用系統理念(IoS)卡,將幾種技術整合到一個新概念中。DTAG會議通過在軍事背景下進行基于場景的桌面兵棋推演演習,探索IoS的潛在好處。
從能力發展的角度來看,文獻中沒有證據表明,擬議的IoS卡得到了現有技術路線圖或技術趨勢分析的支持,這將有助于能力開發者估計一個新的 "系統 "在可預見的未來何時可以現實地出現和部署。DTAG會議的結果產生了新的技術應用概念,但它們缺乏技術趨勢分析和路線圖的支持,使能力開發者獲得的可操作信息有限。
澳大利亞陸軍采用了由國防科技集團(DST)的科學家開發的威脅、機會、弱點和優勢(TOWS)方法來評估新興技術對陸軍通用功能的可能影響。TOWS技術的描述見[9, 10]。TOWS技術將外部威脅和機會與一個組織的內部弱點和優勢進行比較。結果被用來定義一套行動,以保護組織免受威脅,并使其能夠利用機會。TOWS是專門為推斷行動和戰略而設計的。
表1:技術領域對軍隊一般職能的影響[10]
加拿大國防研究與發展部(DRDC)用于識別和評估新興技術的一些工具和技術已經在2015年的北約IST系列講座中進行了描述[11, 12]。目前,DRDC的計劃將這些工具和技術整合到科技(S&T)展望和風險評估的綜合方法中。圖1說明了從前景掃描活動到提供戰略建議的主要組成部分和邏輯流程。新興技術影響評估研討會每年進行一次,以評估新興技術對國防和安全能力、利益相關者和政策制定者的影響。
圖1:DRDC的科技(S&T)展望和風險評估計劃。
DRDC的科技展望和風險評估計劃的所有活動都是按照四步程序進行的,首先是進行前景掃描活動,以確定新出現的利益趨勢,然后收集和分析信息,以發展關于這些利益趨勢的技術情報。然后評估新出現的技術趨勢對國防、安全、政策和立法的可能影響。評估的結果被用來為計劃、能力和伙伴關系方面的決策提供信息。
在所有的未來情況下,任務的成功和有效性依賴于執行任務所需能力的可用性、準備性、穩健性和彈性。新興技術的潛在影響需要在所有作戰功能中進行評估,以確定哪些能力可能從中受益,哪些可能面臨風險。加拿大陸軍使用五個核心作戰功能:指揮、感知、行動、防護和維持
指揮 - 建立共同的意圖和管理指揮的必要結構和程序。作為一項作戰功能,指揮部是其他四項作戰功能的紐帶。指揮部是將所有作戰功能整合到一個全面的戰略、作戰或戰術層面的概念的作戰功能。
指揮部的運作功能由一些關鍵能力支持,包括:
表1:支持指揮職能的能力。
指揮與控制網絡 | 安全、穩健、多級和移動通信系統,允許在所有適當級別進行網絡化指揮。 |
規劃和決策支持系統 | 態勢感知(SA);協作規劃工具;建模與仿真 |
JIMP連接性 | 聯合、機構間、多國和公共 (JIMP) 連接 |
感知 - 一個單一的綜合實體,收集、整理、分析和顯示各級數據、信息和知識。戰術、行動和戰略資產被整合為一個單一的連續體。感知是為指揮官提供知識的操作功能。感知功能包含了所有收集和處理數據的能力。
“感知” 的操作功能由一些關鍵能力支持,包括:
表2:支持感知功能的能力。
地面傳感器網絡 | 雷達;光學 |
空中和戰略傳感器網絡 | 無人機;衛星;網絡 |
情報系統 | 圖像;信號;社會文化;地理空間;人類;開放源 |
行動 - 使用一種能力來影響整個沖突范圍內物質和道德領域的事件。行動反映了對各種來源的能力的整合--戰術、行動或戰略。行動是整合了機動、火力和信息戰的作戰功能,以達到預期效果。它是聯合火力和影響活動的結合,通過機動和對作戰環境的管理而同步和協調。
該法案的運作功能由一些關鍵的能力支持,包括:
表3:支持行動功能的能力。
火力 | 直接火力武器;間接火力武器;遠距離火力;聯合火力;定向能武器 |
機動 | 裝甲車;輕型車輛;自主系統;戰術空運;沿岸船只 |
信息作戰 | 電子戰;心理作戰;計算機網絡作戰(防御、攻擊、利用)。 |
防護 - 為促進任務成功而采取的部隊保護措施,通過管理風險和盡量減少人員、信息、物資、設施和活動在所有威脅下的脆弱性,維護行動自由和行動效率。防護是保護部隊、其能力和行動自由的業務職能。防護功能可以保護部隊免受常規和不對稱的威脅,適用于國內、大陸和國際行動。
防護作戰功能由一些關鍵能力支持,包括:
表4:支持盾牌功能的能力。
火災防護 | 保護基礎設施部隊、個人、車輛、武器、設備和物資免受直接和間接火災的傷害;戰斗識別(反自相殘殺) |
GBAMD | 地基防空和彈藥防御 |
避免爆炸性危險 | 簡易爆炸裝置(IED);誘殺裝置;地雷 |
化學、生物、輻射防御 | 防范化學、生物、輻射、核威脅;環境和職業健康與安全 |
保護免受心理威脅 | 反心理學行動 |
維持--產生、部署、使用和重新部署一支部隊所需的所有功能的組合。"維持"是支持行動的再生和維持能力的操作功能。
"維持"行動功能由一些關鍵能力支持,包括:
表5:支持維持功能的能力。
陸地設備系統 | 維修設施;前方維修;回收 |
材料和分配系統 | 總資產可見度;倉儲;供應;食品服務;陸路運輸;空運;集裝箱化 |
行政系統 | 財務服務;人事管理;停尸服務;牧師;法律服務;郵政服務;娛樂設施 |
衛生服務系統 | 醫療設施;傷員后送;醫療和牙科治療;醫療用品;健康報告;預防醫學(身體和精神)。 |
除了作戰功能外,還考慮了部隊生成能力。一些新興技術可能會影響到部隊生成的各個方面。例如,增強現實和虛擬現實技術正被越來越多地用于加速訓練。它們還為平臺的現場維護和修理提供了新的手段。在CA的背景下,部隊組建得到了一些關鍵能力的支持,包括:
表6:支持部隊組建的能力。
組織力量產生的結構 | 單位;旅;師;訓練機構;靶場和訓練區;總部 |
兵力投送 | 國家維持基地;戰略交通線;戰區維持(包括工程支持);空運;海運;APODs/SPODs |
通常情況下,新興技術影響評估研討會以一個或多個主題專家(SME)的展望簡報開始。中小企業有責任介紹該技術領域并描述其潛在的應用。他們還提供有關被審查的新興技術領域的新興趨勢和主要領導人的有用信息,以及對該技術目前的成熟度、限制、局限性和科學界面臨的挑戰的概述。
圖2:研討會過程。
根據中小企業提供的信息和個人的專業知識,研討會參與者被要求使用簡單的李克特量表評估新興技術領域對陸軍能力的潛在影響,從0(無影響)到7(非常大的影響)。評級過程確保參與者考慮到每個作戰功能的所有能力領域的影響。通常情況下,在考慮一項新興技術的潛在影響時,參與者已經想到了一個具體的能力領域。使用一個系統的能力評級過程,可以確保"不太明顯"的影響領域也在研討會上得到考慮和討論。
圖3:評級過程和尺度。
在研討會上,"影響"的定義是:解決現有的差距和缺陷;解決持久的問題(如士兵的負擔);改善現有的能力;引入新的概念和能力;破壞或否定現有的能力;使任務面臨風險(多種風險類別)。
在第一輪個人評估后,將結果提交給研討會參與者,以激發小組討論和辯論。小組討論提供了機會,以交流對新興技術的看法,要求中小企業提供額外的技術細節和清晰度,挑戰假設,并試圖填補 "高不確定性所固有的知識空白"。小組討論后,再進行第二輪評估。這種方法有助于衡量和減輕 "群體思維"的影響。
在研討會上收集的數據用兩種不同的方法進行分析。第一種是依靠DRDC的科學家在2006年開發的統計工具來進行多標準分析和排名共識(MARCUS)。MARCUS[14, 15]是一個產生共識結果的有用工具。MARCUS的特點之一是它能正確處理排名中的并列關系,能容忍不完整的排名,并在必要時允許單個排名在確定共識排名時具有不同的權重。
下面的例子顯示了小組討論前后評估的微小差異。在這個特殊的案例中,在小組討論之前,評估認為情報系統(5)將受到人工智能(AI)發展的最大影響。在小組討論后,與會者評估說,規劃和決策支持系統(2)將受到最大影響。
圖4:小組討論前后,MARCUS對人工智能應用在20種軍隊能力上的排名
用于分析數據的第二種定量方法是對所有參與者對每個能力領域的評分應用一個簡單的平均函數,如圖5所示。此外,在研討會期間還收集了參與者的定性評估,以便為個人評級提供額外的理由和背景。結果被用來確定哪些能力領域和作戰功能將受到所考慮的新興技術的最大影響(技術觀點),并確定哪些新興技術將有助于塑造整個作戰功能的未來能力(操作功能觀點)。自2014年以來,CA一直在舉辦一系列的研討會,以評估幾個新興技術領域的潛在影響。
如圖5所示,累積結果表明,支持指揮功能的能力將受到人工智能(AI)應用、人類性能優化和修改(HPO、HPM)發展以及量子科學(QS)應用的顯著影響。量子技術有望提供下一代的加密能力,可以提高指揮和控制(C2)網絡的安全性。
圖5:新興技術領域對CA運行功能的影響程度
結果還表明,在未來15年以上的時間里,支持理智功能的能力將受到幾種新興技術的顯著影響。人工智能(AI)的快速發展,以及量子科學(QS)、超材料(MM)和印刷電子(PE)的發展,將有助于塑造未來的感知能力。
對于支持行為功能的能力,結果表明它們將受到人工智能、文化行為模型(CBM)以及培訓、教育和演習5(TEE)新模式的影響。機動能力將大大受益于人工智能的發展,特別是在機器人、自主車輛和蜂群的應用領域,但也可以通過人工智能的增強現實技術為下崗士兵服務。量子傳感器的發展將提供更精確的定位、導航和定時(PNT)系統,以提高在GPS缺失環境下的機動能力。
支持防護功能的能力也將受到幾個技術領域的重大影響。材料科學和個人防護設備(PPE)設計的發展顯然將塑造未來的防火能力。化學和生物檢測和保護(CB DP)的進步將有助于增強或新的CBRN防御能力,同時合成生物學(SB)和人體性能優化(HPO)的發展也將有助于增強或新的CBRN防御能力。量子科學(QS)預計將提供新的傳感器,以實現對爆炸性危險的遠距離探測和規避。
在支持 "維持"功能的所有能力領域中,衛生服務系統是未來15年內變化最大的領域。合成生物學(SB)、人體性能優化(HPO)和改造(HPM)的發展,以及個人防護裝備、化學和生物檢測和保護(CB DP)的發展,培訓、教育和鍛煉的新模式,以及來自印刷電子(PE)的可穿戴和植入式傳感器,預計將對未來的衛生服務系統產生重大影響,前提是有適當的政策和立法。
年度新興技術影響評估研討會是支持能力發展和實施國防創新計劃的關鍵。它們匯集了科學家、學者、工程師、政策制定者、項目管理人員、法律顧問和軍事人員的專業知識。自2014年成立以來,新興技術影響評估研討會為國防能力、科技合作計劃和伙伴關系的戰略投資決策提供了信息。例子包括。
采用部門的量子科技戰略。
加拿大軍隊人工智能概念文件和技術路線圖。
提交給國防部(DND)"創新促進國防卓越和安全"(IDEaS)計劃的新的創新挑戰。
在新興技術領域的新FVEY活動,如超高分子量聚乙烯(UHMWPE)。
幾個國防和安全政策問題簡報。
對敏感技術和出口控制的系統性審查6。
任務的成功和有效性取決于用于實現效果的能力的可用性、準備性、穩健性和復原力。長期的戰略能力發展計劃需要識別和評估新興技術對所有作戰功能的潛在影響,以了解哪些能力可能受益于這些技術,哪些可能面臨風險。為了支持這種評估,我們設計了一個框架,其中包括定量和定性的措施以及支持任務所需的能力要素的正式清單。通過對加拿大陸軍能力要素的幾個新興技術領域的評估結果,說明了該框架的應用。自2014年第一次迭代影響評估研討會以來,累積的結果提供了寶貴的見解,即在未來15年內,哪些軍事能力領域和作戰功能將受到審查技術的最大影響。
表A-1: CA評估的新興技術領域
[1] Chin, Warren, “Technology, war and the state: past, present and future” International Affairs 95: 4, 2019
[2] Sullivan et al. Mad Scientist: Disruption and the Future Operational Environment Final Conference Report 25 July 2019
[3] Kaduck Anthony (LCol), Ron Bell (LCol), Peter Gizewski, Close Engagement. Land Power in an Age of Uncertainty, Kingston, 2017.
[4] Davis, Paul K., Analytic Architecture for Capabilities-Based Planning, Mission-System Analysis, and Transformation. RAND MR-1513
[5] Chapman B. and Gisewski P., Army 2040 Seminar. A Methodology to Address Capability Development in an Uncertain Future. 30th International Symposium on Military Operational Research (ISMOR), 2013
[6] NATO-SAS-082, Disruptive Technology Assessment Game. Evolution and Validation, RTO Technical Report TR-SAS-082, 2012.
[7] H. And?s, B. Damsgaard, G. Kindvall, E. R?nnberg, S. O. Solheim and M. Suojanen, Emerging Technology Concepts and Defence Planning in the Nordic Countries, FFI-NOTAT Eksternnotat 16/00336, 2016.
[8] G. Kindvall, A. Lindberg, C. Trané and J. Westman, Exploring Future Technology Development, FOI- R- -4196--SE, 2017.
[9] Pincombe B. and Dexter P., The Possible Effects of Potential Key Technological Developments on the Force Structure of the Australian Army in 2040. DSTO-GD-0862. 2014
[10] Dexter P. and Krysiak, K. “Assessing the impact of emerging technologies on the Australian Army”. 20th International Congress on Modelling and Simulation, Adelaide, Australia, 1–6 December 2013
[11] Auger, A. Emerging and Disruptive Technologies Impact Assessment. NATO IST 135 Lecture Series. STO-EN-IST-135. 2015
[12] Auger, A. Identification of Emerging Scientific and Technical Trends Using Scientometric Analysis. NATO IST 135 Lecture Series. STO-EN-IST-135. 2015
[13] Holland-Smith, D.J. On the Risk from High-Impact, High-Uncertainty Technologies. NATO IST 135 Lecture Series. STO-EN-IST-135. 2015
[14] Emond, E. J., Developments in the Analysis of Rankings in Operational Research. DRDC CORA TR 2006-37; Defence R&D Canada, December 2006
[15] Tania Yazbeck and E. J. Emond. Multi-Criteria Analysis and Ranking Consensus Unified Solution (MARCUS) -User Guide DOR(CORP) Research Note RN 2004/13. 2004
[16] Auger, A. Emerging and Disruptive Technologies Impact Assessment Workshop. Results from 2015, DRDC-RDDC-2016-L328, Ottawa, Oct 2016.
[17] Auger, A. Impact of Selected Emerging Technologies on Canadian Army Capabilities. Results from Emerging and Disruptive Technologies Workshop, Dec. 2017 DRDC-RDDC-2018-R152. May 2018
[18] Gunashekar S., et al. Oversight of science and technology. Learning from past and present efforts around the world. RAND Europe report, 2019. RR-2921
這項工作是由Calian團隊為加拿大國防研究與發展部-多倫多研究中心(DRDC TRC)進行的任務5 "人機協作決策支持系統的初步要求",是大型人機交互(HAI)任務授權合同(TAC;合同號:W/001/TOR)的一部分。HAI TAC的目標是設計、開發、實施和評估士兵-機器人合作(SRT)的概念、方法和技術,以改善加拿大武裝部隊(CAF)的整體人機系統(HMS)性能。
在本技術說明中,報告了最近對傳感器技術的研究和發展以及未來在有人-無人系統(MUM-T)作業期間在小型無人系統上實現感知和規避(SAA)能力的文獻回顧。
在傳感器技術方面,我們研究了合作和非合作的傳感器,其中非合作的傳感器又分為主動和被動的。我們認為:(1)無源非合作傳感器在尺寸、重量和功率(SWAP)方面比其他傳感器有優勢。被動工作確保了無人平臺在敵對環境中的安全。為了補充單個傳感器能力的約束和限制,我們還認為,關于(2)傳感器和數據融合的趨勢和未來要求是有希望的,以實現動態、不確定環境中的連續和有彈性的測量。(3)此外,我們應關注無人系統領域正在開發的新型傳感器套件。
在檢測和規避方法方面,我們按照SAA流程進行了全面的研究,從檢測沖突、危險或潛在威脅,到跟蹤目標(物體)的運動;評價和評估風險和信心;根據評估的參數對沖突進行優先排序;然后宣布或確認沖突和沖突的程度;確定正確的沖突解決方式;然后是指揮,最后是執行。為了支持這一過程,對各種SAA算法進行了審查,包括探測算法、跟蹤算法和規避策略。我們認為,(4)基于學習的智能算法需要放在未來的SAA要求中,因為它們具有支持任務的適應能力。
最后,我們從各種使用案例中審查了支持MUM-T行動的SAA。我們認為,(5)與蜂群式小型UxV的人-系統接口提供了半自主的SAA能力,而人的參與程度有限。這種綜合的人-機器人互動提供了智能決策支持工具。該系統旨在使單個人類操作員能夠有效地指揮、監測和監督一個UxV系統。基于技術重點的趨勢,我們最終認為,(6)沒有士兵參與的完全自主在現階段的研究和開發進展方面是不成熟的,但我們將積極關注該領域的最新發展。
2022年6月15日,英國國防部在倫敦科技周人工智能峰會上發布了《國防人工智能戰略》,旨在“雄心勃勃、安全和負責任地”使用人工智能的戰略和相關政策。本戰略支持創建新的國防人工智能中心(DAIC),以提供前沿技術樞紐,支撐英軍使用和創新相關技術。本戰略概述了以下內容:一是在國防中使用人工智能的新倫理原則;二是人工智能在國防部加強安全和現代化的地位和應用;三是考慮通過人工智能研究、開發和實驗,通過新概念和尖端技術徹底改變武裝技術能力,并有效、高效、可信地向戰場交付最新裝備。該戰略將將成為英國人工智能戰略的關鍵要素,并加強國防在政府層面通過科學和技術獲取戰略優勢的核心地位。
圖 英國國防部發布《國防人工智能戰略》
(本文根據原文編譯整理,僅供交流參考,觀點不代表本機構立場。)
英國國防部人工智能戰略的愿景是:以英國規模為標準,成為世界上最有效、最高效、最可信和最具影響的國防組織:
有效——提供戰場制勝能力和支持,以及英國與盟友關于人工智能生態系統合作的能力;
高效——通過創新使用技術交付能力,進行作戰并實現生產力效應;
可信——基于人工智能系統的安全性和可靠性受到公眾、盟友和人民的信任,根據英國核心價值觀合法合規地使用人工智能;
影響——積極參與合作和引領人工智能技術的全球發展和管理趨勢;
二**、背景和必要性******
英國國防部《綜合評估(2021)》強調指出,國家在人工智能領域的卓越表現是確保英國在2030年前成為“科技超級大國”的核心。英國國防部《國家人工智能戰略(2021年)》指出,人工智能在改寫整個行業的規則、推動經濟大幅增長和改變生活的所有領域方面具有巨大潛力。英國國防部《綜合作戰概念 (2020年) 》描述了無處不在的信息和快速的技術變革如何改變了戰爭的性質。在軍事作戰的各個領域,沖突正變得愈發復雜。新技術產生大量數據,解鎖新的威脅和漏洞,并通過如蜂群無人機、高速武器和先進網絡攻擊等下一代先進能力擴大潛在攻擊的規模。
人工智能技術以及其影響可能會極大地縮短決策時間,使人類理解負擔加重,而且這些在現代戰場中需要快速做出反應。正如《國防司令部文件(2021)》所指出的,“未來沖突的勝負可能取決于所采用人工智能解決方案的速度和效率”。因此信息作戰變得越來越重要。簡而言之,當代國防正在發生一場根本性的劇變,與人工智能相關的戰略競爭正在加劇,因此必須迅速、主動和全面應對。
本戰略闡述了英國將如何應對這一重大戰略挑戰,其應該引起英國國防部的重視,并參與部隊發展和國防轉型,英國國防部需要明確其機構與人工智能相關的要素并采取相應行動,以在后續執行和交付方面發揮關鍵作用。
三、發展途徑
**一是英國國防部需要轉變為“人工智能就緒”的組織。**具體措施是:1)推動文化、技能和政策變革,培訓領導人,提高人員技能,并加強國防人工智能和自主部門的組織能力;2)創建國防人工智能技能框架和新的人工智能職業發展和晉升路徑;3)將數據視為關鍵戰略資產進行管理和應用,建設新的數字主干網絡和國防人工智能中心。
**二是在速度和規模上采用和利用人工智能,以獲得防御優勢。**具體措施是:1)將人工智能視為能力戰略和部隊發展過程中戰略優勢的關鍵來源;2)短期路線采用成熟的數據科學、機器學習和先進的計算統計技術提升效果和生產力,長期路線進行尖端人工智能技術研發;3)采用多學科多技術將人類認知、創造力和責任與機器速度分析能力相結合以評估人工智能系統的脆弱性和威脅;4)與盟友和伙伴密切合作開發創新能力解決方案以應對共同的挑戰。
**三是推動和支持英國國防和安全人工智能生態系統。**具體措施是:1)通過英國工業和學術人工智能的雄厚基礎以及政府的支持建立信心并明確要求;2)視人工智能生態系統為戰略資產,消除行業壁壘,建立更具活力和一體化的伙伴關系;3)促進行業聯系建立新的國防和國家安全人工智能網絡,促進人才交流和共創,鼓勵業界投資國防相關的人工智能研發,并簡化國防數據和資產的獲取。4)促進中小企業,使監管方法現代化,支持業務增長并最大限度地利用國防人工智能相關知識產權促進相關技術商業化。
**四是塑造全球人工智能發展,以促進安全、穩定和民主價值觀。**具體措施是:1)按照英國的目標和價值觀塑造人工智能的發展,促進倫理方法,并影響符合民主價值觀的全球規范和標準;2)促進安全與穩定,確保英國的技術進步得到適當保護,同時探索建立信心和將軍事人工智能使用風險降至最低的機制;3)考慮可能出現的極端甚至事關生存的風險,并積極與盟友和合作伙伴接觸,制定未來的安全政策,尋求建立對話,以降低戰略錯誤、誤解和誤判的風險。
四、優先效果
通過采用人工智能技術實現本戰略目標,使英國武裝部隊實現現代化,并迅速從工業時代的聯合部隊過渡到敏捷信息時代的綜合部隊,國防部將受益于效率和生產率的提高,其期望的優先效果如下:
決策優勢:通過更充足、更分散的決策制定和基于威脅的機器快速響應,提高作戰節奏和靈活性。
效能:通過智能自主提高靈活性、效能和可用性。
解鎖新能力:通過開發新的作戰方式確保作戰優勢,增強軍事效果,保護人民免受傷害。
武裝部隊:減輕部隊負擔,并將人類決策集中在基于獨創性、背景思維和判斷力的高價值職能上。
五、戰略綜述總結****
**六、**結束語
人工智能必須成為未來必不可少的技術,其也促使著英國國防部改變對現代技術的看法,調整其技術方向和戰略需求,全面擁抱世界領先的人工智能解決方案和能力,推進其國防業務中觀念、文化、規劃和交付方面的持久變化,并將其作為國防戰略融入國防領域,以確保英國軍隊成為敏捷信息時代的綜合部隊。
編譯:船の心
END
世界軍事電子領域2021年度十大進展
雖然有許多信息/知識來源可以確定作戰能力的差距并提供建議,以消除差距或向艦隊提供新的/改進的能力,但沒有一個全面的系統和負責任的實體能捕獲所有這些信息,正在取得或沒有取得進展,以提供一個清晰和簡潔的圖景,消除確定的差距或提供能力。為了解決這個問題,我們開發了一種基于多標準決策分析(MCDA)方法的方法,以計算和可視化任何特定時間點的能力差距得分,以描述基于證實的實時信息的能力差距解決進展。在這項工作中,我們通過在框架中增加新的元素和子元素來擴展用于評估能力的框架,并通過納入不同的模型來計算能力差距分數來擴展MCDA方法。這些模型包括加權總和模型(WSM)、加權產品模型(WPM)、加權總和產品評估(WASPA)、與理想方案相似度排序偏好技術(TOPSIS)和層次分析過程(AHP)。目標是開發一種全面的方法,以1)支持基于硬數據的能力優先排序,2)提供一個清晰和簡明的進展情況,以消除確定的差距或提供一種能力,以及3)支持創建一個中央存儲庫,供各組織分發相關信息。
海軍水面作戰發展中心(SMWDC)指揮官的任務是為水面類型指揮官所管轄的任務領域提供監督、調整、同步和端到端的戰爭改進規劃(WIP)評估。WIP過程是一個正式的框架,用于捕獲、審查和優先考慮艦隊的能力需求,以提高戰備狀態并優化海軍部隊在執行作戰司令官(CCDR)任務中的資源(美國太平洋艦隊司令,2013)。對于每個任務領域,SMWDC總部負責確保WIP艦隊協作小組(FCT)的組成,以參與為年度產出產品的發展提供信息的活動。每個WIP在第一季度和第二季度進行執行工作組(EWG),并在當前財政年度的計劃目標備忘錄(POM)周期的第三季度初進行研討會。在整個WIP周期中,利用SMWDC總部N8/9認可的排名工具來幫助客觀地確定能力差距的優先次序。年度能力領域評估(CAA)是一項協作努力,由EWG主席領導,并得到FCT工作組領導和戰爭發展中心的支持。在第一和第二工作組期間收到的英特爾簡報和FCT更新有助于為CAA的創建提供信息,并最終提供 "家庭作業 "或支持文件,以確定能力差距的優先次序。每個能力領域所有者(CAO)向SMWDC N00通報他們的CAA和IPCL。通過在WIP研討會上提出的努力,CAA報告成為當前WIP周期IPCL發展的基礎(海軍水面和地雷作戰發展中心指揮官,2018)。
在以前的研究工作中,我們開發了一種基于多標準決策分析(MCDA)的方法,以計算和可視化任何特定時間點的能力差距得分,以描述基于證實的實時信息的能力差距解決進展。在這項工作中,我們通過擴大用于評估不同能力的框架和納入計算能力差距分數的不同模型來擴展MCDA方法。這些模型包括加權產品模型(WPM)、加權總和產品評估(WASPA)、與理想方案相似度排序偏好技術(TOPSIS),以及。這種方法的應用將為決策者提供客觀的信息,以1)支持基于硬數據的能力優先排序,2)提供一個清晰和簡明的進展情況,以消除確定的差距和/或提供能力,以及3)支持創建一個中央存儲庫,供各組織分發相關信息。
在以前的工作中,我們建議使用多標準決策分析(MCDA)來計算在特定時間點上的特定優先級的能力差距得分。多標準決策分析既是一種方法,也是一套技術,其目的是提供備選方案的總體排序,從最優先到最不優先。替代方案可能在滿足若干標準的程度上有所不同,而且沒有一個替代方案能最好地滿足所有標準。此外,這些標準之間通常會有一些沖突或權衡。MCDA是一種看待受許多決策標準影響的復雜問題的方法,它將問題分解成更容易管理的部分,以便將數據和判斷帶到這些部分,然后將這些部分重新組合,向決策者展示一個連貫的整體情況。這種方法是對思考和決策的一種幫助,但不是對決策的一種幫助(Department for Communities and Local Government, 2009)。
在能力差距分析的情況下,標準代表影響差距的因素(如理論、組織、物資、資金等),而備選方案是優先能力清單所規定的優先事項。每個因素都有特定的權重,以反映其相對重要性,并由主題專家單獨或集體分配。每個優先事項都會根據每個因素進行定期評估(例如,每季度一次),并根據適當的尺度進行打分。然后使用適當的MCDA模型計算每個優先事項的總分,并將其可視化,以產生一個能力差距分數。
為了實施擬議的方法,需要完成以下任務:
1.使用一個合適的能力管理框架,確定能力差距的因素和子因素的綜合清單。這些因素是對能力進行評估的性能衡量標準。這些因素可能包括:理論、組織、訓練、物資、資金、政策等。這些因素可以按照高層次因素和低層次子因素的層次結構進行分組,以此類推。
2.使用一個適當的尺度對每個因素的能力進行評級。例如,對資金因素可以使用1到5的量表,其中1表示相當大的資金削減,5表示在某一特定時間點對優先事項有充分的資金供應。對于其他因素,如理論、組織、訓練、物資等,也可以制定類似的評分標準。
3.為已確定的因素分配權重以反映其重要性。這可以基于從個人評估到在主題專家小組之間達成共識的模型等各種方法。
4.通過使用合適的MCDA模型將每個備選方案的權重和評級結合起來,計算出總體的優先級差距分數。這些模型包括加權總和模型(WSM)、加權產品模型(WPM)、加權總和產品評估(WASPA)、通過與理想方案相似度排序偏好技術(TOPSIS)和分析層次過程(AHP)(Parlos,2000)。
5.進行敏感性分析,揭示不同的權重或偏好如何影響能力差距得分。敏感性分析提供了一種手段,以檢查權重和偏好的模糊性或評價者之間的分歧對最終總體結果的影響程度。
6.將不同時期的能力差距得分可視化,以提供一個清晰和簡明的畫面,說明在消除已確定因素的差距方面正在取得或尚未取得的進展。
作為一個多國聯盟,當北約的成員國能夠在短時間內自信地將他們的部隊聚集在一起時,北約是最有效的。因此,一個關鍵的信息要求是了解其國家部隊的互操作性程度。為了有效地傳達這種理解,需要統一的、可重復的、可靠的和結構化的方法和框架。成立SAS-156的目的是為互操作性數據的測量、收集和評估制定一個北約標準。信息時代的要求對不同單位快速、方便、安全地連接和共享信息的能力提出了挑戰,但人和程序的因素仍然同樣重要。作者將介紹他們根據在加拿大聯合作戰司令部的工作經驗,對參與國的現有評估框架進行綜合和擴展的工作。加拿大武裝部隊的經驗特別相關,因為它是北約在拉脫維亞的多國增強型前沿存在戰斗小組的框架國家,并且輪流領導北約常設海上小組。
聯盟和伙伴關系一直是上個世紀成功的大規模作戰行動的一個關鍵組成部分。互操作性--為實現戰術、作戰和戰略目標而一致、有效和高效地共同行動的能力--是取得成功的關鍵。北約國家和合作伙伴了解互操作性的重要性,并且已經和正在收集關于行動和演習及活動的大量數據,以評估多國聯盟能夠實現互操作性的程度。然而,諸如缺乏標準術語等障礙仍然存在,而且可靠和有效的數據收集方法仍然難以找到。為了彌補這一缺陷,向系統分析和研究(SAS)小組提出的技術活動建議在2019年獲得批準,由此產生的后續活動,即北約任務組SAS-156 "制定評估多國互操作性的標準方法",正在追求這些明確的研究和利用目標:
幫助北約實現互操作性數據定義、收集和管理的標準。
讓軍事規劃人員更好地了解他們與合作伙伴的互操作性狀況,并在他們之間以共同的方式討論這些評估。
為追求自身互操作性目標的各個國家的資源配置決策提供依據。
本報告描述了北約第一個多領域小組IST-173所取得的成果。與會者包括來自不同小組和團體的科學家,以及來自北約機構和軍事利益攸關方、學術界和工業界的科學家,這為AI和軍事決策大數據這一主題創造了第一個利益共同體。該團隊在實踐中證明了一種新的STO方法的可行性,即任務導向研究,以激發公開對話、自我形成的研究合作和跨小組活動。此外,該方法還有助于為人工智能和軍事決策大數據這兩個主要能力領域聯合開發北約首個科技路線圖,以應對北約在這些領域面臨的作戰挑戰。由于新的組織(軍事利益相關者積極參與的多領域團隊)和這種創新方法的應用,確定了一些經驗教訓,應該支持軍事決策AI和大數據的進一步操作。