亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

在過去的幾十年里,人工智能(AI)在軍隊中的迅速普及伴隨著緩慢但逐步的積累,人們試圖了解這些AI系統如何工作,以便在軍事行動中取得更好的結果。所謂的 "可解釋人工智能"(XAI)背后的想法,以及驅動它的技術,是這種趨勢的體現。然而,問題是,目前形式的XAI是否是人們期望的解決方案。本簡報以范圍界定工作為模式,試圖涵蓋這些方面的每一個問題,并探討在軍隊中使用XAI的廣泛影響,包括其發展、部署和治理。

引言

軍事用途的潛力往往是世界各地技術創新的驅動力。近年來,用于國防目的的高度先進的顛覆性技術開發和部署顯著增加,而人工智能(AI)已成為這一趨勢的典型代表。僅僅在幾年前,目前人工智能在軍事行動中的應用范圍會被視為虛構的素材。今天,隨著致命性自主武器系統(LAWS)領域新興技術的進步,以及人工智能和機器學習(ML)不斷融入現有軍事計算系統的后端,世界各地人工智能系統的軍事應用只會在數量和強度上有所增加。 伴隨著這種激增的是確保所部署的軍事人工智能系統與人類的使用更加兼容,并具有更小的錯誤幅度的新想法。其中一個想法是開發所謂的可解釋人工智能(XAI),即人工智能和ML系統,使人類用戶有可能理解、適當信任并有效管理人工智能。

本簡報解釋了為什么這種系統在軍事上是必要的,什么是XAI,它是如何運作的,到目前為止它在哪里和如何被應用的例子,并評估了它的使用和監管。本簡報使用了主要和次要的研究資料,包括采訪來自不同地域和學科的專家利益相關者,他們目前或曾經來自政府、國防部門、民間社會和學術界。它旨在分析XAI在軍隊中的現狀,并為更有針對性的研究鋪平道路

對 XAI 的需求

人工智能的雙重用途特性確保了其開發和部署中用于民用目的的任何升級也可以應用于其軍事對應物,反之亦然。例如,以色列軍隊使用面部識別軟件來解鎖手機并幫助自動標記社交媒體上發布的圖片中的朋友,以尋找和跟蹤巴勒斯坦的軍事目標。烏克蘭國防部也在使用同樣的軟件來識別潛在的臥底或死亡的俄羅斯士兵。在其他地方,阿塞拜疆在納戈爾諾-卡拉巴赫沖突中使用基于人工智能的計算機視覺程序為特斯拉這樣的自動駕駛汽車導航,為自主無人駕駛飛行器(UAV)導航。 在美國,像那些為流媒體平臺上的個人用戶定制觀看清單的算法,預計將成為武裝部隊認知設備的一部分,在通信受阻或資源有限的環境中為士兵提供建議。

事實上,從法國等擁有完善的軍事人工智能生態系統的國家,到印度等在這一領域新興的國家,全球各國都在投資數百萬美元用于人工智能。這些國家認識到,人工智能是軍事行動中的力量倍增器,通過上下文處理大量數據,識別趨勢、模式、感興趣的人和物體,在關鍵和非關鍵的軍事功能中試行系統和程序,以及預測和建議行動方案,這可能有助于在高風險、時間敏感的情況下協助,或在某些情況下甚至取代人類決策。

人工智能也有可能用于防御性軍事用途,并且可以被訓練來識別、標記和消除惡意軟件。在操作上,人工智能可以使軍事團隊保持或擴大作戰能力,而不需要增加或提高人員力量,這兩者都需要時間和額外的經常性費用,而軍隊可能無法或不愿抽出時間。

盡管有所謂的優勢,然而,人工智能的軍事用途并非沒有重大挑戰。人工智能系統可以被有目的地規劃以造成死亡或破壞,無論是由用戶本身還是通過對手對系統的攻擊。即使根據適用的準則對人工智能系統進行了嚴格的測試和驗證,也可能存在或發生不可避免的誤差,從而造成意外傷害。事實上,即使是已部署的人工智能系統的 "常規"操作,也存在著只有在輸出階段才能發現的故障。在這一點上,這種疏忽的結果可能已經是不可逆轉的,并可能在損害人員、設備和/或信息方面對軍事行動造成不可彌補的損害。

此類故障的一個主要原因是有缺陷的訓練數據集和命令,這可能導致關鍵信息的錯誤表述以及意外的偏見。另一個也許更具挑戰性的原因是系統內的算法問題,這些問題對用戶來說是無法檢測和解釋的。因此,眾所周知,人工智能產生的輸出是基于虛假的關聯和不遵循預期規則的信息處理,類似于心理學中所說的 "聰明的漢斯效應"。

一項跟蹤1988年至2021年各行業133個人工智能系統中公開可用的偏見實例的研究發現,44.2%(59個系統)表現出性別偏見,25.7%(34個系統)同時表現出性別和種族偏見,這是由于用于訓練這些系統的數據集的質量以及它們的算法。移植到沖突環境中,部署這樣的人工智能系統可能意味著,例如,一個屬于該程序有偏見的種族的婦女,因此屬于被偏見雙重困擾的種族和性別的交叉人口,可能被自主武器系統(AWS)的計算機視覺或面部識別軟件誤認為是一個非人類物體。因此,即使自主武器系統被設計為不與人類打交道,該系統也會認為與她打交道是符合其編程規則的,并可能導致她受傷或死亡,因為它不認為她是人類。這種不準確的結果是被稱為人工智能的 "黑盒",即人工智能和ML系統內的算法處理,人類操作員無法解釋或理解。

XAI 實驗

為了應對黑盒問題以及在軍事行動中應用黑盒可能造成的意外傷害,美國國防部下屬的國防高級研究計劃局(DARPA)在2016年開始了一項多項目計劃,開發 "白盒"或 "玻璃盒"XAI,以確保AI系統的可解釋性和可理解性,并帶來有效的人機互動(見圖1)。雖然'XAI'這個術語相對較新,但這個想法卻不是:自1970年代中期技術研究人員研究專家系統的解釋時,'可解釋性'問題就已經存在了。在DARPA宣布之后,圍繞XAI的興趣越來越大,一個利基研究生態系統開始出現,以了解如何使雙重用途的人工智能應用更加可解釋和可理解。

雖然對XAI是什么沒有統一的定義或定性--計算模型、人工智能應用的最佳實踐或兩者的混合,但來自技術和非技術領域的研究人員都潛心開發或以他們自己的方式解釋XAI。軟件專業人士試圖設計基于人工智能和ML的系統,以測試系統對人類終端用戶的可解釋性,并觀察到大多數實現XAI的方法往往屬于兩大類之一:事前和事后。

前期方法包括使用能夠執行低級人工智能功能的基本模型。它們確保了人工智能系統在整個信息處理過程中具有內在的可解釋性,因為它們的處理和決策都很簡單。同時,事后方法是指在自己獨立的處理模型中,將從另一個底層黑盒模型中收到的輸出賦予透明度。這些方法可以是模型不可知的,即適用于任何類型的被視為黑盒的模型;也可以是模型特定的,即僅限于在某些類型的模型上操作,與某種模型邏輯相對應。

雖然這兩種方法都確保了可解釋性的閾值,但發現前述方法在現實世界的應用潛力和可擴展性方面受到很大限制。據觀察,性能較高的人工智能系統由于產生其輸出的更復雜的處理過程,其可解釋性和可理解性仍然較低,而性能較高的系統由于其簡單的參數和信息處理,默認為性能較低。

然而,假設性能較高的人工智能系統會比性能低的系統做出更準確或無偏見的決定,這是不正確的。衡量人工智能系統的性能水平與發現其缺陷和理解其以某種方式處理信息背后的原因有多難成正比。這種性能-可解釋性的權衡仍然是XAI的一個主要問題,而較新的模型和方法的開發仍然面臨著解開它的挑戰。

探索 XAI 的應用

XAI的持續發展被設想為引領 "第三波 "人工智能系統的到來,在這種情況下,人工智能機器能夠理解它們所處的背景和環境,并建立自己的基礎解釋模型來描述真實世界的現象。雖然圍繞人工智能的研究最初是由于美國的軍事利益而出現的,而且美國一直是這一領域的先驅,但在過去的五年里,世界其他地區也出現了人工智能的民用用途。這些都為可解釋和可理解的人工智能系統是各方面的優勢創新這一想法提供了全球的合法性。

到2019年,谷歌、微軟和IBM等大科技公司已經推出了各自的XAI工具包。富士通實驗室和日本北海道大學等醫療服務提供商宣布開發一項基于XAI的新技術,通過識別患者過去醫療數據的相互聯系,為他們的健康提供定制化建議。在金融服務領域,由中國第一家數字銀行WeBank牽頭的XAI標準開發項目于2020年獲得電氣和電子工程師協會(IEEE)的批準,這標志著世界上第一個專門解決人工智能在銀行應用中的黑匣子問題的行業標準。

XAI的這種應用證明了人工智能系統及其相關功能的普遍性,并強調了主要為軍事目的引入的技術如何能夠具有跨領域的民用效用。此外,XAI的民用應用的相對低風險功能可以使其在民用架構中的應用比軍用架構更快,最終在潛在的軍事部署之前為其某些用例特征提供了一個無意中的測試場。

鑒于今天的國防形勢,一些國家已經啟動了將人工智能納入其國防架構的項目。例如,美國計劃在2022年花費近10億美元開發數百個新的軍事人工智能項目,中國的目標是利用人工智能積極實現戰爭戰術的 "智能化",俄羅斯正在逐步開發150個支持人工智能的軍事系統,以色列正在努力系統地將人工智能納入其軍隊的所有系統中。印度政府今年也表示,它計劃在2024年前開發出25種國防專用人工智能產品。雖然開發和部署人工智能似乎是一個最近的問題,需要對國防技術和人工智能倫理之間的交叉點進行更深入的分析,但一些國家已經公開宣布他們打算這樣做。

2020年,瑞典國防研究局啟動了關于XAI在軍事中使用的研究,其多管齊下的目標如下:a)支持軍事終端用戶創建人工智能系統如何運作的心理模型;b)允許專家從人工智能系統的隱藏戰術和戰略行為中獲得洞察力和提取知識;c)幫助開發人員識別缺陷或錯誤,并在系統部署前解決這些問題;以及d)更有效地遵守戰爭規則。

同年,印度海軍在INS Valsura號上開始通過征集論文探索在海上行動中開發和應用XAI的可能性。他們的理由是,在使用人工智能技術時,由于黑盒的存在,往往存在信任上的差距,如果決策者不信任人工智能在國防部門推薦的決策,高層就不愿意采用這種技術。

美國國防部今年也進一步涉足XAI,并征集開發XAI模型用于指揮和控制決策輔助工具的申請,以用于多域作戰(MDO)的戰爭游戲。最近,在2022年6月,英國國防部(MoD)結合他們的《2022年國防人工智能戰略》發布了一份政策文件,強調了國防中人工智能的道德使用原則。其中一項原則名為 "理解",強調了黑匣子問題如何使與國防有關的人工智能系統難以解釋,但解釋和理解系統的機制必須是系統設計的關鍵和明確的一部分,貫穿其整個生命周期。本文考慮了英國信息專員辦公室(ICO)和艾倫-圖靈研究所與Project ExplAIn合作的先前工作--三人早些時候在2020年發布了一份關于XAI的文件,以符合法律要求以及技術和治理最佳實踐的方式,為解釋人工智能系統做出的決定提供實用建議。

很明顯,許多國家已經開始為國防目的更具體地參與XAI,但至今還沒有監測和分析任何進展指標的例子。它們對XAI的承諾和在軍隊中的運作的有效性,只能在幾年的較長時期內確定下來。

來自 XAI 的期望

XAI顯然是人工智能范式中一個備受關注的主題,但圍繞它的迷戀是合理的嗎?

雖然XAI無疑有其優勢,但它的發展和部署也引起了合理的關注。其中最重要的是它的性能與可解釋性之間的權衡:如果可解釋性--這是XAI的主要屬性,也是其他道德AI方法的基礎--與AI/ML系統的性能相反,政治家和立法者會認為繼續研究和投資XAI有好處嗎?對XAI的重新研發可能最終會帶來突破,即有效的XAI模型可以被整合到高性能的人工智能系統中,但目前還沒有跡象表明這種發展的時間安排。

即使出現了這樣的突破,它是否足夠?一些專家認為,在XAI系統中可能總是存在可解釋的缺陷,因為系統提供的每一個解釋都會掩蓋另一個潛在的解釋。因此,我們的愿望不應該是用有效的XAI模型來全面完成高性能的人工智能系統,而應該是一個更簡單的,盡管也更難實現的XAI模型,它提供了關于人工智能系統信息處理的背景清晰度--誰需要知道什么,以及XAI模型應該如何向他們展示這些。一個建議的方法是通過設計來確保這一點:設計一個所需解釋的框架,由XAI模型沿著這個框架生成解釋,并由機器學習支持的終端用戶對輸出進行評估,以確保未來更好地遵守該框架。

除了試圖修復XAI模型中的性能-可解釋性權衡之外,還必須考慮操作中的人類部分,因為他們往往成為科技化的指揮鏈中最薄弱的環節。對原始DARPA項目的監測和評估表明,用戶解釋XAI模型提供的解釋的認知負荷會阻礙用戶的表現。這意味著,即使XAI模型向人類操作者解釋他們的過程,后者也需要精通動態的、往往是不統一的模型。通過適當的培訓,必須確保XAI模型的終端用戶對人工智能功能的可理解性,否則,系統的可解釋性將毫無意義。由于即使是人類也不能證明自己的所有行為,因此需要制定具體的原則來規范用戶對XAI所提供的解釋的接受程度。

還應通過對XAI系統的研究來制定原則,最終導致制定人工智能在其獨立領域使用的標準和許可。例如,歐盟(EU)在2019年批準了一個為期六年的項目,研究XAI的民用應用前景和細節,重點是如何設計ML模型的透明度,產生可控的黑箱解釋,并制定人工智能的倫理和法律標準。民間社會也渴望開發可解釋的負責任的人工智能解決方案,盡管這只是為民事應用打下基礎。

在應用診斷框架方面,來自谷歌、微軟和IBM的研究人員在2019年創建了兩個負責任的人工智能許可證(RAIL),這構成了世界上第一個獨立、認可的負責任的人工智能認證計劃。許可證在可解釋性、公平性、問責制、穩健性和數據質量這五個方面對人工智能/ML系統進行測試,以確定其作為負責任的人工智能應用的地位。在類似的行動中,責任人工智能研究所在2022年發布了他們的RAII認證的測試版,該認證是在世界經濟論壇(WEF)的全球人工智能行動聯盟(GAIA)下開發的。RAII認證是通過風險效益分析、校準評估框架、與專家驗證結果、以及由獨立委員會測試和評估結果的強大過程來最終確定的。

軍事XAI的支持者應該推動復制類似的標準和許可,以便在軍事AI架構中進行整合,確保其AI系統內的可解釋性、可靠性和偏見問題在制度上得到解決,無論在個別情況下是否有政治意愿這樣做。例如,一些國家不愿意承擔對致命性自主武器系統進行標準化法律審查的義務,而傾向于采用更加自愿和/或依靠自身參數的內部審查。雖然軍事XAI標準或認證將是重要的第一步,也是同期的解決方案,但從長遠來看是不夠的。私營公司和軍事承包商等單一的利益相關者零散地開發XAI和相關的負責任的人工智能框架,可能包括潛在的既得利益和后續標準化的問題。軍隊中的XAI需要有獨立的監督和有效的治理機制,而不是把它當作軍事AI開發的另一個勾選框。

結論

XAI的開發和使用,特別是在軍事應用中,仍然是新生事物,既沒有明確它是如何被全面開發的,也沒有一個標準化的方法來規范已經開發或正在開發和部署的內容。在對軍事領域的XAI進行分析時,有兩個關鍵啟示。

現在,技術超越法律的情況越來越普遍,在軍事人工智能等領域更是如此,這些領域是激勵技術革新的先鋒。雖然XAI通常會被看作是一種具有積極價值的技術,但歸根結底,它只是軍隊使用的另一種工具,和其他工具一樣有其固有的優點和缺點。因此,它需要在一個治理框架內發展,以指導其有效和道德的使用,并防止其容易被潛在的濫用、無效或多余。

對XAI的研究似乎仍然是零散的、部門性的,而且大多集中在某些地緣政治空間,這造成了知識孤島,限制了新思想的傳播。此外,具體到軍事領域,圍繞XAI有很多理想主義,因此需要進行批判性的分析和平衡的研究,以便對其前景提供一個整體的視角。未來對這一問題領域的研究應尋求彌合這些差距,進行更多跨學科和跨部門的分析,同時嘗試收集和納入來自不同背景的觀點。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

(2021年11月10日,在荷蘭弗里皮爾舉行的北約反無人機系統技術互操作性演習中,無人機在無人機群演示前處于起飛位置。)

美國防部(DOD)和美國政府在敵方使用小型無人駕駛飛機系統(sUAS)方面面臨著重大國家安全挑戰。創建集群能力的現有技術導致了多層次和無法管理的威脅。本文討論了如何準備和應對這一迫在眉睫的挑戰,俗稱“無人機蜂群”。傳統思維和實踐的基本挑戰推動了對無人機蜂群的關注。一些未解決的問題包括無人機蜂群對美國的潛在利益與威脅。迄今為止,沒有任何方法能充分解決美國對無人機蜂群的戰略風險。盡管美國防部戰略包括一些應對敵方無人機威脅的方法,但它并沒有完全面對挑戰,而要解決未來武裝無人機蜂群帶來的戰略問題,就必須面對這些挑戰。為了減輕這種新出現的風險,美國需要一個協調的方法來解決技術、法律和條令問題。

1 戰略環節

美國目前的戰略文件為確保和推進國家利益提供了總體要求。然而,新出現的威脅和潛在的無人機蜂群技術威脅著美國的安全態勢。例如,2017年美國國家安全戰略指出,“我們將保持一個能夠威懾并在必要時擊敗任何對手的前沿軍事存在”。隨著美國軍隊在全球范圍內的廣泛投入,對手可以利用無人機蜂群來挑戰美國在許多領域的利益;如果是這樣,美國軍隊就不能可靠地投射力量來威懾和擊敗這些同樣的對手。

此外,《美國國防戰略》認為戰爭的特點在不斷變化,行為者可以更迅速、更容易地獲得技術,包括人工智能(AI)、自主性和機器人技術。時任美國防部長詹姆斯-馬蒂斯在2018年說明了這種擔憂,他承認國土不再是一個避難所,必須預測針對“關鍵的國防、政府和經濟基礎設施”的攻擊。無人機蜂群構成了重大的國家安全戰略風險,應對這一新興威脅給美國帶來了三個關鍵領域的挑戰和機遇:技術、法律和理論。

2 奠定基礎:新興趨勢

關于作戰無人機系統使用的研究文獻揭示了以創新方式改變戰爭特征的潛力。技術革命使行為者能夠利用無人機來實現國家目標。最近發生在南高加索地區的納戈爾諾-卡拉巴赫爭議地區的戰爭說明了這一現實。阿塞拜疆對無人機系統的使用極大地幫助了它的勝利,支持了它對亞美尼亞的空中和地面作戰,而亞美尼亞擁有更多的常規空中和地面部隊,包括戰斗機和坦克。此外,這場戰爭說明了使用無人機系統來摧毀防空系統、地面部隊和裝甲車輛的優勢,包括空中能力成本相對低廉。這些系統可以憑借其相對較小的尺寸和較慢的速度避開敵人的防空系統,而且它們在常規沖突中為不太富裕的國家提供了潛在的軍事優勢。這種力量的再平衡表明,國家可能會在未來的沖突中更多地使用無人機系統來脅迫他們的敵人,促成外交上的讓步,并實現國家安全目標。遙控飛機是改變戰爭性質的工具,而小型無人機的創新使用說明了下一步的改進,其成本低,回報潛力大。

除了目前無人機系統的應用,這些航空器的未來發展趨向于更加復雜,在人工智能、自主性和機器學習方面將取得更多進展。這些術語可能會使一些人想到虛構的作品,如《天使降臨》(2019),這部電影中,小型螺旋槳驅動的無人機從地面的管道發射,攻擊美國總統和他的特勤人員。然而,在現實中主要軍事大國目前都在追求這種能力。

中國電子信息技術研究院在2020年9月測試了從地面和空中發射器發射和使用多個sUAS的蜂群編隊。此外,美國海軍研究辦公室和國防高級研究計劃局近年來進行了廣泛的測試,使用大量的無人機相互協調進行偵察,編隊飛行,或可用于向目標投放彈藥。2020年9月的一次演習顯示,俄羅斯也在繼續追求用三種型號的無人機系統進行集成編隊,打擊地面目標。雖然這本身不是無人機蜂群,但一位俄羅斯專家指出:“在這一點上,俄羅斯有很多關于UAV蜂群使用的研究,并對這種概念進行了測試和評估。”

民用無人機蜂群的發展表明,這是一項雙重用途的技術。在過去的幾年里,對無人機能力的需求不斷增加,因為各公司為編排好的展示活動編排了數以百計,有時甚至數以千計的無人機系統。例如,英特爾在2018年創造了一次展示中無人機數量最多的世界紀錄,有2066架。英特爾特定型號的無人機在眾多活動中飛行,包括2018年冬季奧運會和2017年超級碗的半場表演。最近,無人機表演為當選總統喬-拜登的特拉華州勝利慶典展示了蜂群能力。可以想象,一個邪惡的行為者可能會控制大量無人機,對涉及國家元首或大量人群的活動進行破壞。伊朗在2019年9月對沙特阿拉伯最大的原油穩定廠之一進行了無人機攻擊,顯示出不同尋常的復雜性,并且還在試驗同時對50個目標使用大量無人機。無人機蜂群的軍事和民用趨勢預示著美國的力量可能會在未來受到挑戰。盡管各行為體尚未使用真正的小型無人機蜂群來對付對手,但該技術的攻擊應用并不遙遠。

3 戰略風險及影響

各國應在仔細考慮其風險和影響后,規劃使用無人機群。一些文獻承認無人機蜂群在某些戰略軍事背景下的概念性應用。例如,一位戰略專家認為,完全自主武裝型無人機蜂群(AFADS)是蜂群應用的一個子集,可以被視為大規模殺傷性武器(WMD)。美國陸軍應用兵棋推演方法證明了無人機蜂群武器如何在平行攻擊中提供作戰優勢。美國防部關于使用自主系統的發起人之一指出:部署完全自主的武器將是一個巨大的風險,但這可能是一個軍隊值得承擔的風險。這樣做將會進入未知的領域。敵對行動者正積極試圖破壞戰時的安全行動。而且在行動時,沒有人可以干預或糾正問題。

大國可能愿意承擔這種風險;正在開發能夠獨立于人類操作者做出決策的自主武器。前美國防部長馬克-埃斯佩爾指出了美國和其他大國在自主武器發展方面的這種區別。一些評論家斷言,自動防御系統提供了軍事優勢,包括自由打擊覆蓋戰略資產的傳統防空系統或對核和支撐能力進行監視。

各國必須考慮自主武器計劃的戰略影響。一個行為者向對手使用無人機蜂群可能導致意外升級,而一個意外的人工智能決策可能無意中導致敵人反擊或外交危機。國際上的討論還沒有涉及到使用完全自主武器在“危機穩定、升級控制和戰爭終止”方面的戰略考慮。許多專家同意,自主武器系統可能在危機或武裝沖突期間提供作戰優勢,特別是在灰色地帶或混合戰爭中,但戰略風險要求決策者現在就考慮這些危險,以避免以后出現災難性的結果。完全自主的武器系統增加了誤判和/或誤解的風險,這可能導致國家和非國家競爭者之間不受控制的風險升級。這包括使用大規模毀滅性武器的威脅增加。盡管采用自主無人機蜂群存在固有的風險和后果,但這些能力為行為者提供了實現國家目標的軍事和戰略選擇。有人類參與的半自主無人機蜂群武器也會給對手帶來風險,盡管程度較低。

4 重要術語

關鍵術語和分析的范圍將澄清誤解。歐文-拉肖在《原子科學家公報》中寫道,將蜂群無人機定義為“分布式協作系統......成群的小型無人駕駛飛行器,可以作為一個群體移動和行動,只需有限的人類干預”。蜂群的另一個定義規定了軍事應用,“大量分散的個體或小團體協調在一起,作為一個連貫的整體進行戰斗”。根據美國防部指令3000.09,自主武器系統,“一旦啟動,就可以選擇和攻擊目標,而無需人類操作員進一步干預”。美國國家科學、工程和醫學研究院規定,無人機蜂群是指40個或更多的無人機系統,該群體作為一個單位,有各自的行為,所有成員都不知道任務,成員之間相互通信,每個無人機系統“會相對于其他無人機系統進行定位”。這些創新包括人工智能、自主性和機器學習的應用,以及美國防部指定為1、2和3組的sUAS進步。sUAS作為一個整體執行任務,包括情報、監視和偵察以及進攻性攻擊。在本文的其余部分,這種威脅將被稱為無人機蜂群。

5 技術可行性

對抗(或稱反制)無人機蜂群提出了三個領域,這對五角大樓和負責保衛美國國土的國家機構來說既是挑戰也是機遇。第一個領域,即技術,美國防部的工作集中在硬件解決方案上。在2021財年,美國防部最初計劃“在反無人機系統(C-UAS)的研究和開發上至少花費4.04億美元,在C-UAS的采購上至少花費8300萬美元。”所有軍種都追求各種尖端技術解決方案來探測、跟蹤、識別和擊敗目標。用于探測的硬件解決方案包括雷達以及電子光學、紅外和聲學傳感器;所有這些都因小型無人機的表面特征和相對速度而限制了其有效性。另一種技術涉及操作員可能需要控制無人機無線電指令信號的探測。擊敗機制包括干擾、欺騙、槍支、網、定向能和標準防空系統等方法。然而,目前的能力給操作者帶來的結果是好壞參半的。目前的措施主要是針對數量較少的無人機,而這些無人機并沒有表現出蜂群行為能力。其他方法,包括美國空軍和國防部在作戰環境中測試的高功率微波(HPM),可能提供更有效的能力來對付無人機蜂群,但專利方面的挑戰可能會限制其有效性。誠然,美國防部可能正在追求更先進的HPM武器,其基礎設施足跡更小,如Leonidas系統,但目前的研究僅限于非保密來源。

美國防部的反無人機系統(C-sUAS)戰略承認了無人機蜂群帶來的戰爭特征變化,但并沒有提到具體的解決技術。考慮到對抗無人機蜂群的近期要求,當前技術的重大局限性給行業帶來了挑戰。此外,美國防部可能沒有關注無人機蜂群的新威脅。相反,開發和采購工作表明,重點是傳感器和武器,以擊敗目前的無人機系統。美國防部2021財年的C-UAS預算主要針對當前設備進行開發,沒有考慮滿足未來需求的技術創新。在COVID-19大流行期間和之后美國防部預算下降的環境下,這種方法可能被證明是低效的,并造成重大風險。各國開發無人機蜂群技術的速度表明,其成熟速度比應對此類威脅的設備成熟速度更快。

觀察家們注意到需要快速創新以減輕不斷上升的威脅,但目前的國防工業基礎面臨著變革的障礙,包括軍事文化和新的商業技術測試。快速創新的一個更常見的問題源于對商業產品的收購,其中知識產權成為系統部署使用的很大障礙。當公司的設備或軟件不一定能互操作時,這個問題就會變得很嚴重,使C-sUAS操作者無法獲得擊敗目標所需的融合、及時和有用信息。軍事文化不一定會獎勵創新的思想家,并且很可能成為快速變革的障礙。雖然美國防部目前的C-sUAS戰略確定了無人機蜂群的威脅,但它沒有充分解決國防部必須如何克服高成本和創新遲緩的技術風險。

(2022年8月14日,在密歇根州格雷靈營地,分配給美陸軍第37步兵旅戰斗隊總部的上士Noah Straman 在北方打擊行動期間發射了DroneDefender)

6 合法的可接受性

C-sUAS戰略的第二個風險來源是在法律限制,特別是在國土上。現行法律為國土上的美國公民提供保護,同時也抑制了美國防部在軍事設施上保護無人機威脅的能力。鑒于無人機的威脅能力和檢測限制的多重影響,無人機蜂群加劇了這種限制所帶來的風險。C-sUAS戰略宣稱,美國防部的主要利益相關者必須與合作伙伴合作才能取得成功。這一當務之急應推動立法解決方案,以擴大這種反無人機設備運行的國內環境權限。

C-sUAS戰略強調了在國土上操作反無人機能力的重大法律挑戰,并斷言:“許多現有的法律和聯邦法規在設計時并沒有將無人機系統作為威脅來處理,而技術變化的持續速度使得法律當局很難跟上步伐。”目前的法律不允許及時發現潛在的無人機威脅,這些威脅可能來自軍事設施之外。《美國法典》(USC)第10條第130i款授權國防部長和武裝部隊指定人員采取所有動能或非動能行動,以“禁用、損壞或摧毀”對“所涉設施或資產”構成威脅的無人駕駛飛機系統。這一法律限制使操作者無法在潛在的無人機威脅到達目標之前將其擊敗。

盡管《美國法典》第10章第130i條授權國防部“在未經事先同意的情況下......通過攔截或以其他方式獲取電訊或電子通訊,探測、識別、監測和跟蹤無人駕駛飛機”,但它并沒有明確說明這一權力是否延伸到基地的邊界之外;如果可在邊界之外,就會給國防部提供戰術優勢。新的授權也不清楚美國防部是否可以在不違反情報監督指令的情況下,在其管轄范圍之外收集所需的無人機信息。此外,針對潛在的無人機蜂群威脅收集此類信息可能會擴大責任。探測目標還需要區分敵方和友方的無人機,鑒于目前的權限,處理與合法民用飛機有關的具體信息可能會有問題。

根據C-sUAS戰略,美國防部必須采取多邊行動,并與執法機構分享威脅信息,如10 USC 130i所允許的。這可能的一種方式是在國家安全特殊事件(NSSEs)期間,聯邦調查局(FBI)可以有臨時的權力來反擊無人機,而無需首先獲得授權。2018年《預防新威脅法》授權國土安全部(DHS)和司法部(DOJ)“通過基于風險的評估,減輕無人駕駛飛機......對設施或資產的安全或安保構成的威脅”。在最近的案例中,聯邦調查局與聯邦航空管理局(FAA)合作,在2020財政年度期間,包括2020年超級碗、2019年世界大賽、2020年玫瑰碗比賽、華盛頓特區的“A Capitol Fourth”和紐約市的新年慶祝活動中,成功對抗了超過200架無人機。聯邦調查局還與國土安全部以及佐治亞州的州和地方執法部門合作,在2019年超級碗比賽期間對抗54起無人機入侵事件;在體育場周圍的臨時飛行限制期間,至少有6架無人機被沒收了。

2018年《預防新威脅法》的描述內容與《美國法典》第10篇第130i條的授權非常相似,但仍不清楚國土安全部、司法部和國防部如何進行實際合作。首先,NSSEs是臨時性的,如果沒有永久性的授權,通過機構間的協調對威脅進行早期預警的優勢幾乎可以忽略不計。對手很可能不會在NSSE期間對國防部資產發動無人機蜂群攻擊。其次,如果國防部發現了其管轄范圍之外的威脅并警告國土安全部或司法部,聯邦、州或地方執法部門不太可能有時間和能力來攔截無人機蜂群威脅。

地方執法部門和私人實體有更少的權力來對抗無人機。根據國土安全部、司法部、交通部和聯邦通信委員會最近的咨詢,采用反無人機技術的非聯邦公共機構和私人可能違反聯邦法律。法律將無人機定義為飛機,任何破壞或摧毀無人機的工具都可能引發涉及《飛機破壞法》和《飛機海盜法》的責任。那些使用無線電頻率探測的人可能會涉及《竊聽/陷阱法》和《竊聽法》的訴訟負責,這取決于該能力是否記錄或攔截無人機和控制器之間的電子通訊。

最后,附帶影響可能導致當地執法部門或私人實體重新考慮采用這些能力。杰森-奈特對城市地區警察機構的考慮進行了分析,并提到了反無人機技術干擾合法地面和空中活動的例子。目前的授權并沒有為國防部對抗無人機群所需的預警能力提供全面的法律基礎。盡管在某些情況下,與東道國或在應急地點的多邊協調可能為防御者提供優勢,但鑒于美國防部的法律限制,在可能試圖使用無人機蜂群來對付關鍵基礎設施時,國土為對手提供了優勢。

(2022年3月30日,第3海軍陸戰隊第9工兵支援營沿海工兵偵察隊的戰斗工程師海軍陸戰隊下士Chance Bellas在菲律賓克拉韋里亞的Balikatan 22期間組裝了小型無人機系統VAPOR 55)

7 條令(理論)適用性

C-sUAS戰略的最后一個障礙是關于有效使用反無人機設備的一個重要但被忽視的方面。該戰略宣稱,隨著技術的成熟,需要制定條令,但僅僅承認企業的需求并沒有解決規劃誰可能操作這些設備的重大挑戰。現在確定條令上的需求將減輕未來的能力差距。美國陸軍必須在保衛空軍基地免受未來無人機蜂群威脅方面發揮更大作用。

采用反無人機能力的一個獨特方面是,它包括在所有領域的行動。具體來說,在空中瞄準和減輕對手的巨大挑戰,需要對三個主要任務領域的分工進行清晰的評估:防空、部隊保護和空域控制。從這些任務領域中提取部署原則對于規劃反無人機能力的戰略用途是有價值的。聯合條令是基于目前的部隊結構和幫助解決復雜問題的責任。規劃對抗無人機蜂群的方法需要對聯合條令中的角色和責任進行更深入的評估。

條令必須考慮到培訓未來在所有領域發揮作用的設備操作人員。在空中領域的操作需要對防空、部隊保護和空域控制有充分了解和精通的人員。設計一個與技術和設備同步發展的部隊結構并為其提供資源,將更有效地阻止和對付先進的威脅。這一發展推動了反無人機蜂群條令開發的權威指導,其也是C-sUAS聯合辦公室(JCO)作為國防部執行機構責任的一部分。此外,聯合辦公室將“協調C-UAS的聯合作戰概念和聯合條令的發展”。然而,這種責任描述沒有考慮到目前國防部各部門在空域控制、部隊保護和針對無人機蜂群威脅的防空方面的角色挑戰。專注于對抗地面威脅的部隊保護軍事人員并不具備對抗空中威脅同時避開友軍飛機的必要知識。對這些人員進行空域環境、電磁波譜、空間作業和天氣等相關培訓,將使他們更有效地運用能力來對付無人機蜂群。在防空方面重疊的責任,特別是美國陸軍和美國空軍之間的責任,可以解決此條令上的挑戰。然而,各軍種都依賴部隊保護專家,這給業務帶來了風險。

條令還包括對角色和任務的劃分,特別是在空軍基地的防空方面。越南戰爭和伊拉克戰爭迫使高級軍事指揮官和各軍種將能力分配給傳統任務,而犧牲了支持戰略和作戰目標的空軍基地防御。特別是陸軍和空軍,自二戰結束以來,一直在為地區和點狀防空任務的具體作用而爭斗。2020年蘭德公司的一項研究強調了目前的辯論:今天,美國陸軍負責為空軍基地和其他固定設施提供點式AMD(防空和導彈防御),但兩軍多年的忽視導致了能力上的不足......陸軍領導層將其機動部隊的移動式短程防空置于固定設施防御之上。

在美國陸軍對海外和國內主要作戰基地的防空資源進行優先排序之前,戰略和戰役目標很容易被無人機蜂群影響。此外,空軍可能會繼續倡導和獲得C-sUAS的能力,而沒有條令上的決議。空軍可能會實現其長期以來的愿望,即在戰術防空方面發揮更大的領導作用——這將與聯合司令部的任務相矛盾,即避免重復工作并獲得效率。同樣,其他軍種可能會繼續購買設備進行試驗,如果沒有跨領域和職能協調,這可能不是最佳或有效的。

蘭德公司的報告還詳細說明了陸軍和空軍在防空方面的角色錯位。2020年的一份國會研究報告提出了一個重要問題:“計劃中的SHORAD(短程防空)部隊結構和能力是否足以應對預測的未來挑戰?”該報告表明,陸軍計劃在現役和后備部隊之間增加18個營的防空能力,這可能不足以滿足支持歐洲威懾倡議和太平洋威懾倡議的陸軍部隊需要。這些能力包括應對無人機系統的威脅,但不包括保衛空軍關鍵資產和主要作戰基地的假定任務。盡管聯合出版物3-0《作戰》要求整合進攻和防御能力,以實現對敵方無人機的空中優勢和部隊保護,但它并沒有明確規定各軍種的角色和任務。這種理論上的模糊性增加了SHORAD資源不足的危險,以應對未來無人機蜂群的倍增效應。

新興技術的發展和使用無人機蜂群可能性的增加使得有必要對條令和軍種的作用進行重新評估。事實上,空軍參謀長已經敦促國防部長辦公室對各軍種的角色和任務進行審查,以確定聯合作戰概念的領導組織,如遠程精確射擊和攻擊下的后勤。這兩個概念都與保護戰略資產免受潛在的無人機蜂群攻擊有關。此外,美國防部缺乏條令指導可能也表明需要評估機構間的概念和方法,以便在民事管轄范圍內采用類似的能力。JCO及其國防部戰略將為持續的條令開發提供基本要素,但更多的工作必須集中在調整各部門的角色和資源上。

8 建議

美國防部對抗無人機蜂群的新方法必須解決技術快速發展的風險,對手可能利用民用和國防部保護關鍵基礎設施之間的法律縫隙,以及防空、空域控制和部隊保護方面固有的條令挑戰。正如2018年美國國防戰略所指出的,國土不再是一個避難所,而是敵人無人機蜂群的目標,這些蜂群可能具有洲際范圍的能力。

(2021年10月14日,夏威夷波哈庫洛亞訓練區,海軍陸戰隊準下士德米特里-謝潑德在布干維爾II期間進行步兵排戰斗課程時發射無人機)

敵對趨勢必須推動國防工業基地采用相對低成本、快速和人工智能的技術解決方案。最初尋求納入未來技術的“第三次抵消戰略”,為減輕這種風險提供了一個特別有用的方法。該戰略探討了蜂群式無人機、高超音速武器、人工智能和人機協作的最佳組合方式,以在戰斗中提供獨特的優勢,但它并不只關注材料和設備。相反,它考慮了如何最好地將人類的創造力與技術的精確性相結合。當應用于對抗無人機蜂群時,人機協作的概念可以為防空事業提供優勢。解決方案應該包括一系列與人工智能軟件完全整合的傳感器,以便更迅速地識別潛在目標,并提高信心水平。美國陸軍的TRADOC小冊子525-3-1《2028年多域作戰中的美國陸軍》指出,這些特征是人工智能和高速數據處理所希望的,以提高“人類決策的速度和準確性”。

值得投資的人機技術項目包括由人工智能驅動的自主蜂群無人機,以通過斗狗來減輕或摧毀敵人的蜂群。喬治亞理工大學在2017年與海軍研究生院合作進行了這種實驗。此外,美國防部的低成本開發能力包括非動能直接能量武器,如戰術高功率微波作戰響應器(THOR)和混合防御限制空域(HyDRA)計劃。THOR為對抗無人機蜂群提供了一種特別有效的能力,因為與HyDRA激光器相比,其影響范圍更大。然而,如果與綜合指揮和控制(C2)界面連接部署并協調,將人工智能與人類結合起來,該系統可比標準防空能力更有效,成本更低。

C2能力必須能夠更快地確定目標,將傳感器與擊敗機制連接起來,并允許人類操作員迅速選擇更有效的武器。最近的報告表明,聯合司令部正在追求這些能力,并可能要求各軍種開發自己的C2系統,以便最終整合到美國陸軍的前線防空指揮和控制系統。其他C2系統包括美國海軍的CORIAN(反遙控模型飛機綜合防空網絡)能力和美國空軍的多域無人系統應用指揮和控制。然而,這些具體的系統目前似乎并沒有與先進作戰管理系統(ABMS)或擬議的聯合全域指揮與控制(JADC2)架構聯系在一起。最近和剛開始的工作表明,在北大西洋公約組織中將使用JADC2概念將傳感器與射手聯系起來以對抗無人機群的倡議。未來的JADC2架構在概念上可以使人類操作員為自己的目的控制敵方的無人機蜂群網絡。無論哪種創新,“第三次抵消戰略”都為應對未來致命的自主無人機蜂群問題提供了一個潛在的寶貴方法。

在不考慮未來無人機蜂群威脅或人工智能發展活動的情況下,追求不同的和針對具體軍種的C2能力將浪費時間和納稅人的資金。相反,美國防部應更快地將2021財年開發的反無人機蜂群C2能力納入JADC2架構。國會責成國防部長評估綜合防空和導彈防御C2系統,其中包括C-UAS能力,并確定它們是否與新興的JADC2架構兼容。這個框架符合國會對自主或半自主能力的偏好,而且操作和維持成本低。盡管互操作性、知識產權、數據管理和信息保障仍然是挑戰,但將C-sUAS C2系統整合到JADC2架構中,將產生更快的殺傷鏈和潛在更低成本的項目。JCO主任肖恩-蓋尼少將最近承認,這種開放的架構方法可能會在日后帶來巨大的安全紅利。 第二,在國土的現有法律框架內運作,美國防部必須倡導在固定地點有更多的權力來保衛關鍵基礎設施。國會必須在緊急情況下和和平時期授予國防部長更多的權力。該建議必須包括授權操作者在基地邊界之外確定潛在目標。運營商也應該有法律支持,以近乎實時的方式告警當地和聯邦執法機構。

(2021年4月18日,太平洋,分配到第21直升機海戰中隊的海軍二級空勤人員(直升機)丹尼爾-艾爾斯在與兩棲攻擊艦埃塞克斯號的實彈演習中用MH-60S海鷹GAU-21.50口徑機槍向目標無人機開火)

第二,在國土的現有法律框架內運作,美國防部必須倡導在固定地點有更多的權力來保衛關鍵基礎設施。國會必須在緊急情況下和和平時期授予國防部長更多的權力。該建議必須包括授權操作者在基地邊界之外確定潛在目標。運營商也應該有法律支持,以近乎實時的方式告警當地和聯邦執法機構。

幸運的是,聯邦航空局正在推行幾項舉措來對抗敵方無人機。這些計劃包括將無人機納入國家空域系統,以區分友軍和敵軍的無人機。國防部應積極鼓勵聯邦航空局和美國國家航空航天局繼續各自的無人機行業倡議,包括無人機系統交通管理研究,以“確定服務、角色和責任、信息架構、數據交換協議、軟件功能、基礎設施和性能要求,以實現對低空無控制無人機操作的管理”。這些增加的權力,再加上增強的能力,可以縮小民事和軍事管轄權之間的法律差距,以保護國家基礎設施和國防部的關鍵資產。

最后,美國防部必須通過兵棋推演和演習積極磨練理論,以確定空軍基地防空中最合適的角色和職能。隨著無人機技術的成熟和向友軍提出更復雜的問題,盡早建立正確的部隊結構將更有效地應對挑戰。這將需要進行必要的培訓和適當的資源配置,以滿足國會對有效和低成本設備的需求。正如蘭德公司的研究報告所指出的那樣,沒有單一的行動方案,而是通過組合來提供解決方案。然而,角色和職能的重新調整對于成功至關重要。追求適當的聯合討論將為未來對抗無人機蜂群的強大和基于風險的模式提供基礎,并避免過去的戰略錯誤。

付費5元查看完整內容

自動化使系統能夠執行通常需要人類投入的任務。英國政府認為自動化對保持軍事優勢至關重要。本論文討論了當前和未來全球自動化的應用,以及它對軍事組織和沖突的影響。同時還研究了技術、法律和道德方面的挑戰。

關鍵要點

  • 在軍事行動中部署自動化技術可以提高有效性并減少人員的風險。
  • 在英國和國際上,自動化正被用于情報收集、數據分析和武器系統。
  • 英國政府正在開發自動化系統;技術挑戰包括數據管理、網絡安全以及系統測試和評估。
  • 軍事自動化的法律和道德影響受到高度爭議,特別是在武器系統和目標選擇方面。

背景

許多軍事系統都有自動化的特點,包括執行物理任務的機器人系統,以及完全基于軟件的系統,用于數據分析等任務。自動化可以提高某些現有軍事任務的效率和效力,并可以減輕人員的 "枯燥、骯臟和危險 "的活動。 許多專家認為,自動化和自主性是與系統的人類監督水平有關的,盡管對一些系統的定位存在爭議,而且對系統是否應被描述為 "自動化 "或 "自主 "可能存在分歧。英國防部在其 "自主性譜系框架 "中概述了5個廣泛的自主性水平,從 "人類操作 "到 "高度自主"。一個系統可能在不同的情況下有不同的操作模式,需要不同程度的人力投入,而且只有某些功能是自動化的。方框1概述了本公告中使用的定義。

方框1:該領域的術語并不一致,關鍵術語有時可以互換使用。

  • 自動化系統。自動系統是指在人類設定的參數范圍內,被指示自動執行一組特定的任務或一系列的任務。這可能包括基本或重復的任務。

  • 自主系統。國防科學與技術實驗室(Dstl)將自主系統定義為能夠表現出自主性的系統。自主性沒有公認的定義,但Dstl將其定義為 "系統利用人工智能通過自己的決定來決定自己的行動路線的特點"。自主系統可以對沒有預先編程的情況作出反應。

  • 無人駕駛車輛。朝著更高水平的自主性發展,使得 "無人駕駛 "的車輛得以開發,車上沒有飛行員或司機。有些是通過遠程控制進行操作,有些則包括不同程度的自主性。最成熟的無人駕駛軍事系統是無人駕駛航空器,或稱 "無人機",其用途十分廣泛。

  • 人工智能。人工智能沒有普遍認同的定義,但它通常是指一套廣泛的計算技術,可以執行通常需要人類智慧的任務(POSTnote 637)。人工智能是實現更高水平的自主性的一項技術。

  • 機器學習:(ML,POSTnote 633)是人工智能的一個分支,是具有自主能力的技術的最新進展的基礎。

英國政府已經認識到自主系統和人工智能(AI,方框1)的軍事優勢以及它們在未來國防中可能發揮的不可或缺的作用。在其2021年綜合審查和2020年綜合作戰概念中,它表示致力于擁抱新的和新興的技術,包括自主系統和人工智能。2022年6月,英國防部發布了《國防人工智能戰略》,提出了采用和利用人工智能的計劃:自動化將是一個關鍵應用。在全球范圍內,英國、美國、中國和以色列擁有一些最先進的自主和基于AI的軍事能力。方框2中給出了英國和全球活動的概述。

方框2:英國和全球活動

  • 英國 英國政府已表明其投資、開發和部署用于陸、海、空和網絡領域軍事應用的自主和人工智能系統的雄心。最近的投資項目包括NELSON項目,該項目旨在將數據科學整合到海軍行動中;以及未來戰斗航空系統,該系統將為皇家空軍提供一個有人員、無人員和自主系統的組合。在2021年綜合審查發表后,政府成立了國防人工智能中心(DAIC),以協調英國的人工智能國防技術的發展。這包括促進與學術界和工業界的合作,并在紐卡斯爾大學和埃克塞特大學以及艾倫-圖靈研究所建立研究中心。

  • 全球背景 對自主軍事技術的投資有一個全球性的趨勢:25個北約國家已經在其軍隊中使用一些人工智能和自主系統。有限的公開信息給評估軍隊的自主能力帶來了困難,但已知擁有先進系統的國家包括。

    • 美國。美國國防部2021年預算撥款17億美元用于自主研發,以及20億美元用于人工智能計劃。
    • 以色列。國有的以色列航空航天工業公司生產先進的自主系統,包括無人駕駛的空中和陸地車輛以及防空系統。
    • 中國。據估計,中國在國防人工智能方面的支出與美國類似。 分析師認為,這包括對情報分析和自主車輛的人工智能的投資。

俄羅斯和韓國也在大力投資于這些技術。在俄羅斯,機器人技術是最近成立的高級研究基金會的一個重點,該基金會2021年的預算為6300萬美元。

應用

自主系統可以被設計成具有多種能力,并可用于一系列的應用。本節概述了正在使用或開發的軍事應用系統,包括情報、監視和偵察、數據分析和武器系統。

情報、監視和偵察

自動化正越來越多地被應用于情報、監視和偵察(ISR),通常使用無人駕駛的車輛(方框1)。無人駕駛的陸上、空中和海上車輛配備了傳感器,可以獲得數據,如音頻、視頻、熱圖像和雷達信號,并將其反饋給人類操作員。一些系統可以自主導航,或自主識別和跟蹤潛在的攻擊目標。英國有幾架ISR無人機在服役,還有一些正在試用中。這些無人機的范圍從非常小的 "迷你 "無人機(其重量與智能手機相似)到可以飛行數千英里的大型固定翼系統。英國正在試用的一個系統是一個被稱為 "幽靈 "無人機的迷你直升機,它可以自主飛行,并使用圖像分析算法來識別和跟蹤目標。無人駕駛的水下航行器被用于包括地雷和潛艇探測的應用,使用船上的聲納進行自主導航。這些車輛還可能配備了一種技術,使其能夠解除地雷。

數據分析

許多軍事系統收集了大量的數據,這些數據需要分析以支持操作和決策。人工智能可用于分析非常大的數據集,并分辨出人類分析員可能無法觀察到的模式。這可能會越來越多地應用于實地,為戰術決策提供信息,例如,提供有關周圍環境的信息,識別目標,或預測敵人的行動。英國軍隊在2021年愛沙尼亞的 "春季風暴 "演習中部署了人工智能以提高態勢感知。美國的Maven項目旨在利用人工智能改善圖像和視頻片段的分析,英國也有一個類似的項目,利用人工智能支持衛星圖像分析。

武器系統

以自動化為特征的武器系統已被開發用于防御和進攻。這些系統包括從自動響應外部輸入的系統到更復雜的基于人工智能的系統。

  • 防御系統。自動防空系統可以識別和應對來襲的空中威脅,其反應時間比人類操作員更快。這種系統已經使用了20多年;一份報告估計有89個國家在使用這種系統。目前使用的系統可以從海上或陸地發射彈藥,用于應對來襲的導彈或飛機。英國使用Phalanx CIWS防空系統。雖然沒有在全球范圍內廣泛采用,但以色列將固定的無機組人員火炮系統用于邊境防御,并在韓國進行了試驗。這些系統能夠自動瞄準并向接近的人或車輛開火。

  • 導向導彈。正在使用的進攻性導彈能夠在飛行中改變其路徑,以達到目標,而不需要人類的輸入。英國的雙模式 "硫磺石"(DMB)導彈于2009年首次在阿富汗作戰中使用,它可以預先設定搜索特定區域,利用傳感器數據識別、跟蹤和打擊車輛。

  • 用于武器投送的無人平臺。為武器投送而設計的無人空中、海上和陸地運載工具可以以高度的自主性運行。這些系統可以自主地搜索、識別和跟蹤目標。大多數發展都是在空中領域。英國唯一能夠自主飛行的武裝無人機是MQ-9 "收割者",但有幾個正在開發中。英國防部還在開發 "蜂群 "無人機(方框3)。雖然存在技術能力,但無人駕駛的進攻性武器并不用于在沒有人類授權的情況下做出射擊決定;報告的例外情況很少,而且有爭議。 自主系統在識別目標和作出射擊決定方面的作用,是廣泛的倫理辯論的主題(見下文)。

方框3:無人機蜂群

無人機蜂群是指部署多個能夠相互溝通和協調的無人機和人員,以實現一個目標。在軍事環境中,蜂群可能被用來監視一個地區,傳遞信息,或攻擊目標。2020年,英國皇家空軍試驗了一個由一名操作員控制的20架無人機群,作為Dstl的 "許多無人機做輕活 "項目的一部分。蜂群技術還沒有廣泛部署。據報道,以色列國防軍于2021年首次在戰斗中使用無人機蜂群。

影響

自動化技術和人工智能的擴散將對英國軍隊產生各種影響,包括與成本和軍事人員的角色和技能要求有關的影響。對全球和平與穩定也可能有影響。

財務影響

一些專家表示,從長遠來看,軍事自動化系統和人工智能可能會通過提高效率和減少對人員的需求來降低成本。然而,估計成本影響是具有挑戰性的。開發成本可能很高,而且回報也不確定。提高自動化和人工智能方面的專業知識可能需要從提供高薪的行業中招聘。軍隊可能不得不提高工資以進行競爭,英國防部將此稱為 "人工智能工資溢價"。

軍事人員的作用和技能

自動化可能會減少從事危險或重復性任務的軍事人員數量。然而,一些軍事任務或流程,如高層戰略制定,不太適合自動化。在許多領域,自主系統預計將發揮對人類的支持功能,或在 "人機團隊 "中與人類合作。專家們強調,工作人員必須能夠信任與他們合作的系統。一些角色的性質也可能會受到自動化的影響,所需的技能也是如此。例如,對具有相關技術知識的自主系統開發者和操作者的需求可能會增加。英國防部已經強調需要提高整個軍隊對人工智能的理解,并承諾開發一個 "人工智能技能框架",以確定未來國防的技能要求。一些利益相關者對自動化對軍事人員福祉的影響表示擔憂,因為它可能會限制他們的個人自主權或破壞他們的身份和文化感。

人員對自動化的態度:

關于軍事人員對自動化的態度的研究是有限的。2019年對197名英國防部人員的研究發現,34%的人對武裝部隊使用可以使用ML做出自己的決定的機器人有普遍積極的看法,37%的人有普遍消極的態度。有報道稱,人們對某些自主武器系統缺乏信任,包括在2020年對澳大利亞軍事人員的調查中。在這項研究中,30%的受訪者說他們不愿意與 "潛在的致命機器人 "一起部署,這些機器人在沒有人類直接監督的情況下決定如何在預定的區域使用武力。安全和目標識別的準確性被認為是兩個最大的風險。有證據表明,信任程度取決于文化和熟悉程度。

升級和擴散

一些專家提出了這樣的擔憂:在武器系統中越來越多地使用自主權,有可能使沖突升級,因為它使人類離開了戰場,減少了使用武力的猶豫性。蘭德公司最近的一份戰爭游戲報告(上演了一個涉及美國、中國、日本、韓國和朝鮮的沖突場景)發現,廣泛的人工智能和自主系統可能導致無意中的沖突升級和危機不穩定。這部分是由于人工智能支持的決策速度提高了。升級也可能是由自動系統的非預期行為造成的。

還有人擔心,由于自動化和基于人工智能的技術變得更便宜和更豐富,非國家行為者更容易獲得這種技術。這些團體也可能獲得廉價的商業無人機,并使用開放源碼的人工智能對其進行改造,以創建 "自制 "武器系統。關于非國家行為者使用自主系統的報告是有限的和有爭議的。然而,非國家團體確實使用了武裝無人機,而且人們擔心人工智能會使這種系統更加有效。

技術挑戰

正在進行的包括機器人和人工智能在內的技術研究,主要是由商業驅動的,預計將增加自動化系統的應用范圍和采用程度。該領域的一些關鍵技術挑戰概述如下。一個更普遍的挑戰是,相對于數字技術的快速發展,軍事技術的發展速度緩慢,有可能在部署前或部署后不久組件就會過時。

數據傳輸

無人駕駛的車輛和機器人經常需要向人員傳輸數據或從人員那里接收數據。這可以讓人類監督和指導它們的運作或接收它們收集的數據。在某些情況下,系統也可能需要相互通信,如在無人機群中(方框3)。軍方通常使用無線電波在陸地上傳輸數據,其帶寬(頻率的可用性)可能有限。在傳輸大量數據,如高分辨率圖像時,這可能是個問題。5G技術(POSTbrief 32)可能會促進野外更有效的無線通信。系統之間的無線電通信可以被檢測到,提醒對手注意秘密行動。對手也可能試圖阻止或破壞系統的通信數據傳輸。目前正在研究如何最大限度地減少所需的數據傳輸和優化數據傳輸的方法。更多的 "板載 "或 "邊緣 "處理(POSTnote 631)可以減少傳輸數據的需要。然而,減少通信需要系統在沒有監控的情況下表現得像預期的那樣。

數據處理

具有更高水平的自主性的更復雜的系統通常在運行時在船上進行更多的數據處理和分析。這要求系統有足夠的計算能力。一般來說,一個系統能做多少嵌入式數據處理是有限制的,因為硬件會占用空間并需要額外的電力來運行。這可能會限制需要電池供電運行的系統的敏捷性和范圍。然而,人工智能的進步也可能使系統更有效地運行,減少計算要求。由于未來軟件、算法和計算機芯片技術的進步,計算機的處理能力也有望提高。

訓練數據

創建和整理與軍事應用相關的大型數據集,對生產可靠的人工智能自主系統非常重要。機器學習(ML,方框1)依賴于大型數據集來訓練其基礎算法,這些數據可以從現實世界中收集,或者在某些情況下,使用模擬生成。一般來說,用于訓練ML系統的數據越有代表性、越準確、越完整,它就越有可能按要求發揮作用。準備訓練數據(分類并確保其格式一致)通常需要手動完成,并且是資源密集型的。

數據隱私:

一些人工智能系統可能會在民用數據上進行訓練。人們普遍認為,如果使用與個人有關的數據,他們的隱私必須得到保護。這可以通過對個人數據進行匿名化處理或只分享經過訓練的人工智能系統來實現。

網絡安全

由計算機軟件支撐的系統數量的增加增加了網絡攻擊的機會。網絡攻擊者可能試圖控制一個系統,破壞其運作,或收集機密信息。基于人工智能的系統也可以通過篡改用于開發這些系統的數據而遭到破壞。英國防部在2016年成立了網絡安全行動中心,專注于網絡防御。在英國,2021年成立的國防人工智能中心,有助于促進行業伙伴或其他合作者對高度機密數據的訪問。

測試和評估

重要的是,軍事系統要可靠、安全地運行,并符合法律和法規的規定。人工智能和自動化給傳統軟件系統帶來了不同的測試和保證挑戰。 進一步的挑戰來自于ML的形式,它可能不可能完全理解輸出是如何產生的(POSTnote 633)。人工智能軟件可能還需要持續監測和維護。利益相關者已經強調缺乏適合的測試工具和流程,并正在開發新的工具和指南。英國政府的國防人工智能戰略致力于建立創新的測試、保證、認證和監管方法。

倫理、政策和立法

目前的準則和立法

目前還沒有專門針對將自動化或人工智能用于軍事應用的立法。雖然它們在戰爭中的使用受現有的國際人道主義法的約束,但這與新技術的關系是有爭議的。在國家和國際層面上有許多關于人工智能更普遍使用的準則,這些準則可以適用于自動化系統。然而,2021年數據倫理與創新中心(CDEI)的人工智能晴雨表研究發現,工業界很難將一般的法規適應于特定的環境。2022年,英國防部與CDEI合作發布了在國防中使用人工智能的道德原則。

責任感

一些利益相關者強調,如果自主系統的行為不合法或不符合預期,那么它的責任是不明確的。這可能導致系統及其決定與設計或操作它的人類之間出現 "責任差距",使法律和道德責任變得復雜。英國防部的原則說,在人工智能系統的整個設計和實施過程中,應該有明確的責任。國防人工智能戰略為供應商設定了類似的期望。

圍繞自主武器系統的辯論

這一領域的大部分法律和道德辯論都集中在武器系統上。然而,某些非武裝系統(例如,基于軟件的決策支持工具)可能在識別目標方面發揮關鍵作用,因此提出了許多與那些同時部署武器的系統相同的道德問題。

國際上對 "致命性自主武器系統"(LAWS)的使用存在著具體的爭論。這個術語沒有普遍認同的定義,它被用來指代具有不同自主能力的廣泛的武器。關于使用致命性自主武器系統的報告存在很大爭議,例如,由于系統使用模式的不確定性。 聯合國《特定常規武器公約》(CCW)自2014年以來一直在討論致命性自主武器系統的可能立法。它在2019年發布了指導原則,但這些原則沒有約束力,也沒有達成進一步的共識。雖然大多數參加《特定常規武器公約》的國家支持對致命性自主武器進行新的監管,但包括英國、美國和俄羅斯在內的其他國家認為,現有的國際人道主義法已經足夠。根據運動組織 "阻止殺手機器人"(SKR)的說法,83個國家支持關于自主武器系統的具有法律約束力的文書,12個國家不支持。

許多利益相關者認為,必須保持人類對武器和瞄準系統的某種形式的控制,才能在法律和道德上被接受。某些組織,如SKR,呼吁禁止不能由 "有意義的人類控制 "的自主武器系統,并禁止所有以人類為目標的系統。他們還呼吁制定法規,確保在實踐中保持足夠的人為控制。在其2022年國防人工智能戰略中,英國政府表示,識別、選擇和攻擊目標的武器必須有 "適當的人類參與"。作為回應,一些呼吁監管的非政府組織表示,需要更加明確如何評估或理解 "適當的人類參與"。包括英國政府在內的利益相關者建議的維持人類控制的潛在措施包括限制部署的時間和地理范圍。被認為會破壞人類控制的因素包括人類做出決定的有限時間和 "自動化偏見",即個人可能會過度依賴自動化系統,而不太可能考慮其他信息。

公眾對該技術的態度

大多數關于軍事自動化的公眾意見調查都集中在自主武器系統上。SKR委托對28個國家的19,000人進行了民意調查。62%的受訪者反對使用致命性武器系統;這一數字在英國是56%。關于公眾對人工智能、數據和更廣泛的自動化的態度的研究發現,公眾關注的主要問題包括數據安全、隱私和失業。然而,公眾的觀點會因系統的功能和使用環境的不同而有很大差異。

付費5元查看完整內容

執行摘要

大數據、人工智能和機器學習代表了當今最前沿的一些技術,并可能成為未來幾十年甚至更久的主導技術。大多數專家都認為,人工智能的發展將比1879年電力發明以來的任何技術都更能改變我們的生活,這一點通常被稱為人工智能或簡稱AI。

可悲的是,在人工智能和無人系統(或用老話說的 "機器人")的編隊協作問題上,熱度遠遠高于光度,其中大部分是由大眾媒體推動的。普通大眾被不斷喂食關于 "壞"機器人的書籍和電影(例如《世界大戰》、《終結者》),甚至是關于 "好"機器人叛變的書籍和電影(例如《2001:太空漫游》和《機器之家》),普遍擔心今天的機器人--使用人工智能的無人駕駛機器--將以我們在2021年只能模糊感知的方式來主宰我們的生活。

當涉及到人工智能的軍事應用時,這些擔憂就會變得異常強烈。許多人表示擔心,美國軍方可能會失去對其無人系統的控制,特別是其武裝的無人系統。這些擔心已經表現在許多方面,最明顯的是谷歌停止了美國國防部的算法戰爭跨功能團隊的工作,也就是所謂的Maven項目。這尤其令人擔憂,因為Maven項目與武裝無人系統毫無關系。

在許多國家,關于人工智能的軍事用途的對話已經變得尖銳,并阻礙了人工智能在美國軍事武器系統中的有效插入。當人工智能、自主性、無人駕駛和武裝在同一個句子中使用時,這些擔憂被放大了。同時,美國的同行競爭者,中國和俄羅斯,認識到了人工智能在控制他們自己的社會以及其他社會方面的價值,并且正在投資數千億于人工智能,其中大部分是為了給他們的軍隊提供一個與美國軍隊不對稱的優勢。

此外,也許更重要的是,由于今天的戰爭速度往往超過了人腦做出正確決定的能力,美國軍隊需要大數據、人工智能和機器學習,以使其作戰人員在戰斗中獲得優勢,特別是在決策領域。美國軍隊--以及其他國家的軍隊--曾發生過決策者在正確的時間沒有得到正確的信息,來支持時間緊迫的作戰決策而導致悲劇發生的一些情況。

重要的是要注意到,做出這些次優決策的軍事人員在手頭的工具下做了他們能做的最好工作。發生的情況是,戰爭的速度往往超過了人腦做出正確決策的能力。事實上,正如美國陸軍研究實驗室首席科學家亞歷山大-科特博士在一次指揮和控制會議上所說:"人類的認知帶寬將成為戰場上最嚴重的制約因素。"

直到最近,將強化決策提高到新水平的技術根本不存在。今天,它確實存在,而且利用大數據、人工智能和機器學習能夠為作戰人員提供的東西,很可能導致海戰的下一個突破,特別是在決策領域。海軍太平洋信息戰系統中心與海軍研發界、工業界和學術界的合作伙伴一起,正在領導各種努力,以確保美國作戰人員有能力以更少的人和更少的錯誤做出更好的決策。

1 大國競爭時代的戰略視角

21世紀在世界秩序、地緣政治和戰爭方式方面迎來了巨大的變化。正如美國國家情報委員會的頂點出版物《全球趨勢:進步的悖論》所說:

  • 過去幾十年的進步是歷史性的,它將人們聯系起來,賦予個人、團體和國家權力,并在此過程中使10億人擺脫了貧困。但同樣的進步也催生了阿拉伯之春、2008年全球金融危機以及民粹主義、反建制政治的全球崛起等沖擊。這些沖擊揭示了這些成就是多么的脆弱,凸顯了全球格局的深刻變化,預示著一個黑暗而艱難的近期。

《全球趨勢:進步的悖論》指出,未來五年,國家內部和國家之間的緊張局勢將不斷加劇。全球增長將放緩,就像日益復雜的全球挑戰即將到來一樣。范圍越來越廣的國家、組織和有能力的個人將塑造地緣政治。無論好壞,新出現的全球格局正在結束冷戰后美國占主導地位的時代。以公眾期望的方式進行國際合作和治理將變得更加困難。Covid-19危機放大了這些困難,暴露了國際合作的極限。擁有否決權的人處處威脅要阻止合作,而信息回音室效應將強化無數相互競爭的現實,破壞對世界事件的共同理解。因此,未來幾年發生沖突的幾率將比近期任何時候都要高

這一評估在美國國家情報局局長的《世界范圍內的威脅評估》中得到了再次確認,其中部分內容指出。"隨著大國和地區侵略者利用復雜的全球趨勢,同時適應美國外交政策的新優先事項,各國之間的競爭將在未來幾年內增加。國家間沖突的風險,包括大國之間的沖突,比冷戰結束以來的任何時候都要高。"雖然現在評估Covid-19大流行病的全面影響還為時過早,但初步跡象表明,這場危機加劇了美國與其同行競爭對手之間的緊張關系。

2021年,美國仍然在世界各地參與活動。國家安全戰略涉及對美國安全和繁榮的廣泛威脅。這些威脅包括從中國和俄羅斯這樣的高端同行競爭對手,到朝鮮和伊朗,以及以伊黎伊斯蘭國為代表的恐怖主義的持續威脅。在里根國防論壇上的國家安全戰略預演中,當時的國家安全顧問麥克馬斯特將軍強調了這些威脅,并再次確認了前政府的 "4+1戰略",將俄羅斯、中國、伊朗和朝鮮這四個國家以及 "+1"--恐怖分子,尤其是ISIL--列為美國今天必須應對的緊迫威脅。

國際安全范式的這一巨大變化的程度怎么強調都不過分。引起這一新焦點的原因并不神秘,那就是與中國和俄羅斯的大國競爭。事實上,《國家安全戰略》提出了保護美國人民和維護他們的生活方式、促進繁榮、通過實力維護和平以及提升美國在世界上的影響力的戰略愿景。值得注意的是,這個新的、發達的戰略代表了與以前版本的巨大轉變,以前的版本側重于安全、繁榮和國際秩序這三大支柱,都是一些沒有什么具體內容的理想。這個新的國家安全戰略強化了美國對中國和俄羅斯的立場,拋棄了 "朋友 "和 "伙伴 "的字眼,取而代之的是 "修正主義國家 "和 "競爭對手"。

《國防戰略》進一步發展了《國家安全戰略》中提出的主題,更直接地處理了對美國安全和繁榮的威脅。這份文件指出,美國面臨的核心挑戰是被《國家安全戰略》歸類為修正主義大國的長期戰略競爭的重新出現。它指出,越來越明顯的是,中國和俄羅斯想要塑造一個符合其“獨裁”模式的世界--獲得對其他國家的經濟、外交和安全決定的否決權。《國防戰略》發表后不久,美國防部高級官員從詞典中刪除了 "4+1戰略 "一詞,現在以 "2+3戰略 "的方式談論,以承認俄羅斯和中國構成的生存威脅。美國防部領導人已經公開表示,"中國是第一,俄羅斯是第二"。此外,他們還說,俄羅斯仍然是我們最大的近期安全挑戰,而中國是我們最大的長期挑戰。

這份國防戰略繼續說:"與中國和俄羅斯的長期戰略競爭是國防部的主要優先事項,需要增加和持續的投資,因為它們今天對美國的安全和繁榮構成了巨大的威脅,而且這些威脅在未來可能會增加。"

國會研究服務處的一份文件《向國會提交的關于大國競爭和國防的報告》中描述了這種急劇變化的戰略格局。以下是這份報告對今天的戰略環境的描述:

  • 國際關系的后冷戰時代--始于20世紀90年代初,有時被稱為單極時刻(美國是單極大國)--在2006-2008年顯示出消退的初步跡象,到2014年已經讓位于與中國和俄羅斯重新開始的大國競爭以及這兩個國家和其他國家對二戰以來美國主導的國際秩序要素的挑戰,這是一種根本性的不同情況。

  • 在奧巴馬政府2015年6月的《國家軍事戰略》中,大國競爭的恢復與其他考慮因素一起被承認,并被置于特朗普政府2017年12月的《國家安全戰略》(NSS)和2018年1月的《國防戰略》(NDS)的中心位置。2017年12月的NSS和2018年1月的NDS正式調整了美國國家安全戰略和美國國防戰略的方向,明確將主要精力放在與中國和俄羅斯的大國競爭上。國防部(DOD)官員隨后將對抗中國的軍事能力確定為國防部的首要任務。

國會研究處隨后的一份報告《國防初探:地理、戰略和部隊設計》強調了將美國的戰略重點轉向這兩個歐亞大國的重要性,指出:

  • 防止歐亞大陸出現區域性霸權,有時也被稱為維護歐亞大陸的權力分工,或防止歐亞大陸的關鍵地區被一個大國所支配,或防止出現勢力范圍的世界,這可能是歐亞大陸出現一個或多個區域性霸權的后果。

以下是《紐約時報》的一篇社論如何看待美國面臨的長期挑戰問題。"冠狀病毒可能幾乎改變了一切,但它并沒有改變這一點。美國面臨的全球挑戰還在繼續,美國的對手在測試極限,看看他們能在最小的反擊下取得什么成果。"

雖然通常留給更高級別的文件,但美國海軍的《維持海上優勢的設計2.0》也強調了這種同行(而且明顯不再是 "近鄰")競爭的首要重要性,指出:"中國和俄羅斯正在部署其國家力量的所有要素以實現其全球“野心”......中國和俄羅斯試圖以對自己更有利的條件重新定義整個國際體系的規范"。

邁克爾-吉爾德伊上將在就任美國海軍作戰部長后的指示中,強調了這種對高端作戰的需求,以及與美國海軍陸戰隊整合的重要性,在他的FRAGO 01/2019中指出:"我們將確保作戰能力和致命部隊的整體性,使分布式海上作戰、遠征先進基地作戰和有爭議環境中的瀕海作戰效益最大化。"

雖然是聯合部隊集體為國家作戰,但海軍部隊在應對大國競爭方面的重要性在一份題為《海上安全和大國競爭》的報告中得到強調。《維護以美國為首的國際秩序》,其中部分內容指出:

  • 大國競爭(GPC)將大量的注意力引向了威懾或擊敗美國最強大的競爭對手所需的高端能力。然而,競爭不僅僅是高強度的沖突,這就需要對不太激烈的沖突形式與大國競爭之間的關系進行更深入的質疑。盡管分析家們越來越多地詢問全球契約對日常競爭意味著什么,但很少有人詢問全球契約與海軍的海上安全任務之間的關系。這種關注很重要,因為水面海軍的長期部署通常以海上安全行動為主--戰區安全交戰、航行自由行動、人道主義援助等等。

這并不是說海軍比美國其他軍種更重要,也不是說像一些海軍專家所建議的那樣,海軍應該在有限的國防預算中獲得更大的份額,而是說大國競爭的前線是,而且可能繼續是廣闊的歐亞大陸的沿海地區。南中國海的持續摩擦只是大國競爭中的一個爭論點,還有很多其他爭論點。

美國在2020年12月發布的新海洋戰略《海上優勢》毫不含糊地將海上事務置于這一大國競爭的最前沿,其中部分內容指出:

  • 自我們上次在2015年發布《21世紀海權合作戰略》以來,安全環境發生了巨大的變化。一些國家正在爭奪關鍵地區的權力平衡,并試圖破壞現有的世界秩序。我們的對手的重大技術發展和積極的軍事現代化正在侵蝕我們的軍事優勢。遠程精確導彈的擴散意味著美國不能再假定在沖突時可以不受限制地進入世界海洋。

  • 自21世紀初以來,我們的三個海務部門一直在警惕地注視著中國日益增長的海軍力量和俄羅斯聯邦日益增長的侵略行為。我們部署在全球的海軍部隊每天都與中國和俄羅斯的軍艦和飛機互動。我們親眼目睹了他們越來越復雜和越來越有侵略性的行為。中國代表著最緊迫的、長期的戰略威脅。

《國防戰略》高度關注技術,并指出,如果不利用先進的技術來支持我們的作戰人員,美國將無法實現它所尋求的安全和繁榮,并指出:

  • 安全環境也受到快速的技術進步和戰爭性質變化的影響。開發新技術的動力是無情的,以較低的準入門檻擴大到更多的行為者,并以加速的速度發展。新技術包括先進的計算、大數據分析、人工智能、自主性、機器人、定向能、高超音速和生物技術--正是這些技術確保我們能夠打贏未來的戰爭。

  • 新的商業技術將改變社會,并最終改變戰爭的性質。許多技術發展將來自于商業部門,這意味著國家競爭者和非國家行為者也將有機會獲得這些技術,這一事實有可能侵蝕我們國家已經習慣的傳統的超強對抗。保持技術優勢將需要改變行業文化、投資來源和保護整個國家安全創新基地。

《全球趨勢》中強調的發展。《全球趨勢:進步的悖論》以及《國家安全戰略》和《國防戰略》中強調的發展,在美國軍方的未來展望出版物《2035年聯合行動環境》(又稱JOE)中得到了呼應。《聯合作戰環境》的副標題是 "有爭議和無序世界中的聯合部隊",它著眼于20年后,研究未來將如何影響作戰和聯合部隊。《聯合作戰環境》強調,即使在伊拉克和阿富汗的沖突逐漸結束時,美國軍隊在本十年的剩余時間和以后將面臨越來越大的壓力。

《2035年聯合行動環境》有一節專門討論技術。報告的作者解釋了這樣處理技術問題的理由:

  • 聯合部隊將面臨一個主要由加速的技術變革定義的未來技術環境。在過去的20年里,美國對高技術戰爭的做法鼓勵了對手發展非對稱、非常規、不規則和混合的方法。敵人將繼續創新,應用不同的高低技術組合來挫敗美國的利益和軍事力量。

  • 到2035年,美國將面對一系列尋求在一些關鍵領域實現技術平等的競爭對手。累積的結果將是這樣一種情況,用前國防部副部長羅伯特-沃克的話說,"我們的部隊面臨著非常現實的可能性,即到達未來的一個戰區,發現自己面臨著一個先進的、破壞性的技術庫,這可能會使我們以前的技術優勢被推翻--我們的武裝部隊不再擁有無爭議的戰區準入或不受約束的行動自由。"

很明顯,美國情報界和美國軍方都認識到,世界秩序的變化速度與技術生態系統的快速變化如出一轍。此外,在美國政府的最高層,人們承認美國曾經享有的技術優勢已經被削弱,美國軍隊不能再以純粹的技術優勢來支配其對手了。事實上,一些寫軍事和技術的專家已經預示了這種認識。

軍事歷史學家馬克斯-布特(Max Boot)在他的暢銷書《全新的戰爭》(War Made New)中指出:"我的觀點是,技術設定了可能的參數;它創造了軍事革命的潛力。"他用歷史實例支持他的論點,說明技術驅動的 "軍事革命 "如何改變了戰爭并改變了歷史的進程。重要的是,布特指出了技術的重要性,它使那些迅速創新和運用新軍事技術的國家獲得了戰爭勝利的優勢。

美國軍隊已經接受了技術變革的浪潮,這構成了戰爭方式的真正革命。隨著全球技術變革的步伐加快,美國特別善于運用新技術來應對威脅。正如布魯斯-伯科維茨在《戰爭的新面貌》中指出的那樣:

  • 戰時經驗表明,正確的技術,明智地使用,使純粹的數量變得無關緊要。轉折點是1991年的海灣戰爭。戰爭結束時,美國及其聯盟伙伴僅損失了240人。伊拉克遭受了大約10,000人的戰死,盡管沒有人會真正確定。不同的是,美國人可以在晚上看到東西,在沒有特征的沙漠中開車而不迷路,并以90%的概率將一枚智能炸彈投入目標。

雖然所引用的兩本書都是十多年前的舊書,但它們關于技術的論述在美國軍隊接受新工具的方式上仍然是正確的。但正如《2035年聯合作戰環境》以及其他高級別政府、情報界和軍事出版物所指出的,雖然美軍一直善于采用新技術用于軍事用途,但這一過程一直處于壓力之下。有許多因素阻礙了新技術在美國軍隊中的應用,包括這些部隊在過去20年中所面臨的高操作節奏、預算壓力和持續的扣押幽靈,以及往往是笨重的軍事采購系統。盡管有這些壓力,各軍種已經找到了接受新技術的方法,這些技術有望使平衡重新向美國的優勢傾斜。

今天,美國軍隊采用的創新技術中增長最迅速的領域之一涉及無人駕駛系統。在過去的幾十年里,美軍使用的無人駕駛飛行器(UAVs)已經從寥寥無幾增加到1萬多架,而無人駕駛地面車輛(UGVs)的使用已經從零爆炸到12000多架。無人水面飛行器(USV)和無人水下飛行器(UUV)的使用也在增長,因為USV和UUV被證明在廣泛的軍事應用中越來越有用。軍事無人系統(UxS)的擴大使用已經在創造十年前不存在的戰略、作戰和戰術的可能性。

武裝無人系統的擴大使用不僅改變了現代戰爭的面貌,而且還改變了戰斗行動的決策過程。事實上,有人認為,無人機戰爭的興起正在改變我們對 "戰爭 "本身的概念和定義。這些系統在伊拉克和阿富汗的沖突中被廣泛使用,并且隨著美國的戰略重點轉向印度-亞洲-太平洋地區以及這一戰略所要求的高端戰爭,這些系統將繼續具有同樣的相關性,甚至更加重要。無人系統,尤其是它們的效用,不是作為獨立的實體,而是作為被稱為 "人-機-隊 "的作戰伙伴,是美國 "第三抵消戰略 "的一個基本原則。

2 對 "抵消"戰略的需求

美國防部已經啟動了 "第三次抵消戰略",以確保美國保持對潛在對手的軍事優勢。"抵消"戰略是一種軍事競爭的方法,它試圖以不對稱的方式彌補不利的地位。與其在潛在對手也可能擁有巨大實力的領域進行正面競爭,抵消戰略試圖通過引入新的作戰概念和技術,將競爭的軸心轉向美國具有顯著和可持續優勢的領域。

美國在冷戰期間成功地推行了兩種不同的抵消戰略。這些戰略使美國能夠 "抵消"蘇聯在常規部隊中的數量優勢,而不需要在前沿部署的部隊中進行巨大的投資,因為這需要以士兵對士兵、以坦克對坦克的方式提供超額補償。這些抵消戰略依賴于技術、作戰方法和組織結構的根本創新,以彌補蘇聯在時間、空間和部隊規模上的優勢。

這些抵消戰略中的第一個發生在20世紀50年代,當時艾森豪威爾總統試圖通過利用美國的核優勢來克服華沙條約組織的數量優勢,引入戰場核武器--從而將競爭的軸心從常規部隊數量轉移到美國擁有不對稱優勢的領域。這種方法提供了穩定性并為威懾提供了基礎。

第二種抵消戰略產生于20世紀70年代末和80年代初,因為人們認識到蘇聯已經實現了核均勢。第二個抵消戰略試圖通過追求一種新的聯合行動方式來創造一種持久的優勢,即利用常規精確武器、支持實時精確瞄準的實時遠程ISR(情報、監視、偵察)傳感器能力以及允許這些能力在整個戰斗空間同步執行的聯合戰斗網絡的綜合效應。

幸運的是,構成 "第二次抵消戰略 "的軍事技術從未在與蘇聯的正面交鋒中得到檢驗。然而,在 "沙漠風暴 "行動中,這些技術被部署在一支由蘇聯訓練和裝備的軍隊面前。如前所述,正如《戰爭的新面孔》所描述的那樣,伊拉克的失敗是徹底的,代表了現代戰爭中最一邊倒的運動之一。顯然,美國的潛在敵人注意到技術在這場勝利中發揮的關鍵作用。

在20世紀80年代初引入第二套抵消戰略時,美國是唯一擁有知識和能力來開發、部署和成功執行情報、監視和偵察能力、天基系統以及支持這種方法的精確武器的國家。今天,像俄羅斯和中國這樣的競爭對手(以及這些國家向其擴散先進能力的國家)正在追求和部署先進的武器和能力,這些武器和能力展示了許多與傳統上為美國優勢提供高科技基礎的技術力量,如精確制導彈藥。在俄羅斯在敘利亞的力量投射行動中,可以看到美國技術能力與潛在競爭對手之間的這種日益對稱性。

國際安全環境中出現的越來越多的均勢,使得美國必須開始考慮各種技術、系統概念、軍事組織和作戰概念的組合,這些技術、系統概念、軍事組織和作戰概念可能會改變競爭的性質,使美國比潛在對手更有優勢。這一系列的能力為第三個抵消戰略提供了基礎。如同以前的抵消戰略一樣,第三個抵消戰略尋求在預算有限的環境下,通過確定美國獨特的力量和能力所帶來的不對稱優勢,保持并擴大美國的技術和作戰競爭優勢。第三套抵消戰略確保美國的常規威懾態勢在未來仍像今天一樣強大,并為將這一優勢擴展到未來創造條件。

在解釋《第三次抵消戰略》的技術要素時,當時的國防部副部長羅伯特-沃克強調了無人系統、人工智能、機器學習和自動駕駛方面新興能力的重要性。他指出,這些技術為聯合部隊提供了巨大的優勢,使未來的部隊能夠開發和操作先進的聯合、協作的人機戰斗網絡,在太空、空中、海上、海底、地面和網絡領域同步作戰。人工智能將使聯合作戰網絡的自主性達到新的水平--決策權的有限授權,從而為人機協作和作戰團隊帶來全新的機會

無人系統、人工智能和機器學習等技術在第三個抵消戰略中,特別是在該戰略的長期研究和發展計劃(LRRDP)中的突出地位很難被夸大。

也就是說,該戰略有一個強有力的組成部分,強調在使用具有日益復雜的人工智能和機器學習能力的無人系統時,要讓人類處于循環之中。事實上,人機協作是現存的 "第三抵消戰略 "文件以及國防部高級官員的演講和訪談中所強調的一個必要條件。雖然深入研究 "第三抵消戰略 "技術主旨的全部細節超出了本文的范圍,但重要的是要注意,該戰略的主要技術路線集中在人機協作和戰斗團隊的概念上。這一概念的五個基本組成部分是:

  • 自主深度學習系統,它將利用機器學習,在人類反應時間太慢的領域 "以光速 "運作,例如網絡攻擊、電子戰攻擊或大型導彈突襲攻擊。

  • 人機協作,這將使機器能夠幫助人類更快地做出更好的決定。工部長列舉了F-35聯合攻擊戰斗機和海軍綜合火控反航(NIFC-CA)作為這些概念的例子。

  • 輔助人類作戰,這將專注于人和機器可以一起行動的方式,通過可穿戴電子設備、外骨骼和戰斗應用等工具,在各種可能的緊急情況下協助作戰人員。

  • 先進的人機作戰團隊,將側重于人類與無人系統合作作戰;其中一個例子是海軍的P-8 "海神 "與MQ-4C "海神 "的作戰。展望未來,團隊合作的下一個層次將研究蜂群戰術和合作自主。

  • 網絡支持的、網絡硬化的自主武器,將有彈性地在電子戰和網絡環境中運行。目前的一個例子包括戰術戰斧Block IX,其目標可以在飛行中更新。

知識淵博的外部觀察家參考了《第三次抵消戰略》,并強調了無人駕駛系統在實現美國戰略目標方面的重要性。前歐洲盟軍最高司令官詹姆斯-斯塔夫里迪斯(James Stavridis)上將在其發表在《外交政策》上的文章《新三體》中指出,無人系統是這個新三體的三大支柱之一,他指出:"新三體的第二個能力是無人駕駛車輛和傳感器。三合會的這一分支不僅包括空中攻擊無人機,還包括空中、地面和海洋表面的無人監視車......這種系統有一個明顯的優勢,即不需要所有最昂貴的部件:人。"

美國陸軍的一份報告描述了在2014年首次闡述的第三次抵消戰略,而且遠在美國開始稱中國和俄羅斯為同行競爭對手之前,該戰略必須在21世紀的第三個十年中變形和改變:

  • 蘇聯軍隊在數量上的優勢促成了前兩個抵消戰略。隨著美國軍事技術進步的應用已經擴散到近似的對手,它已經有效地重新平衡了戰場。為確保第三次抵消戰略的成功實施,國防部與美國政府必須就我們試圖抵消的東西以及如何平衡這些優先事項以對付處于巨大不同區域和能力的對手達成一致。

  • 第三抵消戰略的運用將恢復美國的力量投射能力,通過可靠的拒絕和懲罰威脅來加強常規威懾力,并作為長期競爭的一部分對潛在的對手施加代價。平衡或擊敗對手能力的能力需要資源,為確保有效運用該戰略,我們必須解決我們試圖抵消的問題。

鑒于第三個抵消戰略的強烈技術重點,在美國尋求在本十年及以后實施這一戰略時,這一戰略的表現將由聯合部隊放置在戰場上的軍事平臺、系統、傳感器和武器所代表。同樣明顯的是,美國各軍種--特別是美國海軍--已經表示希望將無人系統作為其部隊結構中一個日益重要的部分投入戰場。

3 大數據、人工智能和機器學習與軍事武器系統

在國會作證時,前國防部長邁克爾-埃斯珀回答了一個問題:"美國防部技術現代化的首要任務是什么?"他指出,"對我來說,是人工智能。我認為人工智能將可能改變戰爭的特征,我相信誰先掌握了它,誰就會在戰場上主宰很多很多年。這是一個根本性的游戲改變者。我們必須先到達那里。"

美國軍方有許多理由主動利用大數據、人工智能和機器學習來使其武器系統變得更好。也許最令人信服的理由是,我們的潛在對手--特別是我們的同行競爭對手--正在積極地這樣做。一個古老的觀點是軍事術語,"敵人有投票權"。在這種情況下,俄羅斯正在用盧布投票,中國正在用人民幣投票。

這些國家正在對這些技術進行巨大投資。雖然這兩個國家出于國內原因進行這些投資,但他們正在有意和有條不紊地將這些技術盡可能快地插入他們的軍事系統,以便創造一個與美國軍隊不對稱的優勢。鑒于俄羅斯和中國注重保密,這些舉動似乎有悖常理,但這兩個國家都沒有試圖對這些目標保密。

在一次被廣泛宣傳的講話中,俄羅斯總統弗拉基米爾-普京這樣說。"人工智能是未來,不僅是俄羅斯的,而且是全人類的。它帶來了巨大的機遇,但也有難以預測的威脅。誰成為這個領域的領導者,誰就會成為世界的統治者。"

很明顯,其他 "大國 "將人工智能的發展視為一場競賽,并將從中利用競爭性軍事應用。

從美國的角度來看,以及從一些美國盟國的角度來看,這場競賽在很大程度上是,盡管不完全是,軍事競爭的一個方面。美國和盟國對一個或多個潛在對手在人工智能發展中領先的可能性表示擔憂。第三套抵消戰略被設想為一種在人工智能等新技術的軍事競爭中保持領先的方法。

軍事大國競爭的歷史表明,人工智能競爭,本質上是一場軍備競賽,是一種自然發展。然而,比技術跨越更令人擔憂的是,美國的軍事對手--所有某種形式的專制政權--可能不會像以前那樣致力于維持 "人在回路中 "的方法,將人工智能納入軍事事務。這在目前俄羅斯的軍事人工智能發展中似乎尤其如此。

俄羅斯、中國和美國這三個主要軍事大國都認識到,大數據、人工智能和機器學習有可能應用于軍事能力。在政府參與人工智能研究、他們愿意在人工智能發展中承擔的風險、他們將在多大程度上讓位于人工智能系統的自主權以及他們尋求的直接應用方面,這三者的近期目標都有所不同。

鑒于潛在對手將大數據、人工智能和機器學習植入其軍事武器系統的程度,美國軍方非常有必要采取同樣的措施,以確保這些國家不會獲得不對稱的優勢。也就是說,美國軍方的重點必須是證明人工智能武器系統將 "首先不造成傷害"。因此,將人工智能插入軍事系統不是一個 "非此即彼 "的問題,而是一個 "多少?"的問題。換句話說,美國軍方必須專注于在正確的時間和地點應用適量的人工智能。

正如我們前面所指出的,美國防部已經接受了第三套抵消戰略,試圖為美國提供對同行和其他對手的不對稱優勢。雖然這一戰略有許多方面,但其中一個支柱涉及技術,而這一支柱在很大程度上取決于大數據、人工智能和機器學習來獲得這一優勢。作為這一技術重點的一個子集,人機合作被認為是利用人工智能的無人系統獲得軍事優勢的一種方式。

在軍事系統中找到這種恰到好處的自主權平衡所需的能力必須利用許多仍在出現的技術。軍方知道它想實現什么,但往往不知道它需要什么技術或甚至能力,以使系統在自主性和人際互動之間達到適當的平衡。這種探索的一個關鍵因素是,不要擔心機器本身擁有什么屬性--速度、耐力和其他屬性,而是要關注機器內部的東西。美國國防科學委員會的報告《自主性在國防部系統中的作用》是這樣說的:

  • 與其將自主性視為無人系統孤立的內在屬性,不如從人與系統協作的角度來考慮無人系統的設計和操作......操作人員面臨的一個關鍵挑戰是保持執行任務所需的人機協作,而這種協作經常因設計不當而受到阻礙......無人系統開發人員面臨的一個關鍵挑戰是從以硬件為導向、以車輛為中心的開發和獲取過程轉向強調軟件在創造自主性方面的首要地位。

關于將人工智能植入軍事系統的一些爭議源于術語的不精確。幫助澄清這種模糊性的方法之一是確保在使用自主性一詞時,它指的是人和機器之間的關系。在一段時間內執行某項功能,然后停止并等待人類的輸入,然后再繼續,這樣的機器通常被稱為半自主或有人類在環。可以完全依靠自己的力量完成某項功能的機器,但有一個人在監督,并能夠在機器出現故障或失靈時進行干預,通常被稱為人類監督下的自主或人類在環。能夠完全獨立完成某項功能而人類無法干預的機器通常被稱為完全自主或人類不參與的機器。

這表明,我們需要重新調整關于自主武器的一些辯論,以更準確地區分增加武器的自主性和自主武器。在這個意義上,自主性不是指機器的智能,而是指它與人類控制器的關系。對于相對較少的無人系統將用武器與敵人作戰,這種平衡是至關重要的。在發射武器之前,無人平臺需要向操作者--必須有一個操作者在其中--提供一個關于發射決定可能帶來的利弊的決策矩陣。

可以說,即使是一些在美國軍事人工智能領域工作的人,對于將人工智能插入美國軍事武器系統也會有一些矛盾。也許解決這個問題的最好方法是考慮二戰中最知名的照片之一。這張照片由美國信號部隊的約翰-摩爾中尉拍攝,描述了德懷特-艾森豪威爾將軍在1944年6月5日,即入侵諾曼底的前一天與第101空降師的士兵交談。在此之前,艾森豪威爾已經聽取了空軍元帥利-馬洛里的匯報,101師是入侵期間將遭受80%傷亡的兩支部隊之一。

那些研究無人系統對軍事行動的影響的人--特別是那些大力提倡無人系統的人--看了這張照片,可以設想艾森豪威爾將軍不是與美國空降兵對話,而是與他將派往戰場的機器人對話。那些害怕無人系統的人可能會想象美國空降兵就像照片中描述的那樣,但他們會設想一個機器人來指揮這些士兵,而不是艾森豪威爾將軍--顯然這是一個站不住腳的情況。但是,那些深思熟慮地考慮人工智能無人系統對軍事行動的影響的人,會設想艾森豪威爾將軍向一隊美國空降兵講話,與他們的機器人伙伴站在一起。顯然,需要做更多的工作來充分解決人機合作對今天的軍隊意味著什么。

但這種利用大數據、人工智能和機器學習的普遍愿望未能解決一個關鍵問題,即我們希望這些技術能夠幫助作戰人員執行哪些具體任務。問題的根源可能是美國軍方沒有能力將作戰人員的需求轉化為大數據、人工智能和機器學習所帶來的技術解決方案。除非或直到這樣做,否則這些技術不太可能被充分利用來支持美國的作戰人員。

4 公眾將接受什么?軍事武器系統自主化的黑暗面

作為上個世紀最具代表性的電影之一,斯坦利-庫布里克的《2001:太空漫游》將機器人(當時的無人駕駛車輛)的自主性問題作為其中心主題。看過這部電影的人很少能忘記這樣一個場景:宇航員大衛-鮑曼和弗蘭克-普爾考慮斷開HAL(啟發式編程的算法計算機)的認知電路,因為他似乎錯誤地報告了航天器的通信天線中存在故障。他們試圖隱瞞他們所說的話,但不知道HAL能讀懂他們的嘴唇。面對斷線的前景,HAL決定殺死宇航員,以保護并繼續其程序化的指令。

雖然今天很少有人擔心21世紀的HAL會背叛它的主人,但在使用日益自主的無人系統方面所涉及的問題是復雜的、具有挑戰性和有爭議的。庫布里克1968年的電影是有先見之明的。半個多世紀后,雖然我們接受了無人系統其他方面的改進,如推進力、有效載荷、隱身性、速度、耐力和其他屬性,但我們仍在處理多少自主權是足夠的,多少可能是太多的問題。這可以說是我們在未來十年內需要解決的有關軍事無人系統的最重要問題。

這些正在進行的辯論已經催生了一個山寨的書籍產業,試圖解決人工智能、自主性和無人系統的問題,特別是武裝的軍事無人系統。諸如《為戰爭而生》(Wired for War)、《遙控殺人》(Killing by Remote Control)等書。無人駕駛軍隊的倫理;無人駕駛。無人機、數據和完美戰爭的幻覺;反思無人機戰爭;無主之軍。自主武器與戰爭的未來》和《無人機下的國家》只是試圖以深思熟慮的方式解決這一復雜問題的書籍中的一個例子。

無人系統將變得更加自主,與它們感知環境和適應環境的能力成正比。這種能力使無人系統能夠實現更高的決策速度,并使友軍能夠在對手的OODA(觀察、定向、決定和行動)環路內行動。隨著環境或任務的變化,感知和適應的能力將使無人系統能夠找到實現其任務的最佳解決方案,而無需依賴人類操作員的持續監督、輸入和決策。然而,雖然我們需要無人系統在敵人的OODA環內運作,但我們是否準備好讓它們在沒有我們的決策下運作--在我們的OODA環內運作?

《經濟學人》雜志的一篇文章《道德與機器》以這種方式討論了自主權和人在回路中的問題:

  • 隨著機器變得越來越聰明,越來越普遍,自主機器最終必然會在不可預測的情況下做出生死攸關的決定,從而承擔--或者至少看起來承擔--道德機構。目前,武器系統有人類操作員 "在環",但隨著它們越來越復雜,將有可能轉為 "在環 "操作,由機器自主執行命令。

  • 隨著這種情況的發生,它們將面臨著倫理上的困境。一架無人機是否應該向已知目標藏身的房屋開火,而該房屋可能還藏有平民?無人駕駛汽車是否應該轉彎以避開行人,如果這意味著撞上其他車輛或危及車內人員?參與災難恢復的機器人是否應該告訴人們正在發生的真相,如果這有可能引起恐慌?

  • 這些問題導致了 "機器倫理"領域的出現,其目的是讓機器有能力做出適當的選擇--換句話說--分辨是非。工程師、倫理學家、律師和政策制定者之間需要更多的合作,如果讓他們自己來決定,他們都會制定出非常不同的規則。

在《紐約時報》的一篇題為 "智能無人機 "的專欄文章中,比爾-凱勒這樣描述無人系統的自主權問題:

  • 如果你覺得使用遙控戰士無人機令人不安,想象一下,殺死一個可疑敵人的決定不是由遠處控制室的操作員做出的,而是由機器本身做出的。想象一下,一個空中機器人研究下面的景觀,識別出敵對活動,計算出附帶損害的風險最小,然后,在沒有人類參與的情況下,扣動扳機。

  • 歡迎來到戰爭的未來。當美國人在爭論總統是否有權下令用無人機進行暗殺時,強大的動力--科學、軍事和商業--正在推動我們走向將同樣的致命權力讓給軟件的那一天。

最近,雖然看起來有些反常,但對自主機器和人工智能的擔憂也來自于在開發這些技術能力方面最為突出的行業。《紐約時報》的一篇文章,題為 "機器人霸主?也許不是",引用了電影《機器之家》的導演亞歷克斯-加蘭(Alex Garland)的話,他談到了人工智能,并引用了幾個科技行業領導人的話。

  • 理論物理學家斯蒂芬-霍金告訴我們,"全面人工智能的發展可能意味著人類的終結"。特斯拉的首席執行官埃隆-馬斯克告訴我們,人工智能 "可能比核彈更危險"。蘋果公司的聯合創始人史蒂夫-沃茲尼亞克告訴我們,"計算機將取代人類","未來是可怕的,對人非常不利。"

美國防部正在把人類對無人系統的控制問題作為第一要務來處理,并發布了政策指示,以確保人類確實保持在OODA循環中。時任美國防部副部長阿什頓-卡特(Ashton Carter)的一項指令發布了以下指導:

  • 自主和半自主武器系統需要人類的投入和持續的核查,以幫助防止意外的交戰。這些系統的設計應允許指揮官和作戰人員對武力的使用進行適當程度的人為判斷。授權使用或操作這些系統的人類,必須以適當的謹慎并按照戰爭法、適用的條約、武器系統安全規則和適用的交戰規則行事。自主系統的定義是,一旦啟動,就可以選擇和攻擊目標,而無需人類操作員進一步干預的武器系統。

這些指令和討論是--而且應該是--政策制定者、軍事領導人、工業界、學術界和科技界之間對話的一部分,因為明天的自主系統的設計和運作是經過深思熟慮的。正如當時的國防部副部長羅伯特-沃克在新美國安全中心國防論壇上發言時指出的那樣,"我們堅信,人類應該是唯一能夠決定何時使用致命武力的人。但當你受到攻擊時,特別是在機器的速度下,我們希望有一臺機器可以保護我們"。

發布政策聲明是一回事,但實際設計自主系統來執行預期的計劃又是另一回事。從政策的角度來看,這是一個關鍵點,因為盡管人們可以選擇把各種層次的決策權交給自主機器,但卻不能逃避對由此產生的行動的責任。在高度自主的系統中,系統對操作者來說變得不透明,這些操作者經常會問一些問題,如:。它在做什么?它為什么要這樣做?它接下來要做什么?如果被問到這些問題,很難看到操作者如何能履行對自主系統行動的責任。

由于這些原因,美國政府,特別是美國軍方要向美國公眾證明它不會失去對機器人的控制,其門檻是異常高的。許多人表示擔心,美國軍方可能會失去對其無人系統的控制,特別是其武裝的無人系統。這些擔心已經表現在許多方面,最明顯的是谷歌停止了國防部算法戰爭跨職能團隊的工作,也就是所謂的Maven項目。這尤其令人擔憂,因為Maven項目與武裝無人系統無關。

5 美國軍事自主系統規劃

在美國最高級別的政策和戰略文件中,無人系統被作為聯合部隊未來作戰方式的一個重要部分。最近的《四年期國防審查》(QDR)指出:"延續1990年代末開始的趨勢,美軍將增加對無人系統的使用和整合。" 在QDR的其他地方,無人駕駛系統被確定為。"保持我們投射力量的能力"。重要的是,《QDR》強調無人系統是國防部致力于創新和適應的一個關鍵部分。

美國國防部對無人系統的愿景是將這些系統納入聯合部隊。由于無人系統被所有軍種使用,國防部發布了一個路線圖,為軍隊使用無人系統提供一個總體愿景。在新的路線圖發布后不久,《海軍內部》雜志發表的一篇文章指出:"國防部新的30年無人系統計劃--四年來第一次更新路線圖--旨在為快速發展的無人系統技術領域制定一個三十年的指南。"最近的路線圖,即2017-2042財年無人系統綜合路線圖,特別指出需要加強無人系統的自主性,指出。

  • 美國防部保持著將無人系統繼續擴展到聯合部隊結構的愿景,并確定了將進一步擴大無人系統潛在整合的興趣和投資領域。本文件的目的是提供總體戰略指導,使各軍種的無人系統目標和努力與國防部的戰略愿景保持一致。該戰略指導將側重于減少重復工作,促成合作,確定挑戰,并概述了國防部和工業界可能合作的主要領域,以進一步擴大無人系統的潛力。由于國防部已經接受了在幾乎所有作戰環境中使用無人系統,這項戰略將使國防部能夠利用無人系統提供的技術進步和模式轉變。

2017-2042財年無人系統綜合路線圖接著列出了四個感興趣的基礎領域,將加速無人系統的整合。這些領域包括:

  • 互操作性。互操作性在歷史上一直是,并將繼續是無人系統集成和運行的主要推動力。載人和無人系統已經越來越多地將其能力協同起來,重點關注使用開放和通用架構的關鍵需求。一個強大的互操作性基礎提供了一個結構,將使未來的作戰取得進展。

  • 自主性。自主性和機器人技術的進步有可能徹底改變作戰概念,成為一個重要的力量倍增器。自主性將大大提高載人和無人系統的效率和效力,為國防部提供戰略優勢。

  • 網絡安全。無人系統操作通常依賴于網絡連接和有效的頻譜訪問。必須解決網絡漏洞,以防止破壞或操縱。

  • 人機協作。如果說互操作性奠定了基礎,那么人機協作則是最終目標。人類力量和機器之間的協作將實現革命性的合作,機器將被視為重要的隊友。

報告接著討論了機器人和無人系統的聯合概念(JCRAS),它為這些系統在未來戰爭場景中的應用提供了一個愿景,直到2035年。JCRAS與之前討論的2035年聯合行動環境直接保持一致,指出了機器人和自主系統(RAS)給聯合部隊帶來的八個關鍵屬性:

  • 學習能力。未來的RAS將通過與環境、人類的互動以及訪問網絡資源來學習。

  • 更強的態勢感知。未來的RAS將通過收集、處理和優先處理來自先進傳感器網絡的信息來增強意識,這將為作戰人員將數據轉換成知識。這將使復雜、擁擠的戰斗空間中的行動更加有效。

  • 實現更高的性能。與載人和可選擇的載人系統不同,RAS沒有人類生理上的限制(如疲勞)。這允許在單一平臺上延長射程和徘徊時間,進行持久監視,并對傳感器和有效載荷進行全新組合。

  • 提高效率和效益。能力更強的RAS將能夠在軍事行動范圍內執行更多的聯合任務,如戰區內空運、地雷行動、打擊大規模殺傷性武器、供應和維持,同時提高部隊的效率和效力。

  • 提供更大的靈活性。未來的RAS系統將可以通過交換模塊硬件和/或下載新的軟件來快速重新配置,從而賦予新的能力。未來的RAS多任務功能將使聯合部隊能夠快速適應,以滿足不同或不斷變化的任務要求。

  • 通過以機器速度運行來提高節奏。RAS以不斷增加的機器速度 "思考"。RAS可以融合來自網絡ISR傳感器的數據,機動到一個有利的位置,并比對手的人類和RAS更快采取行動。先進的數據分析、實時處理和替代性決策框架將使指揮官能夠比對手更快地做出決定和采取行動。

  • 提供產生大規模的潛力。目前聯合部隊的載人庫存是基于相對較少的高能力、復雜和昂貴的武器裝備,無法迅速再生。RAS提供了使用大量廉價系統以產生大規模的機會。

  • 啟用分布式和分散式行動。敵方的技術將以更高的精度和范圍瞄準美國部隊,使傳統部隊面臨更大的風險。使用RAS進行分布式和/或分散式作戰將提高未來作戰環境中的能力。

正如《質量發展報告》和《無人系統綜合路線圖》都指出的那樣,在美軍面臨具有強大防御能力的同行競爭者的那些地區,無人系統是特別重要的資產。聯合行動準入概念認為,"無人系統,可以在目標區域內徘徊以提供情報收集或火力",是一種關鍵能力,在對手擁有大量防御設施,可以限制美國和聯軍進入的地區,這種能力特別有價值。 此外,無人系統是在西太平洋等高威脅地區執行美國 "空海作戰概念"(現更名為 "全球公域準入和機動聯合概念",簡稱JAM-GC)的一個關鍵組成部分,在這些地區,對手的防御系統對有人駕駛飛機和水面平臺構成了不可接受的高風險。

海軍部已經為海軍和海軍陸戰隊的無人系統開發制定了雄心勃勃的目標。在一份備忘錄中,負責研究、開發和采購的海軍助理部長James Geurts閣下強調了無人駕駛系統的重要性,他在求職信中指出:

  • 美國海軍和海軍陸戰隊在戰略上有必要利用新興的和快速發展的無人駕駛和自主技術。為了加速無人系統的開發和投入使用,并確保綜合有效的努力,海軍部(DoN)已經為加速海軍部的無人系統制定了積極的目標,并確保海軍部在這些新興的能力方面保持領先地位。

這份詳細的備忘錄繼續指出:"無人駕駛和自主技術正在改變各國開展軍事行動的方式......無人駕駛和自主系統的使用將改變我們的戰斗方式。" 美國防部的無人系統愿景隨后引出了無人系統戰略和計劃,最后引出了一系列高級無人系統目標:

  • 通過載人、無人和自主能力的綜合團隊實現空中優勢。

  • 通過擴大我們的海底星座的全球范圍來實現海底優勢。

  • 通過載人和無人自主能力的綜合團隊,實現地面優勢。

  • 吸收我們未來的地面戰斗力。

  • 實行多領域的無人駕駛和自主系統。

  • 實現無人駕駛的大規模。

  • 通過整合無人駕駛和自主系統,實現持久的供應、支持和維持。

  • 實現全面的無人操作能力和先進的自主性和機器學習。

這八個高層次目標中的每一個都有一個段落來支持,該段落提供了關于總體目標所需的更多細節,以及海軍部打算采取的步驟來實現這些預期結果。備忘錄接著詳細介紹了近期的促進因素和塑造努力,然后在結論中指出。"增加無人駕駛和自主系統的作戰使用,有望為我們的海軍部隊釋放出一種革命性的能力。"

最近,海軍部公布了期待已久的《無人駕駛作戰框架》。該文件旨在協調整個部門的無人系統工作,列出了雄心勃勃的目標,旨在幫助使無人系統成為海軍平臺庫存中越來越重要的一部分。該框架有五個目標。

  • 在海軍和聯合行動的全部范圍內推進有人-無人的團隊效應。

  • 建立一個數字基礎設施,快速和大規模地整合和采用無人駕駛能力。

  • 激勵無人駕駛系統的快速增量開發和測試周期。

  • 分解共同的問題,一次解決,并跨平臺和領域擴展解決方案。

  • 為無人駕駛貢獻(平臺、系統、子系統)創造一個以能力為中心的方法。

盡管如此,這份38頁的報告確實為海軍部打算如何將無人駕駛系統引入艦隊和緬因州部隊提供了一個組織動力和指南。

6 為軍用無人駕駛系統設計合適的自主性程度

大多數人都熟悉兒童寓言故事《金發姑娘和三只熊》。當金發女郎品嘗三碗粥時,她發現一碗太熱,一碗太冷,還有一碗恰到好處。當美國防部和各軍種尋求實現自主性和人類互動的最佳平衡--平衡這兩種經常對立的力量并使其 "恰到好處"--在一開始就將這種能力設計到未來的無人系統中,而不是試圖在事后將其固定下來,這可能是唯一可持續的前進道路。如果我們不能做到這一點,幾乎不可避免的是,對我們的武裝無人系統將具有 "HAL"式的力量并超出我們的控制的擔憂將破壞這些重要作戰伙伴的承諾。

在用于軍事用途的無人系統中建立適當程度的自主性的一個關鍵是要記住一句老話:"你站在哪里取決于你坐在哪里。" 用戶和設計無人系統的人經常從不同的--通常是明顯不同的--觀點來對待他們試圖完成的任務。海軍研究咨詢委員會的一份報告指出,在設計具有適當程度的自主性的無人系統時,必須調和四個不同的觀點:

  • 用戶觀點。我可以給這個平臺一個任務,并相信它能在沒有持續關注的情況下完成它嗎?它能識別和處理意外事件或模糊的任務嗎?

  • 機器人學觀點。我能否建立一個實用的機器人,在正確的時間做正確的事情?我可以動態地控制、導航、執行和測量我的機器人嗎?它能管理和融合數據嗎?

  • 機器學習觀點。我的機器能解釋復雜的傳感器嗎?它能理解口頭語言,解釋手勢,或識別人或物嗎?

  • 認知的觀點。我的機器能不能復制人類智能的元素,如認知、推理和推理?

隨著美國軍方出于各種原因增加對無人系統的依賴,它最好在某個時候決定該平臺是否足夠好,也就是說,它具有執行任務所需的速度、耐力和其他物理屬性。一旦確定了這一點,那么正如國防科學委員會報告所建議的那樣,軟件開發的艱苦工作必須成為優先考慮的因素。

7 無人駕駛系統:美國國防部的一個使用案例

利用大數據、人工智能和機器學習的普遍愿望未能解決一個關鍵問題,即我們希望這些技術能夠幫助作戰人員執行哪些具體任務。問題的根源可能是美國軍方缺乏將作戰人員的需求轉化為建議由大數據、人工智能和機器學習實現的技術解決方案的能力。作為前美國海軍軍官和艦艇指揮官,我們思考這個問題的方式讓我們很自然地想到海軍的例子。

開始解決這個問題的一個方法是思考海上的指揮官需要什么信息。無論是1812年8月艾薩克-赫爾艦長試圖帶著憲法號對蓋瑞爾號采取行動,還是今天的航母打擊群指揮官考慮將他的艦艇帶入一個可能有爭議的地區,指揮官需要三個主要東西來幫助他做出最佳決定。

他或她需要知道部隊前方的情況,需要將這些信息傳達給旗艦,并需要做出明智的決定。雖然今天的海軍指揮官擁有豐富的資產來幫助實現這些目標,但現在大數據、人工智能和機器學習可以幫助彌補一些差距。

一個打擊小組的指揮官擁有許多資產,可以展望部隊未來,以評估戰術形勢。他可能使用MQ-4C “海衛一”無人機系統來執行這種偵察任務。今天,"海衛一"操作人員會收到MQ-4C看到的流媒體視頻。但這需要他連續幾個小時盯著這段視頻(海衛一的續航時間為30小時),看到的主要是空曠的海洋空間。

利用大數據、人工智能和機器學習,MQ-4C可以被訓練成只發送它遇到的每艘船的視頻,從而大大壓縮了人類的工作量。更進一步,"海衛一"可以對每一次接觸進行機載分析,以標明其可能的興趣。例如,如果一艘船在航道上運行,已向海事當局提交了航行計劃,并提供了AIS(自動識別系統)信號,那么它很可能只值得操作者注意,“海衛一”將相應地標記它。然而,如果它不符合這些標準(例如,該船突然改變航線,離開了航道,或者沒有AIS信號),操作人員將被提醒。隨著這項技術的不斷發展,“海衛一”或其他無人機系統最終可能會配備分類算法,有可能導致自動識別目標。

一旦“海衛一”處理了這些信息,大數據、人工智能和機器學習可以幫助確定如何與旗艦溝通。在今天有爭議的電子戰環境中,不同的通信路徑具有不同程度的脆弱性。在 “海衛一”號發射之前,指揮官可以確定可接受的通信截獲風險水平,以及泄露打擊群存在的風險。

掌握了這個指揮官的意圖,并利用大數據、人工智能和機器學習,"海衛一"可以評估電子環境,從多個通信路徑中進行選擇,并確定哪條路徑提供最小的攔截漏洞。鑒于 "海衛一"號的尺寸和增長潛力,它甚至可以攜帶一個較小的無人機,并將其發射回部隊,以傳遞這種監視信息。

在旗艦上,指揮官必須了解他的傳感器所收集的數據,然后做出一些時間關鍵性的決定。他應該繼續前進,等待,還是撤退?他應該在前面偵察,還是在另一個方向?他是否應該調用其他部隊,或者他的有機資產是否足以成功地完成任務而不會給他的部隊帶來不必要的風險?

這就是大數據、人工智能和機器學習可以做出重要貢獻,幫助指揮官做出關鍵決策的地方。

如果指揮官選擇勇往直前,強制進行交戰,大數據、人工智能和機器學習可以做到今天的初級戰術決策輔助工具無法做到的事情--提供一系列選擇,并評估每個選擇的利弊。重要的是,這些技術并不--也不應該--做出決定,而是為指揮官提供足夠的、經過精心策劃的信息,以便他能比對手更快地做出最佳決定。

對于致命的軍事無人系統來說,在授權無人作戰伙伴發射武器之前,操作者必須知道什么,或者像經常發生的那樣,建議上級當局授權采取致命行動,這個標準更高。例如,考慮軍事操作人員管理一系列正在進行的無人駕駛航空系統飛行的情況,他們一直在觀察一個恐怖分子,并等待上級當局授權使用從該無人駕駛航空系統發射的空對地導彈來消除威脅。

利用大數據、人工智能和機器學習,操作者可以訓練無人駕駛航空系統預測上級主管部門在授權發射前會問什么問題,即使不能提供點解決方案,至少也可以提供百分比概率或信心水平的問題,例如。這個人是預定目標的信心水平是多少?這種信心是基于什么?是面部識別、聲音識別、行為模式、與某些人的聯系、與已知家庭成員的接近或與已知同伙的接近?對家庭成員、已知同伙或未知人員造成附帶損害的可能性是什么?等待與現在出擊的潛在影響是什么?

這些考慮只是操作者必須訓練其配備致命武器的無人系統處理的問題的一個子集。用大數據、人工智能和機器學習來增強這些系統,并利用它們在敵人和我們的決策圈內運作的能力,遠不是把致命的權力讓給無人系統,而是使這些系統能夠在戰斗的壓力下把人類操作員從不得不做出實時的、往往是即時的決定中解放出來。從一開始就將這種能力設計到無人系統中,最終將使它們成為其軍事操作者的有效伙伴。

這使我們回到了美國防部副部長羅伯特-沃克提出的一些擔憂。他指出,當敵人以 "機器速度 "攻擊我們時,我們需要利用機器來幫助保護我們。建立具有強大的大數據、人工智能和機器學習水平的無人系統,能夠與操作人員合作進行這項工作,才能最終確保我們建造的無人系統充分發揮其潛力,幫助我們的作戰人員在戰斗中獲勝。

有令人信服的證據表明,美國,特別是美國軍隊,必須在利用大數據、人工智能和機器學習方面超過我們的同行競爭對手。人工智能國家安全委員會在其2019年的臨時報告中明確分析了人工智能將如何成為游戲規則的改變者。"人工智能將塑造權力的未來。"2020年,《未來國防工作組報告》這樣提出將大數據、人工智能和機器學習插入美國軍事武器系統的必要性:

  • 將人工智能納入軍事和國家安全領域,將從根本上改變戰爭的打法和勝利方式。無論哪個國家在人工智能競賽中獲勝,都將擁有關鍵的、也許是不可逾越的軍事和經濟優勢......算法戰爭的到來,由速度和精度驅動的人工智能武器在復雜的戰斗空間中競爭,要求美國在進攻性和防御性人工智能能力方面進行大量投資。

我們通過使用無人機系統的例子討論了插入大數據、人工智能和機器學習的影響,在這種情況下,MQ-4C “海衛一”,因為當插入這些技術的問題出現時,這是大多數人想到的戰爭領域。但還有一個領域,大數據、人工智能和機器學習可以在戰爭中產生更大的影響,那就是決策領域。

8 一個更普遍的用例:增強決策

伊恩-托爾在其獲獎的美國海軍誕生和成熟的歷史《六艘護衛艦》中,不僅記錄了海軍的早期發展,還記錄了它在多場戰爭中的掙扎。67很少有人在讀完這本書后,會對1775年至1815年間海軍和國家的生存是如何的近在眼前。

雖然我們很容易被托爾的敘述所吸引,像讀小說一樣快速閱讀這段歷史,但至關重要的是,不要錯過決策在海軍的勝利和失敗中的重要性。從在哪里建造這些護衛艦,到選擇它們的活動區域,到它們要打哪場戰役和避免哪場戰役,以及其他一系列的決定,主要是使國家能夠在那危險的幾十年中生存下來的正確決定。

雖然今天美國海軍的平臺和武器與迪凱特、普雷布爾、班布里奇、赫爾、佩里、勞倫斯等艦長的海軍沒有任何相似之處,但今天的艦長仍然必須做出他們的前輩所做的那種生死攸關的決定。大不相同的是今天的決策速度。像憲法號、星座號和其他早期護衛艦的艦長往往有幾個小時甚至幾天的時間來做出關鍵的選擇,而今天的艦長必須在幾分鐘甚至幾秒鐘內做出決定。

軍事史上不乏這樣的例子:做出更好決定的指揮官獲得了勝利,即使他們的對手擁有地理或物質優勢,這些事件在此無需重述。值得注意的是,在過去的幾個世紀里,各級領導人有幾個小時,甚至幾天的時間來做出關鍵決定。但到了上個世紀中期,戰爭的變化極大地壓縮了決策周期。

在朝鮮戰爭期間,俄羅斯的米格-15戰斗機和美國的F-86 "佩刀 "戰斗機為爭奪制空權展開了激烈的戰斗。空軍上校約翰-博伊德(John Boyd)為了找到一種減輕美國戰斗損失的方法,創造了我們今天所知的OODA循環。OODA是指:觀察、定向、決定和行動。

博伊德的概念是,勝利的關鍵是創造一個比對手更快地做出適當決定的環境。博伊德的構思最初是一種在空對空作戰中獲得成功的理論,是根據他的能量-機動性理論和他對米格-15戰斗機和北美F-86佩刀戰斗機在朝鮮的空對空作戰的觀察而發展出來的。哈利-希拉克--F-16戰斗機的總設計師在談到OODA理論時說:"時間是主導參數。在最短的時間內完成OODA循環的飛行員占了上風,因為他的對手在應對已經發生變化的情況時被抓住了。"

即使是非軍事觀察員也清楚,空對空作戰可以說是壓力最大的軍事行動之一。但是,軍事領導人越來越意識到,壓力--尤其是無法處理信息--導致軍事操作人員開始出現自己的OODA環,并做出次優的決定。

在壓力下做出關鍵軍事決策的挑戰在1965年的電影《貝德福德事件》中進入流行文化。這部電影松散地基于美國海軍艦艇和蘇聯潛艇之間的一些冷戰事件,其情節線圍繞著美國驅逐艦貝德福德號(DLG 113)和一艘蘇聯潛艇之間的貓捉老鼠游戲。

貝德福德號的船員在長達數日的潛艇搜尋中變得越來越疲憊。隨著尋找蘇聯對手的緊迫性加劇,貝德福德號的船長無視他的船員在壓力下萎靡不振的警告,提高了他的要求,甚至碾壓了柴油潛艇的呼吸器。當有人問船長他是否會對他的對手開第一槍時,他回答說他不會,但 "如果他開一槍,我就開一槍"。一個疲憊的少尉把他的船長的話誤認為是 "開一槍 "的命令,于是發射了一枚反潛火箭,摧毀了潛艇,但在它發射一枚核武魚雷之前,潛艇就被消滅了。

雖然是虛構的,但《貝德福德事件》對55年后的一個真實世界的事件卻有可怕的預見。雖然對2020年1月伊朗革命衛隊擊落一架烏克蘭噴氣式客機的全面調查需要幾個月,甚至幾年的時間,但今天已知的是,在戰斗的壓力下,伊朗剛剛向美國軍隊發射了一連串彈道導彈,該國對美國的反擊保持高度警惕。

在伊朗情報或軍事指揮系統的某個地方,發出了巡航導彈來襲的警告。負責一個防空導彈組的軍官試圖聯系他的上級指揮中心,以獲得開火的授權。可悲的是,他無法接通,帶著不完整的信息,他發射了兩枚防空導彈,176人死亡。

這些事件--一個是虛構的,一個是非常真實的--有一個共同點:人類被迫在信息不充分或錯誤的情況下做出關鍵決定。在《貝德福德事件》中,它是人類之間相隔幾英尺的空氣間隙。在烏克蘭飛機被擊落的案例中,是無法溝通,以及對威脅的錯誤認知。

很容易將上述事件視為難以置信的虛構或不如美國軍隊的決定,但這將是一個悲劇性的錯誤。美軍人員做出錯誤決定導致生命損失的引人注目的事件已經困擾了美國軍隊四十多年。

  • 1987年5月,美國海軍斯塔克號(FFG 31)在兩伊戰爭的禁區邊界附近巡邏。由于錯誤地認為交戰雙方都不會以美國軍艦為目標,當斯塔克號試圖與來襲的飛機進行溝通時,艦長一開始并沒有感到震驚。伊拉克的 "幻影 "噴氣機發射了兩枚 "飛魚 "導彈,造成37名美國人死亡,近二十人受傷。

  • 1988年7月,懷著對斯塔克號艦長未能采取行動保護他的艦艇的回憶,在兩伊戰爭仍然激烈的情況下,當他的艦艇被伊朗炮艇圍攻時,文森斯號(CG49)的艦長錯誤地認為,一架接近的飛機正在接近并以攻擊姿態下降。他發射了一枚SM- 2ER導彈,擊落了伊朗航空公司655號航班,機上290人全部死亡。

  • 1994年4月,兩架美國空軍F-15 "攻擊鷹 "在伊拉克上空擊落兩架美國陸軍UH-60 "黑鷹 "直升機,認為它們是伊拉克的米-24 "雌鹿 "直升機,機上26名軍人和平民全部死亡。空軍AWACS控制飛機和 "攻擊鷹 "之間的誤傳,以及自動識別敵我系統的故障,是造成這場悲劇的近因。

  • 2001年2月,在瓦胡島以南10英里處,在為VIP平民游客進行的演示中,美國海軍格林維爾號核潛艇(SSN 772)進行了一次緊急壓載打擊機動,并在日本漁船愛媛丸號下浮出水面。船上的三十五人中有九人死亡。

  • 2017年6月,美國海軍菲茨杰拉德號(DDG 62)與集裝箱船MV ACX Crystal相撞。她的七名船員被殺,其他幾人受傷。僅僅三個月后,美國海軍約翰-S-麥凱恩號(DDG 56)與懸掛利比里亞國旗的油輪Alnic MC相撞。她的10名船員在這次事故中死亡。

雖然所有這些悲慘的事故背后有多種原因,最明顯的是涉及美國海軍菲茨杰拉德號和美國海軍約翰-S-麥凱恩號的致命碰撞,但很明顯,在每個案例中,都有可用的數據,如果使用得當,可能會打破安全專家所說的 "事故鏈",并防止悲劇的發生。

值得注意的是,做出這些次優決策的軍方人員是在手頭的工具下做了他們能做的最好工作。發生的情況是,戰爭的速度往往超過了人腦做出正確決定的能力。事實上,正如美國陸軍研究實驗室的首席科學家亞歷山大-科特博士在一次指揮和控制會議上所說,"人類的認知帶寬將成為戰場上最嚴重的制約因素"。

美國空軍技術地平線報告這樣描述這一挑戰:"盡管今天人類在許多任務上仍然比機器更有能力,但人類的自然能力正變得與技術提供或要求的巨大數據量、處理能力和決策速度越來越不匹配。更緊密的人機耦合和增強人的表現將成為可能和必要。"由于這些原因和其他原因,海軍需要大數據、人工智能和機器學習,以使其作戰人員在戰斗中獲得優勢。

對于我們今天使用技術的人來說,這一挑戰應該不足為奇。正如任何擁有智能手機的人在打開機器后不久就知道的那樣,獲得足夠的數據很少是個問題。有時讓人不知所措的是對大量的數據進行分類,并試圖只挑出當下必要的數據。從戰爭的角度來看,這意味著系統只向決策者提供經過精心策劃的信息,以幫助他或她做出更好的決定,而且往往是在戰斗的壓力下。

每年春天在海軍戰爭學院舉行的當前戰略論壇是美國海軍的年度會議,討論和評估海軍對國家和國際安全的貢獻。雖然每個論壇都有其亮點,但2017年的活動可能會被人們記住,因為海軍作戰部長在會上用手說話。沒錯,約翰-理查森上將,一個核潛艇兵--而不是一個戰斗機飛行員--用他的手說話,把聽眾帶回了70多年前發明的航空戰術。

CNO將時鐘撥回到20世紀50年代的空軍上校約翰-博伊德和OODA循環。理查森上將用OODA環路來討論美國海軍正在使用的各種新技術。他指出,海軍已經在博伊德分類法中的觀察和行動部分進行了大量投資。他指出,在大數據、機器學習和人工智能等新興技術出現之前,我們對OODA環路中的 "觀察和決定 "部分無能為力,但今天我們可以。

這正是CNO在他的講話中使用博伊德的OODA循環的原因。他解釋說,今天的海軍作戰人員有大量的--甚至是壓倒性的--數據需要處理。他們需要大數據、人工智能和機器學習來整理這些數據,只呈現那些有助于決策者和扣動扳機者更快做出更好決策的信息。不難看出,這種將數據轉化為戰術上有用的信息的努力對作戰的所有方面都很重要,而不僅僅是戰斗機戰術。

現在可能是時候在美國海軍幾十年來幫助作戰人員做出更好決策的努力基礎上再接再厲了。海軍在利用技術幫助作戰人員在緊張的情況下以更少的人和更少的錯誤更快地做出更好的決定方面一直走在前列。在20世紀80年代,海軍研究辦公室啟動了一項計劃,研究作戰人員如何在高度緊張的情況下做出更好的決定。這項計劃被稱為TADMUS(壓力下的戰術決策),它利用認知科學在了解決策者如何做出決策方面取得了新的突破。這導致了海軍太平洋信息戰中心的科學家和工程師設計了幾個原型(多模式觀察站、知識墻和其他),并進行了測試,在幫助決策者實現改進決策方面取得了令人鼓舞的成果。

TADMUS與類似的海軍項目一樣,就其本身而言是好的。但正如理查德森上將在其當前戰略論壇的發言中所指出的,直到最近,將強化決策提升到新水平的技術還不存在。今天,它確實存在,而且利用大數據、人工智能和機器學習能夠為作戰人員提供的東西,很可能導致海戰的下一個突破,特別是在決策領域。海軍太平洋信息戰中心與通過海軍研發界、工業界和學術界的合作伙伴一起,正在領導各種努力,以確保美國作戰人員有能力以更少的人和更少的錯誤做出更好的決定。

9 充分發揮大數據、人工智能和機器學習的作用

在美國戰略和軍事指導的最高層,大數據、人工智能和機器學習被認為對為美國軍隊提供作戰優勢極為重要。而且,那些負責將這些技術整合到美國軍事平臺、系統、傳感器和武器的人越來越多地將決策確定為這些技術可以增加最大價值的一個重要領域。

在AFCEA/海軍研究所 "西部 "會議上的講話中,海軍預算主任迪特里希-庫爾曼少將這樣提出了海軍如何能夠最好地利用大數據、人工智能和機器學習的問題。"我們如何利用人工智能,不是為了生產殺人的自主平臺,而是為了讓指揮官在戰斗中獲得優勢?"的確,美國海軍--進而是美國軍隊--想要利用大數據、機器學習和人工智能的本質,不是在沒有人類監督的情況下向遠方發射終結者般的無人系統,而是幫助操作員做出更快、更明智的決定。

軍事作戰人員將始終處于循環之中,并將得到大數據、機器學習和人工智能的協助。軍方希望通過這些尖端技術--無論是應用于無人系統還是戰爭的其他方面--來實現的是進入對手的OODA循環。負責研究、開發和采購的海軍助理部長詹姆斯-格茨閣下在一次軍事工業會議上這樣說:"如果一支部隊能夠利用人工智能讓決策者比對手更快地做出決定,那么它每次都會贏。"

在海軍戰爭學院的一次演講中,美國防部聯合人工智能中心主任杰克-沙納漢中將這樣說。"人工智能對美國國防最有價值的貢獻將是它如何幫助人類做出更好、更快、更精確的決定,特別是在高后果的行動中。"

很明顯,美國國防部已經認識到,淹沒在數據海洋中的作戰人員無法做出有效的決策,并試圖利用人工智能和機器學習等技術來幫助整理數據,只呈現在激烈戰斗中有用的信息。

沙納漢將軍在戰爭學院的講話中談到了利用大數據、人工智能和機器學習幫助作戰人員做出更好決策的機會和挑戰,他指出:"在思考、書寫和談論人工智能與實踐之間存在著鴻溝。卷起袖子,投入到人工智能項目中,這是無可替代的。

最近,國防部聯合人工智能中心的新主任邁克爾-格羅恩中將這樣強調了決策:

  • 當我考慮人工智能的應用時,我想的不僅僅是在發現目標后近乎瞬時開火的用例。在整個聯合部隊中,有一系列廣泛的決策必須由人工智能來實現。

在20世紀的戰爭中,衡量軍事優勢的單位是坦克、艦艇或飛機,以及 "勝過槍炮和棍棒 "對手的能力。在21世紀的戰爭中,軍事領導人只有幾分鐘甚至幾秒鐘的時間來做出關鍵的決定,超越對手的思維能力將決定勝利和失敗的區別。

當美國軍方及其國防工業伙伴在21世紀的第三個十年中制定他們的研發投資決策時,早就應該關注一個長期被忽視的領域--我們的軍事決策者的思想,并確保他們能夠做出更好的決定,比他們的對手更快和更少的錯誤。

付費5元查看完整內容

人工智能正在改變戰爭。英國防部如何準備應對未來的變化?

對于人工智能的軍事用途所帶來的接受挑戰,傳統的反應是堅持要求人類保持 "有意義的人類控制",作為一種產生信心和信任的方式。考慮到人工智能和相關基礎技術的普遍性和快速發展,這不再是一個適當的回應。人工智能將在整個軍事行動范圍內廣泛的指揮和控制(C2)活動中發揮重要的、日益增長的作用。雖然在公眾心目中,人工智能的威脅沒有 "殺手機器人 "那么直接,但在軍事決策中使用人工智能會帶來關鍵的挑戰,同時也有巨大的優勢。加強人類對技術本身的監督并不能防止無意的(更不用說有意的)濫用。

本文以各級(作戰操作員、指揮官、政治領導人和公眾)的信任對有效采用人工智能進行軍事決策至關重要這一前提為基礎,探討了關鍵的相關問題。對人工智能的信任究竟意味著什么?如何建立和維持它以支持軍事決策?人類操作員和人工智能體之間的共生關系對未來的指揮需要作出哪些改變?

當人類對人工智能的行為持有某些期望,而不考慮人工智能體的意圖或道德時,可以說存在對人工智能的信任。然而,與此同時,信任不僅僅是技術性能和可靠性的一個功能--它不能僅僅通過解決數據完整性和可解釋性問題來保證,盡管它們很重要。軍事人工智能中的信任建設還必須解決軍事組織和指揮結構、文化和領導力方面的必要變化。實現總體上適當的信任水平需要一個整體的方法。除了信任人工智能的使用目的之外,軍事指揮官和操作人員還需要充分信任--并且在如何信任--支撐任何特定人工智能模型的輸入、過程和輸出方面得到充分的培訓和具有豐富經驗。然而,最困難的,也可以說是最關鍵的層面是組織生態系統層面的信任。如果不改變軍事決策的體制因素,未來人工智能在C2中的使用將仍然是次優的,被限制在一個模擬框架內。有效引進任何新技術,更不用說像人工智能這樣的變革性技術,需要從根本上重新思考人類活動的組織方式。

優先考慮人和制度層面并不意味著對技術進行更多的控制;相反,它需要在不斷發展的人機認知系統中重新思考人的作用和貢獻。未來的指揮官將需要能夠在一個真正的 "整體部隊"中領導不同的團隊,整合來自軍事、政府和民事領域的貢獻。他們必須對他們的人工隊友有足夠的了解,以便能夠與他們合作并挑戰他們。這更類似于海鷗的雜音,而不是個別 "翠鳥"領導人的天才。為了發展新的指揮和領導概念,英國防部必須重新思考其方法,不僅是培訓和職業管理,還有決策結構和程序,包括未來總部的規模、位置和組成。

人工智能已經在改變戰爭,挑戰人類長期的習慣。通過在訓練和演習中接受更多的實驗,以及探索C2的替代模式,國防部可以更好地準備迎接未來不可避免的變化。

前言

人工智能正在改變人類的思維和決策方式。未來,它將越來越多地影響人類如何確定各種認知過程的優先次序,調整他們的學習、行為和訓練,并更廣泛地改造他們的機構。這些變化在整個軍隊中仍不完全明顯。盡管有新的技術和戰爭迅速發展的特點,今天的武裝部隊在組織結構上與后拿破侖時代歐洲的職業軍隊并沒有很大的區別。太多的人仍然參與到軍事任務中,而這些任務技術可以做得更好更快,并且對于重新思考人類對人機團隊的認知貢獻也沒有給予足夠的重視,而這正是解決未來指揮和控制(C2)問題所需要的。

本文以QinetiQ公司早先的一份報告為基礎,該報告將信任視為軍事能力的基本組成部分和2020年代軍事適應性的基本要求。本文探討了在軍事決策中越來越多地使用人工智能的最新趨勢和想法。本文并不直接關注這一趨勢的倫理(或法律)問題,盡管這些問題很重要。相反,本文強調了信任作為人工智能時代軍事指揮的一個因素的重要性和意義。

人工智能對軍事決策和C2的潛在深遠影響很少引起專家團體以外的關注。大多數公眾關注的是技術的優勢和風險,而不是人類認知和制度構建的潛力和限制。20多年前,著名的社會生物學家E-O-威爾遜抓住了人類當前的挑戰。威爾遜說,真正的問題是,"我們有舊石器時代的情感;中世紀的制度;和神一樣的技術。"在過去的幾十年里,技術的發展速度遠遠超過了人類適應它的能力。強調人工智能的技術屬性,而忽略其日益增長使用中的人類和制度層面,只會使挑戰更加復雜。

在許多領域,人工智能的軍事經驗仍然有限,需要做更多的工作來了解人工智能在人類決策中作用日益增長的影響。本文旨在引發一場更廣泛的辯論,討論英國國防企業內部所需的文化和組織變革,包括指揮部和指揮官的作用,以確保人工智能在未來軍事決策中的最佳使用。

本文的見解來自與人工智能、人類認知、軍事決策和信任理論有關的更廣泛的文獻。這項研究在2021年9月至2022年2月期間進行,大大受益于與來自國防、學術界和工業界的廣泛專家和用戶的訪談。

前兩章提供了本文的理論背景。第一章探討了人工智能和信任的概念,第二章則分析了人類機構的作用以及人工智能對人類做出選擇和決定的認知能力的影響。第三章結合信任、人工智能和人類機構的概念,提出了一個在人工智能支持的軍事決策中發展信任的五維框架。第四章擴大了對C2的分析范圍,特別關注人工智能對傳統上支撐武裝部隊行使權力和指導的人和體制結構的影響。最后一章提出了對未來指揮、領導和 "全軍 "團隊的進一步研究領域。

1. 人工智能和信任

對于人工智能或與人工智能有關的信任,并沒有標準的定義。這兩個概念都有不同的解釋,有時也會有激烈的爭論。本章沒有試圖綜合所有關于這兩個術語的文獻,而是建立了一個基準定義,為隨后討論關于人工智能應用于軍事C2的信任作用提供框架。

1.1 人工智能的性質和類型

人工智能的概念起源于1950年著名的圖靈測試,該測試發生在這個詞被創造出來的幾年前。通過關注它做什么而不是它是什么,更容易將人工智能概念化。人工智能 "試圖讓計算機做人類思想能做的各種事情"。在最基本的方面,它可以被理解為追求特定任務的虛擬信息處理能力。正如 "智能"(或 "思想")有許多層面和不同的用途,人工智能也是如此。因此,人工智能從廣泛的學科中汲取不同的想法和技術,不僅包括數學和計算機工程,還包括哲學、經濟學、神經科學、心理學和語言學。

廣義上講,有三種不同層次的人工智能:人工狹義智能,通常被稱為 "狹義人工智能";人工通用智能,有時被稱為人類水平的人工智能;或者更強大的人工超級智能,超過人類的智能水平。在這一點上,有些人認為會出現一個奇點,在這個奇點中,人工智能要么變得有自我意識,要么達到持續改進的能力,使它的發展超出人類控制。后兩種水平被認為仍有一段距離,盡管距離有多遠還存在爭議。不過,就目前而言,狹義人工智能更先進應用的出現,如先進的機器人技術,加上計算能力的爆炸,才是目前關于人工智能的軍事用途辯論的主要動力。本文重點討論狹義人工智能的應用。

圖 1:AI 類型的簡化分類

在狹義的人工智能中,還有更多的類別,盡管這些技術并不完全是離散的,而且經常被結合使用。最常見的區別是符號人工智能和亞符號或非符號人工智能,前者通常被描述為基于邏輯,后者基于自適應或學習。符號人工智能依賴于順序指令和自上而下的控制,使其特別適合于確定的問題和基于規則的過程。非符號人工智能,其中神經網絡是一種常見的方法,涉及并行、自下而上的處理和近似推理;這與動態條件和數據不完整的情況最相關。符號人工智能提供了精確性和可解釋性,而涉及神經網絡的非符號人工智能則不那么脆弱(網絡中缺少一個節點并不會導致整個網絡無法運行),并且能夠在沒有明確規則或一致證據的情況下識別模式。

有三種常見的機器學習類型,根據有助于智能體學習過程的反饋類型進行區分:監督學習;無監督學習;以及強化學習。在監督學習中,系統被訓練來產生假設或采取具體行動,以追求基于特定輸入的目標值或輸出(被稱為標簽)(例如,圖像識別)。無監督學習沒有設定規格或標簽,也沒有明確的反饋;相反,系統通過尋找數據中的模式進行學習(例如,DNA序列聚類)。強化學習依賴于一個反饋回路,通過試錯或獎懲機制穩定地強化系統的學習行為(例如,先進的機器人技術或無人駕駛汽車)。與監督學習不同,強化學習中使用的輸入數據不是預先定義的,這允許更廣泛的探索,但與無監督學習不同,它有一個預期的應用或總體目標(與總體獎勵最大化相關)。

所有三種類型的機器學習,無論監督或自律的程度如何,都提出了重要的信任和值得信賴的問題。所需的信任程度和性質因使用人工智能的目的不同而不同。

1.2 概念:信任(Trust)

信任描述了兩個或多個智能體之間的互動。信任的傳統定義是假設信任者對受托人的能力和善意(或動機)存在合理的信念。對許多人來說,道德誠信(或意圖)的問題是信任與其他概念(如信心)的區別。另一些人認為,信任的范圍和所指比信心更廣,后者被視為與具體事件相關的獨立判斷。大多數信任的定義趨于統一的是一種脆弱的感覺。沒有背叛的可能性,沒有風險的存在,就不可能有信任。

正是因為經典的信任概念中隱含著假定的道德因素,一些人質疑使用該術語來描述人類與人工智能體的關系。他們認為,在目前狹義人工智能的水平上,我們不能將意向性或道德機構歸于人工智能系統,因此使用 "信任 "一詞是不恰當的。另一些人采取了不那么純粹的觀點,并以反映日常使用的方式應用該術語,意味著對系統的可靠性有信心。

信任作為一個術語在計算機科學中被廣泛使用。更重要的是,信任仍然是公眾和用戶接受人工智能的一個基本方面。今天,關于人工智能的國家政策、法規和專家建議經常強調 "值得信賴的人工智能 "的必要性。例如,DARPA的空戰進化計劃正在探索方法,以模擬和客觀地衡量飛行員在斗狗時對人工智能的信任。認識到這些尚未解決的定義問題,作者選擇了略微調整 "信任 "一詞,使之與通常的做法一致。

作者調整后的信任概念需要對人工智能的表現有一定的預期,而不需要假設人工智能方面的特定動機。因此,對人工智能體行為的積極預期可能是信任存在的充分條件,而不考慮意圖。

在目前大多數關于人工智能的討論中,重點往往是人作為信任者,系統作為受托人,盡管任何認知智能體,包括自主機器人和智能機器,原則上也可以履行信任者的角色。這樣理解的話,信任就成了 "系統成員之間互動的促進者,無論這些成員是人類智能體、人工智能體還是兩者的組合(混合系統)"。事實上,在人工智能更成熟的應用案例中,受托人最有可能同時包括人工智能支持的系統(人工智能體)和該系統的提供者(人類智能體)。在目前的人工智能水平上,信任似乎是一種單向的關系,涉及人類 "信任 "人工智能的程度,而不是真正的雙向信任,即人工智能對人類表現的看法。

各種因素決定了(人類)對技術的信任,包括但不限于信任者的能力水平和信任傾向,以及整體環境或背景(包括更廣泛的文化和機構動態)。除了這些針對人類和環境的考慮,決定一個人或組織對人工智能的信任程度的是技術的性能、過程(它如何產生特定的輸出),以及重要的是目的。所有這三者都決定了人工智能系統的設計和部署。

除了技術的穩健性和安全性,隱私、公平、透明度和問責制是一些最常被提出的影響公眾對人工智能信任的問題。然而,主要是由于設計適當的算法、理解復雜軟件系統的內部結構以及為基于算法的決策賦予責任等方面的困難,所以在值得信賴的人工智能的關鍵屬性列表中總是會加入進一步的考慮:這被交替稱為人類機構、監督或有意義的控制。在某些情況下,保持人類對技術使用的監督可能是唯一的保護措施,以防止無意中出現有偏見的、不可捉摸的和/或監管不力的人工智能系統的風險。

1.3 概念:控制(Control)

控制通常被看作是信任的反面。當對智能體執行任務的能力有信任時,就不需要監督。然而,即使在人工智能更適合做決定的情況下,人類也會經常傾向于干預。信任不足可能和過度信任一樣有風險或適得其反。事實上,正如絕對的控制是罕見的,絕對的信任也是如此。在開發和使用人工智能的過程中,有必要在適當的信任水平和適當的控制水平之間取得謹慎的平衡。這是 "校準的信任 "或可適應/適應性自主性等概念的核心。信任是根據人工智能的能力來校準的,對人工智能能做什么或不能做什么的期望將影響信任的水平。同樣,在可適應的自主性的情況下,用戶定制自主性水平的能力可以支持更大的信任水平。這在國家安全決策中尤為關鍵,因為信任或不信任人工智能的影響可能是最大的。

對技術在人類事務中的作用的擔憂并不新鮮。許多人認為關于人工智能的辯論與之前關于技術的爭論沒有什么不同。根據這一論點,人工智能構成了一種進化,而不是對過去活動的徹底背離,即使人類有時可能在背離以前的自動化水平的情況下被從決策圈中移除。雖然信任仍然是一個挑戰,特別是在機構和社會層面,但穩步應用最初仍然有限的人工智能來支持軍事活動,隨著時間的推移,可以培養出熟悉和越來越多的信心。

其他人,通常是政府以外的人,質疑這種漸進式的方法。他們認為人工智能的崛起是一種范式的轉變,與以前的任何技術都有質的不同。以前的技術都沒有將人工智能的雙重用途特性、傳播的便利性和實質性的破壞潛力結合起來。在過去,最具破壞性的技術都在政府的控制之下,或者在軍事領域之外幾乎沒有應用。此外,雖然以前政府主導了大部分新技術的開發,但這種趨勢幾乎完全逆轉;現在大部分投資和創新來自于工業。鑒于軍事和民用界限的模糊,以及我們的對手和競爭者對人工智能的投資,認為我們可以控制人工智能發展和使用的速度和程度是不明智的。在反思算法技術的進步時,一些人甚至進一步聲稱技術和人類之間的角色發生了逆轉,人們正在成為 "人類的人工制品"和"(技術系統的)智能體"。

如果我們接受對人工智能系統在未來如何操作(和運行)進行完全控制的限制,關鍵問題是我們如何在算法超過目前的性能水平后長期確保適當的交互和人類判斷。反應時間是軍事競賽中的一個關鍵優勢;加快OODA(觀察--方向--決定--行動)循環的各個方面,通常會給那些先到者帶來領先優勢。而這樣做只要一方開始使用人工智能來加快他們的決策和反應時間,另一方就會受到壓力。

2. 人工智能和人類機構

2020年12月,美國空軍首次使用人工智能副駕駛飛行了一架軍用飛機。這種被稱為ARTUμ的算法完全控制了傳感器的使用和戰術導航,而其人類隊友則駕駛著U2間諜飛機。這是首次出現人工智能控制軍事系統的情況。用美國空軍前首席采購官員威爾-羅珀的話說,ARTUμ "是任務指揮官,是人機團隊的最終決定者"。

甚至在ARTUμ演示之前,美國國防部已經開始了其全域聯合指揮控制(JADC2)計劃的工作。JADC2旨在打造連接五個軍種的傳感器,承諾對作戰環境進行快速分析,以便在幾小時或幾分鐘內做出決策。在未來的JADC2中,人工智能將允許快速處理數據,為目標識別提供信息,并推薦最佳的交戰武器(無論是動能還是非動能)。美國空軍的先進作戰管理系統、美國陸軍的 "聚合項目"(被稱為 "學習運動")和美國海軍的 "超配項目 "都在嘗試使用人工智能與自主性相結合的方式來支持JADC2。

其他國家,包括英國通過英國陸軍的 "Theia計劃"等項目,以及北約也已經開始嘗試使用人工智能來支持C2和決策。然而,這種試驗的規模和范圍仍然有限。與數據挖掘和語言翻譯等領域不同,人工智能在軍事決策中的應用仍處于起步階段。

美國國防部高級研究計劃局目前開展的工作提供了對未來的一瞥。作為其 "AI Next "項目的一部分,該機構的第三波人工智能投資尋求 "將計算機從工具轉變為解決問題的伙伴",并 "使人工智能系統能夠解釋其行動,并獲得常識性知識并進行推理"。

2.1 人工智能的民事與軍事用途

人工智能已經塑造或推動了我們的許多日常決策。在某些情況下,它已經改變了整個行業。在高度交易性的活動中尤其如此,如保險或零售部門。人類已經將關鍵活動的責任交給了人工智能,讓算法在沒有人類干預的情況下做出決定。今天,人工智能塑造了谷歌和Facebook等網絡平臺提供的內容,也決定了哪些內容被刪除或屏蔽。保留了人類因素的人工智能決策支持系統也在激增,被用于從醫療診斷到改善制造工藝的各個方面。

很少有地方像金融業那樣,人工智能從根本上改變了人與機器的關系。人工智能現在負責絕大多數的高頻交易。在幾毫秒內做出的數千項微觀決定有能力改變整個財富,有時會帶來毀滅性的后果,2010年的 "閃電風暴 "證明了這一點。人類的決定對于金融市場的效率不再是必要的,事實上,甚至可能會起到反作用。無形的算法似乎已經超越了無形的手。

至于社會的其他部分,人工智能的潛在軍事用途涵蓋了廣泛的應用范圍。這些可以有效地分為企業、任務支持和業務人工智能應用。人工智能的軍事應用,特別是與任務支持和作戰用途有關的應用,在一些基本方面與日常的民用活動不同。在平民生活中,人工智能有機會利用大量容易獲得的數據,不斷針對現實生活中的例子進行訓練和學習。對于軍隊來說,與對手的接觸是零星的,來自真實行動的教訓或 "數據 "在數量和頻率上都相對較低。除了軍事對抗的偶發性質,國家安全決策通常依賴于一套復雜得多的條件,涉及多個參數和利益相關者(更不用說對手的意圖),而今天的算法沒有能力再現這些條件。最后,也是最重要的一點,在國防和國家安全問題上,面臨風險的不僅僅是財富,還有生命。數學邏輯不足以為決策提供依據;在使用武力時,道德和倫理考慮比任何其他人類活動都要突出。當人類生命的完整性受到質疑時,我們為技術設定的標準將永遠高于我們為容易出錯的人類設定的標準。

除了美國、英國和北約等國的現行政策外,人們普遍認為人類將在決策中保留一個關鍵角色。美國國防部的人工智能戰略指示以 "以人為本的方式 "使用人工智能,有可能 "將人類的注意力轉移到更高層次的推理和判斷"。納入人工智能的武器系統設計應 "允許指揮官和操作人員對武力的使用進行適當的人類判斷",并確保 "清晰的人機交互"。提到人類總是 "在循環中 "和 "完全負責選項的開發、解決方案的選擇和執行"--這是以前對我們日益自動化的未來的評估中的常見說法--已經被一種更細微的觀點所取代。

所謂的有監督的自主系統是指人類坐在 "循環 "上。雖然人類在理論上保持監督,但一些批評者認為,在實踐中,他們可能無法真正控制自動決策,因為他們可能不熟悉為他們提供決策信息的環境和人工智能程序。在這些情況下,人類的干預能力,除了停止機器之外,被降到最低,沒有達到"有意義的人類控制 "的想法。只有在完全自主系統的情況下,人類的干預才會被完全消除。然而,最終,試圖定義自主性水平的做法可能會產生誤導,因為它們假定人類和機器之間的認知活動是簡單分離的。2012年美國國防科學委員會的一份報告描述了如何:

  • 沒有完全自主的系統,就像沒有完全自主的士兵、水手、空軍或海軍陸戰隊一樣。也許對指揮官來說最重要的信息是,所有的系統在某種程度上都由人類監督,而最好的能力來自于人類和機器的協調和合作。

兩個領域的發展揭示了各國政府在國防和國家安全的關鍵決策中信任先進的自動化方面已經走了多遠。一個是導彈防御,另一個是網絡防御。兩者的有效性都取決于反應速度,這通常超過了最有經驗的人類操作員的能力。

大多數防御性武器系統,從短程點防御到反彈道導彈系統,都采用先進的自動化操作,使其能夠在沒有人類干預的情況下探測和摧毀來襲導彈。算法實際上是在發號施令。在這種系統中,人類被稱為 "循環",在事先經過嚴格的人類測試后,在有限的設計空間內運作,因此其控制范圍受到限制。雖然錯誤永遠不可能被完全消除,但在大多數情況下,不做出反應或反應遲緩的風險可能超過偶爾發生事故的風險。雖然事故促使人們對這些自主系統的操作進行審查,并可能導致引入一些進一步的人為檢查,但這種干預也帶來了進一步的復雜性。對越來越快的導彈,特別是高超音速導彈的防御將繼續推動人工智能在導彈防御中的應用。

網絡戰是人工智能相對于人類具有明顯優勢的另一個領域,而這往往需要人類保持置身事外。人類操作員缺乏算法快速檢測和應對網絡事件以及不斷調整系統防御的能力。所謂的認知電子戰(EW)系統應用人工智能技術來自動檢測對EW系統的威脅,而不是依賴人類操作員。

2.2 人類和人工的局限性

將決策過程中高度耗時、勞動密集型和需要低層次人類推理的部分自動化,有巨大的好處。軍事評估過程是軍事決策過程的一個關鍵部分,一直是參謀學院教授的標準作戰計劃過程。這種方法的一部分涉及收集和處理信息,為一個或多個行動方案提供信息。由于信息時代的決策需要更大的速度和敏捷性,達成決策的過程將需要加速。人工智能已經證明了它在基于明確定義的規則、輸入和假設快速執行理性過程中的效用。只要人類負責設定假設并定義產生替代方案和概率評估的輸入,人工智能就能增強整個決策過程。

可以理解的是,政府內部和外部都不愿意讓人工智能發揮超出決策支持和適當決策的作用。"指揮和控制"的概念在軍隊的心理和結構中根深蒂固,許多人無法接受一個在某種程度上不涉及人類控制軍事行動或指揮任務的未來。人被要求帶著他們對問題的創造性見解,像現代的亞歷山大一樣解開這個死結。沒有什么比對 "翠鳥時刻 "的信念更能體現這種對直覺型指揮官形象的依戀。這種技能,即指揮官藝術的精髓,只限于那些在最苛刻的情況下能夠憑直覺做出決定的少數人。人工智能提供并非基于人類邏輯或經驗的獨特見解的能力,對這種思維提出了深刻的挑戰,并可能在未來改變指揮官的形象。

許多人將人工智能稱為決策支持而不是決策工具,其推論是人類最終仍然是所有決策的仲裁者。這樣的區別造成了一種令人放心的錯覺,即人工智能只是協助實現一種效果。人類根據一套算法挖掘、篩選和解釋的數據做出的致命行動決定,是否比由智能機器完全執行的決定需要更多的人類機構?對 "行動 "的癡迷--更不用說致命行動--作為更廣泛的 "殺傷鏈 "的最后元素,掩蓋了人工智能在整個行動范圍內的一系列C2活動中日益增長的影響。

許多專家對人類是否有能力控制由人工智能促成或驅動的決策持懷疑態度。這種懷疑往往圍繞著所謂的黑盒問題:高級人工智能,如深度學習,在本質上是無法被人類理解的。這不僅僅是由于它的工作速度,也是由于算法網絡相互作用的方式,以及它們所操作的數據的規模和復雜性。我們不能簡單地詢問系統以了解其思維過程。我們可能知道一個模型的輸入和輸出,但卻無法理解這中間發生的事情。一個相關的、更微妙的論點是,算法對人類的認知攝入施加了 "權力"。人工智能可以決定人類處理哪些信息,而不向他們透露哪些信息被遺漏或拒絕。它還挑戰了這樣一個概念,即如果人類的行動受到數據呈現的內容和方式的制約,他們可以行使 "有意義的 "控制。這與人工智能的好處之一正好相反,即它能夠減少人類的認知負荷,使人類能夠集中精力思考和作出最高價值的活動。

對黑盒挑戰的典型解決方案是開發可解釋的人工智能(XAI)。盡管能夠自我解釋的人工智能可能有助于理解,但它并不必然會導致信任。XAI并不等同于可解釋的AI;解釋不是一個決定,而是一個關于決定的敘事。因此,即使是一個令人信服的解釋也不一定是真的。對于許多潛在的用例,我們還遠遠沒有能力開發出足夠的可解釋(Explainability)的人工智能,更不用說可因果解釋(Interpretability)的了。對更先進的人工智能系統進行嚴格的測試可能會證明它們的部署是足夠的,即使是在沒有人類能力遵循其推理過程的情況下。不過,從根本上說,我們對測試的傳統方法需要重新思考。沒有充分的測試和評估,對不可解釋/可解釋的人工智能的信任將是 "盲目的信任"。對于美國前國防部副部長鮑勃-沃克的問題,我們仍然缺乏一個令人滿意的答案:你如何對學習系統進行測試和評估?

當存在不確定性或缺乏知識時,人類會應用啟發式方法來近似解決復雜問題。啟發式方法是驅動直覺思維的因素;它依賴于經驗法則,通常是通過經驗和實驗來了解。因此,它可能存在偏見和盲點,但它也可以作為一種非常強大和有效的快速認知形式。機器缺乏類似人類的直覺,但它們確實依靠啟發式方法來解決問題。與人類推理的關鍵區別在于,機器不需要記憶或 "個人 "經驗就能進行 "直覺 "或推理。它們利用巨大的數據庫和卓越的概率能力為決策提供信息。強大的模擬與先進的計算能力相結合,提供了一個測試和 "訓練 "算法的機會,其重復程度是人類無法想象的。在宣布任務準備就緒之前,ARTUμ在短短一個多月內經歷了超過一百萬次的訓練模擬。

即使在XAI領域取得了重大進展,仍然會有謹慎的理由,特別是在需要復雜決策的情況下。人工智能通常不善于看到 "全局",也不善于根據相關的內容做出決定。像人類一樣,它也會把相關性或偶然事件誤認為因果關系。人類和機器在處理復雜問題時都會遇到 "正常的意外"。創造力是人類通常具有的特質,但一些先進的人工智能可以產生人類無法企及的驚人結果。簡而言之,許多通常被認為是人類特有的屬性,如創造力和直覺,也可以說適用于人工智能系統--盡管方式不同,速度超過人類能力。

目前機器所缺乏的是人類思維的靈活性和關聯感("框架 "的能力)。人類可以橫向思考,通過實用主義得出合理的結果(這一過程被稱為歸納推理),并反思自己的思維過程(這一能力被稱為元認知)。這些心理過程可以產生驚人的適應和創新的壯舉。

人工智能的出現意味著未來的軍事決策將幾乎肯定需要更強大的人機共生關系,就像在已經接受該技術的商業組織中看到的那樣。目前的討論大多是假設人類繼續控制,或尋求將人類的屬性應用于未來的機器。一些人提倡一種新的 "決策演習"概念,將 "人的指揮和機器的控制"結合起來。但更有可能的是,指揮和控制的責任將越來越多地由人類和人工智能系統分擔,其方式可能是目前難以設想的。人類與人工智能的合作提供了利用各自優勢和減少不足的最佳方式,特別是在戰爭方面(目前戰爭的性質仍然沒有改變)有四個連續性:政治層面;人類層面;不確定性的存在;以及戰爭是一場意志的較量。

3. 信任的維度

信任是動態的;它隨時間而變化。它的最初形成是至關重要的,但它的持續發展也是如此。信任是隨著熟悉程度的提高而自然產生的,因此,假設經驗是積極的,即使是在對技術不完全了解的情況下,技術的使用也會擴大信任的范圍。反過來也是如此,不好的經驗會促進不信任。移動電話技術復雜性對大多數用戶來說是未知的,但人們的積極經驗給了他們使用的信心。這種信心導致了與手機使用所形成的決定相適應的信任感。然而,手機一般不會決定生死大事,盡管它們會將盲目聽從指示的不謹慎的司機置于危險之中。在軍事背景下,賭注更大,用戶和策略制定者非常清楚他們的決定的潛在后果--信任門檻很高。

軍隊作為應急組織,不需要定期交付其主要產出,這影響了可以獲得最直接相關經驗的速度。與金融服務業不同的是,在金融服務業中,交易為人工智能決策提供了頻繁的驗證,而國防部門的時間線往往更長,結果在一個單一的因果鏈中也沒有明確的聯系。做出決定和觀察其影響之間的時間間隔更長,并受制于多種干預變量。雖然模擬演習創造了獲得經驗的機會,但它們只是現實的近似值。

3.1 信任點(Trust Points)

建立和維持信任涉及五個主要的 "Trust Points"--在這些點上,擁有適當水平的信任問題是至關重要的。這些點是:

  • 部署信任:使用人工智能的目的
  • 數據信任:正在使用的數據輸入
  • 過程信任:數據如何被處理
  • 輸出信任:由人工智能產生的輸出
  • 組織系統的信任:優化使用人工智能的整體生態系統

總的來說,這些Trust Points定義了一個整體的信任水平,并且是乘法的:如果對其中一個的信任是 "零",那么整體就是 "零"。只要整體信任是正向的,每個人的信任水平都可以變化--在不同的時間。

部署信任

對在特定情況下使用人工智能的決定的信任是至關重要的。對于人工智能的軍事使用(以及許多民用應用),這在三個層面上運作:社會;組織;和個人。第一個層面考慮的是整個社會是否愿意允許人工智能的使用,這將決定策略制定者如何看待它的使用。組織本身也必須愿意認可這一點。最后,個人必須愿意在這個角色中與人工智能合作。所有這三個層次都需要接受使用人工智能的必要性或其可取性的必然性。可取性可能反映了人工智能在以超過人類操作員的速度或數量(或兩者)處理數據方面的優勢,或在承擔枯燥或危險的工作方面的優勢。而軍方可能會認為,人工智能既實用又要避免將優勢讓給對手,但社會似乎更傾向于將致命的使用視為一個倫理問題,在這個問題上,人類生命的神圣性要求道德行為者決定奪取人的生命。

社會對人工智能使用的接受程度在很大程度上取決于其經驗、有效的溝通和教育,這將有助于為人工智能的使用選擇提供依據。在許多情況下,社會的某些部分可能會比軍方更多地接觸、熟悉和信任人工智能,但致命自主權可能仍然存在問題。雖然沒有致命自主權那么直接的威脅,但在決策中使用人工智能會帶來自己的挑戰,其中最重要的是在一個算法越來越強大、人機協作越來越緊密的世界里,"有意義的人類控制 "究竟意味著什么。

在組織層面,存在關于如何部署作戰和任務支持人工智能的重要問題:是以集中的方式在更高的戰略層面運作,還是以更分散的方式在戰術層面運作。在后一種情況下,人工智能將進一步滲透到組織中,變得更加分散,并用于反應時間可能限制人類干預或驗證人工智能的范圍。組織需要明確決定是否使用人工智能的原則,以及管理其使用的方法(見下文 "過程信任")。關于使用人工智能的決定必須考慮如果系統失敗會發生什么。美國國家航空航天局(NASA)由于擔心系統故障的后果而沒有充分利用其早期火星車的自主能力,對火星車進行微觀管理,并通過大型人類工程師團隊減輕風險。外部組織,如商業技術供應商,的想法也很重要。例如,谷歌的員工迫使該公司在2018年退出一份軍事合同,因為他們擔心軍方對面部識別技術的使用。

個人對人工智能的熟悉程度也將是重要的。目前,從事軍事人工智能工作的人是其使用的倡導者,但隨著接觸人工智能的人群的增加,這種情況將發生變化。與前幾代人相比,接觸技術較多的年輕軍人可能更容易接受人工智能在軍事決策中的應用,但在基礎等級的聯邦結構中,人才幾乎完全來自內部,對其使用的阻力可能來自那些有權力的人;這可能造成機構接受問題。然而,在 "代際特征 "方面,存在著過度簡化的危險。雖然年輕人是在較新的技術中長大的,而且可能更信任它,但技術是可以學習的。代際假設不能成為不使用現代技術的借口。

部署信任是復雜的,因為大多數西方國家的大規模防務活動都是以聯盟行動為前提的,而不是每個盟友或伙伴都對什么是可接受的人工智能的軍事用途有共同的看法。國防部和政府需要更好地傳達他們在使用人工智能方面的方法、用途和保障措施,包括向盟友傳達,而不向對手透露太多信息,因為他們可以制定戰略來抵消(或更糟)人工智能功能的優勢。北約將通過其公共宣傳活動、與成員國在政治層面的聯系以及在不同技術發展階段的軍隊中建立規范,在這方面發揮關鍵作用。

數據信任

這涉及到對人工智能做出判斷的數據的信任程度,這些數據為人類決策提供了依據。雖然測試硬件和軟件相對容易,但測試數據,甚至是準備讓人工智能接受訓練的數據,則更加困難。數據對于人工智能的有效學習至關重要。一些數據將被控制,駐留在現有的國防系統內,或從可靠的外部來源進行驗證,盡管國防部在數據的分類(不一致或不準確)、存儲、訪問和共享方面存在困難,特別是在較高的分類級別。不受控制的數據,如開放源碼數據,是在沒有人類知識或理解的情況下通過聚合產生的,這更具挑戰性。此外,狡猾的對手會試圖注入虛假數據,以破壞決策過程,或用不相關或不準確的數據淹沒決策過程。

武裝部隊需要定義、構建、清理和分析數據的能力,以及開發和維護底層基礎設施(如連接、安全和存儲容量)的能力。這是一個多學科的團隊工作,需要能夠在數據科學生命周期的所有階段工作的 "全棧 "數據科學家。現代戰場將需要更加多樣化的技能,包括心理學家、律師和通信專家。鑒于商業世界對這些技能的需求,吸引和保留這些專家的數量將是困難的。這將需要更靈活的人力資源做法和/或對整個部隊更復雜的理解和使用,包括允許非軍事人員在軍事總部擔任有影響力的職位。

過程信任

過程信任指的是人工智能系統如何運作,包括數據如何處理(匯總、分析和解釋)。目前英國國防部的(狹義的)人工智能決策支持系統吸引了高信任度,因為算法相對簡單且可預測。它們也僅限于參與開發的一小群用戶,或者認識那些開發了人工智能系統的用戶,并且了解該技術。該技術受益于一種源自人們對人類的信任的過渡性信任。雖然不是人工智能,但法國陸軍引進的包裝降落傘的機器導致了降落傘團的信心喪失。堅持要求機器的主管用機器隨機選擇的降落傘打包跳傘,有助于恢復用戶的信心。讓開發人員更接近指揮系統的用戶會有所幫助。法國的采購程序允許某些單位直接與人工智能供應商接觸,以建立對開發商的了解和關系。開發商成為一個關鍵的信任點,如果不是軍隊,他們必須了解和熟悉軍隊的情況。這可能需要加大投資,讓商業伙伴了解軍隊的工作方式,并確保軍事人員了解其文職同事。

要求高水平的可解釋性和透明度并不是一個永久的解決方案,目前限制了英國防部對更強大的、非符號形式的人工智能的訪問。隨著機器學習使技術超越其最初編程的參數,將需要不同的方式來確保對可能看起來是黑盒的信任。隨著這種人工智能系統的使用激增,因了解設計者而產生的過渡性信任將減少,在這個過程中克服最初的信任不足或過度信任將更加困難。應避免過度依賴過程信任,并加強其他信任點,以開發適應能力越來越強的人工智能。

過程信任必須超越技術本身。它需要信任那些為技術提供能量、與技術一起工作并接受技術產出的人類過程。因此,必須同樣重視那些共同構成整體過程的其他活動。這包括培訓和人員的過程,以及如何組建團隊。

輸出信任

對人工智能產出的信任對決策者根據他們收到的信息采取行動至關重要。即使是人類提供的情報,如果原始信息指向不同的方向,指揮官要求新的情報來支持他們的先入之見(一種 "基于決策的證據制作")也不是沒有。而隨著數據的激增,不同的解釋將成為可能,合法的或符合先入為主的解釋。因此,出現了這樣的問題,即人工智能或事實上的人類分析能夠現實地提供什么答案,以及如何驗證輸出。在友軍的部署和對手的物理位置方面,人工智能有可能提供更快的態勢感知。然而,盡管可以從現有的數據中得出更好的推論,但對手的實際意圖是無法可靠地確定的。可預測性通常被視為信任的關鍵因素,但在不穩定的環境中,能夠適應不穩定環境的人工智能輸出會被解釋為不可預測。為了克服這個問題,Bonnie M Muir認為,人類操作員必須具備估計技術可預測性的能力。這種可預測性也會影響整個部署和過程信任點,但在輸出信任方面最為敏感,以反映軍事行動等流動性和不可預測的環境。在這些情況下,數據還必須反映軍事決策者所面臨的大多數情況的離散性和特定對手的獨特文化方式,這加劇了建立大量訓練數據的難度。即使在情況類似于過去的事件時,由于缺乏可比的歷史數據來說明廣泛的變量,使得概率推理變得困難。

用Patricia L McDermott和Ronna N ten Brink的話說,輸出的校準是至關重要的。這可以通過更多地使用企業人工智能和模擬來實現,它擴大了信任的邊界,可以幫助開發輸出信任。如果經驗是積極的,與技術互動并看到它的輸出將產生信任。在作戰環境中,當描述可以知道和檢查的東西時,驗證將是最容易的(例如,關于自己部隊的數據和潛在的對手部隊的布局)。要接近了解對手的意圖是比較困難的,因此需要更高水平的輸出信任。這將包括提高描述的準確性和對從大數據處理中得出的推論進行更多的測試。分享演習和行動的正面敘事,對于實現過渡性信任和緩解從相對不頻繁的行動中積累成功證據的緩慢速度至關重要。

組織系統的信任

生態系統的信任涉及調整更廣泛的組織系統以最大化人工智能的價值所需的信任。C2系統作為一個整體必須被配置為利用人工智能輔助決策的好處,并有適當的檢查和平衡,以在可接受的風險水平內運作。當人工智能的弱點或失敗是在主管的專業知識之外的領域,需要在組織的不同部分進行校準時,這一點尤其重要。如果不在生態系統和組織層面上進行變革,組織將只是將其人類系統數字化。

需要生態系統的信任,以確保結構--包括軍事總部的組織、指揮官的角色以及集中式與更分散或分布式的決策權的平衡--準備好利用人工智能的機會。如果沒有準備好,采用人工智能的漸進式方法往往會鼓勵對結構和整體生態系統的變化采取被動或消極的方法。相比之下,實現人工智能變革力量的專門戰略將迫使人們盡早重新思考支持這種戰略所需的組織。這需要重新思考傳統的軍事結構,但對于走多遠并沒有共識。一些人設想總部變得更扁平,并將非軍事人員納入高級職位,在決策過程中擁有權力。對另一些人來說,生態系統的變化更為深刻;它要求完全取消目前被視為工業時代遺留的工作人員組織系統。這樣做,他們打算消除扼殺理解的信息邊界,并挑戰決策金字塔尖上的獨當一面指揮官的想法。這種轉變需要整個組織生態系統的信任。對于像軍隊這樣的保守組織來說,這將是困難的,在指揮部的激進替代方案被接受之前,需要得到保證。實驗、戰爭游戲和模擬環境提供了低風險的選擇,以測試為特定類型的任務(例如,戰爭、和平行動和能力建設)配置的不同總部結構。

3.2 多少信任是足夠的?

信任是根本,但為技術設定一個不可能高的標準也有風險。幾千年來,指揮官和決策者們一直信任易變的人類。當人工智能開始觀察到輸入數據分布的變化時,技術可以通過自我監測的方式提供幫助,提醒人類 "操作員",或以以前未曾見過的方式進行操作,這樣錯誤輸出的風險會更大。風險容忍度,無論是關于人類還是機器演員,最終都是信任的表達。國防組織需要對自己是否是快速采用者或快速或緩慢的追隨者持誠實態度:商業世界的人工智能發展速度使大多數武裝部隊極不可能成為人工智能決策的 "第一用戶"。漸進派和未來派都是人工智能的支持者,他們之間的差異主要是風險問題,以及針對不同信任點的可實現的信任水平。

通過熟悉產生信任是至關重要的,這可能涉及到將軍事人員嵌入到使用復雜人工智能的商業組織中,或將平民帶入國防。這種變化需要在足夠高的級別上進行,以促進生態系統的信任。模擬、實驗和演習是重要的工具,而且必須足夠廣泛,以便不局限于一小群狂熱者。英國電信公司用人工智能決策支持工具取代英國的電話網絡的項目,當服務時間最長、知識最豐富的工程師與人工智能和數據專家合作時,效果最好,他們可能會對人工智能產生懷疑。將企業人工智能引入改革業務流程,如財務和人力資源,是將熟悉程度擴大到目前直接參與人工智能開發和使用的少數干部之外的另一種方式。

一旦熟悉的東西,信任是人類的天性,但信任的習慣會帶來自身的風險。眾所周知,人類不善于設定正確的目標,當遇到 "專家意見"(無論是人為的還是其他的)時,他們更容易同意而不是懷疑。必須避免 "信任和忘記 "的動態。一個考慮因素是為人工智能系統制定一個 "持續可信性 "的概念,類似于航空平臺的持續適航性,以確保它們仍然適合使用。因此,建立對人工智能的信任(并避免過度信任)的努力必須解決所有的信任點,并包括整個人類-機器團隊,其中人類操作員是其數字對應方的有效合作者和建設性批評者。

4. 對指揮部和指揮員的影響

人工智能對決策的知情、制定和實施方式的影響將是深遠的。通過以超越目前人類進程的速度處理大量的數據,人工智能可以提高對作戰環境的理解,并減少決策者的認知負擔。這不僅僅是今天工作方式的演變。僅僅加快當前C2系統的速度是不切實際的。一輛設計為以70英里/小時速度行駛的汽車是為以該速度運行而配置的。將發動機調整到每小時100英里的速度也許是可能的,但會給車輛系統和駕駛員帶來無法承受的壓力。由人工智能驅動的決策所代表的不連續性需要一種新的方法。正如多國能力發展運動(MCDC)所述。

無論我們未來的C2模型、系統和行為是什么樣子,它們都不能是線性的、確定的和靜態的。它們必須是靈活的、自主的、自適應的和自我調節的,并且至少與它們形成和運行的環境一樣具有偶然性和突發性。

軍隊必須為明天的C2進行重組,并以不同的方式培養他們的指揮官和工作人員。如果沒有這些變化,"生態系統信任"可能被證明是不可能實現的。

4.1 指揮和控制

C2包含兩個不同的元素:指揮,通常與創造力、靈活性和領導力相關;以及控制,與規則、可預測性和標準化相關。人工智能將首先影響控制功能,目前,指揮仍主要是人類的活動。人工智能的數據處理能力將消除控制的大量負擔,例如,為指揮官提供對其部隊的更好理解(如部署、狀態、設備和供應水平),目前這需要消耗大量的注意力和時間。它還將改變向指揮官提供信息的方式。目前,這些數據大部分是在 "拉取"的基礎上提供的--根據總部的報告程序要求或零星地收集。然而,人工智能可以持續監測局勢,并通過強調相關變化的活文件將信息推送給指揮官--類似于24小時的新聞編輯部。然而,通過進一步進入控制領域,人工智能將不可避免地影響指揮權的行使,并形成指揮決策;這對上述指揮和控制之間過于整齊的區分提出了挑戰。在未來的C2系統中,可以想象人工智能可以限制指揮權的行使,就像防抱死制動系統、牽引力控制和電子穩定性允許人類駕駛員指揮車輛,直到失去控制,此時系統會接管,直到情況穩定下來。

人工智能給人類指揮帶來了一個悖論。它同時使更多的知識被集中掌握,使總部能夠看到并與 "前線 "發生的事情互動,并將知識擴散到整個指揮系統,使較低級別的編隊能夠獲得以前只有高級指揮官才有的信息。將更多的權力下放給地方指揮官可以提高反應能力,這在事件發展不可預測、需要快速反應的情況下非常重要。西方武裝部隊傾向于采用(或多或少)任務指揮的概念,即指揮官的意圖描述了預期的效果,并允許下級指揮官根據他們面臨的情況自由執行。軍隊的學習和發展系統以及演習嵌入了這種方法--指揮官將需要相信人工智能能夠在其操作中實施這一意圖。鑒于數據和獎勵功能的戰略復雜性和模糊性,人工智能在戰術和作戰層面的使用可能比在戰略層面的指揮更有效,盡管這些層面并不離散,在現實中也不容易被分割開來。人工智能和更大的網絡連接將提供一個結構、流程和技術網絡,連接多個小型、分散的前方總部和分布式(和加固的)后方功能,即使在更透明的戰斗空間,也更難發現和反擊。如果敵人以C2系統為目標,這將增強復原力。

在每個層面上處理更大數據量的能力必須被仔細引導。人們應該能夠獲得與他們的地位和相對能力有關的信息,以影響他們在環境中發展。W-羅斯-阿什比將此描述為 "必要的多樣性 "問題:一個可行的(生態)系統是一個能夠處理其環境變化的系統。行為者應該在適合其任務的抽象水平上運作。一個旅部不能處理也不需要關于單個士兵的詳細信息;它需要對其下屬單位的身體和道德狀況有一個良好的總體了解。在更多的戰術層面上,NCO指揮官應該對他們團隊中的個人狀態保持警惕。戰略和作戰指揮官可能需要放松控制,讓戰術指揮官在更接近戰斗的地方利用新出現的機會。雖然任務指揮已經允許這樣做,但隨著高級別的指揮官獲得關于戰術層面發生的信息的空前機會,"控制"的誘惑會更大。

人工智能也需要使用抽象、近似和校準的杠桿,以避免將總部淹沒在數據洪流中。這需要在使用這些抽象和近似時的 "過程信任"。總部也可能需要使用不同的人工智能系統,其能力更適合或不適合不同時間范圍內的不同場景。決策也可能包括確定在特定情況下信任哪種人工智能模型(部署和過程信任)的因素。

人機聯合系統的自動化將提高人類的表現,在某些情況下,改變任務本身的性質。無論在什么層面上部署,人工智能不僅會影響人類執行任務的方式,也會影響人類執行的任務。目前的方法通常從研究哪些人類過程可以自動化開始,即人類工作的數字化。有可能從使用人工智能的假設開始,只有在人類是必要(出于法律、政策或道德原因)或可取(更適合這項任務)時才將人類放入系統中--決定什么不應該,而不是什么可以被數字化。這種方法挑戰了目前關于總部的規模、組織、人員配置和運作的概念。

4.2 對未來總體結構的影響

聯合概念說明(JCN)2/17指出,C2有可能在不同的戰爭層次(戰略、作戰和戰術)上發生變化,并對作戰環境的變化特征做出反應,因為作戰環境不再僅僅是物理環境。戰爭與和平的模糊性--強調了在 "行動 "和 "作戰 "之間的連續過程中有效的必要性--以及英國向能夠持續參與的部隊結構的轉變,將需要超越戰斗所需的方法。然而,可能沒有單一的總部原型;因此,為戰斗而配置的總部將與處理上游參與和能力建設的總部不同。雖然現在確定人工智能對軍事總部的影響還為時過早,但商業組織已經發現,與傳統的垂直層次結構相比,具有更多橫向信息共享的扁平結構更適合利用人工智能的優勢,因為在垂直層次結構中,每一層都要保證和授權數據才會被發布。因此,軍事總部--無論其具體形式如何--很可能會比現在更小、更扁平,能夠更快地沿著水平線工作。

探索替代的總部概念可以通過更多地使用實驗和模擬來實現。這應該對經典的J1-9參謀部提出挑戰,或許可以用新的分組來反映人工智能取代人類密集型數據處理和共享任務的能力。在J3/5區域尤其如此,這是計劃和行動之間的界限;由更快的決策帶來的更快節奏的沖突使這種界限變得過時。組織總部的替代方法可能包括那些注重結果的方法。JCN 2/17中描述的英國常設聯合部隊總部(SJFHQ)的結構是圍繞著四個職能來組織的:理解;設計;操作;和啟用。SJFHQ后來又恢復了傳統的J1-9人員分支。然而,"聯合保護者2021 "演習是一項復雜的亞門檻行動,其中使用了人工智能決策支持工具,揭示了J1-9架構的弱點。總部開始演習時是為高強度戰爭而配置的,但隨后調整為更適合與其他機構合作的配置。SJFHQ內部正在開展工作,應用2021年聯合保護者的經驗教訓,并確定這對總部結構意味著什么。然而,不太可能有一個完美的總部模式適用于所有行動類型。需要進一步的實驗,不限于SJFHQ。很能說明問題的是,自JCN 2/17發布以來的四年多時間里,在實施其中的一些建議方面幾乎沒有取得進展。即使英國國防部采用技術的速度相對緩慢,但這也超過了國防部探索改變結構的能力,超越了小規模的愛好者群體。"生態系統信任"是至關重要的,需要有機會在模擬或真實的環境中對各種任務類型的替代方法進行測試,并讓更多的人參與進來,這對有效采用新技術、結構和過程至關重要。

現有的程序需要改變以連接和優化新的結構。這可能需要改變構成武裝部隊規劃過程基礎的軍事評估。雖然它是一個復雜的、符合邏輯的規劃工具,但它是相當線性的、確定性的,并且嚴重依賴于指揮官,特別是在 "指揮官領導 "的英國方法中。在其他國家,參謀部在推動解決方案方面發揮了更大的作用,這可能更適合于人工智能的方法。人工智能為更多的迭代和協作過程提供了機會,它能更好地響應軍事和民防資源中心的要求,轉向更敏捷的模式。新的方法應該給指揮官帶來更少的壓力,要求提供信息(指揮官的關鍵信息要求)。人工智能還可以構建、分析和比較作戰行動方案,允許在做出大規模投入部隊的選擇之前對情景進行建模、測試和完善。

英國常設聯合總部(PJHQ)的情報評估過程自動化的思想實驗發現了取代大量工作人員的機會,加快了總部的戰斗節奏,并允許使用自動總結和自然語言處理來橫向共享信息。在一次作戰部署中測試了這一點,英國第20裝甲步兵旅戰斗隊將部分計劃過程縮短了10倍。然而,當人類仍在環路中時,決策環路的速度可能是有限的。在某些時候,人類決策者將無法跟上,成為決策監控者。如果仍然需要人類來做人工智能自己不能做的決定,這將是一個問題,而這可能是最困難的決定。

盡管有明顯的優勢,但總部不太可能在技術允許的范圍內減少。目前的總部通過規模和保證程序的冗余來補償人類的脆弱性,這對于減輕人工智能團隊成員的脆弱性可能仍然是正確的。此外,隨著戰斗節奏演變成連續的24小時規劃周期,節奏的加快可能會推動某些領域的需求上升。這些壓力可能并不局限于總部本身;它可能會推動前線單位的活動增加,他們必須處理數據并對所發出的指令作出反應。人類行為者仍然需要時間來休息,即使技術不需要。此外,與商業組織不同,軍隊需要冗余,以應對競爭對手蓄意破壞或擾亂他們的決策機構,并需要確保固定基礎設施的安全,以建立他們的網絡。簡而言之,對彈性和流動性的需求影響了軍事C2系統的穩健性和效率。因此,軍隊將需要保留不完全依賴人工智能進行有效操作的結構,并確保在人工智能失敗或故意削弱對人工智能信任的情況下,有恢復性程序可用。

4.3 培養指揮官

傳統上,指揮官是垂直決策結構的頂點,是所有信息的匯集點。雖然不是所有的軍事文化都強調個人的天才,正如 "翠鳥時刻"的概念所體現的那樣,但指揮官獲得信息的特權被總部的低層人員所拒絕。人工智能使信息民主化的潛力將改變這種情況;指揮可能會成為一種更加合議和反復的活動,不僅涉及那些穿制服的人,而且包括情報機構和具有數據科學多方面專業知識的承包商在內的更加折衷的組合--一種 "全部隊"的貢獻。面對一個復雜和適應性強的戰斗空間,另一種鳥也許為未來的指揮提供了一個更好的比喻:椋鳥。它們集體的、高度適應性的雜音為英國的發展、概念和理論中心的C2概念提供了一個更好的形象,即 "為設計和執行聯合行動而配置的動態和適應性的社會技術系統"。

指揮官必須繼續能夠處理動態環境;"沒有計劃能在與敵人的接觸中幸存下來 "這句話仍然是正確的。鑒于技術能夠提高速度(減少反應時間)和復雜性(通過更透明的戰斗空間),處理復雜、快速演變的問題將尤為重要。軍事組織正在試驗人工智能將如何改變C2,包括北約卓越指揮與控制中心、美國JADC2和英國軍隊的數字準備實驗。早期的跡象表明,指揮官將不得不更多地關注問題的框架,并確保在更小、更扁平的結構中的更多不同團隊之間的理解和目標的統一。這表明需要一個不同類型的指揮官和不同類型的工作人員;他們能夠整合由不同學科的成員組成的不同團隊的工作,而且往往是來自軍隊以外的成員。

確保指揮官能夠正確地設定問題的框架是至關重要的。人工智能非常善于在框架內操作,但目前至少在 "閱讀字里行間 "或從定義不明確的數據集中推斷方面很差--這種脆弱性仍然依賴于有人類來設定框架。在確定了問題的框架后,指揮官必須能夠判斷產出在該框架內是否合理。這需要能夠看到大局的人,武裝部隊需要通過在總部的參謀經驗來培養未來的指揮官,使他們熟悉環境和流程,從而能夠在越來越高的級別上進行指揮。模擬可以促進對總部的接觸,同樣可以確保較小的總部仍然保留人們獲得經驗的作用,通過這些經驗可以獲得必要的指揮技能。

雖然指揮官需要知道如何與技術互動,但他們必須繼續關注人工智能所要服務的作戰要求,并對其持適當的懷疑態度,以便他們成為這一過程中的知情者,而不是算法輸出的被動接受者。指揮官需要類似于工業界的 "π型領導人",在軍事專業的同時具有數字和數據意識。他們不需要成為技術專家,但應該有足夠的知識來了解其局限性,能夠與團隊中的專家合作,并有足夠的滿意度來允許對數據、流程和產出的信任。

集體而言,總部團隊需要這些技能,各個團隊成員能夠相互交流和理解。這超出了情報分析員的范圍,包括來自武裝部隊內部和外部的廣泛的行動、技術和數據專家。它還包括對風險更復雜的理解和溝通能力。戰爭從根本上說是一個風險管理的問題,這需要以經驗的方式來理解和溝通風險。因此,了解概率和信心水平是一項關鍵的指揮技能,但諸如沖突中的一次性決定也需要長期的判斷。

軍事教育需要通過在職業生涯中更早地引入數據和技術意識來應對。此外,軍隊對不同能力的評價方式也需要改變。據傳聞,英國陸軍的職業管理流程往往將那些在計算能力上取得好成績的人引向采購等領域,而不是作戰,被選入參謀學院的專業人員往往在計算能力上處于較低的四分之一。這不僅僅是軍隊面臨的挑戰:有望成功競爭的國家需要國家教育系統認識到數據和技術素養技能的價值,并從小培養他們。作者并不主張將教育變成就業前培訓;雖然需要STEM技能(數量比現在多),但人文和社會科學仍然很重要,培養出的畢業生適應性強,能夠解決復雜的問題,并以影響力進行溝通。國家的成功取決于學術和其他形式的多樣性,培養人們在數字世界中茁壯成長,不僅需要技術能力,還需要(人文)特質,如創造力和情商。指揮官和工作人員在未來將需要這兩套技能,也許比今天更需要。

除了分析之外,直覺是信息處理中的一個補充部分。在指揮官需要行使的雙軌制決策方法中,它是人類認知的一個重要部分。有效的決策結合了直覺和分析的優勢。當數據和直覺一致時,決策者可以放心地采取行動。如果它們不一致,則需要在行動前進一步探索。1983年,俄羅斯中校Stanislav Petrov避免了潛在的核戰爭。他的導彈探測系統報告說美國發射了五枚洲際彈道導彈,但他沒有立即報告,而是決定等待,因為這個信息感覺不對。他的(下意識的)雙模式決策使他做出了正確的決定。人工智能更強的數據處理和分析能力可以增強決策過程中的分析要素,但它需要指揮官認識到直覺的價值和局限性。專業軍事教育需要反映出對數據和直覺這兩個組成部分的平衡方法。

4.4 管理整個部隊

未來的指揮官所指揮的團隊必然比今天更加多樣化,領導跨學科團隊為復雜問題帶來新的見解。人類有效構思和發展直覺的能力通過接觸不同的看世界的方式得到加強。這不僅僅是改善受保護特征方面的多樣性,盡管這很重要,還包括確保整個部隊團隊中教育、經驗和觀點的廣泛性。整個部隊的不同元素是這種多樣性的一部分。

越來越多的跨軍事領域的綜合活動要求整個部隊的各軍事部門有效合作。對于正規軍事人員,在 "聯合"方面已經取得了進展,但還需要做更多的工作。在軍事生涯的早期引入聯合訓練是實現這一目標的一種方式;這可能需要重新思考軍事人員何時接受專業軍事教育,目前在英國是在30歲左右。相比之下,澳大利亞國防軍為參加澳大利亞國防軍學院的人員提供了基本的聯合軍事課程,海軍、陸軍和空軍專家也接受了單一軍種培訓。這為未來的指揮官在軍事生涯早期的成長提供了一個跨學科的 "聯合 "模式。正規軍的進展需要擴展到后備軍的整合,因為未來可能會有更多的技術專家駐扎在這里。

事實證明,整合整個部隊的非軍事因素更為困難。Serco研究所的一份報告指出,"盡管在過去十年中,整個部隊的運作取得了進展,但在實現軍事和工業之間的無縫合作方面的努力卻停滯不前。雖然武裝部隊在將非軍事人員帶入其總部方面做得更好,但在場和被納入之間有很大區別。如2021年聯合保護者等演習,經常邀請國際合作伙伴和民間主題專家來幫助規劃過程,但他們往往在軍事規劃人員完成工作后才被邀請對計劃發表意見。許多總部的規劃周期缺乏靈活性,這意味著當規劃被提出來供審查時,可能已經來不及進行修改了。

這不僅僅是對軍隊的觀察;文職專家往往不熟悉軍事進程,等待被邀請做出貢獻,這削弱了他們的影響力。軍事人員沒有本能地理解他們的非軍事同事所能做出的全部貢獻,因此沒有將他們納入其中。人工智能將迫使人們從一開始就需要在規劃過程中建立整個部隊的多樣性,從而使計劃成為真正的合作。

有了人工智能的能力,技術將越來越多地成為整個部隊的一個成員。國際象棋大師加里-卡斯帕羅夫(Gary Kasparov)曾指出,好的技術和好的人類棋手的結合,往往比卓越的技術或更好的人類棋手單獨工作更成功。在某些情況下,人和機器可能在共享任務中緊密結合,以至于他們變得相互依賴,在這種情況下,任務交接的想法就變得不協調了。這在支持網絡感知的工作設計中已經很明顯了,在這種情況下,人類分析員與軟件智能體相結合,以近乎實時的方式理解、預測和回應正在發生的事件。

從這些人機一體的團隊中獲得最大利益,不僅僅是有效的任務分配。它涉及到找到支持和提高每個成員(人或機器)績效的方法,從而使集體產出大于單個部分的總和。正確的行為和創造包容性文化的能力對于從這樣的團隊中獲得最大收益至關重要。指揮官不應專注于試圖管理 "突發事件"--一個試圖描述簡單的事情如何在互動中導致復雜和不可預測的結果概念--或團隊成員的活動,而是需要在塑造團隊和培養團隊內部的關系方面投入更多。

雖然人工智能目前作為一種工具,但隨著技術的發展,它應該被視為團隊的真正成員,擁有影響人類隊友的權利和對他們的責任。然而,無論其最終地位如何,人工智能都可能改變團隊的動態和對人類團隊成員的期望。將人工智能引入一個團隊會改變團隊的動態,而它與人類團隊成員的不同會使團隊的形成更加困難。通過布魯斯-塔克曼(Bruce W Tuckman)的經典階段,即形成、沖刺、規范和執行,需要妥協和適應。人工智能目前不太能做到這一點,需要人類參與者有更大的靈活性,這使得建立人機團隊更加困難,也更難恢復已經失去的信任。

高級人工智能,如果可以說有動機或偏見的話,很可能是以邏輯和任務為導向的(用實力部署清單術語來說,就是綠色和紅色)。一個平衡的團隊將越來越需要能夠維持團隊關系的人類,無論是內部還是跨團隊。因此,人機團隊將是不同的,盡管他們可能與包括神經多樣性同事在內的純人類團隊有一些相似之處,因為對他們來說,感同身受或理解情感線索是困難的。與神經多樣性團隊一樣,人機團隊將受益于團隊成員的多樣性給整體帶來的價值,但也需要進行調整,以最大限度地提高團隊績效的機會。人工智能作為團隊成員的概念究竟會如何發展,目前還不清楚,但有人呼吁組織在更平等的基礎上考慮先進技術的需求。加強企業人工智能在業務支持活動中的使用,將為探索人機團隊如何最有效地合作提供機會,并有可能實現預期運行成本的降低,使人類在價值鏈上從事更有意義的工作。

4.5 職業管理

需要的新的領導風格、新的技能和對技術、數據和風險的進一步理解也需要新的職業管理方法。軍隊的職業管理系統(過于)頻繁地調動人員,但要形成具有必要信任度的有效團隊需要時間。軍隊可能會放慢關鍵人員的流動,甚至可能放慢團隊的流動,從而使總部高級團隊作為一個集體實體而不是個人來管理。然而,目前的人力資源實踐使軍隊或工業界不太可能愿意無限期地保留人們的職位以期待未來的需求。用拉斐爾-帕斯卡爾和西蒙-鮑耶的話說,這就產生了 "混合團隊",即那些成員不固定的團隊,對他們來說,迅速建立團隊信任的能力至關重要。即使是常設總部也會受此影響,特別是當他們成為 "整體部隊 "時。對于'臨時團隊',例如為特定任務而設立的臨時總部,這個問題就更加突出。需要有機制來加速信任的發展,經驗表明,這可以通過早期的行為實踐來實現,包括展示 "技術能力、信息公開、支持互惠和決策中被認為的誠信"。

放慢總部高級職位人員的流動速度將有所幫助,但這還不夠。在無法保證預先建立的團隊在需要時隨時準備好執行任務的情況下,需要有一種方法來減少組建新的部隊團隊的時間。模擬提供了一種方法,通過壓縮任務演練的時間來準備新組建的團隊,并為整個部隊的不同組成部分提供共同工作的經驗。軍隊在這方面做得很好;軍隊的社會化進程創造了強大的紐帶,包括派人到合作伙伴那里進行培訓、演習和任務。對于整個部隊的其他部分來說,這種對跨文化理解的投資是缺乏的。建立對對方的了解,從而建立信任,對文職部門來說同樣重要。軍隊可以做得更多,為其工作人員提供與商業部門合作的經驗,包括與技術專家、數據專家和編碼人員合作,而文職人員也需要更好地了解軍隊、其語言、流程和價值觀。武裝部隊可以通過提供交流任命和模塊化和/或縮短其課程來協助這一進程,使文職人員有可能參加。冠狀病毒大流行引入了新的工作方式,并加速了軍事訓練和教育的變化,這可以為信任提供基礎,在此基礎上可以出現新的團隊和總部類型。

簡而言之,人工智能輔助決策不僅僅是一個技術問題;它需要改變指揮結構、流程和人員技能,才能發揮其潛力,成為武裝部隊在所有任務中運作的一場革命。然而,至關重要的是,在適應不斷變化的戰爭特征時,武裝部隊不能忽視戰爭的持久性:指揮官必須保持領導者和戰士的身份,能夠激勵普通人在最困難的情況下做出非凡的事情,而不僅僅是善于管理戰斗的人。在軍事方面,人工智能是一種工具,可以最大限度地提高武裝部隊在激烈競爭環境中的獲勝機會。

5 結論

人工智能正迅速成為我們國家安全結構的一個核心部分。軍方和情報機構正在嘗試用算法來理解大量的數據,縮短處理時間,并加速和改善他們的決策。對人工智能越來越多的使用和熟悉可以促進對它的信任,但正如專家們的辯論所表明的那樣,要建立和維持對像人工智能這樣的變革性技術的信任,存在著嚴重挑戰。

本文重點討論了人工智能的作戰和任務支持應用,并探討了不斷發展的人與人工智能關系對未來軍事決策和指揮的重要性和影響。當軍事指揮官的角色從控制者轉變為團隊伙伴時,當我們不能再將輔助功能只賦予人工智能體時,那么我們就需要從根本上重新思考人類的角色和我們的機構結構。簡而言之,我們需要重新評估人機決策中信任的條件和意義。沒有這種信任,人工智能的有效采用將繼續比技術的發展更慢,而且重要的是,落后于我們一些對手采用人工智能的速度。

一個稍加修改的信任概念--一個不需要將意向性或道德性歸于人工智能體的概念--可以而且確實適用于AI。只要我們委托機器做可能對人類產生嚴重甚至致命后果的事情,我們就會讓自己變得脆弱。只要存在人工智能的表現達不到我們預期的風險,對它的任何使用基本上都是一種信任的行為。

除了最罕見的情況,對人工智能的信任永遠不會是完全的;在某些情況下,用戶可能有意識地同意較低的信任水平。這種信任需要考慮五個不同的元素,作者稱之為 "信任點"。我們不應該依賴任何一個單一的點來產生整體的信任。事實上,往往得到最多關注的領域--關于數據質量或人工智能輸出的可解釋性問題--從長遠來看,必然會提供不令人滿意的答案,并有可能對技術產生錯位的放心感。

最常被忽視的是在組織生態系統層面上對信任的需求。這需要重新思考武裝部隊的組織及其C2結構。如果說機器的作用越來越大曾經是官僚軍隊結構興起的關鍵驅動力,以集中管理手段,那么人工智能正在以根本的方式挑戰常備軍的這一特點。如果人工智能的使用不僅僅是模擬工作方式的數字化,國防部必須改變其在 "行動(operate)"和 "作戰(warfight)"方面的決策結構。它還需要與整體部隊的各個方面進行更密切的接觸和參與,包括其未被充分利用的后備部隊以及工業和更廣泛的政府。

領導力作為軍事職業的一個持久要素也需要重新考慮。人們傾向于將領導力視為軍事指揮的一種抽象或不可改變的品質。在人工智能時代,指揮任務或領導團隊既需要新的技能(如 "表達數字(speak digital)"的能力),也需要更多樣化的特質(例如,在數據和直覺發生沖突時,橫向思考的能力,構建問題的框架,并應用批判性的判斷)。與以往相比,人工智能更需要那些能夠理解復雜性、構建問題并根據情況提出正確問題的指揮官。這些 "故意的業余愛好者 "摒棄了早期狹隘的專業化,選擇了范圍和實驗思維;他們可以建立專家團隊,吸取專家的意見,使集體人才既廣泛又深入。這些全軍團隊將包括人類和機器,所有這些人都將根據他們在塑造和決策方面的專長作出貢獻。

在尋求回答信任如何影響軍事決策中不斷發展的人與人工智能關系時,本文提出了幾個需要進一步研究的關鍵問題:

  • 我們如何建立必要的信任,在戰術、作戰和戰略層面上重新配置指揮部的組織,其規模、結構、位置和組成
  • 我們如何調整軍事教育,使指揮官為人工智能時代做更好的準備
  • 我們如何優化和改造所有領域的集體訓練,以改善涉及與人工智能體更多協作的指揮
  • 我們如何運作 "全軍 "的概念,以更好地利用我們社會、工業和研究機構中的大量人才
  • 我們如何定義人工智能和人類在人機團隊中的需求和目標

如果我們不從根本上改變如何獲取、培訓和培養領導崗位的人員,以及如何改革他們所處的機構和團隊,我們就有可能在人機關系的信任平衡上出錯,并將無法利用人工智能的全部變革潛力。

作者

克里斯蒂娜-巴利斯是QinetiQ公司的培訓和任務演練的全球活動總監。她在大西洋兩岸有20年的經驗,包括咨詢、工業和公共政策環境,特別關注國防、全球安全和跨大西洋關系。她曾是華盛頓特區戰略與國際研究中心歐洲項目的研究員,Serco公司負責戰略和企業發展的副總裁,以及巴黎Avascent公司的負責人和歐洲業務主管。她擁有華盛頓特區約翰霍普金斯大學高級國際研究學院和意大利博洛尼亞大學的國際關系碩士和博士學位,以及英國和德國的商業學位。

保羅-奧尼爾是RUSI的軍事科學部主任。他在戰略和人力資源方面有超過30年的經驗,他的研究興趣包括國家安全戰略和國防與安全的組織方面,特別是組織設計、人力資源、專業軍事教育和決策。他是CBE,英國特許人事與發展協會的會員,溫徹斯特大學的客座教授,英國后備部隊外部審查小組的成員。

付費5元查看完整內容

這是一個顛覆性技術快速變革的時代,特別是在人工智能(AI)領域。雖然這項技術是由商業部門為商業開發的,但人工智能在軍事應用方面的明顯潛力,現在正促使世界各地的武裝部隊對人工智能防御雛形系統進行試驗,以確定這些系統如何能夠最好地用于作戰與和平時期的任務。

澳大利亞也不例外,在2020年國防戰略更新中分配了資金,開始將人工智能能力引入國防。這將涉及開發解決戰術級和戰略級軍事問題的人工智能應用程序,建立一個熟練的人工智能勞動力,并與澳大利亞合作伙伴和盟友合作,將倫理學納入人工智能應用程序,并進行人工智能實驗。今年在澳大利亞首都地區費爾伯恩設立的國防技術加速實驗室是這一計劃的具體行動體現。

彼得-雷頓(Peter Layton)的論文考慮了人工智能在未來海、陸、空作戰行動中的戰術和作戰層面上可能發揮的作用,為這一廣泛的活動做出了貢獻。這是一個很少被研究的領域,因為到目前為止,大部分的討論都集中在關鍵的技術問題上。這些審議表明,人工智能可能是未來戰爭中的一項重要技術,但仍有許多不確定因素。本文提供了一個起點,在此基礎上開始辯論,這將有助于解決其中一些不確定性。

本文認為,人工智能將滲透到大多數軍事機器中;然而,它的通用性意味著它很可能是在現有作戰層面結構中被使用。鑒于此,人工智能在中短期內的主要作戰用途是“尋找(find)和欺騙(fool)”。人工智能/機器學習尋找隱藏在高度混亂背景中的目標非常出色;在這個應用上,它比人類更好,而且速度更快。然而,人工智能可以通過各種手段被欺騙;其強大的尋找能力缺乏穩健性。這兩個關鍵特征在應用于當前海、陸、空作戰層面的思考時,可能會產生巨大的影響。

本文初步設計的作戰概念與沒有人工智能技術的作戰概念明顯不同。

所討論的概念旨在激發人們對人工智能戰場上人機協作作戰的思考。這樣的戰場在目前看來可能有些猜測,幾乎是科幻小說。即便如此,許多國家已經在規劃、研究和開發方面取得了很大進展。鑒于將軍事力量調整到新方向所需的漫長準備時間,這一旅程需要從現在開始。

人工智能(AI)技術突然變得對軍事力量很重要。美國國防部(US DoD)已將人工智能的投資從2016-17年約6億美元增加到2021-22年25億美元,橫跨600多個項目。中國已經通過了一項“下一代人工智能發展計劃”,旨在到2030年使中國成為人工智能領域的杰出國家,并使人民解放軍從“信息化戰爭”轉向“智能化戰爭”。更引人注目的是,俄羅斯總統普京宣布,“人工智能是未來......誰成為這個領域的領導者,誰就會成為世界的統治者”。這些高級別的倡議和聲明正在產生結果。

在美國,美國海軍(USN)的“海上獵人”號(USV)在沒有船員的情況下從加利福尼亞航行到夏威夷再返回,利用船上的傳感器、雷達和攝像機數據,通過人工智能進行導航。同時,在美國國防部高級研究計劃局(DARPA)的支持下,一架由人工智能驅動的F-16模擬戰斗機最近在多次模擬的近距離空戰中全面擊敗了由非常有經驗的人類飛行員控制的類似模擬。在一項研究陸戰的類似評估中,美國陸軍(US Army)已經確定,一支由人工智能驅動的部隊比一支非人工智能驅動的部隊擁有大約10倍的戰斗力。

中國目前正在應用人工智能,通過指揮和控制系統的自動化來提高其戰場決策的速度和準確性,制定預測性作戰計劃并解決情報、監視和偵察數據融合的挑戰。中國還開始試用人工智能USV,以備在南海使用,并開始試驗無人駕駛坦克,而一家中國私營公司公開展示了人工智能武裝的蜂群無人機。

俄羅斯落后于美國和中國,但現在正在實施一項國家人工智能戰略以迎頭趕上。在軍事領域,俄羅斯有幾項工作正在進行。一條主線是將人工智能應用于信息戰,在戰術上用于發動心理戰,在戰略上用于破壞對手國家的社會凝聚力。另一條線是通過開發無人駕駛地面車輛(UGVs)、遠程傳感器、戰術指揮和控制系統以及無人駕駛航空器(UAVs),使用人工智能來提高陸地作戰行動的有效性。另一個努力方向是國家防空網絡的指揮和控制系統的自動化。

初步跡象表明,人工智能可能是未來戰爭中一項非常重要的技術,但仍然存在不確定性。雖然人工智能在民用領域,特別是在消費類產品中,被廣泛使用,但在軍事環境中才剛剛接近實際部署。此外,它仍然沒有在真正的戰斗行動的惡劣試驗場上得到驗證。即便如此,人工智能已經成為軍事力量考慮其未來時不可忽視的技術。

重要的是,在可預見的未來,可用的人工智能技術是狹義的,而不是通用的。狹義人工智能等于或超過了人類在特定領域內特定任務的智能;其表現取決于應用環境。相比之下,通用人工智能等于人類在任何領域任何任務中的全部表現。何時能實現通用人工智能仍然值得商榷,但似乎還有幾十年的時間。近中期的全球軍事興趣在于如何在現代戰場上使用狹義的人工智能技術。

不足為奇的是,人工智能的定義往往與人類智能相提并論。例如,2018年美國國防部人工智能戰略將人工智能定義為“機器執行通常需要人類智能的任務......”。這種理解將技術擬人化,并無意中將對人工智能應用的思考限制在那些可以由人類執行的任務上。

在某些應用中,人工智能可能比人類做得更多或更少。人工智能和人類能力的維恩圖在某些領域可能會重疊,但認為它們重合是有點虛偽的。在提供解決問題的見解上,人工智能可能是智能的,但它是人工的,因此,它的思維方式是人類所沒有的。

因此,本文在考慮人工智能時,更多的是考慮這種技術能夠執行的廣泛功能,而不是考慮它與人類能力的關系。2019年澳大利亞國防創新委員會采取了這種方法,將人工智能定義為“用于執行以目標為導向的任務的各種信息處理技術,以及追求該任務的推理手段”。

初一看,這個定義似乎并不精確,沒有包括人工智能可能為軍事或民用目的實際執行任務。但這種模糊性是當代人工智能應用的一個關鍵屬性。人工智能可以以多種方式應用,可以被認為是一種普遍存在于社會中的通用技術。通用技術的一個早期例子是電力,現在它被廣泛使用,以至于它的持續存在和使用,就所有的意圖和目的而言,都是簡單的假設。電能使惰性機器活躍起來,人工智能也將以自己的方式,通過推理為它們提供完成任務的能力。人工智能似乎將注入許多軍事機器,因此未來的戰場將不可避免地以某種方式由人工智能支持。

為了取得對對手的作戰優勢,軍隊不斷尋求更大的戰斗力。傳統上,技術是以一種綜合的方式在戰場上使用的,它能最好地利用人類和機器的長處,同時盡量減少兩者弱點的影響。人工智能似乎也可能是類似的。可以預計,人工智能在與人類謹慎地合作時,而不是在某種獨立的模式下,會變得最有效。

這種考慮強調了新技術本身并不會突然間帶來戰場優勢,而是在于人類如何運用它。對早期技術創新的歷史分析指出,擁有指導如何使用這些新技術的合理概念是軍隊成功將其投入使用的關鍵。歷史學家威廉姆森-默里和艾倫-米萊指出:

  • 證據表明,首先,制定未來愿景的重要性。軍事機構不僅需要進行最初的智能投資,以發展對未來戰爭的設想,而且必須繼續對這種設想進行深入思考,以確定這些戰爭可能與以前的沖突有什么不同......在這方面任何對未來戰爭的設想幾乎肯定是模糊和不完整的,不是詳細和精確的,更不是任何科學意義上的預測。然而,愿景并不足以產生成功的創新。一個人對未來沖突的看法也必須是平衡的,并與行動的實際情況有很好的聯系。

在戰術層面,與戰爭現實的聯系是最緊密的。戰略規定了目標、總體方針和使用的力量,但在與聰明和適應性強的對手戰斗中處理這些力量的卻是戰術層面。雖然戰斗的成功可能不會導致戰略的成功,正如美國在越南的戰爭所說明的那樣,反之亦然。一個好的戰略在面對持續的戰術失敗時不可能成功。克勞塞維茨寫道:一切都取決于戰術結果......這就是為什么我們認為強調所有的戰略規劃都只依賴于戰術上的成功是有用的......這在任何情況下都是決策的實際基本依據。戰術通常被認為涉及友軍相互之間以及與敵人之間的分布和機動,以及在戰場上使用這些部隊。

本文旨在為在未來的人工智能戰場上使用人機團隊制定作戰概念。這樣的戰場,特別是當擴大到陸戰以外的空戰和海戰時,有一個混合的線性和深層的方面,具有消耗和機動的概念。設計這些作戰概念將為潛在的狹義人工智能系統如何在戰爭的戰術和作戰層面上使用提供一個廣闊的視野。

首先,本文討論了組成人工智能技術包的各種技術要素。這些要素包括先進的計算機處理和大數據,以及與云計算和物聯網(IoT)有關的具體方面。

第二章研究了利用人工智能發動戰爭的問題,并為防御和進攻制定了通用的作戰概念。這些概念位于作戰和戰術層面之間的模糊界面,涉及友軍相對于對手的分布和機動,以及友軍在戰場上的運用。

第三章、第四章和第五章分別將人工智能防御和進攻的兩個通用概念應用于海洋、陸地和空中領域。每個領域的戰斗在分配和操縱友軍以及與敵人交戰方面都有很大的不同,因此有必要提出單獨的人工智能作戰概念。沒有一個單一的概念能夠充分涵蓋所有三個領域,除非在很高的抽象水平上,但理解其含義可能會變得困難。提出這種具有前瞻性的概念似乎接近于投機性的小說。為了避免這種情況,每個概念都特意以當代作戰思維為基礎,并討論了當前和新興的人工智能支持的海、陸、空平臺和系統,以說明所提出的想法。

設計這些作戰概念的目的是激發思考,并啟動關于未來和如何備戰的辯論。本文提出的作戰概念旨在成為辯論其他人工智能戰場概念的實用性、可能性和有用性的基礎。只有通過對建議進行批判性分析,并不斷重構它們以進一步分析和演化,才能朝著最佳作戰概念取得進展。

本文所討論的概念在性質和范圍上都是有意限制的。就性質而言,海、陸、空的概念是:為了保持每個概念的重點,它們不是聯合或合并的。重要的是,這種狹隘性意味著一些領域并沒有包括在內,如俄羅斯在影響力戰爭中使用人工智能或中國在社會管理和內部防御中使用人工智能。出于類似的原因,每個概念都有一個狹窄的范圍,專注于戰爭,只有限地關注后勤,并避免關鍵領域,如教育、培訓、行政和指揮與控制。值得注意的是,除了與傳統的陸、海、空領域的戰術交戰的關系外,沒有討論網絡和空間這些新領域。

本文將人工智能這種新技術與戰爭的作戰方式和戰術使用選擇聯系起來。有了這樣一個重點,本文就與許多武裝部隊制定的眾多人工智能戰略和計劃不同。一般來說,這些戰略和計劃都是向內看的,目的是闡述人工智能作為一種技術將如何被研究、獲得并引入到他們的具體服務中。本文旨在補充這些人工智能技術戰略和計劃,將它們與更廣泛的作戰業務聯系起來,發揮作用。

付費5元查看完整內容

摘要

由于人工智能(AI)、機器學習,特別是深度學習的進步,可解釋人工智能(XAI)研究領域最近受到了很多關注。XAI是一個研究領域,重點是確保人工智能系統的推理和決策可以向人類用戶解釋。在軍事背景下,這種解釋通常是為了確保:

  • 人類用戶對他們操作的人工智能系統有適當的心智模型。

  • 專家可以從人工智能系統及其隱藏的戰術和戰略行為中獲得洞察力并提取知識。

  • 人工智能系統遵守國際和國家法律。

  • 開發人員甚至在部署前就能發現人工智能系統的缺陷或漏洞。

本報告的目的是為基于深度學習的人工智能系統提供解釋而開發的XAI技術。這類系統本身就很難解釋,因為它們所模擬的過程往往過于復雜,無法使用可解釋的替代方法來建模

盡管深度學習XAI領域仍處于起步階段,但科學文獻中已經提出了許多解釋技術。今天的XAI技術主要用于開發目的(即識別錯誤)。需要進行更多的研究來得出結論,這些技術是否也有助于支持用戶為他們所操作的人工智能系統建立適當的心智模型、戰術開發,并確保未來的軍事人工智能系統遵循國家和國際法律。

關鍵詞

人工智能、可解釋人工智能、透明度、機器學習、深度學習、深度神經網絡

1 引言

人工智能(AI)是一個對瑞典[1]和瑞典武裝部隊(SwAF)具有戰略意義的研究領域。當今人工智能成功的主要因素是機器學習(ML)的突破,更確切地說,是深度學習(DL)的突破。DL是一種潛在的顛覆性技術,使我們能夠使用深度神經網絡(DNN)來模擬以前使用傳統技術無法模擬的復雜過程。例如,DL可以用來準確地轉錄(語音到文本)[2,3],翻譯(文本到文本)[4],合成語音(文本到語音)[5],玩實時戰略游戲(視頻到行動)[6,7],讀取唇語(視頻到文本)[8],識別人臉(圖像到身份)[9]和控制自動駕駛車輛(視頻到行動)[10,11]。

然而,DL仍然處于起步階段,沒有一個數學框架可以用來保證模型的正確性[12]。因此,在軍事應用中開發、部署、使用和維護DNN模型時,有許多挑戰需要考慮和解決。

從軍事用戶(操作員、數據分析師等)的角度來看,最重要的挑戰也許是可解釋性。根據經驗,當人的生命受到嚴重影響時,對可解釋性的需求更大。在軍事領域是這樣,在醫學、執法和其他民事服務領域也是如此。可解釋性很重要,因為它影響著用戶對系統的信任和依賴。信任關系必須是平衡的;過多的信任可能導致對系統的誤用,而過少的信任則可能導致對系統的完全廢棄[13]。最終,解釋的目的是幫助用戶建立一個適當的系統心智模型,以確保它能被有效使用[14]。

深度學習有可能改善復雜軍事系統的自主性,如戰斗機、潛艇、無人機和衛星監視系統。然而,它也會使這些系統變得更加復雜和難以解釋。主要原因是,DL是一種端到端的機器學習技術,意味著機器學習從輸入數據中提取最重要的特征,以實現高性能。這被稱為表征學習,它與傳統技術不同,傳統技術是用人類的直覺來手動提取這種特征。表征學習往往能帶來高性能,但它也要求模型具有高度的表現力和非線性。因此,使用DL訓練的DNN可能由數百萬甚至數十億的參數組成。這使得它們很難向人類解釋和說明,即使學習算法、模型結構、訓練數據等都是已知的和很好理解的。

美國國防部高級研究計劃局(DARPA)于2016年啟動的可解釋人工智能(XAI)計劃也許是為解決這一挑戰而采取的最全面的軍事舉措。該計劃的目的是:

  • "產生更多可解釋的模型,同時保持高水平的學習性能(預測精度)。"

  • "使人類用戶能夠理解、適當地信任并有效地管理新一代的人工智能伙伴"。

自XAI計劃開始以來,已經取得了許多技術上的進步。一些XAI技術甚至已經實現并打包在軟件庫中,可用于深入了解、調試和驗證DNN[16, 17, 18]。這是朝正確方向邁出的一步,但從軍事角度來看,關鍵是XAI技術和工具也要為軍事用戶量身定做,因為在這些地方需要高級解釋,以確保信任、使用和性能。

1.1 目的和范圍

本報告的目的是介紹在DL背景下開發的代表性XAI技術。本報告并非詳盡無遺,它并不涵蓋文獻中提出的所有XAI技術。

1.2 目標讀者群

本報告的目標讀者是操作、獲取或開發AI、ML和DL技術以用于系統或嵌入系統的軍事人員。

1.3 概要

第2章介紹了智能Agent、機器學習和深度學習的概念。第3章介紹了文獻中提出的各種XAI技術。第4章介紹了可用于評估XAI技術所提供的解釋的方法和技術。第5章介紹了一個案例研究,其中XAI被用來解釋一個深度學習模型的行為。最后,第6章對報告進行了總結,并對未來的工作提出了建議。

2 智能Agent、機器學習和深度學習

本章介紹了一些概念、方法、術語和技術,是本報告的其余部分的基礎。已經對智能Agent、機器學習和深度學習有基本了解的讀者可以跳過本章。

2.1 智能Agent

人工智能是一個廣泛的術語,可以有很多定義。在本報告中,人工智能是指對智能Agent(IA)的研究和設計。一個IA是一個能夠在環境中感知、推理和行動的自主實體。通常情況下,IA與環境中的其他Agent(即多Agent系統)以及人類(如人機合作)進行互動。

當在物理世界中實施時,IAs可以代表從簡單的恒溫器到復雜的自動駕駛車輛、自主機器人、無人機等任何東西。在虛擬環境中,人工智能通常由能夠翻譯、轉錄等的機器人或虛擬助理來代表。在軍事模擬中,IAs通常被稱為非玩家角色(NPCs)或計算機生成部隊(CGFs)。

圖2.1說明了IA的主要組成部分。這些組件通常使用傳統編程和人工智能技術的組合來實現,如專家系統、狀態機、行為樹和機器學習。本報告重點討論完全或部分使用DNN實現的IA的XAI。

圖2.1 - 智能Agent(IA)是一個能夠在環境中感知、推理和行動的自主實體。環境可以是物理的(即現實世界)或虛擬的(如互聯網、虛擬仿真、嚴格游戲)。IA通常與其他Agent、人類互動,分別形成多Agent系統和人機團隊。

2.2 機器學習

ML是人工智能的一個子領域,重點是開發能夠從觀察和經驗中學習的智能系統或IA。在本節中,將介紹ML中使用的主要學習策略。

2.2.1 監督式學習

在監督學習中,IA從已被標記或標注的訓練樣本中學習。學習的目的是使與這些樣本的偏差最小化,同時保持對未見過的輸入的概括能力。實際上,IA將模仿訓練數據中的行為。圖2.2說明了監督學習過程。

在監督學習中,標記過程通常是由人類手動完成的,這就是為什么這種方法在許多應用中可能是昂貴和不實用的。監督學習的主要優點是,一旦數據集建立起來,學習過程是穩定的,而且相對容易監控。

監督學習的主要應用是分類和回歸,其中,離散類標簽和連續值分別代表模型的輸出。分類器可用于檢測代理人視野中感興趣的物體,或識別某一特定情況是否危險。回歸通常用于對Agent的執行器(機器人肢體、方向盤位置等)進行低層次的連續控制。

圖2.2 - 監督式學習。IA從已被標記或標注的樣本中學習。學習過程的目標是創建一個模型,使其與所提供的訓練樣本的偏差最小。淺灰色的方框代表訓練樣本(即輸入和它們的標簽)。

2.2.2 強化學習

在強化學習中,IA通過在一個通常是模擬的環境中執行動作來學習。學習的目的是IA在模擬器中執行動作時使其獎勵最大化。獎勵通常由游戲的結果來表示,因此用于獲勝或失敗的行動分別由學習算法進行正向和負向強化。學習過程如圖2.3所示。

強化學習的一個主要優點是,不再需要手動標注訓練數據。相反,在某種意義上,獎勵函數被用來自動標記數據。然而,為現實世界的問題設計一個獎勵函數是一項非艱巨的任務。它要求隨著時間的推移,適當的獎勵可以被分配給IA的行動[19]。一個設計不良的獎勵函數可能會導致不理想的和意外的行為。

強化學習被用于IA需要學習最佳行動選擇策略的應用中。當應用于實時戰略游戲時,IA可以比大多數人類專家更好地學習選擇行動[6, 7]。因此,我們有理由相信,強化學習最終也能為軍事目的產生替代的甚至是新的戰術和戰略。

圖2.3 - 使用強化學習,IA通過在模擬環境中采取行動來學習。學習過程的目標是使環境提供的獎勵信號最大化。淺灰色的方框代表輸入,在這種情況下是一個模擬器和一個獎勵函數,是這個學習策略所需要的。

2.2.3 無監督學習

在無監督學習中,IA學習識別無標簽數據中的模式和結構,如圖2.4所示。請注意,盡管被稱為無監督學習,但總是由一個預先定義的指標指導。例如,k-means聚類算法使用歐氏距離對數據進行聚類。同樣,自動編碼器(AE)需要存在一個損失或誤差度量函數。

無監督學習的最常見應用包括聚類、可視化、降維和異常檢測。無監督學習在DL中的一個較新的應用是元學習,其中IA被訓練的目標是成為更快的學習者(即學習如何去學習)。

圖2.4 - 在無監督學習中,IA學習在未標記的數據中識別模式和集群。無監督學習由預先定義的指標(例如k-means聚類中的歐幾里得距離)指導,從數據中學習。

2.3 深度學習

深度學習是一種機器學習方法,可用于上述所有的學習策略(即監督式學習、強化式學習和無監督式學習)。

2.3.1 深度神經網絡

在DL中,用于捕捉和學習經驗的模型由DNN來表示。DNN本質上是一個數學表達式,由大量的嵌套和可微分的子函數組成。第 2.3.3 節解釋了 DNN 必須是可微分的原因。

DNN 通常使用圖形進行可視化,其中各層節點用邊相互連接,如圖 2.5 所示。在這種表示方法中,每條邊代表一個可訓練的參數或權重,每個節點代表一個神經元(即一個可區分的子函數),使用權重將輸入轉化為輸出。圖2.6說明了一個神經元所進行的操作。該神經元首先計算其輸入和權重的乘積之和。然后這個值被神經元的非線性激活函數處理,產生一個輸出。然后,該輸出被用作下一層神經元的輸入。

在現實世界的應用中,權重(圖2.5中的邊)的數量通常會增長到數百萬甚至數十億。還要注意的是,除了圖2.5中說明的全連接神經網絡(FCNN),還有不同類型的DNN。卷積神經網絡(CNN)用于數據中存在空間關系的情況,這在圖像中是典型的情況。同樣地,當數據中存在已知的時間關系時(如文本和音頻),經常使用遞歸神經網絡(RNN)。在現實世界的應用中,模型的設計通常是使用精心挑選的CNN、RNN和FCNN的混合。本節的其余部分主要討論FCNN。然而,推理和訓練的原則也同樣適用于CNN和RNNs。

在本報告中,用來表示DNN的數學符號是fθ,其中θ代表DNN的可訓練權重或參數。

圖 2.5 - 一個具有四個輸入、兩個隱藏層和一個輸出的全連接 DNN 的可視化。在這個表示中,每條邊代表一個可訓練的參數或權重,每個節點代表一個神經元(即一個可微分的子函數),使用權重將輸入轉化為輸出。每個神經元計算其輸入和權重的乘積之和。然后,該值由神經元的非線性激活函數處理,產生一個輸出。

圖2.6 - DNN中的神經元的可視化。首先,使用輸入x和權重ω的乘積之和被計算。然后,這個值被送入神經元的非線性激活函數g,以產生一個輸出,可以被送入下一層的神經元。代表一個神經元的數學表達式是。請注意,偏差b,也是一個可訓練的參數,與權重不同,它不與輸入相連。

2.3.2 推斷

推理是一個過程,在這個過程中,輸入被已經訓練好的 DNN 處理,產生一個輸出。在DNN中,處理是通過網絡的各層向前傳遞進行的。計算圖也許是描述推理的最直觀的方式。在計算圖中,DNN被模塊化為原始的子函數,代表網絡中嵌入的操作。作為一個例子,圖2.7中的計算圖表示有一個輸入的神經元。使用這種表示方法,很容易看到輸入是如何在圖中向前移動(從左到右)時被轉化的。

計算圖可以被擴展到具有任意數量的輸入、神經元和輸出的DNN模型。在實踐中,使用代表聚合層的計算圖來設計DNN是很常見的。然后,不同的層可以相互連接,形成最終的 DNN。

圖2.7--計算圖表示一個神經元的操作,fθ(x)=g(x×ω+b),有一個輸入x和預訓練的參數θ={ω,b}。計算圖可以擴展到包括任意的輸入和輸出。在現實世界的應用中,DNN由代表神經元聚集層的計算圖組成。

2.3.3 訓練

訓練是DNN,fθ,及其可訓練參數或權重θ,被更新的過程。訓練是一個迭代過程,目的是調整θ,使損失函數L(fθ)達到最小。在實踐中,方程2.1中的梯度下降(GD)優化方法或其變體被用來執行更新。

在GD方法中,α代表一個超參數(即一個用于控制學習過程的用戶定義參數),稱為學習率。學習率α,控制著學習過程的速度。重要的是,α被適當地初始化,以確保可訓練的參數能夠收斂到一個最佳的解決方案。一般來說,如果α太大,訓練過程就會變得不穩定,可訓練參數就不會收斂。此外,如果α太小,訓練將是穩定的,盡管它將花費太多的時間來收斂。由于這個原因,使用能在學習過程中動態地改變學習速率的調度器已經成為常見的做法。

方程2.1中的項表示可訓練參數的梯度。梯度決定了更新可訓練參數θ的方向,從而使損失函數增加。請注意,更新的方向與梯度的方向相反,以便使損失最小化。

為了找到這些梯度,我們使用了反向傳播算法。給定一個訓練實例(x, y?),反向傳播算法首先執行一個前向傳遞來計算損失。給定損失后,再進行后向傳遞,使用鏈式規則公式計算梯度。同樣,解釋反向傳播的最直觀的方法是使用計算圖,其中DNN由子函數的集合表示。要進行反向傳播,所需要的就是找到這些子函數的導數。讓我們用一個簡單的例子來說明反向傳播,其中DNN由線性函數fθ(x)=ωx+b表示,只有兩個可訓練參數θ={ω,b}。在這種情況下,損失函數可以定義為fθ(x)和期望輸出y?的平方誤差:

因此,損失衡量了DNN的預測是否接近已知的輸出值,即y。當損失較小時,預測是好的。同樣地,當損失大時,預測就很差。

圖2.8顯示了代表方程2.2中損失函數的計算圖。除了前向傳遞,這個計算圖還包括一個后向傳遞,利用鏈式規則將損失(或誤差)傳播到可訓練參數θ={ω,b}。請注意,訓練中只需要損失相對于可訓練參數的導數(即)。逆向傳播從設置開始。從這里很容易看出鏈式規則是如何將誤差向后傳播的(從右到左),從而找到。關于本節所述的訓練過程的演示,見附錄A。

即使訓練過程很簡單,可以用計算圖來解釋,也很難理解和解釋模型的行為。下一章將介紹為這些目的而開發的XAI技術。

圖2.8 - 表示平方誤差損失函數的計算圖,。在這個例子中,fθ(x) = ωx + b和θ = {ω, b}分別代表模型和它的可訓練參數,x和y?代表輸入和它的期望輸出(即訓練數據)。

3 可解釋人工智能的技術

可解釋人工智能(XAI)研究的重點是確保人工智能系統的推理和決策能夠被解釋給人類用戶。盡管由于DL的進步,XAI最近受到了很多關注,但XAI的研究領域并不新鮮。它至少在20世紀80年代就已經存在了[20]。對于XAI研究及其歷史的全面回顧,讀者可以參考[21]。

可解釋人工智能是任何用于影響人類生命高風險決策的軍事人工智能系統的關鍵組成部分。戰術層面上的人工智能應用的例子,重點是短期決策,包括無人駕駛車輛的自主控制以及武器和監視系統的目標識別、跟蹤和交戰。此外,XAI在戰爭的戰役和戰略層面同樣重要,甚至可能更重要,因為長期決策和規劃活動可能影響整個團體。在這個層面上,人工智能系統通常用于信息分析,但也可以通過模擬來提出規劃或行動方案(COA)。XAI在軍事應用中的主要目的是:

  • 心智建模[14, 22]。XAI可用于支持用戶為其操作的人工智能系統建立適當的心智模型。在任何軍事系統中,無論是否啟用了人工智能,用戶都必須清楚地了解系統的運行邊界,以確保適當和有效的使用。

  • 洞察力[23,24]。事實表明,DNN可以用來捕捉知識,并在對復雜過程的觀察中找出人類未知的模式。使用XAI技術,人類有可能解開這些知識并從中學習。使用強化學習的戰術和戰略發展是一個典型的應用,XAI有可能在軍事領域產生更深入的洞察力。

  • 法律和法規[25, 26, 27]。XAI有可能被用來確保AI系統遵循國家和國際法律。也許人工智能最具有爭議性的應用是致命的自主武器系統(LAWS)[26]。一些人希望完全禁止這種系統,而另一些人則認為應該允許使用致命性武器系統,因為它們有可能提高精確度并將附帶損害降到最低[27]。盡管如此,作者認為XAI可以在制定政策的過程中發揮重要作用,以規范何時、何地以及是否可以使用LAWS等AI系統。

  • 排除故障[23, 28]。在文獻中,有許多XAI被用來識別DNN中的錯誤的案例。當圖像中的版權水印或模擬器和游戲中的未知作弊器等現實世界數據中不存在的人工制品出現在訓練數據中時,通常會出現BUG。第2.3.3節中介紹的訓練過程可以學會利用,或走捷徑,利用這種人工制品。其結果是,當呈現測試數據時,DNN工作得很好,但當呈現真實世界的數據時卻失敗了。如果將XAI技術作為開發過程的一個組成部分,這種問題可以在部署前被發現和解決。

本章介紹了在DL背景下專門開發的幾種XAI技術。DL的XAI是一個重大挑戰,因為DNN可能由數百萬甚至數十億的參數組成,使得它們不透明,難以被人類解釋。請注意,據我們所知,擬議的技術還沒有在軍事背景下進行科學評估。因此,在這種情況下,這些技術能在多大程度上提供有用的解釋還不得而知。第四章介紹了如何進行這種評估。

3.1 全局解釋技術

全局解釋技術提供了對 DNN 及其整體行為的洞察力。在本節中,我們主要關注可用于分析和可視化高維訓練數據集的技術,但也關注如何獲取和解釋用于模型評估的性能測量。

3.1.1 大型高維數據集的可視化技術

在DL中,訓練數據集通常由大量的高維樣本組成。為了直觀地檢查這些數據集,它們必須被降低到人類可以觀察到的維度(即一維、二維或三維空間)。在可視化中總結大型數據集可以提供關于DNN所要學習的任務復雜性的有用見解。它也可以用來識別數據集中可能對DNN的性能產生負面影響的假象[23]。下面是三種無監督的技術,可用于降低維度以達到可視化的目的。

  • 主成分分析(PCA)[29]。這項技術確定了數據集的主成分。數據被投射到被認為是最重要的成分或向量上。PCA的主要缺點是它是一種線性技術,因此,它可能無法識別非線性數據的模式。PCA的主要優點是該技術很好理解(即它可以被解釋),而且與其他技術相比,它的計算效率高。

  • 可變自動編碼器(VAE)[30]。這是一種DL技術,使用DNNs來降低維度。VAE由兩個DNN組成:編碼器和解碼器。編碼器的目的是將高維的輸入數據壓縮成一個潛在的空間向量(在這種情況下是一維、二維或三維)。解碼器的目的是盡可能準確地使用低維潛空間表示重建高維數據。如第2.3.3節介紹的那樣,使用損失函數對DNN進行訓練,使原始輸入和其重建的誤差最小。一旦訓練完成,只需要編碼器來降低維度。這種技術的主要優點是它能夠學習數據中的非線性因素。缺點是VAE是用不透明的DNN構建的,不容易向人解釋。

  • t-分布式隨機近鄰嵌入(t-SNE)[31]。這項技術是專門為可視化目的開發的。與VAE類似,t-SNE使用GD程序來學習如何最佳地降低數據的維度。在這種情況下,目標函數的目標是保持鄰域距離。t-SNE的優點是,它通常會產生更好的可視化效果。缺點是它的計算很復雜。

為了證明上述技術,將使用MNIST數據集[32]。這個數據集包含灰度圖像,包括代表70000個手寫數字的標簽。每個圖像由28×28像素組成,因此,數據的維度為784。圖3.1說明了從數據集中隨機抽取的15個樣本。

圖3.2中的可視化圖(散點圖)是使用從MNIST數據集中隨機抽取的10000張圖像的子集創建的。在這種情況下,使用PCA(圖3.2a)、VAE(圖3.2b)和t-SNE(圖3.2c和圖3.2d)將維數從784降低到2。這些圖是用所有10000個數據點渲染的,每個數據點的標簽都用顏色編碼,這樣人類就可以直觀地檢查出聚類趨勢。在圖3.2d中,數據集首先使用PCA進行預處理,在使用t-SNE之前將維度從784降低到50。這是使用t-SNE時的標準做法,以確保計算效率。圖3.2中的可視化圖提供了對數據集復雜性的洞察力。如果集群可以被直觀地識別,那么DNN也很可能能夠有效地從數據中學習。同樣地,如果集群不能被識別,那么DNN也將更難從數據中學習。在這種情況下,PCA技術無法分離聚類。因此,不能指望線性分類器能有好的表現。

圖3.1 - 從MNIST數據集中隨機抽取的樣本。樣本的標簽在圖的說明中提供。

圖3.2 - 使用主成分分析(PCA)、可變自動編碼器(VAE)和t分布式隨機近鄰嵌入(t-SNE)在二維散點圖中對高維數據進行可視化。在這種情況下,維度從784(代表28×28像素的圖像)減少到2。這些圖是用10000個數據點呈現的,每個數據點用其標簽(0到9)進行顏色編碼,以便人類可以直觀地檢查聚類情況。在圖3.2d中,在使用t-SNE之前,數據集使用PCA進行了預處理,將維度從784降低到50。這是使用t-SNE時的標準做法,以確保計算效率。可視化提供了對數據集復雜性的洞察力。如果集群可以被直觀地識別,那么DNN也很可能能夠有效地從數據中學習。同樣地,如果集群不能被識別,那么DNN也將更難從數據中學習。

3.1.2 模型評估

在訓練機器學習模型時,模型開發者會不斷測量模型在它之前未見過的輸入數據上的表現,以確認模型是否在向有用的行為發展。當開發者對模型的表現感到滿意時,就會停止訓練過程,并使用未見過的測試數據進行最終評估。這個最終的測試衡量了模型在現實世界中應用時的預期性能,在那里它通常會遇到訓練時沒有看到的輸入。測試數據集能在多大程度上被用來測量實際性能,取決于測試集與現實世界數據的對應程度。雖然在模型訓練和調整過程中對性能的持續測量主要是對模型開發者有意義,但從XAI的角度來看,最終的性能測量對用戶也是有價值的。

(1)對分類器的評估

在從圖像中對軍用車輛進行分類的例子中,每一類車輛都有數千張圖像,相當一部分圖像將被用于訓練,另外一組圖像將被分開,用于在訓練期間對模型進行微調和測試,還有一組圖像將被保留用于最終的性能測量。由于分類器在訓練過程中沒有看到測試集中的圖像,因此測量它在這些圖像上的表現可以了解模型在新數據上的表現如何。

在一個分類任務中,最直接的性能測量是計算正確分類的比例。這個衡量標準被稱為準確性:

也就是說,如果車輛分類模型在100張圖片上進行測試,85張圖片被正確分類,則該模型在測試數據上的準確率為85%。如果不同類別的實例出現的頻率相同,也就是說,數據是平衡的,那么準確率就會很高。

在水雷分類的例子中,任務是分析類似雷的聲納圖像,并將該物體分類為雷或其他東西(通常是巖石)。在這種情況下,可能相對缺乏可供訓練的雷圖像,因為關于巖石的數據很容易收集,而關于雷的數據,特別是由敵對勢力部署的雷,則不容易收集。

雷檢測案例是一個不平衡問題的例子,如果測試數據集要反映真實世界的發生情況,那么它將包含比雷圖片更多的巖石圖片。作為一個例子,假設測試數據集中千分之一的例子是雷(其余都是巖石)。一個總是返回負面分類(不是雷)的分類器將在測試集上達到99.9%的準確率,因為999個分類中實際上是正確的。然而,它在尋找雷方面是無用的,因為在提交給它的實際雷中,它沒有檢測到任何雷。它的召回率為0%。

通過使分類器更容易對可疑物體返回正面分類(雷),可以提高召回率。在極端的情況下,一個總是返回正面分類的分類器可以達到100%的召回率,因為它可以捕捉到所有的雷和所有的巖石。然而,同樣,它也是無用的,因為每一千次正面預測中,只有一次是正確的。它的精確度將是0.1%。

顯然,一個好的探雷器,或任何分類器,都需要有合理的高精確度和高召回率的數值。也就是說,必須有可能相信正面的分類結果,足以投入更多的資源(如部署潛水員)。也必須有可能足夠信任負面輸出,以期望它能找到相當比例的實際存在的雷。然而,在現實中,這兩者之間總是有一個權衡,正確的平衡取決于特定的操作要求。例如,如果不遺漏雷是很重要的,那么分類器將被調整為高召回率。然而,要付出的代價是較低的精度,導致更多的時間被用于調查巖石。

通過在測試數據集上運行分類器,計算有多少雷被正確分類(真陽性或TP),有多少巖石被正確分類(真陰性或TN),有多少巖石被誤認為是雷(假陽性或FP),有多少雷被誤認為是巖石(假陰性或FN),可以計算出準確率、精確度和召回率。這就產生了一個混淆矩陣,如表3.1所示。

表3.1--混淆矩陣的結構,將正確的正面分類(TP)、正確的負面分類(TN)、錯誤的正面分類(FP)和錯誤的負面分類(FN)的數量列表。

混淆矩陣是代表模型性能的一種緊湊但豐富的方式,從中可以推導出許多不同的度量。與同一行的其他數值相比,一個高精確度的模型具有較高的TP值(FP),或者更正式地說:

與同列的其他數值相比,一個高召回率的模型具有較高的TP值(FN),或者更正式地說:

與非對角線位置相比,一個高精確度的模型在所有對角線位置都有很高的數值,或者更正式地說:

矩陣中數值的其他組合產生了其他指標,每個指標都揭示了模型性能的某些方面。一般來說,一個具有不平衡數據的案例(這往往是現實中的常態)將需要更多的指標來衡量模型的性能。然而,對于面臨問題,正確的指標集可以提供一個簡明的圖片,說明模型在實際環境的表現是怎樣的。由于所有的指標都是從混淆矩陣中計算出來的,一個訓練較好的分類器很快就能從中提取這些信息。

(2)多類分類器的評估

如果一個車輛分類器要區分坦克、摩托車和運輸車輛,就存在一個多指標或多類分類問題。在這種情況下,混淆矩陣的行和列的數量將與類別的數量相同。圖3.3是一個多類混淆矩陣的例子,任務是將手寫數字的圖像從0到9分類,也就是10個類別。

從混淆矩陣中計算出的度量可以概括為:通過比較對角線和其余部分給出準確度,而通過比較每個特定類別的對角線值與其行的總和(準確度)或其列的總和(召回率)給出準確度和召回率。因此,通過對矩陣進行顏色編碼,就像在數字分類的例子中那樣,僅僅通過檢查就可以收集到很多信息。例如,從這個例子中可以看出,總體準確率非常高(將對角線與其他部分進行比較),但在不同的數字類別中,表現卻有些不同。數字5有時會被誤歸為3或6或其他,反之,5有時會被誤認為3。然而,數字1幾乎不會與其他東西混淆。

圖3.3 - 混淆矩陣說明了使用MNIST數據集識別手寫數字而訓練的DNN的性能。混淆矩陣可以用來深入了解該模型最可能與其他數字混淆的數字。

(3)回歸模型的評估

在回歸任務中,不可能計算正確的分類。相反,有必要將模型產生的連續值與測試集中的正確值進行比較。

作為一個例子,假設一個自主地面車輛(AGV)的避障模型正在被訓練。AGV必須根據安裝的傳感器的輸入產生一個轉向信號。轉向信號表示為-1和1之間的數字,其中-1表示左急轉,1表示右急轉,0表示不轉,而兩者之間的所有數字都是相應方向上的轉彎等級。AGV已經根據人類操作員記錄的數據進行了訓練。它的測試方法是將它對給定的傳感器刺激產生的轉向信號,與記錄的數據進行比較。例如,記錄可能表明,檢測到遠處左側的障礙物應該產生有限的右轉信號(例如0.2),而檢測到近處左側的障礙物應該產生一個急劇的右轉(接近1)。一個在后一種情況下產生急劇左轉信號(-1)的模型,應該被判定為比另一個產生輕微右轉信號(如0.2)的模型B表現更差。將模型的預測值與期望值相比較,顯然,模型A與該值的距離是2,而模型B的距離是0.8。因此,模型B更接近于正確的行為。如果對測試數據集中所有實例的這種誤差進行測量和匯總,例如計算平均誤差,就可以得到模型性能的總體衡量。

回歸的評估技術主要在如何進行匯總方面有所不同。平均絕對誤差(MAE)取的是誤差絕對值的平均值。該指標衡量模型預測與期望值的偏差程度。均方根誤差取的是誤差平均平方根。它對應于誤差的標準偏差,與MAE不同的是,它對大偏差的懲罰更大。R平方(R2)將平均平方誤差與信號本身的方差進行比較。因此,它首先對變化很大的信號容忍較大的誤差。

3.2 局部解釋技術

與全局解釋技術相比,局部解釋是用來解釋對感興趣的特定輸入的預測的。這些輸入可以是真實世界的例子,也可以是訓練或測試數據集中的例子。DNN的輸入基本上是由一串數值構成的,代表了一些現實世界的過程,如圖像中的像素、文本中的字母、科學數據等等。因此,一個有300個像素的灰度圖像在300個維度上表示它的數據,每個維度講述故事的一部分(所有維度一起提供整體)。

本節重點討論局部解釋技術,其中顯著性地圖被用于解釋。顯著性地圖通過對每個輸入維度的相關性或顯著性打分,來解釋一個模型的輸出。也就是說,它顯示了每個維度在產生與該例子相對應的特定輸出方面的重要性。對于一幅圖像來說,這些顯著性分數可以轉化為熱圖,疊加在圖像上,以表明模型在產生其決定時注意到哪些像素。圖3.4提供了一個在模擬自動駕駛汽車的背景下生成的顯著性地圖的例子。

這里介紹的前兩種技術是白盒技術。這些技術依靠訪問DNN的內部表示(子函數、梯度等)來產生解釋。其他技術是黑盒技術,可以通過查詢模型(通常是多次)和選定的輸入來產生解釋。因此,黑盒技術往往需要更多的計算資源來產生其解釋。

圖3.4 - 突出顯示了DNN用來控制模擬自駕車的最重要的輸入像素的Saliency圖。在這種情況下,代表道路右側的像素似乎是最重要的。

3.2.1 梯度顯著性

梯度顯著性(也叫敏感性分析)是最早的局部解釋技術之一,它被用來解釋神經網絡的行為已經有很長時間了[33, 34]。梯度顯著性的想法是通過計算輸入值的變化會在多大程度上改變模型的輸出值來產生解釋。輸入值的變化會對模型輸出值產生最大影響的輸入被認為比其他輸入對模型輸出值更重要。在數學術語中,這被稱為模型輸出對給定輸入(如圖像)的導數。由于DNN訓練使用導數,許多深度學習軟件庫可以直接計算梯度顯著性。

圖2.8中用來解釋DNN訓練過程的計算圖也可以用來理解梯度顯著性的工作原理。梯度顯著性技術不是計算相對于可訓練參數的導數,也就是訓練過程中所做的,而是計算相對于輸入的導數(即)。

梯度顯著性的問題是,它不能區分影響模型輸出的信號和DNN被訓練為過濾掉的干擾物[35]。使用梯度顯著性技術產生的解釋往往是嘈雜的,也會隱藏模型實際使用的特征。解釋哪些特征使輸入的物體類型更多或更少,并不像解釋哪些特征使其成為現實中的物體類型那樣具有信息量[34]。

3.2.2 分層相關性傳播

分層相關性傳播(LRP)發表于2015年,是第一批使用理論框架來指導局部解釋啟發式方法發展的技術之一[36, 34, 37]。該理論框架的主要好處是,它提供了一種方法,可以找到適合于DNN中各層的多種類型的局部解釋啟發式,以及其他類型機器學習模型的局部解釋啟發式。

LRP首先假設為低層對每個輸出值的貢獻分配相關性,應該考慮哪些激活對輸出值是必要的。從輸入中去除這些相關的激活,最好能取消該輸出值。例如,去除被歸類為汽車的圖像中的所有汽車特征,應該意味著該模型的汽車輸出值為零。在數學術語中,這被稱為模型函數的根,而LRP的想法是使用適合搜索這個根的局部解釋啟發式方法。

雖然沒有已知的技術來優化搜索模型函數的根,但有一些對搜索的限制已被證明是足夠的。例如,根的激活應該在輸出值的激活附近,相關的激活應該在可能的輸入空間內,而且只有輸出值的可用相關性應該被用來給激活分配相關性。事實證明,這些約束條件足以找到將相關性從模型輸出傳播回輸入的局部解釋啟發式方法。

LRP假設模型函數可以用數學技術泰勒擴展來近似。泰勒擴展將模型函數分解為簡單的加法項,可以直接映射到神經網絡組件。加法項意味著模型函數可以被分解為作為模型輸出基礎的每個激活的相關性分數。

LRP是一個局部解釋啟發法系列,使用這些技術進行相關性傳播[37]。這些啟發法專門適用于不同類型的神經網絡層和層級。一些啟發式方法還可以將輸出相關性傳播為有助于模型輸出的正向激活和有損于模型輸出的負向激活。這可能有助于識別缺失的特征,使模型輸出的可能性更大。

3.2.3 沙普利加和解釋

沙普利加和解釋(SHAP)發表于2017年[38],改進以前的一些方法,指出它們之間的數學共性,然后證明它們都可以通過使用一個特定的數學公式進行改進。

該公式由諾貝爾獎得主勞埃德-沙普利于1953年[39]在經濟學的一個分支--博弈論領域提出。它計算出所謂的沙普利值,用于在參與方之間分配一些聯合游戲的收益。該公式旨在根據一組合理性條件公平地分配收益,因此所有的收益都應該被分配;貢獻大的行為者應該獲得更多的收益;沒有貢獻的行為者應該一無所獲;而且應該有可能將不同游戲的收益相加。事實上,沙普利表明,他的公式是唯一可能滿足所有條件的公式。

就解釋而言,第一步是觀察機器學習模型的輸入維度可以被視為參與模型產生輸出預測的游戲的行為者。輸出值可以看作是游戲的總收益,也就是要在玩家之間進行分配。進行公平分配就是在輸入維度之間按其貢獻比例分配輸出值。換句話說,這樣應用沙普利值,就會產生一個突出性掩碼。這個觀察在SHAP方法之前就已經提出了,例如在[40]和[41]。

最初的SHAP工作的貢獻是觀察到一些早期的方法所產生的解釋都可以統一在一個共同的線性形式下,稱為加和特征歸屬,也就是說,它們都有一個共同的屬性,即它們產生的突出度值加起來就是要解釋的模型的輸出值。然后,[38]的作者設定了與上述條件相對應的穩定性條件,并證明沙普利公式是特征歸屬方法滿足所有條件的唯一途徑。由于之前的所有方法都在某種程度上偏離了沙普利公式(通常是通過應用一些沒有太多理論基礎的啟發式方法),作者認為可以通過調整這些方法使其符合該公式來改進。因此,SHAP實際上是一個基于這些調整的方法系列。例如,調整LIME(見第3.2.4節)以符合沙普利公式,可以得到KernelSHAP,即SHAP的一個模型無關的版本。基于特定模型解釋方法的SHAP版本繼承了相同的模型特定性約束。

3.2.4 局部可解釋模型診斷性解釋

局部可解釋模型-診斷性解釋(LIME)在2016年發表時引起了極大的關注[42],因為它是首批可以作為黑盒應用于任何模型的解釋方法之一。LIME通過對樣本進行擾動并觀察所發生的情況來解釋模型對輸入樣本的預測。

任何機器學習模型都將其輸入和輸出之間的關系表示為某種數學函數,由神經網絡的權重和結構或其他參數來定義。這個函數反過來旨在捕捉一些現實世界的關系,例如,一串聲音和一串單詞之間的關系。一個典型的現代機器學習系統所模擬的功能是復雜的,這就是為什么簡單地檢查神經網絡的權重并不能做很多解釋。LIME不考慮函數的整體性,而是試圖描述函數在要解釋的例子附近的作用。通過以不同的方式擾動輸入,它能夠創建一個線性的,因此更簡單的模型,該模型在與所提供的樣本相似的情況下表現得接近于復雜的模型。這個線性模型的系數構成了對輸入的哪些維度對模型的輸出影響最大的直接測量,或者換句話說,這些系數是LIME版本的顯著性掩碼。由于LIME對模型所要做的就是給它提供不同的輸入擾動并觀察它的輸出,所以對模型的內部工作沒有任何了解。

3.2.5 用于解釋黑盒模型的隨機輸入采樣

用于解釋黑盒模型的隨機輸入采樣(RISE)是一種模型無關的局部解釋技術,于2018年發表[43]。與LIME類似,RISE通過擾動輸入并觀察模型的反應來生成解釋。因此,對于解釋的生成,不需要了解模型的內部工作。

RISE通過隨機生成掩碼來擾亂圖像,掩碼使圖像像素變暗。掩碼是通過將圖像劃分為較大的區域,并隨機選擇哪些區域包括在擾動的圖像中來生成的。模型對擾動圖像的輸出值描述了掩碼覆蓋圖像區域的程度,這些區域對該模型類別的分類很重要。與覆蓋較少重要圖像區域的掩碼相比,覆蓋許多對分類很重要的圖像區域的掩碼會導致更高的模型輸出值。通過隨機生成許多掩碼,RISE計算出每個圖像區域的平均重要性。圖像區域的重要性解釋了模型的分類。

RISE的一個好處是,它使用大小均勻的圖像區域來生成解釋。因此,這些解釋涵蓋了與圖像中的物體相同的圖像區域。另一方面,LIME使用超級像素(類似像素值的連續區域),這可能無法捕捉到正確的圖像區域。

3.3 混合解釋技術

混合解釋技術通過結合全局和局部XAI技術提供洞察力。混合解釋技術不是只在個案的基礎上使用局部XAI技術,而是在大量的案例上自動應用局部XAI技術,通常是整個數據集。然后,混合解釋技術會比較所有的本地XAI結果,以確定模型表現不符合預期的情況。這種異常情況可以為進一步的模型開發提供信息,或者指出使用模型時需要考慮的性能限制。

3.3.1 譜系相關性分析

譜系相關性分析(SpRAy)技術是在[23]中介紹的。SpRAy是一種半自動化的技術,它使用整個數據集的分析方法來尋找模型性能不符合預期的情況。例如,在圖像分類中,一個一般類型的物體,如狗或汽車,可能會出現在許多形式和背景中,但類似的物體形式和背景應該有類似的局部XAI結果。如果某些情況下的本地XAI結果與預期的不一樣,這可能表明模型行為異常。依賴于現實世界中可能不存在的虛假和人為的相關性的決策策略,也被稱為 "聰明的漢斯"行為。SpRAy包括五個步驟來尋找異常的模型行為:

  • 用LRP計算相關性圖(見3.2.2節)。

  • 對所有的相關性圖進行預處理,使其具有統一的形狀和大小。

  • 對相關性圖進行譜聚類。譜聚類是一種成熟的技術,它將相似性矩陣(衡量案例之間的相似性)轉化為增強相似性矩陣的聚類特性的表示方法[44]。然后可以在新的表示法中檢測到集群。相關性地圖之間的相似性是由成對的相關性圖之間的歐氏距離計算出來的最近的鄰居。兩個相關性圖之間的歐氏距離是由每個像素的每個顏色通道的強度差異計算出來的。

  • 識別有趣的聚類。譜聚類計算出表明不相交或弱聯系的集群的措施(特征值)。特征值的巨大差距表明集群是不同的。

  • 一個可選的步驟是使用例如t-SNE(見第3.1.1節)對聚類進行可視化。

在[23]中,SpRAy被用來證明上一代機器學習技術--支持向量機(SVM)在圖像分類中學習了虛假的相關關系。例如,SpRAy顯示,該分類器使用了四種不同的策略對馬匹的圖像進行分類,檢測馬匹和騎手,在橫向或縱向的圖像中檢測源標簽,以及檢測障礙物和其他環境元素。因此,在沒有源標簽和背景元素的實際應用中,這個分類器是不可靠的。將源標簽添加到其他物體的圖像上,如汽車,他們可以將分類改為馬。

4 評估可解釋人工智能技術

XAI的一個經常被忽視但很重要的方面是評估擬議的XAI技術的能力。第 4.1節從人類因素的角度介紹了評價標準,其中用戶(如操作員或分析師)是衡量XAI加入人工智能系統后的效果的核心。此外,第4.2節介紹了可用于比較本地XAI技術的測試,如第3.2章中介紹的使用啟發式的技術。

4.1 人為因素評價

對XAI技術的人為因素評估測試了解釋是否考慮了所有對用戶充分利用AI系統的重要因素。例如,用戶可能有不同的目標、需求、知識、經驗、任務背景、用例等。和許多類型的系統開發一樣,在人工智能系統的整個開發過程中,從系統規范到最后的用戶測試,都必須考慮這些因素。由于用于DL的XAI技術是一個新興的研究領域,這些技術的最初用戶往往是對評估模型性能感興趣的系統開發者。這些XAI技術是否對軍事用戶也有用,在很大程度上仍然是一個開放的問題。在[22]中,已經提出了六個指標來評價解釋。

  • 解釋善意。由一份檢查清單組成,其中包括在開發XAI技術時從用戶角度考慮的重要方面。該清單是基于對現有文獻中關于解釋的全面回顧,包括解釋的七個重要方面,例如,解釋是否有助于用戶理解人工智能系統的工作原理,解釋是否令用戶滿意,以及解釋是否足夠詳細和完整。

  • 解釋的滿意度。一個衡量用戶在解釋的好壞方面如何體驗解釋的量表。該量表由八個項目組成,這些項目被表述為聲明(七個好的方面和一個關于解釋對用戶的目標是否有用的項目)。有效性分析表明,該量表是可靠的,可以區分好的和壞的解釋。

  • 促進心智模式的發展。好的解釋會加強用戶對人工智能系統如何工作以及為什么會做出特定決定的理解。在認知心理學中,這種表述被稱為用戶對人工智能系統的心理模型。推薦四個任務來測量用戶對人工智能系統的心智模型,例如,一個提示性的回顧任務,要求用戶在用人工智能系統執行任務后描述他們的推理,以及一個預測任務,讓用戶預測人工智能系統會做什么。用戶的心理模型和專家的心理模型之間的比較顯示了用戶心理模型的完整性。

  • 促進好奇心。好的解釋會促進用戶的好奇心,以調查和解決心理模型中的知識差距。我們建議通過讓用戶識別促使他們要求解釋的觸發因素來衡量好奇心。一些觸發因素的例子是:人工智能系統行動的理由,為什么其他選項被排除在外,或者人工智能系統的行為不符合預期。

  • 對解釋的信任。一個好的心理模型能使用戶適當地信任人工智能系統,并在其操作范圍內使用它。建議使用一個包含八個項目的量表來衡量用戶對人工智能系統的信任。例如,這些項目涉及用戶對使用系統的信心以及系統的可預測性和可靠性。

  • 系統性能。與只使用人工智能系統而不使用XAI相比,XAI的最終目標是提高系統的整體性能。性能測量的例子包括主要任務目標的完成,用戶預測人工智能系統反應的能力,以及用戶的接受度。

未來的研究將提供更多關于在評估人工智能系統的XAI技術時如何解釋這些指標的信息。

4.2 評估本地解釋技術

第3.2章中描述的本地XAI技術產生了突出性地圖,以突出每個輸入維度的重要性。根據模型所處理的數據類型,顯著性圖的可視化程度是不同的。例如,在處理圖像時通常使用熱圖,而在處理文本時通常使用彩色編碼的字符和詞。

圖4.1展示了一個使用熱圖可視化的顯著性圖的例子。在這個例子中,熱圖是為數字0(圖4.1a)生成的,使用了梯度顯著性(圖4.1b)和LRP技術(圖4.1c)。重要的維度(即圖像中的像素)由較暖的顏色(如紅色、橙色、黃色等)表示,而非重要的維度則由較冷的顏色(深藍、藍、淺藍等)表示。這兩種技術之間的明顯區別可以從高亮維度的位置上直觀地觀察到。本節的其余部分介紹了可以用來定量比較和評估不同技術所產生的局部解釋的技術。最終,我們的目標是找出哪個解釋是最準確的。

圖4.1 - MNIST圖像及其相應的熱圖,使用梯度顯著性和LRP技術生成。圖像中的重要維度或像素用較暖的顏色(如紅色、橙色、黃色等)表示。

4.2.1 刪減

刪減[43, 34]是一個指標,通過測量模型在輸入逐漸被扭曲或刪減時準確做出預測的能力來計算。請注意,在這種情況下,刪減意味著將輸入的值轉換為中性的東西(例如,圖像的背景)。刪減過程是由XAI技術產生的顯著性圖指導的,因此更重要維度的值會在不太重要的值之前被刪減。這個指標的直覺是,如果在刪減過程中,性能下降很快,而不是很慢,那么解釋會更好。

圖4.2使用圖4.1b中的梯度顯著性圖說明了刪減過程。在圖4.2b中,50個最突出的像素已經被刪減。在這個階段,很容易推斷出該圖像仍然代表一個0。在圖4.2f中,超過一半的像素(400)已經被刪減。在這個階段,要推斷出圖像實際代表數字0要困難得多。

圖4.2 - 由MNIST圖像的刪減過程產生的圖像,其中0、50、100、200、300和400像素被刪除。

4.2.2 插入

插入指標[43]是對刪減的補充方法。圖4.3說明了在刪減例子中使用的同一MNIST圖像的插入過程。從最初的輸入(用黑色圖像表示)開始,隨著越來越多的輸入維度被插入,按照突出度圖的優先順序,測量準確度的增加。這里的直覺是,當更多的信息被插入到輸入中時,模型預測的準確性應該增加。也就是說,當增加的速度快時,與增加的速度慢時相比,解釋會更好。

圖4.3 - 從MNIST圖像的插入過程中產生的圖像,其中0、50、100、200、300和400像素被插入。

4.2.3 評價指標

為了證明刪減和插入的使用,使用梯度顯著性和LRP技術來衡量這些過程。在這種情況下,使用分類器對XAI技術進行了評估,該分類器從MNIST數據集中隨機抽取了100張圖像。

圖4.4和圖4.5分別顯示了刪減和插入過程的結果。曲線下的面積(AUC)是一種測量方法,可以用來定量比較XAI技術。對于刪減,較小的AUC值要比較大的值好。同樣,對于插入,較大的AUC值比較小的值要好。

在圖4.4中可以看到,LRP技術的性能曲線的下降更加尖銳,并在使用刪減過程時收斂到一個較低的平均概率值。這與它的熱圖是一致的,與梯度顯著性的熱圖相比,它突出了較少的特征(圖4.1c和4.1b),表明與梯度顯著性相比,LRP在較少的特征下更快地找到了解釋。同樣的結論可以從使用插入過程的結果中得出(圖4.5)。在這里,只需插入幾十個特征,就能觀察到平均概率的快速增加,在插入大約100個特征后達到高性能。

圖4.4 - 梯度顯著性和LRP的刪減曲線。

圖4.5 - 梯度突出性和LRP的插入曲線。

5 實驗結果:關于解釋自然語言預測的案例研究

在自然語言處理(NLP)領域,一個常見的機器學習任務是讓人工智能系統評估一個文本在多大程度上表達了消極、積極或中性的情緒(即情緒分析)。諸如 "我非常高興和感激!"這樣的句子顯然表達了積極的情緒,而 "我希望他很快見到他的造物主 "顯然是消極的,而 "他昨天到達 "可以被認為是中性的。積極的例子包含了直接標明它是積極的詞語,而消極的例子則需要對語言有更深的理解,才能抓住其明顯的消極含義。因此,一個文本可以在它所表達的情緒的種類和程度方面有所不同,也可以在它如何直接表達方面有所不同。為了理解人工智能系統是如何試圖理解輸入到它的文本中的情感,可以應用第4.2章中用來解釋圖像分類的同類技術。

5.1 情緒分析預測器

情緒分析模型是所謂的SentimentTagger模型的簡化版,該模型主要被內部用來預測推文(即Twitter上的帖子)中的情感。SentimentTagger模型由一個DNN和一個更傳統的NLP模塊組合而成。在這項工作中,只使用了該模型的DNN部分。DNN模型是使用遞歸(即RNN)和全連接(即FCNN)神經網絡層的組合設計的。RNN部分使用一種叫做長短時記憶(LSTM)的技術來實現,該技術專門為一個句子中的單詞或字符之間,甚至是跨句子的遠距離依賴關系建模。例如,在 "我昨天以便宜的價格買的車今天壞了 "這句話中,事件 "壞了 "指的是 "車",盡管它們被其他文字分開。

在SentimentTagger中使用的特定LSTM是通過將傳入的文本(一條推文)分解成其組成字母來觀察的。更確切地說,它看的是字符,如字母,但也包括標點符號、空白、表情符號等等。然后,該模型提取出一個善于模擬情感的中間表征。這個中間表征然后被送入FCNN以產生最終的情感預測。預測是一個在0和1之間的連續值,其中0是最消極的,1是最積極的。因此,這是一個回歸模型,就解釋而言,這意味著解釋不是對預測一個特定類別的貢獻,而是對該特定輸出值的貢獻。

SentimentTagger的預測過程如圖5.1所示。表5.1中還提供了該模型預測的一些例子。表5.1中前三條推文的預測結果與人類判斷的真實情感值很一致。接下來的三條是低估了積極情緒的例子,而最后三條是低估了消極情緒的例子。對于一些例子,如第六個例子,可以說SentimentTagger比人類標簽者做得更好。在所有情況下,了解SentimentTagger的估計依據是什么,將是有益的。

圖5.1 - SentimentTagger的結構。一條推文被送入LSTMRN,它產生一個中間表征。然后將其送入FCNN,反過來產生最終的情感預測。

表5.1 - SentimentTagger對推文進行情感預測的例子。

5.2 解釋方法

為了對SentimentTagger產生的預測進行解釋,我們采用了模型診斷性的LIME和SHAP技術。SHAP的版本(KernelSHAP)實際上是對LIME的修改(根據[38]中提出的一般公式),這使得比較變得有趣。在這種情況下,選擇與模型無關的方法的原因是,不同類型的神經網絡的串聯使得應用特定模型的方法變得非同尋常。

SentimentTagger分析推文所包含的字符,而不是在詞的層面。顯著性解釋的最直接表述是指出一條推文的每個字符對該推文的情緒預測有多大貢獻。圖5.2a給出了這樣一個解釋的例子,SentimentTagger預測該條推文的情緒為中性(0.47),而人類判斷的數值為輕微的消極(0.31)。那么,是什么推動了這種預測呢?在這里,顏色編碼被用來表示每個字符對增加或減少情感預測的貢獻。藍色表示消極貢獻(即消極情緒),紅色表示積極貢獻(即積極情緒)。接近透明紫色的顏色代表中性情緒。

這個例子似乎表明,"更好 "這個詞中的字符做出了積極的貢獻,而 "壞 "這個詞中的字符做出了消極的貢獻,而其他字符則提供了一個不太清晰的畫面。從單個字符的顯著性歸因中得出結論是很困難的,因為字符本身并不真正意味著什么。因此,雖然可能有理由讓情感預測模型在角色層面上工作,但可能應該在一個綜合的層面上提供解釋,以更好地映射到實際意義。

如果將字符級別的歸因匯總到包含相應字符的每個詞上,結果就會出現圖5.2b中的可視化。出現的畫面更加清晰,不僅可以看到 "更好 "和 "壞 "對預測的推動作用有多大,而且還可以看出 "什么時候"的輕微積極作用和 "某人 "和 "不耐煩"的輕微消極作用。最后,還可以注意到,"紅色 "和 "藍色 "的數量似乎大致相當,這解釋了為什么SentimentTagger決定對情緒進行中性評價。在后面的例子中,到單詞級別的解釋是可視化的。

圖5.2 - 一條推文,根據其對該推文的情感預測的貢獻,對字符和詞進行了顏色編碼。紅色表示對積極情緒的貢獻;藍色表示對消極情緒的貢獻。在這個案例中,模型預測的是中性情緒(0.47),而人類標注者對情緒的判斷是輕微的消極(0.31)。詞級顯著性的可視化似乎更清楚地映射了句子語義的重要性。

5.3 定性結果

表5.2顯示了九個在不同方面都很有趣的推文例子。顏色對應的是由SHAP做出的顯著性歸因(然后如上文所解釋的那樣匯總到詞級)。預測欄列出了由SentimentTagger預測的情感值,而真實值欄則顯示了由人類判斷分配的值。一個詞越紅,說明組成它的字符越多,共同推動了預測值的上升。反之,一個詞越是藍色,它的字符越是把預測值推低。

對于前三條推文,SentimentTagger的預測與人類的情緒判斷(在真值一欄)相當一致。盡管達成了一致,但有趣的是,SentimentTagger看了哪些詞來得出其預測結果。在第一條推文中,"愚蠢的"、"可怕的"、"丑陋的"、"糟糕的 "和 "不 "促使情緒向消極方向發展,但 "父親 "一詞是一個更強大的消極驅動因素。可以詢問SentimentTagger是否發現了消極形容詞與 "父親 "的組合,或者它是否足夠成熟,能夠識別出 "不是他們的父親 "是一個有害的聲明。第三條推文更清晰;"微笑 "做了大部分的積極作用。

第4條和第5條推文是SentimentTagger將消極情緒分配給實際上相當積極的推文例子。諸如 "醫院"、"走了 "和 "眼淚 "等詞被表面上解釋為消極的,而對上下文的正確理解會否定這種判斷。6號推文似乎也顯示了預測和真實情緒之間的差異。然而,可以說,問句形式所表達的不安全感實際上使預測比指定的標簽更接近事實。

在例子7到9中,關系是相反的,即預測嚴重低估了推文中表達的消極程度。一些被遺漏的消極情緒可能源于拼寫錯誤,如 "appauling"(7),缺失空格,如 "worstairline "和 "beyondajoke"(7),以及口語化的縮寫,如 "tf"(9),盡管一個字符級的LSTM預計會比一個單詞級的更好地處理輕微的拼寫錯誤和空格缺失。其他錯誤則更難解釋,如 "令人震驚"、"可怕"、"凄慘"(7)和 "刺激"(9)。例子8似乎表明,SentimentTagger錯過了 "刺激 "和 "高 "之間的聯系。

表5.3顯示了LIME對相同推文產生的顯著性歸因。雖然SHAP的歸因在很大程度上是可理解的,但并不完全符合直覺,LIME的版本則在很大程度上令人困惑。少數與直覺相符,如 "可笑"(1)、"欣賞"(2)和 "樂觀"(6),其中前兩個沒有被SHAP強調。有些直接與直覺相抵觸,例如 "無用"(7)和 "微笑"(3),后者也與SHAP相抵觸。然而,大多數只是顯得很隨意,如 "ajahnae"(1)、"ago"(2)、"will"(5)和 "today"(8)。這些不直觀的解釋是否表明SentimentTagger存在SHAP沒有發現的故障,或者SHAP的更直觀的歸因是否更準確地描述了LSTM實際在做什么?KernelSHAP在理論上是LIME的一個更好的基礎版本,這一事實表明了后者,但這些定性的結果不能提供任何證明。為了更客觀地比較這兩種解釋方法,在下一節將進行定量分析。

表5.2 - 選定的推文,按SHAP的顯著性數值進行著色,這些數值已經匯總到單詞級別。

表5.3 - 選定的推文,按照LIME的顯著性數值進行著色,這些數值已經匯總到單詞級別。

5.4 特征刪減分析

正如第4.2.1節所解釋的,刪減指標通過按照XAI技術賦予特征的顯著性順序來測試解釋方法的性能。一個好的XAI技術應該對那些對預測模型的輸出很重要的特征賦予很高的顯著性,因此按照這個順序刪減特征會使模型的性能急劇下降。在本案例中,按照突出性順序要刪減的特征是字符,在這種情況下,刪減一個特征意味著用一個空字符來代替它,比如一個制表符或一個空格,而預測模型是SentimentTagger。我們在一批500條推文的例子上對SentimentTagger的SHAP解釋和LIME解釋都進行了刪減測試,然后繪制了模型的預測性能如何隨著刪減的特征(字符)數量而下降。此外,作為一個基線,我們用一個隨機掩碼進行刪減,導致特征以隨機順序被刪減。由于SentimentTagger是一個回歸模型,它的性能不能用準確性來衡量。相反,我們使用了R2指標,該指標代表了對訓練好的模型解釋測試數據中的差異的程度的衡量。

圖5.3顯示了SentimentTagger的R2性能作為刪減數量的函數,分別按SHAP、LIME和隨機掩碼排序。很明顯,刪減測試有利于SHAP,因為它的曲線按照突出性歸因的順序迅速下降,而LIME的相應曲線則明顯不那么陡峭。LIME在刪減測試中的表現只比隨機掩碼略好。因此,SHAP似乎在識別少數特征(字符)方面做得更好,沒有這些特征,模型就無法準確預測。這也許并不奇怪,因為Shapley公式的設計就是為了做到這一點,而LIME則依賴于更多技術上的啟發式方法。然而,通過有選擇地將少數幾個字符替換為空白,甚至有可能完全消除SentimentTagger的性能,這一事實可能是關于此類模型的穩健性(或缺乏穩健性)的一個有趣的跡象。

更值得注意的是,在SHAP案例中,R2值在最初的10次左右的刪減后實際上下降到了零以下,然后隨著更多的刪減被執行,又向零移動。這意味著第一組刪減實際上導致模型的表現比忽略其輸入并總是做出相同預測的模型要差。隨著更多的刪減,模型的預測將趨向于中性預測,即對應于一個空推文,這相當于忽略輸入。因此,R2值會收斂到零。

圖5.3 - 對SentimentTagger預測的SHAP和LIME解釋的刪減分析。隨機順序的刪減被用作基線。該圖顯示了對模型性能的影響,如R2指標所衡量的,當特征按突出性順序被連續刪減(即字符被連續刪減)時。SHAP曲線最初的陡峭下降表明,SHAP善于發現哪些特征對模型性能最為關鍵。低于零的跌幅表明,戰略性的刪減會導致模型做出的情感預測與人類標注的真實情感相矛盾。LIME的緩慢下降表明LIME的顯著性值在尋找哪些特征對模型性能最關鍵方面不如SHAP值,只比隨機刪減稍好。

6 結論

深度學習將被用于補充和取代軍事系統的某些功能。事實上,DL技術已經在軍事監控系統中得到了應用,以自動檢測和跟蹤大量圖像數據中感興趣的物體[45]。與傳統的軟件技術相比,DL有幾個優勢。最重要的是,DL可以用來為那些使用傳統軟件技術無法建模的復雜過程建模。它還可以促進主動學習,即人工智能系統與用戶互動,以獲得高質量的數據,這些數據可用于增強運行中系統模型(即部署后)。

不幸的是,這些優勢也帶來了重大挑戰,不僅在技術上,而且在操作上都需要解決。在本報告中,重點是可解釋性的挑戰。DL的一個主要缺點是,即使學習算法、模型結構和訓練數據是已知的,并且被很好地理解,但模型本身的行為卻不是可解釋的。在許多用于音樂推薦和廣告目的民用應用程序中,這通常不是一個問題。然而,在軍事領域,理解和解釋人工智能系統的行為是至關重要的。在這種情況下,人工智能系統提供的決定和建議可能會對人類的生活產生深刻的影響。這在使用自主武器和無人機的戰術層面是有效的,在軍事領導人和政治決策者做出長期決定的作戰和戰略層面也是有效的。

也許有人會說,復雜的軍事系統,如戰斗機、潛艇、坦克和指揮與控制的決策支持工具,也是難以掌握的。雖然這是事實,但用于建立這些系統的技術本質上是可以解釋的。因此,如果出了問題,有可能完整地檢查系統以識別和糾正問題。而在DL中,情況并非如此。主要原因是,在現實世界的應用中,DNN經常由數百萬甚至數十億的參數組成。因此,即使是這些模型的創建者也沒有能力系統地解決模型中可能存在的錯誤。

在這份報告中,探討了為解決可解釋性挑戰而提出的幾種最先進的XAI技術。盡管已經取得了一些進展,但可以得出結論,用于軍事領域DL應用的XAI仍然處于起步階段。最終,即使已經提出了許多XAI技術,它們還沒有在軍事背景下被檢測過。因此,不能保證現有的XAI技術能夠在高風險的軍事AI系統中使用DL。

在為軍事目的開發人工智能系統時,我們建議在采購和開發過程中盡早確定可解釋性和可解釋性要求。最重要的是,這些要求的定義是可行的和可驗證的。也就是說,這些要求必須符合在可解釋性方面實際可能的期望。

在未來的工作中,我們打算開發一個評估框架,可以用來支持軍事人工智能系統中XAI能力的發展。

FOI

FOI,瑞典國防研究局,是瑞典國防部下屬的一個主要任務資助機構。其核心活動是研究、方法和技術開發,以及為瑞典國防和社會安全利益而進行的研究。該組織雇用了約1000名員工,其中約800名是科學家。這使得FOI成為瑞典最大的研究機構。FOI為其客戶提供了大量領域的前沿專業知識,如安全政策研究、國防和安全相關分析、各種類型威脅的評估、危機控制和管理的系統、有害物質的保護和管理、IT安全和新傳感器提供的潛力。

付費5元查看完整內容

摘要

人工智能領域的進展繼續擴大這組技術的潛在軍事應用范圍。本文探討了信任在人機聯合作戰中的關鍵作用,以及依靠人工智能來補充人類認知的潛在影響。如果依靠人工智能來準確處理傳感器數據,操作自主系統和平臺,或通過擬議的作戰概念(如以決策為中心的戰爭)提供有利的決策支持,設想機器智能的中央指揮和控制作用,那么信任機器智能將是未來作戰中的一個關鍵組成部分。鑒于這些技術和理論的發展,信任的概念對于機器智能在戰術和作戰層面的軍事行動中的使用變得高度相關,正確校準的信任水平是安全和有效行動的基礎。在簡要回顧了機器智能的最新進展和對信任概念的探索之后,本文概述了人工智能在戰場上的當前和潛在應用,以及由不充分或不合理的高信任度帶來的挑戰。

引言

縱觀歷史,技術已經擴大了武裝沖突的領域,戰術交戰的節奏,戰場的地理范圍,以及指揮官與部隊溝通的手段。技術創新--包括軍事和民用--改變了軍隊的作戰方式以及國家計劃和進行這些沖突的方式。在21世紀,迄今為止,很少有進步能像統稱為人工智能(AI)的一組技術那樣獲得如此多的關注。人工智能正準備迎來一個新的時代,在這個時代,機器智能和自主性正在為軍事行動的規劃和執行產生明顯的新概念。算法戰爭可能會帶來一些獨特的東西:增強甚至取代人類決策過程的系統,其速度可能超過人類規劃者的認知能力。
新興技術的整合提出了任何數量的基本組織和倫理問題,值得關注。本文將采用定性的社會科學方法,重點討論人類-自治團隊(HAT)的一個重要方面:鼓勵對機器智能的適當信任程度。有大量的學術文獻關注自動化或機器人技術中的信任問題,但有關具體軍事應用的工作較少。當人工智能在聯合作戰中被實際部署時,在信任方面有哪些挑戰和機會?在簡要回顧人工智能和概述機器智能在戰場上的可能應用之后,本文在分析鼓勵適當信任水平的陷阱和潛在解決方案之前,探討了信任和信任校準的概念。

人工智能的進展

幾十年來,人類一直對賦予機器某種形式的人工智能的可能性著迷,Nils Nilsson將其定義為 "致力于使機器智能化的活動,而智能是使一個實體在其環境中適當運作并具有預見性的品質"。在數字時代的早期,出現了兩種廣泛的人工智能方法。自上而下的專家系統方法使用復雜的預編程規則和邏輯推理來分析一個特定的數據集。對于具有可預測規則的明確定義的環境--諸如分析實驗室結果或下棋等應用--專家系統或 "符號 "人工智能(基于符號邏輯)的性能主要取決于處理速度和算法的質量。另一大類使用自下而上的機器學習方法,模擬人類通過檢測數據中的模式進行學習的方式。神經網絡是一種以人腦為模型的機器學習形式,能夠通過使用多個(因此是 "深")人工神經元層來識別復雜的模式,是被稱為 "深度學習 "的技術的基礎。通過其在數據集中尋找關系的能力,這種技術也被稱為 "連接主義"。
自上而下、基于規則的符號系統和自下而上的機器學習連接主義技術之間的差異是很大的,特別是關于它們的潛在應用范圍和靈活性。深度學習方法的顯著特點是能夠將學習與它所訓練的數據集分開,因此可以應用于其他問題。基于規則的算法可以在狹義的任務中表現得非常好,而深度學習方法能夠迅速找到模式,并在 "蠻力 "專家系統計算方法無效的情況下有效地自學應用。最近的一些人工智能進展顯示了模仿創造力的能力,產生了有效的解決問題的方法,這些方法對人類來說可能是反直覺的。
然而,總的來說,人工智能仍然是狹窄的或 "脆弱的",即它們在特定的應用中功能良好,但在用于其他應用時仍然不靈活。與人類的認知相比,鑒于機器的計算速度遠遠超過人腦,機器智能在將邏輯規則應用于數據集時要優越得多,但在嘗試歸納推理時,它必須對數據集或環境進行一般性的觀察,這就顯得不足。大多數機器學習仍然需要大量的訓練數據集,盡管新的方法(包括生成對抗網絡(GAN)和 "小于一次 "或LO-shot學習)正在出現,需要非常小的數據集。圖像識別算法很容易被混淆,不能像人類那樣立即或直觀地理解情景背景。這種脆性也延伸到了其他問題,比如游戲。雖然人工智能在視頻游戲中經常表現出超人的能力,但他們往往不能將這種專業知識轉移到具有類似規則或玩法的新游戲中。
 雖然人工智能技術繼續在變得更加適應方面取得重大進展,但任何接近人類的人工通用智能仍然難以實現。評估人工智能的近期前景因該技術的漸進式進展而變得更加復雜。圍繞著人工智能的炒作--在很大程度上被深度學習方法的成功所推動--既導致了對該技術未來的不切實際的期望,也導致了對其非常大的進展的正常化。正如一份報告所指出的,"人工智能將一項新技術帶入普通人的視野,人們對這項技術習以為常,它不再被認為是人工智能,而出現了更新的技術"。盡管象征性的人工智能和各種形式的機器學習構成了該領域最近的大部分進展,也許除了融合這兩種方法的嘗試之外,未來仍然不確定。一些人猜測,機器學習技術帶來的進展可能會趨于平穩,而另一些人則保持樂觀。相關的技術進步,如短期內的計算機芯片設計和長期內的量子計算,可能會影響進一步進展的速度。

付費5元查看完整內容
北京阿比特科技有限公司