信息戰依賴于能夠識別敵人的行動和可能的進攻性信息活動地點。在一個全球數百萬人產生數百萬條信息的世界里,純粹的人類對信息景觀的監視是注定要失敗的。我們通過對阿塞拜疆/亞美尼亞沖突的案例研究表明,通過關注各種起作用的敘述,人工智能輔助的人類分析有可能將監視目標縮小到一個可管理的規模,并識別武裝沖突中敵對者部署的自動化。
信息戰從根本上說是關于敘事的塑造。這可以采取以下兩種形式:(1)戰術性敘事塑造,即關于部隊位置/人數和傷亡的敘事;(2)戰略性敘事塑造,即關于戰爭的有效性/對部隊/平民士氣的影響的敘事。信息戰領域的一個關鍵問題是要能夠快速識別和了解敵人的信息活動,以便準確應對。
鑒于敘事在信息戰中的核心地位,敘事不能說謊。因此,我們應該通過仔細觀察支持敵人更廣泛議程的敘述來尋找敵人的活動。通過他們所宣傳的敘事來尋找敵人的活動,敵人就不能在不破壞自己的效力的情況下隱藏活動;這是信息戰的雙刃劍,也適用于圍繞同一作戰網絡空間的公共外交。
在本文中,我們提出了一種具體的方法,利用信息戰的這種敘事特性來識別信息戰活動。特別是,我們強調了這樣一個過程:(1)識別相關的敘事和敘事信號,(2)根據敘事信號以結構化的方式收集數據,(3)調查敵人敘事中的行為者和故事。在本文的其余部分,我們將通過一個案例研究來展示這種方法的具體用途,然后我們將強調一些正在進行的技術改進,我們正在努力提高這種方法在實地使用的便利性和效率。本文的目標是為在無處不在的信息戰環境中利用社交媒體獲取情報提供一種工作方法。
2022年5月9日蘭德公司發布《利用機器學習進行作戰評估》報告。作者描述了一種利用機器學習來支持軍事作戰評估的方法。他們展示了如何利用機器學習從情報報告、作戰報告以及傳統和社會媒體中的非結構化文本中快速、系統地提取與評估相關的見解。這些數據已經由作戰級別的總部收集,通常是關于當地居民、敵人和伙伴部隊的最佳可用信息來源,但很少被納入評估,因為它們的結構不容易被分析。本報告中描述的機器學習方法有助于克服這一挑戰。
本報告中描述的方法,作者利用最近結束的針對上帝抵抗軍的戰役進行了說明,使評估小組能夠向指揮官提供關于戰役的近乎實時的見解,這些見解是客觀的,與統計學相關。這種機器學習方法可能特別有利于資源有限或沒有具體評估數據的戰役,這在資源有限或被拒絕地區的戰役中很常見。這種機器學習的應用對大多數評估小組來說應該是可行的,并且可以通過公開和免費的機器學習工具來實現,這些工具已被授權在美國國防部系統上使用。
如何利用機器學習工具將現有的情報報告、作戰報告和環境數據(如社交媒體、傳統媒體)納入戰爭行動層面的評估?
準確和及時的評估--提供關于哪些是有效的,哪些是無效的,以及如何改進作戰的反饋--是所有美國軍事作戰的一個關鍵要求。對軍事作戰的評估是圍繞戰役的作戰目標進行的,評估過程的重點是確定在實現這些目標方面是否正在取得進展。評估小組--最好是與指揮小組一起--確定與每個目標相關的預期效果,然后制定有效性措施(MOE),以跟蹤實現這些目標的進展。
獲得和處理正確的數據類型對于產生相關和可辯護的評估至關重要,這也是本報告的主題。有效的評估要求數據是客觀的、縱向的、與軍事作戰希望達到的效果類型相關的、有適當的評估結構,并且有足夠的時間頻率來支持決策。
在以前的研究中,我們為特種作戰部隊(SOF)的作戰評估開發了一種標準化的方法,我們發現作戰總部已經收集的各種數據與評估有關,但很少被使用。三種類型的數據--情報報告(如來自人類情報或信號情報來源)、作戰報告(如情況報告[SITREPs])和環境數據(如社交媒體)中已有的對正在發生的事件的文字描述,往往是有關當地居民、敵人和伙伴部隊的最佳可用信息來源。然而,這些數據的結構很少能被輕易地納入評估過程。
本報告描述了一種方法,即如何利用機器學習(ML)工具將這些現有數據納入作戰評估。我們展示了一個基于ML的文本分類器如何快速整理和準備這些數據,以便使用評估小組常用的標準統計工具進行后續分析。然后,我們使用最近結束的針對上帝抵抗軍的作戰數據來說明這一方法。這種基于ML的方法對大多數評估小組來說應該是可行的,并且可以用公開和免費提供的ML工具來實施,這些工具已被預先授權用于美國國防部(DoD)的機密系統。
本報告所描述的方法使評估小組能夠準確、及時地了解一場戰役,為指揮官提供近乎實時的、客觀的、與統計學相關的結果。可以使用我們的方法分析的每一種類型的數據--情報、作戰和環境--為理解一個戰役的效果提供了一個不同的視角。在有評估特定數據(如投票)的軍事作戰中,這些新的數據來源使評估小組能夠對調查結果進行三角測量,提高評估的可靠性。然而,ML工具在評估專用數據有限或沒有的情況下特別有用--這在資源有限或在被拒絕地區的作戰中很常見。
我們的分析集中在一個具體ML評估應用上:使用 "有監督機器學習"(SML),從現有的情報、作戰和環境報告中的非結構化文本中構建一個可供評估的數據庫。SML的這種應用的直覺是相對簡單的。首先,人類分析員通過手工審查和分析可用的非結構化文本的一個子集。這第一步的輸出通常被稱為 "訓練數據"。然后,ML算法分析這個訓練數據,并試圖模仿人類分析師對所有剩余文本使用的相同分析過程。
這種方法允許評估小組系統地編輯非結構化文本中的信息--每份報告中提供的定性描述成為客觀和定量評估中的單一數據點--然后檢查這些信息如何隨時間演變。這種方法是將ML納入評估過程的最簡單方法,但它仍然是一種有效的方法,可以從這些現有數據中信息豐富的非結構化文本中獲得與評估相關的見解。
在本報告中,我們詳細說明了一個五步工作流程,并在圖S.1中進行了總結,評估小組可以按照這個流程將SML納入評估過程。
圖S.1 用于評估工作流的監督機器學習
第1步是整理大量的潛在相關報告--通常是數以千計的年度報告(或更多)--可用于大多數業務。這個整理過程包括刪除不必要的重復內容,并將數據重新組織成適合ML算法分析的格式。在我們的方法中,現有報告中的非結構化文本被分為單句,然后分析其與競選活動的相關性。
第2步是制定適合每個相關MOE的編碼標準。這些編碼標準是歸納出來的,評估小組首先審查現有的數據,以確定哪些MOE是可以用現有的數據衡量的。然后,評估小組制定具體的編碼標準--也就是一套規則,說明什么時候一份報告應該被認為與該MOE相關(或不相關)。至關重要的是,這些編碼標準要足夠清晰和詳細,以便于復制,使不同的分析員在應用這些標準時產生幾乎相同的結果。本報告為每一類數據(情報、作戰和環境)提供了常用的MOE的編碼標準樣本,盡管具體的編碼標準必須是針對作戰的。
第3步是準備訓練數據,這是SML方法中ML算法的主要輸入。這些訓練數據是整體非結構化數據的一個子集,由評估小組使用步驟2中制定的編碼標準進行審查、分析和編碼。確保編碼標準的穩健性和可復制性是開發這些訓練數據的一個關鍵組成部分,因為ML算法試圖復制人類分析員的編碼。
第4步是實現和校準一個或幾個選定的ML算法。校準過程包括審查由ML算法編碼的報告,以驗證其準確性--也就是說,即確保被識別為相關的報告確實是相關的。如果算法表現不佳,評估小組需要調整算法參數或擴大訓練數據的數量。在一個實際的活動中,這個校準過程應定期重復,以確保算法在更多的數據可用時仍然表現良好。
第5步,評估小組處理來自ML算法的輸出,以整合到評估過程中。ML算法的輸出是一個結構化的數據庫(例如,Excel),確定所有滿足步驟2中制定的編碼標準的報告。這種通用的結構化格式允許用評估小組常用的工具進行分析,并便于插入現有的態勢感知工具中。在某些情況下,可以直接分析這些數據,以產生報告在一段時間內的趨勢線,例如,以正面方式討論一個實體(如敵人或伙伴部隊)的社交媒體報告的百分比與以負面方式討論它的數量相比。在其他情況下,這些數據需要與報告中的其他信息相結合--例如,提取特定地點的信息可以使評估小組生成不斷變化的敵人作戰自由地圖。
機器學習可以成為支持作戰評估的有力工具
我們的研究確定了五個建議,這些建議將提高基于ML的評估方法的價值。
建議1:在受控演習中驗證SML方法。本報告所描述的方法是特意設計的,以使評估小組盡可能容易復制,而且該方法的設計依靠的是既免費又已被批準在許多軍事網絡上使用的工具。然而,盡管我們已經用實際作戰測試了我們的方法,但我們并沒有試圖在實時或與軍事分析員團隊一起做這件事。因此,我們建議利用實戰演習,但在受控條件下驗證各項要求--如任務前培訓、人員配置、分析工具的可用性和必要的數據訪問。
建議2:探索如何利用無監督的ML為作戰評估提供信息。無監督的ML可以提供一種工具,用于發現戰役活動和這些活動的行動目標之間的未預期模式。經過評估小組的審查,這些信息可以為指揮官提供一個寶貴的工具,用來探索未預料到的模式。考慮到我們的任務是探索如何利用ML將現有數據用于評估,我們沒有詳細研究將無監督ML納入評估的實用性或價值。
建議3:對作戰報告實施適度的標準化。SITREP和其他作戰報告往往是關于伙伴部隊活動和能力的唯一最佳歷史數據來源,而且這種報告還可以提供關于美國部隊活動的詳細歷史記錄。這些特點使作戰報告成為評估小組潛在的有力工具--特別是如果有ML(或類似的)工具可以快速提取與評估有關的信息--但這種報告在質量和細節上并不一致。我們建議對這種作戰報告進行適度的標準化。要求(簡單地)戰術部門持續討論其伙伴部隊的活動和能力。
建議4:改善歷史情報和作戰報告的歸檔、發現和提取。獲取和提取本報告所述方法所需的相關情報和作戰報告在現有系統中并不容易。對于情報報告,我們建議在現有系統中增加快速提取縱向數據(如三個月或更長時間的數據)的能力,以滿足一組特定的搜索參數(如地理、布爾邏輯),其中包括報告全文和一些關于數據的基本描述性信息(日期、來源等)。對于業務報告,我們建議業務層面的總部確保所有下屬總部的SITREPs被系統地歸檔。
建議5:擴大專業軍事教育中要求的具體評估討論。盡管承認評估對軍事行動的重要性,但在向聯合部隊提供的與評估有關的教育和培訓方面存在重大差距。因此,評估小組往往難以提供指導有效決策所需的信息,而作戰級總部的其他工作人員往往缺乏經驗。
混合行動由多個行動領域的協調攻擊完成,包括網絡戰和信息戰。檢測混合型威脅的一個關鍵挑戰是如何識別個別事件是對手(精心策劃的)措施的結果,并將所謂不相關的事件聯系起來。由于物理和網絡及信息領域的行動可能發生在不同的時間、不同的地點、不同的速度,作為短期或長期的活動,并且可能是低強度的,因此連接這些點的任務變得更加困難。為了確定與具體任務規劃和執行相關的信息,混合威脅的風險評估必須始終在具體任務的背景下進行,包括其任務目標、行動區域和任務時間范圍。
在本文中,我們描述了兩種情況,在這兩種情況下,對手可能在物理以及網絡和信息空間中進行攻擊,以干擾行動。接下來,我們描述了一個演示器的高級架構,顯示了不同類型的傳感器和信息源是如何連接在一起的。為了應對混合威脅并充分發揮對分析員和決策者的支持潛力,有必要在不同的細節水平上實現態勢感知--從原始數據到高度聚合的風險評估--在不同的領域中共享信息,并在聚合水平上融合它們。
多域作戰(MDO)并不是一個新現象。在戰爭中,長期以來一直在多個領域開展行動。從陸、海、空行動開始,空間和網絡領域補充了對手的組合。為了對付這些,需要不同部門的深入合作。同樣,混合威脅這個詞也不是2020年的發明。一開始是混合戰爭,它與非對稱戰爭、非正規部隊和信息行動等概念混雜在一起。
在早期,重點是傳統的軍事沖突。戰場是傳統的地面,坦克、飛機和艦艇與人員一起是主要的行為者。通信是決定勝負的一個關鍵因素。數字化的開始提供了新的好處和選擇,但也給戰爭帶來了新的脆弱性。今天被稱為網絡和信息領域(CID)的使用在軍事能力方面是一個很大的推動。隨著社交媒體的出現,信息領域發生了巨大的變化,因為它使對手更容易影響公眾輿論和關鍵人物的意見。此外,隨著物聯網中相互連接的設備越來越多,網絡威脅的重要性也在增加。今天的關鍵基礎設施(用于能源、交通、衛生等)比過去更容易受到信息技術的威脅,它們是現代戰爭中的熱門目標。這為敵對勢力的攻擊打開了大門。他們的工具箱不再局限于經典的軍事資產。當然,新興的技術導致了反擊和反擊的措施,以及一場永恒的競爭。
在軍事和民用領域,對信息交流的使用和依賴日益增加,產生了新的攻擊載體,同時也產生了防御這些攻擊的新需求。在今天的沖突中,威脅影響到政治、軍事、經濟、社會、信息和基礎設施等領域。不同的威脅可能是由正規和非正規部隊造成的。這些可能是不利的國家,也可能是出于非政府考慮的團體。
一個關鍵的挑戰是如何在戰術層面上認識到個別事件是對手(精心策劃的)措施的結果,并將所謂不相關的事件聯系起來。在任務規劃或任務執行的風險評估中,這個問題的答案可能會導致對自己的措施無動于衷的決定,如使用通信渠道、部隊保護、路線規劃或反網絡行動。由于物理和網絡及信息領域的行動可能發生在不同的時間,以不同的速度,作為短期或長期的活動,并且可能是低強度的,因此連接這些點的任務變得更加困難。
混合沖突的分析、評估和決策是復雜的,原因有很多:混合活動的信號是多維的;結合多種類型的信息是必要的;許多混合沖突是隱蔽的,或者很難從正常的國家與國家的關系中分辨出來。對混合沖突的評估需要包括對手行為者的戰略目標、被利用的社會脆弱性和背景事件、跨社會領域的活動,以及對目標社會的影響。在早期的工作中,我們根據混合沖突的這五個要素提出了一個分析過程。在本文中,我們在這項工作和更廣泛的情報文獻的基礎上,解決如何進行混合沖突評估的問題。具體來說,我們概述了一個詳細的評估過程,為決策者提供對形勢的了解,以選擇對混合威脅的預防性和反應性反應。所提議的程序的優點在于它對混合沖突的綜合評估,結合了目標社會的觀點和對手行為者的觀點。此外,所提出的評估功能依賴于人類產生的分析性見解--考慮到背景、模糊性、規范性--和從傳入數據中產生的信號--考慮到結構化和結合來自多個來源的信息--之間的持續互動。這種綜合視角超越了傳統的分析方法。我們提出的評估很適合引導人類和自動化情報的結合,并提供了一個分析方法和工具的藍圖,以應對混合沖突中的決策挑戰。
混合沖突是國家之間的一種沖突,大多低于公開戰爭的門檻(見歐盟等的定義,2018年,北約,2019年和荷蘭層面的定義,NCTV,2019年)。混合沖突中的國家使用許多國家權力的措施來影響其他社會。這些措施包括外交、信息、軍事、經濟、金融、情報和執法手段。戰略層面上的混合沖突案例研究需要敘事和社交媒體操縱、針鋒相對的金融和經濟制裁、外交威脅、大規模軍事演習和許多其他全社會的互動。許多類型的混合威脅在前些年的經驗中是已知的。例如,美國的選舉影響,中國通過基礎設施投資的影響,以及俄羅斯在破壞烏克蘭穩定方面的努力。
混合沖突給決策者帶來了不同的挑戰。這是因為公開的軍事對抗大多被避免,只有低于武裝沖突的法律門檻的活動才被應用。網絡領域和信息領域是針對政府和社會的影響活動發生的主要領域。由于混合沖突中許多活動的隱蔽性或模糊性,在將活動歸于國家行為者方面存在很大問題。最后,混合沖突是對各種手段和方法的創造性安排,它創造了新的情況,對分析來說具有內在的挑戰性。在這篇文章中,更詳細地研究了在面臨上述挑戰時對混合沖突的評估。
記錄一個系統或集成系統內所有信息變化的出處,這提供了關于正在做出的決定和促使這些決定的重要信息。從取證的角度來看,這可以用來重新創建決策環境。然而,出處也可以為其他兩個重要功能服務。收集的數據可以支持組件的整合,而生成的圖形數據結構可以通過解釋、總結和告警來支持操作員進行態勢感知。混合戰爭將必然匯集不同決策支持能力,因為決策者必須在多個戰爭領域運作。自主代理將可能在計劃和執行過程中發揮作用,有時能夠在沒有人類干預的情況下做出決定,但人類決策者必須意識到這一點。事實證明,證據圖可以轉化為修辭結構圖(RSG),使代理能夠用自然語言甚至多模態交流,向人類解釋他們的行動。證據還被證明可以加強對計劃執行監控,并可用于向人類或自主代理提供通知,當計劃中使用的信息發生變化時,可能需要重新考慮計劃。隨著我們朝著智能機器在復雜環境中支持人類決策者團隊的方向發展,跟蹤決策及其輸入的需要變得至關重要。
出處是關于實體、活動、代理以及這些概念之間關系的信息[1]。這些信息不僅僅解釋了發生了什么,它還回答了關于實體如何被操縱、何時發生以及誰參與了這個過程的問題。我們很可能熟悉關于追蹤藝術作品出處的新聞和虛構的故事。任何實體的創造、破壞或修改的出處都可以被追蹤。在本文中,我們將重點討論軍事系統內的信息。在指揮與控制(C2)內,信息出處對于記錄行動背后的決策過程是必要的,特別是當自主和人工智能(AI)代理深入參與時。參與某一過程的 "誰 "可能是人類或人工智能代理。
信息出處有幾個目的。在取證方面,出處追蹤提供了參與決策的人和代理,以及數據是如何演化為該決策的。美國公共政策委員會指出,數據出處是算法透明度和問責制的一個明確原則[2]。完整記錄的出處可以闡明數據的依賴性、責任流,并幫助解釋為什么采取某些行動。隨著人工智能和自主代理繼續自動化進程,它們在做出關鍵決策時已變得更加不可或缺[3]。
混合戰爭為沖突推波助瀾,以削弱對手的實力。相關的行動既發生在物理世界,也發生在媒體空間(通常被稱為 "信息空間")。防御混合戰爭需要全面的態勢感知,這需要在兩個領域,即物理和媒體領域的情報。為此,開源情報(OSInt)的任務是分析來自媒體空間的公開信息。由于媒體空間非常大且不斷增長,OSInt需要技術支持。在本文中,我們將描述對物理世界的事件以及媒體事件的自動檢測和提取。我們將討論不同類型的事件表征如何相互關聯,以及事件表征的網絡如何促進情景意識。
開源情報(OSInt)的任務是探索和分析可公開獲取的媒體空間,以收集有關(潛在)沖突的信息,以及其他主題。所謂 "媒體空間",我們指的是通過傳統媒體(如電視、廣播和報紙)以及社交媒體(包括各種網絡博客)傳播的非常龐大、快速且持續增長的多語種文本、圖像、視頻和音頻數據語料庫。社會媒體大多是平臺綁定的。平臺包括YouTube、Twitter、Facebook、Instagram和其他[1,2]。在很大程度上,媒體空間可以通過互聯網訪問。很多部分是對公眾開放的。然而,也存在一些半開放的區域,其中有潛在的有價值的信息,但并不打算讓所有人都能接觸到,例如Telegram和Facebook頁面。
媒體空間提供關于物理世界的信息:發生了什么?哪些事件目前正在進行?未來計劃或預測會發生什么?它對物理世界的事件反應非常快,也就是說,幾乎是立即提供信息[3]。因此,媒體空間似乎是物理世界中事件的一個有希望的 "傳感器"。然而,從鋪天蓋地的大量信息中檢索出特別相關的信息仍然是一個挑戰,因為到目前為止,所提供的大多數信息是完全不相關的,至少對軍隊來說是如此。此外,媒體空間并不一致--它包括真實和虛假信息,因此,事實核查是一個進一步的挑戰。
除了作為物理世界的傳感器,媒體空間還是意識形態、意見和價值觀的論壇。它是一個重要的空間,用于協商一個社會認為是允許的、規定的或禁止的東西,并用于表現情緒和偏見。因此,它已成為混合戰爭的戰場,即以 "通過暴力、控制、顛覆、操縱和傳播(錯誤的)信息"([4],第2頁)為目的進行的行動。(錯誤的)信息行動導致我們稱之為 "媒體事件"。媒體事件可以被觸發,以影響情緒、意識形態和公眾對物質世界的看法。
作為一個多國聯盟,當北約的成員國能夠在短時間內自信地將他們的部隊聚集在一起時,北約是最有效的。因此,一個關鍵的信息要求是了解其國家部隊的互操作性程度。為了有效地傳達這種理解,需要統一的、可重復的、可靠的和結構化的方法和框架。成立SAS-156的目的是為互操作性數據的測量、收集和評估制定一個北約標準。信息時代的要求對不同單位快速、方便、安全地連接和共享信息的能力提出了挑戰,但人和程序的因素仍然同樣重要。作者將介紹他們根據在加拿大聯合作戰司令部的工作經驗,對參與國的現有評估框架進行綜合和擴展的工作。加拿大武裝部隊的經驗特別相關,因為它是北約在拉脫維亞的多國增強型前沿存在戰斗小組的框架國家,并且輪流領導北約常設海上小組。
聯盟和伙伴關系一直是上個世紀成功的大規模作戰行動的一個關鍵組成部分。互操作性--為實現戰術、作戰和戰略目標而一致、有效和高效地共同行動的能力--是取得成功的關鍵。北約國家和合作伙伴了解互操作性的重要性,并且已經和正在收集關于行動和演習及活動的大量數據,以評估多國聯盟能夠實現互操作性的程度。然而,諸如缺乏標準術語等障礙仍然存在,而且可靠和有效的數據收集方法仍然難以找到。為了彌補這一缺陷,向系統分析和研究(SAS)小組提出的技術活動建議在2019年獲得批準,由此產生的后續活動,即北約任務組SAS-156 "制定評估多國互操作性的標準方法",正在追求這些明確的研究和利用目標:
幫助北約實現互操作性數據定義、收集和管理的標準。
讓軍事規劃人員更好地了解他們與合作伙伴的互操作性狀況,并在他們之間以共同的方式討論這些評估。
為追求自身互操作性目標的各個國家的資源配置決策提供依據。
本文研究了在信息時代,俄羅斯聯邦的各種官僚機構如何利用外交語言、宣傳和軍事信號,圍繞沖突和暴力實時地進行有利的敘述。這兩年的外交聲明和政治軍事行動共有約3000條記錄可供考慮,提供了大量的數據供評估。通過研究2019年和2020年這些聲明的頻率、預期信息和目標,本文確定了俄羅斯如何在口頭上介入全球事件的趨勢,并將這種做法與俄羅斯軍事干預的行動能力聯系起來。盡管作為國家活動的外交活動和軍事信號早在信息時代之前就已存在,但本文評估了這些工具在現代環境中的使用情況。了解俄羅斯將如何試圖干預或阻止外界對世界各地的政治和軍事危機的反應是至關重要的,因為政治限制可能仍然是信息時代軍事決策的最重要的限制因素,特別是對民主國家的軍隊,如北約成員。
為了逆向設計顏色革命,俄羅斯的國策越來越多地利用其境外的社會裂痕和暴力來削弱其對手并夸大其作為大國的偽裝。本文利用2019-2020年俄羅斯言論數據庫,調查了俄羅斯國家宣傳如何利用海外暴力事件來推進這一議程;然后將這種言論與當代俄羅斯的軍事行動和現代化進行比較,以評估宣傳活動是否與俄羅斯的作戰能力相關。這允許對俄羅斯在世界各地的暴力事件中的言行進行比較。
本文沒有調查俄羅斯信息戰政策在每個暴力事件中的具體動機,而是局限于分析俄羅斯外交和軍事政策的表達。通過研究不同地域的宣傳和行動的頻率,不管是什么原因,本文突破了俄羅斯信息戰的刻意混淆性質,顯示了某些可量化的模式。
本文發現有證據表明,俄羅斯通過宣傳和軍事力量的展示,將歐洲挑出來進行恫嚇。如果排除烏克蘭這個例外情況,俄羅斯的宣傳和軍事示威的全球分布在地區和聯盟關系上都有相當強的相關性。同樣,與美國的主要非北約盟國(MNNA)、俄羅斯的盟國或不結盟國家相比,俄羅斯的憤怒似乎主要針對北約成員國。然而,如果將其分解到除美國以外的各個北約成員國的層面上,這種關聯性就不那么明顯了。
人工智能領域的進展繼續擴大這組技術的潛在軍事應用范圍。本文探討了信任在人機聯合作戰中的關鍵作用,以及依靠人工智能來補充人類認知的潛在影響。如果依靠人工智能來準確處理傳感器數據,操作自主系統和平臺,或通過擬議的作戰概念(如以決策為中心的戰爭)提供有利的決策支持,設想機器智能的中央指揮和控制作用,那么信任機器智能將是未來作戰中的一個關鍵組成部分。鑒于這些技術和理論的發展,信任的概念對于機器智能在戰術和作戰層面的軍事行動中的使用變得高度相關,正確校準的信任水平是安全和有效行動的基礎。在簡要回顧了機器智能的最新進展和對信任概念的探索之后,本文概述了人工智能在戰場上的當前和潛在應用,以及由不充分或不合理的高信任度帶來的挑戰。
縱觀歷史,技術已經擴大了武裝沖突的領域,戰術交戰的節奏,戰場的地理范圍,以及指揮官與部隊溝通的手段。技術創新--包括軍事和民用--改變了軍隊的作戰方式以及國家計劃和進行這些沖突的方式。在21世紀,迄今為止,很少有進步能像統稱為人工智能(AI)的一組技術那樣獲得如此多的關注。人工智能正準備迎來一個新的時代,在這個時代,機器智能和自主性正在為軍事行動的規劃和執行產生明顯的新概念。算法戰爭可能會帶來一些獨特的東西:增強甚至取代人類決策過程的系統,其速度可能超過人類規劃者的認知能力。
新興技術的整合提出了任何數量的基本組織和倫理問題,值得關注。本文將采用定性的社會科學方法,重點討論人類-自治團隊(HAT)的一個重要方面:鼓勵對機器智能的適當信任程度。有大量的學術文獻關注自動化或機器人技術中的信任問題,但有關具體軍事應用的工作較少。當人工智能在聯合作戰中被實際部署時,在信任方面有哪些挑戰和機會?在簡要回顧人工智能和概述機器智能在戰場上的可能應用之后,本文在分析鼓勵適當信任水平的陷阱和潛在解決方案之前,探討了信任和信任校準的概念。
幾十年來,人類一直對賦予機器某種形式的人工智能的可能性著迷,Nils Nilsson將其定義為 "致力于使機器智能化的活動,而智能是使一個實體在其環境中適當運作并具有預見性的品質"。在數字時代的早期,出現了兩種廣泛的人工智能方法。自上而下的專家系統方法使用復雜的預編程規則和邏輯推理來分析一個特定的數據集。對于具有可預測規則的明確定義的環境--諸如分析實驗室結果或下棋等應用--專家系統或 "符號 "人工智能(基于符號邏輯)的性能主要取決于處理速度和算法的質量。另一大類使用自下而上的機器學習方法,模擬人類通過檢測數據中的模式進行學習的方式。神經網絡是一種以人腦為模型的機器學習形式,能夠通過使用多個(因此是 "深")人工神經元層來識別復雜的模式,是被稱為 "深度學習 "的技術的基礎。通過其在數據集中尋找關系的能力,這種技術也被稱為 "連接主義"。
自上而下、基于規則的符號系統和自下而上的機器學習連接主義技術之間的差異是很大的,特別是關于它們的潛在應用范圍和靈活性。深度學習方法的顯著特點是能夠將學習與它所訓練的數據集分開,因此可以應用于其他問題。基于規則的算法可以在狹義的任務中表現得非常好,而深度學習方法能夠迅速找到模式,并在 "蠻力 "專家系統計算方法無效的情況下有效地自學應用。最近的一些人工智能進展顯示了模仿創造力的能力,產生了有效的解決問題的方法,這些方法對人類來說可能是反直覺的。
然而,總的來說,人工智能仍然是狹窄的或 "脆弱的",即它們在特定的應用中功能良好,但在用于其他應用時仍然不靈活。與人類的認知相比,鑒于機器的計算速度遠遠超過人腦,機器智能在將邏輯規則應用于數據集時要優越得多,但在嘗試歸納推理時,它必須對數據集或環境進行一般性的觀察,這就顯得不足。大多數機器學習仍然需要大量的訓練數據集,盡管新的方法(包括生成對抗網絡(GAN)和 "小于一次 "或LO-shot學習)正在出現,需要非常小的數據集。圖像識別算法很容易被混淆,不能像人類那樣立即或直觀地理解情景背景。這種脆性也延伸到了其他問題,比如游戲。雖然人工智能在視頻游戲中經常表現出超人的能力,但他們往往不能將這種專業知識轉移到具有類似規則或玩法的新游戲中。
雖然人工智能技術繼續在變得更加適應方面取得重大進展,但任何接近人類的人工通用智能仍然難以實現。評估人工智能的近期前景因該技術的漸進式進展而變得更加復雜。圍繞著人工智能的炒作--在很大程度上被深度學習方法的成功所推動--既導致了對該技術未來的不切實際的期望,也導致了對其非常大的進展的正常化。正如一份報告所指出的,"人工智能將一項新技術帶入普通人的視野,人們對這項技術習以為常,它不再被認為是人工智能,而出現了更新的技術"。盡管象征性的人工智能和各種形式的機器學習構成了該領域最近的大部分進展,也許除了融合這兩種方法的嘗試之外,未來仍然不確定。一些人猜測,機器學習技術帶來的進展可能會趨于平穩,而另一些人則保持樂觀。相關的技術進步,如短期內的計算機芯片設計和長期內的量子計算,可能會影響進一步進展的速度。
同步使用針對所有社會職能中的特定漏洞而定制的多種權力工具,以實現協同效應。混合作戰入侵者將尋求利用目標國家的弱點。每一個混合戰爭入侵者可能有獨特的能力,可用于打擊目標國家。戰爭的“奇襲”原則可能是混合攻擊成功的最大因素。
?世界各地的軍隊正在根據戰爭的發展開發、集成和使用機器人和自主系統 (RAS)。需要進一步思考這一過程在荷蘭境內發生的條件以及可能產生的挑戰和影響。HCSS 項目“軍事背景下的 RAS”試圖為這一討論做出貢獻。
在兩年的時間里,該項目產生了五篇公共研究論文,涵蓋了與在軍事背景下實施 RAS 相關的一系列主題。這些研究論文涵蓋了軍事適用性、倫理考慮、法律論述、合作要求以及 RAS 在軍事環境中的實施。所有論文都合并在此報告中,包括簡要總結分析的綜合報告和一系列六份情況說明書。 研究方法側重于獲取從業人員、研究人員、倫理學家、法律專家、行業專業人士、技術人員、民間社會組織、軍事人員和國防界其他成員的專業知識。這樣做不僅能夠收集對主題的多方面理解,而且還能將這些利益相關者獨特地聯系在一起,并促進他們之間具有挑戰性的討論。在項目過程中,與不同的咨詢委員會成員舉行了五次會議,指導了研究軌跡,并為其立場文件和研究論文草稿提供了寶貴的意見。還收集了來自 200 多名利益相關者的專業知識,參加了六場專家會議,其中涉及各種方法,包括基于場景的討論、設計會議、
次要目標是為公眾辯論提供信息,并在抵制流行的“殺手機器人”觀念的軍事背景下就 RAS 進行更細致的對話。為此,舉辦了關于 RAS 的道德困境的公開研討會,與 BNR Nieuwsradio 合作發布了五個 De Strateeg 播客,組織了會議和圓桌會議,并于 2021 年 2 月發布了一部 18 分鐘的紀錄片。
引 言
2019 年 12 月,普京在俄羅斯國防部董事會會議上發表講話時表示,“機器人系統和無人機正在被嚴格引入并用于戰斗訓練,這極大地提高了武裝部隊的能力。”幾個月后,俄羅斯國防部宣布了一項價值約 420 萬歐元的封閉招標,旨在“研究為新一代人工智能軍事系統創建神經網絡開發、訓練和實施的實驗模型”。雖然中國在公開場合遠沒有那么自夸,但他們的軍事優勢戰略是由人工智能和自動化的發展引領的,這導致一些分析人士認為,解放軍的目標是通過系統沖突和高度智能化的戰爭來主導。
這些觀點意味著一個更大的現象。世界各地的軍隊正在根據戰爭的第四次演變開發、整合和使用機器人和自主系統,需要進一步思考在荷蘭境內進行這一過程的條件以及可能出現的挑戰和影響作為結果。
HCSS 項目“軍事背景下的 RAS”試圖為這一討論做出貢獻。在兩年的時間里,該項目產生了五篇公共研究論文,涵蓋了與在軍事背景下實施 RAS 相關的一系列主題。該綜合將這些主題聯系在一起,并展示了該項目最相關的發現。下面總結了 HCSS 研究對道德要求、法律話語、合作伙伴合作、實施和概念開發和實驗的觀察,然后是關于 RAS 的軍事適用性的初級部分。
RAS的軍事適用性
機器人和自主系統 (RAS) 在軍事環境中提供了大量、重要且影響深遠的機會。為了觀察這些系統在這種情況下的適用方式并評估它們的效用,需要解決一些定義和概念:
1 自主性:人類賦予系統執行給定任務的獨立程度。根據系統自身的態勢感知(綜合感知、感知、分析)、規劃和決策,實現分配任務是自治的條件或質量。自主性是指一系列自動化,其中可以針對特定任務、風險水平和人機協作程度定制獨立決策。自主級別可以包括遠程控制(非自主)、操作員協助、部分自動化、條件自動化、高度自動化或完全自動化。
2 機器人:能夠通過直接的人工控制、計算機控制或兩者兼而有之來執行一組動作的動力機器。它至少由平臺、軟件和電源組成
3 機器人和自主系統 (RAS):RAS 是學術界和科學技術 (S&T) 社區公認的術語,強調這些系統的物理(機器人)和認知(自主)方面。RAS 是一個框架,用于描述具有機器人元素和自主元素的系統。值得注意的是,RAS 的每個連續部分都涵蓋了廣泛的范圍。“系統”部分指的是廣泛(在我們的例子中為軍事)應用領域的各種物理系統。在計算機或網絡上運行的自動化軟件系統,包括“機器人”,即無需人工干預即可執行命令的軟件,不符合 RAS 的條件,因為它們缺少物理組件。“機器人”部分,指的是系統的物理布局,認為系統是無人或無人居住的。所有其他物理方面(大小、形式,無論是飛行、漂浮還是滾動等)都保持打開狀態。
4 致命自主武器系統 (LAWS):一種武器,在沒有人為干預的情況下,根據人為部署武器的決定,在沒有人為干預的情況下選擇和攻擊符合某些預定義標準的目標,因為攻擊一旦發動,人為干預就無法阻止。
5 有意義的人類控制(MHC):MHC 包括(至少)以下三個要素:(1)人們就武器的使用做出知情、有意識的決定;(2) 人們被充分告知,以確保在他們對目標、武器和使用武器的背景所了解的范圍內,使用武力符合國際法;(3) 所討論的武器是在現實的操作環境中設計和測試的,并且相關人員已經接受了足夠的培訓,以便以負責任的方式使用武器。MHC 是一個復雜的概念,在許多情況下,上述描述并不是決定性的。荷蘭官方的立場是,“所有武器,包括自主武器,都必須保持在有意義的人類控制之下。”
“殺手機器人”的言論已將公眾對軍事環境中機器人和自主系統的看法縮小為完全關于高度或完全自主系統使用致命武力的觀點。實際上,RAS 可應用于眾多軍事功能和任務,每個功能具有不同程度的自主性(見下圖)。機器人和自主系統的廣泛軍事適用性產生了無數和巨大的機會。未來幾年的挑戰是充分利用這些機會,發揮軍事優勢的潛力,同時降低所帶來的風險。
在這些功能中實施 RAS 會帶來重大挑戰,但也預示著軍隊將面臨更有效、更高效和更敏捷的新機遇。可以根據這些類別評估 RAS 繼續改進/再改進國防領域的潛力。
速度。在促進快速決策和威脅優先級排序的人工智能的幫助下,RAS 已經能夠超越人類的反應時間并縮短 OODA(觀察、定位、決定、行動)循環。
可靠性。將任務委派給機器需要高度的信任,但到目前為止,RAS 還不能證明在所有軍事應用領域都有足夠的可靠性。然而,我們對這些系統的信心將會增加,因為它們證明了它們在執行特定任務時的可靠性和有效性。
準確性。人工智能系統的面部圖像識別和感官能力已經超過了人類的表現水平,盡管無人系統比人類操作員更精確的說法受到廣泛爭議。
大規模效應。由于射程和耐力的增加,RAS 有能力增強對戰場的覆蓋范圍并壓倒對手。這種潛力的最好例子是“蜂擁而至”。
可達性。RAS 極大地增強了監視、情報、偵察和武器系統的可用存在點。
穩健性。在短期內,由于惡劣的天氣和任務的變化等意外條件,RAS 將比人類更容易失敗。這種脆弱性延伸到虛擬域:由于連接丟失、黑客攻擊和其他干擾可能導致系統無法運行。
安全。RAS 可以執行“枯燥、危險和骯臟”的任務,以便人類可以專注于更專業的任務并遠離火線。
成本。盡管最先進技術的獨家使用權將保留給最富有的玩家,但現在被認為是高度先進的系統的成本將在未來 20 年內下降,從而變得更加普及。
維護。考慮到系統的復雜性和涉及的多個(外部)合作伙伴,更新和升級 RAS 軟件和硬件可能會更加困難。
時間效率。RAS 可以 24/7 全天候高標準執行乏味且重復性的監控任務,無需休息,高效解決后勤規劃,快速超越人工多任務處理的極限。
靈活性。盡管 RAS 目前在執行特定任務方面表現出色,但在可預見的未來,人類仍將是最靈活的。隨著開發人員繼續創新當前系統,這種動態可能會發生變化。
適應性。RAS 具有高度自適應性,并且隨著時間的推移在系統生命周期(擴展、擴展、升級等)期間易于重新配置,以便跟上動態環境中出現的新要求。
外部合法性。因此,軍方與 RAS 的接觸必須在他們(可能)提供的先進能力與其所服務的社會的價值觀和規范之間取得平衡。
內部合法性。RAS 的信任和組織規范化將隨著時間的推移而得到加強。隨著對系統的理解、可預測性和熟悉度的提高,它們在組織內的合法性將得到鞏固。
許多國家認識到這種潛力并意識到需要在瞬息萬變的國際舞臺上具有軍事競爭力,因此將 RAS 用作其武裝部隊的一部分(圖 2)。然而,盡管有明顯的機會,但在軍事環境中實施 RAS 并非易事。許多實際和理論挑戰阻礙了實施過程,需要政策制定者、創新者、研究人員、國防界和民間社會成員之間的討論,在許多情況下,這些挑戰考驗著我們賴以監管、開發、獲取、整合和使用其他軍事技術。為了分析這些挑戰,重要的是確定 RAS 系統生命周期的三個階段:開發、集成和使用(圖 3)。下一節總結了在 HCSS RAS 項目期間探索和分析的理論考慮(道德和法律)和實際考慮(私營部門合作和概念試驗與開發)。
RAS的開發是一個硬件和軟件設計和生產的動態過程,在后期根據系統測試、集成、監控和使用的結果不斷地重新審視。RAS的設計和開發需要國防部門和私營部門之間更深入的互動與合作。因此,私營部門在塑造 RAS 生命周期的發展階段和解決與該階段相關的理論和實踐考慮方面發揮著關鍵作用。
這一階段涉及 RAS 的組織嵌入,由此與系統開發者/生產者的關系發生變化,新的參與者(例如實際的軍事最終用戶)出現或獲得更主導的角色。在這個階段,“交接”變化的性質引發了關于不同參與者角色的新問題。
在作戰環境中使用 RAS 會影響軍隊的工作方式、與誰合作以及在什么條件下工作。這是因為相關系統的更大自主性促使操作員和指揮官以“更高的抽象層次”與系統進行交互。除了部署之外,這個階段還包括RAS的維護和服務。
結 論
機器人和自主系統代表了軍事領域的轉變。它們提供了顯著的軍事能力,以擴大軍事行動的質量、范圍、效率和安全性,并正在改變我們現在和未來對抗沖突的方式。RAS 功能正在實施,不僅是荷蘭武裝部隊,還有我們的潛在對手。技術、運營、法律和道德問題,以及這種新興技術的潛在擴散是復雜且相對較新的。
隨著新發展的出現和在運營使用過程中獲得經驗,我們概念化、設計、建造和運營 RAS 的方式將需要反復重新考慮。這也意味著需要不斷的知識開發、概念開發和實驗。為了充分了解 RAS 的潛力及其作為軍事工具箱中重要戰略工具的要求,必須在操作環境中進行實際測試。
要讓行業充分參與這些市場,在這個快速發展的領域中共同開發和共同試驗需要不同的思維方式。在產品完全成熟并且操作使用表明它們被充分理解和可預測之前,RAS 將需要通過短周期創新過程進行不斷調整。
在軍事背景下開發和實施 RAS 將需要持續關注、創造性的大局思維以及與利益相關者(包括政策制定者、學者、倫理學家、律師、行業專業人士、技術人員、民間社會和國防界)的強大合作網絡。