軍事環境產生了大量的重要數據,需要使用機器學習對其進行處理。它通過分析產生的大量信息來學習和預測可能的場景的能力提供了自動學習和決策支持。本文的目的是提出一種應用于軍事組織的機器學習體系結構模型,并以應用于非軍事組織體系結構模型的文獻計量學研究為支撐。為此,進行了截至2021年的文獻計量學分析,制作了戰略圖并對結果進行了解釋。所使用的信息是從科學界廣泛接受的一個主要數據庫ISI WoS中提取的。沒有直接使用軍事消息來源。本工作分為五個部分: 軍事領域的機器學習研究; 使用SciMat、Excel和VosViewer工具解釋我們的研究方法; 該方法基于數據挖掘、預處理、聚類歸一化、戰略圖及其結果分析來研究軍事背景下的機器學習; 在此基礎上,我們提出了一種軍事應用的概念架構; 最后,我們給出結論,在這里我們將看到機器學習最重要的領域和最新的進展,在這個例子中,應用到軍事環境中,分析大量數據,提供效用,機器學習和決策支持。
機器學習(ML)通過利用來自不同來源(包括大數據應用程序)的大量可用信息,實現了許多任務的自動化。它的使用目前正在廣泛的傳播,而ML已經成為我們日常生活中[1]的重要組成部分。在軍隊中,智能應用的使用也加速了[2]的發展。例如,韓國國防部大幅增加了其信息,隨著越來越少的情報分析師,他們需要應用人工智能(AI)技術來準確、及時地處理所有信息[3]。另一個值得注意的例子是軍事設備和機器對石油的依賴。這也是ML發揮作用的地方,因為軍事后勤必須基于明智的推理[4];因此,我們看到了ML是如何融入軍事世界的。本文的目的是提出一個體系結構模型,以反映如何在軍事環境中實際應用數學模型。在這個架構中,我們解決了在軍事環境中使用最頻繁的數據、算法和應用等方面的問題。
在開展這項工作的同時,正如我們將在第2節中看到的,我們研究了相關工作,注意到在這一新興主題中很少有綜述工作,這引起了我們對對主要科學數據庫之一Web of Science進行到2021年及包括2021年的文獻計量分析的興趣。在本節中,我們還提出了一個概念架構,以一種實際的方式在非軍事組織中應用ML,因為在軍事領域中沒有反映這種架構的作品。本工作中使用的文獻計量方法在第3節中解釋,我們將主要使用SciMat文獻計量分析工具,能夠在一個縱向框架[5]中執行科學的繪圖分析。通過這一分析,我們建立了一個戰略圖,其中我們確定了ML應用于軍事領域的主要領域。在第4節中,我們應用所描述的方法來根據起源進行分析:我們看到了ML應用于軍事世界的主要科學領域; 在第5節中,一旦完成了文獻計量分析,我們現在可以重新定義第2節中提出的概念架構,特別是針對軍事組織。最后,我們得出了一些結論,其中我們揭示了所獲得的結果與發現的主要主題領域和結論。
圖1 用于軍事組織的數據驅動架構
2022年5月9日蘭德公司發布《利用機器學習進行作戰評估》報告。作者描述了一種利用機器學習來支持軍事作戰評估的方法。他們展示了如何利用機器學習從情報報告、作戰報告以及傳統和社會媒體中的非結構化文本中快速、系統地提取與評估相關的見解。這些數據已經由作戰級別的總部收集,通常是關于當地居民、敵人和伙伴部隊的最佳可用信息來源,但很少被納入評估,因為它們的結構不容易被分析。本報告中描述的機器學習方法有助于克服這一挑戰。
本報告中描述的方法,作者利用最近結束的針對上帝抵抗軍的戰役進行了說明,使評估小組能夠向指揮官提供關于戰役的近乎實時的見解,這些見解是客觀的,與統計學相關。這種機器學習方法可能特別有利于資源有限或沒有具體評估數據的戰役,這在資源有限或被拒絕地區的戰役中很常見。這種機器學習的應用對大多數評估小組來說應該是可行的,并且可以通過公開和免費的機器學習工具來實現,這些工具已被授權在美國國防部系統上使用。
如何利用機器學習工具將現有的情報報告、作戰報告和環境數據(如社交媒體、傳統媒體)納入戰爭行動層面的評估?
準確和及時的評估--提供關于哪些是有效的,哪些是無效的,以及如何改進作戰的反饋--是所有美國軍事作戰的一個關鍵要求。對軍事作戰的評估是圍繞戰役的作戰目標進行的,評估過程的重點是確定在實現這些目標方面是否正在取得進展。評估小組--最好是與指揮小組一起--確定與每個目標相關的預期效果,然后制定有效性措施(MOE),以跟蹤實現這些目標的進展。
獲得和處理正確的數據類型對于產生相關和可辯護的評估至關重要,這也是本報告的主題。有效的評估要求數據是客觀的、縱向的、與軍事作戰希望達到的效果類型相關的、有適當的評估結構,并且有足夠的時間頻率來支持決策。
在以前的研究中,我們為特種作戰部隊(SOF)的作戰評估開發了一種標準化的方法,我們發現作戰總部已經收集的各種數據與評估有關,但很少被使用。三種類型的數據--情報報告(如來自人類情報或信號情報來源)、作戰報告(如情況報告[SITREPs])和環境數據(如社交媒體)中已有的對正在發生的事件的文字描述,往往是有關當地居民、敵人和伙伴部隊的最佳可用信息來源。然而,這些數據的結構很少能被輕易地納入評估過程。
本報告描述了一種方法,即如何利用機器學習(ML)工具將這些現有數據納入作戰評估。我們展示了一個基于ML的文本分類器如何快速整理和準備這些數據,以便使用評估小組常用的標準統計工具進行后續分析。然后,我們使用最近結束的針對上帝抵抗軍的作戰數據來說明這一方法。這種基于ML的方法對大多數評估小組來說應該是可行的,并且可以用公開和免費提供的ML工具來實施,這些工具已被預先授權用于美國國防部(DoD)的機密系統。
本報告所描述的方法使評估小組能夠準確、及時地了解一場戰役,為指揮官提供近乎實時的、客觀的、與統計學相關的結果。可以使用我們的方法分析的每一種類型的數據--情報、作戰和環境--為理解一個戰役的效果提供了一個不同的視角。在有評估特定數據(如投票)的軍事作戰中,這些新的數據來源使評估小組能夠對調查結果進行三角測量,提高評估的可靠性。然而,ML工具在評估專用數據有限或沒有的情況下特別有用--這在資源有限或在被拒絕地區的作戰中很常見。
我們的分析集中在一個具體ML評估應用上:使用 "有監督機器學習"(SML),從現有的情報、作戰和環境報告中的非結構化文本中構建一個可供評估的數據庫。SML的這種應用的直覺是相對簡單的。首先,人類分析員通過手工審查和分析可用的非結構化文本的一個子集。這第一步的輸出通常被稱為 "訓練數據"。然后,ML算法分析這個訓練數據,并試圖模仿人類分析師對所有剩余文本使用的相同分析過程。
這種方法允許評估小組系統地編輯非結構化文本中的信息--每份報告中提供的定性描述成為客觀和定量評估中的單一數據點--然后檢查這些信息如何隨時間演變。這種方法是將ML納入評估過程的最簡單方法,但它仍然是一種有效的方法,可以從這些現有數據中信息豐富的非結構化文本中獲得與評估相關的見解。
在本報告中,我們詳細說明了一個五步工作流程,并在圖S.1中進行了總結,評估小組可以按照這個流程將SML納入評估過程。
圖S.1 用于評估工作流的監督機器學習
第1步是整理大量的潛在相關報告--通常是數以千計的年度報告(或更多)--可用于大多數業務。這個整理過程包括刪除不必要的重復內容,并將數據重新組織成適合ML算法分析的格式。在我們的方法中,現有報告中的非結構化文本被分為單句,然后分析其與競選活動的相關性。
第2步是制定適合每個相關MOE的編碼標準。這些編碼標準是歸納出來的,評估小組首先審查現有的數據,以確定哪些MOE是可以用現有的數據衡量的。然后,評估小組制定具體的編碼標準--也就是一套規則,說明什么時候一份報告應該被認為與該MOE相關(或不相關)。至關重要的是,這些編碼標準要足夠清晰和詳細,以便于復制,使不同的分析員在應用這些標準時產生幾乎相同的結果。本報告為每一類數據(情報、作戰和環境)提供了常用的MOE的編碼標準樣本,盡管具體的編碼標準必須是針對作戰的。
第3步是準備訓練數據,這是SML方法中ML算法的主要輸入。這些訓練數據是整體非結構化數據的一個子集,由評估小組使用步驟2中制定的編碼標準進行審查、分析和編碼。確保編碼標準的穩健性和可復制性是開發這些訓練數據的一個關鍵組成部分,因為ML算法試圖復制人類分析員的編碼。
第4步是實現和校準一個或幾個選定的ML算法。校準過程包括審查由ML算法編碼的報告,以驗證其準確性--也就是說,即確保被識別為相關的報告確實是相關的。如果算法表現不佳,評估小組需要調整算法參數或擴大訓練數據的數量。在一個實際的活動中,這個校準過程應定期重復,以確保算法在更多的數據可用時仍然表現良好。
第5步,評估小組處理來自ML算法的輸出,以整合到評估過程中。ML算法的輸出是一個結構化的數據庫(例如,Excel),確定所有滿足步驟2中制定的編碼標準的報告。這種通用的結構化格式允許用評估小組常用的工具進行分析,并便于插入現有的態勢感知工具中。在某些情況下,可以直接分析這些數據,以產生報告在一段時間內的趨勢線,例如,以正面方式討論一個實體(如敵人或伙伴部隊)的社交媒體報告的百分比與以負面方式討論它的數量相比。在其他情況下,這些數據需要與報告中的其他信息相結合--例如,提取特定地點的信息可以使評估小組生成不斷變化的敵人作戰自由地圖。
機器學習可以成為支持作戰評估的有力工具
我們的研究確定了五個建議,這些建議將提高基于ML的評估方法的價值。
建議1:在受控演習中驗證SML方法。本報告所描述的方法是特意設計的,以使評估小組盡可能容易復制,而且該方法的設計依靠的是既免費又已被批準在許多軍事網絡上使用的工具。然而,盡管我們已經用實際作戰測試了我們的方法,但我們并沒有試圖在實時或與軍事分析員團隊一起做這件事。因此,我們建議利用實戰演習,但在受控條件下驗證各項要求--如任務前培訓、人員配置、分析工具的可用性和必要的數據訪問。
建議2:探索如何利用無監督的ML為作戰評估提供信息。無監督的ML可以提供一種工具,用于發現戰役活動和這些活動的行動目標之間的未預期模式。經過評估小組的審查,這些信息可以為指揮官提供一個寶貴的工具,用來探索未預料到的模式。考慮到我們的任務是探索如何利用ML將現有數據用于評估,我們沒有詳細研究將無監督ML納入評估的實用性或價值。
建議3:對作戰報告實施適度的標準化。SITREP和其他作戰報告往往是關于伙伴部隊活動和能力的唯一最佳歷史數據來源,而且這種報告還可以提供關于美國部隊活動的詳細歷史記錄。這些特點使作戰報告成為評估小組潛在的有力工具--特別是如果有ML(或類似的)工具可以快速提取與評估有關的信息--但這種報告在質量和細節上并不一致。我們建議對這種作戰報告進行適度的標準化。要求(簡單地)戰術部門持續討論其伙伴部隊的活動和能力。
建議4:改善歷史情報和作戰報告的歸檔、發現和提取。獲取和提取本報告所述方法所需的相關情報和作戰報告在現有系統中并不容易。對于情報報告,我們建議在現有系統中增加快速提取縱向數據(如三個月或更長時間的數據)的能力,以滿足一組特定的搜索參數(如地理、布爾邏輯),其中包括報告全文和一些關于數據的基本描述性信息(日期、來源等)。對于業務報告,我們建議業務層面的總部確保所有下屬總部的SITREPs被系統地歸檔。
建議5:擴大專業軍事教育中要求的具體評估討論。盡管承認評估對軍事行動的重要性,但在向聯合部隊提供的與評估有關的教育和培訓方面存在重大差距。因此,評估小組往往難以提供指導有效決策所需的信息,而作戰級總部的其他工作人員往往缺乏經驗。
機器學習是現代戰爭系統的關鍵組成部分。本文探討了人工智能的 7 個關鍵軍事應用。
機器學習已成為現代戰爭的重要組成部分,也是我(Nicholas Abell)作為陸軍退伍軍人和數據科學家的主要興趣點。與傳統系統相比,配備人工智能/機器學習的軍事系統能夠更有效地處理大量數據。此外,人工智能由于其固有的計算和決策能力,提高了作戰系統的自我控制、自我調節和自我驅動能力。
人工智能/機器學習幾乎被部署在所有軍事應用中,軍事研究機構增加研發資金有望進一步推動人工智能驅動系統在軍事領域的應用。
例如,美國國防部 (DoD) 的國防高級研究計劃局 (DARPA) 正在資助一種機器人潛艇系統的開發,該系統預計將用于從探測水下水雷到參與反潛行動的各種應用。此外,美國國防部在 2017 財年在人工智能、大數據和云計算方面的總體支出為 74 億美元。預計到 2025 年,軍事 ML 解決方案的市場規模將達到 190 億美元。
以下是機器學習將在未來幾年證明其重要性的七種主要軍事應用。
來自全球不同國家的國防軍隊正在將人工智能嵌入陸地、海軍、空中和太空平臺上使用的武器和其他系統中。
在基于這些平臺的系統中使用人工智能,可以開發出更少依賴人工輸入的高效作戰系統。它還增加了協同作用,提高了作戰系統的性能,同時需要更少的維護。人工智能還有望使自主和高速武器能夠進行協作攻擊。
軍事系統通常容易受到網絡攻擊,這可能導致機密軍事信息丟失和軍事系統損壞。然而,配備人工智能的系統可以自主保護網絡、計算機、程序和數據免受任何未經授權的訪問。
此外,支持人工智能的網絡安全系統可以記錄網絡攻擊的模式,并開發反擊工具來應對它們。
人工智能有望在軍事后勤和運輸中發揮關鍵作用。貨物、彈藥、武器和部隊的有效運輸是成功軍事行動的重要組成部分。
將人工智能與軍事運輸相結合可以降低運輸成本并減少人力工作負荷。它還使軍用艦隊能夠輕松檢測異常并快速預測組件故障。最近,美國陸軍與 IBM 合作,使用其 Watson 人工智能平臺來幫助預先識別 Stryker 戰車的維護問題。
正在開發人工智能技術以提高復雜戰斗環境中目標識別的準確性。這些技術使國防軍隊能夠通過分析報告、文檔、新聞提要和其他形式的非結構化信息來深入了解潛在的作戰領域。此外,目標識別系統中的人工智能提高了這些系統識別目標位置的能力。
支持人工智能的目標識別系統能力包括基于概率的敵人行為預測、天氣和環境條件匯總、潛在供應線瓶頸或漏洞的預測和標記、任務方法評估以及建議的緩解策略。機器學習還用于從獲得的數據中學習、跟蹤和發現目標。
例如,DARPA 的競爭環境中的目標識別和適應 (TRACE) 計劃使用機器學習技術在合成孔徑雷達 (SAR) 圖像的幫助下自動定位和識別目標。
在戰區,人工智能可以與機器人手術系統 (RSS) 和機器人地面平臺 (RGP) 集成,以提供遠程手術支持和疏散活動。美國尤其參與了 RSS、RGP 和其他各種用于戰場醫療保健的系統開發。在困難條件下,配備人工智能的系統可以挖掘士兵的病歷并協助進行復雜的診斷。
例如,IBM 的 Watson 研究團隊與美國退伍軍人管理局合作開發了一種稱為電子病歷分析器 (EMRA) 的臨床推理原型。這項初步技術旨在使用機器學習技術來處理患者的電子病歷,并自動識別和排列他們最嚴重的健康問題。
模擬與訓練是一個多學科領域,它將系統工程、軟件工程和計算機科學結合起來構建計算機模型,使士兵熟悉在軍事行動中部署的各種作戰系統。美國正在越來越多地投資于模擬和訓練應用。
美國海軍和陸軍都在進行戰爭分析,啟動了幾個傳感器模擬程序項目。美國海軍已經招募了 Leidos、SAIC、AECOM 和 Orbital ATK 等公司來支持他們的計劃,而美國陸軍的計劃得到了包括 SAIC、CACI、Torch Technologies 和 Millennium Engineering 在內的公司的支持。
威脅監控和態勢感知在很大程度上依賴于情報、監視和偵察 (ISR) 工作。ISR 行動用于獲取和處理信息以支持一系列軍事活動。
用于執行 ISR 任務的無人系統既可以遠程操作,也可以按照預先定義的路線發送。為這些系統配備人工智能有助于防御人員進行威脅監控,從而提高他們的態勢感知能力。
具有集成 AI 的無人駕駛飛行器 (UAV) - 也稱為無人機 - 可以巡邏邊境地區,識別潛在威脅,并將有關這些威脅的信息傳輸給響應團隊。因此,使用無人機可以加強軍事基地的安全,并提高軍事人員在戰斗中或偏遠地區的安全性和效率。
人工智能在軍事技術硬件和軟件的大規模采用,向我們展示了現代戰爭中令人難以置信和可怕的范式轉變。毫不奇怪,世界上最大的軍隊比其他任何事情都更加關注這項技術,而這場技術競賽的獲勝者可能會比美國在研制原子彈后擁有更多的全球影響力。 (作者:Nicholas Abell,美國陸軍退伍軍人)
摘要 知識圖譜以語義網絡的形式將客觀世界中概念、實體及其之間的關系進行結構化描述,提高了人類從數據中抽取信息、從信息中提煉知識的能力。該文形式化地描述了知識圖譜的基本概念,提出了知識圖譜的層次化體系架構,詳細分析了信息抽取、知識融合、知識架構、知識管理等核心層次的技術發展現狀,系統梳理了知識圖譜在軍事領域的應用,并對知識圖譜未來發展的挑戰和趨勢進行了總結展望。
?美國國防部已經可以開始應用其現有的國際科技協議、全球科學網絡以及在多邊機構中的作用來促進數字國防合作。本報告將這些選項集合構建為軍事人工智能合作工具箱,可為調整政策、推進研究、開發和測試以及連接人員提供了有價值的途徑。
美國將人工智能 (AI) 的領導地位視為提升其在國際體系中的戰略地位和保持其未來軍事優勢的關鍵。美國的盟友和伙伴網絡是服務于這些目標的不對稱資產,正如旨在讓美國為當前戰略競爭時代做好準備的國家安全和國防政策所確認的那樣。
最值得注意的是,美國國防部 (DOD) 人工智能戰略中宣布的關鍵舉措和國家安全委員會關于人工智能的建議表明了國際參與對人工智能安全、安保、互操作性和與民主價值觀保持一致的重要性。
簡而言之,人們一致認為,加強聯盟和伙伴關系很重要,不僅因為美國在聯盟中行動,而且因為俄羅斯等經常單獨行動。由于技術加速如何推動軍事進步、刺激經濟增長和塑造21世紀的治理模式,人工智能和其他新興技術是與這些近乎同等競爭對手競爭的核心。如果不深化與盟友和伙伴的合作,美國既無法應對大國帶來的挑戰,也無法從塑造人工智能的民主軌跡中獲益。
在此背景下,本報告重點關注通過基于可互操作部隊和尖端技術的強大軍事關系,維護美國及其伙伴和盟國網絡相對于潛在對手的優勢的必要性。國防部已經擁有多種工具可用于深化與其盟國和國際安全伙伴的科技(S&T)合作。但為了充分利用它們在人工智能方面的潛力,該部門需要重新設想并更好地整合它們。
為此,此處的分析將現有的國防科技協議、軍事科技交流和多邊機構的要素構建為軍事人工智能合作工具箱。這項工作不僅僅是為人工智能能力開發集中資源,還包括政策調整;測試、評估、確認和驗證 (TEVV) 管道;研發(R&D)、人員交流;數據共享;和標準化。這里的目的不是提出新的協議,而是回答國防部如何利用其現有的科技合作機制來支持數字時代的軍事合作,確保相關資源和框架在尋求人工智能領導力和未來時不會被利用聯軍成功。
雖然應該承認挑戰,包括圍繞數據交換的敏感性和對技術政策的不同政策觀點,但隨著時間的推移,它們也可以成為合作以減輕這些障礙的動力。換言之,現有工具有助于在政治信任、凝聚力和互操作性方面獲得更多支持,從而使合作有助于應對數字威權主義和技術驅動的國際安全環境變化的共同挑戰。 主要發現是:
雖然軍事人工智能合作的某些方面可能需要新的投資、機制和協議,但這不應該排除現有工具可以用于新用途的多種方式。軍事人工智能合作工具箱之所以有吸引力,正是因為它可以在短期內啟動,滿足與盟友和伙伴盡早建立互操作性和推進人工智能的緊迫性。
在這篇簡短的報告中,我們列出了大數據、機器學習和人工智能領域的主要趨勢,重點關注將在未來12-18個月影響所有行業的公司和組織的項目。幫助企業應用數據和人工智能的工具無疑正變得越來越簡單。但對數據和人工智能興趣的增長帶來了更廣泛的應用、更廣泛的用戶,以及有趣的新挑戰。
以下是我們2022年報告中涉及的幾個主題:
現代數據平臺 機器學習中的模型樞紐 大型語言模型 圖情報 以數據為中心的人工智能 新的擴展工具