越來越多的網絡安全專家、公司和業余愛好者形成了一個社區,他們傾向于公開分享他們從惡意軟件和攻擊分析中獲得的關于網絡威脅的知識。在網絡安全方面,這種類型的知識通常被稱為網絡威脅情報(CTI)。不幸的是,它通常以自然語言文本的形式提供,例如博客文章或PDF報告。為了使其可用于自動化安全措施或信息共享平臺,必須將其轉換為機器可讀的格式,最好是通過一個基本自動化的過程。已經發表了不同的方法來解決這個問題。然而,它們都不是真正面向用戶的,這在CTI領域是至關重要的,因為信息對情報狀態的宣告在很大程度上取決于它在具體行動中的應用。考慮到這一差距,我們提供了一個基于理論的問題模型,它反映了由個別情報定義所產生的特定領域的用戶需求。然后,我們使用這個模型來實現一個技術解決方案,利用一套強有力的定制技術,以及用戶友好的界面進行直接互動。
應用于2000份自然語言威脅報告,我們的示范性實施方案提供了超過150,000個CTI對象和關系,包含33,389個獨特的破壞性指標(IoCs)。我們的解決方案的總召回率被測量為0.81,而精度為0.93。這些結果顯示了隱藏在前面提到的公開來源中的巨大潛力,并證明有自動化的措施可以可靠地發現它,并使它可以被計算機輔助措施所利用。
越來越多的設備和關鍵基礎設施的全球聯網為敵對國家或APT集團提供了大量的可能性,通過網絡攻擊損害經濟、社會和政治。然而,與此同時,IT安全專家越來越多地使用類似的技術來應對這些威脅。一個由專家、公司和個人組成的日益壯大的社區已經出現,他們專門報告網絡威脅,提供惡意軟件的分析結果,并討論有關攻擊和攻擊者的趨勢和預測。這些信息通常被稱為網絡威脅情報(CTI),對網絡安全分析師和安全運營中心(SOCs)來說是非常有趣的。然而,由于這些來源的大量信息是以自然語言文本的形式提供的,專家們必須花大力氣提取相關信息,使其可用于自動安全解決方案、可視化工具或標準化的共享平臺。快速增長的數據量與持續短缺的熟練分析師相結合(例如在[1]和[2]中提到的),使得這項工作越來越難。
在本文中,我們提出了一種廣泛支持人工分析過程的方法,使用信息提取(IE)的概念以及自然語言處理(NLP)領域的技術。為了保證密切關注網絡安全分析的實際情況,我們首先對該領域的一些基本要求進行了展望。在接下來的步驟中,我們從IE話語的角度描述問題,并推導出一個問題模型。由于CTI的領域非常具體,所以要提取的實體類型也基本上是具體的。我們將展示,這種對問題的看法是如何通過使用各種定制的NLP技術來高精度地解決所產生的子問題的。我們對從自然語言文本中提取CTI的科學和技術討論的貢獻如下:
論文組織:在第2節中,我們對本文范圍內的研究進行了概述,以便在科學和技術論述中對其進行定位,并將我們的方法與現有的解決方案進行區分。第3節記錄了我們的CTI提取問題的模型,第4節介紹了該方法的實施。第5節對所產生的解決方案進行了評估,并在第6節進行了討論。在最后一節中,我們得出了結論。
2022年5月9日蘭德公司發布《利用機器學習進行作戰評估》報告。作者描述了一種利用機器學習來支持軍事作戰評估的方法。他們展示了如何利用機器學習從情報報告、作戰報告以及傳統和社會媒體中的非結構化文本中快速、系統地提取與評估相關的見解。這些數據已經由作戰級別的總部收集,通常是關于當地居民、敵人和伙伴部隊的最佳可用信息來源,但很少被納入評估,因為它們的結構不容易被分析。本報告中描述的機器學習方法有助于克服這一挑戰。
本報告中描述的方法,作者利用最近結束的針對上帝抵抗軍的戰役進行了說明,使評估小組能夠向指揮官提供關于戰役的近乎實時的見解,這些見解是客觀的,與統計學相關。這種機器學習方法可能特別有利于資源有限或沒有具體評估數據的戰役,這在資源有限或被拒絕地區的戰役中很常見。這種機器學習的應用對大多數評估小組來說應該是可行的,并且可以通過公開和免費的機器學習工具來實現,這些工具已被授權在美國國防部系統上使用。
如何利用機器學習工具將現有的情報報告、作戰報告和環境數據(如社交媒體、傳統媒體)納入戰爭行動層面的評估?
準確和及時的評估--提供關于哪些是有效的,哪些是無效的,以及如何改進作戰的反饋--是所有美國軍事作戰的一個關鍵要求。對軍事作戰的評估是圍繞戰役的作戰目標進行的,評估過程的重點是確定在實現這些目標方面是否正在取得進展。評估小組--最好是與指揮小組一起--確定與每個目標相關的預期效果,然后制定有效性措施(MOE),以跟蹤實現這些目標的進展。
獲得和處理正確的數據類型對于產生相關和可辯護的評估至關重要,這也是本報告的主題。有效的評估要求數據是客觀的、縱向的、與軍事作戰希望達到的效果類型相關的、有適當的評估結構,并且有足夠的時間頻率來支持決策。
在以前的研究中,我們為特種作戰部隊(SOF)的作戰評估開發了一種標準化的方法,我們發現作戰總部已經收集的各種數據與評估有關,但很少被使用。三種類型的數據--情報報告(如來自人類情報或信號情報來源)、作戰報告(如情況報告[SITREPs])和環境數據(如社交媒體)中已有的對正在發生的事件的文字描述,往往是有關當地居民、敵人和伙伴部隊的最佳可用信息來源。然而,這些數據的結構很少能被輕易地納入評估過程。
本報告描述了一種方法,即如何利用機器學習(ML)工具將這些現有數據納入作戰評估。我們展示了一個基于ML的文本分類器如何快速整理和準備這些數據,以便使用評估小組常用的標準統計工具進行后續分析。然后,我們使用最近結束的針對上帝抵抗軍的作戰數據來說明這一方法。這種基于ML的方法對大多數評估小組來說應該是可行的,并且可以用公開和免費提供的ML工具來實施,這些工具已被預先授權用于美國國防部(DoD)的機密系統。
本報告所描述的方法使評估小組能夠準確、及時地了解一場戰役,為指揮官提供近乎實時的、客觀的、與統計學相關的結果。可以使用我們的方法分析的每一種類型的數據--情報、作戰和環境--為理解一個戰役的效果提供了一個不同的視角。在有評估特定數據(如投票)的軍事作戰中,這些新的數據來源使評估小組能夠對調查結果進行三角測量,提高評估的可靠性。然而,ML工具在評估專用數據有限或沒有的情況下特別有用--這在資源有限或在被拒絕地區的作戰中很常見。
我們的分析集中在一個具體ML評估應用上:使用 "有監督機器學習"(SML),從現有的情報、作戰和環境報告中的非結構化文本中構建一個可供評估的數據庫。SML的這種應用的直覺是相對簡單的。首先,人類分析員通過手工審查和分析可用的非結構化文本的一個子集。這第一步的輸出通常被稱為 "訓練數據"。然后,ML算法分析這個訓練數據,并試圖模仿人類分析師對所有剩余文本使用的相同分析過程。
這種方法允許評估小組系統地編輯非結構化文本中的信息--每份報告中提供的定性描述成為客觀和定量評估中的單一數據點--然后檢查這些信息如何隨時間演變。這種方法是將ML納入評估過程的最簡單方法,但它仍然是一種有效的方法,可以從這些現有數據中信息豐富的非結構化文本中獲得與評估相關的見解。
在本報告中,我們詳細說明了一個五步工作流程,并在圖S.1中進行了總結,評估小組可以按照這個流程將SML納入評估過程。
圖S.1 用于評估工作流的監督機器學習
第1步是整理大量的潛在相關報告--通常是數以千計的年度報告(或更多)--可用于大多數業務。這個整理過程包括刪除不必要的重復內容,并將數據重新組織成適合ML算法分析的格式。在我們的方法中,現有報告中的非結構化文本被分為單句,然后分析其與競選活動的相關性。
第2步是制定適合每個相關MOE的編碼標準。這些編碼標準是歸納出來的,評估小組首先審查現有的數據,以確定哪些MOE是可以用現有的數據衡量的。然后,評估小組制定具體的編碼標準--也就是一套規則,說明什么時候一份報告應該被認為與該MOE相關(或不相關)。至關重要的是,這些編碼標準要足夠清晰和詳細,以便于復制,使不同的分析員在應用這些標準時產生幾乎相同的結果。本報告為每一類數據(情報、作戰和環境)提供了常用的MOE的編碼標準樣本,盡管具體的編碼標準必須是針對作戰的。
第3步是準備訓練數據,這是SML方法中ML算法的主要輸入。這些訓練數據是整體非結構化數據的一個子集,由評估小組使用步驟2中制定的編碼標準進行審查、分析和編碼。確保編碼標準的穩健性和可復制性是開發這些訓練數據的一個關鍵組成部分,因為ML算法試圖復制人類分析員的編碼。
第4步是實現和校準一個或幾個選定的ML算法。校準過程包括審查由ML算法編碼的報告,以驗證其準確性--也就是說,即確保被識別為相關的報告確實是相關的。如果算法表現不佳,評估小組需要調整算法參數或擴大訓練數據的數量。在一個實際的活動中,這個校準過程應定期重復,以確保算法在更多的數據可用時仍然表現良好。
第5步,評估小組處理來自ML算法的輸出,以整合到評估過程中。ML算法的輸出是一個結構化的數據庫(例如,Excel),確定所有滿足步驟2中制定的編碼標準的報告。這種通用的結構化格式允許用評估小組常用的工具進行分析,并便于插入現有的態勢感知工具中。在某些情況下,可以直接分析這些數據,以產生報告在一段時間內的趨勢線,例如,以正面方式討論一個實體(如敵人或伙伴部隊)的社交媒體報告的百分比與以負面方式討論它的數量相比。在其他情況下,這些數據需要與報告中的其他信息相結合--例如,提取特定地點的信息可以使評估小組生成不斷變化的敵人作戰自由地圖。
機器學習可以成為支持作戰評估的有力工具
我們的研究確定了五個建議,這些建議將提高基于ML的評估方法的價值。
建議1:在受控演習中驗證SML方法。本報告所描述的方法是特意設計的,以使評估小組盡可能容易復制,而且該方法的設計依靠的是既免費又已被批準在許多軍事網絡上使用的工具。然而,盡管我們已經用實際作戰測試了我們的方法,但我們并沒有試圖在實時或與軍事分析員團隊一起做這件事。因此,我們建議利用實戰演習,但在受控條件下驗證各項要求--如任務前培訓、人員配置、分析工具的可用性和必要的數據訪問。
建議2:探索如何利用無監督的ML為作戰評估提供信息。無監督的ML可以提供一種工具,用于發現戰役活動和這些活動的行動目標之間的未預期模式。經過評估小組的審查,這些信息可以為指揮官提供一個寶貴的工具,用來探索未預料到的模式。考慮到我們的任務是探索如何利用ML將現有數據用于評估,我們沒有詳細研究將無監督ML納入評估的實用性或價值。
建議3:對作戰報告實施適度的標準化。SITREP和其他作戰報告往往是關于伙伴部隊活動和能力的唯一最佳歷史數據來源,而且這種報告還可以提供關于美國部隊活動的詳細歷史記錄。這些特點使作戰報告成為評估小組潛在的有力工具--特別是如果有ML(或類似的)工具可以快速提取與評估有關的信息--但這種報告在質量和細節上并不一致。我們建議對這種作戰報告進行適度的標準化。要求(簡單地)戰術部門持續討論其伙伴部隊的活動和能力。
建議4:改善歷史情報和作戰報告的歸檔、發現和提取。獲取和提取本報告所述方法所需的相關情報和作戰報告在現有系統中并不容易。對于情報報告,我們建議在現有系統中增加快速提取縱向數據(如三個月或更長時間的數據)的能力,以滿足一組特定的搜索參數(如地理、布爾邏輯),其中包括報告全文和一些關于數據的基本描述性信息(日期、來源等)。對于業務報告,我們建議業務層面的總部確保所有下屬總部的SITREPs被系統地歸檔。
建議5:擴大專業軍事教育中要求的具體評估討論。盡管承認評估對軍事行動的重要性,但在向聯合部隊提供的與評估有關的教育和培訓方面存在重大差距。因此,評估小組往往難以提供指導有效決策所需的信息,而作戰級總部的其他工作人員往往缺乏經驗。
為了能夠在一個日益脆弱的世界中捍衛自己的生活方式和價值觀,團結在北約框架內的西方民主國家必須有能力在必要時 "以機器速度作戰"。為此,國防領域的數字化不能只局限于后勤、維護、情報、監視和偵察,而必須同樣能夠實現負責任的武器交戰。以歐洲未來戰斗航空系統(FCAS)為重點,我們討論了基于人工智能的武器系統的道德統一系統工程的各個方面,這可能會在國際社會中找到更廣泛的同意[1]。在FCAS計劃中,這是自二戰以來歐洲最大的軍備努力,有人駕駛的噴氣式飛機是一個網絡系統的元素,無人駕駛的 "遠程載體 "保護飛行員并協助他們完成戰斗任務。鑒于正在進行的辯論,德國國防部長已經強調。"歐洲戰略自主的想法走得太遠了,如果它被認為意味著我們可以在沒有北約和美國的情況下保證歐洲的安全、穩定和繁榮。那是一種幻覺[2]"。在這個意義上,FCAS與北約的目標是一致的。
"武器的殺傷力越大,影響越深遠,就越需要武器背后的人知道他們在做什么,"沃爾夫-馮-鮑迪辛將軍(1907-1993)說,他是1955年成立的二戰后德國聯邦國防軍的富有遠見的設計師(見圖1)。"如果沒有對道德領域的承諾,士兵就有可能成為一個單純的暴力功能者和管理者"。他深思熟慮地補充道。"如果僅僅從功能的角度來看,也就是說,如果要實現的目標在任何情況下都高于人,那么武裝部隊將成為一種危險[3]"。
弗朗西斯-培根(1561-1626)關于實現權力是所有知識的意義的聲明標志著現代項目的開始[4]。然而,自從人工智能(AI)在國防領域出現后,旨在造福人類的技術可能會反過來影響它。這種類型的工具性知識使現代危機像在聚光燈下一樣明顯。關于人的倫理知識,關于人的本質和目的,必須補充培根式的知識。有一種 "人的生態學",一位德國教皇提醒德國議員說。"他不制造自己;他要對自己和他人負責[5]"。因此,任何符合倫理的工程必須是以人類為中心的。這對于國防領域的人工智能來說是最迫切的。因此,數字倫理和相應的精神和道德是必不可少的技能,要與卓越的技術同時系統地建立起來。因此,領導哲學和個性發展計劃應鼓勵設計和使用基于人工智能的防御系統的道德能力。
北約STO的科技界如何在技術上支持負責任地使用我們從人工智能中收獲的巨大力量?為了更具體地論證,讓我們以德國聯邦國防軍的文件為指導,從它在20世紀50年代成立的時候,也就是人工智能這個詞真正被創造出來的時候,到最近的聲明。由于這些武裝部隊已經從暴政和以當時高科技為特征的 "全面戰爭 "中吸取了教訓,他們似乎在概念上已經為掌握數字挑戰做了準備。這一點更是如此,因為聯邦國防軍是一支載于《德國基本法》的議會軍隊,它完全按照聯邦議院的具體授權行事,即以德國人民的名義行事。
國防領域的人工智能旨在將軍事決策者從常規或大規模任務中解脫出來,并 "馴服 "復雜性,讓他們做只有個人才能做的事情,即智能地感知情況并負責任地采取行動。自動化對聯邦國防軍的重要性很早就被認識到了。馮-鮑迪辛在1957年提出:"然后,人類的智慧和人力將再次能夠被部署到適合人類的領域"[6]。從這個角度來看,武裝部隊作為基于人工智能的系統的使用者,并沒有面臨根本性的新挑戰,因為技術的發展一直在擴大感知和行動的范圍。
互動、討論和各種信息的交流使網絡成為今天的場所。文本、圖像、視頻,甚至諸如地理空間和健康數據等信息都以前所未有的規模被分享。網絡上的這種信息交流為各種數據驅動的應用產生了一個廣泛的、可自由訪問的數據源--有多種機會,但也有風險。在本文中,我們介紹了研究項目ADRIAN--"在線網絡中依賴權威的風險識別和分析 "的總體思路,該項目致力于研究和開發基于人工智能的方法,以檢測基于異質性在線數據集的個人和機構的潛在威脅。我們將首先監測選定的社交運動應用程序,并分析收集的地理空間數據。在第二步,體育應用和社交媒體平臺的用戶資料將被關聯起來,以便能夠形成一個個人集群,并能夠識別潛在的威脅。由于所謂的 "數字孿生 "可以通過這種方式重建,因此會產生敏感數據。如果這些數據也能與其他機密數據相關聯,就有可能估計出個人、團體或地點所受威脅的合理性。
現代網絡是基于互動、討論和信息交流的。然而,網絡也為數據驅動的應用創造了一個巨大的、可自由訪問的信息源。由于網絡上用戶生成的數據以自動化的方式與現有資源有效地聯系在一起,即使是無意中透露的個人信息也會產生破壞性的后果。因此,即使是微不足道的,有時是無意披露的信息也會對個人、團體或整個組織產生潛在的有害影響[1,2,3]。盡管服務提供商現在有責任和利益來確保網絡上用戶數據的安全和隱私,但這些數據被濫用、泄露,或者公開的信息被用來對付原始創建者[4]或政府機構[5]的情況越來越多。執法部門和其他人群在社交媒體平臺上面臨著越來越多的潛在威脅,這不僅僅是自2020年美國發生暴亂以來。特別是,社交媒體賬戶和帖子(如Twitter或Instagram)與流行的體育應用程序的跟蹤和位置數據的收集和鏈接,使用戶和他們的親人可以被識別,使他們可以追蹤,成為網絡攻擊的潛在目標(如網絡跟蹤,doxing,身份盜竊)[5,6]。在這種情況下,另一個與安全有關的方面是,可以利用收集到的跑步路線的地理空間數據來定位軍事基地[7]。由于不是所有的信息本身或組合都會造成威脅,單純的數據最小化、限制數據訪問、數據規避和預防工作是不夠的[8]。在研究項目ADRIAN--"在線網絡中依賴權威的風險識別和分析"中,我們采取了主動搜索、建模、預測和突出網絡威脅的方法,并特別針對政府機構進行研究。我們的方法的目標是自動監測選定的(體育)應用程序,并分析其收集的數據,將其與社會媒體資料相關聯,形成個人集群,以確定潛在的目標并評估其風險潛力。這是基于處理文本(如推文)、圖像(如建筑物前的自拍、地圖)和地理空間信息(如跑步路線)。這意味著我們正在處理一個異質的數據集。由于它的構成,對處理方法的要求也非常不同。由于在數據分析和知識提取過程中可以通過這種方式重建所謂的 "數字孿生",因此產生了極其敏感的(元)數據[6]。通過將這些信息與其他分類數據相關聯,就有可能確定相應(群體)個人或地點的威脅可信度。為了實現這些目標,技術實施必須結合信息檢索方法和法醫語言學的方法。此外,網絡分析和聚類的方法將被用來開發新的評估功能,以根據披露的信息識別目標(人、地點等)。
在本文中,我們介紹了我們對這一主題的理解,也介紹了我們的方法和我們的原型,我們正在不斷地開發。本文的組織結構如下。在第2節中,我們回顧了當前的研究現狀,重點是現有的方法和定義,因為通常缺乏統一的術語。在第3節中,我們介紹了我們自己在ADRIAN中采取的方法,從有針對性的數據收集、數據聚合和充實以及交互式可視化開始。在第4節中,我們介紹了我們在原型上的工作,并在第5節中討論了我們的方法,然后在第6節中得出結論并提出展望。
混合戰爭為沖突推波助瀾,以削弱對手的實力。相關的行動既發生在物理世界,也發生在媒體空間(通常被稱為 "信息空間")。防御混合戰爭需要全面的態勢感知,這需要在兩個領域,即物理和媒體領域的情報。為此,開源情報(OSInt)的任務是分析來自媒體空間的公開信息。由于媒體空間非常大且不斷增長,OSInt需要技術支持。在本文中,我們將描述對物理世界的事件以及媒體事件的自動檢測和提取。我們將討論不同類型的事件表征如何相互關聯,以及事件表征的網絡如何促進情景意識。
開源情報(OSInt)的任務是探索和分析可公開獲取的媒體空間,以收集有關(潛在)沖突的信息,以及其他主題。所謂 "媒體空間",我們指的是通過傳統媒體(如電視、廣播和報紙)以及社交媒體(包括各種網絡博客)傳播的非常龐大、快速且持續增長的多語種文本、圖像、視頻和音頻數據語料庫。社會媒體大多是平臺綁定的。平臺包括YouTube、Twitter、Facebook、Instagram和其他[1,2]。在很大程度上,媒體空間可以通過互聯網訪問。很多部分是對公眾開放的。然而,也存在一些半開放的區域,其中有潛在的有價值的信息,但并不打算讓所有人都能接觸到,例如Telegram和Facebook頁面。
媒體空間提供關于物理世界的信息:發生了什么?哪些事件目前正在進行?未來計劃或預測會發生什么?它對物理世界的事件反應非常快,也就是說,幾乎是立即提供信息[3]。因此,媒體空間似乎是物理世界中事件的一個有希望的 "傳感器"。然而,從鋪天蓋地的大量信息中檢索出特別相關的信息仍然是一個挑戰,因為到目前為止,所提供的大多數信息是完全不相關的,至少對軍隊來說是如此。此外,媒體空間并不一致--它包括真實和虛假信息,因此,事實核查是一個進一步的挑戰。
除了作為物理世界的傳感器,媒體空間還是意識形態、意見和價值觀的論壇。它是一個重要的空間,用于協商一個社會認為是允許的、規定的或禁止的東西,并用于表現情緒和偏見。因此,它已成為混合戰爭的戰場,即以 "通過暴力、控制、顛覆、操縱和傳播(錯誤的)信息"([4],第2頁)為目的進行的行動。(錯誤的)信息行動導致我們稱之為 "媒體事件"。媒體事件可以被觸發,以影響情緒、意識形態和公眾對物質世界的看法。
越來越多的信息以非結構化文本數據的形式在網上分享,尤其是在社交媒體上,這為補充傳統的網絡威脅情報來源提供了機會。由于這種大量的數據無法人工處理,我們探討了使用機器學習來協助分析的一些可能性。我們特別關注與命名的威脅者有關的信息的檢索。通過對現有的語言模型進行微調以完成特定的下游任務,基于偽自動注釋的數據,我們獲得了檢測和提取以前未見過的威脅行為者的模型。我們在不同的條件下進行了多次評估,其中一些評估結果表明,這些模型確實能夠產生在半自動分析環境下有用的結果。此外,我們認為這是一個將一般語言模型應用于特定領域任務的案例研究,并反思了一些更普遍的經驗教訓。
威脅情報是網絡防御的一個組成部分。對技術系統的記錄和監測是網絡威脅情報(CTI)的傳統來源。越來越多的信息在網上分享,尤其是在社交媒體上,為補充傳統來源提供了一個機會,以提高網絡環境中的態勢感知。要大規模地利用這些新來源,需要有能力以比任何分析家都要高得多的速度篩選大量的非結構化數據。因此,有必要進行半自動分析,將分析員的思維優勢與計算機的處理能力相結合。
自然語言處理(NLP)和機器學習(ML)的最新發展提供了強大和多功能的語言模型,這些模型代表了對語言的一般理解,通過大量的文本數據和計算能力獲得。這些模型可以在更小的數據量上進行微調,以學習一個特定的任務。在這項工作中,我們探索了將這種語言模型應用于CTI背景的可能性,特別是我們專注于自動識別文本中提到的(以前未見過的)網絡威脅者的任務。除了與CTI有關的這種能力的好處外,這也是一個將一般語言模型應用于利基和特定領域的任務的案例研究,對于這些任務,不能假定有預先存在的數據集和評估基準。
價值1750億美元的電子游戲生態系統龐大且不斷發展,為全球28億游戲玩家提供服務,包括與當前和未來軍事建模和仿真(M&S)直接相關的技術和工作方式。英國國防科學與技術實驗室(Dstl)的研究計劃委托進行了一項研究,分析游戲生態系統,以了解哪些新興或現有方法可以為軍事訓練和更廣泛的M&S提供顯著收益。重點是“建模和仿真即服務 (MSaaS)” ,以及為更復雜的多域操作培訓的成本效益可能出現“階梯式變化”。首先生成了游戲和軍事M&S功能的熱圖,以突出與軍事最相關的領域。通過與Dstl主題專家合作,確定了軍事M&S通過利用游戲行業內的技術和能力實現現代化的20個關鍵機會。它們是跨技術、人員和流程的速贏和長期機會的混合體。其中的關鍵是游戲引擎技術不斷增長的潛力;社區在游戲和游戲開發中的價值;以及廣泛的網絡訪問作為M&S發現、共享和創新的推動者的作用。
人工智能領域的進展繼續擴大這組技術的潛在軍事應用范圍。本文探討了信任在人機聯合作戰中的關鍵作用,以及依靠人工智能來補充人類認知的潛在影響。如果依靠人工智能來準確處理傳感器數據,操作自主系統和平臺,或通過擬議的作戰概念(如以決策為中心的戰爭)提供有利的決策支持,設想機器智能的中央指揮和控制作用,那么信任機器智能將是未來作戰中的一個關鍵組成部分。鑒于這些技術和理論的發展,信任的概念對于機器智能在戰術和作戰層面的軍事行動中的使用變得高度相關,正確校準的信任水平是安全和有效行動的基礎。在簡要回顧了機器智能的最新進展和對信任概念的探索之后,本文概述了人工智能在戰場上的當前和潛在應用,以及由不充分或不合理的高信任度帶來的挑戰。
縱觀歷史,技術已經擴大了武裝沖突的領域,戰術交戰的節奏,戰場的地理范圍,以及指揮官與部隊溝通的手段。技術創新--包括軍事和民用--改變了軍隊的作戰方式以及國家計劃和進行這些沖突的方式。在21世紀,迄今為止,很少有進步能像統稱為人工智能(AI)的一組技術那樣獲得如此多的關注。人工智能正準備迎來一個新的時代,在這個時代,機器智能和自主性正在為軍事行動的規劃和執行產生明顯的新概念。算法戰爭可能會帶來一些獨特的東西:增強甚至取代人類決策過程的系統,其速度可能超過人類規劃者的認知能力。
新興技術的整合提出了任何數量的基本組織和倫理問題,值得關注。本文將采用定性的社會科學方法,重點討論人類-自治團隊(HAT)的一個重要方面:鼓勵對機器智能的適當信任程度。有大量的學術文獻關注自動化或機器人技術中的信任問題,但有關具體軍事應用的工作較少。當人工智能在聯合作戰中被實際部署時,在信任方面有哪些挑戰和機會?在簡要回顧人工智能和概述機器智能在戰場上的可能應用之后,本文在分析鼓勵適當信任水平的陷阱和潛在解決方案之前,探討了信任和信任校準的概念。
幾十年來,人類一直對賦予機器某種形式的人工智能的可能性著迷,Nils Nilsson將其定義為 "致力于使機器智能化的活動,而智能是使一個實體在其環境中適當運作并具有預見性的品質"。在數字時代的早期,出現了兩種廣泛的人工智能方法。自上而下的專家系統方法使用復雜的預編程規則和邏輯推理來分析一個特定的數據集。對于具有可預測規則的明確定義的環境--諸如分析實驗室結果或下棋等應用--專家系統或 "符號 "人工智能(基于符號邏輯)的性能主要取決于處理速度和算法的質量。另一大類使用自下而上的機器學習方法,模擬人類通過檢測數據中的模式進行學習的方式。神經網絡是一種以人腦為模型的機器學習形式,能夠通過使用多個(因此是 "深")人工神經元層來識別復雜的模式,是被稱為 "深度學習 "的技術的基礎。通過其在數據集中尋找關系的能力,這種技術也被稱為 "連接主義"。
自上而下、基于規則的符號系統和自下而上的機器學習連接主義技術之間的差異是很大的,特別是關于它們的潛在應用范圍和靈活性。深度學習方法的顯著特點是能夠將學習與它所訓練的數據集分開,因此可以應用于其他問題。基于規則的算法可以在狹義的任務中表現得非常好,而深度學習方法能夠迅速找到模式,并在 "蠻力 "專家系統計算方法無效的情況下有效地自學應用。最近的一些人工智能進展顯示了模仿創造力的能力,產生了有效的解決問題的方法,這些方法對人類來說可能是反直覺的。
然而,總的來說,人工智能仍然是狹窄的或 "脆弱的",即它們在特定的應用中功能良好,但在用于其他應用時仍然不靈活。與人類的認知相比,鑒于機器的計算速度遠遠超過人腦,機器智能在將邏輯規則應用于數據集時要優越得多,但在嘗試歸納推理時,它必須對數據集或環境進行一般性的觀察,這就顯得不足。大多數機器學習仍然需要大量的訓練數據集,盡管新的方法(包括生成對抗網絡(GAN)和 "小于一次 "或LO-shot學習)正在出現,需要非常小的數據集。圖像識別算法很容易被混淆,不能像人類那樣立即或直觀地理解情景背景。這種脆性也延伸到了其他問題,比如游戲。雖然人工智能在視頻游戲中經常表現出超人的能力,但他們往往不能將這種專業知識轉移到具有類似規則或玩法的新游戲中。
雖然人工智能技術繼續在變得更加適應方面取得重大進展,但任何接近人類的人工通用智能仍然難以實現。評估人工智能的近期前景因該技術的漸進式進展而變得更加復雜。圍繞著人工智能的炒作--在很大程度上被深度學習方法的成功所推動--既導致了對該技術未來的不切實際的期望,也導致了對其非常大的進展的正常化。正如一份報告所指出的,"人工智能將一項新技術帶入普通人的視野,人們對這項技術習以為常,它不再被認為是人工智能,而出現了更新的技術"。盡管象征性的人工智能和各種形式的機器學習構成了該領域最近的大部分進展,也許除了融合這兩種方法的嘗試之外,未來仍然不確定。一些人猜測,機器學習技術帶來的進展可能會趨于平穩,而另一些人則保持樂觀。相關的技術進步,如短期內的計算機芯片設計和長期內的量子計算,可能會影響進一步進展的速度。
本報告總結了 IST-144-RTG 在基于內容的多媒體分析 (CBA) 方面的研究進展,該研究由來自 NLD、NOR、美國和英國的團隊進行。這些科學家匯集了來自異構媒體源(文本、視頻和圖像)和人類評估的信息檢索策略。因此,可以通過基于內容的信息檢索和多媒體分析來利用多個異構數據源,以提供及時準確的數據概要,并結合人類直覺和理解來開發問題/解決方案空間的全面“視圖”。北約聯盟軍事領導人、指揮官和情報分析員需要這種可互操作的工具,這些工具可以交叉提示從一種方法獲得的知識以在另一種方法中生成任務,以加快態勢感知和決策制定,并應對國防信息空間的復雜性。提供了核心技術組件的描述以及它們在概念演示器中的組合應用的描述,該演示器解決了一個虛構但現實的場景,代表了聯盟面臨的防御挑戰。該報告總結了解決限制所需的進一步工作的發現和建議,包括技術和系統級別的差距,例如用于集成分析服務的開放分布式架構,現在和未來的預期。