研究人員通常會增加訓練數據來提高神經網絡的預測能力,但當數據或計算資源有限時,這種方法是不可行的。本文擴展了以前的研究,即使用長短期記憶-完全卷積網絡從公開的廣播式自動相關監視(ADS-B)數據中識別飛機發動機類型。這項研究設計了兩個實驗,改變訓練數據樣本和輸入特征的數量,以確定對ADS-B分類模型的預測能力的影響。第一個實驗從有限的特征集中改變了訓練數據觀察的數量,結果是83.9%的準確率(與以前只用25%的數據的實驗相比,準確率在10%以內)。實驗結果表明,與數據數量相比,特征選擇和數據質量導致了更高的分類精度。第二次實驗接受了所有ADS-B特征組合,并確定空速、氣壓和垂直速度對飛機發動機類型預測的影響最大。
關鍵詞:多變量長短期記憶-完全卷積網絡,廣播式自動相關監視,公開信息,開源數據,分類,機器學習
在過去的三十年里,互聯網上的存儲量從1993年的15.8 exabytes增加到2020年的6.8 zettabytes[1],增幅超過40000%。雖然很難確定確切的數字,但截至2022年2月,互聯網的規模估計約為21 zettabytes,并且每兩年翻一番[2]。如果我們假設普通的個人電腦(PC)有一個一兆字節的硬盤,21兆字節就相當于210億臺PC,基本上世界上每個人都有三臺PC。雖然這些數據中有很多是個人數據,但其中很大一部分被認為是公開可用的信息(PAI),可以被任何互聯網用戶或組織利用。
可用數據的增加導致了對識別趨勢的研究(即數據分析),在社會的多個方面,包括商業和政府,變得越來越普遍。研究人員和大公司已經考慮了多種方法來最好地利用這種被恰當地稱為 "大數據 "的巨大資源。一些已經顯示出前景的領域包括物聯網(IoT)分析[3-5]、trafc建模[6]、戰斗和海上運動[7-11]、圖像識別[12]、搜索引擎[12]和自然語言處理[12]。
對PAI和數據分析的日益關注,得到了負責做出合理防御決策的軍事防御戰略家的認可。通過將PAI與他們所掌握的大量傳感器數據相結合,如來自情報、監視和偵察平臺的數據,有可能提高這些資源的預測能力。美國空軍和太空部隊對數據分析的需求是顯而易見的,因為多領域行動是其防御戰略的組成部分。事實上,22財年的態勢聲明呼吁指揮和控制部門需要翻譯和共享數據,以提供 "實時傳播可操作的信息",從而提供 "以比我們的競爭對手更快的速度在所有領域進行聯合作戰"[13]。如果沒有最近的技術、人工智能和機器學習的進步,這個目標幾乎是不可能的。幸運的是,新技術可以用來清除大數據中的噪音,其速度遠遠超過人類的速度,以快速做出對軍事決策者來說很重要的推斷。
為了幫助軍事領導人分析他們所掌握的巨大數據,我們試圖通過為大數據的一個主要用戶提供增強的能力來改善軍事行動:情報分析員。對情報分析員來說,一個重要的重點領域是生命模式(POL)的建模。一些研究人員試圖通過機器學習來改善POL建模[14-18]。最近的研究興趣表明,用深度學習分析地面和機載飛機傳感器,以預測飛機的特性。
POL建模的一個研究方向是利用廣播式自動相關監視(ADS-B)數據來對飛機進行預測[6, 8, 11, 19]。某些空域內的飛機被要求通過機載轉發器廣播ADS-B輸出。使用ADS-B數據進行分類問題的好處是,它是公開的,在美國和歐洲飛行的飛機被要求在大多數空域等級中廣播它[20, 21]。ADS-B數據從世界各地的不同地點收集,業余愛好者和研究人員在這些地點維護一個接收器來收集數據。ADS-B收集者將他們的數據提交給集中的存儲庫,如ADS-B交易所[22],這些存儲庫將數據匯總起來供公眾使用。在這些存儲庫中,關于廣播飛機的統計和運動學信息都是可用的。
生命模式(POL)建模是一個擁有許多技術和最佳實踐的研究領域[14-18]。軍事和國防人員對POL建模的興趣,不僅僅包括對人類日常活動的建模。例如,來自飛機傳感器的未歸屬數據,如從空中交通管制(ATC)的主雷達收集的數據,可以通過一些分析對發射的飛機做出推斷。ATC的主雷達收集運動信息,如位置和空速,但如果沒有飛機通過其應答器提供,則無法獲得飛機的識別信息。有了這些基本的飛機運動學數據,模型可以預測諸如飛機型號或發動機類型等信息,而不需要在原始數據集中直接說明。ADS-B數據的好處是,這些特征存在于數據集中,可以作為真實數據,為沒有真實數據的數據集建立模型。
由于這種類型的處理可能是資源密集型的,在處理有限的計算資源時,訓練一個深度學習模型可能是困難的,或者在某些情況下是不可能的。訓練一個模型所需的計算資源量在很大程度上受訓練數據的大小影響。出于這個原因,了解如何通過最小化用于訓練模型的數據來最好地利用可用資源是很重要的。有兩種方法可以最小化數據:限制特征的數量或減少訓練樣本的數量。在這項研究中,利用飛機運動學數據,我們研究了預測發動機類型時改變這些因素的影響。由于減少訓練數據將不可避免地降低所得模型的準確度,在本文中,我們將可接受的模型定義為預測準確度在先前89.2%的基線研究成果的10%以內[23]。因此,能達到至少79.2%準確率的模型將被認為是 "可接受的"。
本文的研究貢獻可以歸納為以下幾點:
由于深度學習分類問題的最小數據集大小沒有明確的指導原則,本研究旨在確定飛機預測模型的基線。
本文確定了用運動學數據識別飛機的基線特征。速度、氣壓和垂直速度
本文分析并重申了選擇適當特征的重要性。該數據集內的 "噪音 "特征嚴重限制了網絡的分類能力。
本文的其余部分組織如下。第二節提供了關于ADS-B的詳盡的文獻回顧和背景信息。在第三部分,討論了用于開發和評估每個模型的方法和過程。第四部分介紹了結果。第四部分提供了結論。
無線電頻率指紋(RFF)是通過機器學習(ML)分類器將唯一可識別的信號失真歸于發射器。RFF經常被提議作為無線設備安全的認證機制,但技術受到不同操作條件下指紋變化的限制。首先,這項工作研究了頻率通道對典型的RFF技術的影響,以前只使用單一頻率通道的突發事件進行評估,沒有考慮多通道操作的影響。使用多類馬修斯相關系數(MCC)進行的性能表征顯示,在用于訓練模型的頻率通道以外的頻率通道上操作會導致性能惡化,從MCC>0.9(優秀)下降到MCC<0.05(隨機猜測),表明不應期望單通道模型在現實的多通道操作中保持性能。提出了一種訓練數據選擇技術來創建多通道模型,其性能優于單通道模型,將跨通道平均MCC從0.657提高到0.957,并實現了頻率通道無關的性能。第二,這項工作引入、開發并演示了通過失真重構提取指紋(FEDR)過程,這是一種基于神經網絡的量化信號失真的方法。與一個簡單的密集網絡相結合,FEDR指紋與四種常見的RFF技術進行了評估,Nc={5,10,15,25,50,100}未見過的類別。帶有FEDR指紋的密集網絡在所有的Nc值中都取得了最佳性能,MCC從0.945(Nc=5)到0.746(Nc=100)不等,使用的訓練參數比次好的卷積神經網絡少73%。
圖 1. 基于 RFF 的 WirelessHART 設備認證的設想用例。我們的實驗裝置模仿了這種配置。
美國空軍2030年及以后的科技戰略文件規定,需要 "發展和提供變革性的戰略能力",以確保美國在與近鄰對手的任何沖突中占據優勢[1]。這些戰略能力包括有保障的信息共享和快速有效的決策,由彈性和靈活的通信平臺驅動。這種保證需要一個由安全的有線和無線鏈路組成的無處不在的世界性基礎設施,它連接著從個人電腦和便攜式電子設備到關鍵信息系統、情報傳感器網絡和軍事武器系統等一切。
由于通信介質的性質,無線安全特別重要,它可以被對手輕易地監控。安全性取決于比特級的加密算法,該算法通過使用秘密信息實現加密和身份認證。例如,在WPA2(一種廣泛使用的無線認證協議)中,一個共享的秘密(如網絡密碼)被利用在一個4路握手過程中,以認證雙方并產生一個用于加密通信的密鑰[2]。然而,任何知道這個生成的密鑰的實體在理論上都可以冒充已經認證的一方,從而破壞信任。不幸的是,密碼學中的這個單點故障總是存在的。
消除單點故障的一個策略是要求多種形式的認證。多因素認證(MFA)要求用戶提供三類信息中的至少兩類:i)你知道的東西,ii)你擁有的東西,以及iii)你是的東西[3]。例如,試圖登錄信息系統的人類用戶可能被要求提供一個密碼(即知道)和一個ID(即擁有),或者一個密碼和一個發送到訂閱的移動設備上的代碼(即擁有)。最近的技術,如基于智能手機的指紋掃描儀(如三星超聲波指紋識別)和紅外臉部映射器(如蘋果FaceID),再加上現代機器學習的進步,使得將你所在類別的東西的信息納入認證機制成為可能。
通過使用射頻指紋(RFF)[4],類似的策略可以擴展到無線通信。RFF從無線發射器的發射中提取關于你是什么的信息。這種物理層的信息可以增強比特級的認證機制,實現多層次的身份驗證,并通過深入防御有效地加強安全[5]。然而,RFF帶來了許多實際的實施挑戰,包括邊緣設備資源限制[6]和提取的指紋的顯著漂移和變化[7]。
以下各節提供了RFF及其挑戰的介紹性概述,隨后概述了這項工作為解決這些挑戰所做的貢獻。
射頻指紋是一種用于從發射信號的特征來識別發射者的技術[8]。這種技術直接應用于信號本身,與依賴這些信號的比特級解釋的加密算法不同。其基本理論是,由于制造過程中的不一致,每個發射器的構造都略有不同,即使是那些來自同一制造商的相同的內部組件。這些不一致表現在發射信號的微小但可測量的失真上,在信號上留下了 "指紋"。有可能找到同一發射器留下的多個指紋的共同點,這樣,未來的指紋就可以歸于該發射器。
RFF的核心是依靠機器學習(ML)分類器,該模型是用一組Nc類(即發射器)的大量例子(即指紋)訓練出來的。當一個新的、從未見過的例子被輸入到訓練好的模型中時,該模型可以預測哪個Nc類產生了它。大多數公布的RFF技術包括兩個步驟:i) 指紋提取和ii) 分類[8]。指紋提取過程,如時域獨特本地屬性(TD-DNA)[9]或基于星座的獨特本地屬性(CB-DNA)[10],是用來建立作為分類器輸入的特征集的算法。指紋是對信號的測量,更確切地說,是對信號中存在的扭曲的測量。其基本假設是發射器以一致的方式扭曲信號,因此,分類器可以將扭曲映射到發射器上。
在更現代的RFF方法中,分類器直接接受原始信號,在模型中整合指紋提取。這些方法通常利用卷積神經網絡(CNN)的力量來實現令人印象深刻的分類性能[11]。卷積神經網絡自動學習信號的哪些部分對辨別Nc類貢獻最大,并構建自身以提取該信息。
與人的指紋在人的一生中保持不變不同,發射器的指紋經常受到操作條件的影響,如溫度、信道噪聲、其他發射器的干擾、元件的老化以及傳輸的信息類型[7]。這些操作條件中的每一個都會對信號施加不同類型和組合的失真,使指紋發生變化。這種可變性使得采用實用的基于指紋的認證機制變得困難,因為在一組條件下運行良好的系統在其他條件下可能無法正常運行。因此,在設計RFF技術時必須考慮操作條件。
基本的挑戰是:i)了解哪些操作條件會導致指紋的變化,以及ii)了解這些變化如何在指紋中表現出來。第一個挑戰需要列舉操作條件,考慮到發射器可能在無窮無盡的環境中運行,這是一項非同尋常的壯舉。這方面的研究重點是證明某個特定條件會影響分類性能,然后產生一種技術來對抗這些影響[7, 12]。為此,這項工作的研究一提供了一個關于頻率通道對RFF的影響的檢查。它研究了在單通道模型上使用多通道數據所產生的性能惡化,并提出了一種數據驅動的技術來減輕這些影響。
研究操作條件如何在指紋中表現出來,有其自身的障礙。首先,在RFF社區中,對構成指紋的定義各不相同。典型的指紋提取技術,如TD-DNA[9, 13]、CBDNA[10, 14]、Gabor變換[15, 16]和基于內在模式函數(IMF)的變換,如Hilbert-Huang變換[17],都產生非常不同類型的指紋。每種技術都對哪些類型的失真對區分發射器很重要做出假設,根據這些假設測量信號,并將這些測量結果作為指紋。因此,只能在這些假設的范圍內研究指紋的可變性,這就提供了一個不完整的關于指紋總體上如何變化的畫面。
另一個障礙是,最近的RFF技術利用復雜的ML模型進行 "端到端 "分類,主要使用深度CNN[18]。這些網絡不需要指紋步驟,因為它們將指紋提取與分類結合起來[8]。模型攝取原始信號,通過一系列相互連接的非線性層,并輸出預測的類別。根據設計,這些網絡專注于最能區分類別的特征,盡管它們傾向于產生強大的性能,但它們嚴重偏向用于訓練它們的類別。因此,在不同的操作條件下,性能的變化只能用用于訓練CNN的類別來表示。
研究二提供了一種基于神經網絡的新型指紋提取技術,該技術利用CNN來測量兩個輸入信號之間的相對失真,即一個失真信號和同一信號的未失真版本。該技術被稱為 "通過失真重建的特征提取"(FEDR),它忽略了類別信息,而是專注于量化失真本身。它改進了以前的指紋提取技術,因為它沒有假設哪些失真存在,而且它改進了端到端CNN,因為它提供了一個通用的指紋類型,可以在任何數量的類別和使用情況下進行研究。此外,用于提取指紋的神經網絡不需要接觸到RFF類,這意味著它的訓練可以獨立于這些類進行。
這兩項研究的貢獻將在下一節詳細介紹。
本節概述了這兩項研究中的每一項,強調了主要問題和貢獻。
研究I通過研究頻率通道(即載波頻率)如何影響指紋識別,擴展了以前關于操作條件對RFF的影響的工作。現代通信協議通常采用多個頻率通道,以實現同時使用和避免干擾。例如,WiFi(IEEE 802.11 b/g/n)[2]將2.4 GHz ISM頻段細分為11×20 MHz的重疊信道,而ZigBee[19]和Wireless Highway Addressable Remote Transducer(WirelessHART)[20](即基于IEEE 802.15.4的協議)使用相同的頻段,但將其分為15×5 MHz的非重疊信道[21],而藍牙[22]使用80×1 MHz非重疊信道的更精細的劃分。
現有的RFF技術在多通道情況下的應用是有限的,因為之前的模型是用單頻通道的突發事件創建和評估的,沒有考慮多通道運行的影響。本研究對四個單通道模型的多通道性能進行了評估,這些模型的復雜性不斷增加,其特點是多類馬修斯相關系數(MCC)。模型包括一個具有簡單判別分析的指紋提取器和三個神經網絡。提出了一種多通道訓練技術以提高跨通道性能,并在存在加性白高斯噪聲(AWGN)的情況下對所有模型進行了評估。
具體來說,研究I的研究問題和貢獻是:
S1-Q1. 頻率通道是如何影響射頻(RF)指紋的?
S1-Q2. 指紋中是否存在與頻率無關的信息?該信息能否在頻率無關的RFF模型中得到利用?
S1-C1. 首次評估了單通道模型對多通道數據集的敏感性。評估表明,在RFF模型訓練期間,如果不考慮頻率通道,會導致性能惡化,從MCC>0.9(優秀)下降到MCC<0.05(隨機猜測),表明以前RFF研究中的單通道模型性能不應該被期望延伸到多通道情況(實驗A)。
S1-C2。一種訓練數據選擇技術,構建的多渠道模型可以超越單渠道模型,平均跨渠道MCC從0.657提高到0.957。研究結果表明,可以從一個小的頻道子集中學習頻率診斷變異性,并可以利用它來提高RFF模型在多個頻率頻道的通用性(實驗B)。
S1-C3. 對存在加性白高斯噪聲(AWGN)的多通道模型的評估,表明多通道模型在噪聲性能方面的優勢取決于模型類型和噪聲水平。多通道神經網絡大約保持或超過了單通道性能,但多通道MDA/ML模型的性能始終優于其單通道對應的模型(實驗C)。
研究二提出了一種新型的指紋提取技術,它側重于量化信號失真,而不考慮發射器。FEDR是一種基于神經網絡的方法,用于學習相對失真潛伏空間。它依賴于一個關鍵的觀察,即只要能可靠地提取比特級的信息,就能從扭曲的對應信號中生成未扭曲的通信信號。通過一個受限的網絡結構和一個自定義的正則化損失,FEDR可以量化兩個信號之間存在多少失真。該技術對信號中存在哪種失真或多少失真不做任何假設,并對失真進行量化,不分等級,使其成為研究不同操作環境的指紋的理想選擇。
此外,由于FEDR網絡學習信號失真,它可以獨立于RFF類進行訓練,并作為靜態指紋提取器部署,它可以在終端與低復雜度的ML分類器相配合,進行RFF。FEDR被應用于合成的IQ不平衡數據和真實世界的IEEE 802.11a/g數據集。隔離失真信息和去除內容信息產生了指紋,當與基本分類器結合時,其性能超過了最先進的端到端分類技術。
研究II的研究問題和貢獻包括。
S2-Q1. 能否訓練一個網絡來學習失真信號和其相應的未失真信號之間的差異?
S2-Q2. 這些差異是否能提供足夠的信息來辨別特定的發射器?
S2-C1. 一種用于指紋提取的深度學習技術,稱為通過失真重建提取指紋FEDR。利用接收信號的失真和未失真版本,FEDR使用一個結構受限和規范化的相對失真潛在空間來重建原始失真。因為FEDR學習的是失真而不是設備,所以網絡可以獨立于RFF類進行訓練。
S2-C2. 介紹、開發和演示FEDR技術,使用具有模擬智商不平衡的合成WiFi數據。使用一個基本的密集網絡,從學到的FEDR指紋中提取了模擬失真參數,意味著失真信息被FEDR技術量化了。
S2-C3. 對從現實世界中從未見過的發射器的WiFi數據集中提取的FEDR指紋的RFF性能進行評估。基于FEDR的分類器取得了最好的性能,MCC從0.945(Nc=5類)到0.746(Nc=100類),使用的訓練參數比次好的CNN少近73%。
本文件圍繞這兩項主旨研究及其貢獻展開。第2章提供了一個簡短的背景,以提供跨越這兩項研究的技術背景。這包括關于ML的基本信息,它在射頻機器學習(RFML)中的應用,以及近期RFF研究的總結。研究一和研究二在第3章和第4章中作為獨立的手稿呈現,每篇手稿的格式都與期刊出版物一致。這兩章中的每一章都介紹了自己的相關介紹和相關工作,以及該相應研究的相關背景信息。第5章中總結了研究結論和未來的工作。
兵棋模擬是一種決策工具,可以為利益相關者分析的場景提供定量數據。它們被廣泛用于制定軍事方面的戰術和理論。最近,無人駕駛飛行器(UAVs)已經成為這些模擬中的一個相關元素,因為它們在當代沖突、監視任務以及搜索和救援任務中發揮了突出的作用。例如,容許戰術編隊中的飛機損失,有利于一個中隊在特定戰斗場景中勝利。考慮到無人機的分布可能是這種情況下的決定性因素,無人機在超視距(BVR)作戰中的位置優化在文獻中引起了關注。這項工作旨在考慮敵人的不確定性,如射擊距離和位置,使用六種元啟發法和高保真模擬器來優化無人機的戰術編隊。為紅軍蜂群選擇了一種空軍經常采用的戰術編隊,稱為line abreast,作為案例研究。優化的目的是獲得一個藍軍蜂群戰術編隊,以贏得對紅軍蜂群的BVR戰斗。采用了一個確認優化的穩健性程序,將紅軍蜂群的每個無人機的位置從其初始配置上改變到8公里,并使用兵棋方法。進行了戰術分析以確認優化中發現的編隊是否適用。
索引詞:優化方法,計算機模擬,無人駕駛飛行器(UAV),自主智能體,決策支持系統,計算智能。
兵棋是在戰術、作戰或戰略層面上模擬戰爭的分析性游戲,用于分析作戰概念,訓練和準備指揮官和下屬,探索情景,并評估規劃如何影響結果。這些模擬對于制定戰術、戰略和理論解決方案非常有用,為參與者提供了對決策過程和壓力管理的洞察力[1]。
最近,無人駕駛飛行器(UAVs)作為一種新的高科技力量出現了。利用它們來實現空中優勢可能會導致深刻的軍事變革[2]。因此,它們的有效性經常在兵棋中被測試和評估。
由于具有一些性能上的優勢,如增加敏捷性、增加過載耐久性和增加隱身能力,無人機已經逐漸發展起來,并在許多空中任務中取代了有人系統[3]。然而,由于戰斗的動態性質,在視覺范圍之外的空戰中用無人系統取代有人平臺是具有挑戰性的。在空戰中,無人機可以被遠程控制,但由于無人機飛行員對形勢的認識有限,它將在與有人平臺的對抗中處于劣勢。然而,這種限制可以通過自動戰斗機動[4]和戰術編隊的優化來克服。此外,使用無人機可以允許一些戰術編隊和戰略,而這些戰術編隊和戰略在有人駕駛的飛機上是不會被考慮的,例如允許中隊的飛機被擊落,如果它有助于團隊贏得戰斗。文獻中最早的一篇旨在優化超視距(BVR)作戰中的飛機戰術編隊的文章[5]表明,空戰戰術是用遺傳算法(GA)進行優化的候選方案。該實施方案采用分層概念,從小型常規作戰單位建立大型編隊戰術,并從兩架飛機的編隊開始,然后是四架飛機,最后是這些飛機的倍數。在模擬中沒有對導彈發射進行建模。當一架飛機將其對手置于武器交戰區(WEZ)的高殺傷概率(Pkill)區域內一段特定時間,簡化的交戰模擬器就宣布傷亡。事實證明,所提出的方法的應用是有效的,它消除了團隊中所有沒有優化編隊的飛機,并為整個優化編隊的飛機團隊提供了生存空間。
Keshi等人[6]使用了與[5]相同的分層概念,從由兩架飛機組成的元素中構建大型戰術編隊。模擬退火遺傳算法(SAGA)被用來優化編隊,使其能夠克服對局部最優解的收斂。對16架飛機的編隊進行了優化,提出的最優解表明SAGA比基本的GA更有效。最后,為了探索一個穩健的SAGA,對不同的馬爾科夫鏈進行了比較,事實證明自調整馬爾科夫電流更適合所提出的問題。
Junior等人[7]提出使用計算機模擬作為一種解決方案,以確定BVR空戰的最佳戰術,使擊落敵機的概率最大化。在低分辨率下使用通用參數對飛機和導彈進行建模,并改編了名為COMPASS的模擬優化算法,模擬了兩架飛機對一架飛機的BVR戰斗。低分辨率模型假定在水平面的二維空間內有一個均勻的直線運動。使用優化的戰術表明,擊落敵機的平均成功率從16.69%提高到76.85%。 Yang等人[8]提出了一種方法來優化飛機對一組目標的最佳攻擊位置和最佳路徑。該工作考慮到飛機能夠同時為每個目標發射導彈,并將飛機與目標有關的攻擊性和脆弱性因素作為評價攻擊位置的指標。一個高保真模擬被用來模擬每個導彈的飛機、雷達、導彈和WEZ的動態特性。這項工作并沒有解決在BVR戰斗場景中優化一組飛機對另一組飛機的編隊問題。
Li等人[9]提出了一種基于指揮員主觀認識的編隊優化方法,即在空戰中目標設備信息不確定的情況下選擇飛機編隊的問題。首先,計算戰斗機的戰斗力,這是通過指揮員的主觀認識評估目標戰斗力的基礎。戰斗機的戰斗力以能力的形式表現出來,包括攻擊、探測、生存能力、通信、電子戰、預警系統等。因此,通過采用前景理論和綜合模糊評估來優化空戰訓練。最后,一個應用實例證明了該方法在小規模空戰中的可行性。作者聲稱,利用戰斗力評估戰斗情況的能力為優化空戰訓練提供了一種新的方法。
?zpala等人[10]提出了一種在兩個對立小組中使用多個無人駕駛戰斗飛行器(UCAVs)進行空戰的決策方法。首先,確定兩隊中每個智能體的優勢地位。優勢狀態包括角度、距離和速度優勢的加權和。在一個團隊中的每個智能體與對方團隊中的每個智能體進行比較后,每個航空飛行器被分配到一個目標,以獲得其團隊的優勢而不是自己的優勢。為一對對立的團隊實施了一個零和博弈。對許多智能體參與時的混合納什均衡策略提出了一種還原方法。該解決方案基于博弈論方法;因此,該方法在一個數字案例上進行了測試,并證明了其有效性。
Huang等人[11]開發了新的方法來處理UCAV編隊對抗多目標的合作目標分配和路徑規劃(CTAPPP)問題。UCAV的編隊是基于合作決策和控制的。在完成目標偵察后,訓練指揮中心根據戰場環境和作戰任務向每架UCAV快速傳輸任務分配指令。UCAV機動到由其火控系統計算出的最佳位置,發射武器裝備。合作目標分配(CTAP)問題通過增強型粒子群優化(IPSO)、蟻群算法(ACA)和遺傳算法(GA)來解決,并在歸因、精度和搜索速度等方面進行了比較分析。在進化算法的基礎上發展了UCAV多目標編隊的合作路徑規劃(CPPP)問題,其中提供并重新定義了獨特的染色體編碼方法、交叉算子和突變算子,并考慮燃料成本、威脅成本、風險成本和剩余時間成本來規劃合作路徑。
Ma等人[12]開展的工作解決了在BVR作戰場景中優化兩組(R和B)無人機對手之間的優勢地位問題。一個無人機ri∈R對一個無人機bj∈B的優勢是通過ri和bj之間的距離、ri的導彈發射距離的下限和上限、ri的高度和bj的高度之差以及ri的最佳發射高度來估計的。決定性的變量是無人機在兩組中的空間分布和每架飛機在這些組中的目標分配。無人機在三維作戰空間BVR中的可能位置被簡化(離散化),通過立方體的中心位置來表示。每個無人機組都有一組立方體。優化問題被建模為一個零和博弈,并被解決以獲得納什均衡。
Ma等人[12]提出的工作沒有使用高保真模擬來分析無人機空間分布的選擇和分配給它們的目標對BVR作戰的影響。高保真模擬對飛機、雷達、導彈及其導彈的WEZ的動態特性進行建模。這些動態特性也影響到BVR作戰時每架飛機的行動觸發,因此也影響到最終的結果。例如,如果在兩組無人機之間第一次沖突后的時間窗口內考慮高保真BVR作戰模擬,新的沖突可能會發生,直到模擬結束。因此,每個在交戰中幸存的無人機將能夠選擇一個新的目標,這取決于可用目標的優勢值。在[12]中沒有考慮與無人機行為有關的不確定性。有關敵方無人機在戰術編隊中的確切位置及其導彈發射距離的信息是行為不確定性的例子。這兩個信息和上面描述的其他信息在BVR戰斗中是相關的:它們直接影響飛機之間的交戰結果。
在這項研究中,我們試圖解決文獻中發現的一些局限性,如低分辨率模擬、與敵人有關的不確定性的處理以及缺乏對優化解決方案的穩健性的確認,旨在提高兵棋結果的質量。我們的目標是驗證哪些藍色蜂群的戰術編隊可以在BVR戰斗中戰勝紅色蜂群。作為一個案例研究,RED蜂群使用了空軍經常采用的戰術編隊,稱為line abreast[13]。為了評估BLUE蜂群解決方案的穩健性,我們解決了新的問題,改變了RED蜂群每架飛機的位置,目的是估計新的RED蜂群編隊對BLUE蜂群的優化戰術編隊的效率的影響。
我們使用自主智能體和高保真計算機模擬來優化BVR戰斗中的無人機戰術編隊,考慮與敵人相關的不確定性,如戰術編隊中的位置誤差和導彈發射距離。統一行為框架(UBF)被采納為創建自主智能體的基礎。飛機和導彈在三維環境中用六個自由度(DoFs)建模。
該程序將在接下來的章節中進一步討論。
混合行動由多個行動領域的協調攻擊完成,包括網絡戰和信息戰。檢測混合型威脅的一個關鍵挑戰是如何識別個別事件是對手(精心策劃的)措施的結果,并將所謂不相關的事件聯系起來。由于物理和網絡及信息領域的行動可能發生在不同的時間、不同的地點、不同的速度,作為短期或長期的活動,并且可能是低強度的,因此連接這些點的任務變得更加困難。為了確定與具體任務規劃和執行相關的信息,混合威脅的風險評估必須始終在具體任務的背景下進行,包括其任務目標、行動區域和任務時間范圍。
在本文中,我們描述了兩種情況,在這兩種情況下,對手可能在物理以及網絡和信息空間中進行攻擊,以干擾行動。接下來,我們描述了一個演示器的高級架構,顯示了不同類型的傳感器和信息源是如何連接在一起的。為了應對混合威脅并充分發揮對分析員和決策者的支持潛力,有必要在不同的細節水平上實現態勢感知--從原始數據到高度聚合的風險評估--在不同的領域中共享信息,并在聚合水平上融合它們。
多域作戰(MDO)并不是一個新現象。在戰爭中,長期以來一直在多個領域開展行動。從陸、海、空行動開始,空間和網絡領域補充了對手的組合。為了對付這些,需要不同部門的深入合作。同樣,混合威脅這個詞也不是2020年的發明。一開始是混合戰爭,它與非對稱戰爭、非正規部隊和信息行動等概念混雜在一起。
在早期,重點是傳統的軍事沖突。戰場是傳統的地面,坦克、飛機和艦艇與人員一起是主要的行為者。通信是決定勝負的一個關鍵因素。數字化的開始提供了新的好處和選擇,但也給戰爭帶來了新的脆弱性。今天被稱為網絡和信息領域(CID)的使用在軍事能力方面是一個很大的推動。隨著社交媒體的出現,信息領域發生了巨大的變化,因為它使對手更容易影響公眾輿論和關鍵人物的意見。此外,隨著物聯網中相互連接的設備越來越多,網絡威脅的重要性也在增加。今天的關鍵基礎設施(用于能源、交通、衛生等)比過去更容易受到信息技術的威脅,它們是現代戰爭中的熱門目標。這為敵對勢力的攻擊打開了大門。他們的工具箱不再局限于經典的軍事資產。當然,新興的技術導致了反擊和反擊的措施,以及一場永恒的競爭。
在軍事和民用領域,對信息交流的使用和依賴日益增加,產生了新的攻擊載體,同時也產生了防御這些攻擊的新需求。在今天的沖突中,威脅影響到政治、軍事、經濟、社會、信息和基礎設施等領域。不同的威脅可能是由正規和非正規部隊造成的。這些可能是不利的國家,也可能是出于非政府考慮的團體。
一個關鍵的挑戰是如何在戰術層面上認識到個別事件是對手(精心策劃的)措施的結果,并將所謂不相關的事件聯系起來。在任務規劃或任務執行的風險評估中,這個問題的答案可能會導致對自己的措施無動于衷的決定,如使用通信渠道、部隊保護、路線規劃或反網絡行動。由于物理和網絡及信息領域的行動可能發生在不同的時間,以不同的速度,作為短期或長期的活動,并且可能是低強度的,因此連接這些點的任務變得更加困難。
不確定性是混合沖突的一個核心概念。許多混合沖突是隱蔽的、可否認的,并在正常的國家間關系和武裝沖突之間的灰色地帶進行。此外,混合沖突的信號可能來自于在很長一段時間內收集的大量公開和秘密來源,并且具有不同程度的可靠性。這些因素加在一起,對混合沖突的決策構成了重大挑戰。處理高層次的不確定性要求在情報分析和評估方面有創新的解決方案。在這方面,一個有希望的方法是對不確定性的明確估計。在這項研究中,我們借鑒了統計學、情報分析和人工智能的知識,提出了一種新的方法,并為量化和系統地估計不確定性開發了一個統計模型。該模型考慮了情報分析中不確定性的幾個重要因素:來源可靠性、信息可信度、概率語言和及時性。我們使用標記的和模擬的數據測試了我們的方法,并討論了使用人工智能和數據科學實現這一過程自動化的機會和挑戰。通過這樣做,這項研究向智能分析工具邁出了一步,以減輕混合沖突決策中的不確定性挑戰。
不確定性是情報分析中的一個基本概念。幾乎所有的情報評估都應該用不確定性來表達。這是因為評估要么試圖從不完整的或往往是模糊的數據中做出推斷,要么試圖預測未來的事件(Mandel & Irwin, 2020)。混合沖突的幾個特點1增加了情報分析和評估的不確定性。許多混合沖突是隱蔽的、可否認的,并在正常的國家與國家之間的關系和武裝沖突之間的灰色地帶進行,導致新出現的威脅的信號很弱,而且往往不完整(Monaghan, Cullen & Wegge, 2019)。此外,混合沖突的信號可能來自于長期收集的大量公開和秘密來源,并具有不同的可靠性。這些問題因日益數字化而被放大,數字化導致了公開來源信息的爆炸性增長,而這些信息越來越容易被誤傳或假傳(Treverton, 2021)。
混合沖突的這些特點給情報分析人員帶來了一些挑戰:不確定性增加、模糊性、不可捉摸性、低于檢測閾值的活動、信息過載和數字來源的爆炸(Cullen,2018)。這些挑戰反過來又加劇了情報界對不確定性的系統和定量估計的呼吁。在混合沖突的情報分析中,需要創新方法來處理這些前所未有的不確定性和模糊性。這反過來將支持決策者制定應對復雜的混合威脅的政策。這些呼吁得到了實證研究的響應,實證研究顯示有可能減少分析偏差,改善合作,促進分析透明度,并為實現(半)自動化的情報分析過程鋪平道路(TR-SAS-114,2020)。
盡管各國情報組織之間存在定性標準,并且已經提出了改進不確定性估計的方法,但據我們所知,沒有任何情報組織采用系統的不確定性估計方法(Friedman & Zeckhauser, 2012)。換句話說,不確定性的估計或多或少地隱含在 "分析者的頭腦中"。此外,不確定性最常以定性方式(如 "極有可能")而非定量方式(如 "75%可能")來表達。盡管對不確定性的量化存在一些不情愿的態度--擔心涉及到對 "最佳估計 "的判斷的虛幻的具體感(有 "硬數字")--數值有可能緩解語言障礙,解決不確定性詞匯中的語義差異,并鼓勵分析者的責任感(Dhami & Mandel, 2020)。
這項研究試圖解決這些差距,并提出一種系統地、定量地估計和表達不確定性的方法。這項工作的新穎之處在于,它提出并測試了一種從情報報告本身提取不確定性信息的方法,而不是嚴重依賴分析員的判斷(例如,Lesot, Pichon & Delavallade, 2013;Schum & Morris, 2007)。因此,我們的方法也旨在對不確定性進行更客觀和可重復的估計。另一個主要貢獻是,我們考慮了這個過程自動化的步驟、機會和挑戰(使用數據科學和人工智能的技術)。畢竟,系統地手工估計不確定性將極大地增加分析者的工作量。通過這樣做,這項工作向更快、更系統、更客觀的不確定性判斷邁出了一步,減輕了混合沖突中決策支持的挑戰。
本文旨在展示開源數據的潛力,結合大數據分析和數據可視化,以表明特定領域的彈性水平,其中包括北約彈性評估的基線要求(blr)。
本文中描述的概念驗證提取了特定領域的相關彈性指標,涵蓋了包括能源和交通在內的選定基線要求。概念驗證使用交互式儀表板,允許終端用戶從多個角度探索可用的公共數據,以及對這些數據進行高級分析和機器學習模型的結果。
關鍵詞:大數據分析,機器學習,彈性,能源,交通,媒體
軍隊越來越意識到大數據分析在作戰和戰略決策中的重要性和作用。在正確的時間獲得相關信息一直是做出最佳決策的關鍵因素。今天,這種影響甚至更大,因為數據和信息可以大規模收集并提供給每個人。技術和人工智能方法成為利用數據的巨大推動者[1]。
廣泛可用的開源數據來自媒體、科學文章、相關(專家)門戶網站,涵蓋經濟、政治、社會、能源、交通運輸等帶來了創造更有洞察力的背景的可能性,并通過分析各種來源和整合結果為任何評估提供了有價值的新維度。
從軍事角度來看,我們從開源數據中確定了許多跨不同領域的重要指標,這些指標可以用于評估整個聯盟的戰備和恢復能力。來自不同領域的許多指標似乎相互影響,可以相互關聯。
在去年,北約CI機構數據科學團隊參與了一項創新性的概念驗證,包括轉型和作戰命令,如ACT、SHAPE和JFCBS;為了識別、提取、計算和呈現開源數據中最相關的指標,以支持整個聯盟的彈性評估。由于彈性評估是一項復雜的評估,它依賴于許多不同領域和事件的關系,因此該項目定義了較小的范圍,重點關注以下關鍵領域:
?關鍵基礎設施——醫院、發電廠、港口、液化天然氣接收站和軍事設施
?能源——專注于電力和天然氣
?交通——專注于空運、公路、海運和接近實時的交通指標
?媒體——態勢感知
其主要目標是通過使用來自公開數據集的大數據來確定相關指標。然后創建有用的策劃數據和機器學習(ML)模型,以識別相關關系,并提供對當前情況和破壞性事件影響的見解。為了提高結果的準確性,我們最初關注于一個特定的地理區域。
機器學習是現代戰爭系統的關鍵組成部分。本文探討了人工智能的 7 個關鍵軍事應用。
機器學習已成為現代戰爭的重要組成部分,也是我(Nicholas Abell)作為陸軍退伍軍人和數據科學家的主要興趣點。與傳統系統相比,配備人工智能/機器學習的軍事系統能夠更有效地處理大量數據。此外,人工智能由于其固有的計算和決策能力,提高了作戰系統的自我控制、自我調節和自我驅動能力。
人工智能/機器學習幾乎被部署在所有軍事應用中,軍事研究機構增加研發資金有望進一步推動人工智能驅動系統在軍事領域的應用。
例如,美國國防部 (DoD) 的國防高級研究計劃局 (DARPA) 正在資助一種機器人潛艇系統的開發,該系統預計將用于從探測水下水雷到參與反潛行動的各種應用。此外,美國國防部在 2017 財年在人工智能、大數據和云計算方面的總體支出為 74 億美元。預計到 2025 年,軍事 ML 解決方案的市場規模將達到 190 億美元。
以下是機器學習將在未來幾年證明其重要性的七種主要軍事應用。
來自全球不同國家的國防軍隊正在將人工智能嵌入陸地、海軍、空中和太空平臺上使用的武器和其他系統中。
在基于這些平臺的系統中使用人工智能,可以開發出更少依賴人工輸入的高效作戰系統。它還增加了協同作用,提高了作戰系統的性能,同時需要更少的維護。人工智能還有望使自主和高速武器能夠進行協作攻擊。
軍事系統通常容易受到網絡攻擊,這可能導致機密軍事信息丟失和軍事系統損壞。然而,配備人工智能的系統可以自主保護網絡、計算機、程序和數據免受任何未經授權的訪問。
此外,支持人工智能的網絡安全系統可以記錄網絡攻擊的模式,并開發反擊工具來應對它們。
人工智能有望在軍事后勤和運輸中發揮關鍵作用。貨物、彈藥、武器和部隊的有效運輸是成功軍事行動的重要組成部分。
將人工智能與軍事運輸相結合可以降低運輸成本并減少人力工作負荷。它還使軍用艦隊能夠輕松檢測異常并快速預測組件故障。最近,美國陸軍與 IBM 合作,使用其 Watson 人工智能平臺來幫助預先識別 Stryker 戰車的維護問題。
正在開發人工智能技術以提高復雜戰斗環境中目標識別的準確性。這些技術使國防軍隊能夠通過分析報告、文檔、新聞提要和其他形式的非結構化信息來深入了解潛在的作戰領域。此外,目標識別系統中的人工智能提高了這些系統識別目標位置的能力。
支持人工智能的目標識別系統能力包括基于概率的敵人行為預測、天氣和環境條件匯總、潛在供應線瓶頸或漏洞的預測和標記、任務方法評估以及建議的緩解策略。機器學習還用于從獲得的數據中學習、跟蹤和發現目標。
例如,DARPA 的競爭環境中的目標識別和適應 (TRACE) 計劃使用機器學習技術在合成孔徑雷達 (SAR) 圖像的幫助下自動定位和識別目標。
在戰區,人工智能可以與機器人手術系統 (RSS) 和機器人地面平臺 (RGP) 集成,以提供遠程手術支持和疏散活動。美國尤其參與了 RSS、RGP 和其他各種用于戰場醫療保健的系統開發。在困難條件下,配備人工智能的系統可以挖掘士兵的病歷并協助進行復雜的診斷。
例如,IBM 的 Watson 研究團隊與美國退伍軍人管理局合作開發了一種稱為電子病歷分析器 (EMRA) 的臨床推理原型。這項初步技術旨在使用機器學習技術來處理患者的電子病歷,并自動識別和排列他們最嚴重的健康問題。
模擬與訓練是一個多學科領域,它將系統工程、軟件工程和計算機科學結合起來構建計算機模型,使士兵熟悉在軍事行動中部署的各種作戰系統。美國正在越來越多地投資于模擬和訓練應用。
美國海軍和陸軍都在進行戰爭分析,啟動了幾個傳感器模擬程序項目。美國海軍已經招募了 Leidos、SAIC、AECOM 和 Orbital ATK 等公司來支持他們的計劃,而美國陸軍的計劃得到了包括 SAIC、CACI、Torch Technologies 和 Millennium Engineering 在內的公司的支持。
威脅監控和態勢感知在很大程度上依賴于情報、監視和偵察 (ISR) 工作。ISR 行動用于獲取和處理信息以支持一系列軍事活動。
用于執行 ISR 任務的無人系統既可以遠程操作,也可以按照預先定義的路線發送。為這些系統配備人工智能有助于防御人員進行威脅監控,從而提高他們的態勢感知能力。
具有集成 AI 的無人駕駛飛行器 (UAV) - 也稱為無人機 - 可以巡邏邊境地區,識別潛在威脅,并將有關這些威脅的信息傳輸給響應團隊。因此,使用無人機可以加強軍事基地的安全,并提高軍事人員在戰斗中或偏遠地區的安全性和效率。
人工智能在軍事技術硬件和軟件的大規模采用,向我們展示了現代戰爭中令人難以置信和可怕的范式轉變。毫不奇怪,世界上最大的軍隊比其他任何事情都更加關注這項技術,而這場技術競賽的獲勝者可能會比美國在研制原子彈后擁有更多的全球影響力。 (作者:Nicholas Abell,美國陸軍退伍軍人)
基于人工智能 (AI) 實現的軍事情報(MI)自動化,在許多方面拓寬了情報收集程序和分析功能范圍。在當今的數字化世界中,每分鐘都以指數方式產生數據。世界各地的情報機構正在體驗新的信息維度,而這些信息在過去由于人類處理龐大數據集的能力有限而被忽視。人工智能/機器學習 (ML)的發展帶來了一種革命性的方法,可以收集大量數據并使用 ML 算法進行分析,從而為非戰時時期和戰時戰略、作戰和戰術指揮官生成各種情報信息摘要。為了應對傳統和非傳統威脅,基于機器學習的軍事情報數據收集和分析,將通過有監督、無監督、強化和深度學習方法進行,其中自動化程度通過人在回路和人在回路之外的方法確定。這些 ML 工具將有助于開發系統框架,能夠通過自適應學習技術感知和響應運行環境,從而從其經驗中學習,根據以前的學習和經驗適應不斷變化的環境。結合智能安全傳感器、監控無人機、地球觀測衛星、電子和虛擬源監控系統,可以增強軍事情報信息收集系統。數據分析和數據融合可以在信息源收集、存儲與處理、融合與分析、數據共享4層框架內,通過回歸、分類、時序分析、聚類分析、主題建模、協同過濾和關聯規則等方式進行。軍事云網絡和物聯網 (IoT)可以增強數據共享。與其他武裝軍種、相關部委、工程大學和商業利益相關者合作,將有助于制定未來的策略指南、研發、ML 算法開發計劃以及為各種基于 ML 的 MI 平臺和應用程序生產兼容的硬件。
軍事情報 (MI) 是收集、解釋和向軍事指揮官傳播信息以協助其決策的過程。它研究廣泛的作戰環境,分析各種參與者,同步相關信息并監控非戰時、戰時正在進行的事件。隨著技術的進步,多源數據呈現多倍和多維度增加。這些數據來自戰略、作戰和戰術層面,包括政治、軍事、經濟、社會、商業、媒體和多背景職業人員。情報分析人員經常面臨從大量信息中得出適當結論的復雜任務。從可用數據中得出的假設不能被認為是結論性的,因為它無法通過最大程度收集的信息源進行驗證。由于生成的信息在時間和空間上是動態的,隨著形勢變化而快速演變;從一組信息中得出的結論通常需要驗證,由于處理如此大量的數據和信息的限制,有時甚至在給定的上下文中排除了驗證。此外,需要通過與其他來源的各種相關性分析,定期檢查來源的真實性,這對從這些信息中得出的假設有明顯的影響。
不可否認,由于各種來源的數據生成激增,在信息的收集、分析和相關性評估方面將有很大的改進空間。在收集和分析過程中使用人工智能 (AI) 和機器學習 (ML) 可能是未來最有效的方法。許多技術先進的國家正在用AI/ML改造他們的智能系統。因此,需要評估機器學習是否可用于情報信息的收集和后續分析,處理非戰時、戰時的海量數據流,以獲得戰場環境和當代全球形勢最準確的結論性圖景。
軍事情報是一個動態過程,這是由于各種參與者無處不在的活動,他們產生了連續的數據流。對數據進行評估和分析,將數據分發給利益相關者,采取適當的行動并監測相應的影響,這些都是不可分割的過程,可以通過機器學習系統驅動的自動化進行。此外,通過 ML 系統可以提高和更有效地運行指揮、控制、通信、計算機、情報、監視和偵察 (C4ISR) 系統的功能,其中集成系統可以從環境中學習,并根據迭代學習過程提出評估方法。因此,可以將軍事情報、偵察和監視集成在一個綜合指揮系統下,通過機器學習可以拓寬軍事視野。
Shu-Hsien 等人(2003 年)強調了基于知識的未來軍事情報規劃系統架構。已經討論了許多應用 ML的系統架構和系統配置,其中介紹了自動和半自動分析方法的過渡。此外,還討論了一個具有假設系統實施策略的典型模型。
Prelipcien 等人 (2010) 強調了可用于分析和決策行為模型的各種 AI 算法。簡要介紹了神經網絡的應用、泛型算法、模糊邏輯和專家系統。一些模型描述了神經網絡可用于模式識別但在決策應用方面存在不足。泛型算法具有對環境動態適應的自學習原理,可廣泛用于開發多種決策方案。模糊邏輯被推薦用于基于輸入和期望輸出之間關系的決策規則。它有助于機動計劃和兵力分配,但缺乏具體的判斷決定。專家系統是基于知識規則進行識別和確定特定情況下的行動時間。并重點討論了各種算法模型設計的 ML 應用。
Dijk (2019) 在他之前關于國防應用中的 AI 和 ML 的會議上,為軍事情報分析方法編譯了許多 ML 模型。與實現研究目標相關的方法是無人傳感器和系統、使用 ML 方法對無人機進行聲學檢測、通過無人機系統進行態勢感知、可見光和熱光譜范圍內的視頻監控、用于視覺識別的神經網絡、用于行為識別的深度學習,提出了用于危險分類、信息提取和語義世界建模的深度神經網絡模型,和基于對象的深度學習多光譜圖像融合方法,應用于軍事情報分析。
Ahmed (2019) 強調了人工智能在孟加拉國 (BD) 武裝部隊監視領域應用的重要性。詳細闡述了 AI 實施路線圖架構,可用作探索預期目標的初始參考方案。調查已用于基于ML進行軍事情報分析框架的意見和指南。
Mitchell 等人(2019 年)討論了情報周期元素之間的相互聯系,并列舉了如何將 ML應用于情報周期的各個階段。通過人工智能實現自動化,所有情報機構都可以利用潛在的工作時間,這為情報機構在量化價值方面的效率加速程度提供了深入的見解。這為情報主體在情報過程中應用數學模型時的效率提供了定量比較。
中國(2017)強調了潛在的通用技術、支撐平臺和未來人工智能產業,以開發智能計算技術,用于未來人工智能驅動的重大科技項目。重要的是要發現知識計算技術是建立在自適應機器學習和分析推理技術之上的。其中,關鍵群體智能技術、跨媒體分析推理技術、知識計算與服務技術、混合增強智能架構、智能自主無人系統、智能虛擬現實技術、智能計算芯片與系統、自然語言處理技術,已成為探索未來軍事情報分析的重要創新。大數據智能理論、跨媒體感知理論、混合與增強智能理論、群體智能理論、自主協調與控制、優化決策理論、高級機器學習理論、類腦智能計算等學術研究發展規劃理論、群體智能理論和量子智能計算理論已被預測為 ML 應用于情報分析的指導學術話語。這些將通過機器學習為未來的軍事情報分析構建基于知識的架構。這些是基本的學術指導方針,持續發展將為 ML 用于軍事情報分析創建研發計劃。結合這一理論框架,Haridas(2015)提出了用于國家和軍事情報收集的大數據分析,基于大數據分析的情報可以為決策提供必要的支持。ML 被用作情報大數據分析工具,通過該工具可以實現威脅警報、社交媒體監控、信息挖掘、文檔分析和網絡安全監控。討論了基于大數據應用的情報收集系統的概念布局,其中可以對來自多個收集源的各種信息數據進行實時高級分析,以提供態勢感知、決策制定和戰斗評估。這些都為今后的研究和開發提供了較為詳細的理論概念。
Michael O'Hanlon (2019) 預測未來 20 年軍事技術將發生顯著變化,他專注于軍事技術的未來趨勢。在四類技術突破中,第一類是收集與軍事行動相關數據的傳感器,第二類是處理和分發這些數據的計算機和通信系統。預測了 2020-2040 年關鍵可部署技術的預計進展,其中顯示了傳感器和其他通信系統的部署概率。它對情報采集源、通信和信息處理技術的未來發展做出了清晰的預測。 Connable (2012) 強調了各種形式和格式的情報數據融合過程,并介紹了融合過程對于相關國家和國際參與者分析未來復雜環境的重要性。一個包含政治、經濟、軍事、社會和信息基礎設施的系統分析圖,解釋了信息流如何影響戰略和作戰重心,這驗證了未來情報數據收集和處理熱潮的顛覆性轉變。它描繪了融合的情報圖片如何更好地反映地面圖片,從而幫助情報人員了解復雜的社會-政治-軍事環境,并與大局建立聯系。因此,在未來復雜的作戰和戰略場景中,將在情報數據融合分析方面尋求范式轉變。
為了對來自不同來源的數據進行融合,Cruickshank (2019) 提出通過應用數據科學來開發軍事情報架構,為了從原始數據中提取知識的能力。建議使用 ML 和其他 AI 技術,數據科學將成為分析來自各種收集源結構化和非結構化數據的首選學科。在這方面,Kendrick (2019) 展示了一個在所有陸軍梯隊采用以數據為中心的框架。這允許在陸軍決策和執行的每一層面將數據科學有效地整合到陸軍情報中。數據科學工具可以自動化情報過程的復雜步驟,最終開發軍事情報數據庫。這些概念可以提供為軍事情報過程開發合適的 ML 模型。
Dopico 等人(2009 年)在他們的《人工智能百科全書》中匯編了大量關于當前人工智能技術發展的研究文章。在這些文章中,各種最新的智能系統建模、自適應技術、人工神經網絡、用于信息檢索的人工智能、認知建模、基于行為的神經網絡聚類、智能代理中的決策、面部表情識別程序、分層強化學習、自然語言處理程序、模糊邏輯系統的監督學習和群體智能方法模型,可以提供一個啟動框架,可用于說明 ML 如何用于解釋情報數據并將其轉換為可用信息。有了 ML 程序開發指南,對用于軍事情報分析的 ML 系統的研究和開發可能非常重要。
機器學習是人工智能的一個子集,已被發達國家和發展中國家的軍隊廣泛用于其各種軍事應用和作戰平臺。 ML算法用于分析和學習數據(Bhatnagar,2018)。 ML 旨在通過分析示例和信息中有意義的關系和數據模式,來學習和調整其思維模式,這些示例和信息旨在以類似于人類認知邏輯的性質工作(Janiesch & Heinrich,2021)。在 2018 年美國國防戰略(Defense, 2018)中宣布,將人工智能作為未來打贏戰爭的關鍵技術,這已被美國(US)列為未來戰略。俄羅斯在 2017 年重申追求人工智能技術,因為俄羅斯總統公開宣布了其對未來軍事前景的立場(Simonite,2017)。中國在 2017 年發布了一項戰略,詳細說明了到 2030 年通過人工智能引領軍事技術的路線圖(Council,2017 年)。 Maven 項目是正在進行的領先的軍事 AI 實施項目之一,在伊拉克和敘利亞打擊 ISIS 的行動中,五角大樓通過算法戰跨職能團隊將無人機視頻轉換為可操作的情報,從而開始對 ML 進行軍事應用(WEISGERBER,2017 年)。
軍事情報(MI)流程集成了情報、監視和偵察 (ISR),ISR開發了情報發送 (IC) 流程。通常,它結合了空間數據庫、屬性數據庫、案例庫、規則庫和知識庫,MI 過程通過這些知識庫進行工作。軍事偵察是獲取有關敵對部隊和自身作戰利益地形信息的過程。軍事監視是根據偵察數據對活動進行監測,以便保持有關的最新情況 。MI 結合了分析偵察和監視數據,并將原始信息轉換為對當前和未來行動具有軍事利益的有用情報的過程(Liao 等人,2003 年)。軍事 ISR 的框架如圖 1 所示。
圖1:軍事ISR框架(Liao等,2003)
從圖 1 可以明顯看出,MI 的相互交織的過程列舉了每個過程都與其他過程相輔相成,并且任何過程中缺乏活動都會導致整個 IC 過程出現故障。可以通過自動化以最小的錯誤概率加速持續的協調、修訂、更新和執行。因此,最新的人工智能強化學習方法通??過人機協作將整個過程納入情報分析框架。
MI過程是通過使用管理信息系統(MIS)進行的,通過該系統處理顯性知識。但在當今世界,有大量的數據產生,包括物理數據和虛擬數據,有屬性數據庫、空間數據庫、案例庫和知識庫等多種數據庫。地理信息系統(GIS)和基于知識的決策支持系統(KBDSS)被用于整合決策支持和知識管理功能,以增強顯性和隱性知識庫。在這方面,提出了結合情報戰支持系統(IOSS)結構,通過混合推理策略完成豐富的知識表示,證明了其在生產決策系統中的適用性(Xia & Rao,1999)。該系統的運行基于從書面知識中學習、從問題解決中學習、從問題解決失敗中學習和從遺忘中學習。這稱為自適應和強化學習,它是 ML 的主要屬性和 AI 的核心功能。由于情報收集、積累、分析和傳播功能的動態特性,基于強化學習的 ML 功能正變得越來越流行,并且依賴于 MI 過程。
MI 流程的層次結構和配置大致分為三個層次(Liao 等,2003)。第一層由作戰和戰術情報收集組織和單位組成,其通過偵察和監視手段收集數據、圖片、信號和網絡信息。這些手段大致可細分為人類智能、信號智能、圖像智能和通信智能。第二層次對提供的數據和信息進行不同的情報分析。在此層面上,分別根據日常和緊急需求提供常規和特殊情報報告。常規情報的存檔是這一層面的重要組成部分之一,它會定期更新并根據需要進行檢索。第三層是經常提出智能化要求的用戶組織、上級指揮部和高層領導。他們還定期更新態勢感知以及具有作戰和戰術價值的特殊情況。
MI的作戰流程分為常規任務和特殊任務。在常規任務中,作戰注意力集中在基于常規和標準操作程序的基本情報收集上。有時限的特殊任務側重于從特定事件、情況和人員中獲取特定情報。因此,這兩個作戰過程都闡釋了如圖 2 所示的 IC。
圖2:軍事情報作戰流程(Liao等,2003)
廣義情報作戰流程建立在對第一層情報采集組織和單位采集的原始數據處理之上。將原始數據轉換為信息的過程是由隱性和顯性知識庫完成的。這兩種類型的知識庫之間存在核心差異。隱性知識是任何智力主體的經驗、邏輯思維和膽識的積累,本質上更多的是個人屬性(Oliver, et al., 1997)。它因人而異,并且根據此類知識庫做出的決定通常是出乎意料的,可能不是基于邏輯推理(Hedlund,1994)。盡管在某些情況下,隱性知識被證明是根據情報預測任何結果的合理正確方法。但另一方面,顯性知識基于教義基礎的規則、方法和技術,本質上更精確、清晰和結構化(Zhang & Griffith,1997)。此外,程序性知識是由顯性知識支持的標準操作程序(Anderson,1985)。
在當今的數字化世界中,人類處于大量數據中,這些數據正以指數方式增長。數據的多樣性、數量、速度、矢量和無處不在不僅擾亂了當今的作戰前景,而且忽視了對通過它所承載的信息解釋,從而危及國家安全。在“信息就是力量”的格言下,作戰部隊必須具備解讀這種不斷增加的結構化和非結構化數據的能力,并找到有助于促進非戰時、戰時情報數據庫發展的模式。世界各地的情報機構正在重新定位和重組其傳統的情報作戰方法,以適應動態數據流并準備分析大型數據集。很明顯,在未來的技術時代,情報前景必須拓寬,并依賴于收集和組織大部分自己感興趣的數據來可視化未來態勢。
一般情報作戰由五個相互關聯、相互依賴的循環組成。分別是計劃、收集、處理、分析和傳播 (PCPAD)。收集、處理和分析 (CPA) 階段至關重要,需要從技術方面加以重視,因為操縱和處理的數量已經超過了人類的能力。數據收集來源包括傳感器、航空系統、衛星、無線電信號、開源互聯網、社交網絡、不同的組織、代理、對手等等。這些數據在不同的時間和空間以不同的格式在不同的介質中以二進制數據的數字格式或書面和口頭數據的形式出現。因此,它需要一個通用的解釋系統,可以處理、存儲、解釋所有類型的數據格式,并可以制作通用的情報圖。
根據 Desjardins(Desjardins,2019 年)的說法,世界正在產生大量數據,如圖 3 所示。
圖3:2019年中一天的數據(Desjardins, 2019)
Bulao (Bulao, 2020) 總結了以下關于互聯網世界中通過信息高速公路產生了多少數據的細節。
表 1:通過信息高速公路生成數據(Bulao,2020)
這些是在非戰時時期準備情報數據庫時需要分析的數據量和數據類型,以便在需要的時候幫助提取必要的信息。此外,在過去十年中,非傳統安全 (NTS) 威脅仍然很高,并且已經成為新的安全問題。因此,需要每天開發、更新和監控針對 NTS 威脅的情報,以便及時了解由于參與者的不可預測行為而導致的任何即將發生的情況。在戰時,在活躍的戰場情景下,持續的偵察和監視是任何作戰活動必不可少的組成部分。在戰場環境中,這些來自各種來源的數據被添加到以前的數據庫中,從而產生海量的數據流,這是人類操作員使用傳統的收集、存儲和分析方法無法處理和組織的。在正在進行的 AI 技術時代,有監督和無監督 ML 被廣泛用于收集大量數據。使用 ML 的優點是它可以自主或半自主地訓練自己來整理 MI 所需的數據,這使它能夠用可用的模式標記數據。因此,機器學習系統可以輕松篩選數十億字節的數據并捕獲所需的數據類型,為機器學習創建有意義的信息。雖然機器學習應用于數據收集,但系統通過數據挖掘(Chan,2020)通過正確識別、定位、分析、集成、清理和存儲來準備數據。
在討論了 MI 流程和系統架構的廣泛結構之后,不同國家的軍隊一直在通過監督學習和強化學習關注隱性知識和顯性知識來開發和重新定位其 MI 流程。隨后,對各種正在進行的MI流程系統進行了徹底的重組,這些系統將在可預見的未來主導MI流程的制定。簡要討論了一些最近開發的用于收集和分析 MI 流程的自動化系統。
? 多域指揮和控制系統(MDC2)是集中式平臺之一,收集和分析通過傳感器從陸地、空中、海洋和網絡空間收集的原始數據。這些數據與中央系統的融合是為了創建一個單一的信息庫,從而為決策者創建一個通用的作戰圖(CLARK,2017)。
? 邊境監視系統(BSS),對邊境沿線的物體和人員進行自動監視。它由傳感器、網絡資源和數據庫組成,其中開發了算法來計算指標,從而為威脅提供預測值。它不僅可以估計威脅程度,還可以評估一系列事件的不確定性程度。貝葉斯推理、背書理論、模糊推理和 Dempster Shafer 理論與編程算法一起用于 BSS 的設計(Albertus C. van den Broek,2019)。
? 聲學探測器,是一種通過機器學習方法運行的主動探測系統,可以跟蹤和探測空中和地面中的小型微型物體。 ML 方法用于使用來自各種傳感器和雷達的實時數據來檢測和評估多種算法的性能。這可以將各種音頻特征與可聽和不可聽頻譜區分開來。基于 ML 的檢測算法可以剔除噪聲并通過作戰環境產生可用的情報(Alexander Borghgraef,2019 年)
? 通過增強技術在可見光和熱光譜范圍內進行視頻監控,采用深度神經網絡記錄和檢測紋理和熱圖像。卷積神經網絡是在自適應學習算法下設計的,通過從各種來源獲取傳感器數據并做出決策。它在長波紅外和可見光譜范圍內的大規模多光譜熱世界數據集中特別有用(Vanessa Buhrmester,2019)。
? 基于深度學習的行為識別已經應用于監控系統中的傳感器數據分析。該系統致力于識別人的異常行為并跟蹤具有特定行為模式的人員(Maria Andersson,2019)。該系統通過預設的人與人、人與物、人在特定環境的行為模式來分析不同的行為特征。這是在監督學習模型上設計的,其中具備不同的行為類別和模式,通過這些模型分析和檢查受試者的行為特征,以篩選和檢測所需的感興趣的人。
? 通過結合和分析不同的情報輸入,開發了基于語義世界模型的信息提取技術。這些情報輸入的形式有人力情報(HUMINT)、圖像情報(IMINT)、開源情報(OMINT)、虛擬源情報(VIRINT)等。通過使用數據驅動的機器學習機制和語義世界建模,將信息整合、處理、融合產生一個通用的情報。這些是基于深度學習方法面向結構化和非結構化數據開發的(Almuth Hoffmann,2019)。
ML 在國防、經濟、醫療保健、交通、航空、空間技術、商業等領域的應用領域已經具有較大發展。有趣的是,這些領域的應用成果可以加速國防應用的發展。對于 MI,這些 ML 算法可以用于探索未來的應用,這些應用已經在理論研究中或已經在實際工業應用中。在此基礎上,討論了算法模型及其在模型分析中的應用范圍:
? 從互聯網資源和通信媒體中檢索多媒體信息會在高維空間中產生大量數據。主動學習支持向量機 (ALVSM) 一直在開發以處理此類高維系統,因此可以作為 MI 數據收集和分析的基本系統 (Jiang & Horace, 2009)。
? 基于智能體的智能系統建模被開發用于感知和響應作戰環境,作為一個自適應系統來獲取和存儲信息,從其經驗中學習,通過自動化或半自動化控制,調整方向,適應變化的環境。通過自適應學習不斷修改規則,使系統在不斷變化和演變的環境中做出必要的決策輸出。智能體的工作原理是通過基于代理的建模 (ABM) 結合人類和基于機器的數據進行監控、傾聽和響應 (Tang, et al., 2009)。
? 環境智能 (AmI) 通過物聯網 (IoT) 無縫集成智能設備和基礎設施。它通過語音識別和圖像轉換集成了所有的采集和監視傳感器、智能系統、人、計算機和社會交互。該系統通過認知推理的直觀界面工作,并向智能體提供合適的策略選擇(Sadri & Stathis,2009)。
? 面部表情識別系統 (FERS) 用于識別人類情緒并捕捉大量圖像序列中的面部表情。人機交互解釋面部運動并分析情緒狀態(Dornaika & Raducanu,2009)。
? 數據挖掘和數據倉庫被廣泛用于管理和分析大型數據集(基于模式識別技術)。數據倉庫可用于存儲可在需要時檢索的數據。數據挖掘用于壓縮龐大的信息存儲庫。它是一個涵蓋大數據集、模式識別、機器學習、信息與控制理論、信息檢索、并行與分布式計算和數據可視化的多學科領域(Zhou,2003)。與 MI 分析最相關的數據挖掘活動可能是關聯、序列、分類、聚類和通過神經網絡、決策樹、回歸分析和基于記憶的推理進行的預測(Wang 等人,2009 年)。
? 帶有傳感器、AI 和 ML 的地理信息系統 (GIS) 生成數字地圖,其中輸入來自地面傳感器、空中平臺和衛星。它生成定制的便攜式地圖,其中包含實時和空間放置的更新對象以及用于檢測和跟蹤系統的準確地理坐標。圖像和對象處理是通過自適應和監督機器學習的深度挖掘建模完成的(Matheson,2020)。
? 基于傳感器的認知平臺通過廣泛的神經網絡系統中的各種數據和圖像收集傳感器工作。該平臺通過模糊邏輯和遺傳算法進行操作,形成專家和學習系統(Hamblem,2017)。
要在大局下開發完整的情報概要,顯然需要關聯和融合來自多個收集源的所有情報數據。基于機器學習方法的工具可以分為三類,例如監督學習、無監督學習、強化學習和深度學習。 Alkire (Alkire, et al., 2016) 將分析工具分類為啟用分析、執行分析和支持分析。啟用監督學習方法下的分析工具可幫助智能體快速、準確、完整地執行特定的分析任務。這種半自動化工具通過人機交互和人在環結構中執行分析任務。執行分析是替代智能體的全自動工具;從而在具有人外循環結構的無監督學習方法下運行。執行分析工具可以通過基于任務和基于周期的方式進行操作。基于任務的工具從情報代理中卸載指定的任務并自主完成任務。基于循環的工具完全無需人工??干預即可執行智能循環的所有步驟。強化學習和深度學習下的分析工具通過自適應學習運行,它通過知識管理數據庫、建模、模擬環境、人際協作、縱向和橫向協作來支持智能體。
數據合成是情報數據分析的重要步驟。其目的是將來自各種收集源的所有不同元素組合在一起,以開發單個事件和情況的情報摘要。這種合成一般分三個層次進行。初級階段是基礎分析和開發,其中匯總來自單一來源的數據以制作情報產品。這是關鍵基礎,因為到下一層次的合成鏈取決于此數據組合階段。高級分析和開發層次目的在于解釋多源數據,由于來自多個來源的數據量和類型,分析和開發變得更加復雜。與此層次并行,可以創建多源分析和多情報融合,以發現情報產品之間的關系,這可以被認為是更深層次的階段。這樣做主要是為了找出數據模式,以便可以預測任何情報事件的概率。最后一個層次是所有源分析,其中所有可用數據被融合和合成在一起,并在時間、地點和行為方面對目標進行更準確的預測。這種類型的分析需要一種整體方法來組合所有類型的數據格式,這可以通過監督學習 ML 方法較好地完成。
人機界面和人機協作是將機器學習納入 MI 的重要階段。在 MI 流程的自主化方面,人在環系統一直是首選。可以通過多個層次開發將 ML 納入 MI 流程。這些層級是相互關聯的,可以從總部放置到外勤單位,以促進各種來源的信息流動。
第 1 層將主要包括人力、機械和電子來源。可以放置傳感器、無人機、衛星和雷達,以全天候收集來自全國各地和感興趣區域的圖像源,以用于作戰目的。傳感器是靜態設備,低成本設備,可以很容易地放置在感興趣的地方。傳感器之間可以建立局部連接,其中圖像數據可以收集在全國分布式服務器的數據庫中。此數據存儲功能將在第 2 層(存儲和處理)中進行協調,其中可以在中央數據庫中收集、分類和篩選來自傳感器的所有圖像數據。無人機和衛星分別是可以探測、跟蹤和定位靜止和移動物體的戰術和戰略設施。無人機可以將圖像數據發送到本地和中央數據庫,而衛星數據可以發送到中央數據庫。由于衛星范圍超出國家邊界,它可能用一個單獨的數據庫用于外部圖像存儲。雷達是靜態檢測系統,可以檢測飛行物體、移動物體。這些圖像數據可以通過光纖網絡直接存儲到中央數據庫。
圖4:第1層(數據來源)
智能安全傳感器、無人駕駛航空器(UAV)、地球觀測衛星(EOS)以及電子和虛擬源的功能
非戰時監視是 MI 部門的主要職能之一。為此,除了人工收集信息外,傳感器、無人機和地球觀測衛星(EOS)也可以在收集大量數據和信息方面發揮重要作用。
? 智能安全傳感器
智能安全傳感器是構建 MI 采集系統的關鍵元素。靜態的、通過物聯網(IoT)互聯的傳感器,可以在國家邊境形成一個大型監控網絡系統。它們可以執行各種功能,包括環境監測、武器控制、通信和信號攔截、監測軍事行動、犯罪檢測、入侵檢測、NBC 檢測等。有多種類型的傳感器可用 MI 目的。有源傳感器通過自己的輻射源發揮作用??,該輻射源在電磁頻譜的微波和無線電波長區域工作。它支持包括運動檢測和入侵檢測在內的各種 ML 算法。這些都是通過ML算法下的自動提取過程,從復雜的噪聲頻譜中處理無線電信號。智能傳感器通過強化學習機制發揮作用,這是一種多功能、自我診斷和自我補償的裝置。這些是由具有更高處理芯片的高分辨率圖像傳感處理器構建的,可以將數據從遠程站快速傳輸和共享到中央數據庫或本地數據庫。短波圖像輻射機制已證明它是用于 MI 目的的精密和可靠傳感器之一。微機電系統 (MEMS) 傳感器通過機電傳感器發揮作用,小型化機電傳感器尺寸,因其在短時間內快速部署而廣受歡迎。這些是在崎嶇不平地形和環境中長時間工作的理想傳感器。視覺解釋數據生成過程使其成為值得信賴的軍事檢測傳感器之一。納米傳感器被認為是用于 MI 的最先進技術。它們耐用、堅固、重量輕,并通過自適應學習算法工作。這些新興技術通過創建本地虛擬云網絡來共享數據。這些在難以接近的地形配置中提供了更好的連接性,該配置通過認知學習方法和通過增強現實 (AR) 界面進行工作(Electronicsforu,2018 年)。
? 監視無人機(UAV)
監視無人機(UAV) 是收集難以接近和易受攻擊的地形圖像和視頻數據的基本系統之一。由高分辨率計算機視覺和圖像處理技術建模的移動對象檢測和跟蹤 (MODAT) 框架,用于創建地理空間地圖和其他圖像文檔。對地形物體的監測、對運動物體的跟蹤和實時位置數據的更新,有助于對感興趣區域進行24小時監控。它們獨立運行,集群工作,分散方式通信,以確保最佳的安全性和應用靈活性。自動化 MODAT 框架在圖像對齊、運動檢測和對象跟蹤等三個模塊下運行。圖像數據的大量計算是基于強化學習的各種圖像處理算法進行的(Ibrahim等人,2010)。
? 地球觀測衛星
地球觀測衛星(EOS) 是一個覆蓋廣泛地形的寶貴情報收集系統,因此可以作為任何軍隊的戰略資產設施。 EOS可以從不同高度觀察獲取地形衛星圖像并將其發送回中央控制站。經過適當處理后,這些圖像可以通過機器學習研究地形配置模式的變化,并為潛在的越境入侵提供警報。對衛星圖像進行采集、存儲、處理和解釋的整個過程都是由各個ML算法模型自主完成的。
? 電子和虛擬來源
除了其他傳統和現有的情報來源之外,電子和虛擬來源對 MI 至關重要。數字簽名和潛在信息出現在各種電子媒體和虛擬信息高速公路(互聯網、社交媒體網絡和其他媒體資源)中,可以對任何即將發生的情況建立 360 度的視角和評估。通過有監督的算法建模框架來強化人工智能學習,可以從這些媒介中提取所需的信息。這需要人工的持續監督,可以通過監督學習程序來實現。互聯網上的電子資源是 ML 在檢測和提取所需信息方面發揮重要作用的主要信息來源之一。它可以通過自動化過程對所需信息進行分類和收集,由于數據量大,情報人員經常忽視這一過程。潛在情報來源包括互聯網網站、社交媒體平臺(Facebook、Twitter、Instagram 等)、視頻共享平臺(YouTube、Vimeo、TikTok 等)、新聞門戶(國內和國際)、媒體頻道(國內和國際)。這些來源的數據通常以非結構化的圖像和語音數據格式出現。外交機構是提供該國家最近在政治、經濟和軍事方面發展情況的真實來源之一,這些發展通常以結構化的形式出現。全球軍備合同和交易細節可以提供潛在對手的最新軍備能力。這些主要是結構化數據,收集來源通常需要在第 2 層進行驗證。除此之外,各種軍事技術開發計劃可能是了解未來軍事發展趨勢的最重要來源。這些數據采用結構化格式,通常需要在第 2 層進行驗證。
? 人力情報
人力資源仍將是最重要的信息來源,正如孟加拉國陸軍所流行的那樣。人力情報(HUMINT)可以通過各種人力和其他來源收集。這些可以分為常規、非常規、專業、按需和共享 HUMINT。常規 HUMINT 是從一般收集來源收集的,這些來源經過培訓并符合常規就業原則。從需要定期驗證的來源收集非常規的 HUMINT。這些來源必須符合個性配置文件下第 3 層中設置的驗證參數。專業的 HUMINT 是從高度機密的來源收集的,這些來源通常在感興趣的地方處于休眠狀態,基于自驅動機制收集信息。專業的來源通常在放置之前進行驗證,但需要與在第 3 層中執行的活動模式相匹配。 按需HUMINT 是常規 HUMINT 的擴展,其中來源通常在特定情況下放置在特定的時間范圍內。共享 HUMINT 是經常從其他組織按需或出于共同目的收到的共同情報。 HUMINT 的模式有書面、口頭和編碼格式的數據。這種結構化、半結構化甚至非結構化數據可以通過數據挖掘、NLP 和文本分析方法進行分析。非結構化信息管理架構 (UIMA) 可用于第 2 層,以處理半結構化和非結構化數據并創建通用結構化數據庫。
在第 2 層中,將協同進行數據存儲、數據處理、數據流、數據處理硬件。來自各種來源的數據可以存儲在分散的服務器中,該服務器可以將數據傳輸到中央數據庫。按需數據也可以通過軍用云網絡進行提取。數據處理可以通過 ML 算法進行。對于結構化數據,監督學習系統可以在有限的自主性下使用。對于圖像和語音數據,可以使用強化學習,使其可以從環境中學習,并可以繼承具有情境經驗的自適應配置。 NLP 可以應用于各種語音識別、語音解釋和語音定向。數據存儲可以通過大數據框架內的神經網絡來實現。數據流可以通過安全的光纖網絡進行。此外,機械采集源可以通過物聯網互連,從而可以即時和集中地執行數據流和設備控制。
圖5:第2層(存儲和處理)
基于機器學習的情報數據處理
通過各種收集源獲得的數據將形成大數據。不斷變化的數據結構需要基于ML的數據處理算法,這是一個不斷發展的研究領域。 ML算法對數據的處理是通過數據選擇(結構化、半結構化和非結構化)、數據處理、數據轉換、數據輸出和最終數據存儲來進行的。在不斷發展的數據科學領域,有多種 ML 算法方法。其中,回歸、分類、時間序列分析、主題建模、聚類分析、協同過濾、關聯規則和降維很流行,并在軍事和商業中得到廣泛應用(Bhatnagar,2018)。在使用 ML 算法進行數據處理時,可以采用三種學習類型的 ML 技術。被廣泛使用的 ML 的三個子領域是監督學習、強化學習和自動/無監督學習。在 ML 的這些子領域中,監督學習(神經網絡、貝葉斯網絡、樸素貝葉斯、支持向量機和馬爾可夫模型算法)用于對數據處理任務進行分類和估計。強化學習(Q-Learning、R-learning、TD 學習和 Sarsa 學習算法)用于從情報數據集中開發決策任務。無監督學習(k 均值、高斯模型、X 均值和 Dirichlet 過程模型算法)的主要功能是通過對形勢趨勢分析來產生數據聚類,以做出未來的預測事件(Bhatnagar,2018)。處理和分析各種來源生成的情報數據需要使用大數據框架。在眾多大數據處理框架中,Hadoop 框架最適合 MI 分析(Chowdhury,n.d.)。
第 3 層通過融合各種數據集發揮作用,從而可以開發人格剖析模型、決策模型、動態情境模型和綜合預警 (EW) 系統。結合HUMINT,收集、協作和融合個人在社交網絡(OSN)和其他網站中的互動,創建軍事和非軍事感興趣者的內部動態人格檔案。這類人員的選擇范圍可能包括敵人的軍事和非軍事領導層以及非傳統威脅集團的嫌疑行為者。根據 (Souri, et al., 2018),艾森克三因素模型(精神病、外向、神經質 (PEN) 模型)、大五模型和另類五模型被廣泛用于描述人格概況。為此,可使用樸素貝葉斯、決策樹、神經網絡和支持向量機等 ML 算法來分析在線數據集。
基于強化學習,可以實現定期更新和重構的人格輪廓。根據一個人在不同情況下的各種行為反應所形成的一系列人格特征,編制了人格模型。這種個性模型將被廣泛用于開發大量決策模型,這些模型將成為戰略和作戰領導力的重要成分。類似地,基于某種情況下的各種活動,可以將活動元素的組合以隨機方式融合在一起,以預測即將到來的情況。因此,情景元素的融合將利用機器學習的自適應學習方法構建動態情景模型。所有這些模型將有助于創建關于相關人員和任何情況的綜合電子戰,特別是高級領導和一般部隊。
圖6:第3層(融合和分析)
MI 數據融合的特點
? 數據融合是機器學習將所有類型的數據處理成可用的格式,并為當前和未來情況準備統一圖景的方法。 ML一般通過數據的不不完整、數據的關聯、數據的不一致性和數據的分散性來進行這種數據融合。數據融合是處理多源數據和信息的集自動檢測、因果、關聯、估計和組合的多層次、多方面的過程(F.E.White,1991)。它是信息從不同來源和不同時空點轉換的過程。該過程提高了檢測能力和可靠性,減少了數據模糊性,并擴展了從國家邊界到興趣點區域的空間和時間覆蓋范圍。JDL模型是軍事領域中最常見、最流行的融合模型之一,它基于輸入的結構數據,通過對象、影響、情境和過程細化四個不斷增加的抽象層次產生輸出。 JDL 模型主要側重于輸入輸出數據,而不是處理。相反,Dasarthy 的框架允許輸入/輸出數據流和功能處理(Dasarthy,1994)。基于全球、區域和國家層面事件的不確定性,MI 通常需要適應隨機數據集。根據這些隨機數據集構建大量決策模型將很有用。在這方面,Goodman (Goodman, 1997) 隨機集就是一個非常有用的過程,它具有結合決策不確定性以及呈現不確定性選項的一般模式能力。
? 用于 MI 數據轉換的數據融合技術必須經過魯棒的自適應編程框架,以解決數據類型的不完善、數據類型的多樣性、傳感器技術的多樣性以及操作環境的性質和類型。
? 數據融合算法需要能夠承受智能體和傳感器從現場收集的不完美、不精確的數據類型。它還應該能夠導出冗余數據,從而減少測量中的噪聲。
? 數據融合系統應該能夠避免反直覺的結果,并且能夠以適當的注意力處理高度沖突的數據,從而消除決策錯誤的增加。
? 數據融合方案應該能夠同時處理同質和異構數據,如音頻、視頻、無線電信號和其他形式的信號源。
? 數據融合系統需要通過傳感器注冊來克服由單個傳感器模式引起的校準誤差。該處理可以集中式和分布式兩種方式完成。分布式融合過程在必須建立無線傳感器網絡的偏遠地區非常有用。
? 數據融合方法應針對多個時間尺度,以處理傳感器接收和發送數據的多個時間尺度變化。由于數據流通過的路由是可變的,因此可能存在數據亂序到達的可能性。為了解決這種性能變化的潛在缺陷,融合中心應該具有分布式融合設置。
? 融合過程必須通過強化學習方法進行操作,以便能夠快速適應變化并相應更新。
數據融合方法
實時數據融合系統將面臨許多挑戰,因為該方法仍在探索中。主要挑戰來自非結構化、不完整和不精確的數據。很明顯,MI 數據永遠不會具有完整的結構化格式,因為預測的來源包括人類傳感器、無人機、衛星和其他虛擬和在線平臺。 Khaleghi (Khaleghi, et al., 2011) 描述了數據融合系統中的幾個與數據相關的挑戰。數據融合方法的分類如圖 7 所示
圖7:數據融合方法的分類(Khaleghi等,2011)
無論數據結構如何,ML都可以使用數據融合算法,在多個數據模型中創建數據結構,以滿足MI的各種需求。其中,數據不完備性是數據融合系統面臨的最基本的挑戰,主要表現為不確定性、模糊性、不完全性和粒度性。有許多建議的不完善的數據融合框架來解決這些限制。流行的數據融合框架是概率、證據、模糊推理、可能性、粗糙集理論、混合和隨機集理論融合。該框架具有處理數據不確定性、模糊數據融合、模糊數據處理、不完整數據處理和不完整數據融合的能力。
第 4 層是數據共享平臺,將與內部和外部利益相關者共享完整的態勢模型和集成電子戰信息。這個集中的數據共享平臺將連接到所有編隊指揮部,使態勢感知可以即時到達。這些可以通過具有單獨通信集線器的光纖網絡連接到其他組織和利益相關者。
圖8: 第4層(數據共享)
軍事云計算在MI融合中的應用
軍事云計算(MCC)可以為通用情報數據和資源提供方便的按需共享網絡訪問。 MCC 至關重要的可訪問性功能使其可靠、耐用且安全,具有軍事級別的網絡攻擊保護。它將為所有情報大數據和其他資源提供一個動態的資源池和存儲設施,以便任何情報人員可以在世界任何地方隨時訪問它,同時可以在任何地方、時間上傳各種數據。這樣,MI 資源可以 24 小時共享和訪問。 MCC 可以在 4 層單獨的分散功能中構建。 Cheng & Liao (Cheng & Liao, 2011) 將它們命名為資源層、面向服務的架構層、面向服務的工具層和云計算應用層。資源層將保存所有的物理資源和邏輯資源。物理資源包括存儲配件、網絡設備、物理數據庫配件、服務器等。邏輯資源包括應用軟件和其他相關軟件。面向服務的架構層執行情報服務、通用服務和專業服務的資源共享。面向服務的工具層提供用戶接口和訪問接口,進行仿真建模和調試加密數據。
用于情報數據傳輸的軍事物聯網
軍事物聯網 (MIoT) 將是一個新興且必不可少的系統,用于連接同一軍用級網絡下的所有設備、傳感器、無人機、衛星和其他采集設備。它將人和機器互連在一起,促進人機協作。 MIoT將由除了采集設備之外的所有軍事平臺組成,因此也可以傳遞執行部署指令。這不僅允許信息不斷地流入中央數據庫,而且還將流出的信息傳播給最終用戶。
基于上述關于將機器學習納入 MI 過程的各種因素討論,提出以下建議:
? 除了傳統的 MI 收集源之外,還可以在感興趣的領域中加入基于機器學習的收集源。
? 可引入數據融合中心,對各類數據進行組合融合,形成統一的情報圖。
? 可以與工程機構、政府機構和相關行業合作啟動研發,以幫助推動機器學習算法和配套硬件的自主創新和開發。
? 可規劃ML算法開發時間線及相關MI應用平臺,將MI過程向人機協作轉變。
? 可以在 MI 框架內引入情報層級框架,以便協同實現自動化。
? 必須通過充分更新的防火墻系統確保每一層來源的信息安全。
? 在 MI 流程的每一層都需要確保備份數據存儲。
機器學習是人工智能的一個子集,已被發達國家和發展中國家的軍隊廣泛用于各種軍事應用和作戰平臺。為支持這一趨勢,發達國家通過機器學習重新定位其情報收集和分析過程,以更深入地了解情況并從各個角度進行分析。軍事ISR的框架包括空間數據庫、屬性數據庫、案例庫、規則庫和知識庫,這些過程相互交織。在機器學習應用的情報分析框架中,可以通過自動化以最小的錯誤概率要求人機協作,來加速持續的協調、修訂、更新和執行。地理信息系統(GIS)和基于知識的決策支持系統(KBDSS)被用于整合決策支持和知識管理,以增強顯性和隱性知識庫這兩種形式的情報知識方法。結合智能作戰支持系統(IOSS)結構,通過混合推理策略完成豐富的知識表示,證明了其在決策系統中的適用性。 MI的層次結構和配置大致分為三個層次;第一級由作戰和戰術情報收集組織和單位組成,第二級對收集組織和單位提供的數據和信息進行不同的情報分析,第三級是用戶組織,上級總部和高層領導經常對情報提出要求。第一級和第二級的數據收集和分析步驟可以通過結合基于人工智能的功能系統來實現自動化。
ML 在 MI 中的全球軍事應用的最新發展范圍,包括多域指揮和控制系統 (MDC2)、邊境監視系統 (BSS)、聲學探測器、視頻監視、基于深度學習的行為識別,及通過語義世界建模進行信息提取。這些系統或技術通過使用監督、強化和深度學習方法,來分析來自人力情報 (HUMINT)、圖像情報 (IMINT)、開源情報 (OMINT)、虛擬源情報 (VIRINT) 和許多其他來源的信息。用于 MI 分析的 ML 算法模型已經開發出來,該領域的一些重要成就是主動學習支持向量機 (ALVSM)、基于智能體的智能系統建模、環境智能 (AmI)、面部表情識別系統 (FERS)、數據挖掘和數據倉庫、帶有傳感器的地理信息系統 (GIS) 和基于傳感器的認知平臺。
MI 的收集、處理和分析 (CPA) 階段至關重要,需要從技術方面予以重視,因為操縱和處理龐大的數據量已經超過了人類的能力。數據來源的類型包括傳感器、航空系統、衛星、無線電信號、開源互聯網、社交網絡、不同的組織、代理、對手等等。在非戰時時期,非傳統安全 (NTS) 威脅在過去十年中一直居高不下,并已成為新的安全問題。在戰時,在活躍的戰場情景下,持續的偵察和監視是任何作戰活動必不可少的組成部分。在戰場環境中,這些來自各種來源的數據被添加到以前的數字數據庫中,從而產生大量數據流。 ML 系統可以輕松篩選數十億字節的數據,并捕獲所需的數據類型,為 MI 創建有意義的信息。當機器學習應用于數據收集時,系統通過正確識別、定位、分析、清理和存儲來準備數據。有各種 ML 方法利用復雜算法和預測建模來進行數據分析以預測未來的結果。監督學習適用于訓練和測試數據集,其中訓練數據集可用于 MI 智能體訓練 ML 系統。無監督學習用于查找數據集中的數據結構模式。強化學習使用復雜的算法從其經驗中學習并重新設計其程序以分析預測情況。深度學習通過人工神經網絡發揮作用,其中數據保存在多個層級中,以便通過可變數據接口層使用。在 MI 的自動化中,發現 AI的應用在 MI 過程的處理和分析階段帶來了最大影響。因此,機器學習的內在價值將為 MI 組織促進和利用“自動化紅利”,以便人類可以將節省的時間用于其他高優先級任務。
非戰時監視是 MI 部門的主要職能之一。除了手動和人工收集信息外,傳感器、無人機和 EOS 還可以在收集大量數據和信息方面發揮重要作用。智能安防傳感器可以通過物聯網互聯,可以形成跨越國界的大型監控網絡系統。監視無人機 (UAV) 是通過移動目標檢測和跟蹤 (MODAT) 框架收集無法訪問和易受攻擊的地形圖像和視頻數據的基本系統之一。地球觀測衛星 (EOS) 是一種覆蓋廣泛地形的寶貴情報收集系統,因此可以作為任何軍隊的戰略資產設施。通過監督算法建模框架來強化人工智能學習,可以從電子和虛擬資源中提取所需信息。 ML算法對數據的處理是通過數據選擇(結構化、半結構化和非結構化)、數據處理、數據轉換、數據輸出和最終數據存儲來進行的。用于情報數據處理的 Hadoop 框架作為大數據框架執行,用于處理和分析從各種來源生成的情報數據。數據融合是 ML 將所有類型的數據處理成可用的格式并準備好當前和未來情況的統一圖景的方法。 ML一般通過數據的不完善、數據的關聯、數據的不一致性和數據的分散性來進行數據融合。在各種融合系統中,Joint Director of Laboratories (JDL) 模型、Dasarthy 框架和 Goodman 隨機集執行各種數據融合、特征融合、決策融合和信息融合。流行的數據融合方法涵蓋了概率、證據、模糊推理、可能性、粗糙集理論、混合和隨機集等多種理論。數據合成是情報數據分析的一個重要步驟,它可以將來自各種收集源的所有不同元素組合在一起,以開發單個事件和情況的情報摘要。軍事云計算(MCC)的動態資源池和所有情報大數據及其他資源的存儲設施,可以為通用情報數據和資源提供便捷的按需共享網絡訪問,讓任何情報人員可以在世界任何地方的任何時間訪問它,同時可以在任何時間上傳各種數據。
數據收集、數據存儲和處理、數據融合和分析以及最后的數據共享四個層次的功能,可以通過監督和強化學習方法開發。這將允許全方位擴展 MI 的范圍,并且可以監視感興趣的物理和虛擬區域。因此,ML 的應用將促進 MI 收集和分析過程的自動化,以便可以查看自己興趣點的所有情況,并且戰略、作戰和戰術領導者清楚接下來會發生什么。
Nizam Uddin Ahmed 中校, 在孟加拉國國防學院擔任高級研究員。他對國防技術發展有著廣泛的興趣。他在 Springers、Mirpur Papers 和 NDC 期刊上發表了多篇論文。目前,他正在研究將人工智能納入武裝部隊的可行性,并開發各種深度學習模型。
?
對于群體智能中的人類操作員來說,關鍵情況下的決策支持至關重要。自主系統共享的大量數據很容易使人類決策者不堪重負,因此需要支持以智能方式分析數據。為此,使用了用于評估情況和指示可疑行為或統計異常值的自主系統。這增強了他們的態勢感知能力并減少了工作量。因此,在這項工作中,強調為檢測監視任務中的異常而開發的數據融合服務,例如在海事領域,可以適應支持集群智能的運營商。此外,為了使人類操作員能夠理解群體的行為和數據融合服務的結果,引入了可解釋的人工智能 (XAI) 概念。通過為某些決策提供解釋,這使得自主系統的行為更容易被人類理解。
作者解決了由于自主系統共享大量數據而導致的信息過載問題。為了緩解這個問題,他們建議通過兩種智能數據分析方式來幫助人類操作員。第一種方法是自動異常檢測,這可能會加強人類操作員的 態勢感知SA 并減少他們的工作量。第二種方法是可解釋的人工智能 (XAI) 概念;它們有可能使群體行為以及異常檢測結果更易于理解。
作者認為,控制一群無人機仍然具有挑戰性。一方面,(半自動化)群體代理“必須決定行動方案”;另一方面,人類操作員必須決定他們的行動,例如與群體互動。提出的建議力求改善人在循環中。考慮到海上監視的應用,使用非固定代理的動態方法具有幾個優點。首先,某些場景只能使用動態方法進行管理;其次,與固定監視傳感器相比,代理更便宜;第三,在多個地點靈活使用代理可以減少操作群體所需的人員數量。然而,情況評估仍然需要知情的操作員。
作者認為,在海洋領域用于船舶分析的異常檢測算法可能適用于引入以下場景的群體。“假設我們有一個群體來支持海上船只,這些船只不僅會收集它們自己的傳感器系統可用的數據,還會收集所有資產的數據。所有來源收集的信息都需要融合成一幅連貫的畫面。這不應僅限于 JDL 數據融合的第一級,而應包括更高級別的數據融合過程,以獲取有關附近所有對象的可用信息。” 數據驅動的方法能夠應對這種情況。文獻提供了三種檢測位置和運動異常的方法:統計解釋為與正常行為相比的異常值;聚類分析聚類相似的軌跡和確切的路線;用于建模正常移動模式的深度學習方法。為了應對更復雜的場景,包括船舶周圍環境(基礎設施、地理、天氣等)在內的算法是必要的。在某些復雜異常的情況下,區分正常和異常行為需要基于規則、基于模糊、多智能體或基于概率圖形模型的算法。對于所有提到的算法類別,作者都指出了大量的示例算法。
一些算法是黑盒模型,因此,它們的解釋對于人類操作員來說是復雜的。XAI 概念可以幫助緩解這個問題。XAI 概念旨在“提供道德、隱私、信心、信任和安全”,并努力在“它已經做了什么、現在正在做什么以及接下來會發生什么”中明確決策。,從而提高了人工操作員的 SA。考慮到 XAI 模型,模型特定方法(僅限于某些數學模型)可以與模型無關(適用于任何類型的模型)方法區分開來。
在目前的貢獻中,重點是與模型無關的方法。考慮到這些,局部解釋方法(解釋整個模型的單個預測結果)可以與全局解釋方法(解釋整個模型的行為,例如以規則列表的形式)區分開來。此外,作者使用特征屬性、路徑屬性和關聯規則挖掘來區分方法。通過特征屬性,“用戶將能夠了解他們的網絡依賴于哪些特征”;方法示例是提供全局和局部可解釋性的 Shapley Additive Explanations (SHAP) 和指示“模型在進行預測時考慮的輸入特征” 的局部可解釋模型無關解釋 (LIME)。路徑集成梯度(PIG,使用局部解釋)等路徑屬性提供了對模型預測貢獻最大的特征,從而深入了解導致決策的推理。關聯規則挖掘(ARM)是另一種使用全局解釋的方法,發現大型數據集中特征之間的相關性和共現。ARM 方法使用簡單的 if-then 規則,因此被認為是最可解釋的預測模型。可伸縮貝葉斯規則列表 (SBRL)、基尼正則化 (GiniReg) 和規則正則化 (RuleReg) 技術被認為適用于監視任務。
作者認為,使用這樣的 XAI 概念,人類操作員(決策者)可以更好地理解、更好地控制和更好地與一群自主代理進行通信,尤其是在具有挑戰性的環境中。總而言之,將異常檢測和 XAI 概念這兩種方法應用于人類在環、用戶對群體智能的理解和信任可能會得到改善。