在這項工作中,我們解決了雷達波形優化和目標跟蹤的問題。提出了一種基于控制論方法的優化波形設計和目標跟蹤算法,其中波形參數是通過最小化跟蹤均方誤差(MSE)而自適應設計的。在這項工作中,采取了幾種方法來提高雷達跟蹤性能。首先,卡爾曼濾波器被用來估計目標位置,用它來優化波形參數。實驗結果表明,所提出的算法有能力在笛卡爾空間內跟蹤飛行目標,它提供了對目標位置和目標速度笛卡爾矢量以及徑向速度的準確估計。該算法根據估計矢量在飛行中調整波形參數。在文獻中,多普勒效應理論被大量用于估計目標速度。在某些條件下,如跟蹤高速目標或惡劣的海洋和天氣條件下,多普勒效應就不那么有效。因此,在這第一個方法中,引入了一種依賴于卡爾曼濾波估計的算法,而不依賴于多普勒效應。一個具有實時自適應參數的低通濾波器被應用于估計的速度矢量,并提取準確的速度估計。此外,從一個現實的角度來解決雷達跟蹤問題,承認目標運動不能像我們提出的使用卡爾曼濾波器那樣用矩陣來描述,因此引入了交互式多模型算法來估計目標位置。通過模擬,我們證明了所提算法的良好性能,并證明波形優化可以提高雷達的跟蹤性能。最后,考慮從兩個天線而不是一個天線收集信息,并使用其中一個數據融合算法,以及IMM算法,我們能夠減少跟蹤誤差,并為跟蹤問題提供一個更穩健可靠的解決方案。
圖 1. 大腦/認知雷達感知-行動周期。
認知被定義為參與認識、學習和理解事物的心理過程。這個定義介紹了定義CR的三個主要成分:
系統與環境持續互動并感知其地標的能力,包括潛在的目標和障礙物;這使得相控陣天線成為CR的主要組成部分,因為它們能夠快速掃描環境。
智能地處理接收到的回波,并提取有關目標和周圍環境的測量值的能力。
能夠提取有關目標和環境的信息,并相應地使用它來做出有關波形和目標運動估計的決定。
認知型雷達在某種程度上模仿了大腦的學習方式,并根據感官采取行動,遵循一個類似的循環:感知、學習、調整、行動。它們不斷地從環境中學習,并作出決定以提高跟蹤性能。類似的循環,即眾所周知的感知-行動循環(PAC),在解釋大腦如何工作或描述一些智能系統的文獻中被多次提及([2][3][4])。引用[2],神經科學家Joaquin Fuster將感知-行動循環描述為 "在處理目標導向行為的過程中,信息從環境到感覺結構,再到運動結構,再次回到環境,再到感覺結構,如此循環往復"。圖1解釋了與認知雷達相關的大腦的運行周期。在這項工作中,我們討論了這個閉環循環的所有步驟,這些步驟制約著CR的性能。提出了一個系統模型,并進一步討論了以估計和波形優化過程為重點的內容。
在文獻中,討論了兩種主要的波形選擇方法:控制論和信息論。在這項工作中,考慮了控制理論方法中的波形選擇標準。雷達波形參數主要通過最小化跟蹤均方誤差(MSE)來確定。
CR有一個閉環的工作循環。該系統依靠接收器的反饋來收集關于目標和環境的知識。這些知識然后被用來優化發射波形,并改進對目標的探測、跟蹤、估計和識別。這個概念在2006年由S.Haykin[1]在文獻中首次提出,他寫道,我們引用[1]"整個雷達系統構成了一個動態的封閉反饋回路,包括發射器、環境和接收器。
CR的運行周期(即上述閉環)從發射器對環境的照射開始。然后,從環境中反彈出來的傳輸波形(即目標回波、雜波等)被接收器截獲。關于目標和環境的有用信息從接收到的回波中提取出來,然后更新一個信息庫(記憶塊),在下一個周期由目標估計器(TE)作為一組關于環境的先驗知識使用。根據TE提供的估計結果,波形被優化。通常考慮用貝葉斯方法來實現目標估計器。
在CR中,提取的信息不僅在接收機層面發揮作用,而且在發射機層面通過改變波形和一些相關參數,如脈沖重復頻率(PRF)、脈沖寬度、脈沖數N和雷達發射時間表來發揮作用。這方面是CR與經典的自適應雷達的區別,后者只能在接收層面使用提取的信息。
波形優化設計作為一個重要的研究課題出現在信號處理界,因為它在許多領域都有廣泛的應用,如通信系統、聲納,以及在我們感興趣的情況下,改善雷達系統的性能。文獻中討論了許多設計標準,其中我們提到了最大信噪比(SINR)標準[9]、最大探測概率標準[14]、最大互感信息(MI)[8]標準和最小化均方誤差標準(MMSE)[10]、[11]。這些設計標準方法可以分為兩類:控制理論方法,其目的是為連續運行的動態系統開發一個控制模型;信息理論方法,更側重于研究信息流和從接收的測量數據中提取更多的目標信息。本文采用了控制理論方法,通過最小化跟蹤MSE來確定最佳波形選擇/設計。
本文介紹了動態目標跟蹤應用中的數據融合網絡的軟件框架。該框架背后的想法是促進完整的分布式融合網絡或特定部分的實施和評估,例如,通信和數據壓縮的策略。該框架由抽象出分布式數據融合網絡所需基本構件的類組成。該框架提供了一個快速原型設計的工具,并促進了對目標跟蹤應用中分布式融合網絡的評估。對多靜態和移動傳感器、通信和融合網絡的研究興趣表明了這種工具的重要性。具體來說,就是為評估不同的融合結構、算法和傳感器類型的預期性能提供數據。
由多個異質傳感器組成的網絡中的數據融合是一個重要的研究領域,特別是用于態勢感知的目標跟蹤。越來越多的傳感器和移動傳感器的能力引起了哪些數據需要通信以及如何通信的問題。在一個最佳設置中,所有的傳感器都能與中央融合中心進行通信。由于通信帶寬有限,這種情況并不總是存在,而且對于大型的傳感器網絡來說,這可能不是最好的解決方案。分布式融合架構提供了一種更加靈活和穩健的數據融合方式,因為某種程度的融合可以由傳感器本身作為本地融合節點來執行。本地融合的數據是傳感器數據的一個更緊湊、更精細的表示,可以與網絡中的其他節點進行交流。此外,這使得只暴露出融合數據而不是原始數據的傳感器得以整合。
在目標跟蹤中,融合數據對應于檢測到的目標的估計運動軌跡。在一個分布式的目標跟蹤網絡中,估計的軌跡被交流和融合,而不是來自例如雷達或相機傳感器的原始探測。為了融合軌跡,采用了軌跡對軌跡的融合(T2TF)方法。存在精確的T2TF方法[1]。精確方法的缺點是需要對估計值之間的相關性有充分的了解,這反過來又要求有更多的信息被傳遞,而這些信息可能是不可用的。
為了彌補這一點,人們可以應用處理未知相關性的融合算法,如反協方差交集(ICI,[2])。ICI算法與眾所周知的協方差交叉(CI,[3])算法的方法相同。該算法處理待融合的估計值之間存在的未知協方差,這是分布式融合網絡的核心。與CI相比,ICI算法是一個不太保守的選擇,但在許多情況下仍然是一致的。該算法是為估計值之間存在共同信息的情況而定制的。這通常是分布式目標跟蹤網絡中的情況,其中一個共同的目標模型被用來跟蹤檢測到的目標。以前的工作在[4]和[5]中提出,真實數據被用來評估監控應用中的這種融合算法。
在信息領域,諸如信道緩存(CC,[6])這樣的融合基礎設施可以用來處理信息不被重復使用,也就是重復計算。信道緩存是基于一個由信道濾波器[7]啟發的單一連接的樹形拓撲網絡。與信道濾波器相比,信道緩存在傳輸時不跟蹤節點之間的共同信息。這意味著一種更容易的通信方式,因為一個節點只是傳輸它的本地獨立信息。收到的信息被存儲在本地信道緩存中,該緩存保持了每個軌道和節點的貢獻信息的歷史。由于信息是加法的,延遲的信息可以很容易地被添加到緩存中,例如,在臨時的通信損失中。從整合的角度來看,它使傳感器的臨時連接成為可能,如一個被激活的無人機,以更新一個特定目標。在一個節點上,只需將所有本地和緩存中收到的來自特定目標的信息相加,就可以建立一個全局軌道。
為了在網絡中實現一個共同的態勢圖,需要有效的通信。特別是當鏈路的帶寬有限和通信條件不同的時候。在有限的通信鏈路上發送數據需要制定發送什么和何時發送的策略。處理動態通信條件需要網絡拓撲結構對單個節點的零星損失具有魯棒性。
這些方面促使我們建立一個框架來促進分布式的融合網絡的實施和模擬。在這里,我們重點關注分布式的目標跟蹤應用,以及不同的融合方法選擇、數據關聯和通信策略如何影響跟蹤性能。我們提出了一個用MATLAB?編寫的基于抽象類結構的軟件框架,以及用于仿真和評估的工具(2.0節)。最后,該框架被用于一個案例研究,以介紹如何在一個特定的區域監控場景中使用該框架來評估通信策略和融合基礎設施的不同選擇(第3.0節)。
該框架分為兩部分:結構和模擬。第一部分由實施和設計的構件組成,抽象出分布式融合網絡的核心功能。第二部分處理仿真,以支持在確定的場景中對已實施的網絡進行評估。
架構中最基本的構件是節點和鏈接。節點是一個對象的抽象,它可以與其他節點連接以創建一個網絡。鏈接是對兩個節點之間的通信通道和數據運輸的抽象化。一個融合數據的節點被稱為融合節點。融合節點繼承了節點類的額外屬性和功能。它仍然是抽象的,必須由用戶來實現。所需的功能由具有共同接口的對象表示,以方便實現。這些對象抽象了本地融合、軌道融合、數據關聯和通信管理。節點、鏈接和融合節點對象被歸入網絡和融合對象中。為了將這些對象與物理對象連接起來,我們有這樣的對象:平臺和傳感器。一個平臺對象抽象了一個具有位置和速度等屬性的物理對象。傳感器對象抽象出一個物理傳感器,它可以觀察物理世界,并根據測量模型產生觀察結果。以上描述的對象,如圖1所示,是構成該框架實施部分的基礎的核心對象。
為了更詳細地描述融合節點,圖2展示了它的屬性、功能和數據流。箭頭顯示了內部對象和外部對象之間的數據流。抽象的功能對象用粗邊框表示。使用來自安裝的傳感器的測量值,軌道由本地融合器對象(如目標跟蹤器)估計,并作為本地軌道存儲。通信管理器封裝了處理數據傳輸和接收邏輯的所有功能。例如,可以在通信管理器中實現一個智能邏輯,比較本地和接收的數據,并只傳輸信息量最大的數據。收到的軌跡數據被存儲為遠程軌跡。全局軌道的生成由軌道融合器處理,使用關聯器對象計算的關聯。在這里,關聯代表了一個假設,即一個本地或遠程軌道與一個全局軌道來自同一個目標。使用這種架構可以實現和設計不同類型的融合基礎設施,并結合不同的融合算法和關聯邏輯。
圖 1:框代表不同對象的框架架構。基礎對象是鏈路、節點、平臺和傳感器。融合節點繼承了具有附加屬性和功能的節點對象。虛線將網絡和融合對象與物理對象分開。
網絡和融合對象通過應用離散時間步進方案支持仿真。仿真在一個時間循環中運行,對象在時間上以特定的順序向前邁進。物理對象通過通用接口集成到仿真中,支持隨機生成數據或讀取預定義的數據,如軌跡和探測。當模擬循環開始時,物理對象的數據被生成或讀取。在模擬過程中,每個時間步驟都重復三個步驟:推進物理對象,處理所有節點中的可用新數據,推進鏈接。仿真循環可以擴展到處理多次仿真,即蒙特卡洛。
圖 2:更詳細的融合節點對象。虛線表示融合節點的邊界。粗線框是要由用戶實現的抽象對象。本地測量由本地融合器處理。通信管理器處理如何發送和接收數據。全局軌道由軌道融合器使用關聯器計算的關聯生成。
認知方法在幾乎所有方面可提高現有雷達的性能,這導致了近年來研究的激增,空軍雷達建模和仿真(M&S)工具的一個關鍵差距是缺乏針對分布式全適應雷達(FAR)系統的全面、動態分布式雷達情景生成能力。截至2015年初,所有的研究都是在理論上推進概念,并通過模擬檢驗其性能,或者最多使用預先錄制的數據。沒有關于實驗驗證概念的報告,主要是因為還沒有開發出測試它們的必要硬件。然而,為了確定應用認知處理方法的真正性能潛力,這一步驟是至關重要的。為了解決這個問題,俄亥俄州立大學(OSU)電子科學實驗室(ESL)的認知傳感實驗室(CSL)與Metron公司、空軍研究實驗室(AFRL)和空軍科學研究辦公室(AFOSR)一起,已經開始了一項研究計劃,從分析和實驗上開發和檢驗認知雷達處理概念。
CSL設計并建造了認知雷達工程工作區(CREW),這是世界上第一個專門用來測試完全自適應和認知算法的雷達測試平臺,Metron和OSU開發了一個認知FAR系統的理論框架,在單一傳感器和目標的目標探測和跟蹤范圍內確定了關鍵的系統組件并進行了數學建模。我們一直在開發建模、模擬、分析和實驗能力,以證明FAR系統比傳統的前饋雷達(FFR)系統取得的性能改進。我們從OSU的軟件定義雷達(SDR)系統的模擬場景和預先記錄的數據開始。我們現在有能力利用CREW演示認知雷達跟蹤系統的實時操作。
這個項目的目標是為分布式FAR雷達開發一個基于MATLAB的M&S架構,從而能夠在模擬的、以前收集的和實時的流式數據上進行算法開發和測試。在第一階段,我們開發了一個基線FAR M&S架構,該架構采用面向對象編程(OOP)方法在MATLAB中編碼。它包括一個控制感知-行動(PA)周期運行的FAR引擎和確定下一組傳感參數的軟件對象;從傳感器獲取數據;處理數據以跟蹤目標;存儲和顯示傳感和跟蹤過程的結果。我們開發的模塊實現了模擬和預先錄制的SDR數據實例,以及實時和模擬的CREW數據實例。
第一階段開發的FAR M&S架構允許在模擬和實驗CREW數據源之間,以及在驅動傳感的FAR算法之間進行透明切換。輕松交換傳感和處理對象的能力將允許快速開發和測試認知雷達算法,通過構建M&S功能來避免重復工作和 "單點 "解決方案。它將使工業界、學術界和空軍的研究人員之間的合作成為可能,因為不同研究人員開發的算法可以使用一致的模擬、收集的數據和實驗室條件進行測試和比較。
認知型雷達,根據IEEE標準雷達定義686[1],是 "在某種意義上顯示智能的雷達系統,根據不斷變化的環境和目標場景調整其操作和處理"。特別是,嵌入認知型雷達的主動和被動傳感器使其能夠感知/學習動態變化的環境,如目標、雜波、射頻干擾和地形圖。為了達到探測、跟蹤和分類等任務的優化性能,認知雷達中的控制器實時適應雷達結構并調整資源分配策略[2, 3, 4]。對于廣泛的應用,已經提出了不同的適應技術和方法,例如,自適應重訪時間調度、波形選擇、天線波束模式和頻譜共享,以推進認知雷達背景下的數學基礎、評估和評價[5, 6, 7, 8, 9, 10]。
雖然認知方法和技術在提高雷達性能方面取得了很大進展,但認知雷達設計和實施的一個關鍵挑戰是它與最終用戶的互動,即如何將人納入決策和控制的圈子。在國家安全和自然災害預報等關鍵情況下,為了提高決策質量和增強態勢感知(SA),將人類的認知優勢和專業知識納入其中是必不可少的。例如,在電子戰(EW)系統中,在設計適當的反措施之前,需要探測到對手的雷達。在這種情況下,戰役的進程和成功取決于對一個小細節的觀察或遺漏,僅靠傳感器的自動決策可能是不夠的,有必要將人納入決策、指揮和控制的循環中。
在許多應用中,人類也充當了傳感器的角色,例如,偵察員監測一個感興趣的現象(PoI)以收集情報。在下一代認知雷達系統中,最好能建立一個框架來捕捉基于人類的信息來源所建議的屬性,這樣,來自物理傳感器和人類的信息都可以被用于推理。然而,與傳統的物理傳感器/機器4的客觀測量不同,人類在表達他們的意見或決定時是主觀的。人類決策的建模和分析需要考慮幾個因素,包括人類的認知偏差、處理不確定性和噪音的機制以及人類的不可預測性,這與僅由機器代理組成的決策過程不同。
已經有研究工作利用信號處理和信息融合的理論來分析和納入決策中的人類特定因素。在[11]中,作者采用了先驗概率的量化來模擬人類在貝葉斯框架下進行分類感知而不是連續觀察的事實,以進行協作決策。在[12,13]中,作者研究了當人類代理人被假定使用隨機閾值進行基于閾值的二元決策時的群體決策性能。考慮到人類受到起點信念的影響,[14]中研究了數據的選擇、排序和呈現對人類決策性能的影響。在人類協作決策范式中,已經開發了不同的方案和融合規則來改善人類人群工作者的不可靠和不確定性[15, 16]。此外,在[17,18]中,作者將前景理論(PT)用于描述人類的認知偏見,如風險規避,并研究了現實環境中的人類決策行為。在[19, 20]中也探討了基于人類和機器的信息源在不同場景下的信息融合。在[19]中,作者表明,人類的認知力量可以利用多媒體數據來更好地解釋數據。一個用戶細化階段與聯合實驗室主任(JDL)融合模型一起被利用,以在決策中納入人類的行為因素和判斷[20]。
未來的戰場將需要人類和機器專業知識的無縫整合,他們同時在同一個環境模型中工作,以理解和解決問題。根據[21],人類在隨機應變和使用靈活程序、行使判斷和歸納推理的能力方面超過了機器。另一方面,機器在快速反應、存儲大量信息、執行常規任務和演繹推理(包括計算能力)方面勝過人類。未來雷達系統中的高級認知尋求建立一種增強的人機共生關系,并將人類的優點與機器的優點融合在一起[22]。在本章中,我們概述了這些挑戰,并重點討論了三個具體問題:i)人類決策與來自物理傳感器的決策的整合,ii)使用行為經濟學概念PT來模擬人類在二元決策中的認知偏差,以及iii)在相關觀測下半自主的二元決策的人機協作。
本章的其余部分組織如下。在第11.1節中,我們介紹了一項工作,說明如何將人類傳感器的存在納入統計信號處理框架中。我們還推導出當人類擁有機器無法獲得的輔助/側面信息時,這種人機一體化系統的漸進性能。我們采用行為經濟學的概念前景理論來模擬人類的認知偏差,并在第11.2節中研究人類在二元假設檢驗框架下的決策行為。第11.3節討論了一種新的人機協作范式來解決二元假設檢驗問題,其中人的知識和機器的觀察的依賴性是用Copula理論來描述的。最后,我們在第11.4節中總結了與這個問題領域相關的當前挑戰和一些研究方向,然后在第11.5節中總結。
深度學習技術在計算機視覺領域的快速發展,促進了基于人工智能(AI)應用的廣泛傳播。分析不同種類的圖像和來自異質傳感器數據的能力使這項技術在軍事和國防應用中特別有趣。然而,這些機器學習技術并不是為了與智能對手競爭而設計的;因此,使它們如此有趣的特性也代表了它們在這一類應用中的最大弱點。更確切地說,輸入數據的一個小擾動就足以損害機器學習算法的準確性,并使其容易受到對手的操縱--因此被稱為對抗性機器學習。
對抗性攻擊對人工智能和機器人技術的穩定性和安全性構成了切實的威脅。這種攻擊的確切條件對人類來說通常是相當不直觀的,所以很難預測何時何地可能發生攻擊。此外,即使我們能估計出對手攻擊的可能性,人工智能系統的確切反應也很難預測,從而導致進一步的意外,以及更不穩定、更不安全的軍事交戰和互動。盡管有這個內在的弱點,軍事工業中的對抗性機器學習話題在一段時間內仍然被低估。這里要說明的是,機器學習需要在本質上更加強大,以便在有智能和適應性強的對手的情況下好好利用它。
在很長一段時間里,機器學習研究人員的唯一關注點是提高機器學習系統的性能(真陽性率/敏感度、準確性等)。如今,這些系統缺乏穩健性的問題已不容忽視;許多系統已被證明非常容易受到蓄意的對抗性攻擊和/或操縱。這一事實使它們不適合現實世界的應用,特別是關鍵任務的應用。
一個對抗性的例子是,攻擊者故意設計了一個機器學習模型的輸入,以導致該模型犯錯。一般來說,攻擊者可能無法接觸到被攻擊的機器學習系統的架構,這被稱為黑盒攻擊。攻擊者可以利用 "可轉移性 "的概念近似于白盒攻擊,這意味著旨在迷惑某個機器學習模型的輸入可以在不同的模型中觸發類似的行為。
最近針對這些系統的對抗性攻擊的演示強調了對抗性行為對穩定性影響的普遍關注,無論是孤立的還是互動的。
也許最廣泛討論的攻擊案例涉及圖像分類算法,這些算法被欺騙成 "看到 "噪聲中的圖像,即隨機產生的不對應于任何圖像的白噪聲被檢測為圖像,或者很容易被像素級的變化所欺騙,因此它們將一輛校車分類為鴕鳥,例如。同樣,如果游戲結構或規則稍有改變,而人類不會受到影響,那么表現優于人類的游戲系統(如國際象棋或AlphaGo)就會突然失敗。在普通條件下運行良好的自動駕駛汽車,只要貼上幾張膠帶,就會被誘導轉向錯誤的車道或加速通過停車標志。
許多北約國家利用人工智能和機器學習來改善和簡化軍事行動和其他國家安全舉措。關于情報收集,人工智能技術已經被納入在伊拉克和敘利亞的軍事行動中,其中計算機視覺算法被用來檢測人和感興趣的物體。軍事后勤是這一領域的另一個重點領域。美國空軍使用人工智能來跟蹤其飛機何時需要維護,美國陸軍使用IBM的人工智能軟件 "沃森 "來預測維護和分析運輸請求。人工智能的國防應用還延伸到半自主和自主車輛,包括戰斗機、無人機或無人駕駛飛行器(UAV)、地面車輛和船舶。
人們認為對抗性攻擊在日常生活中相對罕見,因為針對圖像分類算法的 "隨機噪音 "實際上遠非隨機。不幸的是,對于國防或安全技術來說,這幾乎是不可能的。這些系統將不可避免地被部署在對方有時間、精力和能力來開發和構建正是這些類型的對抗性攻擊的環境中。人工智能和機器人技術對于部署在敵人控制或敵人爭奪的地區特別有吸引力,因為這些環境對于我們的人類士兵來說是最危險的環境,在很大程度上是因為對方對環境有最大的控制。
在意識到人工智能發展和應用的技術領先的重要性后,北約于2020年在多國能力發展運動(MCDC)下啟動了人工智能、自動化和機器人技術的軍事用途(MUAAR)項目。該項目的范圍是開發概念和能力,以應對開展聯合聯盟行動的挑戰,并對其進行評估。項目的目標是評估可能受益于人工智能、自動化和機器人技術的當前和未來的軍事任務和功能。它還考慮了效率和成本節約方面的回報。
在國防應用中,對抗性地操縱機器學習分類器所帶來的危險的例子很多,嚴重程度各不相同。例如,致命的自主武器系統(LAWS)可能會將友軍戰車誤認為是敵軍戰車。同樣,一個爆炸裝置或一架敵方戰斗機可能會被錯誤地識別為一塊石頭或一只鳥。另一方面,知道人工智能垃圾郵件過濾器跟蹤某些單詞、短語和字數進行排除,攻擊者可以通過使用可接受的單詞、短語和字數來操縱算法,從而進入收件人的收件箱,進一步增加基于電子郵件的網絡攻擊的可能性。
綜上所述,人工智能支持的系統可能會因為對抗性攻擊而失敗,這些攻擊是故意設計來欺騙或愚弄算法以使其犯錯的。這種攻擊可以針對分類器的算法(白盒攻擊),也可以通過訪問輸入來針對輸出(黑盒攻擊)。這些例子表明,即使是簡單的系統也能以意想不到的方式被愚弄,有時還可能造成嚴重后果。隨著對抗性學習在網絡安全領域的廣泛應用,從惡意軟件檢測到說話人識別到網絡物理系統再到許多其他的如深度造假、生成網絡等,隨著北約增加對自動化、人工智能和自主代理領域的資助和部署,現在是時候讓這個問題占據中心位置了。在將這些系統部署到關鍵任務的情況下之前,需要對這些系統的穩健性有高度的認識。
已經提出了許多建議,以減輕軍事環境中對抗性機器學習的危險影響。在這種情況下,讓人類參與其中或在其中發揮作用是至關重要的。當有人類和人工智能合作時,人們可以識別對抗性攻擊,并引導系統采取適當的行為。另一個技術建議是對抗性訓練,這涉及給機器學習算法提供一組潛在的擾動。在計算機視覺算法的情況下,這將包括顯示那些戰略性放置的貼紙的停車標志的圖像,或包括那些輕微圖像改變的校車的圖像。這樣一來,盡管有攻擊者的操縱,算法仍然可以正確識別其環境中的現象。
鑒于一般的機器學習,特別是對抗性機器學習,仍然是相對較新的現象,對兩者的研究仍在不斷涌現。隨著新的攻擊技術和防御對策的實施,北約軍隊在關鍵任務的行動中采用新的人工智能系統時需要謹慎行事。由于其他國家,特別是中國和俄羅斯,正在為軍事目的對人工智能進行大量投資,包括在引起有關國際規范和人權問題的應用中,北約保持其戰略地位以在未來戰場上獲勝仍然是最重要的。
Elie Alhajjar博士是美國陸軍網絡研究所的高級研究科學家,同時也是紐約州西點軍校數學科學系的副教授,他在那里教授和指導各學科的學員。在來到西點軍校之前,Alhajjar博士曾在馬里蘭州蓋瑟斯堡的國家標準與技術研究所(NIST)從事研究。他的工作得到了美國國家科學基金會、美國國立衛生研究院、美國國家安全局和ARL的資助,最近他被任命為院長的研究人員。他的研究興趣包括數學建模、機器學習和網絡分析。他曾在北美、歐洲和亞洲的國際會議上展示他的研究工作。他是一個狂熱的科學政策倡導者,曾獲得民用服務成就獎章、美國國家科學基金會可信CI開放科學網絡安全獎學金、Day One技術政策獎學金和SIAM科學政策獎學金。他擁有喬治-梅森大學的理學碩士和數學博士學位,以及圣母大學的碩士和學士學位。
現代數字雷達在其波形、雷達參數設置和傳輸方案方面提供了前所未有的靈活性,以支持多種雷達系統目標,包括目標探測、跟蹤、分類和其他功能。這種靈活性為提高系統性能提供了潛力,但需要一個閉環感知和響應方法來實現這種潛力。完全自適應雷達(FAR),也被稱為認知雷達,是模仿認知的感知-行動周期(PAC),以這種閉環方式適應雷達傳感器。在這項工作中,我們將FAR概念應用于雷達資源分配(RRA)問題,以決定如何將有限的雷達資源如時間、帶寬和天線波束寬度分配給多個相互競爭的雷達系統任務,并決定每個任務的傳輸參數,使雷達資源得到有效利用,系統性能得到優化。
已經提出了一些感知-行動的RRA方法。這一領域的最新工作被稱為認知雷達資源管理,而較早的相關工作則被稱為簡單的傳感器管理或資源分配。這些算法依賴于兩個基本步驟。首先,它們以概率方式捕獲(感知)監視區域的狀態。其次,他們使用這種概率描述,通過確定哪些行動有望實現效用最大化來選擇未來的傳感行動。
任何RRA算法的一個關鍵挑戰是平衡目標探測、跟蹤、分類和其他雷達任務的多個競爭性目標。這一點通過優化步驟中用于選擇下一步雷達行動的目標函數來解決。目標函數也被稱為收益、標準、價值或成本函數。因此,以適合優化的數學形式闡明系統目標,對完全自適應雷達資源分配(FARRA)系統的運行至關重要。隨著可用于適應的參數數量和雷達系統任務數量的增加,這變得越來越困難。這種優化有兩種基本方法:任務驅動和信息驅動。
在任務驅動的方法中,為每個任務指定性能服務質量(QoS)要求,如探測目標的預期時間或跟蹤的均方根誤差(RMSE),并通過加權各種任務的效用來構建一個綜合目標函數。這樣做的好處是能夠分別控制任務性能,并確定任務的相對重要性。然而,它需要用戶有大量的領域知識和判斷力,以指定任務要求和傳感器成本,并構建成本/效用函數和加權,以結合不同的任務性能指標。
在信息驅動的方法中,一個全局信息測量被優化。常見的信息測量包括熵、相互信息(MI)、Kullback-Leibler分歧(KLD)和Renyi(alpha)分歧。信息指標隱含地平衡了一個雷達可能獲得的不同類型的信息。這具有為所有任務提供共同的衡量標準(信息流)的理想特性,但沒有明確優化諸如RMSE等任務標準。因此,信息理論的衡量標準可能很難被終端用戶理解并歸結為具體的操作目標。此外,如果沒有額外的特別加權,它們不允許單獨控制任務,并可能產生以犧牲其他任務為代價而過度強調某些任務的解決方案,或者選擇在用戶偏好判斷下只提供邊際收益的傳感器行動。
在這項工作中,我們考慮一個雷達系統對多個目標進行同步跟蹤和分類。基于隨機優化的FAR框架[28],為我們的PAC提供了結構。我們開發并比較了用于分配系統資源和設置雷達傳輸參數的任務和信息驅動的FARRA算法,并在模擬機載雷達場景和俄亥俄州立大學的認知雷達工程工作區(CREW)實驗室測試平臺上說明其性能。這項工作結合并擴展了我們以前在傳感器管理[8-14]和FAR[18, 21, 27, 29-31]的工作。初步版本發表于[32]。結果表明,任務和信息驅動的算法具有相似的性能,但選擇不同的行動來實現其解決方案。我們表明,任務和信息驅動的算法實際上是基于共同的信息理論量,所以它們之間的區別在于所使用的指標的粒度和指標的加權程度。
本章的組織結構如下。在第10.2節中,我們提供了FAR框架的概述,在第10.3節中,我們通過為這個問題指定FAR框架的組成部分來開發多目標多任務FARRA系統模型。在第10.4節中,我們描述了組成FARRA PAC的感知和執行處理器,包括我們采用的任務和基于信息的目標函數。在第10.5節中,我們提供了比較優化方法的機載雷達仿真結果,在第10.6節中,我們展示了CREW測試平臺的結果。最后,第10.7節介紹了這項工作的結論。
單個PAC的FAR框架是在[18, 27]中開發的,在此總結一下。圖10.1是一個系統框圖。PAC由感知處理器和執行處理器組成。PAC通過硬件傳感器與外部環境互動,通過感知處理器和執行處理器與雷達系統互動。感知處理器接收來自硬件傳感器的數據,并將其處理為對環境的感知。該感知被傳遞給雷達系統以完成系統目標,并傳遞給執行處理器以決定下一步行動。執行處理器接收來自感知處理器的感知以及來自雷達系統的要求,并解決一個優化問題以決定下一個傳感器的行動。執行處理器通知硬件傳感器下一次觀察的設置,傳感器收集下一組數據,然后循環往復。
圖10.1: 單一PAC FAR框架
與傳統的雷達系統不同,認知雷達被設計為采用感知-行動周期來不斷適應其環境。自適應波束導向認知雷達(AB-CRr)系統試圖通過制定適應其環境的波束布局策略來提高探測和跟蹤性能。AB-CRr不是在搜索場景中采用傳統的光柵掃描,而是建立一個目標環境的概率模型,使其能夠更有效地利用其有限的資源來定位和跟蹤目標。在這篇論文中,我們研究了調整AB-CRr框架以探測和跟蹤大型目標群的方法。這是通過將相關運動群的特性整合到雷達跟蹤模型和AB-CRr的基本動態概率模型中來實現的。結果表明,AB-CRr能夠調整其波束轉向策略,在搜索和跟蹤應用之間有效地進行資源平衡,同時利用群結構和群內目標的相關性來抵制大型群的可用資源過載。
對于北約的軍事和維和行動,雷達幾乎用于所有應用,包括防空、武器定位、監視、偵察和目標獲取。雷達系統能夠在白天和黑夜工作,對天氣具有相對免疫力,甚至可以提供地平線覆蓋。它們可以提供高分辨率圖像,檢測、定位和跟蹤所有范圍內的目標。認知雷達傳感的新興主題源于哺乳動物的認知。它既包含“感知-行動循環”,也包含更明確的記憶生成和利用。將認知理念應用于雷達有可能開啟一個新的傳感時代,不僅可以提高現有雷達系統的性能,還可以開辟全新的能力領域。該任務組的目標是開發和進行實驗和理論研究,以說明在雷達系統中啟用基于認知的能力的好處和挑戰。幾個參與小組已經進行了認知實驗,任務組提供的合作使想法、經驗和結果得以分享。在這項研究開始時,幾乎沒有或沒有實驗工作來以實際的方式證明認知行為。這項工作已經能夠在雷達傳感器中展示真正的認知行為。然而,這項工作也凸顯了認知感知實驗工作的難度,還有很多工作要做。任務組的實驗工作無疑會超出本任務組的時限,因為建立了強大的鏈接。建議就認知雷達網絡這一主題發起一個進一步的北約任務組。
低速、慢速和小型 (LSS) 飛行平臺的普及給國防和安全機構帶來了新的快速增長的威脅。因此,必須設計防御系統以應對此類威脅。現代作戰準備基于在高保真模擬器上進行的適當人員培訓。本報告的目的是考慮到各種商用 LSS 飛行器,并從不同的角度定義 LSS 模型,以便模型可用于LSS 系統相關的分析和設計方面,及用于抵制LSS系統(包括探測和中和)、作戰訓練。在北約成員國之間提升 LSS 能力并將 LSS 擴展到現有分類的能力被認為是有用和有益的。
【報告概要】
在安全受到威脅的背景下考慮小型無人機系統 (sUAS)(通常稱為無人機)時,從物理和動態的角度進行建模和仿真遇到了一些獨特的挑戰和機遇。
無人機的參數化定義包括以下幾類:
描述無人機飛行動力學的分析模型在數學上應該是合理的,因為任務能力在很大程度上取決于車輛配置和行為。
考慮到剛體在空間中的運動動力學需要一個固定在剛體本身的參考系來進行合適的力學描述,并做出一些假設(例如,剛體模型、靜止大氣和無擾動、對稱機身和作用力在重心處),可以為 sUAV 的飛行動力學開發牛頓-歐拉方程。
在檢測 sUAS 時,必須考慮幾個現象,例如可見波范圍內外的反射、射頻、聲學以及相關技術,如被動和主動成像和檢測。
由于需要多個傳感器檢測 sUAS,因此有必要考慮識別的參數以便針對不同類型的檢測器對特征進行建模。此外,對多個傳感器的依賴還需要在信息融合和集成學習方面取得進步,以確保從完整的態勢感知中獲得可操作的情報。
無人機可探測性專家會議表明了對雷達特征以及不同無人機、雷達和場景的聲學特征進行建模的可能性,以補充實驗數據并幫助開發跟蹤、分類和態勢感知算法。此外,雷達場景模擬的適用性及其在目標建模和特征提取中的潛在用途已得到證實。
然而,由于市場上無人機的復雜性和可變性以及它們的不斷增強,就其物理和動態特性對無人機簽名進行清晰的建模似乎并不容易。
sUAS 特性的復雜性和可變性使得很難完成定義適合在仿真系統中使用的模型的任務。這是由于無人機本身的幾個參數,以及考慮到無人機的所有機動能力和特性所需的飛行動力學方程的復雜性。
此外,sUAS 特性的復雜性和可變性不允許定義用于評估相關特征的參數模型。
圖1 無人機類別與其他類別/參數的關系(part 1)
圖2 無人機類別與其他類別/參數的關系(part 2)
圖3 參考坐標系
【報告目錄】