本報告的目的是探討可用于估計紅外(IR)目標中心的多種方法。具體的重點是在一個非常小的空間區域發出信號的目標,近似于一個點源。如果只需要一個簡單的解決方案,中心可以被大致估計為感興趣區域(ROI)中最亮的像素。雖然很容易實現,但這種方法只能產生一個精確到單個像素的估計。如果沒有任何進一步的細化,這將建立一個精度的下限。然而,通過考慮鄰近的像素,有可能將估計值細化到一個像素的一小部分。因此,選定的算法必須能夠進行亞像素估計,以便為高精確度的應用建立必要的精確程度。這些應用中的幾個可能包括在整個視頻中跟蹤一個投射物或使用紅外目標進行相機校準。
將這些算法限制在點源上的重要性在于,它允許對目標中心進行非常精確的估計。理想的候選人將在圖像的一個小區域內擁有一個單一的、定義明確的峰值。一個物體作為點源的能力根據所涉及的距離而變化。一個較大的物體可能不被認為是一個點源,除非是在非常長的距離上,而一個短距離的點源可能在較長的距離上根本無法注冊。在這方面,有幾個物體可以被認為是適用的。鹵素燈泡從燈泡中心的一個小燈絲產生熱量。帶有示蹤劑的射彈會在子彈底部有一個小的,但很亮的燃燒點。鉚釘的頭部在外部邊緣迅速冷卻,但在中心緩慢冷卻,在死角處形成一個熱斑。所有這些元素都是這種算法的良好候選者。附近的車輛,可能看起來很大(幾百個像素),其紅外特征的梯度很淺,將不適合這種跟蹤算法。
首先,有必要建立一個全像素方法,它將作為一個控制和基準。這種算法的作用是找到強度最大的像素位置。在出現平局的情況下,解決方案將是峰值位置的平均值。因此,如果像素值是飽和的,全像素估計有可能產生一個小數值。請注意,由于圖像生成的性質,最大值,因此整個像素的估計值將出現在子圖像的中心(或在飽和圖像的情況下接近中心)。這意味著,只要圖像被裁剪并以ROI為中心,其余算法的結果對任何尺寸的圖像都有效。
由相機記錄的真正的點源可以在數學上表示為一個艾瑞盤。由于這個函數相當復雜,可以用眾所周知的高斯分布做一個稍不準確的估計。這是一個非常常見的簡化,雖然這兩個函數的尾部不匹配,但中心,即估計的最重要的位置,卻非常匹配(參考文獻1)。候選點源,給定適當的距離,預計將表現出類似于艾瑞盤或高斯分布的特征。因此,尋找子像素中心的最合理的方法是將一個二維(2D)高斯函數擬合到圖像區域,獲得其中心的坐標。在實踐中,使用MATLAB擬合二維高斯分布需要運行一個優化,這可能是相當緩慢的。因此,盡管這種方法可以非常精確,但最好還是能有一個能更快運行的解決方案。將二維高斯分布擬合到圖像區域的方法被稱為優化高斯擬合。
為了獲得一個計算成本較低的解決方案,需要尋求一種確定性的分析方法。首先,參考文獻2中描述了一種擬合拋物線估計器的新方法。雖然這同時滿足了確定性和分析性的要求,但它只針對一維(1D)的情況。為了對估計點源的子像素中心有用,它必須在二維上推導。這個估算器可以根據方程1到9擴展到二維空間。
這項研究的目的是討論目前最先進的在點云數據上執行的機器學習算法的方法。所進行的研究將應用于三維激光雷達可視化和開發(3DLIVE)團隊的內部工作,其主要目標是為目標坐標測量(TCM)創建一個可視化和與點云數據互動的新系統。所提出的機器學習方法與三維點云和計算機視覺的機器學習的三個主要課題有關,每個課題都有自己研究的論文部分。這些主題是分割、分類和目標檢測,所選的論文是最近的研究,取得了最先進的性能。這項研究的結果是選定的幾種方法,它們向3DLIVE團隊展示了最有希望的結果和有效性。有效性在很大程度上取決于算法對3DLIVE使用案例的可擴展性和適用性,以及其準確性和精確性。
在傳統的計算機視覺問題中,二維數據一直是用于推理的主要信息形式。隨著近來價格低廉且廣泛使用的3D傳感器(如蘋果深度相機、Kinect和飛行時間相機)的發展,3D數據已經變得非常豐富,并為解決計算機視覺問題提供了許多優勢。也就是說,它包含了更多的拓撲信息(深度維度、形狀和比例信息),這些信息對場景的理解至關重要,并提供了一個更自然的世界表現。由于這一技術層面的原因,將三維數據應用于自動駕駛、機器人、遙感和醫療等領域已經成為近期研究的重點,并將繼續擴展到其他領域[1]。
三維數據可以有很多格式,包括網格、深度圖像、體積網格和點云。場景理解應用中最常見的格式是點云-結構化數據,因為這種數據形式保留了三維空間中的原始幾何信息,沒有任何離散化損失。在進行分析之前,需要對點云進行定義:點云是一組數據點(x,y,z),通常代表一個(多個)三維物體的外表面,由合成或三維掃描器產生。三維數據面臨的一個挑戰是存儲要求--三維場景比二維的同一場景需要多出幾個數量級的存儲。點云解決了這個問題,因為它不需要存儲多邊形網格,因此提高了性能并降低了開銷--這是對時間敏感的應用的關鍵考慮[2]。
三維LiDAR可視化和開發(3DLIVE)項目旨在為目標坐標測量(TCM)和三維分析創建一個新系統。目前的TCM方法使用立體圖像,利用英偉達3D視覺眼鏡以及專門的GPU和顯示器來查看重疊的二維圖像,給人一種三維的感覺。然而,這種方法很難訓練,而且會造成眼睛疲勞;此外,它所使用的英偉達軟件和硬件已經達到了使用壽命的終點,不再得到支持或生產。因此,需要開發一種新的3D數據開發解決方案。
用于TCM的3DLIVE方法旨在利用主要由LiDAR傳感器收集的3D點云。然后使用游戲引擎Unity將這些數據可視化。此外,由于上述數據可以通過Octree格式有效地加載到Unity中,因此可以使用大規模的數據集。點的元數據信息可以在查看器中查看和分析,用戶可以在整個大的地理區域內導航并選擇點進行分析。有多種方法可以與數據互動,從在某一地點投放一個感興趣的點到測量距離、長度和面積。
有多種模式可以與3D點云數據互動。它們包括標準的鼠標和鍵盤、虛擬現實和增強現實(使用Hololens 2)。增強現實的互動是3DLIVE團隊的主要開發重點,因為它使用戶沉浸在數據中,同時仍然類似于立體眼鏡的方法。我們目前還在尋求使用機器學習(ML),使我們能夠自動獲得這些點云數據集中的物體信息,例如它們是什么物體,在空間內有什么界限,并進行自動目標識別(ATR)。
在過去的10-20年里,大多數深度學習計算機視覺研究都集中在2D圖像上,但隨著更多可用的3D數據的興起,最近的研究著眼于將傳統的深度學習技術應用于計算機視覺的3D數據。這項新的研究使得場景理解的場景有了重大的進展,但是在將模型從二維過渡到三維的過程中,仍然存在著一些障礙。具體到點云,數據是非結構化和無序的,這意味著以點云為輸入的深度學習網絡不能直接應用標準的深度學習方法,如卷積神經網絡(CNN)[1]。相反,必須開發定制的解決方案,使其具有包絡不變性,通常用對稱函數實現。另一個挑戰是從點云中捕捉局部和全局結構信息。通過單個點來評估點云會失去點與點之間的局部和整體結構信息,因此網絡在設計時必須通過查看鄰近的數據來考慮這一點。由于直接處理點云的困難,許多方法將點云數據轉化為一種中間格式,如將點云投影到二維圖像中,這樣就可以應用傳統的深度學習方法[1]。最后,從三維傳感器收集的點云數據并不完美--由于傳感器的局限性,采集設備的固有噪聲,以及被采集表面的反射性質,往往存在噪聲污染和異常值,會破壞數據采集[1]。從上面可以看出,在點云數據上應用深度學習方法并不簡單,需要對現有的技術進行重新設計,以便在網絡中使用,但是三維點云比二維數據的描述能力的提升超過了負面因素。
計算機視覺任務通常被分成3個不同的類別:分類、目標檢測和分割。對于點云,這些類別通常被定義為: 三維形狀分類,三維目標檢測和跟蹤,以及三維點云分割[1]。
三維形狀分類方法試圖通過首先學習每個點的嵌入,然后使用聚合方法從整個點云中提取一個全局形狀嵌入,來對點云中的物體進行分類(標記)。這個全局嵌入被輸入到幾個完全連接的層中以實現分類[1]。
三維目標檢測和跟蹤方法可以分為3類: 1)目標檢測,2)物體跟蹤,以及3)場景流估計。對于目標檢測方法,它們在每個檢測到的物體周圍為輸入的點云產生定向的三維邊界盒。接下來,三維物體跟蹤的目的是預測物體的狀態,因為它以前的狀態。與物體跟蹤相關的是三維場景流估計,即給定同一場景在兩個不同時刻的兩個點云,描述每個點從第一個點云到第二個點云的運動[1]。
與目標檢測和跟蹤一樣,三維點云的分割也可以根據所需的粒度分為三類。這些類別從最普遍到最不普遍:語義分割(場景級別)、實例分割(物體級別)和部分分割(部分級別)。給定一個點云,三維點云語義分割的目標是根據點的語義將點云分成幾個子集(例如,將場景中的所有椅子涂成相同的顏色)。更低一級的是三維點云實例分割,它比語義分割更具挑戰性,因為它需要對點進行更準確和精細的推理。實例分割不僅需要區分具有不同語義的點,還需要區分具有相同語義的獨立實例(例如,給每把椅子涂上不同的顏色,而不是所有椅子都是同一顏色)。最后,在最細微的層面上,部分分割試圖將具有相同語義的物體的各個部分分開(例如,給椅子的各個部分涂上不同的顏色),由于具有相同語義標簽的形狀部分具有較大的幾何變化和模糊性,因此這項任務特別困難[1]。
3DLIVE努力的目標之一是創建一個系統(利用機器學習),該系統接收一個地理區域的點云,將具有類似屬性的點分組為對象,并為每個組成對象和結構貼上標簽,使數據更容易使用和分析。在我們著手實現這些目標之前,我們確定研究當前點云數據集的分割和分類技術狀況將是有價值的。Guo等人在2019年完成了一項關于點云的深度學習方法的調查[1]。我們的目的是確認研究中提出的信息仍然是準確和相關的(針對點云數據集的ML是一個快速發展的領域),進行我們自己的研究并創建一個類似的調查,并決定在研究的分類、分割和目標檢測的方法中,哪些是最適合我們的使用案例的。AFRL RIEA/RIED內部研究小組(IHURT)被召集起來,與3DLIVE團隊一起做這項研究,并回答以下研究問題:
目前3D點云分割和分類的技術水平如何,哪些方法對3DLIVE的工作最有效?我們能否開始為我們打算使用的大規模三維城市點云的分割、分類和目標檢測奠定框架并制定行動方案?
這項研究的結果將使3DLIVE團隊能夠推進ML點云的分析工作。我們希望最終能復制出性能最高、最相關的分割、分類和目標檢測方法,并將其用于NGA地理空間存儲和數據管理(GRID)服務器的地理3D點云數據。此外,3DLIVE團隊已經開發了一種生成大規模合成城市點云數據集的方法,我們可以利用這種合成數據作為我們創建和使用的模型的額外訓練數據。這項研究將為3DLIVE團隊使用ML創建額外的工具來幫助作戰人員分析和衡量三維數據奠定基礎。這將最終實現上述目標,即創建一個新的TCM系統,供目標人員(如第363 ISR聯隊和其他目標部門的人員)使用,用一種利用越來越多的本地3D數據的替代技術取代目前已被淘汰的技術。
圖2. RPVNet的概述。它是一個具有多種交互作用的三分支網絡,其中體素分支和范圍分支共享類似的Unet架構,而點分支只利用每點的MLPs。
該研究項目解決了下一代自主蜂群網絡系統的分布式控制和優化的挑戰,其中快速變化和超動態的網絡狀態(如網絡拓撲結構、頻譜和信道狀態信息、數據緩沖區排隊狀態等)需要分布式優化算法的快速收斂和低延時。最近基于PI對網絡控制和優化的研究,利用二階信息(SOI),在這個研究計劃中,我們提出了一系列新的分布式算法技術,與傳統方法相比,在收斂速度和排隊延遲方面都有數量級的改進,同時達到了同樣的可證明的網絡效用優化。
具體來說,我們在這個項目中的研究任務集中在基于動量(Heavy-ball)的聯合擁堵控制和多路徑路由(部分SOI)的EMANE仿真實現上。我們提出的研究計劃采取了一種綜合的、整體的方法,從數學建模、優化理論、控制理論、排隊理論和隨機分析等領域吸取技術。擬議的研究不僅將推進我們在下一代復雜網絡的算法設計方面的知識,而且還將通過探索基于SOI的網絡控制和優化的新領域來滿足一般網絡研究界的關鍵需求。
所提出的方法將影響廣泛的應用,如機載網絡和無人機系統的圖像/視頻,特別是在控制和優化行動不能承受大的延遲和緩慢收斂的系統。將尋求與AFRL進行實質性的合作,以促進這一研究工作的潛在過渡途徑。
圖1:在高度動態的無線網絡下,無人機系統通信有嚴格的延遲要求。
隨著部署在戰場上的通信網絡的激增以及它們所產生的大量移動數據,今天的無線網絡技術正被拉伸到極限。不僅戰術信息的爆炸性增長要求不斷增加網絡容量,大規模無線網絡的復雜協調也在實時控制和優化中引入了嚴格的延遲和收斂速度要求。為了設計高效的優化算法來應對新興的戰術無線網絡,一個關鍵的方面是有效地處理擁塞控制和鏈路調度之間的交叉互動,包括在協議棧層內和跨協議棧。因此,近年來出現了對戰術無線網絡的低延遲和快速轉換的聯合擁堵控制和調度算法的迫切需求。此外,聯合擁塞控制和路由優化不僅是信息網絡設計的要求,也是許多復雜網絡運行的核心問題,如智能電網需求響應[1-3]、供應鏈管理[4-7]、交通網絡流量控制[8, 9],僅舉幾例。
一個動機示例: 為了說明快速收斂、低延遲和分布式設計的重要性,我們在此以無人機系統網絡為例。控制和優化無人機系統網絡的一大挑戰來自于快速變化和高度動態的網絡狀態(如網絡拓撲結構、頻譜/信道狀態、數據緩沖區排隊狀態等),這使得傳統的擁堵控制、路由和頻譜訪問技術變得無效(見圖1的說明性例子)。這種高度動態的性質需要網絡控制和優化算法的快速收斂。否則,在完成緩慢的收斂過程后,網絡拓撲結構、頻譜/信道狀態信息和排隊狀態很可能被大大改變,使所有的計算結果和控制行動變得過時和無用。
使網絡控制問題更加嚴重的是,控制行動與需要實時傳輸大量數據的時間密切相關(例如,無人機系統圖像或視頻監控等)。因此,當數據到達量激增時,需要低延遲的網絡控制算法來避免過度延遲和大量的丟包(由于超時事件)。否則,可能會發生突然的大規模網絡中斷,這不僅會導致大范圍的不便,而且會導致毀滅性的戰斗失敗甚至是生命損失。此外,機載網絡的地理規模大,網絡子系統之間物理層技術的異質性,以及快速響應時間的要求,意味著控制和優化算法既不能集中,也不能有高的復雜性。這就要求開發出完全分布式的算法,以規避單點故障問題,簡單易行,又能達到可證明的優化性能。
由于移動數據需求的快速增長,近年來出現了大量關于資源分配的工作,旨在使無線網絡中的網絡效用最大化(例如,見[10-13],和[14]的調查)。這導致了一個優雅的數學分解框架,"松散耦合 "的擁堵控制、調度和路由算法自然而然地出現。這些算法不需要關于到達或信道狀態的統計知識。相反,它們只依賴隊列長度和信道狀態信息來做出控制決策。這些算法也與非線性優化理論中的拉格朗日對偶分解框架和子梯度方法有內在聯系[10, 11],其中(按比例)隊列長度可以被解釋為拉格朗日對偶變量,隊列長度更新起到子梯度方向的作用。
盡管這些基于隊列長度的算法(QLA)具有吸引人的特點,但它們受到了幾個關鍵的限制。首先,在現有的QLA框架中,已經證明了效用優化差距O(1/K)可以通過排隊延遲的O(K)懲罰來實現,其中K>0是一個系統參數。因此,一個小的效用優化差距需要一個大的K,并導致大的排隊延遲。為了解決這一局限性,近年來有大量的工作(如[13,15-17]等)集中在減少這些方案的排隊延遲上(后面對相關工作有更深入的討論)。同時,在現有的QLA框架中,基于隊列長度的權重調整忽略了目標函數輪廓的曲率,并且在每次迭代中使用小的步長[10-13],這導致收斂速度不理想。為了解決這個問題,最近提出了一些二階擁塞控制和路由/調度算法來提高收斂速度(見,例如,[18,19])。然而,由于其復雜的算法結構,這些二階方法需要更大的信息交換開銷,并且不能隨著網絡規模的擴大而很好地擴展。現有方法的這些限制促使我們在這個項目中追求一種新的重球設計。
更具體地說,在這個項目中,我們開發了一個基于重球的權重調整方案,在不影響網絡效用性能和不增加任何計算復雜性的情況下,大幅減少隊列長度,提高收斂速度。我們的方法是基于將隊列長度與權重分離的巧妙想法,然后使用一個權重更新方案,該方案只利用前一個時隙的權重變化的一個更多的記憶槽。令人驚訝的是,我們表明這個簡單的方案提供了兩個控制自由度,使我們能夠實現效用優化、低延遲以及快速收斂。
從歷史上看,重球法是由Polyak在20世紀60年代首次提出的[20],用于解決無約束的凸優化問題,其最初的目標是加速梯度下降法的收斂。重球法的基本思想是,不是只使用當前迭代的(子)梯度信息和完全不記憶過去迭代的軌跡,而是使用當前梯度(類似于 "勢")和上一步的更新方向(類似于 "動量")的線性組合來計算搜索方向。該方法是由物理學中描述重體在勢場中運動的二階常微分方程(ODE)激發的,并可被視為該方程的離散版本,因此被稱為 "重球(HeavyBall)"。在[21]中已經表明,通過適當地權衡當前的 "勢 "和 "動量",該算法對目標輪廓不敏感,這導致了更快的收斂。事實上,收斂加速的優勢是我們在無線網絡跨層優化中采用重球方法的第一個基本理由。但令人驚訝的是,我們隨后的研究表明,采用重球思想的好處遠遠超出了收斂加速的范圍。
然而,我們注意到,由于一些技術上的挑戰,為無線網絡中的效用最大化問題開發一個基于重球的解決方案并不簡單。首先,由于重球法最初是為無約束的靜態優化問題設計的,目前還不清楚如何為無線網絡效用最大化修改重球法,因為無線網絡是一個有約束的隨機優化問題,問題結構要復雜得多。其次,與QLA設計中隊列長度和拉格朗日對偶變量之間的明顯聯系不同,重球法與可觀測的網絡狀態信息(如隊列長度、信道狀態等)之間的關系是未知的。因此,在重球法下,延遲和網絡效用之間的權衡仍然是一個開放的問題。第三,由于包含了過去的迭代值,重球方法的算法結構與QLA方法不同。因此,QLA中用于建立吞吐量-優化和效用-延遲權衡的傳統技術并不適用。因此,在重球方法的性能分析中需要新的分析技術。
本項目的主要貢獻是,我們首次開發了一個基于重球的無線網絡效用優化框架,克服了上述的技術挑戰。我們建立了一系列關于大幅減少延遲和快速收斂的新分析結果,同時保留了效用優化的特點。本文的主要結果和技術貢獻如下:
在重球思想的啟發下,我們提出了一個新的權重調整方案,用于無線網絡中的聯合擁塞控制和路由/調度。我們的工作不僅提供了重球算法和可觀察的網絡狀態信息(隊列長度和信道狀態)之間的協同作用,允許在實踐中簡單實現,它還擴展和概括了經典的重球方法,從無約束的靜態優化到約束的隨機網絡效用優化范式,從而推進了數學優化理論中重球方法的先進性。
在我們的基于重球的聯合擁堵控制和調度方案下,有一個β參數化的動量(β∈[0,1]是一個系統參數,通常選擇接近1),我們表明,延遲是(1-β)-QLA方法的小數部分。更具體地說,我們的理論分析表明,可以用O((1-β)K)+O((1+β)√K)的排隊延遲成本實現效用最優差距O(1/K),其中參數K與重球法的步長成反比。此外,在β被選為β=1-O(1/ √ K)的K的漸進制度中,我們的重球算法實現了[O(1/K), O( √ K)]效用-延遲權衡,這明顯優于眾所周知的QLA方法的[O(1/K), O(K)]權衡。
鑒于參數K和β,我們表明我們基于重球的算法的收斂時間擴展為O[log(√ K) (- log-1 (1 + β - √ β))]。結合前面的結果,我們提出的重球算法提供了一個重要而優雅的三方權衡關系,由K和β中的兩個控制旋鈕控制。最值得注意的是,通過權衡收斂速度,同時實現效用最優和低延遲。我們注意到,這種重要的三向權衡關系迄今在文獻中尚未被發現。
除了理論結果,本項目的一個重點是開發高保真的基于EMANE的模擬,以測試和驗證我們上述的理論結果和見解。在這個項目中,我們已經成功地開發了一個基于Shim層的EMANE跨層仿真平臺來測試我們的HeavyBall算法。我們基于EMANE的仿真結果表明,所有的理論預測在高保真仿真中是可以觀察到的。此外,值得一提的是,我們的基于EMANE的跨層仿真平臺具有很強的通用性,對于AFRL所重視的其他基于EMANE的無線網絡跨層仿真來說,可以具有獨立的利益。
在本節中,我們首先回顧了與本文密切相關的QLA文獻的最新進展。如前所述,在減少QLA方法的延遲方面已經有了很大的努力。例如,在[13]中,采用了類似于[22-24]中的虛擬隊列技術,其中虛擬隊列長度根據服務速率演變,是實際服務速率的一小部分。在[16]中,提出了一種用占位者比特代替真實數據的虛擬積壓機制。研究表明,通過接受一些非零的丟包概率,這種方法實現了[O(1/K), O(log2 (K))]效用-延遲權衡。在[15]中還提出了一個指數Lyapunov虛擬積壓方法與基于閾值的丟包方案相結合,以實現O(log(K))的延遲。雖然具有對數型的時延擴展,但[15,16]的一個主要限制是,[16]中選擇占位器比特的大小和[15]中的閾值都需要非因果的全局到達和信道統計(參見[15,公式(17)],[16,公式(45)]),這通常是不可能實現的。另外,如果參數設置不當,這些方案可能會導致不可忽略的丟包概率。為了解決這個問題,在[17]中提出了一個每迭代學習,以在線方式學習最佳的占位比特大小。然而,每迭代學習組件大大增加了算法的復雜性。在某種意義上,所有這些減少延遲的方案都可以被看作是為了減少延遲而犧牲了一些吞吐量的優化(體現在降低服務速率或丟包)。相比之下,在不犧牲任何吞吐量優化和不需要任何非因果統計知識的情況下,我們的重球方案通過設置β=1-O( 1/√ K),實現了[O(1/K), O( √ K)]效用-延遲折衷。此外,我們的重球算法實現了一個優雅的三方權衡,這是現有作品[13, 15-17]所不能提供的。
接下來,我們進一步提供重球法的背景,然后回顧重球領域的相關工作。在優化文獻中,重球法也被稱為多步驟或動量法。自其誕生以來[20],重球法已經在信號處理和機器學習中找到了應用(見,例如,[25]和其中的參考文獻)。然而,到目前為止,重球法在網絡研究中仍然基本上沒有被探索。據我們所知,重球法在網絡領域的唯一應用可以在[26]中找到,作者在那里開發了一個基于重球的互聯網擁堵控制方案。我們注意到,我們的工作與[26]在以下關鍵方面有所不同: 首先,我們提出的重球算法是一個動態方案,適用于隨機的無線信道,而[26]中提出的算法解決的是有線網絡的靜態擁塞控制速率優化問題。其次,[26]中的算法需要一些假設(參見[26, Sec. VII-C])來把問題變成無約束的表述,這樣經典的重球方法就可以被應用。然而,正如[26]中所指出的,這些假設限制了重球法的使用,使其只能用于具有某些路由結構的問題。相比之下,我們提出的方法可以處理所有的網絡約束,并適用于所有的效用優化問題。第三,我們在本文中推導出明確的效用-延遲-收斂權衡比例法,而[26]中沒有提供這樣的結果。
總的來說,我們的成果為跨層網絡控制和優化理論貢獻了一個令人興奮的新設計范式,該范式利用了動量/記憶信息。本報告的其余部分組織如下。第2節介紹了我們提出的重球算法和擬議算法的性能分析。第3節介紹了數值結果,第4節是本文的結論。
在決策或推理網絡中進行適當的推理,需要指揮官(融合中心)對每個下屬的輸入賦予相對權重。最近的工作解決了在復雜網絡中估計智能體行為的問題,其中社會網絡是一個突出的例子。這些工作在各種指揮和控制領域具有相當大的實際意義。然而,這些工作可能受限于理想化假設:指揮官(融合中心)擁有所有下屬歷史全部信息,并且可以假設這些歷史信息之間具有條件統計獨立性。在擬議的項目中,我們打算探索更普遍的情況:依賴性傳感器、(可能的)依賴性的未知結構、缺失的數據和下屬身份被掩蓋/摻雜/完全缺失。對于這樣的動態融合推理問題,我們建議在一些方向上擴展成果:探索數據源之間的依賴性(物理接近或 "群體思維"),在推理任務和量化不一定匹配的情況下,采用有用的通信策略,甚至在每個測量源的身份未知的情況下,采用無標簽的方式--這是數據關聯問題的一種形式。
我們還認識到,對動態情況的推斷是關鍵目標所在。考慮到一個涉及測量和物理 "目標 "的傳統框架,這是一個熟悉的跟蹤問題。但是,來自目標跟蹤和多傳感器數據關聯的技術能否應用于提取非物理狀態(物理狀態如雷達觀察到的飛機)?一個例子可能是恐怖主義威脅或作戰計劃--這些都是通過情報報告和遙測等測量手段從多個來源觀察到的,甚至可能被認為包含了新聞或金融交易等民用來源。這些都不是標準數據,這里所關注的動態系統也不是通常的運動學系統。盡管如此,我們注意到與傳統的目標追蹤有很多共同點(因此也有機會應用成熟的和新興的工具):可能有多個 "目標",有雜波,有可以通過統計學建模的行為。對于這種動態系統的融合推理,我們的目標是提取不尋常的動態模式,這些模式正在演變,值得密切關注。我們特別建議通過將雜波建模為類似活動的豐富集合,并將現代多傳感器數據關聯技術應用于這項任務,來提取特征(身份)信息。
研究的重點是在具有融合觀測的動態系統中進行可靠推理。
1.決策人身份不明。在作戰情況下,融合中心(指揮官)很可能從下屬那里收到無序的傳感器報告:他們的身份可能是混合的,甚至完全沒有。這種情況在 "大數據 "應用中可能是一個問題,在這種情況下,數據血統可能會丟失或由于存儲的原因被丟棄。前一種情況對任務1提出了一個有趣的轉折:身份信息有很強的先驗性,但必須推斷出身份錯誤的位置;建議使用EM算法。然而,這可能會使所有的身份信息都丟。在這種情況下,提出了類型的方法來完成對局部(無標簽)信念水平和正在進行的最佳決策的聯合推斷。
2.動態系統融合推理的操作點。在以前的支持下,我們已經探索了動態事件的提取:我們已經開發了一個合理的隱馬爾科夫模型,學會了提取(身份)特征,有一個多伯努利過濾器啟發的提取方法 - 甚至提供了一些理論分析。作為擬議工作的一部分,將以兩種方式進行擴展。首先,打算將測量結果作為一個融合的數據流,這些數據來自必須被估計的未知可信度的來源。第二,每個這樣的信息源必須被假定為雜亂無章的 "環境 "事件(如一個家庭去度假的財務和旅行足跡),這些事件雖然是良性的,可能也不復雜,但卻是動態的,在某種意義上與所尋求的威脅類似。這些必須被建模(從數據中)和抑制(由多目標追蹤器)。
3.數據融合中的身份不確定性。當數據要從多個來源融合時,當這些數據指的是多個真相對象時,一個關鍵的問題是要確定一個傳感器的哪些數據與另一個傳感器的哪些數據相匹配:"數據關聯 "問題。實際上,這種融合的手段--甚至關聯過程的好方法--都是相當知名的。缺少的是對所做關聯的質量的理解。我們試圖提供這一點,并且我們打算探索傳感器偏差和定位的影響。
4.具有極端通信約束的傳感器網絡。考慮由位置未知、位置受漂移和擴散影響的傳感器網絡進行推理--一個泊松場。此外,假設在這樣的網絡中,傳感器雖然知道自己的身份和其他相關的數據,但為了保護帶寬,選擇不向融合中心傳輸這些數據。可以做什么?又會失去什么?我們研究這些問題,以及評估身份與觀察的作用(在信息論意義上)。也就是說,假設對兩個帶寬相等的網絡進行比較;一個有n個傳感器,只傳輸觀察;另一個有n/2個傳感器,同時傳輸數據和身份。哪一個更合適,什么時候更合適?
5.追蹤COVID-19的流行病狀況。誠然,流行病學并不在擬議研究的直接范圍內,但考慮到所代表的技能以及在目前的健康緊急情況下對這些技能的迫切需要,投機取巧似乎是合理的。通過美國和意大利研究人員組成的聯合小組,我們已經證明,我們可以從當局提供的每日--可能是不確定的--公開信息中可靠地估計和預測感染的演變,例如,每日感染者和康復者的數量。當應用于意大利倫巴第地區和美國的真實數據時,所提出的方法能夠估計感染和恢復參數,并能很準確地跟蹤和預測流行病學曲線。我們目前正在將我們的方法擴展到數據分割、變化檢測(如感染人數的增加/減少)和區域聚類。
本報告研究了概率多假設跟蹤(PMHT)的另一種分配模型,其中目標被分配給測量,與原始的PMHT模型相比,測量被分配給目標。一個新的 "以目標為中心 "的PMHT算法被推導出來,并與原來的 "以測量為中心 "的算法相比較。研究了以目標為中心的PMHT和用于雜波中單目標跟蹤的概率數據關聯(PDA)濾波器之間的關系,并為以目標為中心的PMHT提出了一個PDA式的目標狀態協方差矩陣的近似值。還提出了一個以目標為中心/以測量為中心的PMHT混合體,以解決密布目標情況下的算法性能。
概率多假設跟蹤(PMHT)方法(參考文獻1和2)是一種多目標跟蹤方法,適用于測量值和目標之間分配未知的情況。這種情況是典型的跟蹤問題,在這種情況下,目標只被部分地觀察到,并且在可觀察的維度上間隔很近。例如,在純方位跟蹤中,沒有觀察到目標的范圍,因此,測量的方位可以與沿方位線或靠近方位線的任何數量的可能目標相關。即使對于目標范圍可以觀察到的問題,或者只有一個目標存在的問題,與目標無關的雜波測量(例如,由于環境影響)也會在測量和目標之間產生分配問題。
這種分配問題的模型分為兩類,一類是將分配視為互斥和窮盡的,另一類是將它們視為統計上獨立的。基于互斥和窮舉分配的跟蹤方法包括聯合概率數據關聯(JPDA)跟蹤(參考文獻3),其中考慮了當前掃描中的所有目標和測量組合,以及多假設跟蹤(參考文獻3),其中考慮了所有可用掃描中的所有目標和測量組合。因此,MHT的計算復雜度是指數級的,實際應用需要對假設樹進行合理的修剪。由于JPDA跟蹤中的枚舉被限制在當前的掃描范圍內,它的計算量比MHT小得多,但在當前掃描范圍內的復雜度是指數級的,因此僅限于順序跟蹤應用。
基于統計學上獨立分配的方法包括PMHT,它允許在一次掃描中把多個測量值分配給同一個目標。PMHT最大的優勢是它的計算效率--它與被跟蹤的目標數量、掃描數量以及掃描中的測量數量是線性關系。然而,這種效率是有代價的;PMHT的分配模型產生了一個具有許多局部最大值的似然函數,使得該算法難以初始化,并且在雜波嚴重、信噪比低、軌道間隔較近的情況下容易出現軌道丟失。
正如參考文獻4中所討論的,PMHT對每個目標進行多次測量會導致雜波以及來自干擾目標的測量在跟蹤的每個目標附近的 "過度好客 "現象。這個問題的一個潛在解決方案是改變PMHT的分配模式,使每個目標最多接受一次測量。做到這一點的一個方法是,在PMHT分配模型中,就獨立性和分配方向的假設而言,交換測量和目標的角色;也就是說,假設目標是獨立于測量的,并在每次掃描時引入缺失的目標到測量的分配(而不是測量到目標的分配)。與PMHT不同的是,在PMHT中,一個掃描中的多個測量可能被分配給同一個目標,而在這個替代的PMHT中,多個目標可能被分配給一個掃描中的同一個測量。這一結果對于在測量域中或相對于傳感器分辨率而言間隔較近的目標來說似乎是合理的。參考文獻5探討了在PMHT分配模型中交換測量和目標的角色的基本想法,盡管該參考文獻中的許多細節要么被省略,要么不清楚,而且丟失的目標到測量分配的統計模型似乎并不完全合理。盡管如此,參考文獻5是第一個關于在PMHT分配模型中調換測量和目標角色的公開文獻參考。本報告徹底研究了這種角色互換的意義以及由此產生的新的PMHT算法。在下文中,這種新的算法將被稱為以目標為中心的PMHT,以強調其目標到測量的分配模型;*原始的PMHT,如參考文獻1和2中得出的,根據其測量到目標的分配模型,可以認為是以測量為中心的,將被交替稱為以測量為中心的PMHT,原始的PMHT,或簡單的PMHT。
本報告研究了PMHT的另一種以目標為中心的分配模型,其中目標被分配給測量;該模型是原始PMHT的對偶,以測量為中心的分配模型,其中測量被分配給目標。對于線性高斯狀態空間模型,得出了以目標為中心的PMHT的明確狀態估計算法。與以測量為中心的PMHT不同的是,該算法在一般情況下不會減少到對每個目標的迭代卡爾曼平滑問題(除了一個批次的長度)。盡管如此,以目標為中心的PMHT仍然是一個迭代的線性估計問題。
本報告還研究了以目標為中心的PMHT和PDA濾波之間的關系,對于批長為1和雜波中的單個目標,它與PDA濾波密切相關。這兩種方法都被證明是對當前掃描中可用的目標信息的某種加權組合的卡爾曼濾波問題,其權重由熟悉的PDA的關聯概率βtr和以目標為中心的PMHT的條件目標-測量分配概率ξtr給出,兩者的形式非常相似(比較方程式(5-8)和(5-14))。此外,根據參考文獻13中為PMHT提出的PDA式近似,為以目標為中心的單掃描PMHT得出了目標狀態估計協方差矩陣的近似值。鑒于關聯概率和分配概率βtr和ξtr之間的密切關系,這種近似方法特別適合于以目標為中心的PMHT。將這種近似方法擴展到多盤(即批處理長度大于1)的情況是留給未來研究的。
以目標為中心的PMHT分配模型并不新鮮;就作者所知,參考文獻5是該方法的第一個公開文獻報告。然而,參考文獻5中的許多細節要么被遺漏,要么不清楚,要么不完全合理。本報告試圖解決這些問題中的每一個。例如,參考文獻5中的作者聲稱,與以測量為中心的對應模型相比,以目標為中心的分配模型應該減少不完整數據PDF中的局部最大值的數量,但沒有證據或證明。然而,本報告第4節提供的例子似乎削弱了這一說法,因為該例子中以目標為中心和以測量為中心的不完整數據PDF在局部最大值的數量和位置方面幾乎是相同的。對這種行為的進一步研究顯然是有必要的。
最后,研究了一種以目標為中心/以測量為中心的混合方法,以解決以目標為中心的模型的潛在缺陷,即在特定的掃描中,目標與測量相關的條件概率與其他目標無關,有效地導致了每個目標的獨立估計問題。為了解決這個問題,我們提出了兩種方案來混合這兩種方法:一種是在EM迭代之間交換以目標為中心和以測量為中心的分配模型,另一種是對以目標為中心的PMHT的目標到測量的分配概率進行重新歸一化,使用類似于參考文獻13中的觀點,將掃描中所有測量的目標互動聯系起來。這兩種方法都很容易實現,但要留待將來研究。
高光譜線掃描儀提供了大量的數據,從這些數據中可以得出信息并意識到潛在的威脅。然而,由于必須處理的數據量太大,對這些數據的實時分析很困難;因此,這些數據歷來都是經過后處理的。我們通過研究高階統計(偏度和峰度)和信息理論(熵)來使用傳入數據的統計表示,為每個傳入光譜提供特定的概率分布函數數據,從而減少計算負擔。在2020-2021財年的這項工作中,我們表明,我們對數據的統計表示可以用于異常檢測。我們通過收集數據,處理實驗和模擬光譜,為統計分析開發地面實況,以及對使用我們的數據進行預處理的分析來做到這一點。此外,我們確定,使用半監督機器學習來實施我們的算法,可以對我們獲得的高光譜數據進行實時分析(100毫秒的幀率,每幀250個光譜)。這種算法可以在需要立即了解情況的情況下實施,從而提高作戰人員的殺傷力。
獲得戰術優勢并不總是意味著決定性地確定關于周圍環境的信息。獲得戰術優勢的一種方式是通過異常檢測,例如,發現獨特或不預期的事情。根據Chandola等人的說法,異常檢測是 "在數據中找到與預期行為不一致的模式"。獲得戰術優勢可以簡單到了解什么時候有不符合模式的東西,并可能引起關注。從作戰人員在戰場上獲得戰術優勢的角度來看,異常檢測可以指示出目標或噪聲信號流中感興趣的情況。因此,異常檢測可以松散地通過信號檢測理論的眼光來看待必須做出決定的噪聲信號。更具體地說,異常檢測可以是一種新穎性檢測,其中新穎性不是訓練方法的一部分。存在許多異常檢測技術,這些技術包括(但不限于)分類、聚類、近鄰、統計、信息論和光譜異常檢測技術。
所采用的異常檢測器的類型不僅僅取決于被分析的數據類型,更取決于數據的管理或處理方式。例如,高光譜數據是與光譜信息同時收集的空間信息,形成一個三維的超立方體信息,如圖1(左)所示,可用于表面威脅分析。也有一些技術可以在光譜數據中找到異常點。然而,當它們應用于高光譜數據時,往往計算成本很高。大多數高光譜處理技術都是一次性處理整個超立方體。 由于需要實時分類和處理的數據量太大,實時處理數據會變得計算量過大,必須實現減少計算負擔的方法來接近實時分析。
有一些方法旨在減少高光譜分析中處理的數據量,這些方法大多依賴于多頻段分析。可以利用幾個光譜帶從高光譜數據集中獲得相關的信息,如圖1(中間和右邊)所示。這可以有效地減少正在處理的數據量,但它也依賴于存在的一小部分光譜數據,導致更快速的處理。
圖1:由空間分離的光譜組成的高光譜超立方體(左),可表示為光譜的單幀掃描(中),并可處理為概率分布,得出可用于分析的參數(右)。
圖2:一個信號(如頻譜)(A)通過頻譜Y軸上的強度值進行分檔,并計算出出現的次數(B)。這個分布可以用來進行信息論計算,或者用適當的函數來擬合高階統計(C)。
我們采用兩種方法來降低信號的維度,首先是檢查頻譜值的概率密度函數(PDF),計算高階統計(HOS)和信息論技術。信號的PDF(圖2B和圖2A,分別),包括頻譜的PDF,是通過將強度值分組并計算出現次數產生的。當分組和計數時,PDF可用于計算信息論參數,或用適當的函數擬合以計算相關的HOS,如圖2C所示。
在數學上,HOS是一個求和序列,在計算上沒有負擔,從而減少了處理數據的時間。具體來說,在這項工作中,我們試圖采用偏度和峰度,它們分別是PDF的第三和第四時刻。HOS在數學上被描述為:
其中mk是第k個時刻,n是數據的長度,σ是數據的標準差,???是數據的樣本平均值。偏度提供k = 3,峰度提供k = 4。圖3是HOS的一個直觀表示。圖3A顯示了隨著偏度和峰度的變化,分布的變化方式。圖3A中心的凹陷灰色箭頭在圖3B中表示。可以清楚地看到,隨著偏度變正(上行),分布向左移動,而隨著偏度變負(下行),它向右移動。當峰度大于3時(右列),分布變得更尖,而當峰度小于3時(左列),分布變得更平頂。正態分布的偏度和峰度分別等于0和3,如圖3A中的中間分布和圖3C中所示。因此,擬合PDF講的是PDF的形狀,當PDF由于光譜特征而發生變化時,相關的HOS也會發生變化。
熵利用的是對數函數,可以用查找表快速而容易地確定,也是一種求和:
其中S是熵,p是事件x發生的概率,通過規范化的發生率確定。雖然HOS有助于解釋PDF的形狀,但熵是指一個特定PDF中的信息量。這將隨著光譜中峰的數量(但不是位置)的變化而變化,因為這必然會改變PDF。這些的組合可以用來描述譜的變化。
圖3:改變HOS的估計分布(A),HOS如何變化,如(A)中心的正態分布(B)和HOS采取的正態分布的值(C)所代表的。
在這份報告中,我們提供了我們在2020年和2021年財政年度完成的對高光譜實時威脅異常檢測(Hyper Thread)的研究,重點是爆炸物。首先,我們展示了不同的PDF如何改變熵和HOS,包括當PDF中存在一個以上的模式時。隨后,我們分析了峰度如何可能被用作識別閾值的機制。第3.3節深入探討了高光譜數據的參數化以及如何使用我們所使用的儀器的數據。隨后,第3.4節概述了我們開發的算法以及如何在實時分析中采用上述參數,并在實驗室環境中全面實施該算法。第3.5節討論了開發和分析地面實況以適當地描述算法的性能。最后,在第3.6節中討論了使用輻射校正的必要性以及對太陽和人工照明的差異的分析。
美國陸軍作戰能力發展指揮部分析中心創建了一種算法,用于估計定位、導航和授時(PNT)傳感器和系統的目標位置誤差。即使系統用來尋找感興趣目標的確切算法是專有的或未知的,該算法也可以使用。該程序具有高度的模塊化和可擴展性;因此,相對來說,添加各種不同的PNT傳感器、系統和目標是很容易的。然而,目前僅有的傳感器是使用到達時間差、到達頻率差和/或到達角度的信號智能系統,以及可能有激光測距儀和測量校準源輻射的光子計數探測器的電子光學/紅外(EO/IR)系統。
美國防部有各種傳感器,作戰人員可以用它們來尋找位置。一些傳感器可以讓作戰人員找到潛在的威脅。如果作戰人員目前不能使用GPS,他們可能需要使用傳感器來確定自己的位置。傳感器可以單獨使用,也可以在更復雜的情況下連接在一起,以估計一個感興趣的物體的位置。為了確保美國陸軍為作戰人員配備能夠執行任務的傳感器,建立一個能夠估計這些位置傳感器在任何情況下的性能的模型至關重要。
美國陸軍作戰能力發展司令部(DEVCOM)分析中心需要一種算法來估計正在進行定位、導航和授時(PNT)計算的各種傳感器和系統的性能。DEVCOM分析中心(DAC)開發了多用途通用簡化TLE計算器(MUSTC)模型,該模型可用于查找各種傳感器的目標位置誤差(TLE),進而用于定位各種物體。
MUSTC算法并不要求用戶了解系統如何使用傳感器的測量結果來確定位置。在MUSTC軟件中添加一個新的傳感器類型所需要的只是一個模型,該模型可以估計傳感器測量的原始值,作為傳感器和目標參數以及它們的位置的函數。
為了使算法能夠確定TLE,算法需要知道所有參考傳感器和目標在場景中的位置、可能影響位置測量的變量和這些變量的不確定性,以及用戶希望為感興趣的項目計算TLE值的空間位置。然后,該算法將假定感興趣的物品在名義上位于用戶想要估計TLE的位置。一旦知道了位置,軟件就可以使用測量模型來確定傳感器將為該場景測量什么。然后,該軟件可以使用這些測量結果,以及優化算法,來確定感興趣的項目在空間指定點的TLE。
該算法的主要優點是,它可以擴展到確定來自不同傳感器類型的測量的各種不確定性如何影響總TLE,或找到感興趣的項目的位置的不確定性。
該算法的主要缺點是,由于反復調用實現優化算法的函數來計算TLE,所以計算有時會很耗時。程序可以使用許多優化算法,有些算法比其他算法快。即使程序使用一個相對較快的優化算法,如果優化算法被調用足夠多的次數,計算時間仍然會增加。DAC努力減輕這一缺點,找到了可用的最快的優化算法,但仍能產生正確的答案,將程序寫成多線程應用程序,以便利用大多數現代計算機處理器的多個核心,并試圖在最終結果的準確性和必須調用優化算法的次數之間找到最佳平衡。
高能激光(HEL)系統在對射程外的目標進行定位時,很容易受到大氣湍流的影響。目前的HEL系統使用波前傳感器和復雜的自適應光學系統來補償這些畸變。本論文的主要目的是研究使用機器學習算法的目標圖像像差補償技術,消除對復雜的波前傳感硬件的需要。目標圖像將從高能激光光束控制研究試驗臺(HBCRT)獲得,圖像像差將被模擬,以提供必要的數據集來訓練和驗證圖像像差補償方法。這些技術的性能將被評估為軍事成像應用。
高能激光(HEL)平臺可以證明是艦載防御無人駕駛飛行器的重要系統,因為HEL的彈倉深度大,成本低[1]。然而,HEL系統必須瞄準無人機的特定位置以達到最佳破壞效果。這一要求導致需要對目標進行精確成像以確定最佳瞄準點。圖像的清晰度會因為HEL系統和目標之間的大氣湍流而降低。為了補償這些大氣畸變,目前的HEL系統使用波前傳感器和自適應光學系統(AO)來測量大氣畸變并改變激光的聚焦方式。這些系統的制造成本很高,并增加了HEL系統的復雜性。人工神經網絡的發展為補償大氣像差提供了可能,而無需使用復雜的波前傳感器。
本論文的目的是研究如何使用深度學習模型來補償無人機圖像中的大氣像差。首先,將通過一種稱為盲去卷積的經典去模糊技術來設定性能基線。然后,基線性能將與兩個最先進的深度學習模型(U-Net和DeblurGAN)的性能進行比較。
本論文在第二章將首先概述HEL系統、AO和人工智能(AI)以及深度學習(DL)。第三章進一步介紹了DL模型如何應用于HEL系統的像差補償。第四章將介紹模型的訓練和實現過程,第五章將討論模型的性能結果。最后,第六章將總結已完成的研究,并提供未來工作的方向。
目標姿態估計和目標點選擇在直接能量武器系統中至關重要,因為它使系統能夠指向目標的特定和戰略區域。然而,這是一項具有挑戰性的任務,因為需要一個專門的姿態傳感器。在新出現的深度學習能力的激勵下,本工作提出了一個深度學習模型,以歐拉角的方式估計目標航天器的姿態。深度學習模型的數據是通過實驗從三維無人機模型中產生的,其中包括大氣背景和湍流等效應。目標姿態來自于二維關鍵點的訓練、驗證和預測。有了關鍵點檢測模型,就有可能檢測到圖像中的興趣點,這使我們能夠估計有關目標的姿勢、角度和尺寸。利用弱透視直接線性變換算法,可以從三維到二維的對應關系中確定三維物體相對于攝像機的姿勢。此外,從這種對應關系中,可以確定目標上的瞄準點,模仿激光跟蹤。這項工作評估了這些方法及其在模擬真實世界環境中實驗產生的數據的準確性。
本報告收集了為支持將固有曲面地球模型引入下一代巡航導彈(NGCM)高保真建模與仿真(M&S)工具而進行的分析結果。這些結果用于記錄已實施的算法,預計與其他電子戰應用有關。
我們引入固有曲面地球模型的技術方法的關鍵原則是:1)確定代碼庫中與地球表面有關的計算的位置;2)重構代碼庫,將這些計算遷移到一個新的地球表面軟件對象。在其他方面,這涉及到引入一個關鍵的概念區別:以前,基座標框架和地球表面是混在一起的(地球表面和基座標系統的X-Y平面是一樣的);我們的改變要求把基座標框架和地球表面作為不同的角色分開。
不同的地球表面對象的實現可以模擬不同的地球表面形狀。對于開發和測試,我們的計劃是按照以下策略推出這些對象:首先是平面地球,以保留傳統的行為;然后是球面地球,最簡單的曲面,以支持暴露和消除整個代碼庫中隱含的平地假設,同時受益于盡可能簡單的幾何算法;最后是扁球體,該類包括WGS84,但其許多算法明顯比球體的算法更復雜。
這項工作研究了使用深度神經網絡(DNN)來進行武器交戰區(WEZ)最大發射距離的估算。WEZ允許飛行員確定一個空域,在這個空域中,可用的導彈有更大的概率成功地攻擊一個特定的目標,即一個假想的飛機周圍的區域,在這個區域中,對手容易被擊中。我們提出了一種方法,使用50,000次不同條件下的模擬發射來確定一個特定導彈的WEZ。這些模擬被用來訓練一個DNN,它可以預測飛機在不同發射條件下的WEZ,其決定系數為0.99。它提供了有關前述研究的另一個步驟,因為它采用了一個非具體化的模型,即它一次性考慮了WEZ的所有方向,這在以前是沒有的。此外,建議的方法采用了一種實驗設計,允許較少的模擬運行,提供更快的模型訓練。
在模擬的計算環境中,軍事系統必須與真實相似,其保真度要達到一定程度,才能得出有用的結論[15]。這是通過使用可靠的計算模型來實現的,這些模型被認為包含了它們所代表系統的主要特征[16]。
在處理空戰時,需要建模的最關鍵部分之一是導彈。關于導彈系統本身和何時使用它的決定,即開火,都是如此。在考慮超視距(BVR)空戰時,這一點甚至更為關鍵,因為這一決定必須只根據態勢感知系統顯示給飛行員的內容來做出[11]。
在建設性模擬的背景下,飛機的行為是自主的,有必要為其控制算法提供類似于真正的飛行員會收到的數據,以便執行一致[9]。飛行員可以用來決定是否向對方飛機發射導彈的一個最重要的方面是武器交戰區(WEZ),簡單地說,它代表武器的射程[10]。這個定義將在第2.1節中進一步深入討論。然而,這個范圍的確定不是一個簡單的任務,因為它受到射手和目標的一系列變量的影響。此外,它自然也取決于導彈本身。在這項工作中,我們提出了一種方法,利用一系列不同條件下的模擬發射來確定特定導彈的WEZ。這些模擬被用來訓練一種機器學習算法,當飛機發現自己處于不同的發射條件時,可以預測WEZ。以前的工作已經采用了一些類型的人工神經網絡(ANN),如小波神經網絡(WNN)[29]和帶有貝葉斯正則化人工神經網絡(BRANN)的多層感知器(MLP)[4],對WEZ進行預測,也是基于模擬數據進行預測。文獻內也有純粹的數學方法,如[14]和[23],但它們提供了考慮固定導彈射程的不切實際的導彈模型和基于仿真的更復雜模型之間的中間步驟。
公司和政府內部可能已經開展了更多關于WEZ確定的研究[5],但這仍然很少公開。這項工作的貢獻是采用了深度神經網絡(DNN)和一個新的非離散模型,即該模型同時考慮了WEZ的所有方向,而不是像我們所知的那樣離散了off-boresight角度(圖5)。此外,它使用的實驗設計允許較少的模擬運行次數,這提供了一個更快的模型訓練。
本文的其余部分組織如下。第2節提供了背景,更深入地解釋了WEZ的概念,并介紹了所采用的特定導彈模型和所使用的實驗設計。在第3節中,詳細介紹了所提出的方法,而在第4節中介紹和分析了由此產生的結果。最后,第5節闡述了該工作的主要結論,并提出了一些未來的發展建議。