神經網絡在實時目標檢測算法中越來越受歡迎。這些算法的一個主要問題是其量化自身不確定性的能力,這導致了許多備受矚目的失敗。本研究提出了三種新型實時檢測算法。第一種是利用貝葉斯卷積神經層并產生預測分布,第二種是利用前幾幀的預測,第三種是將這兩種技術結合在一起的模型。這些增強技術旨在緩解現代檢測算法的校準問題。將這三種模型與最先進的 YOLO 架構進行了比較;競爭最激烈的模型的精確度提高了 0.6%,而召回率降低了 3.7%。這項研究還對神經網絡在不確定情況下的表現進行了調查,并提供了深入見解。研究表明,對于一個給定的類別,注釋總數比平均值每增加 0.92%,對象檢測模型對該類出現誤報的可能性就會增加 0.7%。因此,這項研究表明,神經網絡在不確定實際分類情況時,會遵從訓練中出現頻率最高的類別。
分布廣泛的現代通信網絡為無源雷達系統提供了共享頻譜的絕佳機會,而發射器選擇是其中的一個主要考慮因素。本研究介紹了發射器選擇問題空間,它由三個合成孔徑雷達(SAR)處理域組成,即數據采集域、圖像域和任務性能域。這些域之間的定量聯系對于在數據收集域和/或圖像域中提出滿足任務性能域中給定任務要求的最佳發射器選擇問題至關重要。本研究考察了合成孔徑雷達處理域的屬性,以制定數據采集域和圖像域的性能指標,并根據探測性能在任務性能域對其結果進行評估。研究結果表明,可以在數據采集域和圖像域中提出并解決等效的優化問題,從而實現快速高效的優化,同時滿足任務性能域中給出的任務要求。
圖 2. 合成孔徑雷達處理鏈的數據采集、圖像和任務性能領域。
大量的現代通信系統增加了對有限射頻(RF)頻譜的需求,造成頻譜擁塞問題[1, 2]。因此,在多個系統之間建立頻譜共享機制的想法已經浮出水面,利用現有地面發射器(發射機)網絡的無源雷達系統也得到了積極開發[3, 4]。其中,無源合成孔徑雷達(SAR)技術由于能夠不受天氣和日光限制地生成高分辨率圖像,在民用和軍用領域的應用興趣也顯著增加[5, 6]。此外,近年來,利用機會信號的雙穩態雷達技術也得到了顯著發展。
雷達可生成各種數據產品,包括合成孔徑雷達圖像和目標軌跡。產品的質量取決于雷達采集參數,如帶寬、方位分集和信號雜波加噪聲比(SCNR)。通常,雷達硬件將針對特定任務產品(合成孔徑雷達、地面移動目標指示(GMTI)等)進行設計和廣泛測試,以達到輸出質量的最低要求。任務規劃(飛行路徑、運行參數等)會進一步調整硬件設計,以實現所需的性能。然而,對于無源雷達,只有接收機的設計受雷達工程師的控制。軟件可調硬件為實時更新任務規劃提供了靈活性,但還需要指標和算法來驅動這些更新。此外,對于無源雷達來說,選擇最佳發射器是一項重大挑戰,因此制定評估選擇結果的性能標準至關重要。因此,本研究的目標是定義合成孔徑雷達處理域并制定合成孔徑雷達性能標準,以便為無源雙穩態和多靜態合成孔徑雷達制定發射器選擇問題,從而在確保任務成功的同時實現快速高效的優化。
圖 1. 帶有三個發射器(TX)和一個接收器(RX)的被動合成孔徑雷達系統的成像場景。發射和接收信號分別表示為 s(t) 和 r(t),β 為雙穩態角。
圖 1 描述的是一種無源合成孔徑雷達應用場景,包括地面發射器和機載接收器,但這項研究也適用于其他幾何形狀和數量的接收器。近年來,有關無源雷達系統評估標準的研究一直在積極開展。例如,通過估算地形和大氣條件對發射信號的傳播損耗,開發了一種傳播模型來預測合成孔徑雷達的性能[7]。此外,還計算了相干 Cram′er-Rao 下限(CRLB)來表示目標參數估計誤差,并將其應用于發射器選擇的性能驅動優化算法中[8、9、10]。對于多靜態合成孔徑雷達,已開發出一種多目標優化框架,可根據合成孔徑雷達性能標準(如信噪比、側膜水平、分辨率和對比度)選擇一組最佳發射器[11]。其他研究人員已經證明了制定通用圖像質量方程(GIQE)的概念,以預測合成孔徑雷達圖像的國家圖像可解釋性分級表(NIIRS)[12, 13],但對于雙靜態和多靜態合成孔徑雷達還沒有這樣的方程。多靜態雷達比單靜態或雙靜態雷達更有優勢,因為它可以提供空間多樣性,從而提高整體圖像質量,增強目標特征,進而提高目標探測能力[14]。然而,多靜態雷達信號處理更為復雜,發射器分布不均和/或測量不準確會降低圖像質量[15]。
多靜態雷達任務規劃是一種新的范例,它將許多不同的參數和眾所周知的雷達概念以新的方式結合在一起,但人們對這些新的方式還沒有很好的理解或分析。與多個發射器和多個接收器相關的大量參數導致了高維空間的雷達設計問題。此外,由于各種雷達參數之間的相互影響,優化很難量化。如前所述,本研究探討了無源合成孔徑雷達發射器選擇問題空間,討論了制定發射器選擇優化問題時需要考慮的重要因素,并解決了提出的優化問題。
本研究的重點是理解、定義和量化三個合成孔徑雷達領域(即數據收集、圖像和任務性能領域)之間的關系,以便在實現給定任務要求的同時高效選擇發射器(見圖 2)。第三章和第四章將討論擬議的發射器選擇框架,該框架在數據收集域和圖像域中選擇一個或一組發射器,其選擇結果在任務性能域中進行評估,以檢查所選雙穩態對之間的關系及其在實現探測等任務要求方面的性能。
為此,針對被動雙穩態和多靜態合成孔徑雷達提出了發射器選擇和飛行路徑規劃的優化問題(OPs)。
與任何優化問題一樣,必須對上一節中列出的擬議業務方案中的 “最佳 ”進行定義。第三章和第四章詳細介紹了性能標準和目標函數的制定,這些標準和函數構成了一個優化問題,用于選擇最佳發射器。圖 2 描述了合成孔徑雷達處理的一般數據采集、信號和圖像處理、圖像分析和任務性能評估鏈。如前所述,在本研究中,性能標準是在數據采集和圖像域中定義的,然后在任務性能域中對選擇結果進行評估。最終目的是滿足任務目標,例如目標探測或識別性能。因此,我們可以從最大限度地提高任務成功率的角度來表述優化問題,例如通過探測概率與誤報概率或識別正確率來衡量。然而,先驗的任務評估通常并不可行,因此分辨率和對比度等圖像指標通常被用作任務性能指標的替代指標[11, 12, 16, 17]。以往的工作關注基于特定合成孔徑雷達域參數的發射器選擇問題。文獻[8、9、18]考慮了目標定位的發射器選擇問題。在 [8, 9] 中,CRLB 被用作表示目標定位誤差的性能指標,而在 [18] 中,目標定位熵被用作傳感器選擇的目標函數。在 [10] 中,作者使用雙穩態幾何圖形來選擇 在 [10] 中,作者根據模糊函數和 CRLB 之間的關系,利用雙穩態幾何選擇多靜態雷達的最佳發射器-接收器對。文獻[11]為發射器選擇框架定義了多靜態合成孔徑雷達性能標準,如信噪比、側膜水平、分辨率和對比度。
通常情況下,以往的研究使用一個域(數據采集域或圖像域)的參數(如采集幾何形狀、信噪比、分辨率和對比度)來解決發射器選擇問題,并假定其結果可優化任務性能域的性能。從質量上講,假定圖像的改進將導致任務性能的提高。同樣,數據收集標準(如 SCNR 和圖 2 中列出的其他示例)的改進也會導致圖像質量的提高。不過,要理解數據收集、圖像和任務性能領域之間的關系,還需要定量聯系。雖然文獻(如文獻 [19])中有一些雙穩態定義,但多穩態測量方法還不常見。例如,眾所周知,雙靜態分辨率是雙靜態角度的函數,但多靜態分辨率的通用定義尚未被廣泛接受(盡管文獻[11]中提出了一個定義)。因此,需要進一步分析,從數據采集和圖像域參數的角度量化多靜態合成孔徑雷達任務的性能。這樣,任務規劃的優化問題就可以迎刃而解了。
與飛行前的任務規劃方法相比,飛行中的實時優化需要更快的解決方案。將優化問題推向圖 2 的數據采集(左)端,可減少信號和圖像處理量,從而加快優化速度。因此,需要在合成孔徑雷達領域之間建立定量聯系,以便通過優化數據收集標準來優化任務性能。為此,本研究使用多目標函數提出了數據采集和圖像域中發射器選擇的優化問題。然后在任務性能域對選擇結果進行評估,將選定的雙穩態對與實現特定任務要求(如探測)的性能聯系起來。目標函數由數據采集參數(如帶寬、功率和幾何形狀)和圖像質量指標(如分辨率和對比度)構成。然后,采用固定閾值檢測器和恒定誤報率(CFAR)檢測器來評估由所選雙穩態對形成的合成孔徑雷達圖像的性能。
本論文旨在提出并解決無源雷達網絡中的最佳發射器選擇問題,以生成性能最佳的合成孔徑雷達圖像,為無源雙穩態和多靜態合成孔徑雷達技術領域的最新技術做出以下重要貢獻。
定義了合成孔徑雷達數據處理域,包括數據采集域、圖像域和任務性能域,并提供了這些域之間的量化關系。
通過推導 SCNR 和對比度 IQM 測量之間的定量關系,顯示數據收集域和圖像域之間的聯系。
通過展示分辨率和目標定位精度參數之間的相關性,顯示數據收集/圖像領域與任務性能領域之間的聯系。
通過評估數據收集和圖像域中基于探測概率(任務性能域的衡量標準)的發射器選擇結果,研究三個域之間的關系。
提供了對無源雷達網絡中最佳發射器選擇問題空間的基本理解。
針對無源雙靜態和多靜態合成孔徑雷達配置,提出并解決發射器選擇的多目標優化問題。
提供了一個基于性能的發射器選擇框架,該框架可根據作戰任務需求進行自適應調整。
根據合成孔徑雷達性能指標開發歸一化和加權目標函數,以便在數據采集域進行飛行中實時發射器選擇。
根據 SCNR 和對比度 IQM 關系,將數據采集域目標函數最大化的優化問題轉化為圖像域等效目標函數最小化的最大化問題。
通過檢測評估雙靜態和多靜態合成孔徑雷達圖像的任務性能。
為合成孔徑雷達圖像實施固定閾值和 CFAR 探測器,考慮合成孔徑雷達系統對雜波圖像像素功率的成像效應。
開發一種統計程序來實施檢測器,以評估選定的最佳發射器在雙穩態和多靜態合成孔徑雷達圖像中的性能。
對雙穩態和多靜態合成孔徑雷達配置進行性能比較,并為選擇合成孔徑雷達配置提供定量措施,以便有效選擇最佳發射器。
圖 3. 概括數據收集、圖像和任務性能領域之間關系的雙靜態案例圖。
圖 3 描述了雙臂合成孔徑雷達的數據采集、圖像和任務性能領域之間基于性能指標的關系,第三章將對此進行討論。在圖 3 中,帶寬和 SCNR0、分辨率和對比度、定位誤差和探測概率 (PD) 分別指數據采集、圖像和任務性能域的性能指標。本研究特別表明,檢測概率(任務性能域)是 SCNR0(數據采集域)的函數。如圖 3 所示,SCNR0(數據收集域指標)的增加意味著 PD(任務性能域指標)的增加。SCNR0 和帶寬可以快速有效地選擇發射器,而無需經過更復雜、更耗時的成像和任務分析過程。
圖 5-30: YOLOv3 在重新分配的半標簽視譜圖上探測到的船只。(為便于說明,圖像對比度有所增強)。
在復雜的計算機視覺應用中,卷積神經網絡(CNN)的性能已經超過了人類水平,并有可能大大提高紅外反艦導彈尋的器算法的性能。但是,基于卷積神經網絡的算法的性能非常依賴于用于優化這些算法的數據,通常需要大量完全標注的真實世界訓練示例集。
本論文分為四個技術章節,探討了將 CNN 應用于長波紅外船舶探測、識別和鑒定所面臨的挑戰。為了解決缺乏合適的長波紅外訓練數據的問題,我們合成生成了一個由 972,000 張帶有不同海景和背景雜波的軍用艦船全標記圖像組成的大型熱仿真數據集。該數據集--IRShips--是全球最大的公開可用的此類圖像庫。
圖 3-14: 數據后處理算法概覽。
可配置的自動工作流程管道極大地促進了基于 CNN 算法的開發。這項工作開始時還沒有這樣的工具,因此我們創建了一個集成的模塊化深度學習開發環境--Deeplodocus。該環境已公開發布,目前已躋身 Python 軟件包索引庫前 50%軟件包的行列。利用 Deeplodocus,對全卷積單級 YOLOv3 物體檢測算法進行了訓練,以檢測真實世界長波紅外圖像序列中高度雜亂的船只。進一步增強 YOLOv3 后,F 分數達到 0.945,這是首次使用合成數據來訓練 CNN 算法,以成功檢測長波紅外圖像中的軍用艦船。
圖 2-5: 說明必須將多個不同的流程和軟件組件編譯成單一的互聯系統,才能訓練、驗證和測試深度學習算法。
利用新加坡海事數據集的視覺光譜和近紅外數據,將 YOLOv3 的檢測準確率與兩個替代 CNN(Faster R-CNN 和 Mask R-CNN)進行了基準比較,結果顯示 YOLOv3 比 Mask R-CNN 快三倍,但準確率低 3%。通過使用依賴光譜域的編碼對 YOLOv3 進行修改后,近紅外測試數據的準確性達到了一流水平,同時保持了 YOLOv3 在速度上的顯著優勢。
圖 1-3: 現代制導導彈所含關鍵子系統示意圖
表 1-1:部分現役反艦導彈的最大速度和射程,以及推進、導航和末端制導方式。
圖 3-5: 作為合成紅外數據集基礎的 10 個 CAD 模型。(不按比例)。
本論文將雷達信號處理與數據驅動的人工神經網絡(ANN)方法相結合。信號處理算法通常基于對數據形成過程的建模假設。在某些情況下,這些模型足以設計出良好甚至最優的解決方案。
但在很多情況下,這些模型可能過于復雜,無法形成分析解決方案;可能過于簡化,導致實際結果與理論上的結果大相徑庭;可能是未知的,即多個已知模型或參數值中的一個可能適合數據,但我們不知道是哪個;或者過于復雜,導致解決方案的計算量過大。
數據驅動的方差網絡方法提供了彌合這些差距的簡單方法。我們在四項不同的研究中證明了這一點,在這些研究中,我們利用雷達數據模型來制定數據驅動型解決方案,這些解決方案既準確又具有計算效率。
我們將基于 ANN 的結果與計算要求極高的最小二乘法和窮舉匹配過濾法進行了比較。結果表明,ANN 的性能可與這些方法相媲美,但計算量卻很小。我們在使用各種參數值的模型采樣數據上訓練人工智能網絡。這自然可以處理漂移和未知參數值,它們可能會改變數據,但不會改變所需的預測結果。我們的研究表明,根據簡單模型的數據訓練出的 ANN 分類器的實際表現可能比理論預期的要差得多。我們通過將有限的真實數據與合成模型數據相結合來改善這種情況。在所有情況下,我們都使用了易于評估的模型。然而,這些模型的分析方法并不簡單,無法創建分析解決方案。
特別是,我們提出了一種實現非相干脈沖壓縮的方法,可在單脈沖寬度內分辨目標。我們提出了一種檢測微弱目標軌跡的方法,該方法無需事先假設目標加速度、信噪比等。我們介紹了在訓練無人機和非無人機目標分類器時納入不完美模型數據的不同方法。最后,我們介紹了一種估算海面多徑傳播路徑差的方法,用于目標跟蹤。
遙控飛機執行的軍事任務類型不斷擴展到包括空對空作戰在內的各個方面。雖然未來的視距內空對空作戰將由人工智能駕駛,但遙控飛機很可能將首先投入實戰。本研究旨在量化延遲對高速和低速交戰中一對一視距內空對空作戰成功率的影響。研究采用了重復測量實驗設計,以檢驗與指揮和控制延遲相關的各種假設。有空對空作戰經驗的參與者在使用虛擬現實模擬器進行的一對一模擬作戰中受到各種延遲輸入的影響,并對每次交戰的作戰成功率進行評分。這項研究是與美國空軍研究實驗室和美國空軍作戰中心合作進行的。
因變量 "戰斗得分 "是通過模擬后分析得出的,并對每次交戰進行評分。自變量包括輸入控制延遲(時間)和交戰起始速度(高速和低速)。輸入延遲包括飛行員輸入和模擬器響應之間的六種不同延遲(0.0、0.25、0.50、0.75、1.0 和 1.25 秒)。每種延遲在高速和低速交戰中重復進行。采用雙向重復測量方差分析來確定不同處理方法對戰斗成功率的影響是否存在顯著的統計學差異,并確定延遲與戰斗速度之間是否存在交互作用。
結果表明,在不同的潛伏期水平和交戰速度下,戰斗成功率之間存在顯著的統計學差異。潛伏期和交戰速度之間存在明顯的交互效應,表明結果取決于這兩個變量。隨著潛伏期的增加,戰斗成功率出現了顯著下降,從無潛伏期時的 0.539 降至高速戰斗中 1.250 秒潛伏期時的 0.133。在低速戰斗中,戰斗成功率從無延遲時的 0.659 降至 1.250 秒延遲時的 0.189。最大的遞增下降發生在高速潛伏期 1.00 至 1.25 秒之間,低速潛伏期 0.75 至 1.00 之間。高速交戰期間戰斗成功率的總體下降幅度小于低速交戰期間。
這項研究的結果量化了視距內空對空作戰中戰斗成功率的下降,并得出結論:當遇到延遲時,希望采用高速(雙圈)交戰,以盡量減少延遲的不利影響。這項研究為飛機和通信設計人員提供了信息,使他們認識到延遲會降低預期作戰成功率。這種模擬配置可用于未來的研究,從而找到減少延遲影響的方法和戰術。
本報告概述了在基于模型的自適應目標跟蹤以及識別來自電磁干擾(EMI)源的衛星欺騙和干擾攻擊方面所做的研究工作。我們假設可以利用不同電磁干擾源的射頻(RF)特征來識別和跟蹤主動和被動電磁干擾源。射頻信號被輸入一個基于模型的深度神經網絡(DNN),該網絡可對不同物體進行分類和跟蹤。
我們的初步結果表明,對于有源電磁干擾源,即使用不同調制方案發射射頻信號的源,使用 DNN 識別電磁干擾源射頻調制方案的準確性在很大程度上取決于射頻信號的質量,而射頻信號的質量又是信道的函數。特別是,如果信道是視距信道,且信噪比(SNR)較大,則調制類型的分類準確率很高(> 95%)。另一方面,如果信道參數未知和/或波動較大,信噪比較低,則分類準確率較低(< 60%)。調制類型識別的性能使我們得出結論,在現實世界中基于調制類型的目標跟蹤將非常困難。因此,這項研究的主要工作集中在使用有源雷達對無源信號源進行分類,并以人員計數系統為原型。
我們沒有使用模擬,而是在實驗室建立了一個小規模的測試環境來驗證假設。我們提出的人員計數系統使用多個發射天線,通過發送毫米波雷達啁啾掃描環境。物體反彈回來的信號由多個接收天線接收、處理并存儲到數字數據庫中。然后,我們對數字數據進行特征提取,并將特征輸入卷積神經網絡,以進行物體分類和跟蹤。在這些實驗中,我們將行走的人視為移動物體。我們的初步結果表明,在有限的環境中(如實驗室環境),卷積神經網絡可以利用射頻信號準確識別不同的目標(> 95%)。
許多科學和工程學科都對目標識別和跟蹤進行了深入研究[1][2][3][4][5]。從用于早期探測和跟蹤飛行中導彈的全球定位系統(GPS)[6][7][8] 到自動駕駛汽車[9],它們都是許多技術的基礎組件。此外,未來的無線通信系統使用大規模多輸入多輸出(MIMO)波束成形[10]和自由空間光學(FSO)通信技術[11][12][13],使發送方能夠通過將射頻光束或激光束直接聚焦到接收方來傳輸數據。這些聚焦傳輸提高了信噪比(SNR),降低了所需的發射功率以及多用戶干擾。然而,聚焦傳輸在很大程度上依賴于準確跟蹤和識別接收器位置的能力。
傳統的物體跟蹤和識別技術都是基于模型的,這是因為其數學上的優雅和高效,也許更重要的原因是缺乏訓練數據。基于模型的方法通過數學模型將有關問題的先驗知識納入其中,這些先驗知識或基于物理定律,或基于成熟的直覺,以捕捉物體的動態和屬性,從而實現精確的跟蹤和分類。因此,基于模型的方法在許多只需幾個參數就能精確建模的環境中非常有效。卡爾曼濾波器就是基于模型方法的一個典范 [14][15][16]。卡爾曼濾波器在許多應用中都取得了成功,特別是在跟蹤受噪聲觀測影響的目標時。卡爾曼濾波器在跟蹤中取得成功的關鍵在于將目標動態(如速度、加速度等)的精確數學模型與這些值的經驗實時噪聲測量相結合。卡爾曼濾波器根據增量測量/觀測數據和假定的數學模型動態,通過一組更新參數值的遞推方程,高效(快速)地估計模型參數。
用于跟蹤的卡爾曼濾波器的一個主要缺點是,其性能在很大程度上取決于基于一些合理假設(如物理定律或經驗)的所謂精確數學模型。然而,如果數學模型不夠豐富,無法捕捉所考慮環境的所有微小細節,那么卡爾曼濾波器的最佳性能就會受到所考慮的數學模型系列的限制。
為此,本研究調查了用于識別和跟蹤物體的深度神經網絡(DNN)。DNN 是一類基于人工神經網絡(ANN)的機器學習方法,在現實世界的許多應用場景中都表現出色。DNN 架構允許模型從大型數據庫中學習難以用數學建模的復雜動態和特征。
本節將介紹兩項不同的工作。第一項工作是使用不同類型的卷積神經網絡 (CNN) 檢測 EMI 源的射頻調制類型。這項研究完全在 Matlab 仿真環境中完成。第二項研究是利用有源雷達系統的射頻信號作為 3-D CNN 的輸入,檢測房間內的人數并跟蹤他們。這類系統通常被稱為人員計數系統 [17][18][19]。與第一個系統不同的是,所有射頻信號都不是模擬的。相反,它們是使用基于 MIMO 的毫米波雷達系統實時收集的。接下來,我們對原始數據進行特征提取,并將特征輸入三維卷積神經網絡以檢測人數。
將前景目標從背景中分離出來是許多視頻處理管道的第一步。雖然現有的背景分離方法能夠充分解決許多技術難題,如光照變化、動態背景(如飄動的樹葉、揮舞的旗幟等)、相機抖動等),但它們在處理移動傳感器方面有局限性,而且計算復雜性也很高。這是未來智能系統的一個主要限制,因為最近流行的移動傳感器和小型平臺需要在尺寸、重量和功率(SWaP)限制下進行板載處理。
這項小企業創新研究(SBIR)工作進行了一些創新,以處理這些挑戰和解決最先進的限制: 這些創新包括:i)開發創新的數學模型和先進的算法,在此基礎上有效地處理小型平臺上的高效背景減除的挑戰;以及ii)開發移動傳感器和圖像形成的觀察幾何的數學模型,并利用三維世界中剛體運動的低等級約束來有效檢測獨立移動的目標。第二階段的工作開發了計算機視覺和機器學習算法,利用背景外觀和運動的低等級約束來區分前景區域和背景。背景外觀的低秩約束是基于理論和經驗結果,這些結果表明,在不同的變換(如光照變化)下,對應于特定目標的矢量圖像大約位于一個低維子空間上。此外,對運動的低秩約束利用了自由移動的傳感器的觀察幾何學來區分前景和背景運動。通過將傳感器運動與外觀模型相結合,所開發的方法能夠處理靜態和移動的相機。背景分離算法也被移植到移動設備上,以提供實時性能,并在標準和內部數據集上進行了評估。在該項目中開發的技術為低成本移動設備上穩健有效的自動計算機視覺提供了一個自然的框架和基礎。
擬議工作的首要目標是開發技術,在靜態和自由移動的視頻傳感器中使用移動處理器實現實時背景/前景分離。
圖1:提議的背景分離技術將使移動平臺上的視頻傳感器得到利用,并有廣泛的應用,包括:空中視頻的利用、增強現實和游戲、高分辨率視頻的邊緣處理、可穿戴傳感器和自主車輛。
視頻傳感器已經成為生活中所有領域中無處不在的信息來源(圖1)。從國防到商業到消費領域,它們正被越來越多地用于實現廣泛的應用。例如,固定和傾斜變焦(PTZ)相機通常被用來提供視覺監控、關鍵基礎設施安全、商業智能和建筑自動化。同樣,安裝在無人機平臺上的攝像機很容易成為情報、偵察和監視(ISR)數據和態勢感知的最關鍵來源之一。此外,世界各地的消費者正在從手持設備(如智能手機)和可穿戴設備(如谷歌眼鏡、GoPro等)產生大量的視頻數據。
這些傳感器產生的大量數據推動了對能夠從豐富的視頻數據中提取有用信息的自動化技術的需求。例如,自動視覺監控系統和空中視頻開發工具被廣泛用于檢測和跟蹤感興趣的目標,并從視頻中識別活動。然而,大多數現有的視覺分析系統都假定有大型的處理基礎設施(強大的PC、服務器、GPU等),因此不能輕易應用于許多新的移動傳感設備,或具有嚴格的尺寸、重量和功率(SWaP)限制的小型平臺。因此,有必要開發高效的計算機視覺技術,使其能夠使用易于與傳感設備集成的低功耗、低成本的移動計算平臺對視頻進行實時利用。
圖2:最先進的背景建模方法所使用的馬賽克(上)和基于體素(下)的表示方法在計算上成本非常高,對移動平臺來說不可行。
許多視頻處理管道的第一步是將前景目標與背景分離。這是通過背景分離算法完成的,該算法試圖通過自適應地學習和模擬背景的特征來識別視頻流中最相關的部分,并找到不符合學習模型的像素。作為自動視覺監控系統最關鍵的組成部分之一,背景分離問題已經在計算機視覺文獻中得到了廣泛的研究。人們提出了許多方法來解決其技術難題,如光照變化、動態背景(如飄動的樹葉、揮舞的旗幟、噴泉等)、攝像機抖動、陰影和移動攝像機等。雖然現有的方法相當善于處理其中的許多挑戰,但它們也有很高的計算復雜性(以像素數計),不適合移動平臺。另一方面,如今產生的很大一部分視頻數據是由移動傳感器捕獲的,例如,手持式智能手機、可穿戴設備(GoPro、谷歌眼鏡等)以及安裝在小型無人機上的傳感器。然而,大多數現有的背景分離工作都集中在視頻監控中使用的靜態和PTZ相機的視頻上。即使對于一些使用先進的在線優化和子空間估計技術[GK15, HBS12]進行快速背景分離的最新算法也是如此。因此,這些算法不能直接應用于來自移動傳感器的視頻。
那些試圖解決移動傳感器問題的方法也借鑒了靜態攝像機算法的基本方法。這些方法首先創建新的表征(圖2),以消除平臺運動的影響,例如,背景馬賽克(通過拼接后續幀的圖像生成)或明確的三維模型(使用結構-運動和立體技術創建)。然后,從靜態攝像機領域借來的背景分離技術被應用于這些新的表示。除了原始分離技術的復雜性之外,這種方法還為處理管道引入了更多計算上的復雜元素。例如,生成馬賽克所需的圖像拼接算法涉及非常昂貴的圖像扭曲(轉換)組件。同樣,如果不使用GPU進行繁重的并行處理,從運動中獲得結構和立體感的技術以及由此產生的三維體素代表就無法實時創建。
為了應對上述挑戰,Novateur Research Solutions和賓夕法尼亞大學的通用機器人、自動化、傳感和感知(GRASP)實驗室(以下簡稱Novateur團隊)在SBIR工作期間進行了多項數學創新。這些創新包括開發創新的數學模型以及先進的計算機視覺和機器學習技術,能夠有效地從各種場景的移動和靜止傳感器中分離背景和前景。
特別是,在第二階段的工作中,該團隊開發了代數模型,利用背景外觀的低等級約束以及運動來區分前景區域和背景。背景外觀的低秩約束是基于理論和經驗結果,這些結果表明,在不同的變換(如光照變化)下,對應于給定物體的矢量圖像大約位于一個低維子空間上。此外,對運動的低秩約束利用了自由移動的傳感器的觀察幾何,以區分前景和背景運動。然后,該團隊開發了基于代數優化(矩陣分解)和機器學習(神經網絡)的新型算法,利用這些約束從移動平臺上進行背景減除。
第一階段開發的背景分離技術是
因此,它們能夠使用各種低成本、低功耗和輕量級的處理單元在靜態和移動傳感器的高分辨率圖像中進行有效的背景分離。
在第二階段的研究和開發工作中,完成的主要目標包括
在移動傳感器視頻中高效在線提取多個移動目標的新型代數框架--在第一階段的工作中,Novateur團隊將發現和分割獨立移動物體的問題作為一個低等級的近似問題來解決。更具體地說,我們開發的技術涉及檢測和跟蹤各幀之間的特征,然后將這些跟蹤結果匯總到不完整的矩陣中,其中缺失的條目反映了這樣一個事實:隨著攝像機在空間中的移動,特征會隨著時間的推移而被遮擋。然后我們表明,我們可以利用這樣的假設,即大部分場景是剛性移動的,以及仿射模型的結構,該模型規定這些軌跡中的大部分必須位于高維空間的三維流形上。我們方法的下一個關鍵想法是利用在線不完全矩陣分解技術,快速有效地從測量中提取這個三維子空間結構。一旦這樣做了,獨立移動的障礙物就可以通過識別低等級模型的離群值來恢復,然后根據圖像中的接近程度將這些特征分組。第二階段的工作在第一階段模型的基礎上進一步發展,納入了子空間跟蹤[HBS12]和動態模式分解[GK15, KFB15],并利用背景模型的低秩屬性來實時提取前景像素。此外,第二階段的工作還開發了新的機器學習模型,利用低維約束將靜態的三維場景幾何與獨立移動的物體分開。
利用背景分離技術作為注意力集中機制,改進移動計算平臺上的移動目標檢測--第二階段工作開發了一種新型計算機視覺算法,能夠在移動平臺上檢測移動目標,如無人機。該算法結合了光流、深度神經網絡以及低等級約束,并為進一步處理任務提供了注意力集中機制。
測試和評估--Novateur團隊還利用標準基準數據集以及由真實世界場景組成的內部數據集,展示了所提出的背景分離技術的能力。該團隊還對提議的技術進行了定量和定性評估,其中包括對真實世界數據的性能特征和權衡分析。
實施端到端軟件,實現視頻中移動目標的穩健檢測--第二階段實施了一個基于ROS架構的端到端軟件,利用移動計算平臺對靜態和移動傳感器的視頻中的目標進行穩健檢測。
目前的自動空中加油(AAR)工作利用機器視覺算法來估計接收飛機的姿勢。然而,這些算法取決于幾個條件,如精確的三維飛機模型的可用性;在沒有事先給出高質量信息的情況下,管道的準確性明顯下降。本文提出了一個深度學習架構,該架構基于立體圖像來估計物體的三維位置。研究了使用機器學習技術和神經網絡來直接回歸接收飛機的三維位置。提出了一個新的位置估計框架,該框架基于兩個立體圖像之間的差異,而不依賴于立體塊匹配算法。分析了其預測的速度和準確性,并證明了該架構在緩解各種視覺遮擋方面的有效性。
圖3:利用的坐標系統。紅軸代表X軸,綠軸代表Y軸,藍軸代表Z軸。所有顯示的箭頭表示該軸上的正方向。
本報告的目的是探討可用于估計紅外(IR)目標中心的多種方法。具體的重點是在一個非常小的空間區域發出信號的目標,近似于一個點源。如果只需要一個簡單的解決方案,中心可以被大致估計為感興趣區域(ROI)中最亮的像素。雖然很容易實現,但這種方法只能產生一個精確到單個像素的估計。如果沒有任何進一步的細化,這將建立一個精度的下限。然而,通過考慮鄰近的像素,有可能將估計值細化到一個像素的一小部分。因此,選定的算法必須能夠進行亞像素估計,以便為高精確度的應用建立必要的精確程度。這些應用中的幾個可能包括在整個視頻中跟蹤一個投射物或使用紅外目標進行相機校準。
將這些算法限制在點源上的重要性在于,它允許對目標中心進行非常精確的估計。理想的候選人將在圖像的一個小區域內擁有一個單一的、定義明確的峰值。一個物體作為點源的能力根據所涉及的距離而變化。一個較大的物體可能不被認為是一個點源,除非是在非常長的距離上,而一個短距離的點源可能在較長的距離上根本無法注冊。在這方面,有幾個物體可以被認為是適用的。鹵素燈泡從燈泡中心的一個小燈絲產生熱量。帶有示蹤劑的射彈會在子彈底部有一個小的,但很亮的燃燒點。鉚釘的頭部在外部邊緣迅速冷卻,但在中心緩慢冷卻,在死角處形成一個熱斑。所有這些元素都是這種算法的良好候選者。附近的車輛,可能看起來很大(幾百個像素),其紅外特征的梯度很淺,將不適合這種跟蹤算法。
首先,有必要建立一個全像素方法,它將作為一個控制和基準。這種算法的作用是找到強度最大的像素位置。在出現平局的情況下,解決方案將是峰值位置的平均值。因此,如果像素值是飽和的,全像素估計有可能產生一個小數值。請注意,由于圖像生成的性質,最大值,因此整個像素的估計值將出現在子圖像的中心(或在飽和圖像的情況下接近中心)。這意味著,只要圖像被裁剪并以ROI為中心,其余算法的結果對任何尺寸的圖像都有效。
由相機記錄的真正的點源可以在數學上表示為一個艾瑞盤。由于這個函數相當復雜,可以用眾所周知的高斯分布做一個稍不準確的估計。這是一個非常常見的簡化,雖然這兩個函數的尾部不匹配,但中心,即估計的最重要的位置,卻非常匹配(參考文獻1)。候選點源,給定適當的距離,預計將表現出類似于艾瑞盤或高斯分布的特征。因此,尋找子像素中心的最合理的方法是將一個二維(2D)高斯函數擬合到圖像區域,獲得其中心的坐標。在實踐中,使用MATLAB擬合二維高斯分布需要運行一個優化,這可能是相當緩慢的。因此,盡管這種方法可以非常精確,但最好還是能有一個能更快運行的解決方案。將二維高斯分布擬合到圖像區域的方法被稱為優化高斯擬合。
為了獲得一個計算成本較低的解決方案,需要尋求一種確定性的分析方法。首先,參考文獻2中描述了一種擬合拋物線估計器的新方法。雖然這同時滿足了確定性和分析性的要求,但它只針對一維(1D)的情況。為了對估計點源的子像素中心有用,它必須在二維上推導。這個估算器可以根據方程1到9擴展到二維空間。
該研究項目解決了下一代自主蜂群網絡系統的分布式控制和優化的挑戰,其中快速變化和超動態的網絡狀態(如網絡拓撲結構、頻譜和信道狀態信息、數據緩沖區排隊狀態等)需要分布式優化算法的快速收斂和低延時。最近基于PI對網絡控制和優化的研究,利用二階信息(SOI),在這個研究計劃中,我們提出了一系列新的分布式算法技術,與傳統方法相比,在收斂速度和排隊延遲方面都有數量級的改進,同時達到了同樣的可證明的網絡效用優化。
具體來說,我們在這個項目中的研究任務集中在基于動量(Heavy-ball)的聯合擁堵控制和多路徑路由(部分SOI)的EMANE仿真實現上。我們提出的研究計劃采取了一種綜合的、整體的方法,從數學建模、優化理論、控制理論、排隊理論和隨機分析等領域吸取技術。擬議的研究不僅將推進我們在下一代復雜網絡的算法設計方面的知識,而且還將通過探索基于SOI的網絡控制和優化的新領域來滿足一般網絡研究界的關鍵需求。
所提出的方法將影響廣泛的應用,如機載網絡和無人機系統的圖像/視頻,特別是在控制和優化行動不能承受大的延遲和緩慢收斂的系統。將尋求與AFRL進行實質性的合作,以促進這一研究工作的潛在過渡途徑。
圖1:在高度動態的無線網絡下,無人機系統通信有嚴格的延遲要求。
隨著部署在戰場上的通信網絡的激增以及它們所產生的大量移動數據,今天的無線網絡技術正被拉伸到極限。不僅戰術信息的爆炸性增長要求不斷增加網絡容量,大規模無線網絡的復雜協調也在實時控制和優化中引入了嚴格的延遲和收斂速度要求。為了設計高效的優化算法來應對新興的戰術無線網絡,一個關鍵的方面是有效地處理擁塞控制和鏈路調度之間的交叉互動,包括在協議棧層內和跨協議棧。因此,近年來出現了對戰術無線網絡的低延遲和快速轉換的聯合擁堵控制和調度算法的迫切需求。此外,聯合擁塞控制和路由優化不僅是信息網絡設計的要求,也是許多復雜網絡運行的核心問題,如智能電網需求響應[1-3]、供應鏈管理[4-7]、交通網絡流量控制[8, 9],僅舉幾例。
一個動機示例: 為了說明快速收斂、低延遲和分布式設計的重要性,我們在此以無人機系統網絡為例。控制和優化無人機系統網絡的一大挑戰來自于快速變化和高度動態的網絡狀態(如網絡拓撲結構、頻譜/信道狀態、數據緩沖區排隊狀態等),這使得傳統的擁堵控制、路由和頻譜訪問技術變得無效(見圖1的說明性例子)。這種高度動態的性質需要網絡控制和優化算法的快速收斂。否則,在完成緩慢的收斂過程后,網絡拓撲結構、頻譜/信道狀態信息和排隊狀態很可能被大大改變,使所有的計算結果和控制行動變得過時和無用。
使網絡控制問題更加嚴重的是,控制行動與需要實時傳輸大量數據的時間密切相關(例如,無人機系統圖像或視頻監控等)。因此,當數據到達量激增時,需要低延遲的網絡控制算法來避免過度延遲和大量的丟包(由于超時事件)。否則,可能會發生突然的大規模網絡中斷,這不僅會導致大范圍的不便,而且會導致毀滅性的戰斗失敗甚至是生命損失。此外,機載網絡的地理規模大,網絡子系統之間物理層技術的異質性,以及快速響應時間的要求,意味著控制和優化算法既不能集中,也不能有高的復雜性。這就要求開發出完全分布式的算法,以規避單點故障問題,簡單易行,又能達到可證明的優化性能。
由于移動數據需求的快速增長,近年來出現了大量關于資源分配的工作,旨在使無線網絡中的網絡效用最大化(例如,見[10-13],和[14]的調查)。這導致了一個優雅的數學分解框架,"松散耦合 "的擁堵控制、調度和路由算法自然而然地出現。這些算法不需要關于到達或信道狀態的統計知識。相反,它們只依賴隊列長度和信道狀態信息來做出控制決策。這些算法也與非線性優化理論中的拉格朗日對偶分解框架和子梯度方法有內在聯系[10, 11],其中(按比例)隊列長度可以被解釋為拉格朗日對偶變量,隊列長度更新起到子梯度方向的作用。
盡管這些基于隊列長度的算法(QLA)具有吸引人的特點,但它們受到了幾個關鍵的限制。首先,在現有的QLA框架中,已經證明了效用優化差距O(1/K)可以通過排隊延遲的O(K)懲罰來實現,其中K>0是一個系統參數。因此,一個小的效用優化差距需要一個大的K,并導致大的排隊延遲。為了解決這一局限性,近年來有大量的工作(如[13,15-17]等)集中在減少這些方案的排隊延遲上(后面對相關工作有更深入的討論)。同時,在現有的QLA框架中,基于隊列長度的權重調整忽略了目標函數輪廓的曲率,并且在每次迭代中使用小的步長[10-13],這導致收斂速度不理想。為了解決這個問題,最近提出了一些二階擁塞控制和路由/調度算法來提高收斂速度(見,例如,[18,19])。然而,由于其復雜的算法結構,這些二階方法需要更大的信息交換開銷,并且不能隨著網絡規模的擴大而很好地擴展。現有方法的這些限制促使我們在這個項目中追求一種新的重球設計。
更具體地說,在這個項目中,我們開發了一個基于重球的權重調整方案,在不影響網絡效用性能和不增加任何計算復雜性的情況下,大幅減少隊列長度,提高收斂速度。我們的方法是基于將隊列長度與權重分離的巧妙想法,然后使用一個權重更新方案,該方案只利用前一個時隙的權重變化的一個更多的記憶槽。令人驚訝的是,我們表明這個簡單的方案提供了兩個控制自由度,使我們能夠實現效用優化、低延遲以及快速收斂。
從歷史上看,重球法是由Polyak在20世紀60年代首次提出的[20],用于解決無約束的凸優化問題,其最初的目標是加速梯度下降法的收斂。重球法的基本思想是,不是只使用當前迭代的(子)梯度信息和完全不記憶過去迭代的軌跡,而是使用當前梯度(類似于 "勢")和上一步的更新方向(類似于 "動量")的線性組合來計算搜索方向。該方法是由物理學中描述重體在勢場中運動的二階常微分方程(ODE)激發的,并可被視為該方程的離散版本,因此被稱為 "重球(HeavyBall)"。在[21]中已經表明,通過適當地權衡當前的 "勢 "和 "動量",該算法對目標輪廓不敏感,這導致了更快的收斂。事實上,收斂加速的優勢是我們在無線網絡跨層優化中采用重球方法的第一個基本理由。但令人驚訝的是,我們隨后的研究表明,采用重球思想的好處遠遠超出了收斂加速的范圍。
然而,我們注意到,由于一些技術上的挑戰,為無線網絡中的效用最大化問題開發一個基于重球的解決方案并不簡單。首先,由于重球法最初是為無約束的靜態優化問題設計的,目前還不清楚如何為無線網絡效用最大化修改重球法,因為無線網絡是一個有約束的隨機優化問題,問題結構要復雜得多。其次,與QLA設計中隊列長度和拉格朗日對偶變量之間的明顯聯系不同,重球法與可觀測的網絡狀態信息(如隊列長度、信道狀態等)之間的關系是未知的。因此,在重球法下,延遲和網絡效用之間的權衡仍然是一個開放的問題。第三,由于包含了過去的迭代值,重球方法的算法結構與QLA方法不同。因此,QLA中用于建立吞吐量-優化和效用-延遲權衡的傳統技術并不適用。因此,在重球方法的性能分析中需要新的分析技術。
本項目的主要貢獻是,我們首次開發了一個基于重球的無線網絡效用優化框架,克服了上述的技術挑戰。我們建立了一系列關于大幅減少延遲和快速收斂的新分析結果,同時保留了效用優化的特點。本文的主要結果和技術貢獻如下:
在重球思想的啟發下,我們提出了一個新的權重調整方案,用于無線網絡中的聯合擁塞控制和路由/調度。我們的工作不僅提供了重球算法和可觀察的網絡狀態信息(隊列長度和信道狀態)之間的協同作用,允許在實踐中簡單實現,它還擴展和概括了經典的重球方法,從無約束的靜態優化到約束的隨機網絡效用優化范式,從而推進了數學優化理論中重球方法的先進性。
在我們的基于重球的聯合擁堵控制和調度方案下,有一個β參數化的動量(β∈[0,1]是一個系統參數,通常選擇接近1),我們表明,延遲是(1-β)-QLA方法的小數部分。更具體地說,我們的理論分析表明,可以用O((1-β)K)+O((1+β)√K)的排隊延遲成本實現效用最優差距O(1/K),其中參數K與重球法的步長成反比。此外,在β被選為β=1-O(1/ √ K)的K的漸進制度中,我們的重球算法實現了[O(1/K), O( √ K)]效用-延遲權衡,這明顯優于眾所周知的QLA方法的[O(1/K), O(K)]權衡。
鑒于參數K和β,我們表明我們基于重球的算法的收斂時間擴展為O[log(√ K) (- log-1 (1 + β - √ β))]。結合前面的結果,我們提出的重球算法提供了一個重要而優雅的三方權衡關系,由K和β中的兩個控制旋鈕控制。最值得注意的是,通過權衡收斂速度,同時實現效用最優和低延遲。我們注意到,這種重要的三向權衡關系迄今在文獻中尚未被發現。
除了理論結果,本項目的一個重點是開發高保真的基于EMANE的模擬,以測試和驗證我們上述的理論結果和見解。在這個項目中,我們已經成功地開發了一個基于Shim層的EMANE跨層仿真平臺來測試我們的HeavyBall算法。我們基于EMANE的仿真結果表明,所有的理論預測在高保真仿真中是可以觀察到的。此外,值得一提的是,我們的基于EMANE的跨層仿真平臺具有很強的通用性,對于AFRL所重視的其他基于EMANE的無線網絡跨層仿真來說,可以具有獨立的利益。
在本節中,我們首先回顧了與本文密切相關的QLA文獻的最新進展。如前所述,在減少QLA方法的延遲方面已經有了很大的努力。例如,在[13]中,采用了類似于[22-24]中的虛擬隊列技術,其中虛擬隊列長度根據服務速率演變,是實際服務速率的一小部分。在[16]中,提出了一種用占位者比特代替真實數據的虛擬積壓機制。研究表明,通過接受一些非零的丟包概率,這種方法實現了[O(1/K), O(log2 (K))]效用-延遲權衡。在[15]中還提出了一個指數Lyapunov虛擬積壓方法與基于閾值的丟包方案相結合,以實現O(log(K))的延遲。雖然具有對數型的時延擴展,但[15,16]的一個主要限制是,[16]中選擇占位器比特的大小和[15]中的閾值都需要非因果的全局到達和信道統計(參見[15,公式(17)],[16,公式(45)]),這通常是不可能實現的。另外,如果參數設置不當,這些方案可能會導致不可忽略的丟包概率。為了解決這個問題,在[17]中提出了一個每迭代學習,以在線方式學習最佳的占位比特大小。然而,每迭代學習組件大大增加了算法的復雜性。在某種意義上,所有這些減少延遲的方案都可以被看作是為了減少延遲而犧牲了一些吞吐量的優化(體現在降低服務速率或丟包)。相比之下,在不犧牲任何吞吐量優化和不需要任何非因果統計知識的情況下,我們的重球方案通過設置β=1-O( 1/√ K),實現了[O(1/K), O( √ K)]效用-延遲折衷。此外,我們的重球算法實現了一個優雅的三方權衡,這是現有作品[13, 15-17]所不能提供的。
接下來,我們進一步提供重球法的背景,然后回顧重球領域的相關工作。在優化文獻中,重球法也被稱為多步驟或動量法。自其誕生以來[20],重球法已經在信號處理和機器學習中找到了應用(見,例如,[25]和其中的參考文獻)。然而,到目前為止,重球法在網絡研究中仍然基本上沒有被探索。據我們所知,重球法在網絡領域的唯一應用可以在[26]中找到,作者在那里開發了一個基于重球的互聯網擁堵控制方案。我們注意到,我們的工作與[26]在以下關鍵方面有所不同: 首先,我們提出的重球算法是一個動態方案,適用于隨機的無線信道,而[26]中提出的算法解決的是有線網絡的靜態擁塞控制速率優化問題。其次,[26]中的算法需要一些假設(參見[26, Sec. VII-C])來把問題變成無約束的表述,這樣經典的重球方法就可以被應用。然而,正如[26]中所指出的,這些假設限制了重球法的使用,使其只能用于具有某些路由結構的問題。相比之下,我們提出的方法可以處理所有的網絡約束,并適用于所有的效用優化問題。第三,我們在本文中推導出明確的效用-延遲-收斂權衡比例法,而[26]中沒有提供這樣的結果。
總的來說,我們的成果為跨層網絡控制和優化理論貢獻了一個令人興奮的新設計范式,該范式利用了動量/記憶信息。本報告的其余部分組織如下。第2節介紹了我們提出的重球算法和擬議算法的性能分析。第3節介紹了數值結果,第4節是本文的結論。
過去的研究表明,神經網絡在進行量子糾錯(QEC)解碼時,比算法解碼器更準確、更高效。由于量子計算機中的量子比特是不穩定的,在它們解體之前只能在幾毫秒內使用,為了在量子算法的時間預算內糾正數據量子比特的錯誤,有必要采用快速量子糾錯的方法。算法解碼器善于解決只有幾個數據量子比特的邏輯量子比特的錯誤,但在含有更多數據量子比特的系統中效率較低。有了神經網絡解碼器,實際的量子計算變得更加可實現,因為糾錯操作的計算速度比MWPM或部分查找表的實現方式快得多。這項研究旨在進一步推動神經網絡QEC解碼器的研究,通過使用高性能計算算法生成詳盡和隨機采樣的數據集,評估數據集生成方法對這些神經網絡與類似模型相比的有效性的影響。這項工作的結果表明,不同的數據集會影響各種性能指標,包括準確性、F1得分、接收者操作特征曲線下的面積和QEC周期。