本報告概述了我們在基于模型的自適應目標跟蹤以及識別來自電磁干擾(EMI)源的衛星欺騙和干擾攻擊方面所做的研究工作。我們假設可以利用不同電磁干擾源的射頻(RF)特征來識別和跟蹤主動和被動電磁干擾源。射頻信號被輸入一個基于模型的深度神經網絡(DNN),該網絡可對不同物體進行分類和跟蹤。
我們的初步結果表明,對于有源電磁干擾源,即使用不同調制方案發射射頻信號的源,使用 DNN 識別電磁干擾源射頻調制方案的準確性在很大程度上取決于射頻信號的質量,而射頻信號的質量又是信道的函數。特別是,如果信道是視距信道,且信噪比(SNR)較大,則調制類型的分類準確率很高(> 95%)。另一方面,如果信道參數未知和/或波動較大,信噪比較低,則分類準確率較低(< 60%)。調制類型識別的性能使我們得出結論,在現實世界中基于調制類型的目標跟蹤將非常困難。因此,這項研究的主要工作集中在使用有源雷達對無源信號源進行分類,并以人員計數系統為原型。
我們沒有使用模擬,而是在實驗室建立了一個小規模的測試環境來驗證假設。我們提出的人員計數系統使用多個發射天線,通過發送毫米波雷達啁啾掃描環境。物體反彈回來的信號由多個接收天線接收、處理并存儲到數字數據庫中。然后,我們對數字數據進行特征提取,并將特征輸入卷積神經網絡,以進行物體分類和跟蹤。在這些實驗中,我們將行走的人視為移動物體。我們的初步結果表明,在有限的環境中(如實驗室環境),卷積神經網絡可以利用射頻信號準確識別不同的物體(> 95%)。
圖 4. 從射頻信號中提取特征。特征/物體包含已識別物體的數量、其多普勒速度、其 x、y、z 位置和相對信噪比。
研究目的是利用相鄰視頻幀來提高卷積神經網絡(CNN)分類器對受壓目標的魯棒性。我們確定并下載了可適度改變縱向角度的目標視頻片段。軍用車輛目標類別的視頻片段以前曾用于通過遷移學習對預訓練的 CNN 進行微調。我們從這些視頻片段中獲得了幀序列,每幀中的目標都受到了不同的連貫應力。我們沒有依賴于單幀圖像的分類,而是使用了分類器類別概率上的不同運行平均值和運行乘積,以提高分類的魯棒性,使其能夠在目標與傳感器的縱向角度發生變化時,不受所施加應力的影響。結果表明,當我們對輸出類概率使用移動平均/乘積濾波器時,分類器的穩健性發生了適度變化。當對少量元素進行平均時,這種穩健性的提高最為明顯,而當我們應用的濾波器元素數量增加時,穩健性又恢復了穩定(穩健性提高)。
由于用于訓練卷積神經網絡(CNN)的圖像與 CNN 將嘗試分類的圖像存在差異,因此軍事系統中使用的人工智能分類器與商業行業中使用的人工智能分類器有些不同。這些差異可能是有意的,也可能是無意的,即使是訓練有素的分類器最終也會因為目標圖像無法識別而失效。
我們的目標是使這些 CNN 分類系統對目標應力具有更強的魯棒性,以擴大其在戰場環境中的應用,因為在戰場環境中,目標會被有意隱藏和改變,傳感器會被遮擋,敵對分子會有意干擾傳感器圖像。CNN 模型的分類效果和魯棒性已在很大程度上得到了優化,目前最先進的 CNN 正處于高原狀態。
CNN 分類器必須經過識別目標的訓練才能對目標進行分類。由于施加在目標上的應力可能多種多樣,要針對戰場上可能出現的各種類型和強度的目標應力訓練軍用 CNN 分類器既困難又不切實際;因此,必須找到其他方法來提高分類器對戰場應力的魯棒性。目前正在進行分類器融合和傳感器融合分類的研究。研究人員以前曾構建過 CNN 架構,利用視頻剪輯的時間方面來訓練 CNN,并直接從視頻中對物體進行分類,但大部分工作都花在了提高算法過程的效率上,在實施之后,研究人員發現,雖然從視頻中訓練 CNN 的效率提高了,但分類效果并沒有顯著改善。
在本報告中,我們使用多個傳感器圖像來擴大 CNN 分類器在分類目標高度緊張時的分類成功范圍。我們使用相鄰幀的傳感器視頻,并不是在每一幀中對目標進行分類,而是將分類器的分類概率加總平均,然后選擇概率最大的一類作為正確答案。我們相信,這將增加在壓力環境下成功分類的幾率。由于每個類別的分類概率從 0 到 1 不等,因此也可以使用移動積濾波器來提高分類的成功率。移動平均濾波器和移動乘積濾波器中的元素數量也可以改變,以檢測其最佳長度。
我們假設,隨著相鄰幀的使用,特別是當目標相對于傳感器的方位角逐漸變化時,目標上方的相對應力位置可能會發生變化,從而揭示出分類器用于正確分類目標的新特征。
這種想法與雷達信號疊加的做法類似,即把雷達回波疊加在一起,以增加目標的響應并減少系統噪聲。如果我們將其應用到相鄰視頻幀的分類中,如果我們在受壓環境下的目標分類中使用移動平均值和移動乘積,那么我們或許就能開發出更穩健的分類方法。
為了驗證這一假設,從網上下載了軍用陸地車輛的視頻剪輯。選擇的車輛視頻片段與之前開發的軍用車輛訓練數據庫相吻合,該數據庫用于在壓力環境下進行 CNN 分類分析。我們特別尋找了能以緩慢變化的視角顯示目標的視頻片段。利用預訓練 CNN 的遷移學習開發的六個類別如下:
本報告概述了在基于模型的自適應目標跟蹤以及識別來自電磁干擾(EMI)源的衛星欺騙和干擾攻擊方面所做的研究工作。我們假設可以利用不同電磁干擾源的射頻(RF)特征來識別和跟蹤主動和被動電磁干擾源。射頻信號被輸入一個基于模型的深度神經網絡(DNN),該網絡可對不同物體進行分類和跟蹤。
我們的初步結果表明,對于有源電磁干擾源,即使用不同調制方案發射射頻信號的源,使用 DNN 識別電磁干擾源射頻調制方案的準確性在很大程度上取決于射頻信號的質量,而射頻信號的質量又是信道的函數。特別是,如果信道是視距信道,且信噪比(SNR)較大,則調制類型的分類準確率很高(> 95%)。另一方面,如果信道參數未知和/或波動較大,信噪比較低,則分類準確率較低(< 60%)。調制類型識別的性能使我們得出結論,在現實世界中基于調制類型的目標跟蹤將非常困難。因此,這項研究的主要工作集中在使用有源雷達對無源信號源進行分類,并以人員計數系統為原型。
我們沒有使用模擬,而是在實驗室建立了一個小規模的測試環境來驗證假設。我們提出的人員計數系統使用多個發射天線,通過發送毫米波雷達啁啾掃描環境。物體反彈回來的信號由多個接收天線接收、處理并存儲到數字數據庫中。然后,我們對數字數據進行特征提取,并將特征輸入卷積神經網絡,以進行物體分類和跟蹤。在這些實驗中,我們將行走的人視為移動物體。我們的初步結果表明,在有限的環境中(如實驗室環境),卷積神經網絡可以利用射頻信號準確識別不同的目標(> 95%)。
許多科學和工程學科都對目標識別和跟蹤進行了深入研究[1][2][3][4][5]。從用于早期探測和跟蹤飛行中導彈的全球定位系統(GPS)[6][7][8] 到自動駕駛汽車[9],它們都是許多技術的基礎組件。此外,未來的無線通信系統使用大規模多輸入多輸出(MIMO)波束成形[10]和自由空間光學(FSO)通信技術[11][12][13],使發送方能夠通過將射頻光束或激光束直接聚焦到接收方來傳輸數據。這些聚焦傳輸提高了信噪比(SNR),降低了所需的發射功率以及多用戶干擾。然而,聚焦傳輸在很大程度上依賴于準確跟蹤和識別接收器位置的能力。
傳統的物體跟蹤和識別技術都是基于模型的,這是因為其數學上的優雅和高效,也許更重要的原因是缺乏訓練數據。基于模型的方法通過數學模型將有關問題的先驗知識納入其中,這些先驗知識或基于物理定律,或基于成熟的直覺,以捕捉物體的動態和屬性,從而實現精確的跟蹤和分類。因此,基于模型的方法在許多只需幾個參數就能精確建模的環境中非常有效。卡爾曼濾波器就是基于模型方法的一個典范 [14][15][16]。卡爾曼濾波器在許多應用中都取得了成功,特別是在跟蹤受噪聲觀測影響的目標時。卡爾曼濾波器在跟蹤中取得成功的關鍵在于將目標動態(如速度、加速度等)的精確數學模型與這些值的經驗實時噪聲測量相結合。卡爾曼濾波器根據增量測量/觀測數據和假定的數學模型動態,通過一組更新參數值的遞推方程,高效(快速)地估計模型參數。
用于跟蹤的卡爾曼濾波器的一個主要缺點是,其性能在很大程度上取決于基于一些合理假設(如物理定律或經驗)的所謂精確數學模型。然而,如果數學模型不夠豐富,無法捕捉所考慮環境的所有微小細節,那么卡爾曼濾波器的最佳性能就會受到所考慮的數學模型系列的限制。
為此,本研究調查了用于識別和跟蹤物體的深度神經網絡(DNN)。DNN 是一類基于人工神經網絡(ANN)的機器學習方法,在現實世界的許多應用場景中都表現出色。DNN 架構允許模型從大型數據庫中學習難以用數學建模的復雜動態和特征。
本節將介紹兩項不同的工作。第一項工作是使用不同類型的卷積神經網絡 (CNN) 檢測 EMI 源的射頻調制類型。這項研究完全在 Matlab 仿真環境中完成。第二項研究是利用有源雷達系統的射頻信號作為 3-D CNN 的輸入,檢測房間內的人數并跟蹤他們。這類系統通常被稱為人員計數系統 [17][18][19]。與第一個系統不同的是,所有射頻信號都不是模擬的。相反,它們是使用基于 MIMO 的毫米波雷達系統實時收集的。接下來,我們對原始數據進行特征提取,并將特征輸入三維卷積神經網絡以檢測人數。
作者正在研究分布式雷達在穿墻感應中的應用。這項技術的預期操作場景是在建筑物外的(安全)遠程距離內探測和識別建筑物內的人員和武器裝備。本研究使用的雷達結構和信號處理算法類似于美國陸軍作戰能力發展司令部(DEVCOM)陸軍研究實驗室(ARL)實施的埋藏和隱蔽表面目標探測的設計;目前的雷達發射和接收頻率更高。
在這項研究中,實驗是在ARL的阿德爾菲實驗中心(ALC)507號樓("沙盒 "區域)進行的,使用的是室內低金屬兩層夾板結構。用來測試分布式雷達的受控環境與用來測試ARL針對電子目標的諧波雷達的低金屬環境相同。
圖1 步進頻率雷達收發器:(a)賽靈思的RFSoC與Alion/HII的雷達固件,以及(b)定制的發射器/接收器(Tx/Rx)濾波器和放大器PCB,由28VDC供電
本研究中收集的數據表明,在低矮的金屬建筑中,相互成直角的天線對能夠探測到多個移動目標,而這些目標從建筑外是看不到的。隨時間變化的距離圖顯示了目標所遵循的路徑;在一個頻道中跟蹤的目標路徑的模糊性可以通過在另一個頻道中跟蹤同一目標來緩解。仍需努力將同時收集的數據的IQ振幅一致地結合起來,以解決多個目標。一個目標是在二維(下行和上行)圖像上繪制目標位置,也許是以視頻動畫的形式疊加在場景的俯視圖上(即被成像的建筑物的典型平面圖)。在對移動目標進行成像時,發射器和接收器天線的雙穩態配對是否具有優勢(與標準的單穩態發射器天線配對相比)還有待確定。
該研究項目解決了下一代自主蜂群網絡系統的分布式控制和優化的挑戰,其中快速變化和超動態的網絡狀態(如網絡拓撲結構、頻譜和信道狀態信息、數據緩沖區排隊狀態等)需要分布式優化算法的快速收斂和低延時。最近基于PI對網絡控制和優化的研究,利用二階信息(SOI),在這個研究計劃中,我們提出了一系列新的分布式算法技術,與傳統方法相比,在收斂速度和排隊延遲方面都有數量級的改進,同時達到了同樣的可證明的網絡效用優化。
具體來說,我們在這個項目中的研究任務集中在基于動量(Heavy-ball)的聯合擁堵控制和多路徑路由(部分SOI)的EMANE仿真實現上。我們提出的研究計劃采取了一種綜合的、整體的方法,從數學建模、優化理論、控制理論、排隊理論和隨機分析等領域吸取技術。擬議的研究不僅將推進我們在下一代復雜網絡的算法設計方面的知識,而且還將通過探索基于SOI的網絡控制和優化的新領域來滿足一般網絡研究界的關鍵需求。
所提出的方法將影響廣泛的應用,如機載網絡和無人機系統的圖像/視頻,特別是在控制和優化行動不能承受大的延遲和緩慢收斂的系統。將尋求與AFRL進行實質性的合作,以促進這一研究工作的潛在過渡途徑。
圖1:在高度動態的無線網絡下,無人機系統通信有嚴格的延遲要求。
隨著部署在戰場上的通信網絡的激增以及它們所產生的大量移動數據,今天的無線網絡技術正被拉伸到極限。不僅戰術信息的爆炸性增長要求不斷增加網絡容量,大規模無線網絡的復雜協調也在實時控制和優化中引入了嚴格的延遲和收斂速度要求。為了設計高效的優化算法來應對新興的戰術無線網絡,一個關鍵的方面是有效地處理擁塞控制和鏈路調度之間的交叉互動,包括在協議棧層內和跨協議棧。因此,近年來出現了對戰術無線網絡的低延遲和快速轉換的聯合擁堵控制和調度算法的迫切需求。此外,聯合擁塞控制和路由優化不僅是信息網絡設計的要求,也是許多復雜網絡運行的核心問題,如智能電網需求響應[1-3]、供應鏈管理[4-7]、交通網絡流量控制[8, 9],僅舉幾例。
一個動機示例: 為了說明快速收斂、低延遲和分布式設計的重要性,我們在此以無人機系統網絡為例。控制和優化無人機系統網絡的一大挑戰來自于快速變化和高度動態的網絡狀態(如網絡拓撲結構、頻譜/信道狀態、數據緩沖區排隊狀態等),這使得傳統的擁堵控制、路由和頻譜訪問技術變得無效(見圖1的說明性例子)。這種高度動態的性質需要網絡控制和優化算法的快速收斂。否則,在完成緩慢的收斂過程后,網絡拓撲結構、頻譜/信道狀態信息和排隊狀態很可能被大大改變,使所有的計算結果和控制行動變得過時和無用。
使網絡控制問題更加嚴重的是,控制行動與需要實時傳輸大量數據的時間密切相關(例如,無人機系統圖像或視頻監控等)。因此,當數據到達量激增時,需要低延遲的網絡控制算法來避免過度延遲和大量的丟包(由于超時事件)。否則,可能會發生突然的大規模網絡中斷,這不僅會導致大范圍的不便,而且會導致毀滅性的戰斗失敗甚至是生命損失。此外,機載網絡的地理規模大,網絡子系統之間物理層技術的異質性,以及快速響應時間的要求,意味著控制和優化算法既不能集中,也不能有高的復雜性。這就要求開發出完全分布式的算法,以規避單點故障問題,簡單易行,又能達到可證明的優化性能。
由于移動數據需求的快速增長,近年來出現了大量關于資源分配的工作,旨在使無線網絡中的網絡效用最大化(例如,見[10-13],和[14]的調查)。這導致了一個優雅的數學分解框架,"松散耦合 "的擁堵控制、調度和路由算法自然而然地出現。這些算法不需要關于到達或信道狀態的統計知識。相反,它們只依賴隊列長度和信道狀態信息來做出控制決策。這些算法也與非線性優化理論中的拉格朗日對偶分解框架和子梯度方法有內在聯系[10, 11],其中(按比例)隊列長度可以被解釋為拉格朗日對偶變量,隊列長度更新起到子梯度方向的作用。
盡管這些基于隊列長度的算法(QLA)具有吸引人的特點,但它們受到了幾個關鍵的限制。首先,在現有的QLA框架中,已經證明了效用優化差距O(1/K)可以通過排隊延遲的O(K)懲罰來實現,其中K>0是一個系統參數。因此,一個小的效用優化差距需要一個大的K,并導致大的排隊延遲。為了解決這一局限性,近年來有大量的工作(如[13,15-17]等)集中在減少這些方案的排隊延遲上(后面對相關工作有更深入的討論)。同時,在現有的QLA框架中,基于隊列長度的權重調整忽略了目標函數輪廓的曲率,并且在每次迭代中使用小的步長[10-13],這導致收斂速度不理想。為了解決這個問題,最近提出了一些二階擁塞控制和路由/調度算法來提高收斂速度(見,例如,[18,19])。然而,由于其復雜的算法結構,這些二階方法需要更大的信息交換開銷,并且不能隨著網絡規模的擴大而很好地擴展。現有方法的這些限制促使我們在這個項目中追求一種新的重球設計。
更具體地說,在這個項目中,我們開發了一個基于重球的權重調整方案,在不影響網絡效用性能和不增加任何計算復雜性的情況下,大幅減少隊列長度,提高收斂速度。我們的方法是基于將隊列長度與權重分離的巧妙想法,然后使用一個權重更新方案,該方案只利用前一個時隙的權重變化的一個更多的記憶槽。令人驚訝的是,我們表明這個簡單的方案提供了兩個控制自由度,使我們能夠實現效用優化、低延遲以及快速收斂。
從歷史上看,重球法是由Polyak在20世紀60年代首次提出的[20],用于解決無約束的凸優化問題,其最初的目標是加速梯度下降法的收斂。重球法的基本思想是,不是只使用當前迭代的(子)梯度信息和完全不記憶過去迭代的軌跡,而是使用當前梯度(類似于 "勢")和上一步的更新方向(類似于 "動量")的線性組合來計算搜索方向。該方法是由物理學中描述重體在勢場中運動的二階常微分方程(ODE)激發的,并可被視為該方程的離散版本,因此被稱為 "重球(HeavyBall)"。在[21]中已經表明,通過適當地權衡當前的 "勢 "和 "動量",該算法對目標輪廓不敏感,這導致了更快的收斂。事實上,收斂加速的優勢是我們在無線網絡跨層優化中采用重球方法的第一個基本理由。但令人驚訝的是,我們隨后的研究表明,采用重球思想的好處遠遠超出了收斂加速的范圍。
然而,我們注意到,由于一些技術上的挑戰,為無線網絡中的效用最大化問題開發一個基于重球的解決方案并不簡單。首先,由于重球法最初是為無約束的靜態優化問題設計的,目前還不清楚如何為無線網絡效用最大化修改重球法,因為無線網絡是一個有約束的隨機優化問題,問題結構要復雜得多。其次,與QLA設計中隊列長度和拉格朗日對偶變量之間的明顯聯系不同,重球法與可觀測的網絡狀態信息(如隊列長度、信道狀態等)之間的關系是未知的。因此,在重球法下,延遲和網絡效用之間的權衡仍然是一個開放的問題。第三,由于包含了過去的迭代值,重球方法的算法結構與QLA方法不同。因此,QLA中用于建立吞吐量-優化和效用-延遲權衡的傳統技術并不適用。因此,在重球方法的性能分析中需要新的分析技術。
本項目的主要貢獻是,我們首次開發了一個基于重球的無線網絡效用優化框架,克服了上述的技術挑戰。我們建立了一系列關于大幅減少延遲和快速收斂的新分析結果,同時保留了效用優化的特點。本文的主要結果和技術貢獻如下:
在重球思想的啟發下,我們提出了一個新的權重調整方案,用于無線網絡中的聯合擁塞控制和路由/調度。我們的工作不僅提供了重球算法和可觀察的網絡狀態信息(隊列長度和信道狀態)之間的協同作用,允許在實踐中簡單實現,它還擴展和概括了經典的重球方法,從無約束的靜態優化到約束的隨機網絡效用優化范式,從而推進了數學優化理論中重球方法的先進性。
在我們的基于重球的聯合擁堵控制和調度方案下,有一個β參數化的動量(β∈[0,1]是一個系統參數,通常選擇接近1),我們表明,延遲是(1-β)-QLA方法的小數部分。更具體地說,我們的理論分析表明,可以用O((1-β)K)+O((1+β)√K)的排隊延遲成本實現效用最優差距O(1/K),其中參數K與重球法的步長成反比。此外,在β被選為β=1-O(1/ √ K)的K的漸進制度中,我們的重球算法實現了[O(1/K), O( √ K)]效用-延遲權衡,這明顯優于眾所周知的QLA方法的[O(1/K), O(K)]權衡。
鑒于參數K和β,我們表明我們基于重球的算法的收斂時間擴展為O[log(√ K) (- log-1 (1 + β - √ β))]。結合前面的結果,我們提出的重球算法提供了一個重要而優雅的三方權衡關系,由K和β中的兩個控制旋鈕控制。最值得注意的是,通過權衡收斂速度,同時實現效用最優和低延遲。我們注意到,這種重要的三向權衡關系迄今在文獻中尚未被發現。
除了理論結果,本項目的一個重點是開發高保真的基于EMANE的模擬,以測試和驗證我們上述的理論結果和見解。在這個項目中,我們已經成功地開發了一個基于Shim層的EMANE跨層仿真平臺來測試我們的HeavyBall算法。我們基于EMANE的仿真結果表明,所有的理論預測在高保真仿真中是可以觀察到的。此外,值得一提的是,我們的基于EMANE的跨層仿真平臺具有很強的通用性,對于AFRL所重視的其他基于EMANE的無線網絡跨層仿真來說,可以具有獨立的利益。
在本節中,我們首先回顧了與本文密切相關的QLA文獻的最新進展。如前所述,在減少QLA方法的延遲方面已經有了很大的努力。例如,在[13]中,采用了類似于[22-24]中的虛擬隊列技術,其中虛擬隊列長度根據服務速率演變,是實際服務速率的一小部分。在[16]中,提出了一種用占位者比特代替真實數據的虛擬積壓機制。研究表明,通過接受一些非零的丟包概率,這種方法實現了[O(1/K), O(log2 (K))]效用-延遲權衡。在[15]中還提出了一個指數Lyapunov虛擬積壓方法與基于閾值的丟包方案相結合,以實現O(log(K))的延遲。雖然具有對數型的時延擴展,但[15,16]的一個主要限制是,[16]中選擇占位器比特的大小和[15]中的閾值都需要非因果的全局到達和信道統計(參見[15,公式(17)],[16,公式(45)]),這通常是不可能實現的。另外,如果參數設置不當,這些方案可能會導致不可忽略的丟包概率。為了解決這個問題,在[17]中提出了一個每迭代學習,以在線方式學習最佳的占位比特大小。然而,每迭代學習組件大大增加了算法的復雜性。在某種意義上,所有這些減少延遲的方案都可以被看作是為了減少延遲而犧牲了一些吞吐量的優化(體現在降低服務速率或丟包)。相比之下,在不犧牲任何吞吐量優化和不需要任何非因果統計知識的情況下,我們的重球方案通過設置β=1-O( 1/√ K),實現了[O(1/K), O( √ K)]效用-延遲折衷。此外,我們的重球算法實現了一個優雅的三方權衡,這是現有作品[13, 15-17]所不能提供的。
接下來,我們進一步提供重球法的背景,然后回顧重球領域的相關工作。在優化文獻中,重球法也被稱為多步驟或動量法。自其誕生以來[20],重球法已經在信號處理和機器學習中找到了應用(見,例如,[25]和其中的參考文獻)。然而,到目前為止,重球法在網絡研究中仍然基本上沒有被探索。據我們所知,重球法在網絡領域的唯一應用可以在[26]中找到,作者在那里開發了一個基于重球的互聯網擁堵控制方案。我們注意到,我們的工作與[26]在以下關鍵方面有所不同: 首先,我們提出的重球算法是一個動態方案,適用于隨機的無線信道,而[26]中提出的算法解決的是有線網絡的靜態擁塞控制速率優化問題。其次,[26]中的算法需要一些假設(參見[26, Sec. VII-C])來把問題變成無約束的表述,這樣經典的重球方法就可以被應用。然而,正如[26]中所指出的,這些假設限制了重球法的使用,使其只能用于具有某些路由結構的問題。相比之下,我們提出的方法可以處理所有的網絡約束,并適用于所有的效用優化問題。第三,我們在本文中推導出明確的效用-延遲-收斂權衡比例法,而[26]中沒有提供這樣的結果。
總的來說,我們的成果為跨層網絡控制和優化理論貢獻了一個令人興奮的新設計范式,該范式利用了動量/記憶信息。本報告的其余部分組織如下。第2節介紹了我們提出的重球算法和擬議算法的性能分析。第3節介紹了數值結果,第4節是本文的結論。
本報告記錄了通過利用深度學習(DL)和模糊邏輯在空間和光譜領域之間整合信息,來加強多模態傳感器融合的研究成果。總的來說,這種方法通過融合不同的傳感器數據豐富了信息獲取,這對情報收集、數據傳輸和遙感信息的可視化產生了積極的影響。總體方法是利用最先進的數據融合數據集,為并發的多模態傳感器數據實施DL架構,然后通過整合模糊邏輯和模糊聚合來擴展這些DL能力,以擴大可攝入信息的范圍。這項研究取得的幾項進展包括:
出版物[1, 2, 3, 4, 5]進一步詳細介紹了取得的進展。
本報告總結了迄今為止在路線偵察領域的本體開發的進展,重點是空間抽象。我們的重點是一個簡單的機器人,一個能夠感知并在其環境中導航的自主系統。該機器人的任務是路線偵察:通過觀察和推理,獲得有關條件、障礙物、關鍵地形特征和指定路線上的敵人的必要信息。路線偵察通常是由一個排的騎兵和非騎兵進行的。這項研究探討了機器人執行部分或全部必要任務的合理性,包括與指揮官進行溝通。
這是一項具有挑戰性的對抗性任務,即地形穿越加上信息收集和解釋。偵察的解釋方面需要考慮語義學--確定相關的信息和確定它如何相關(即有意義)。語義信息在本質上是定性的:例如,危險是一個定性的概念。為了將危險與某些特定的區域聯系起來,我們需要一種方法來指代該區域。這意味著至少能夠給空間的某些部分附上定性的標簽。
Kuipers在他的空間語義層次的早期工作中指出了空間的定性表示對機器人探索的重要性。例如,層次結構的拓撲層次包含了 "地方、路徑和區域的本體",歸納產生了對較低層次的因果模式的解釋。
最近,Izmirlioglu和Erdem為定性空間概念在機器人技術中的應用提供了以下理由:
對于負責路線偵察的無人地面車輛(UGV)來說,其架構中的不同模塊將消費和產生語義信息:負責語義感知和目標識別、計劃和執行、自然語言對話等的模塊,加上主要負責維護信息的語義世界模型。例如,在美國陸軍作戰能力發展司令部陸軍研究實驗室的自主架構中,語義/符號世界模型被用來 "實現符號目標(例如,去接近一個特定的物體)",*其中接近是一個語義概念。
一個關鍵問題是如何在世界模型和其他模塊之間分配維護和處理不同類型語義信息的責任。從語義世界模型的角度來看,這取決于有多少符號推理是合適的。例如,假設要接近的物體位于一個給定區域的某個位置,而不是靠近該區域的外部邊界。一旦機器人靠近物體,就可以推斷出機器人在物體的位置附近,而且也在同一區域內。如果有公制信息,就可以用幾何例程得出這個結論。在沒有公制信息的情況下,是否會出現在純粹的定性空間中推斷有用的情況?
本報告不涉及這個問題。我們的目標是確定什么應該被代表,而把如何代表和在哪里代表留給未來的工作。
以下片段取自FM7-92中對路線偵察的描述。空間表達是彩色的,周圍有一些文字作為背景。
路線偵察的結果是一份報告,以圖表的形式,并附有文字說明。FM7-92給出了一個例子,我們可以從中提取一些更必要的概念:
讓我們把這段關于路線偵察的描述中提到的概念建立一個綜合清單,重點放在空間概念上,并盡可能地保留軍事術語:
1)必須指定環境中的位置、路線、區域和感興趣的物體。稱這些為 "實體"。
2)這些實體之間的空間關系是相關的(例如,一個地點在另一個地點的北邊)。值得注意的是,不同類型的實體之間的關系是被指定的。
a. 物體(例如,障礙物)在位置或區域。
b. 一些地點在空間上與路線有關(例如,沿著路線,毗鄰,或靠近道路)。
c. 地點可能代表更大的區域(例如,雷區的位置)。
d. 道路和小徑可以與路線相關:它們可能相交、重疊(部分疊加),或平行運行。
a. 一些地點相對于其他地點或區域有方向性的定位(例如,一個防御性的位置)。
b. 有些區域是由其與另一個區域或地點的關系來定義的,這可能不是一種局部的關系(例如,觀察和火力場是由一個潛在的遠程位置來定義的,該位置有一條通往路線上的一個區域的線路)。
4)路線可能被障礙物阻擋,障礙物可能是明確的物體或更大的區域(例如,一個障礙物與一個雷區)。
6)有時,描述物理基礎設施(如道路、橋梁)及其屬性是很重要的。
路線偵查收集和解釋不同種類和不同來源的信息:
背景知識。這包括關于環境特征的類型和預期成為任務一部分的物體的信息,包括道路、障礙物、溝壑、橋梁等等。
任務規范。確定偵查的區域和路線,以及當時可獲得的任何信息。
環境。通過空間分析(包括幾何學、拓撲學等)、感知、地圖衛星數據的離線圖像處理和其他類型的分析,確定環境的相關特征。
任務執行期間的通信。我們假設指揮官或人類操作員在偵察過程中可以向UGV提出詢問或命令,提供新信息或集中注意力。
如前所述,一份報告。
原則上,所有這些信息都以某種抽象的形式組合在一個語義世界模型中。我們把環境的物理屬性和特征稱為 "實體"。把我們用來表示這些實體和它們之間關系的抽象概念稱為 "概念"。
不同類型的實體的概念。層次結構在語義表征中很常見,用來捕捉關于世界上遇到的實體類型的一般知識。一個類型就是一個概念,類型被組織在一個層次中:MRZR是一種輕型的、戰術性的、全地形的車輛,它是一種輪式地面車輛,它是一種地面車輛的類型,等等。屬性和關系可以與一個給定的概念相關聯,而下級概念則繼承這些屬性。在路線偵察中,如果有信息說某一地區有一條道路,但沒有更多的細節,仍然可以從道路的概念中推斷出它的預期屬性:它比它的寬度長得多;它在人們感興趣的地點之間通向;在其他條件相同的情況下,它可能比周圍的地形行駛得快。從實用的角度來看,這意味著如果有可能將某物歸類為一個已知的概念,那么語義世界模型就不需要記錄關于該物的每一條相關信息。
用于實體的目的和用途的概念。一個代表道路典型用途的概念可以進一步區分其長度和寬度的語義,這反過來又導致了跨越和沿途、穿越和跟隨等概念之間的區別。這將使UGV能夠以不同的方式對待 "偵察道路對面的區域 "和 "偵察前方的道路 "的命令。前方的道路也是一個語義概念:它取決于對過去去過的地方的了解。
代表部分信息的概念。有時可能會有定性的信息。想象一下,任務規范的一部分是關于雷區在計劃路線上存在的信息,但不知道具體位置,或者知道雷區的位置,但不知道其范圍。這種無知可以很容易地在代表實體的概念中得到體現。
新概念適用于新環境。另一個交流的例子可能是信息性的。想象一下,當一輛UGV穿越一條東西走向的道路時,它與遠程指揮官進行交流,指揮官問道:"道路北側是什么?"* 需要識別的物體可能不在道路和地形的邊界上(與 "建筑物的一側 "形成對比),而是在以道路邊緣為界的某個感興趣的區域內,距離UGV的位置向北不遠,向東和向西也有一些距離。這個區域可能沒有事先作為一個概念被劃定;相反,它是在當前的背景下構建或推斷出來的。這是一個有趣的例子,一個概念不是從公制數據中抽象出來的,而是被強加在公制數據上的。
背景中的概念的適應和組合。想象一下,對一張地圖的分析產生了對代表區域、道路等等的概念的分解。這些概念可能直接適用于某些目的。例如,與道路相聯系的概念在推理兩點之間的導航時是有用的。然而,在其他情況下,這些概念可能需要調整或與其他概念相結合。例如,如果一條道路被指定為 "危險區域",那么這個區域的概念可能會超出道路的邊界,延伸到周圍的地形。
本論文探討了區塊鏈與互聯網協議第六版(IPv6)數據包信息的使用,以支持與無人駕駛飛行器(UAVs)智能蜂群的安全、高性能和可擴展的通信。在這篇論文中,我們研究了三種情況下的加密數據包的交換,即點對點、點對多和多對點。我們模擬了每個場景下的蜂群行為,并在模擬運行中改變了蜂群中無人機的數量。基于仿真的結果顯示,對于點對點場景和多對多場景,即使在多對多場景中,交互節點的數量增加,延遲也沒有明顯增加。相反,在點對多的情況下,延遲會增加。需要進行更多的研究來評估本論文中提出的區塊鏈-IPv6方法的安全性和可擴展性。
圖. 使用區塊鏈技術的無人機群智能中的塊生成概念
越來越多的無人機被用于軍事目的,再加上自動化方面的進步,如為無人駕駛飛行器(UAV)配備不同程度的自主權和群集智能,使得這些飛行器成為敵對勢力的誘人目標。為了獲得競爭優勢,對手將試圖找到無人機的飛行控制器、接收器或發射器的可利用的物理和網絡漏洞,然后應用動能、網絡或某種動能和網絡攻擊機制的組合來操縱無人機的行為,例如使無人機墜毀或泄露敏感數據。
攻擊軍用無人機的一個途徑是操縱無人機使用的通信機制,無論是無人機與無人機之間的通信還是無人機與人類操作員之間的通信。例如,對手可以修改或阻止無人機群之間的數據交換,以降低無人機群的行動效率。重要的是,為軍事單位提供的無人機已經過動能和網絡脆弱性評估,與這些脆弱性相關的風險在無人機的操作使用之前就已經得到緩解,并且在無人機的使用壽命內對無人機系統進行修改時,也要進行風險評估和緩解。
安全風險管理也要在一個框架中進行規范,美國國家標準與技術研究所(NIST)就是這樣做的,它發布了一個風險管理框架。多種技術可用于實施降低安全風險的措施。例如,Vikas Hassija和Vinay Chamola[1]斷言。"當務之急是保持無人機和其他用戶之間交易的安全性、成本效益和隱私保護。區塊鏈技術是一個非常有前途的解決方案,可用于部署實時無人機應用"。
科學技術的創新和進步之間存在著一種共生關系。諸如自動駕駛汽車、自主無人駕駛飛行器(UAV)和智能家用電器等能力,一度被認為是科幻小說的范疇,或者在技術上太難實現,現在已經很普遍了。
無人機的概念最早出現在1783年,當時約瑟夫-米歇爾和他的伙伴雅克-艾蒂安-蒙戈爾費埃公開展示了一種當時可以說是無人機或無人駕駛飛機的交通工具[2],其形式是1849年在法國一個叫安諾奈的地方的熱氣球,在那次戰爭中,由奧地利中尉弗朗茨-馮-烏沙提斯創造的氣球炸彈被用來攻擊威尼斯市。雖然這次攻擊只造成了輕微的損失,但它可以被稱為成功,因為兩天后威尼斯就投降了[3]。尼古拉斯-特斯拉在1898年獲得了遙控(RC)的專利,大約20年后,一家名為拉斯頓-普羅克特空中目標的公司在特斯拉之前獲得專利的遙控技術基礎上發明了第一架無翼飛機[4]。
從那時起,無人機技術和它的應用已經穩步增長。它們已被用于科學研究,如收集有關火山活動的數據,在這些地方使用駕駛飛機會太危險或太昂貴。在20世紀90年代,亞伯拉罕-卡雷姆推出了 "捕食者",這是一種配備了攝像頭和其他傳感器的無人機,用于監視。國防界為 "捕食者 "配備了武器裝備,包括導彈[5]。掠奪者本身已被用于一些沖突,如在阿富汗、巴基斯坦、波斯尼亞、前南斯拉夫、伊拉克、也門、利比亞、敘利亞和索馬里的沖突[6]。在2022年,它們也被烏克蘭和俄羅斯武裝部隊廣泛用于戰斗。
無人機技術的一個重大進步是應用了蜂群智能,一群無人機模仿大量同質動物的智能行為,如蟻群、鳥群和蜜蜂群。蜂群通過蜂群成員之間的協調表現出集體行為。蜂群的行為可以被編碼為算法,而這些算法又可以通過軟件實現,在計算機上執行,比如無人機中使用的嵌入式計算機[7]。蜂群行為甚至被用來進行基于無人機的燈光表演,例如在2020年東京奧運會的開幕式上。
在蜂群中,蜂后是控制器,同樣地,在蜂群智能無人機中,系統中有一個控制中心,典型的控制器名為地面控制站(GCS)。無人機的工作方式很直接,這涉及到無人機和GCS之間的數據交換,然后GCS可以連接到衛星,或者衛星可以直接連接到無人機,一切都在實時發生。圖1說明了無人機和其基礎設施的一種通信方式。至少,通信需要是低延遲和安全的[8]。
有兩種技術可以在GCS和無人機之間進行通信。第一種技術是基于蜂群基礎設施的GCS,第二種是飛行Ad-Hoc網絡(FANET)。基于蜂群基礎設施的GCS本身有一個GCS,用于集中式通信。所有的無人機群都將與GCS進行通信,以便群組能夠運作。然而,這種技術的一個缺點是,它依賴于GCS的可用性和正確運作。如果GCS受到干擾,整個無人機群也會受到干擾。相比之下,FANET使用一個發射器向某個無人機發送命令,然后該無人機將這些命令轉發給第二個無人機。然后這些命令將以串行或并發的方式分發給其他無人機。所有的無人機將進行通信,并擁有發射器給出的命令列表,這樣,如果這個發射器發生故障,所有的無人機仍然可以執行命令,因為每個無人機都有一個有效的命令列表。最后,通過使用這種FANET技術,每個無人機將具有冗余性,而不完全依賴通信基礎設施。然而,這種技術也有缺點。例如,一個入侵者或一個未知的無人機可以進入并破壞無人機群。再比如,無人機群的授權成員無法檢測到,所以入侵者(即未經授權的參與者)的無人機,從而可以獲得將由授權無人機執行的命令列表[9]。
為了克服入侵者無人機的問題,也許可以應用區塊鏈來防止未經授權的無人機使用無人機群命令來獲取列表。區塊鏈本身已被廣泛用于金融領域,目的是在每筆交易的驗證過程中消除第三方。
在區塊鏈中,當數據被分發時,將很難被黑客攻擊并獲得完整的數據,因為它是由一個使用加密手段的網絡驗證的。每個區塊由前一個區塊的哈希值,驗證哈希值的隨機數,或稱nonce,以及時間戳組成。完整性的保證是由區塊鏈為第一個區塊的形成提供的,這個區塊是由一個經過驗證的交易形成的結果,稱為創世區塊。由于哈希值是不可預測的或唯一的,欺詐或復制行為將被發現。每個經過驗證的區塊都有其哈希值,對該區塊的任何改變都會對其他區塊產生影響。如果所有或大多數節點給予許可或同意,該區塊就會被添加到鏈上,因為共識機制安排交易的有效性在某個區塊的有效性。
區塊鏈上的這種共識機制可以通過三種方式進行,那就是工作證明、股權證明和投票,實用拜占庭容錯。在加密貨幣的世界里,工作證明被用于采礦。它的工作原理是在每個節點上進行數學方程的計算,然后每個首先完成計算的節點將有權將最新的區塊輸入區塊鏈。使用權益證明,只有合法的節點可以進行計算以達成共識。另一方面,實用拜占庭容錯是基于投票的,要求至少有三分之一的授權節點是拜占庭的。
認證過程是通過生成具有偽隨機函數的一次性密碼(OTP)來進行的。無人機在區塊鏈中注冊,每架無人機根據存儲在區塊鏈節點中的關系,確定它能夠認證的最近的無人機。認證請求從無人機發送至相關的無人機,后者在區塊鏈中觀察并檢查該無人機是否有關系,并能對其進行認證。這個方案能夠挫敗外部惡意無人機的攻擊或第三方攻擊,即使對手知道第一個令牌。
在本論文中,我們研究了使用IPv6(互聯網協議版本6)在無人機之間進行通信的方式。與IPv4(互聯網協議版本4)相比,IPv6有很多優點,即速度更快,更有效,因為它的路由表比IPv4少,所以路由過程將更有組織和有效,而且更安全,因為它配備了交換數據的加密功能。帶寬更有效,因為IPv6支持組播。配置更容易,因為它自動運行。總的來說,IPv6更適合無人機等移動設備,因為不需要通過網絡地址表(NAT),因此延遲低。IPv6將使用區塊鏈與權益證明共識相結合。
與加密貨幣一樣,區塊鏈上的每個節點都必須進行支付。在這項研究中,支付被替換成OTP。每個節點產生相同或同步的OTP。區塊鏈和OTP在這里的使用是為了檢測未經授權的無人機,并防止他們讀取或更新無人機群使用的命令列表。此外,我們探索了區塊鏈、智能合約共識(SCC)和分布式賬本技術在蜂群通信方面的能力。此外,還根據提出的無人機群智能通信架構的概念進行了模擬。
本論文的范圍僅限于探索區塊鏈技術和OTP的聯合使用,這兩種技術在IPv6數據包中都有填充。
在進行了模擬物理無人機在點對點、點對多、多對點場景下的運行,并使用1-10000次迭代或交易的實驗后,得到了各場景的延遲比較結果。從這些結果可以得出結論,對于點對點方案和多對多方案,即使在多對多方案中,交互節點的數量增加,延遲也沒有顯著增加。而在點對多的情況下,一個節點以廣播信息的形式同時向幾個節點進行交易,這導致了延遲的增加。第四章和第五章解釋了仿真結果和這些結論的總結。此外,第五章還討論了與本論文中的事項有關的未來工作的可能性和建議。
第二章介紹了無人機群智能通信區塊鏈功能的背景,并利用它作為無人機群智能的通信手段。它還對IPv6結構格式進行了概述。第三章討論了基于IPv6區塊鏈的通信數據傳輸的分析。具體而言,分析了IPv6區塊鏈數據包的場景、保密性、完整性和可用性。第四章闡述了IPv6區塊鏈在無人機蜂群智能中實現的可能性和挑戰的研究成果。第五章提供了結論和對未來研究的建議。
網絡物理系統(CPS)由相互作用的計算和物理組件組成。該項目旨在開發創新的驗證技術以保證網絡物理系統的安全行為。混合系統[5]是一個富有表現力的數學模型,有助于描述涉及連續和離散狀態及其演變的復雜動態過程,這使得它們特別適合于為CPS建模。在這個項目中,我們專注于開發混合系統可達性分析的新技術,即自動探索給定動態系統的狀態空間并計算系統軌跡的包絡,給定其不確定參數的邊界的技術。為了減輕系統的復雜性,我們的目標是發展組合方法,即把系統分析分解為各部分的分析方法。考慮到這一總體目標,我們在這個項目中的活動可以大致分為以下幾個研究方向:
以線性微分方程為特征的系統的可達性方法。雖然現代線性代數軟件包對數萬維的矩陣是有效的,但基于集合的圖像計算卻僅限于幾百維。在[9]中,我們提出了分解到達集的計算,使集的操作在低維度上進行,而像指數化這樣的矩陣操作則在全維度上進行。我們的方法適用于密集型和離散型的設置。對于一組標準的基準,它顯示出與各自的最先進的工具相比,速度提高了兩個數量級,而在精度上只有少量的損失。對于密集時間的情況,我們展示了一個超過10,000個變量的實驗,大約比以前的方法高兩個數量級。這些算法為JuliaReach[10]奠定了基礎,JuliaReach是一個用于基于集合的動態系統可達性分析的工具箱。JuliaReach由兩個主要包組成。Reachability,包含連續和混合系統的可達性算法的實現,以及LazySets,一個獨立的庫,實現最先進的凸集計算算法。該庫同時提供了具體的和懶惰的集合表示,后者代表了將集合計算延遲到需要時才進行的能力。我們擴展了[8]中的這些結果,增加了對任意大小分區和任意低維集合表示的支持。在一個相關的工作中[11],我們沿著復雜度的不同維度擴展了這些結果,即提出了一種有效處理混合系統離散轉換的組合方式。
偽造方法。混合系統的證偽是與驗證相對應的,目的是找到違反給定安全屬性的軌跡。這是一個具有挑戰性的問題,目前偽造算法的實際適用性仍然受制于其高時間復雜性。在[13]中,我們試圖利用我們已經開發的可達性算法的力量來提高偽造技術的可擴展性。特別是,我們從現有的偽造問題的編碼作為一個非線性優化問題開始[25],并提出了一個擴展,通過增加用可達性算法獲得的線性狀態約束來減少優化問題的搜索空間。我們在一些標準的混合系統基準上展示了我們方法的效率,證明了在速度和可偽造實例數量上的性能提升。在[12]中,我們通過將非線性優化問題分解為兩個更簡單的優化問題,并以交替的方式解決它們來增強這種算法。
并行方法。如上所述,可達性分析技術是目前驗證網絡物理系統安全屬性的最先進技術的核心。在這個主旨中,我們研究了如何利用現代CPU中強大的并行多核架構來擴展此類技術。在文獻[18]中,我們首次提出了一套并行狀態空間探索算法,利用多核CPU,能夠對CPS的線性連續和混合自動機模型進行可達性分析,從而解決了這一限制。為了證明在多核處理器上實現的性能加速,我們在幾個基準上對所提出的并行算法進行了實證評估,比較其關鍵性能指標。
庫普曼算子理論。非線性動力系統的可達性分析是一項具有挑戰性和計算成本的任務。同時,如上所述,計算線性系統的可達狀態,通常可以在高維度上有效地完成。在[6]中,我們探討了利用這兩類系統之間的聯系的驗證方法,該方法基于Koopman算子的概念[23]。Koopman算子將非線性系統的行為與嵌入高維空間的線性系統聯系在一起,并增加了一組所謂的可觀察變量。盡管新的動態系統有線性微分方程,但初始狀態集是用非線性約束條件定義的。由于這個原因,現有的線性系統可達性方法不能直接使用。我們提出了第一個可達性算法,以處理這種未曾探索過的可達性問題的類型。我們的評估考察了幾種優化方法,并表明所提出的工作流程是驗證非線性系統行為的一個很有前途的途徑。
可達性分析的混合方法。這些方法[7]通過用較簡單的動力學(如常數或仿生動力學)來近似非線性動力學。這一步使我們有可能利用現有的線性動力學混合系統的算法的力量。在[20]中,我們提出了基于動力學比例模型轉換的混合方法的改進。該轉換旨在減少線性化域的大小,從而減少超近似誤差。我們在一些非線性基準實例上展示了我們方法的效率。
在線驗證。在這個研究方向中,我們的目標是將可達性分析應用于在線環境中。換句話說,我們考慮的環境是,可達性分析所提供的信息被實時用于指導自主系統的控制算法。這反過來又對可達性分析的性能效率提出了特別嚴格的時間限制。在[14]中,我們提出了一種方法,利用深度神經網絡在有限的時間內對可達集進行保守的近似。我們提供了基于統計模型檢查方法的概率性保證。該方法被評估為自主車輛在模擬環境中幾個動作的彈性安全架構的一部分。我們的評估表明,可達性分析可以在幾分之一秒內完成,并且比傳統的非線性可達性工具要好兩個數量級。我們還提出了另一種方法[1],通過將障礙證書[22]的計算泛化到動態變化的初始條件,以及在運行時使用生成的安全集來對抗先前未知的、可能與時間有關的不安全集,從而有效地進行實時可達性分析。這些方法得到了[15]的補充,在那里我們探討了如何將可達性分析作為模型預測控制[17]的一部分來支持動態避障。
通過驗證進行規劃。在我們的早期工作[16]中,我們通過提供從PDDL+(一種描述規劃領域的形式主義)到混合系統的轉換方案,在彌合混合自動機的規劃和驗證領域之間的差距方面邁出了第一步。這使得模型檢驗工具能夠在混合規劃領域得到應用。通過這種方式,我們可以解決最先進規劃器范圍之外的PDDL+領域。在這個項目中,我們將[19]中的這些想法改編為時態規劃,并將我們的方法納入到細化循環中。我們還提出了一個基于抽象的放松[21],用于推理線性數字規劃問題。
混合系統的Event-B。在這個研究方向上,我們考慮了Event-B[2]和混合系統之間的協同作用。我們在這一領域的成果包括開發了一個通用的混合鐵路信號系統模型[3],該模型可以進一步完善,以捕捉特定的鐵路信號系統。另外,在[4]中,我們提出了一種網絡物理系統的多元開發方法,該方法建立在基于細化和證明的建模語言Event-B及其對混合系統建模的擴展。為了提高該方法中所產生的Event-B模型的低演繹驗證自動化程度,這項工作描述了一種在證明過程中整合可達性分析的新方法。此外,為了提供更全面的網絡物理系統開發和基于仿真的驗證,我們描述了將網絡物理系統Event-B模型轉化為Simulink的機制。
隨機常微分方程(RODEs)。顧名思義,這些是在其向量場函數中包含隨機過程的常微分方程(ODEs)。它們已經在廣泛的應用中使用了很多年,但一直是隨機微分方程(SDEs)的影子存在,盡管能夠對更廣泛的、通常在物理上更充分的干擾進行建模。在[24]中,我們研究了包含維納過程的RODEs在有限時間跨度和無限時間跨度上的安全驗證問題。更詳細地說,我們研究了p-安全問題,其中我們確定了滿足安全規范的概率至少為p的初始狀態集。基于確定概率測量大于p的樣本路徑集,我們提出了一種將ODEs的隨機可達性減少為對抗性可達性的方法,以解決有限時間范圍內的p-安全問題。這種方法允許將擾動的ODEs的可達性計算方法有效地提升到RODEs。在這個方法中,有限時間范圍內的p-安全問題被簡化為具有時間變化的擾動輸入的ODEs的內部逼近魯棒的后向可達集問題。然后,我們將該方法擴展到無限時間跨度的p-安全問題。最后,我們在幾個例子上演示了我們的方法。
本文介紹了在卡勒獎學金第一年內進行的研究,研究如何自主控制檢查平臺向故障平臺行駛以完成檢查相關任務。這項研究的目的是開發一個有限時間的相對位置控制框架,使檢查衛星能夠安全地接近發生故障的平臺,因為平臺的通信能力受到阻礙,導致其在接近過程中根本無法通信。故障平臺導致獨特的挑戰,即平臺的狀態被認為是先驗未知的,檢查器可能無法從故障平臺提供的準確和連續的信息中受益;故障平臺也可能受到機動和干擾。
在該獎學金的第一期內,使用 MATLAB 和 Simulink 開發了仿真軟件,以演示檢查平臺與故障平臺執行會合操作。首先引入基于視線的相對運動模型,直接使用導航信息,然后以自適應非奇異終端滑模控制器的形式開發魯棒控制框架,以確保閉環系統穩定并保證有限時間收斂到所需的狀態。然后在最終討論未來的工作和目標之前展示和討論模擬結果。
這項工作的目的是開發能夠成功處理復雜動態環境中順序決策的深度終身學習方法,重點是多Agent情報、監視和偵察(ISR)場景。我們為深度卷積神經網絡開發了一個新的架構,支持通過去卷積因子化的終身學習(DF-CNN),探索了通過Distral和Sobolev訓練的策略提煉的組合,并開發了一個混合控制器,將深度學習應用于ISR智能體。我們的方法在標準基準深度學習數據集、DOOM環境和ATE3模擬環境中的ISR場景中進行了評估。
我們的主要貢獻是反卷積因子卷積神經網絡(DFCNN)。DF-CNN框架調整了標準卷積神經網絡(CNN)框架,以實現任務之間的轉移。它在每個CNN層維護一個共享知識庫,并通過這個共享知識促進不同任務的CNN之間的轉移。每個具體任務的CNN模型的各個過濾層都是由這個共享知識庫重建的,隨著網絡在多個任務中的訓練,這個知識庫會隨著時間的推移而調整。DF-CNN代表了ELLA終身學習框架對深度網絡的概括。
實驗表明,DF-CNN在終身中的基準識別任務上的表現優于其他方法(包括單任務學習、低層的硬參數共享和漸進式神經網絡)。此外,該框架能夠抵抗災難性遺忘,同時仍然允許從未來的學習中反向轉移到以前學習的模型。
對于深度強化學習,我們研究了將Sobolev訓練整合到Distral多任務框架中,以努力改善轉移和訓練,探索了DF-CNN在深度RL中的應用,并開發了一個混合控制器,將本地學習的深度RL策略結合在一起,在ATE3仿真環境中完成ISR場景。