在自主航空系統的動態環境中,無人駕駛飛行器(UAV)的集成引發了模式轉變,為協同決策和導航提供了前所未有的機遇和挑戰。本文探討了多智能體強化學習(MARL)在復雜環境下無人飛行器規劃和協同中的應用。
論文的第一部分介紹了單智能體強化學習和 MARL。舉例說明了 MARL 在反無人機系統(C-UAS)中的應用。將反無人機系統問題表述為多智能體部分可觀測馬爾可夫決策過程(MAPOMDP),并提出了多智能體部分可觀測深度強化學習追擊者控制優化(MAGNET),用于訓練一組無人機系統的追擊者或智能體,以追擊和攔截速度更快的無人機系統或逃逸者。在 MAGNET 中,將基于控制障礙函數(CBF)的安全層集成到近端策略優化(PPO)中,以便在訓練和測試過程中提供安全保證。此外,還將 DeepSet 網絡納入 MAGNET,以處理智能體觀測的時變維度。進行了大量的仿真,結果表明,與基線實現相比,MAGNET 可以維持一個無碰撞的環境,但犧牲了輕微的逃逸者捕獲率降低。
論文的第二部分涉及多智能體系統的安全學習方法。為此,探索了高級空中機動性應用中的一個更復雜的場景,即一組自主無人機(UAV)可能需要合作同時到達預定目的地,例如攻擊目標或運送重型貨物。然而,控制一組無人機同時到達目的地并非易事,因為它們必須滿足空間約束條件,這意味著控制算法不僅要避免無人機之間的碰撞,還要避免無人機與非合作飛行物(NCFO)之間的碰撞,而這些飛行物不受控制算法的協調。現有的時間協調控制算法可以實現多無人機系統的同時到達,但無法確保無碰撞。在本例中,提出了一種安全的線性二次優化控制算法,該算法由兩大部分組成,即時間協調規劃器和安全層,其中時間協調規劃器用于推導無人機的加速度,以最小化所有無人機的到達時間與預定終止時間之差,而安全層則應用基于控制障礙函數的解決方案來生成可行的無人機加速度,以確保無碰撞環境。
最后,利用 MARL 框架解決終端時間協調問題,成功實現了無人機同時到達目的地,同時避免與其他無人機和非合作飛行物(NCFO)發生碰撞。
在機器學習(ML)的整個流程中,人們扮演著至關重要的角色。人們通過復雜的分布式評估網絡對大量數據進行注釋,從而為機器學習算法的開發做出貢獻。在機器學習部署端,專家從業人員在醫療保健、借貸、教育、社會服務和救災等各種現實世界領域與 ML 模型成果合作。本論文的重點是研究和支持人類在復雜決策環境中的判斷,以期改善他們與機器學習算法的整合。這項工作以研究人類行為的學科,特別是心理學、認知科學和人機交互學的豐富和肥沃土壤為基礎,從定量和定性的角度研究不同社會技術系統中的情景人為因素,如眾包、同行評審、ML 輔助決策等。具體來說,我們設計了統計工具,用于理解不同數據激發范式下的人類行為。下一步,我們將設計實驗,從統計學角度深入了解人類在復雜環境下的決策偏差,從而支持循證政策改革,提高決策質量。為了改進現實世界環境中的人工智能部署,我們提出了特定領域和通用領域框架,以支持人類與人工智能的有效合作。這里的重點是理解和利用人類與 ML 工具的相對優勢。本論文展示了在提高機器學習算法影響力這一更廣泛的目標中強調人類作用的重要性。
機器學習(ML)技術的飛速發展,在很大程度上是由于它有望自動完成傳統上認為只有人類才能完成的各種任務。從基于視覺表征識別數字的簡單行為,到診斷胸片異常的復雜任務。對視覺表征的理解是現代機器學習方法的成就之一。其他進步包括但不限于自然語言處理、機器人等領域。這些技術進步的核心宗旨是希望復制和再現人類的能力。換句話說,要全面了解機器學習工具,就必須研究其設計初衷的人類印記。
人類的能力和智慧通過幾種復雜的互動交織在 ML 工具的結構中。當我們仔細研究任何機器學習算法的設計和執行所涉及的不同過程時,這一點就會變得顯而易見。實際上,在現實世界中部署一個 ML 模型包括三個主要階段: (1) 收集數據,以捕捉模型的預期目標,例如,對于圖像識別模型,可能需要收集帶有注釋的圖像,以描述圖像中感興趣的特征;(2) 模型開發,在此過程中,采用精心選擇的架構對模型進行訓練,以學習預期目標;(3) 模型部署,將開發的 ML 工具部署到現實世界的環境中,例如自動駕駛汽車中的圖像識別模型,它可以幫助駕駛員獲得低功耗和安全的駕駛體驗。
在本論文中,我們將重點關注人在人工智能設計和執行管道的第一和第三階段中發揮的不可或缺的作用。人們在這些階段的行為對 ML 工具產生了至關重要的影響,并直接影響到 ML 在實踐中的成果。在數據收集階段,除了最近使用合成數據訓練 ML 模型的趨勢之外,數據幾乎完全由人生成。收集到的數據反映了參與生成數據的人的知識、經驗等。經過訓練,人工智能可以從數據中的模式中學習,其結果也反映了同樣的知識和經驗。之前的機器學習文獻對這一現象進行了詳細研究。從人們那里收集數據的一種常見方式是眾包,即在眾包平臺上上傳一項特定任務(如圖像標記),由參與的工作人員為上傳的圖像提供注釋。不難看出,眾包工作者行為的特殊性會對根據這些數據訓練出的最終模型產生怎樣的影響。
接下來,模型部署階段的具體情況會對模型的幾個方面產生重要影響。例如,請看前面提到的視覺模型為駕駛提供幫助的例子。理想的駕駛助手應該能夠在駕駛員即將犯錯時發出警告,因此在這種情況下,合適的輔助模型在很大程度上取決于人類駕駛員的能力和需求。這一想法適用于所有引入人工智能工具來增強人類能力的現實環境。了解人工智能模型所要輔助的人類專家當前的能力和缺陷,對于設計一個能夠在實踐中實現改善整體結果目標的模型至關重要。
鑒于人的整合在塑造 ML 模型的行為及其在實際應用中的有用性方面發揮著重要作用,我的論文有助于設計工具和實驗,以支持在復雜環境中更好地理解和整合人,從而改進 ML 工具。具體來說,這篇論文著眼于眾包和會議同行評審領域,研究復雜數據激發環境中人類行為的不同方面。我們的研究結果揭示了人們在這兩種環境下的行為中以前未經測試的細微差別和偏差,倡導在數據激發中進行以人為本的設計。接下來,關于人在模型部署階段的作用,本論文研究了在分類和生成設置中人與人工智能成果的協作。我們闡明了了解人類專家和人工智能模型在任何任務中的相對優勢對于支持有效的人類-人工智能協作的重要性。
第一部分側重于理解眾包中的人類決策行為。正如前面簡要提到的,眾包是訓練機器學習模型的主要數據來源,而其中生成的數據質量會影響在此基礎上訓練的模型的行為。在本論文中,我們設計了統計工具來檢查眾包數據的屬性。訓練 ML 模型需要大量數據,因此我們利用高維統計學習技術為本章介紹的算法提供理論保證。具體來說,第 2 章提供了一種雙樣本測試算法,用于檢測兩個人群對一組項目的偏好(以排名表示)是否存在統計意義上的顯著差異。第 3 章研究了在眾包過程中,當眾包者的專業水平信息可用時的數據聚合方法。具體來說,我們證明了一種流行的聚合方法--最大似然估計--在統計上是不被允許的。
第二部分側重于理解同行評審中的人類決策行為。科學同行評審是一種復雜的數據激發設置,它由評審人和提交的論文組成,旨在找出最優秀的論文。這種設置以分布式人工評估為基礎,其中每個評審員只評估一部分提交的論文,而每篇論文只由少數幾個人進行評估。這種設置為研究人類行為提供了豐富的素材,同時也帶來了一系列挑戰,如主觀性、偏見、激勵機制錯位等。本章的工作重點是研究同行評議數據,檢驗參與者的行為是否存在偏差,并據此提出基于證據的同行評議政策改革建議。第二部分的大部分技術工作包括:(1)設計實驗,仔細收集會議同行評審中的人類評價數據;(2)應用統計技術,找出人們評價中的重要模式。
接下來,我們將在第三部分討論本論文的第二個重點,即理解和支持人類與機器學習模型結果的整合。機器學習模型正被用于支持醫療保健、信用貸款、刑事司法等廣泛領域的決策。例如,在刑事司法系統中,算法累犯風險評分為被告的審前保釋決策提供依據。在高風險決策系統中引入 ML 輔助,就是要通過精心設計的混合決策系統,將人類認知和 ML 模型各自的優勢結合起來并加以放大。因此,論文的第三部分旨在提出可行的見解,以提高人類與 ML 合作的有效性,從而提高其成果的質量。
在第 8 章中,我們延續了之前對人類決策中的偏差所做的研究,研究了人類認知偏差在人工智能輔助決策中的作用。這項研究是之前關于支持人類決策者適當依賴 ML 模型輸出的研究的延續。
如前所述,有效的人類-人工智能合作關系的一個重要組成部分是了解人類與基于人工智能的決策在特定任務上的優勢和局限性。雖然行為科學研究為人工智能模型補充人類認知能力(反之亦然)的潛在機會提供了見解,但還需要進一步的研究來(1)了解這些發現在具體的現實世界人類決策任務中的影響,然后(2)將這些見解付諸實施,以促進有效的人類-人工智能合作關系。因此,本論文的其余部分提出了在兩類任務中實現人機交互互補的見解:預測性決策任務和生成性、共同創造性任務。相應地,第 9 章提出了預測決策中人機互補的通用領域和特定領域框架,第 10 章介紹了我們在審核人工智能模型中人機結合的特定領域工作。
這項工作旨在通過人類決策者及其與機器學習算法的結合,為大規模提高社會技術系統的決策質量提供可操作的見解。
本文探討了人工智能(AI)技術在生成無人機(UAV)機群軌跡中的應用。所面臨的兩大挑戰包括準確預測無人飛行器的路徑和有效避免它們之間的碰撞。
首先,本文在單隱層前饋神經網絡(FFNN)中系統地應用了多種激活函數,與之前的研究相比,提高了預測路徑的準確性。
其次,引入了一種新穎的激活函數 AdaptoSwelliGauss,它是 Swish 和 Elliott 激活函數的復雜融合,并與縮放和移動高斯分量無縫集成。斯維什能促進平穩過渡,埃利奧特能捕捉突然的軌跡變化,而縮放和位移高斯能增強對噪聲的魯棒性。這種動態組合專為捕捉無人機軌跡預測的復雜性而設計。與所有現有的激活函數相比,這種新激活函數的精度要高得多。
第三,提出了一種新穎的綜合碰撞檢測、規避和批處理(ICDAB)策略,它融合了兩種互補的無人機碰撞規避技術:改變無人機軌跡和改變其起始時間,也稱為批處理。這種融合有助于克服兩種技術的缺點:第一種技術是減少軌跡操作次數,避免路徑過于迂回;第二種技術是減少批次規模,減少整體起飛時間。
近年來,無人機因其多功能性和廣泛的應用潛力而越來越受歡迎,從監視和監測到交付和運輸,無所不包。然而,無人機在復雜環境中的安全高效運行仍然是一項重大挑戰,尤其是在涉及多個無人機的情況下。一個關鍵問題是需要優化無人飛行器的軌跡,以實現各種目標,如盡量縮短飛行時間、避免碰撞和擴大覆蓋范圍。傳統的軌跡規劃和控制方法在處理現實世界場景的復雜性和不確定性方面往往能力有限,而且可能無法擴展到大型無人機群。
之前的研究(如 Lai (2020)、Xue (2017) 以及 Qiu 和 Duan (2020))已經證明了利用非線性優化技術的功效。最近,Xu 等人(2024 年)將多目標優化用于軌跡生成。當需要快速改變軌跡時,優化程序太慢且不具有自適應能力,因此人工智能技術成為首選。人工智能技術,尤其是基于機器學習和神經網絡的技術,使無人機能夠從數據中學習并適應不斷變化的條件,從而在應對這些挑戰方面展現出巨大的前景 Lai(2020)。
這些研究涉及利用雙曲切線函數(Tanh)、Sigmoid 等激活函數訓練單隱層的 FFNN。所使用的激活函數對路徑的預測精度不高,因此我們首先要改進這方面的問題。我們在單隱層 FFNN 中系統地應用了多種激活函數,并進行了綜合比較分析。除了 Sigmoid 和 Tanh 外,我們還使用了整流線性單元(ReLU)、泄漏 ReLU、Swish、Elliot 和 Maxout。
其次,為了追求更高的軌跡精度,我們引入了一種新型激活函數 AdaptoSwelliGauss,它超越了相同神經網絡架構中常用的同類激活函數。該函數結合了能捕捉平滑過渡并保持軌跡連續性的 Swish 激活函數和能捕捉方向和速度突然變化的 Elliot 激活函數,以及能使激活函數對噪聲數據具有魯棒性的縮放和位移高斯。
在自主無人機中,碰撞檢測和規避的關鍵部分對確保其運行的安全性和效率起著至關重要的作用,這也是我們的第三個重點。當考慮到多架無人機同時起飛時,這些功能的重要性就更加突出了。無人飛行器之間的碰撞檢測非常簡單,但是有很多方法可以通過改變飛行軌跡來避免碰撞。Guo 等人(2021 年)介紹了一種流行的方法--圓弧軌跡幾何法(CTGA)。假設兩架無人飛行器在路徑上的某一點發生碰撞,該技術會對其中一架無人飛行器的路徑添加一個小擾動。這種算法的缺點是容易陷入操縱循環。對一個無人飛行器軌跡的任何改變都可能無意中造成與其他無人飛行器的碰撞,從而導致棘手的情況。此外,對無人飛行器軌跡的頻繁操作可能會導致飛行路徑錯綜復雜,從而影響無人飛行器群的整體效率。
另一種避免無人機碰撞的輔助技術是改變它們的起始時間。Sastre 等人(2022a)和 Sastre 等人(2022b)提出了這樣一種流行的方法。他們采用了一種分批機制,創建具有非碰撞軌跡的無人飛行器群,以促進安全飛行。然而,多批次的創建引入了一個時間密集的過程,延遲了無人機群的整體發射。
在本文中,我們介紹了一種先進的碰撞檢測和規避算法,稱為 ICDAB 算法。在這里,我們首先改進了 Guo 等人(2021 年)提出的 CTGA 算法,然后將這種規避算法與批處理機制相結合,最終形成了我們的算法。
本文的其余部分安排如下: 第 2 節回顧了相關文獻,第 3 節介紹了我們提出的算法和方法,第 4 節展示了結果,第 5 節總結了本文并提出了未來的工作方向。
本論文旨在解決在工業相關場景中為機器人生成任務計劃的難題。隨著小批量生產的增加,企業要求機器人經常為新任務重新編程。然而,只有在大規模生產時,維持一支具備特定編程技能的操作員團隊才具有成本效益。自動化程度的提高將目標定位在人類與機器人共享工作環境的企業,擴大了制造業的應用范圍。為此,需要通過任務計劃來控制機器人,從而安排和優化行動的執行順序。本論文的重點是生成反應靈敏、透明、可解釋、模塊化和自動合成的任務計劃。這些任務計劃可提高機器人的自主性、容錯性和魯棒性。此外,這種任務計劃還能促進與人類的合作,實現計劃的直觀呈現,并使人類有可能在運行時提示指令,以修改機器人的行為。最后,自主生成減少了操作員為機器人編程所需的編程技巧,并優化了任務計劃。
本論文討論了使用行為樹(BT)作為機器人任務計劃的策略表示。論文比較了行為樹和有限狀態機(FSM)的模塊性,認為行為樹在工業場景中更為有效。本論文還分別使用遺傳編程法和從演示中學習法探索了自動和直觀生成 BT 的方法。所提出的方法旨在為移動操縱任務高效地進化 BT,并允許非專業用戶直觀地教授機器人操縱任務。本論文強調了用戶體驗在任務解決中的重要性,以及用戶體驗如何使進化算法受益。最后,論文提出了使用以前從演示中學到的 BT 來干預無監督學習過程的方法。
在過去的十年中,無人駕駛飛行器(UAV)的使用領域完全爆炸式增長。如今,它們被用于執行監視任務和檢查人們難以到達的地方。為了提高執行這類任務的效率和穩健性,可以使用合作無人機群。然而,這對使用哪些解決方案來定位和導航智能體提出了新的要求。本論文研究、實施和評估了無人機群相對定位和繪圖的解決方案。
報告研究并介紹了通過使用擴展卡爾曼濾波器(EKF)融合智能體之間的速度數據和成對距離測量來估計相對位置的系統。在現有估計相對位置方法的基礎上開發了一種濾波器,并對其進行了修改,以包括星座中所有可用的成對距離,從而使定位精度提高了 47%。此外,還開發了一種多維縮放(MDS)初始化程序,能夠非常準確地確定蜂群內的初始相對位置,幫助 EKF 幾乎瞬間收斂。此外,還開發并測試了另一種使用 MDS 坐標估計值作為輸入的 EKF。
無人機配備了測距探測器,可測量四個方向與墻壁的距離。距離數據被插入一個網格,將環境離散化。在繪制環境地圖時,采用了一種方法來考慮無人機位置的不確定性,從而改進了結果。對蜂群繪制地圖的兩種方法進行了測試,結果表明它們適用于不同的設置。如果蜂群中的無人機具有共同的坐標系,無人機就會更新相同的網格并繪制地圖。如果無人機的坐標系不同,則分別創建地圖,然后合并。一般來說,協作構建地圖的方法性能更好,而且不需要復雜的地圖合并解決方案。要合并地圖,需要一個成本函數來衡量地圖的匹配程度。我們對三種不同的成本函數進行了比較和評估。使用已知的全局位置和相對姿態估計值,對探索環境的蜂群的映射器進行評估。
事實證明,在將相對姿態估計值輸入繪圖系統時,利用已有的定位濾波器所實現的精度足以生成分辨率為十厘米的地圖。在模擬環境中可以實現更高的制圖分辨率,但需要更多的計算時間,因此沒有進行測試。
本論文探討了支持分布式海上作戰(DMO)的兩種不同通信架構的選項。這兩種架構分別是星形網絡和無線網狀網絡。為本研究開發場景模型的目的是幫助讀者更好地理解緊密結合的數據類型、數據速率和所需網絡功能對網絡設計的影響。本研究針對需要視頻、語音和數據鏈路組合的場景中的各種資產,對每種架構進行了評估。它深入分析了每種設計所固有的信息傳遞延遲,并評估了每種網絡的可靠性。研究發現,利用機載路由功能的低地球軌道衛星星形和網狀網絡可提供最低的定時延遲。研究還發現,通過專用通道提供視頻饋送時,網絡抖動最小。最后,網狀網絡的可靠性略高于傳統的星形網絡,這是因為數據鏈路具有冗余性,而且缺少一個可能易受攻擊的中心樞紐。因此,利用特設無線網狀通信網絡將支持在分布式海上作戰進行有限的進攻性聯合火力打擊期間部署自適應部隊包。
圖 1. 星形網絡拓撲(左)和全網狀拓撲(右)。
在任何戰斗環境中,良好的通信都是取得勝利的關鍵。即使是在擁有堅實通信基礎設施的地理位置,如果戰地指揮官不能及時收到來自戰地資產的正確信息報告,也會造成混亂。在海戰中,尤其是在近海,通信基礎設施充其量也是微乎其微。
為響應美國防部長關于改進聯合火力(JF)行動的號召,本畢業設計探討了支持分布式海上行動(DMO)的兩種不同通信架構的選項。這兩種架構分別是星形網絡和無線網狀網絡。
為本研究開發情景模式的目的是幫助讀者更好地理解緊密耦合的數據類型、數據速率和所需網絡功能對網絡設計的影響。這有助于突出已實施網絡的設計限制。模擬結果用于定義基準參考和可追溯數據要求,以支持為 JF DMO 設計的戰術網絡。
A. 戰術通信網絡拓撲結構
網絡設置通常用拓撲結構來描述,拓撲結構是網絡內節點排列和通信的物理方式(美國陸軍工程部,1984 年,7)。本研究評估了圖 1 左側所示的傳統星形網絡和圖 1 右側所示的多層網狀通信網絡,并量化了這些鏈路的排列可能對操作產生的影響。
1.星形網絡
最廣泛使用的無線網絡拓撲結構是星形幾何模式。星形拓撲結構包括一個中心節點,所有信息都通過該節點流動。在星形格式中,所有信息都必須從每個參與資產發送和接收,并通過中心樞紐路由。這種配置中的中心節點是單點故障。如果中央節點離線,整個網絡就會癱瘓。
2.無線網狀網絡
多層戰術無線網狀網絡是指在網絡內共享信息的過程。網狀網絡描述了一種配置,其中每個節點都具有通信能力,可以相互發送和接收信息。在網狀網絡中,節點是自組織的,可根據需要通過路由算法自動建立(Shillington 和 Tong,2011 年)。
B. 結論
本研究的設計要求側重于網絡配置、對信息定時延遲的影響、網絡抖動和可靠性。研究發現,使用具有機載路由功能的低地球軌道(LEO)衛星的星形和網狀網絡可提供最低的定時延遲。研究還發現,在提供視頻饋送專用通道時,網絡抖動最小。最后,網狀網絡的可靠性略高于傳統的星形網絡,這是因為數據鏈路具有冗余性,而且沒有潛在的易受攻擊的中心樞紐。因此,在分布式海上行動的有限進攻性聯合火力打擊中,利用特設無線網狀通信網絡將支持部署自適應部隊包。
近年來,反無人機系統(CUAS)在應對無人機系統(UAS)帶來的各種威脅方面的技術能力急劇增長。有必要通過開發系統的 CUAS 方法來利用 CUAS 技術。在本研究中,文獻綜述探討了 (1) 當前的無人機系統技術和應用;以及 (2) CUAS 的能力及其有效性分析。利用這些信息,通過基于模型的系統工程(MBSE)工具(ExtendSim)對假設的作戰環境進行測試,以評估幾種假設的 SoS CUAS 配置的有效性。開發了一種方法來分析 SoS CUAS 任務成功的不同因素及其影響,并將其用于權衡分析。從在 MBSE 工具中進行的每個 SoS CUAS 仿真中,可以得出進一步迭代和改進 SoS CUAS 配置的見解,從而在對 SoS CUAS 成本進行定性分析的基礎上優化參數。這項研究的成果是一個完善的模型和方法,今后可用于代表實際運行環境,以進行進一步分析。這項研究表明,將各種不同的 CUAS 平臺集成到一個 SoS CUAS 中,以應對無人機系統所構成的復雜威脅,是大有可為的。
本研究探討了對反無人駕駛航空系統(CUAS)系統(SoS)的需求,以應對無人駕駛航空系統(UAS)對國家經濟、安保和安全造成的日益嚴重的威脅。近年來,無人機系統的使用激增,導致 CUAS 行業迅速發展,并開發出了應對特定威脅的解決方案。然而,隨著 CUAS 技術的成熟,現在需要將這些單獨的 CUAS 工作整合到一個同步統一的 SoS 中,以更好地防御無人機系統的威脅。
文獻綜述包括對無人機系統和 CUAS 能力的研究,為本研究提供了清晰的信息。通過了解 (1) 群組分類;(2) 有效載荷能力;(3) 通信能力;以及 (4) 所采用的戰術,對無人機系統的類型和威脅情景進行了研究。通過了解 (1) 處理鏈;(2) 市場上可用的傳感器;(3) 指揮與控制 (C2) 能力;以及 (4) 緩解技術,可以使用 CUAS。以文獻綜述中形成的認識為基礎,提出了進一步分析 SoS CUAS 的方法和模型。
建議的方法使用基于模型的系統工程(MBSE)工具 ExtendSim 來模擬無人機系統飛入 SoS CUAS 作戰區時的作戰環境。該模型基于攻擊型無人機系統的特點,通過一套傳感器和射手來觀察場景的最終結果。作為名義基線模型的首次迭代,根據公開文獻假定了許多未知條件,同時控制了初始參數,以觀察這些參數值如何影響情景結果。在軍事背景下,攔截敵方無人機系統成功的置信度為 95%,失敗的可能性為 5%,這是一個保守的閾值。根據基線模型模擬了三種情景,得出測試結果,然后對結果進行進一步分析。
通過對結果的分析,得出進一步改進模型的見解。基于初始條件和假設,得出的經驗教訓有 (1) 指定 SoS CUAS 的置信度有助于確定后續模擬的范圍和錨點;(2) 在指定目標下,過多的資源投入(如更多的傳感器-射手組)不會產生最具成本效益的組合;(3) 在指定目標下,改變傳感器和射手參數有助于優化整個系統,為完善模型提供整體方法。通過在 Excel 中復制模型,對 MBSE 模型進行了驗證,并在第二次迭代中對模型進行了優化,從而進一步改進了模型。
這項研究表明,使用 ExtendSim 模型(如作為本研究一部分開發的模型)將單個 CUAS 集成和優化為一個統一的 SoS 具有很大的潛力。隨著無人機系統威脅的不斷發展,發展當前的 CUAS 能力并跟上新出現的無人機系統威脅是至關重要的。未來可擴展本研究的工作包括 (1) 改變無人機系統及其使用的參數,以模擬動態威脅場景;(2) 改變 CUAS 規格,以模擬當今和未來多種系統的不同能力;(3) 建立一個 C2 系統模型,同步 SoS CUAS 中各種傳感器和射手系統的所有鏈接,以便在統一戰線中有效、高效地消除無人機系統的威脅。
本博士論文詳細分析了提高網絡防御態勢感知所需的決策要素,特別強調了網絡安全運營中心(SOC)分析人員的感知和理解。提出了基于數據流網絡流取證(NF3)的兩種不同架構。第一種架構使用集合機器學習技術,第二種則是算法復雜度更高的機器學習變體(λ-NF3),可提供更強大的防御框架來抵御對抗性攻擊。這兩項建議都旨在有效地自動檢測惡意軟件并進行后續的事件管理,在接近所謂的下一代認知計算 SOC(NGC2SOC)方面取得了令人滿意的結果。為保護組織的計算機網絡而進行的事件監督和監測必須輔以可視化技術。在這種情況下,本論文基于任務導向的指標和程序,使用基于模糊邏輯的專家系統,對三維圖片進行了表述。確切地說,在實施網絡防御解決方案時,考慮到一個組織的使命、資源和任務的相關性,以做出更明智的決策,最新技術證明存在嚴重缺陷。這項研究工作最終為改進網絡防御決策提供了兩個關鍵領域:一個是用于評估解決方案參數的可靠、完整的驗證和確認框架,另一個是根據網絡殺傷鏈和 MITRE ATT & CK 標準開發的合成數據集,該數據集可統一參考網絡攻擊的各個階段。
圖1所示。研究活動的周界及其演變順時針方向。
本博士論文的研究目標如下: 1.了解和分析網絡防御態勢感知及其研究挑戰; 2.開展研究活動,將計算和數據處理與網絡決策系統的操作方面(業務需求)聯系起來; 3.找出不足之處,闡明未來的研究方向;
上述目標促成了以下研究任務:
特定領域的建模先驗和專門組件對機器學習領域越來越重要。這些組件將我們作為人類的專業知識整合到模型中。我們在這篇論文中認為,優化方法提供了一套具有表現力的操作,應該成為機器學習從業者建模工具箱的一部分。
我們提出了兩種基于優化的建模的基礎方法。1)OptNet架構,該架構將優化問題整合為更大的端到端可訓練深度網絡中的各個層,以及2)輸入凸神經網絡(ICNN)架構,該架構有助于使基于能量的深度模型和結構化預測中的推理和學習變得更有吸引力。
然后,我們展示了如何使用OptNet方法:1)作為一種結合無模型和基于模型的強化學習的方式;2)用于top-k學習問題。最后,我們展示了如何區分錐體程序,并將cvxpy領域的特定語言轉化為可區分的優化層,使本論文中的方法能夠快速建立原型。
本論文文件的源代碼以開放源碼的形式在以下網站提供:
本論文探討了區塊鏈與互聯網協議第六版(IPv6)數據包信息的使用,以支持與無人駕駛飛行器(UAVs)智能蜂群的安全、高性能和可擴展的通信。在這篇論文中,我們研究了三種情況下的加密數據包的交換,即點對點、點對多和多對點。我們模擬了每個場景下的蜂群行為,并在模擬運行中改變了蜂群中無人機的數量。基于仿真的結果顯示,對于點對點場景和多對多場景,即使在多對多場景中,交互節點的數量增加,延遲也沒有明顯增加。相反,在點對多的情況下,延遲會增加。需要進行更多的研究來評估本論文中提出的區塊鏈-IPv6方法的安全性和可擴展性。
圖. 使用區塊鏈技術的無人機群智能中的塊生成概念
越來越多的無人機被用于軍事目的,再加上自動化方面的進步,如為無人駕駛飛行器(UAV)配備不同程度的自主權和群集智能,使得這些飛行器成為敵對勢力的誘人目標。為了獲得競爭優勢,對手將試圖找到無人機的飛行控制器、接收器或發射器的可利用的物理和網絡漏洞,然后應用動能、網絡或某種動能和網絡攻擊機制的組合來操縱無人機的行為,例如使無人機墜毀或泄露敏感數據。
攻擊軍用無人機的一個途徑是操縱無人機使用的通信機制,無論是無人機與無人機之間的通信還是無人機與人類操作員之間的通信。例如,對手可以修改或阻止無人機群之間的數據交換,以降低無人機群的行動效率。重要的是,為軍事單位提供的無人機已經過動能和網絡脆弱性評估,與這些脆弱性相關的風險在無人機的操作使用之前就已經得到緩解,并且在無人機的使用壽命內對無人機系統進行修改時,也要進行風險評估和緩解。
安全風險管理也要在一個框架中進行規范,美國國家標準與技術研究所(NIST)就是這樣做的,它發布了一個風險管理框架。多種技術可用于實施降低安全風險的措施。例如,Vikas Hassija和Vinay Chamola[1]斷言。"當務之急是保持無人機和其他用戶之間交易的安全性、成本效益和隱私保護。區塊鏈技術是一個非常有前途的解決方案,可用于部署實時無人機應用"。
科學技術的創新和進步之間存在著一種共生關系。諸如自動駕駛汽車、自主無人駕駛飛行器(UAV)和智能家用電器等能力,一度被認為是科幻小說的范疇,或者在技術上太難實現,現在已經很普遍了。
無人機的概念最早出現在1783年,當時約瑟夫-米歇爾和他的伙伴雅克-艾蒂安-蒙戈爾費埃公開展示了一種當時可以說是無人機或無人駕駛飛機的交通工具[2],其形式是1849年在法國一個叫安諾奈的地方的熱氣球,在那次戰爭中,由奧地利中尉弗朗茨-馮-烏沙提斯創造的氣球炸彈被用來攻擊威尼斯市。雖然這次攻擊只造成了輕微的損失,但它可以被稱為成功,因為兩天后威尼斯就投降了[3]。尼古拉斯-特斯拉在1898年獲得了遙控(RC)的專利,大約20年后,一家名為拉斯頓-普羅克特空中目標的公司在特斯拉之前獲得專利的遙控技術基礎上發明了第一架無翼飛機[4]。
從那時起,無人機技術和它的應用已經穩步增長。它們已被用于科學研究,如收集有關火山活動的數據,在這些地方使用駕駛飛機會太危險或太昂貴。在20世紀90年代,亞伯拉罕-卡雷姆推出了 "捕食者",這是一種配備了攝像頭和其他傳感器的無人機,用于監視。國防界為 "捕食者 "配備了武器裝備,包括導彈[5]。掠奪者本身已被用于一些沖突,如在阿富汗、巴基斯坦、波斯尼亞、前南斯拉夫、伊拉克、也門、利比亞、敘利亞和索馬里的沖突[6]。在2022年,它們也被烏克蘭和俄羅斯武裝部隊廣泛用于戰斗。
無人機技術的一個重大進步是應用了蜂群智能,一群無人機模仿大量同質動物的智能行為,如蟻群、鳥群和蜜蜂群。蜂群通過蜂群成員之間的協調表現出集體行為。蜂群的行為可以被編碼為算法,而這些算法又可以通過軟件實現,在計算機上執行,比如無人機中使用的嵌入式計算機[7]。蜂群行為甚至被用來進行基于無人機的燈光表演,例如在2020年東京奧運會的開幕式上。
在蜂群中,蜂后是控制器,同樣地,在蜂群智能無人機中,系統中有一個控制中心,典型的控制器名為地面控制站(GCS)。無人機的工作方式很直接,這涉及到無人機和GCS之間的數據交換,然后GCS可以連接到衛星,或者衛星可以直接連接到無人機,一切都在實時發生。圖1說明了無人機和其基礎設施的一種通信方式。至少,通信需要是低延遲和安全的[8]。
有兩種技術可以在GCS和無人機之間進行通信。第一種技術是基于蜂群基礎設施的GCS,第二種是飛行Ad-Hoc網絡(FANET)。基于蜂群基礎設施的GCS本身有一個GCS,用于集中式通信。所有的無人機群都將與GCS進行通信,以便群組能夠運作。然而,這種技術的一個缺點是,它依賴于GCS的可用性和正確運作。如果GCS受到干擾,整個無人機群也會受到干擾。相比之下,FANET使用一個發射器向某個無人機發送命令,然后該無人機將這些命令轉發給第二個無人機。然后這些命令將以串行或并發的方式分發給其他無人機。所有的無人機將進行通信,并擁有發射器給出的命令列表,這樣,如果這個發射器發生故障,所有的無人機仍然可以執行命令,因為每個無人機都有一個有效的命令列表。最后,通過使用這種FANET技術,每個無人機將具有冗余性,而不完全依賴通信基礎設施。然而,這種技術也有缺點。例如,一個入侵者或一個未知的無人機可以進入并破壞無人機群。再比如,無人機群的授權成員無法檢測到,所以入侵者(即未經授權的參與者)的無人機,從而可以獲得將由授權無人機執行的命令列表[9]。
為了克服入侵者無人機的問題,也許可以應用區塊鏈來防止未經授權的無人機使用無人機群命令來獲取列表。區塊鏈本身已被廣泛用于金融領域,目的是在每筆交易的驗證過程中消除第三方。
在區塊鏈中,當數據被分發時,將很難被黑客攻擊并獲得完整的數據,因為它是由一個使用加密手段的網絡驗證的。每個區塊由前一個區塊的哈希值,驗證哈希值的隨機數,或稱nonce,以及時間戳組成。完整性的保證是由區塊鏈為第一個區塊的形成提供的,這個區塊是由一個經過驗證的交易形成的結果,稱為創世區塊。由于哈希值是不可預測的或唯一的,欺詐或復制行為將被發現。每個經過驗證的區塊都有其哈希值,對該區塊的任何改變都會對其他區塊產生影響。如果所有或大多數節點給予許可或同意,該區塊就會被添加到鏈上,因為共識機制安排交易的有效性在某個區塊的有效性。
區塊鏈上的這種共識機制可以通過三種方式進行,那就是工作證明、股權證明和投票,實用拜占庭容錯。在加密貨幣的世界里,工作證明被用于采礦。它的工作原理是在每個節點上進行數學方程的計算,然后每個首先完成計算的節點將有權將最新的區塊輸入區塊鏈。使用權益證明,只有合法的節點可以進行計算以達成共識。另一方面,實用拜占庭容錯是基于投票的,要求至少有三分之一的授權節點是拜占庭的。
認證過程是通過生成具有偽隨機函數的一次性密碼(OTP)來進行的。無人機在區塊鏈中注冊,每架無人機根據存儲在區塊鏈節點中的關系,確定它能夠認證的最近的無人機。認證請求從無人機發送至相關的無人機,后者在區塊鏈中觀察并檢查該無人機是否有關系,并能對其進行認證。這個方案能夠挫敗外部惡意無人機的攻擊或第三方攻擊,即使對手知道第一個令牌。
在本論文中,我們研究了使用IPv6(互聯網協議版本6)在無人機之間進行通信的方式。與IPv4(互聯網協議版本4)相比,IPv6有很多優點,即速度更快,更有效,因為它的路由表比IPv4少,所以路由過程將更有組織和有效,而且更安全,因為它配備了交換數據的加密功能。帶寬更有效,因為IPv6支持組播。配置更容易,因為它自動運行。總的來說,IPv6更適合無人機等移動設備,因為不需要通過網絡地址表(NAT),因此延遲低。IPv6將使用區塊鏈與權益證明共識相結合。
與加密貨幣一樣,區塊鏈上的每個節點都必須進行支付。在這項研究中,支付被替換成OTP。每個節點產生相同或同步的OTP。區塊鏈和OTP在這里的使用是為了檢測未經授權的無人機,并防止他們讀取或更新無人機群使用的命令列表。此外,我們探索了區塊鏈、智能合約共識(SCC)和分布式賬本技術在蜂群通信方面的能力。此外,還根據提出的無人機群智能通信架構的概念進行了模擬。
本論文的范圍僅限于探索區塊鏈技術和OTP的聯合使用,這兩種技術在IPv6數據包中都有填充。
在進行了模擬物理無人機在點對點、點對多、多對點場景下的運行,并使用1-10000次迭代或交易的實驗后,得到了各場景的延遲比較結果。從這些結果可以得出結論,對于點對點方案和多對多方案,即使在多對多方案中,交互節點的數量增加,延遲也沒有顯著增加。而在點對多的情況下,一個節點以廣播信息的形式同時向幾個節點進行交易,這導致了延遲的增加。第四章和第五章解釋了仿真結果和這些結論的總結。此外,第五章還討論了與本論文中的事項有關的未來工作的可能性和建議。
第二章介紹了無人機群智能通信區塊鏈功能的背景,并利用它作為無人機群智能的通信手段。它還對IPv6結構格式進行了概述。第三章討論了基于IPv6區塊鏈的通信數據傳輸的分析。具體而言,分析了IPv6區塊鏈數據包的場景、保密性、完整性和可用性。第四章闡述了IPv6區塊鏈在無人機蜂群智能中實現的可能性和挑戰的研究成果。第五章提供了結論和對未來研究的建議。
這篇論文提出了在自動化制造背景下的多智能體機器人裝配規劃的算法。我們的工作涉及到 "工廠自主權堆棧 "的許多部分。本論文的第一個貢獻是引入了一個離散工廠問題的表述,其中包括時間延長的多機器人任務分配、任務間的優先權約束和避免碰撞的約束。我們提出了一種解決此類問題的有效方法。我們算法效率的兩個關鍵是它將任務分配和路線規劃解耦,以及它能夠利用一些機器人在自己的時間表中被推遲而不對工廠的整體性能造成任何負面影響的情況。
本論文的下一個主要貢獻是針對我們的離散工廠問題的在線版本的重新規劃算法系列。在在線設置中,工廠指揮中心定期收到新的制造工作量,這些工作量必須被迅速納入整體計劃中。我們通過大量的實驗表明,我們的重新規劃方法適用于廣泛的問題。此外,我們提出的方法在應用時可以使工廠在等待收到更新的計劃時永遠不必凍結。
我們最后的貢獻是一個概念驗證系統,用于大規模的多機器人裝配計劃,包括任意形狀和尺寸的裝配體和原材料。我們的系統從原材料和一套關于這些材料如何組合的基本指令開始。然后,規劃器合成一個施工計劃,其中定義了每個有效載荷將如何攜帶(由一個或多個機器人攜帶),每個組件和子組件將在哪里建造,以及哪些特定的機器人將被分配到每個單獨和協作的運輸任務。最后,一個反應式防撞控制策略使機器人能夠以分布式方式執行建造計劃。我們在模擬中證明,我們的系統可以在幾分鐘內合成具有數百個部件的裝配體的施工計劃。雖然我們沒有解決圍繞多機器人制造的所有相關的 "現實世界 "的考慮,但我們的工作是向使用移動機器人的大規模自動化施工邁出的一小步。