偏遠軍事基地的安保是一項艱巨而又關鍵的任務。偏遠地區通常離敵方戰斗人員更近,離支援部隊更遠;負責保衛基地的人員裝備較少。這些地點通常還依賴空中補給任務來維持任務的準備狀態和有效性。本論文分析了小型自主無人機群如何協助防御行動。為此,創建了一個基于智能體的計算機仿真模型,該模型創建了一個戰術問題(敵人試圖攻擊或滲透一個假想基地),無人機群試圖抵御該問題。結果表明,如果每架無人機負責覆蓋的范圍不超過 0.18 平方英里,并且至少有 40% 的無人機配備武器,那么蜂群可以有效阻止 95% 的攻擊者。結論是,無人機是基地防御的絕佳補充,尤其有助于有機能力較弱(視野、防御資產等有限)的偏遠前哨。雖然這項研究專門針對反擊對中央基地的威脅,但蜂群動態算法可應用于未來的移動車隊或飛機防御問題,甚至和平時期的搜索和救援等應用。
快速準確地識別附近的飛機對美國海軍艦艇的安全有效運行至關重要。現代技術和計算機輔助決策工具為過時的戰斗識別方法提供了替代方案。通過將 Soar 認知架構的強化學習功能與戰斗識別技術相結合,本論文探索了兩者合作的潛力。在開發出 Soar 與戰斗識別方法之間的基本接口后,本論文分析了所開發的 Soar 代理對既定真理的整體正確性,以確定系統的學習水平。雖然這項初步研究的范圍有限,但其結果有利于戰斗識別的大幅現代化。除了建立概念驗證外,這些發現還有助于未來的研究,以開發出一個強大的系統,能夠模仿和/或輔助人類操作員的決策能力。雖然這項研究的重點是基于海上的海軍應用,但研究結果也可擴展到整個國防部門的實施。
戰術決策者可獲得的海量信息會讓戰術行動官(TAO)或任務指揮官(MC)等單個操作人員應接不暇。在作戰環境中,戰術行動官或任務指揮官必須快速正確地識別和分類未知飛機(海軍作戰部長 [CNO],2012 年)。隨著未知飛機數量的增加,傳感器數據和決策信息的數量也相應增加。通過嘗試確定一種有助于 TAO/MC 決策過程的程序,有可能提高操作員的效率,從而通過減少飛機在戰斗識別(CID)方面未分類的時間來提高作戰環境的內在安全性。通過強化學習(RL)解決方案,Soar: 認知架構可促進 CID,并最終模擬 TAO/MC 的認知過程。
本論文是解決 TAO/MC 決策者可能遇到的 CID 操作員任務超負荷問題的關鍵一步,它通過有效(準確)的 RL 確定了模擬 CID 過程的計算機輔助決策工具。通過評估 RL 對簡化的 CID 規則集的影響,可以評估 Soar 認知架構,將其作為一個合理的框架納入 TAO/MC 職責。最終,評估 RL 功能是否足以成為在特定行動領域內準確模擬 CID TAO/MC 認知功能的工具集,對于在擴展研究之前證明這一概念的可行性至關重要。研究 RL 的潛在益處可以重塑 CID 的標準操作程序和 TAO/MC 的主要職責。
結合 CID 評估 RL 算法是研究確定合作系統可行性的關鍵一步。本論文將利用 SOAR 認知架構和基本的 CID 矩陣,嘗試回答以下研究問題: “在 SOAR 認知架構下,CID 的強化學習是否有效?
對上述研究問題的評估將通過開發和分析兩個以結果為導向的假設來實現。
假設 Ia. 將強化學習/獎勵價值納入戰斗識別功能將降低或不改變所提供的建議行動/識別的有效性。
假設 Ib. 將強化學習/獎勵價值納入戰斗識別功能將提高所建議行動/識別的有效性。
在過去幾年中,無人機群受到了廣泛關注,但對對抗性無人機群(即競爭性無人機群對無人機群游戲)的研究則較少。本文研究了團隊對團隊無人機空戰場景中的影響因素,闡明了交戰空間中兵力集中和對手分散的影響。具體而言,本文有以下貢獻:
1.戰術分析: 確定了在小到 2 vs.-2 和大到 10 vs.-10 的交戰中,明確協調戰術或分散、貪婪戰術的優勢條件,并研究了這些模式如何隨著團隊武器質量的變化而變化;
2.協調戰術: 介紹并演示了一種深度強化學習框架,該框架使智能體學會利用自身和隊友的情境來決定在什么情況下采用哪些預先設定的戰術,以及在整個交戰過程中與哪些隊友(如果有的話)進行協調;在 N 對 N 的交戰中,使用在此框架內訓練的神經網絡的智能體在與采用基線戰術的智能體團隊的交戰中的效能優于基線戰術,N 小到 2,大到 64;以及
3.生物啟發協調: 通過基于 Monte-Carlo 智能體的模擬發現,不僅要優先集中團隊力量對付威脅最大的對手智能體,還要通過部署較小的防御力量和防御高優先級威脅之外的低處罰威脅來保留一些資源,從而最大限度地利用防御團隊燃料庫中的剩余燃料。
圖 3.1: 模擬示例截圖,顯示兩隊飛機(藍、紅)進行 WVR 狗斗。
首先在第 2 章中研究了相關文獻,然后在第 3 章中探討了上述隱式和顯式協調團隊戰術、每種戰術有效的情況以及武器質量如何影響其性能。然后,在第 4 章中介紹并演示了一種 RL 方案的訓練和測試,該方案可根據智能體的情境與其隊友的情境成對切換戰術。在第 5 章中,演示了多旋翼生物啟發防御場景中優勢兵力集中的影響。最后,將在第 6 章中討論這些方法和實驗的局限性以及未來可能開展的工作,并在第 7 章中做出總結。
本文研究了利用同時探測原理的無人飛行器群進行自主監控的模型。該模型可指定探測感興趣區域內感興趣物體所需的傳感器數量;只有指定數量的傳感器同時掃描,才能探測到物體。該模型計劃在監控行動期間部署蜂群中的單個車輛,以保證監控的最高質量;質量以行動期間所覆蓋的感興趣區域的百分比來衡量。此外,假設監控是在復雜的行動區域(包括城市環境、建筑密集區或地形非常不平坦的山區環境)進行的,在這些區域可能會經常出現由障礙物或地形造成的遮擋。為解決問題,提出了基于模擬退火的元啟發式算法。該算法部署了一定數量的航點,從這些航點進行監控,最大限度地提高監控質量,并考慮到同步檢測原則。該算法通過一組基于典型監控場景的實驗進行了驗證。
當代武裝沖突不同于二十多年前的武裝沖突。當代武裝沖突的最大特點之一是戰場局勢多變,來自不同來源的信息不計其數,可靠性也各不相同。此外,當代大多數行動都是在特定環境下進行的,如城市和集結區(西伯利亞、烏克蘭)等,這大大限制了普通的偵察和監視方式。這種環境需要新的方法來收集和處理所有必要信息,以支持軍事決策過程(營級及以上)或部隊領導程序(連級及以下)。
指揮官決策的關鍵步驟之一是監視。可以說,監視是一個持續的過程,始于計劃和決策過程。它為指揮官的決策提供關鍵信息。通常,偵察工作由部署在敵區縱深的特別小組進行。顯然,部署這樣一個或多個小組對他們的訓練和準備要求很高。此外,來自這些小組的信息流是延遲的,而且不必精確,這可能會對任務產生巨大影響。在當代行動中,無人駕駛飛行器(UAV)等新技術被用于收集幾乎在線的信息,為指揮官的決策提供支持。無人飛行器的使用對決策的速度和質量產生了巨大影響。此外,這種信息收集方式還能節省人力資源。有關這一問題的更多信息可參見文獻 [1-7]。
本文提出了使用小型無人機群(sUAV)進行自主監控的模型。目標是通過無人機群中的傳感器覆蓋盡可能大的感興趣區域。每架無人機都部署在行動區的準確位置(航點),監控感興趣區域的一部分。該模型還允許在需要多個傳感器檢測某些感興趣物體的情況下使用(進一步稱為同步檢測)。此外,假設監控是在復雜的行動區(包括城市環境、建筑密集區或地形非常不平坦的山區環境)中進行,障礙物或地形造成的遮擋可能會經常發生。
無數科學著作都在關注如何將無人機群用于多種目的。要解決無人機群進行偵察或監視等復雜問題,有幾個課題非常重要。此類任務的路徑規劃是關鍵問題之一。Yao 等人[8]提出了一種基于 Lyapunov 導向矢量場(LGVF)和改進干擾流體動力學系統(IIFDS)的混合方法,以解決多架無人機三維合作路徑規劃中的目標跟蹤和避障問題。Lamont 等人[9]設計并實現了無人機群的綜合任務規劃系統。該系統集成了多個問題領域,包括路徑規劃、飛行器路由和基于分層架構的蜂群行為。Shanmugavel 等人[10] 研究了同時到達目標的路徑規劃問題。
與無人飛行器有關的另一個關鍵問題是其可靠性和故障保護。軍事指揮官必須做好在任何意外情況下完成任務的準備。使用無人機群執行監視任務是一個非常重要的問題,關系到關鍵信息的精確收集。目前還沒有專門針對這一主題的科學著作,但有幾篇有趣的論文值得考慮。Triharminto 等人[11] 開發了一種三維移動目標攔截避障算法。該算法被稱為 L+Dumo 算法,整合了改進的杜賓斯算法和線性算法。可以對這種方法進行修改,以減少無人機無法完成監視任務的影響。Sampedro 等人[12]重點研究了可擴展的靈活架構,用于無人機群的實時任務規劃和智能體到任務的動態分配。所提出的任務規劃架構包括一個全局任務規劃器(GMP),負責通過一個智能體任務規劃器(AMP)分配和監控不同的高級任務,而智能體任務規劃器則負責向蜂群中的每個無人機提供和監控任務中的每個任務。Sujit 等人[13] 解決了在由靜態、彈出式和移動式障礙物組成的障礙物豐富環境中運行的多架無人機從給定起始位置到目標配置生成可行路徑的問題。彈出式和移動式障礙物環境中的路徑規劃系統為解決無人機群在復雜環境(包括建筑密集區或山區地形)中執行監視任務時出現的故障提供了靈感。
異構多智能體系統為解決農業、軍事、裝配和倉庫自動化等不同領域的復雜問題提供了可能,否則單個智能體是無法解決這些問題的。要有效部署異構多機器人團隊,研究必須解決不同抽象程度的四個問題:任務規劃(是什么)、運動規劃(如何)、任務分配(誰)和調度(何時)。這些問題高度相互依存,先前的工作已經證明,利用這些問題的單個解決方案之間的協同作用的系統可以提高多機器人協調的效率和效益。
本文研究了在多智能體組隊應用中使用基于特質的模型來表示單個智能體,以及如何利用基于特質的建模來實現更穩健、更高效的多智能體聯盟組建解決方案。具體來說,我們研究了如何在聯盟組建算法中使用這些技術來回答任務分配、調度、運動規劃和任務規劃這四個問題。
我們的研究表明,利用基于機器人和任務特質建模的算法可以在異構多機器人團隊中實現高效的協調,并且在時間進度、分配質量和計算效率方面優于現有方法。本論文的貢獻如下:
創建一個建模框架,使現代任務分配算法能夠推理動態特征。通過使用基于轉換的建模框架,我們創建了對以往基于特質的建模技術的擴展,以更好地推理智能體的特質如何隨時間變化。
為異構多機器人系統開發基于時間擴展特質的任務分配和路徑規劃統一框架。我們引入了一種基于搜索的方法,用于基于特質的時間擴展任務分配和運動規劃,命名為增量任務分配圖搜索(ITAGS)。
整合任務規劃、任務分配、調度和運動規劃的新型多機器人協調問題的形式化和解決方案。我們形式化了一類新的多機器人協調問題,該問題融合了這些問題中的每一個,并提出了一種解決方案(圖形遞歸同步任務分配、規劃和調度(GRSTAPS))。
為 ITAGS 的動態變體創建框架,該變體能夠進行基于特征的任務分配修復: 我們對 ITAGS 進行了擴展,使用基于特質的動態時間擴展任務分配算法,如果智能體的特質或任務要求在執行過程中發生變化,該算法可以修復任務分配。
創建一個主動學習框架,用于學習多智能體任務分配問題的特質要求: 由于理解一個聯盟的特質與該聯盟在特定任務中的表現之間的關系可能具有挑戰性,因此我們提出了一種主動學習框架來學習任務與特質之間的關系。此外,我們還提供了一種新的時間擴展任務分配算法,該算法能夠優化學習到的質量模型。
圖 2.1: 顯示各種多機器人協調問題交叉點的維恩圖。
近年來,隨著機器人技術和電子技術的發展,無人駕駛飛行器(UAV)的體積越來越小,價格越來越低。由于無人飛行器易于購買和控制,人們開始越來越頻繁地使用它們。在本研究中,我們將從網絡的角度研究無人機群。一般來說,多架無人機可以組成一個蜂群網絡。每個無人機都是一個網絡節點。無人機之間的鏈接被視為網絡數據鏈路。在第 2 章中,我們將設計一種新穎的雙層 MAC: 我們將設計支持同步、并發多波束傳輸/接收的上層 MAC 層,以及與 802.11 兼容但充分發揮多波束天線優勢的下層 MAC 層;我們建議調整兩個 MAC 層的參數,以支持不同的任務優先級。在第 3 章中,我們為典型的機載網絡提出了一種吞吐量最優、異構(同時具有計劃通信和隨機通信)的介質訪問控制(MAC)策略。我們提出的 MAC 方案允許無人機使用上行/下行 MAC 方案與飛行器通信。我們的仿真結果表明,與傳統的 MAC 協議相比,性能有了顯著提高。在第 4 章中,我們針對機載網絡中的 MAC 設計問題提出了以下建議: (1) 長距離 Ku 波段鏈路。(2) 多波束天線。(3) 全雙工通信。我們的 MAC 設計具有 3ent 特性,即彈性、高效和智能。特別是,通過在每個波束中對流量進行編碼,它可以抵御干擾攻擊。此外,它還通過整合全雙工流量控制和多波束數據轉發實現了高吞吐量的通信。在第 5 章中,我們提出了一個采用 USRP-RIO 的多波束智能天線無線網狀網絡硬件測試平臺。我們測試了天線的方向性,實現了全雙工傳輸系統和中繼系統。此外,USRP還實現了MBSA的兩個重要特征CPT和CPR。
虛擬環境(VE)技術的最新進展,以及虛擬環境在治療和培訓個人方面的應用的增長,為在安全和豐富的環境中進行演練開辟了新的可能性。研究表明,虛擬環境可用于治療創傷后應激障礙(PTSD)患者,但很少有研究提出創建有效環境的良好指導原則。本研究旨在為系統設計提供參考,讓退伍軍人在實際進入該環境之前,在安全的環境中演練潛在的壓力體驗。我們調查了退伍軍人對虛擬環境特定設計組件的反應,以幫助開發對退伍軍人有效的系統。評估了對建議的六種刺激的反應,以及兩種類型的系統視角:第一視角和第三視角。采用的測量方法包括參與者的行為、主觀不適單元(SUD)以及包括心率、心率變異性和呼吸頻率在內的生理反應。對于患有創傷后應激障礙的退伍軍人來說,最有效的系統應該包括一套初始刺激,這些刺激可以進行配置,以便關注個人所經歷的特定創傷,或許還可以改變刺激強度。這些刺激應包括擁擠的房間和驚嚇噪音場景。第一人稱視角和頭戴式顯示器是首選的設計,除非是曾經有過暈動癥的人。這些人應該先在中性的第一人稱 VE 環境中接受網絡暈動癥測試,然后再在演練環境中接受測試。結果表明,創傷后應激障礙患者的心率反應與非創傷后應激障礙患者有明顯不同,創傷后應激障礙患者的 SUD 分數變化提供了有關個人對每種刺激的反應的有用信息。創傷后應激障礙患者在 VE 中也會表現出回避刺激等行為。本研究的結果表明,除虛擬戰斗區域外,其他虛擬環境也能引起創傷后應激障礙患者的行為、情緒和生理反應,因此應進一步研究這些類型的環境是否適用于創傷后應激障礙退伍軍人。
多目標跟蹤(MTT)在自主系統的制導、導航和控制中發揮著至關重要的作用。然而,它在計算復雜性、測量-跟蹤關聯模糊性、雜波和漏檢等方面提出了挑戰。
論文的前半部分探討了在移動平臺上使用攝像頭和光探測與測距(LiDAR)掃描儀進行多擴展目標跟蹤的問題。首先設計了一個貝葉斯框架,用于同時定位和映射以及檢測動態目標。開發了兩個隨機有限集濾波器來跟蹤提取的動態目標。首先,占格(OG)高斯混雜(GM)概率假設密度(PHD)濾波器聯合跟蹤目標運動狀態和目標形狀的改進占格圖表示。與傳統的 GM-PHD 過濾器相比,OG-GM-PHD 過濾器成功地重建了目標的形狀,并產生了較低的最優子模式分配(OSPA)誤差指標。第二種 MTT 過濾器(分類多重模型 (CMM) 標簽多重伯努利 (LMB))是為了利用與類別相關的運動特征而開發的。它融合了從圖像到點云的分類數據,并將物體類別概率納入跟蹤的目標狀態。這樣就能更好地實現測量與跟蹤之間的關聯,并利用與類別相關的運動和出生模型。CMM-LMB 過濾器在 KITTI 數據集和 CARLA 模擬器的模擬數據上進行了評估。在這兩種情況下,CMM-LMB 過濾器的 OSPA 誤差指標都低于多重模型 LMB 和 LMB 過濾器。
下半部分研究了使用窄視場和有限行動回轉率傳感器的 MTT 傳感器管理。空間態勢感知(SSA)的傳感器管理被選為一個應用場景。用于空間態勢感知(SSA)的經典傳感器管理算法往往只考慮直接回報。本論文開發了深度強化學習(DRL)智能體,以克服長期傳感器任務分配問題中問題規模的組合性增加。為了訓練和評估 DRL 智能體,開發了一個用于 SSA 傳感器任務分配的定制環境。DRL智能體采用基于群體訓練的近端策略優化方法進行訓練,其表現優于傳統的近視策略。
本文的主要重點是開發一種低成本、魯棒性和高效的合作定位解決方案,以幫助無人自主飛行器在全球定位系統缺失或性能下降的條件下進行導航。
首先,推導出固定翼無人機(UAV)和多旋翼無人機的完全可觀測性條件。創建了一個相對位置測量圖(RPMG),圖中的節點是車輛或已知特征(地標),它們之間的邊代表測量結果。利用圖論和線性代數概念,得出了可觀測矩陣最大秩的條件,并建立了可觀測矩陣秩與系統中可用測量值之間的關系。該分析條件的缺點之一是必須在所有時間時刻保持一個連通的 RPMG。因此,我們提出了一種離散時間可觀測性條件,即一個時間間隔內的 RPMG 的聯合必須是相連的。
接下來,將討論無人飛行器 (UV) 緊密協調和控制的一個基本問題。在各種應用中,飛行器的慣性位置并不重要。在這種情況下,車輛之間的相對姿態和方位對開發控制器非常有用。眾所周知,擴展卡爾曼濾波器(EKF)的性能非常出色,前提是它的初始化接近真實位置并能接收到測量結果。對于沒有任何全球定位系統(GPS)測量數據或網絡延遲嚴重(需要重新初始化濾波器)的長距離行駛車輛,已知先驗信息的假設是無效的。為了規避這些問題,我們開發了一種多假設卡爾曼濾波器(MHEKF),該濾波器在初始化過程中沒有先驗信息,這意味著相關的不確定性非常大。
最后,解決了地面車輛的分布式合作定位問題。集中式合作定位需要大量計算。我們開發了一種分布式合作定位算法,使組內的每輛車都能估計自己的慣性狀態。該算法是為自主地面車輛開發的,在仿真中僅使用測距數據。
圖 1.1:合作定位的相對位置測量圖,其中塔作為地標(已知興趣點),不同的 UV 相互合作。
艦船集成項目辦公室(PMW760)對其權限范圍內所有無人系統都能使用的統一、有凝聚力的通信協議的前景很感興趣。數據分發服務(DDS)是使用點對點鏈路進行這種內聚通信的主要候選協議。本論文的目的是評估 DDS 在符合海軍用例標準的網絡架構中的性能。提出了一個包含衛星通信(SATCOM)和無線保真(WiFi)鏈路的網絡架構,以測試 DDS 在場景設置的限制下在網絡節點之間執行內聚通信的能力。使用網絡模擬器 Mininet 來設置網絡參數,并研究各個點對點鏈接在不同數據樣本大小下的吞吐量和延遲性能。使用實時創新 Perftest 軟件工具進行模擬,測量不同網絡配置(理想、抖動和多流)下的吞吐量和延遲。在理想配置和抖動配置下,對可靠通信和最佳努力通信以及實施和未實施 DDS 安全性進行了模擬。還對多流量配置進行了模擬,以評估同時多流量數據(在網絡節點內并行運行的流量數據)如何爭奪網絡資源并影響性能。
建議的網絡架構如圖 7 所示。任務指揮官駐扎在總部,對由現場指揮官、支援艇、拖車和兩架無人機組成的任務單元實施指揮和控制。場景設置如下:
多種類無人駕駛飛行器(UAV)的使用越來越重要。因此,人類和機器人之間的互動及其互動設計變得越來越重要,特別是在戰場上的軍事偵察。然而,越來越大的無人機蜂群導致許多需要解決的挑戰,例如,具有高動態的復雜情況增加了對用戶的要求。在這項工作中,研究了以應用為導向的人類與蜂群互動的展示方案,其重點是作戰管理系統中的蜂群。在一項文獻調查中,確定了潛在的應用和當單個操作者監控作為高度自動化系統的大型蜂群時可能出現的挑戰。此外,還確定了已經存在的設計準則。基于這些結果,為獲得全面的態勢感知,對蜂群的可視化的四種不同布局進行了原型設計。
根據收集到的文獻,定義了四種群組可視化的布局。這些都是在原型人機界面中實現的。可視化的重點是戰斗管理系統中的蜂群。人機交互是通過傳統的顯示器和鼠標/鍵盤或觸摸控制實現的。首先,介紹了四個布局,之后解釋了不同的組件。
基于蜂群的顯示器將整個蜂群作為一個單元來顯示,而不是每個智能體單獨顯示(見圖2-2)。用戶通過高級命令控制整個蜂群,蜂群則自行組織。仍然可以從蜂群中分離出個別的智能體,或發送個別的命令;這些可以單獨顯示或啟用。