近十年來,無人機(UAV)在軍事對抗、災害管理、氣象監測及物流配送等領域的應用持續深化。隨著無人機從受控環境轉向真實場景,外源性及內源性"不確定性"因素深刻影響其任務規劃與決策機制。在無人機需求激增的背景下,各國政府加速完善監管體系,亟需設計能高效管控空域交通的"監視安防系統",尤其在管制空域。基于此背景,本論文聚焦空域安全問題,在不確定環境下提供兼顧"目標捕獲"與"碰撞規避"的安全規劃解決方案。
本文首先提出多智能體協同捕獲目標的空域安防策略。針對"多追捕者-多逃逸者"問題的計算復雜性,采用基于博弈幾何特征的啟發式算法,開發計算高效的任務分配機制。研究從雙追捕者單逃逸者模型切入,通過解析最優追捕策略推導出獨立于逃逸策略的"動態分配算法"。該算法進一步擴展至任意數量、異速智能體的多追捕多逃逸場景,實現追捕方協同作戰效能最大化。
隨后引入隨機干擾因素,運用"前向可達性分析"與"協方差控制"理論解析隨機流場中的追逃博弈。首次在約束博弈框架下研究對抗場景中的"高斯分布導向"問題,通過迭代技術數值求解協方差控制方程。所提方法成功應用于導彈"末段制導"場景,并延伸至外源隨機流場追逃博弈:基于線性反饋控制策略,在參與者標稱解空間構建"機會約束協方差博弈"模型。線性/非線性流場仿真驗證表明,追捕方可有效引導博弈趨向捕獲狀態。
最終聚焦參數化不確定性研究。首先構建參數不確定條件下的最優控制框架,引入"敏感度函數"與"共態變量"技術增強參數擾動魯棒性。利用敏感度函數解決含"動態障礙物"(運動模型不確定)環境的安全路徑規劃問題,進而將該方法擴展至類"戰爭迷霧"態勢的博弈論建模。
圖1.1:(a)"極速航空"是亞馬遜開發的未來物流系統,通過無人機(UAV)在30分鐘內將包裹安全送達客戶;(b)無人機攔截器追蹤侵入管制空域的無人機,使用抓捕網實施捕獲。基于多無人機協同的反無人機技術,是構建未來智能空基平臺的解決方案之一。
自主無人機作為革命性新興技術,正重塑基礎設施檢測、軍事偵察與警務監控領域。然而當前主流平臺普遍存在重量大、成本高、操作復雜等局限,使其難以應用于密集城區等場景——政府法規嚴禁重型無人機在人群附近自主運行。重量主要源于機載計算資源需求,這些資源用于運行提供態勢感知的關鍵計算機視覺算法。本論文闡述如何通過邊緣計算在輕量級無人機上實現自主性:將高負載計算任務卸載至近端服務器。論證該技術可使自主飛行器在可接受的性能損耗下更接近FAA監管上限運行。同時揭示新型操作系統如何通過統一編程接口整合碎片化無人機生態,并展示其在商用現貨硬件上構建異構協同無人機集群的能力。
無人機(Unmanned Aerial Vehicles)作為顛覆性技術已廣泛應用。民用領域實現基礎設施檢測、農業監測、林火防控及警務監控等任務的安全低成本執行;軍事領域則成為前沿偵察的關鍵工具。當前多數場景需配備持續操控無人機的人類飛手。近年研究致力于推動全自主飛行無人機發展——美國國家標準與技術研究院(NIST)將其定義為"預編程無遙控飛行,含響應實時觀測的特定任務動作"[68]。該技術具雙重優勢:降低人力成本與注意力占用,并支持無人機集群協同任務執行。集群技術為軍民領域革命性任務開啟新可能[22]。全自主無人機的核心驅動力在于完成主動視覺任務[6,93],要求無人機依據場景解析實時響應,例如自主降高"近距離觀察"變化場景后返航繼續監控。這類任務雖范圍窄,卻構成目標追蹤、障礙規避等基礎操作的核心特征。
重量是制約全自主無人機應用的根本障礙。更高智能需更強算力(導致更重機載設備)與更豐富傳感系統。例如機載GPU需配套散熱器、冷卻風扇及大容量電池等冗長后勤保障鏈。重量增加使民用空域監管更嚴苛:自2021年起,FAA僅預授權總重低于250克的無人機在人與車輛上空飛行[50]。重型無人機需額外審批并滿足防撞防墜落條件。即便超重,輕型機在城市超視距(BVLOS)自主飛行的獲批難度也遠低于重型機。該監管已成民用項目的重大阻礙。軍事場景中重量同樣關鍵——重型飛行器使后勤復雜化并常需專屬運輸載具[73]。
自主無人機推廣還受限于軟件可移植性、操作門檻、任務通用性及單機成本。雖存在統一編程生態嘗試,廠商專屬SDK開發仍是常態,導致代碼移植困難并割裂開發者生態。現有全自主無人機需用戶具備豐富飛行經驗保障安全,大幅抬高操作門檻。多數產品缺乏通用性,無法執行制造商預設范圍外的任務。當前自主無人機單機成本數倍于手動操控機型,嚴重削弱集群操作經濟性——個體損毀在集群任務中屬預期風險。
本研究核心貢獻SteelEagle系統,通過邊緣計算與模塊化自主架構突破上述瓶頸。邊緣計算使無人機通過低延遲高帶寬無線網絡,將計算密集型實時任務卸載至近地服務器(通常部署于基站附近),大幅降低機載硬件需求。同步開發的SteelEagle操作系統具備硬件無關性、開發者友好性與任務中心化特征,關鍵設計采用商用現貨(COTS)[49]無人機及計算/通信載荷。該方案避免硬件定制(如機體改裝)與特權軟件修改(如設備"越獄"),降低成本并提升可及性,同時規避FAA/FCC再認證需求。但COTS方案也帶來新挑戰:輕量級COTS通信設備的熱限問題引發延遲、幀率與質量風險,迫使系統智能管理通信、計算與預測環節。
論文結構如下:
? 第二章梳理自主無人機發展史及相關研究,闡明SteelEagle的技術基礎
? 第三章探討輕量COTS無人機邊緣連接方案,解析設計挑戰并制定機載通信載荷選型標準
? 第四章呈現SteelEagle系統設計全貌,對比現役系統優劣,演示自主任務執行并附性能分析
? 第五章推出改進型邊緣通信載荷,論證其縮短系統"觀察-調整-決策-行動"(OODA)循環周期,顯著提升自主性能
? 第六章建立基準測試體系,量化邊緣計算與全機載方案在關鍵任務中的性能表現,聚焦OODA循環在高延遲低吞吐場景下的變化規律
? 第七章通過驅動架構實現SteelEagle在多硬件平臺與控制模式的部署,演示系統自適應能力并奠定斷聯操作基礎
? 第八章總結研究成果并展望未來方向。
隨著自主機器人能力提升并日益融入社會生活,用戶交互方式、機器對人的感知機制及其對人類意圖的理解能力成為關鍵課題。當用戶需同時操控多臺機器人時,這一挑戰的復雜性將顯著增加。
自主作業中常需人工介入,尤需復雜決策或存在安全隱患的場景。因此,多智能體系統的人機交互方法成為重要研究方向——這類交互應兼具直觀性、高效性與安全性。本研究提出新型"集群人機交互界面(HSI)",通過手勢控制與觸覺反饋實現在密閉空間內操控四旋翼無人機群。該界面在保障操作者安全的同時,顯著降低集群控制的認知負荷。
人機交互界面(HRI)旨在優化人機通信機制,以直觀友好方式增強用戶對機器人的指揮協作能力。核心挑戰在于賦予移動機器人系統環境中的用戶定位與交互能力:定位需獲取用戶相對于機器人的位姿(位置與朝向),這對近距離交互或共享空間導航至關重要。我們提出創新方法,可實時獲取用戶位姿及其他人機交互所需人體參數。
另一挑戰在于將HRI與HSI范式擴展至戶外場景。不同于受控實驗室環境,戶外涉及諸多變量(如多變氣象條件、靜態與動態障礙物混合)。本論文設計便攜式集群人機交互界面,支持操作者在戶外操控多智能體系統。該便攜HSI采用智能雙目鏡形態,用戶通過其選定戶外區域并分配任務,使多智能體系統在目標區域執行作業。此系統開創了多智能體作業新模式:在利用自動駕駛設備執行視距操作時,既能融合用戶實地知識,又能保持其態勢感知能力。
隨著無人機(UAV)技術日趨成熟,無線生態系統正經歷前所未有的范式轉變。這類空中平臺因其快速靈活部署、高性價比及與地面節點建立視距(LoS)鏈路的優勢,在多樣化應用中展現出獨特價值。然而,將無人機整合至現有蜂窩網絡的實際效益,需通過全面探索內在權衡空間方能準確表征。本研究核心目標即基于無人機特性,對無人機蜂窩網絡展開詳細系統級分析。
靜態網絡架構分析
首先聚焦三維(3D)雙跳蜂窩網絡的靜態場景性能表征,其中地面基站(BS)與無人機協同服務地面用戶設備(UE)。具體而言,UE可通過接入鏈路直連地面基站,或通過無人機中繼(聯合接入與回程)間接連接至地面基站。采用第三代合作伙伴計劃(3GPP)開發的實用模型,對基站與無人機天線輻射方向圖進行真實建模,并引入包含視距與非視距鏈路的空地傳輸概率信道模型。基于最大功率接入策略,研究放大轉發(AF)與解碼轉發(DF)中繼協議下的網絡性能。運用隨機幾何工具,解析3D場景中最近(服務)無人機與原點間距離及天頂角的聯合分布,構建接收信號干擾噪聲比(SINR)分布的核心數學框架,推導AF與DF協議下覆蓋概率的精確表達式。針對基站下傾天線導致回程鏈路衰弱的問題,提出并分析專用于回程的上傾定向天線配置,通過大量仿真驗證無線回程無人機搭配定向天線的優越性。
移動網絡模型研究
其次轉向移動場景,研究無人機基站服務地面用戶的四大經典移動模型:直線(SL)、隨機駐停(RS)、隨機游走(RW)與隨機路點(RWP)。其中SL模型參考3GPP無人機部署與軌跡仿真模型,其余模型則在真實性與可解析性間取得平衡。基于最近鄰接入策略,定義兩種UE服務模式:UE獨立模型(UIM)與UE依賴模型(UDM)。UIM中服務無人機與其他無人機遵循相同移動模式,UDM中服務無人機則飛向目標UE并懸停其上空。提出統一方法表征各移動與服務模型下的無人機點過程,推導典型UE平均接收速率與會話速率的精確表達式。運用變分法證明:當各無人機移動獨立同分布時,簡單SL模型可為其他通用移動模型(含曲線軌跡)的性能提供下界。
切換概率解析
延續移動場景分析,研究初始位置服從齊次泊松點過程(PPP)的無人機蜂窩網絡切換概率。假設所有無人機遵循SL模型沿隨機方向直線運動,考慮同速(SSM)與異速(DSM)兩種場景。基于最近鄰接入策略,推導兩種移動場景的切換概率。對于SSM,通過建立與單層地面蜂窩網絡(靜態基站、移動UE)的等效性,計算精確切換概率;對于DSM,通過刻畫無人機空間分布演化推導切換概率下界。
空地信道特性研究
完成網絡級分析后,聚焦空地無線信道獨特屬性。首先基于萊斯多徑信道模型,研究無人機晃動對信道相干時間的影響,分析單無人機(SUS)與多無人機(MUS)場景。針對兩種場景,采用維納與正弦隨機過程模擬晃動,推導信道自相關函數(ACF)進而計算相干時間。研究表明:即使微弱晃動也會導致相干時間快速衰減,增加信道追蹤與可靠鏈路建立的難度。
損傷感知統一信道建模
最后構建綜合考慮晃動與硬件損傷的空地統一信道模型。其中晃動由無人機隨機物理波動引發,硬件損傷源自收發端射頻非理想特性(如相位噪聲、I/Q失衡、功放非線性)。采用維納與正弦過程建模晃動影響,硬件損傷則建模為乘性與加性失真噪聲過程(涵蓋寬平穩與非平穩特性)。嚴格推導信道ACF,系統分析四項關鍵指標:功率延遲分布(PDP)、相干時間、相干帶寬及失真噪聲過程的功率譜密度(PSD)。結合合理參數驗證發現:高頻段下即使微小晃動也會嚴重降低相干時間,導致高頻段空地信道估計極其困難。
無人機(UAV)被視為搜救行動、災害救援、遙感測繪、空中監視與安防領域的重要工具。無人機輔助通信網絡憑借其成本效益與靈活性,作為能提供新功能與機遇的網絡基礎設施正獲得廣泛關注。除了支持復雜多機任務的互聯互通,無人機網絡還可部署于偏遠地區與極端環境提供連接服務,并根據可變需求對移動網絡覆蓋進行補充擴展。然而,利用這種靈活性需應對無人機網絡固有的動態性特征——包括高度移動性與資源受限性。通過軟件定義網絡(SDN)與網絡功能虛擬化(NFV)實現的網絡軟件化,能借助集中化可編程性與虛擬化網絡功能,為無人機網絡提供靈活自適應的控制與重構能力。
本論文通過識別軟件化為無人機網絡帶來的潛在增益——這些增益在先前研究中尚未被充分探索——展開對無人機網絡軟件化的研究。為實現SDN與NFV在無人機網絡中的應用,我們提出并描述了一種軟件化無人機網絡架構。此外,針對SDN架構的核心要素——SDN控制器的關鍵挑戰展開研究,該控制器通過邏輯集中式控制器與可編程網絡節點間的接口實現網絡可編程性。為適應網絡移動性與連接約束,我們提出部署與分配嵌入式SDN控制器的方案,確保在網絡拓撲動態變化及地面基礎設施可能不可用時控制功能的持續運行。同時,我們充分利用NFV提供的靈活性。需開發新型部署與編排方案,以有效管理由虛擬網絡功能(VNF)定義任務與網絡功能的無人機網絡。為此,我們描述了受益于此靈活性的適用場景,并提出高效部署與管理基于NFV的無人機網絡方案。
本文的貢獻如下:
軟件化增益評估:為驗證無人機網絡軟件化的合理性,我們通過建立軟件化無人機性能增益評估模型展開研究。該模型模擬由多架無人機組成的系統執行不同需求任務的場景,對比有限或非軟件化系統,分析多種情境下網絡重構能力的效果。
軟件化無人機網絡架構:提出支持無人機網絡軟件化的架構體系,描述實現網絡部署與重構所需的組件與功能,并解決現有技術限制。該架構包含以下核心創新:
SDN控制器部署方案:針對無人機快速移動特性及偏遠地區無法部署地面SDN控制器的挑戰,提出空中控制器部署方案。該方案在容量與通信約束條件下,以最少無人機作為控制器,并通過靈活設計確保節點-控制器及控制器間連接。進一步提出動態調整機制,使空中控制器能追蹤拓撲變化的無人機網絡節點,同時限制控制器移動以減少拓撲調整的時間與能耗。
基于NFV的無人機網絡:利用NFV在無人機計算設施上部署多樣化網絡與處理功能,實現靈活網絡規劃、資源高效利用及動態重構能力。該特性對缺乏計算基礎設施的偏遠地區任務尤為重要,支持數據就地采集、處理與傳輸。我們展示需在任務區不同位置完成數據捕獲、處理與交付的適用場景,將網絡或任務功能表達為由系列虛擬網絡功能(VNF)構成的服務功能鏈(SFC),并提出聯合無人機網絡部署與SFC布局方案。該方案構建覆蓋任務區域的最小化無人機網絡,分配充足資源滿足VNF及其流量需求。為適應網絡移動性,設計動態編排機制,在無人機移動引發拓撲變化時維持網絡連接與SFC需求,同時限制因反復移動與調整導致的網絡中斷與開銷。
后續結構安排如下:第二章綜述無人機網絡的應用場景與挑戰,介紹軟件化技術(SDN與NFV)及其在通信網絡中的通用性,探討無人機網絡軟件化的動機,梳理現有SDN/NFV與無人機網絡融合的研究進展與局限。第三章量化無人機網絡軟件化增益,提出多任務場景下的評估模型,分析不同情境下的重構性能提升。第四章闡述支持可編程性與重構能力的軟件化無人機網絡架構,包含空中SDN控制與NFV網絡部署的創新組件。第五章專注SDN控制器部署,分析無人機網絡與地面控制器斷連時的挑戰,提出高效可動態調整的空中控制器部署方案并進行性能評估。第六章聚焦NFV與無人機網絡融合,討論應用動機與受益場景,描述并評估NFV網絡初始部署方案與動態編排流程。第七章總結研究成果,提出結論并展望未來研究方向。
法國、俄羅斯、英國、美國、中國等核武器國家日益認識到將人工智能(AI)融入核武器指揮、控制和通信(NC3)系統的意義。盡管風險和隱患已得到廣泛承認,但在瞬息萬變的核領域獲得戰略優勢的誘惑,加上擔心落后于競爭對手的人工智能創新,可能會推動這些國家競相將人工智能技術整合到可靠性尚待驗證的 NC3 系統中。
人工智能并不是一個新名詞,核武器國家已經將屬于這一范疇的技術整合到 NC3 系統中。但是,與當前基于規則的模型相比,當今最先進的基于深度學習的人工智能模型的可能集成帶來了一系列明顯不同的、更大的挑戰。人們對功能強大的大型模型在影響核武器決策等關鍵功能方面的可靠性和適用性存在重大擔憂。
歐洲領導力網絡(ELN)開展的題為"研究人工智能對戰略穩定的影響:歐洲和五核國的觀點"。在美國國務院軍控、核查與合規局的支持下,該項目確定了核武器國家如何在其 NC3 系統中使用和尋求使用人工智能技術,并探討了這種整合的反響。
報告探討了當今先進人工智能系統的固有風險,揭示了該技術不同分支的特點和風險。報告為通用風險評估框架奠定了基礎,以分析考慮整合的模型,并為暫停將高風險人工智能系統整合到 NC3 奠定了規范和門檻基礎。
在一系列秘密對話中,來自核武器國家的專家比較了他們對在 NC3 系統中使用人工智能的風險和益處的評估,以期建立防止危機情況下核升級的防范措施。
該項目的核心發現包括
核武器國家將人工智能納入 NC3 系統的方式各不相同,反映了特定的核條令、軍事文化、軍民關系和道德考量。不過,它們都看到了人工智能在提高態勢感知、早期威脅探測和決策支持方面的價值。
所有核武器國家都強調人類監督核決策的重要性。它們都同意讓 “人在回路中 ”的概念,但不清楚它們的解釋在多大程度上有重疊。
整合尖端人工智能模型,如大型語言模型,由于其不透明性和不穩定性,對戰略和危機的穩定性構成了特殊風險。
核武器國家應同意迅速暫停整合高風險的人工智能模型。可在本報告介紹的風險分析系統基礎上對暫停措施進行詳細說明,以提供一個評分系統,對高風險人工智能系統進行分類。
對于不具有同樣高風險的人工智能模型,第一軌道層面的雙邊倡議應圍繞保留人類對核系統的控制展開。與此同時,第二軌道對話應深入探討技術問題,如確保人類監督的實用方法。
近年來,人工智能經歷了巨大的發展和成熟,但自主系統在各種未知環境中的應用歷來困難重重。DARPA 正尋求通過 "地下挑戰 "項目改變這一現狀,為機器人專家提供在復雜和高風險的地下場景中為民用和軍用急救人員提供支持的機會。地下領域面臨著諸多挑戰,如有限的通信、多樣的拓撲和地形以及感知能力下降等。MARBLE 團隊提出了一種自主探索未知地下環境的解決方案,其中協調智能體搜索感興趣的人工制品。該團隊提出了兩種導航算法,一種是基于度量拓撲圖的規劃器,另一種是基于連續前沿的規劃器。為促進多智能體協調,各智能體共享并合并新的地圖信息和候選目標點。智能體在環境中的不同點部署通信信標,擴大了共享地圖和其他信息的范圍。機載自主功能減輕了人類監管人員的負擔,使智能體能夠檢測和定位人工制品,并在已建立的通信網絡之外進行自主探索。考慮到這一挑戰的規模、復雜性和節奏,吸取了一系列經驗教訓,其中最重要的是,在具有代表性的環境中進行頻繁而全面的實地測試是快速完善系統性能的關鍵。
要在 DARPA 地下挑戰賽中取得成功,智能體必須具備多種不同的能力。為了得分,它們必須能夠檢測和分辨各種人工制品,在環境中相對于固定的世界幀進行定位,并將這些信息反饋給基站,以便最終提交給 DARPA。RGB 圖像由 YOLO(Redmon 等人,2016 年)處理,YOLO 會在物體周圍生成一個邊界框,并估算出置信度分數。通過將邊界框的中心與相應的對齊深度測量值進行融合,可獲得工件的局部投影。然后,利用機器人當前的狀態估計值,將投影轉換到固定的世界幀中。在不同階段,我們學到了很多關于開發靈活物體檢測系統的知識,我們將在第 9.1 節中討論這些知識。
每個機器人都要進行物體融合,以匯總該機器人的單個檢測結果。基站會將所有機器人的工件報告合并為一份報告。在人工提交之前,位置和類型相似的人工制品會被合并。人工監督員可以查看文物報告圖像以及機器人的地圖和里程計,從而在提交最終報告前對文物位置或分類進行人工修正。文物報告通過可部署的 WiFi 網狀網絡傳輸,同時還傳輸地圖片段、全球機器人位置和其他用于多智能體協調的有用信息。基站并不充當中心智能體,但它可以像其他智能體一樣在機器人之間傳遞信息。
制圖、導航和工件定位等關鍵的自主進程都依賴于準確可靠的狀態估計。車隊一直依賴于谷歌的 Cartographer(Hess 等人,2016 年),它使用激光雷達掃描匹配進行局部里程測量,并通過全局環路閉合進行掃描到子地圖的優化,以校正漂移。盡管其他激光雷達-慣性 SLAM 算法具有更高的精度,如 LOAM(Zhang 和 Singh,2017 年),但 Cartographer 還是因其實時閉環漂移校正、易用性和詳盡的文檔而被選中。
優化目標點選擇和到達目標點的路徑對于提高探索效率至關重要。我們的團隊開發了定制解決方案,用于選擇新的目標點,并根據每個電路環境的預期拓撲結構導航到這些目標點。隧道賽道采用了基于圖形的導航和探索策略。城市賽道和洞穴賽道的環境在空間上比隧道環境更為復雜,因此我們開發了一種更全面的基于前沿的探索算法。第 4 節和第 5 節將詳細討論這些解決方案。為了繪制環境地圖,地面機器人使用開源軟件包 octomap(Hornung 等人,2013 年)生成世界的概率占位網格表示法。為了支持我們的多智能體解決方案的需要,我們在 octomap 軟件包中增加了地圖合并等功能,第 3 節將對此進行討論。
其中一些流程,如定位、全局規劃和偽裝檢測,只需稍作調整即可同時用于空中和地面平臺。但是,低級子系統是單獨設計的。空中飛行器使用 Voxblox(Oleynikova 等人,2017 年)生成環境的歐幾里得符號距離場表示,這對于生成與障礙物有足夠間隙的路徑非常有用。除了水平 Ouster 激光雷達之外,無人機還使用了向上和向下的深度傳感器進行測繪。這種設置增加了垂直方向的體積信息增益,這對穿越豎井和樓梯至關重要。無人駕駛飛行器還有一個專門為 3D 導航開發的不同的本地規劃解決方案,該方案以深度圖像空間內的規劃為基礎。直接在傳感器幀中檢測障礙物在很大程度上可以避免測繪和定位的不確定性,從而在沿路徑飛行時提供額外的安全保障。第 6 節將對此進行更詳細的討論。
圖 3. 地面平臺、空中平臺和基站軟件管道概覽。綠色為數據源,紫色為工件檢測流程,橙色為定位和繪圖流程,紅色為導航流程,藍色為操作流程。
過去幾十年來,在安全、監視、情報收集和偵察等許多領域,對目標跟蹤(OT)應用的需求一直在增加。最近,對無人駕駛車輛新定義的要求提高了人們對 OT 的興趣。機器學習、數據分析和深度學習的進步為識別和跟蹤感興趣的目標提供了便利;然而,持續跟蹤目前是許多研究項目感興趣的問題。本文提出了一個系統,實現了一種持續跟蹤目標并根據其先前路徑預測其軌跡的方法,即使目標在一段時間內部分或完全被隱藏。該系統分為兩個階段:第一階段利用單個固定攝像機系統,第二階段由多個固定攝像機組成的網狀系統。第一階段系統由六個主要子系統組成:圖像處理、檢測算法、圖像減法器、圖像跟蹤、跟蹤預測器和反饋分析器。系統的第二階段增加了兩個主要子系統: 協調管理器和相機控制器管理器。這些系統結合在一起,可以在目標隱藏的情況下實現合理的物體連續性。
近幾十年來,學術界對無人駕駛飛行器(UAV)的關注明顯激增。先進的無人飛行器能夠執行復雜的飛行動作、在復雜的空間內飛行,并在不斷變化的環境中執行復雜的任務,因此其發展備受關注。這些環境包括采礦、城市搜索與救援 (USAR)、軍事行動等部門,以及包括維護和修理地下基礎設施在內的一系列工業應用。進入密閉空間并在其中作業的迫切需求已成為迫使研究人員推進無人機技術的驅動力。這些進步旨在克服與在受限環境中工作相關的復雜性,解決無人機當前的局限性,同時提高其整體性能能力。
在本論文中,介紹了一套相互關聯的工具,旨在使無人飛行器能夠在受限空間內自主規劃飛行動作。為實現這一目標,本文提出了一種改進的 "教學-重復-再規劃"(I-TRP)迭代策略。該解決方案是一種離線-在線混合方法,包括三個階段戰略中的四個主要模塊。根據手工繪制的路徑(教學階段)和感知到的環境幾何特征,開發了具有新穎占用檢查特性的先進 3D 飛行走廊。此外,結合生成的飛行走廊,還開發了一種通用全局路徑規劃算法 Field D* 的增強版,以通過離線流程(重復階段)制定出近乎最優和平滑的拓撲等效路徑。最后,通過順序凸優化過程(重新規劃階段),制定出具有在線碰撞檢查和避障功能的局部規劃算法。利用無人飛行器機載傳感器捕捉到的地形信息,這種局部規劃可生成后優化的動態可行路徑。
后置參考路徑被用于制定一套包含飛機位置、姿態、速度和加速度的制導指令,以引導無人機飛行在生成的飛行走廊(可能具有復雜的幾何特征)內飛行。所開發的路徑跟蹤方法是通過使用非線性模型預測公式制定的。
所開發的 I-TRP 策略可引導自主無人機在幾乎任何結構化或非結構化環境中到達目的地,這些環境具有不同程度的幾何復雜性,從開放的自由空間到高度雜亂的環境不等。仿真結果表明,在適合實時飛行導航的高效計算過程中,所開發的 I-TRP 策略的能力優于現有機制。
多智能體機器人技術有望塑造工業的未來,有可能改變日常生活的許多方面。在未來十年中,它們預計將對運輸系統、軍事應用(如偵察和監視、搜救行動或太空任務)產生影響,并為急救人員提供支持。
在機器人領域最新發展的推動下,隨著新一代多智能體機器人系統變得更加智能、精確,應用領域也更加多樣化,本論文將為這些系統的發展做出貢獻。但是,為了實現這些目標,組成合作機器人系統的各個智能體需要在確保準確性和保留執行多樣化任務能力的同時,對它們所能完成的任務進行專業化。
本論文在考慮單個智能體專業化能力的特定背景下,探討了蜂群機器人技術中的任務分配問題。基于每個智能體都擁有專門的功能能力,以及分布在周圍環境中的預期任務提出了特定要求的假設,提出的任務分配機制在兩個不同的空間中制定。首先,團隊成員專業化的初級形式被表述為嵌入智能體動力學控制空間的合作控制問題。其次,定義了智能體專業化的高級表述,在專用的專業化空間中估計單個智能體的任務分配概率,這是本論文對蜂群機器人領域的進步和實踐的核心貢獻。
在專業化空間中制定的原始任務分配過程經歷了四個發展階段。首先,從概念上引入了任務特征識別階段,利用嵌入在智能體中的傳感層的輸出來驅動所提出的任務分配方案。其次,制定匹配方案,將每個智能體的專業能力與相應的檢測任務進行最佳匹配。在這一階段,智能體專業化的一般二進制定義是任務-智能體關聯的基礎。第三,將任務-智能體匹配方案擴展為創新的基于概率專業的任務-智能體分配框架,以推廣這一概念并挖掘智能體專業化考慮的潛力。第四,根據智能體的機械、物理結構和嵌入式資源對其專業化進行調制定義,進一步完善了總體框架。此外,還對原有框架進行了擴展,并引入了優先級層,以提高系統對復雜任務的響應能力,這些復雜任務的特點是基于對多個類別的識別。
在模擬和實際實驗中對所提出的基于專長的任務分配方法進行了實驗驗證,并結合潛在應用對結果進行了介紹和討論,以證明所提框架的有效性和效率。
這項工作旨在填補以往解決機器人群個體專業化問題的工作中的技術空白。本論文的成果通過開發一個創新框架,利用傳感能力來支持智能體之間專業化的概念化和實施,從而推動了蜂群機器人領域的發展。重點在于定義單個智能體的專長,并根據每個任務的特定約束條件,將其與這些單個智能體所要掌握的任務相匹配。為此,本研究打算回答以下研究問題:
問題 1:一群智能水平相對較低的機器人如何完成復雜的任務,這些任務需要單個機器人代理的專業化?
過去二十年來,多智能體系統的合作編隊控制受到了研究人員的極大關注。本論文以文獻綜述(第 2 章)中提到的方法為基礎,提出了一種解決方案,以填補機器人團隊中單個成員專業化方面的研究空白。本論文的重點是通過利用智能體的非同質性來增強蜂群的能力。為此,本論文擴展了合作蜂群的概念,并提出了一個嚴格的流程來利用單個智能體之間的專業異質性。
為了回答問題 1,我們首先進行了一項早期調查,以驗證這一概念。這一過程將機器人團隊工作空間的不同區域定義為分配給不同任務的獨立區域。所開發的解決方案可讓機器人順利安全地切換位置,并根據每個訪問區域要執行的特定任務動態調整整體隊形。它定義了如何在每個區域管理機器人群的編隊。作為一種初級的專業化形式,當智能體從一個區域轉移到另一個區域時,該框架會將智能體的領導角色從一個智能體切換到另一個智能體。在第一階段的研究中,假定一個特定的智能體(即蜂群中的一個成員)是每個區域中唯一專門執行領導任務的智能體。在任務完成之前,該智能體被指定為相關區域的專門領導者。第一部分研究的詳細情況將在第 3.4 節中報告。
問題 2:能否對最初的方法進行升級,讓專業化個體從環境中的自動目標識別中獲益,能否讓智能體之間的合作變得足夠穩健和靈活,以便在發現目標后自動將適當的專業化智能體分配到相應的任務中?
為了回答這個問題,我們進一步擴展了原有的協調系統,用于在專用機器人之間分配基于任務的領導權。通過對分布在機器人群工作空間中的專業化影響區域的定義進行演化,對問題進行了重新表述。受早期編隊方法的啟發,出現了一種有趣的解決方案。從使用機載傳感器自動識別工作區目標的假設出發,選擇有資格執行識別任務的智能體的過程應逐步經歷三個基本狀態,分別稱為搜索狀態、任務狀態和執行狀態。這種方法還可擴展到目標移動時的動態影響區域,以及多個任務共享同一區域時的動態影響區域。這更好地反映了移動機器人的實際干預場景。這方面的工作將在第 3.5 節中報告。
問題 3:為了改進蜂群的管理,能否根據智能體的專業化程度,在一定程度上適合響應給定任務的概率匹配機制中,適當定義和制定每個智能體的專業化功能?
為了解決這個問題,可以利用基于概率的建模來完善用于實現單個智能體角色專業化的框架設計。建立這樣一種智能體行為的概率表征,可以形成一種可擴展的機制。后者支持自動化流程,能夠處理任務和專業化定義中的不確定性,并應對任務約束和智能體能力之間的不完美匹配。所提出的智能體選擇方案是根據任務識別的置信度和特定智能體滿足任務特定要求的概率來制定的。所提出的基于專業的任務分配方案旨在根據所識別的任務約束條件,計算蜂群中各個智能體的匹配適合度,即任務-智能體專業匹配概率。本框架的開發過程詳見第 4.3 和 4.4 節。
問題 4:提議的框架能否應用于實際系統?
為了證明所提方法的有效性及其在現實世界中的應用潛力,我們從兩個方面對其進行了測試。首先,在仿真中對所提出的框架進行驗證,以證明其有效性。第 5 章介紹了大量的模擬實驗。然后,作為案例研究介紹了擬議方法的潛在應用,同時詳細介紹了擬議框架在真實機器人平臺上的實施情況,以驗證和檢驗基于專業的任務分配方案在實現預期協調水平方面的性能。這項工作將在第 6 章中介紹。
圖 3.12 任務執行的先后順序:(a-c)影響區重疊,操作員選擇任務 1(紅色)為優先任務,這促使紅色機器人繼續擔任領導者,直到紅色任務完成;(d-f)第二優先任務(藍色)正在執行,藍色機器人轉為領導者位置;(g-h)蜂群恢復到影響區重疊外的搜索狀態,然后搜索其他任務(綠色,然后是紅色),由相應的領導者機器人執行。
新一輪科技革命和產業變革正在萌發,在 5G、大數據、云計算、深度學習等新技術的共同驅動 下,人工智能(AI)作為新型基礎設施的重要戰略性技術加速發展,并與社會各行各業創新融合,引發鏈 式變革。
特別是在網絡空間安全防護領域,人工智能在威脅識別、態勢感知、風險評分、惡意檢測、不良 信息治理、騷擾詐騙電話檢測、灰黑產識別等方面有其獨特的價值和優勢,應用需求呈現跨越式發展,產 生了顯著的溢出效應。
為探索解決行業安全應用前沿問題,打造 AI in Security(人工智能賦能安全)最佳 實踐“樣板間”,并推動全球信息通信行業對人工智能在在安全領域形成共識,形成普及應用和規模發展, 提升網絡空間智能安全防護水平,特編制本案例集。