在當今安全格局中,未經授權無人機在禁航空域的擴散已成為重大威脅。這些無人機構成從潛在監視與間諜活動到物理攻擊等惡性行為的多樣化風險。因此,開發高效反無人機激光系統愈發重要。本研究聚焦三大目標:建立內部可靠性模型、識別關鍵組件、探究影響反無人機系統可靠性的因素。通過分析關鍵組件可靠性及系統參數對整體可靠性的影響,旨在提升反無人機激光系統的綜合性能與效能。為此,采用可靠性框圖(RBD)方法計算反無人機系統中激光子系統的可靠性。同時開展組件級可靠性全面評估,識別系統薄弱環節,從而實現針對性改進與優化。為捕捉系統失效行為的真實場景,采用不同分布模型計算系統可靠性,確保深入理解其多工況下的運行可靠性。最終獲取反無人機激光系統的能量值與命中概率,以有效應對環境挑戰。
無人機已迅速融入現代社會生活,在多個領域獲得廣泛應用。盡管最初主要與軍事行動相關,無人機當前在民用領域發揮關鍵作用。其應用場景涵蓋娛樂(航拍攝影)、地質學(地圖繪制、勘測)、交通(流量監測)、安防(搜救、人群監控、救災)、物流(包裹投遞)、農業(作物監測、噴灑)及通信(應急基礎設施)等多元化領域。這些創新應用標志著社會向更高自主性轉型的重要進程,無人機正深刻改變日常生活的各個方面。
在當今安全格局中,禁航空域內非法無人機活動構成的威脅與日俱增。此類無人機可被用于監視、間諜活動甚至物理攻擊等惡意行為。為有效應對此類威脅,開發強健的反無人機激光系統勢在必行。圖1展示了激光反無人機系統的典型配置。
反無人機激光系統作為關鍵安防技術,旨在檢測、追蹤并反制禁航空域內的非法無人機。通過先進檢測機制、精確追蹤能力與有效反制手段,此類系統致力于保護敏感區域免受惡意無人機的潛在威脅。激光武器憑借其光速響應、精準光束定位與單次打擊成本效益[19],正成為應對無人機威脅升級的有效解決方案。為分析激光對無人機引擎的打擊效能,文獻[16]研究了目標對激光的脆弱性綜合評估方法。Ball在文獻[24]中指出,評估目標對激光的脆弱性類似于評估非爆炸性穿透物撞擊目標時造成的損傷機制,盡管未明確闡述具體評估方法。
全球對無人機、射頻模塊及個人通信設備的反制需求日益增長。掃頻干擾器已被證實對多類目標具有普適性干擾效能。隨著技術進步,干擾設備需同步演進以適應新型威脅并滿足附加約束條件,包括提升能效、壓縮帶寬占用及實現并行友好通信。為此,本文提出新型掃頻干擾信號體系,并將信號參數化過程建模為優化問題。通過真實硬件實驗平臺,評估了多類目標在選定干擾信號下的干擾效能,采用定制優化算法指導評估流程并開展算法性能對比。聚焦最優算法進行超參數調優研究,基于實測數據運用響應面法(RSM)解析特定目標受擾時的參數關聯機制。最終證實本實驗方法可作為通用框架,用于優化針對任意目標的多樣化干擾信號。
針對惡意射頻通信的電子對抗需求顯著增長,威脅涵蓋無人機、商用射頻模塊、個人移動電臺及軍用通信領域。射頻干擾器因其非侵入特性成為首選對抗裝備,廣泛應用于要員保護、重大活動安保、車隊護航、關鍵基礎設施防護及電子戰領域。干擾設備通過發射特定信號引發電磁干擾,使目標通信失效。現有文獻提出多種干擾策略:主動式(阻塞/掃頻/單音信號發射)與響應式(基于協議層)干擾方案已在[1]中對比驗證。掃頻信號在多場景展現顯著效能[2]。近期研究聚焦通過調整掃頻參數或信號結構優化掃頻策略:如[3]探究不同掃頻周期對LoRa模塊的影響;[4]分析無人機跳頻系統(FHSS)的命中率與掃頻參數設置;[5]對比無人機反制中掃頻參數的競爭方案;[6]提出噪聲調頻與掃頻復合信號以增強對多調制模式的干擾效果;[7]則對比梳狀組合掃頻與掃頻-噪聲復合方案。
上述研究可歸納為掃頻信號優化的兩大核心挑戰:針對特定場景尋找最優掃頻參數配置;將基礎掃頻升級為復雜信號結構。針對第一項挑戰,我們沿用既往研究[8]的抽象模型,將掃頻參數調優過程建模為干擾效能最大化優化問題,采用多種優化算法求解并在真實硬件平臺驗證。對比確定性搜索、隨機搜索、遺傳算法、粒子群優化及貝葉斯優化等主流方法的性能表現。實驗硬件涵蓋射頻模塊與無人機兩類典型目標,運用響應面法(RSM)量化干擾信號對設備的抑制效果。
針對第二項挑戰,通過引入間隙、頻移、重復及帶寬變換等機制改造基礎掃頻結構,在滿足可選邊界條件(如降低功耗、提升干擾效能、實現并行友好通信)前提下優化信號設計。基于第一項挑戰獲得的算法性能認知,選取高級掃頻信號代表案例在實驗平臺驗證。隨著復雜掃頻信號自由度增加,實驗評估耗時顯著增長。為提升效率,需對優化算法進行專項改進與超參數調優以減少評估步數。
本文核心貢獻如下:? 分析掃頻干擾信號在多參數集下對選定目標的抑制效果并記錄響應面 ? 提出擴展經典掃頻信號的新型復雜干擾信號架構(具備更高自由度) ? 對比主流優化算法在干擾效能最大化任務中的性能表現 ? 提出算法改進方案與適配超參數以降低時間成本。
全文結構:第二章闡述優化問題框架及掃頻信號改進方案;第三章介紹對比算法實現與超參數設置;第四章基于實驗測量展開研究;第五章呈現響應面、算法性能對比及超參數調優結果;第六章總結研究成果。
為破解軍事智能裝備預測性維護中智能化與網絡化程度低、物理模型構建困難等問題,本研究針對人工智能技術在軍事智能裝備中的應用框架、關鍵技術及保障決策方法展開探索。通過將預測性健康管理(PHM)系統架構融入軍事智能裝備健康管理體系,充分發揮人工智能全域通信、泛在感知與自主學習等核心能力,實現軍事智能裝備健康管理的數據驅動化、智能化和網絡化轉型。本研究成果可為復雜戰場環境下軍事智能裝備保障提供參考路徑,有效降低運維成本,持續提升保障效能。
本文重點研究人工智能技術(AIT)在機電控制系統(MECS)中的應用:首先闡釋AIT基礎理論與概念框架,繼而開發現代化AIT核心技術,結合我國現代企業機電控制系統現狀剖析現存瓶頸,最終探究AIT與機械系統的融合路徑,重點討論其在機械電子孔口子系統與電氣控制系統集成中的實踐應用。
"軍事智能裝備"泛指具備預測、感知、分析、推理、決策及控制能力的裝備體系。其在裝備數控化基礎上演進為更高級形態,可顯著提升生產效能與制造精度。其發展關鍵技術涵蓋缺陷檢測與健康維護技術(如高端數控機床、工業機器人),而故障預測與健康管理(PHM)技術正成為未來保障體系的核心方向。隨著軍事智能裝備復雜度提升,構建部件或系統的精確數學模型愈發困難。利用裝備全生命周期多節點歷史數據進行建模,相較物理分析模型更有利于實現PHM功能。鑒于軍事智能裝備向信息化、智能化、網絡化演進,其維護流程也需同步實現網絡協同與智能決策。本研究聚焦PHM與人工智能的融合應用,著力提升軍事裝備智能保障的決策水平、力量編成、方法革新及效能增益,為PHM智能化與網絡化維護模式的落地實施提供支撐。
高端技術的廣泛運用正在深刻改變制勝機理。信息力已超越火力成為戰爭勝負的決定性要素,控制取代摧毀成為壓制對手的首選手段。作戰體系中集群單元的影響力超越傳統集中兵力效果,催生出三大新型作戰樣式:基于集群協同的"新型智能作戰"(亦稱分布式協同戰)、基于多域集群的"集群攻防戰"、以及創新理論體系衍生的"電磁全維戰",三者共同構成未來智能化戰爭的基本形態。
自主智能體技術的進步正通過支持偵察、障礙規避、路徑規劃與目標探測等多樣化任務,變革多域作戰模式。然而組建人類與自主智能體混合團隊時,因雙方“認知模型”及世界理解方式存在差異而產生挑戰。本研究著力構建“聯合認知系統”,旨在融合人類與自主智能體優勢以提升“情報監視偵察(ISR)”“協同作戰”“搜索救援(SAR)”及戰場“醫療后送”等任務的協作效能。此類軍事行動需協調具備多元能力與復雜“依存關系”的多智能體系統,對決策與資源管理構成嚴峻挑戰。本文提出基于“協同設計”的方法優化指揮控制決策,聚焦多智能體系統內部任務分配與協調的“可觀察性、可預測性與可導控性”(OPD)原則。該協同設計方法通過評估多智能體在各子任務中的相互“依存關系”及所需“能力”(如目標感知、障礙規避或區域值守),適用于“無人機”“有人駕駛載具”及“地面控制站人員”等多元團隊。
所提出的“聯合認知系統”(JCS)框架綜合評估人機智能體的能力與依存關系,結合環境參數、任務要素及“在線監測”(狀態與行為感知),動態推薦特定任務的最佳執行主體。研究通過在三維模擬環境中組織不同能力配置的人機混合團隊執行“搜索救援任務”展開實驗。團隊配對設計旨在考察操作員如何發展差異化“能力水平”,進而促使自主智能體在各任務階段提供相應層級的“支援”。測試八種機器學習算法后,最優模型的“任務分配預測準確率”達80%以上。研究核心在于探尋“人機控制權”的最優平衡,通過“預判失誤”或檢測操作員“失能狀態”,最大限度避免“自動化濫用”以保障“有效人類決策權”。這有望推動未來“C2指揮控制系統”實現:采集感知數據(“觀察”);輔助解析并“預判”態勢(“預測”);優化團隊內部任務“導控”(“可導控性”)。此類系統可增強“聯合全域指揮控制”(JADC2)在分布式團隊與混合編隊資源管理中的作戰效能,依托“人工智能”支撐加速決策進程。
“聯合全域指揮控制”(JADC2)代表一種復雜的決策模式,旨在快速整合全域作戰能力以獲取“競爭”與“沖突”場景中的戰略優勢[1]。根據文獻[2]闡述,JADC2涵蓋“感知”“研判”“行動”三大核心功能,貫穿“太空”“網絡”“空中”“陸地”及“海洋”五大作戰域[3]。該系統依托由先進傳感技術構成的“多域傳感體系”,包含“光電/紅外成像”“高光譜成像”“雷達(無源/有源)”“聲學傳感器”及“偵察衛星”等設備。跨域數據流生成分布于不同時空維度的海量信息。“有效管理”這些數據對支持“作戰管理”與“指揮決策”至關重要,需確保“精準情報”及時送達相應團隊或“智能體”以實現預期作戰效果。此類“數據點”要求構建統一的“多域網絡”——通過整合“多源信息”(取代孤立數據管道)形成“全域聯合態勢感知圖景”。這種“集成化路徑”有助于“全面把握作戰環境”。如圖1所示,應用“機器學習”“人工智能”與“預測分析”能進一步優化該流程,提供“數據融合”與“快速解析”的高級能力,將感知圖景轉化為作戰行動[2][3]。文獻[4]強調,“指揮控制”的根本目標是確保“精準情報”及時交付相應決策者,從而彰顯“敏捷性”并促進團隊間“互操作性”。實現此目標需依托“量子通信”“人工智能(AI)”及“自主系統”等關鍵技術。未來JADC2將構筑“類云環境”,實現“情報共享”“態勢監視”及“高速數據通信”以加速決策[2]至[5]。這些技術以遠超人類的“處理速度”與“規模”實現數據快速解析。文獻[4]著重指出“AI”與“機器學習(ML)”在自動化處理海量信息、支持決策流程中的整合作用。二者特別擅長在“動態多變量環境”中識別快速演變的“模式特征”,通過關聯“地形”“氣象”“行為模式”等離散情報源預判態勢并響應環境變化[2]至[5]。在“未來指揮控制系統”中,AI有望跨“梯隊”“作戰域”及“作戰資產”同步多重行動,從而把握“關鍵戰機窗口”。此項能力在“無人地面載具(UGV)”“無人機(UAV)”“水下潛航器(UUV)”“水面艇(USV)”等搭載智能傳感器的作戰平臺日益普及的戰場尤為重要。AI賦能的系統可評估作戰環境中“多源情報”,運用“歷史數據”生成行動建議,從而減輕“認知負荷”并賦能指揮官的“快速有效決策”。
無人系統與自主智能體的發展深刻重塑了“聯合全域指揮控制”(JADC2)框架內的團隊結構與角色定位。這些進步重新定義了“指揮控制”(C2)與“任務管理”的實施路徑,要求對多元化資源及團隊進行精密協同。這種整合需依托先進的“C2能力”以優化資源分配并實時調整任務指令——需綜合考量“性能評估”“任務修正”“動態環境條件”“人員工作負荷”“疲勞狀態”及“機器性能極限”等多元因素。為應對此挑戰,本節將探討“人機自主編隊”(HAT)在多智能體團隊中的興起,以及如何通過“協同設計”的HAT框架評估“有效人類決策權”。
人工智能與自主系統的應用顯著改變了團隊動態,催生出“人機自主編隊”(HAT)概念[6]。HAT重構了團隊結構、成員角色及其在權責體系中的層級關系[6]。將自主智能體融入人類團隊增加了復雜度:因其承載差異化能力與角色[7]至[8],可能導致“任務委派矛盾”“權責錯配”及“責任主體驗證缺失”。由此可能形成影響團隊動態與績效的“復雜依存關系網”[7]至[8]。影響該復雜性的因素包括:成員特性、任務構成、情境特征、環境條件及任務目標。有效評估HAT需建立并驗證性能度量標準,涵蓋:(i)單兵作戰效能(ii)單機性能表現(iii)整體團隊績效[6]。“客觀”與“主觀”度量工具有助于判定任務能力邊界[6]。傳統軍事團隊績效指標聚焦“安全性”與“作戰能力”,包括“團隊執行力”“壓力水平”“信任度”及“凝聚力”[2]。這些指標可深化團隊能力認知,優化“多智能體系統”協作效能以保障任務成功。
“有效人類決策權”概念包含三大核心原則:僅有人類在場不足以保證實質性控制;意向性決策貢獻取決于“心理認知能力”與“系統理解度”;差異化法律責任要求不同層級的控制權,由此可能引發“責任缺失”[9]。核心矛盾源于機器人與裝備從工具屬性向“團隊成員”的轉化——這要求建立“相互依存的通信”“協同決策”及“聯合作戰”機制[10]。因此有效訓練方法與“人因工程”研究致力于探索提升“團隊效能”與“個體效能”的路徑。例如“認知人機系統”研究領域正探索運用“生物標記物”作為人類“精神狀態”或“生理狀態”的評估指標[11]至[14]。“神經生理學數據”的運用有助于精準解析團隊協作中的人類支援需求(如根據“工作負荷”“疲勞狀態”或“功率譜密度”動態調整編隊層級)[11]至[15]。此類認知將優化“資源配置”,通過AI或“自主智能體”在操作員“失能狀態”時提供實質性支援。其還有助于提升“能力透明度”與“依存關系可見性”,發展“可調節的多智能體編隊模式”。這些信息可實現“人機資源動態調配”——例如當操作員“警覺度下降”時,自主智能體可增強“貢獻度”或接管特定任務“控制權”,從而提升“整體任務效能”。
當前各類“自主能力”已內嵌于無人機系統。這些能力使智能體能夠實施“自主決策”,發展“專項技能”以促進任務成功。此類技能通常通過“深度強化學習”(DRL)實現:路徑規劃(如D3-QN算法)、導航(DQN/PPO算法)及高度控制(DDPG算法)[16]至[18]。既有研究展示了嵌入式自主智能體的應用案例:無人機系統基于“視覺導航”實現“障礙規避”[19],或依托無人機平臺實施“目標定位”[20]。此外通過“卷積神經網絡”(CNN)與YOLO等算法增強無人機相機的“搜救任務目標檢測能力”[20]。多智能體團隊還包含其他“半自主系統”:如“陸基/海基水雷”“防空反導系統組件”[22],以及支撐近距空戰“基本戰術機動”的無人戰機“自主導引系統”[23]。但自主載具的“傳感器性能局限”(目標檢測置信度低、視覺識別偏差或導航執行錯誤)仍構成制約[24]。過度復雜的智能體模型可能引發“決策透明度”問題,導致團隊成員難以維持“態勢感知”[25]——例如人類操作員可能無法判斷何時介入接管自主智能體任務。
這些能力使多智能體團隊得以在人類與自動機器間分配“控制權”與任務。但當人機因“理解偏差”導致協作失敗,或“突發異常行為”引發“指揮控制”(C2)系統混亂與模糊性時,將影響多智能體團隊的“可預測性”與“作戰效能”。美國陸軍“訓練與條令司令部”(TRADOC)強調必須識別保證任務成功的“部隊作戰能力”。在戰場或災區等“動態環境”中,當異構團隊需與“地面傳感器”“無人載具”等資產交互時,須配置“實時學習”與“自適應算法”[2]。這些算法支撐“最優博弈策略”制定,提升部隊對“彈道導彈威脅”等動態條件的“響應力”與“適應性”[2]。北約“TG-HFM247工作組”指出人機編隊面臨“動態可調協作”挑戰:因編隊過程需“雙向認知學習”,雙方必須理解彼此“行為模式”“優勢”與“短板”。隨著團隊成熟度提升,這種互相認知將催生“互補增效”作用[26]。該工作組強調采用“人機編隊設計模式”可建構“心智模型”、明晰“角色定位”、優化“任務條件”,進而增強“團隊協作透明度”與“任務分配策略”[26]。2016年瑞典海軍演習中的指揮控制研究提煉出三維度框架:(i)“信息分布”(ii)“決策權分配”(iii)“交互模式”[9],凸顯“靈活響應的C2系統”對管理復雜多智能體環境的核心價值。整合“人機編隊框架”將提升“協同效能”,通過定義清晰角色與“任務分配策略”,釋放混合編隊的“互補能力潛能”,最終實現“團隊作戰效能”的全面增強。
“協同設計框架”評估協調多智能體能力以達成任務目標所需程度。該框架界定各智能體分配的功能與任務能否獨立執行,或因“執行能力缺失”必須協作完成[7]至[8]。其運作基于“依存關系”“從屬關系”及“執行能力”三原則:“依存關系”定義為聯合行動中兩個及以上實體為滿足依賴需求形成的互補關系[7]至[8];“從屬關系”通過“執行能力”概念展開——涵蓋實體獨立勝任任務所需的技能、知識與認知水平;當實體缺乏有效執行任務的能力時,即形成需他方支援的“從屬關系”。為評估任務完成所需的“能力依存狀態”,該框架提出采用“依存關系分析表”(IA)[7]至[8]。此表格通過定義任務、子任務、必備能力及團隊成員替代角色(執行主體或支援角色),輔助設計依存關系架構。這些能力對任務達成至關重要,指導評估人類操作員與自主智能體間的任務分配。分析結果將強化“決策回路”——該回路作為“聯合全域指揮控制”(JADC2)核心要素,遵循“可觀察性-可預測性-可導控性”(OPD)準則:“可觀察性”確保用戶清晰掌握系統內部狀態與行動;“可預測性”使用戶能基于實時和歷史數據預判系統行為;“可導控性”賦予用戶引導控制系統運作的權限,確保按需動態調整[7]至[8]。三要素協同作用旨在實現人機智能體間的無縫集成與高效協作。
本文旨在通過聚焦集成自主智能體與人類操作員的混合多智能體團隊,應對“聯合全域指揮控制”(JADC2)的核心挑戰。研究目標分為四方面:(1) 通過AI建議優化資源分配;(2) 建立“多模態數據管道”整合人機智能體與其他實體特征,提升互操作性與同步能力以改進信息融合;(3) 構建“人機自主協同框架”,運用3D仿真環境訓練測試多智能體團隊,評估性能與依存關系;(4) 應用“可觀察性-可預測性-可導控性”(OPD)原則增強JADC2決策流程保障“有效人類決策權”,同時研究人類神經生理信號中的“生物標記物”與“行為模式”以優化資源分配策略。達成這些目標將推動多域作戰中基于AI任務分配策略的“多智能體資源管理”進展。
本方法通過名為JCS的試驗性處理平臺實現,整合實驗設計與海量數據采集構建多模態管道及機器學習算法。該方法運用協同設計原則優化任務分配、資源管理及決策流程,強化“可觀察性”“可預測性”與“可導控性”(OPD)。
所提方案將人機數據整合為統一管道,依托協同設計原則與AI優化任務分配。JCS匯聚多元數據源——含“氣象數據”“地理環境地圖”(GEM)“任務狀態”“神經生理指標”“載具傳感器”“信號情報”(SIGNIT)“人工情報”(HUMINT)及“自主智能體性能指標”——形成“多模態集成框架”,增強復雜作戰環境中的透明度與動態任務分配能力。
聯合認知系統框架含五大模塊以提升作戰效能:(i)特征采集:獲取自主智能體與人類操作員數據;(ii)任務參數:定義子任務(含目標數量與位置);(iii)環境參數:監測風速、降雨、溫度等關鍵條件;(iv)能力評估:核定各智能體能力,確定其擔任“支援角色”或“主執行體”;(v)任務分配:運用機器學習技術根據評估能力與環境因素預測最佳子任務執行主體。該綜合框架(基于文獻[15]改進)旨在優化任務分配、資源管理及整體任務效能。
研究以“搜救任務”(SAR)為用例背景:救援隊在時間資源受限條件下部署無人機最優定位災后受困者。部署“無人機系統”(UAS)的核心目標是評估傷情(區分危重與非危重狀態),據此制定救援優先級。任務執行需人類操作員、救援調度員(通常為有人駕駛飛行器)與機器協同完成。無人機必須規避障礙物,規劃最優路徑定位“目標區域”(即災區)內所有受困者。任務依據協同設計框架分解,基礎能力與子任務如下:S1-目標探測感知;S2-障礙物感知;S3-偏差規避障礙物;S4-抵近目標獲取分析圖像;S5-在規避禁區的目標區域內導航。該結構化路徑確保人機組件協同應對SAR任務需求。
隨著技術快速發展,空中交互模式日益復雜,智能空戰已成為多智能體系統領域前沿研究方向。在此背景下,大規模空戰場景的動態性與不確定性帶來顯著挑戰,包括可擴展性問題、計算復雜性及多智能體協同決策難題。為解決這些問題,我們提出一種基于圖結構與零階優化的多智能體強化學習(MADRL)新型自主空戰決策方法——GraphZeroPPO算法。該方法創新性地將GraphSAGE圖網絡與零階優化融入MADRL框架,通過圖結構適應多智能體系統高動態與高維特性,利用高效采樣策略實現導彈發射快速決策,同時借助零階優化有效探索全局最優解。最后,我們展示了在1v1與8v8空戰場景下的仿真實驗及對比結果。研究表明,該方法能有效適應大規模空戰環境,同時實現高勝率與快速決策性能。
無人機面臨的核心挑戰在于路徑規劃與動態避障。近年來涌現的多種路徑規劃算法雖成功解決部分問題,但仍存在諸多局限。本文針對A*、RRT與粒子群優化(PSO)三種主流算法,在障礙物密集的三維城市環境中開展系統性實驗。通過設計三組實驗(每組含兩種場景),綜合考量城市地圖規模、飛行高度、障礙物密度與尺寸等變量。實驗結果表明:A算法在計算效率與路徑質量方面表現最優;PSO在急轉彎與高密度環境展現優勢;RRT*憑借隨機搜索特性,在各類實驗中保持均衡性能。
形態各異的無人機已廣泛應用于軍事[2]、航拍、搜救[3]與農業[1]等領域。路徑規劃作為實現地形導航、任務執行與目標抵達的核心技術,近年來成為研究重點。路徑規劃可分為兩大范式:靜態環境規劃與動態環境規劃。前者適用于障礙物位置固定的場景(如建筑物、橋梁、交通燈),需在任務前完成路徑計算;后者應對移動障礙物(如車輛、鳥類、行人),依賴機載實時路徑計算模塊實現動態適應。算法選擇取決于具體任務需求。
路徑規劃算法主要分為四類:第一類為基于圖搜索的算法(如A*[5]、Dijkstra[4]、D*[6]、跳點搜索JPS[7]),將環境建模為圖結構,節點代表位置/狀態,邊代表可行轉移路徑。第二類為基于采樣的方法,包括概率路線圖PRM[8]與快速擴展隨機樹RRT[9],通過隨機采樣構建路徑。第三類為人工勢場法[10],通過引力與斥力場引導無人機趨近目標。第四類為仿生優化算法(如蟻群ACO[11]、粒子群PSO[12]、灰狼GWO[13]),模擬生物行為并依賴預設成本函數尋優。各類方法雖具優勢,但均存在局限:圖搜索法在三維大場景中計算成本高[14];仿生算法需參數調優且迭代次數多[15];勢場法易陷局部最優[16];采樣法則生成離散航點而非連續軌跡[17]。本文聚焦RRT*[18]、A*與PSO三種經典算法,針對城市三維環境設計六種實驗場景(涵蓋環境規模、障礙物形態密度、起降高度差異等變量),系統比較其性能差異。
論文結構如下:第二節綜述相關對比研究;第三節概述A*、RRT*與PSO算法原理;第五節詳述仿真實驗與結果分析;第六節總結研究結論。
低分辨率遙感影像中的精確航空器識別是航空領域尤其是戰斗識別中一項極具挑戰性的關鍵任務。本研究提出一種創新、可擴展且基于人工智能的解決方案,旨在解決已知機型與新型/未知機型協同精準識別這一核心難題。傳統方法(人類專家主導的作戰識別與圖像分類)在新型類別識別方面存在顯著局限。本方法通過相似性學習技術,實現對廣泛軍用與民用航空器特征的深度解析,結合度量學習實現機型身份辨識,并利用監督式小樣本學習完成機型分類。針對低分辨率遙感數據稀缺的挑戰,本研究設計了一種端到端框架:通過全監督方式訓練通用嵌入模型,自適應軍事航空器識別的多樣性與復雜性需求。與既有航空器圖像分類方法相比,本研究方案在機型分類(F1分數達0.861)與新型類別二分識別(F1分數達0.936)方面均展現顯著優勢。該方法有效應對遙感數據固有挑戰,為數據集質量設定了新標桿。該研究為領域專家開辟了新路徑,展現了區分多類型航空器的獨特能力,為實時航空器識別提供了更魯棒、領域自適應的技術潛力。
圖 1. 從左到右的流程圖顯示:a) 傳統的 CID,b) 圖像分類和 c) 智能已知和新飛機識別(INNAR),以找到已知和新類別
本文在飛機識別和戰斗識別方面做出了以下重大貢獻:
引入了一種新方法來自動實現 CID。
引入了一個新的、更好的數據集版本--MTARSI-INNAR,在識別 MTARSI 數據集中的錯誤并執行有領域專家參與的嚴格數據清理過程后,推進了自動 CID 開發和評估。
提出的 INNAR 是一種創新方法,可高精度區分已知(友)類和新(敵)類,以增強 CID 的適應性。它利用最先進的卷積網絡和相似性學習,通過圖像三元組構建穩健且可通用的特征表示。
驗證了圖像分類在原始高噪聲 MTARSI 數據集上做出了非常高準確率的虛假承諾,并提出將飛機識別和戰斗識別轉移到相似性和少數鏡頭學習上。
隨著無人機與社會越來越緊密地聯系在一起,更多未經培訓的用戶需要具備操作無人機的能力。要實現這一目標,就必須開發人工智能能力,協助人類操作員控制無人機系統和處理傳感器數據,從而減少對操作員進行大量培訓的需要。本文介紹了 HADRON 項目,該項目旨在開發和測試多種新型技術,以實現對無人機群的人性化控制。該項目分為三個主要部分。第一部分是整合各種技術,實現對無人機的直觀控制,重點關注新手或缺乏經驗的飛行員和操作員。第二部分的重點是開發一個多無人機系統,該系統將由一個指揮和控制站控制,其中一名專家飛行員可以監督多架無人機的操作。項目的第三部分將側重于減少人類操作員的認知負荷,無論他們是新手還是專家飛行員。為此,將開發人工智能工具,協助無人機操作員進行半自動實時數據處理。
HADRON 項目考慮了三個級別的自主性。第一級側重于新手用戶,即使是相當簡單的操作也需要高度輔助,例如通過使用直觀的無人機控制技術。下一個層次涉及專業飛行員,旨在使他們能夠從中央站控制多架無人機系統。最后一個層次旨在通過引入人工智能工具來自動處理實時數據,從而大幅降低操作員的認知負荷。本文介紹了 HADRON 項目的定義,該項目將開發和測試不同的新型技術,以明確哪些技術對未來的無人機駕駛有用。本文介紹了系統架構,并討論了所使用的不同技術的選擇。
圖 1. 描繪了一名下馬士兵使用語音命令操作無人機的情景。無人機探測到目標后會通過語音通知操作員,以便操作員當場做出決定。
鑒于確定的能力差距,確定了三個主題:第一個主題將為未經培訓的用戶開發人性化的無人機控制;第二個主題將為專家用戶開發無人機的多智能體控制;最后,第三個主題將通過開發半自動數據解讀算法來輔助前兩個主題。
配備先進傳感器的無人平臺的集成有望提高態勢感知能力,緩解軍事行動中的 “戰爭迷霧”。然而,管理這些平臺涌入的大量數據給指揮與控制(C2)系統帶來了巨大挑戰。本研究提出了一種新穎的多智能體學習框架來應對這一挑戰。該方法可實現智能體與人類之間自主、安全的通信,進而實時形成可解釋的 “共同作戰圖景”(COP)。每個智能體將其感知和行動編碼為緊湊向量,然后通過傳輸、接收和解碼形成包含戰場上所有智能體(友方和敵方)當前狀態的 COP。利用深度強化學習(DRL),聯合訓練 COP 模型和智能體的行動選擇策略。展示了在全球定位系統失效和通信中斷等惡劣條件下的復原能力。在 Starcraft-2 模擬環境中進行了實驗驗證,以評估 COP 的精度和策略的魯棒性。報告顯示,COP 誤差小于 5%,策略可抵御各種對抗條件。總之,貢獻包括自主 COP 形成方法、通過分布式預測提高復原力以及聯合訓練 COP 模型和多智能體 RL 策略。這項研究推動了自適應和彈性 C2 的發展,促進了對異構無人平臺的有效控制。
圖:從學習到的交流中預測 COP 的框架概覽。在決策過程中確定并使用 COP。使用 QMIX作為 COP 集成的 MARL 方法示例。
配備先進傳感器的無人平臺的集成為減輕 “戰爭迷霧 ”和提高態勢感知能力帶來了希望。然而,管理和傳播來自此類平臺的大量數據對中央指揮與控制(C2)節點的信息處理能力構成了巨大挑戰,特別是考慮到隨著平臺數量的增加,數據量也會呈指數級增長。目前的人工處理方法不適合未來涉及無人平臺群的 C2 場景。在本研究中,我們提出了一個利用多智能體學習方法來克服這一障礙的框架。
我們考慮的框架是,智能體以自主方式相互通信(以及與人類通信),并以數據驅動的方式訓練這種通信功能。在每個時間步驟中,每個智能體都可以發送/接收一個實值信息向量。該向量是智能體感知或視場(FoV)的學習編碼。這些向量不易被對手解讀,因此可以實現安全的信息傳輸。
在接收方,必須對信息進行解碼,以恢復發送方的感知和行動。此外,還應將信息整合(隨時間匯總)到 “共同作戰圖像”(COP)中。與編碼器一樣,解碼器也是以數據驅動的方式學習的。在本文中,我們將 COP 的定義簡化為戰場上每個友方和敵方智能體的當前狀態(位置、健康狀況、護盾、武器等)。我們認為,COP 對決策智能體至關重要。
近年來,以數據驅動方式進行端到端訓練的人工智能/人工智能方法大有可為。在數據驅動型自主 COP 的背景下,一個優勢是無需對傳感器和執行器中的噪聲、對手的動態等做出建模假設。通過充分的訓練,我們的數據驅動方法將產生高度精確的 COP。
不過,ML 模型可能對訓練數據或訓練場景的偏差很敏感。這與陸軍 C2 場景中通常假設的 DDIL(拒絕、中斷、間歇和有限影響)環境形成了鮮明對比。我們的實驗強調評估對霧增加、全球定位系統失效和通信中斷(如干擾)的適應能力。
我們使用深度神經網絡(DNN)的深度學習實現了編碼器和解碼器的數據驅動端到端訓練。將 DNN 應用于 COP 形成的一個挑戰是通信中缺乏人類可解釋性。人類可解釋性對于人類操作員有效控制蜂群至關重要。例如,通過解釋通信,操作員可以理解蜂群用于(自主)決策的特征。我們的方法具有人機互換性,這意味著人類操作員可以解碼傳入的信息,并將自己的感知編碼,與蜂群進行交流。由此產生的 COP 使人類能夠指揮蜂群。
在實踐中,COP 被大量用于任務執行,例如,確保協調運動。我們假設,將 COP 納入自主決策智能體將產生彈性多智能體策略(例如,對敵方變化的彈性)。我們在實驗中將有 COP 和沒有 COP 的多智能體策略學習與多種最先進的方法進行了比較,并驗證了這一假設。
接下來,我們總結一下我們的方法。我們首先描述了我們的深度學習方案,其中每個智能體將其感知和行動編碼成緊湊向量并進行傳輸。各智能體共享底層嵌入向量空間,以實現對態勢的共同理解。每個智能體都要訓練一個編碼器-解碼器,以生成本地 COP。本地 COP 應與智能體的感知一致,并能預測行動區域內所有單元的狀態(包括位置)。
在不同的模擬場景、初始部隊配置和對手行動中,使用深度強化學習(DRL)對 COP 和智能體策略進行端到端訓練。訓練的輸出是一個編碼器-解碼器神經網絡(NN)和一個跨智能體共享的策略 NN。可通過多種方式對訓練進行配置:最小化帶寬、最大化對干擾(如信道噪聲、數據包丟失、GPS 干擾等)的恢復能力。該方法可用于協調信息收集任務。
實驗在星際爭霸-2(SC2)多智能體環境中進行。在 SC2 中模擬的多個藍方與紅方場景中,通過經驗觀察了方法的有效性。具體來說,在具有挑戰性和現實性的 TigerClaw 場景(圖 1)中測試和評估了方法,該場景由 DEVCOM 陸軍研究實驗室(ARL)和陸軍主題專家(SMEs)在美國佐治亞州摩爾堡的上尉職業課程中開發。
圖 1:(左)Tigerclaw場景中的狀態示例。(右)每個智能體的感知(本地觀察)和它們之間的通信聯系。
對 COP 的準確性和幻覺進行評估,以揭示有趣的訓練動態。在整個模擬過程中,方法生成的 COP 高度準確,誤差小于 5%(與地面實況相比)。為了測試策略的魯棒性,我們將我們的方法與多種最先進的多智能體 RL 方法和基線進行了比較。結果表明,我們的方法所制定的策略能夠抵御視覺范圍下降、通信能力下降、GPS 被拒絕以及場景變化等因素的影響。
總之,這項研究通過數據驅動的 COP 形成,實現了人在環內的異構自主平臺的指揮和控制,推動了自適應和彈性 C2 領域的發展。其貢獻如下:
實時自主形成可解釋的共同行動圖像(COP)的方法,包括預測整個行動區域的敵方位置。
由于利用智能體間的通信進行分布式 COP 預測,因此展示了對可視范圍和 GPS 拒絕的更強的應變能力。
通過聯合訓練 COP 模型和多智能體 RL 策略,提高整體任務成功率。
本文介紹了一種為戰場環境量身定制的動態三維場景感知創新系統,該系統利用配備雙目視覺和慣性測量單元(IMU)的無人智能體。該系統處理雙目視頻流和 IMU 數據,部署先進的深度學習技術,包括實例分割和密集光流預測,并通過專門策劃的目標數據集加以輔助。通過集成 ResNet101+FPN 骨干進行模型訓練,作戰單元類型識別準確率達到 91.8%,平均交叉比聯合(mIoU)為 0.808,平均精度(mAP)為 0.6064。動態場景定位和感知模塊利用這些深度學習輸出來完善姿態估計,并通過克服通常與 SLAM 方法相關的環境復雜性和運動引起的誤差來提高定位精度。
在模擬戰場元環境中進行的應用測試表明,與傳統的 ORB-SLAM2 立體方法相比,自定位精度提高了 44.2%。該系統能有效地跟蹤和注釋動態和靜態戰場元素,并利用智能體姿勢和目標移動的精確數據不斷更新全局地圖。這項工作不僅解決了戰場場景中的動態復雜性和潛在信息丟失問題,還為未來增強網絡能力和環境重建方法奠定了基礎框架。未來的發展將側重于作戰單元模型的精確識別、多代理協作以及三維場景感知的應用,以推進聯合作戰場景中的實時決策和戰術規劃。這種方法在豐富戰場元宇宙、促進深度人機交互和指導實際軍事應用方面具有巨大潛力。
無人機已成為現代戰爭中不可或缺的一部分,其向更大自主性的演進是不可避免的。本研究探討了軍用無人機向智能化、最小程度依賴人類方向發展的軌跡,并詳細介紹了必要的技術進步。我們模擬了無人機偵察行動,以確定和分析新出現的挑戰。本研究深入探討了對提高無人機智能至關重要的各種技術,重點是基于物體檢測的強化學習,并提供了實際實施案例來說明這些進步。我們的研究結果證實了增強軍用無人機智能的巨大潛力,為更自主、更有效的作戰解決方案鋪平了道路。
圖 3 智能無人機偵察場景和應用技術。
在最近的沖突中,如俄羅斯入侵烏克蘭和亞美尼亞-阿塞拜疆戰爭,無人機被認為是不可或缺的力量。目前,大多數可用于作戰的無人機都是遙控的。雖然無人機在一定程度上實現了自動化,但由于技術和道德問題,仍需要操作人員。從戰術角度看,無人機的最大優勢是 "低成本 "和 "大規模部署"。然而,這兩個優勢只有在無人機無需操作人員即可控制時,也就是無人機智能化時才能發揮作用。
自主無人機本身并不是一個新概念,因為人們已經進行了廣泛的研究。例如,我們生活在一個無人機用于送貨和搜救任務的時代 [1]、[2]、[3]。然而,民用智能無人機技術能否直接用于軍事目的呢?我們的答案是'不能',因為軍用無人機的操作在以下情況下與民用無人機有明顯區別。首先,軍用環境比民用環境更加復雜。想想特斯拉在未鋪設路面的道路上自動駕駛時,駕駛員必須干預的頻率有多高。軍事行動并不發生在 "鋪設良好的道路上"。此外,軍事行動涉及在任意地點分配任務。其次,伴隨軍事行動而來的是敵人無數次的反擊。這些反作用包括主動和被動拒絕,主動拒絕包括試圖攔截,被動拒絕包括隱藏和欺騙。這些敵方活動增加了問題的復雜性。第三,由于軍事的特殊性和安全性,缺乏與軍事行動相關的數據。例如,缺乏坦克和運輸機發射器(TEL)的鳥瞰數據,而這些都是物體探測的常用目標。第四,軍用智能無人機執行任務時需要考慮安全和道德問題。智能無人機在執行任務時如果缺乏穩定性,就會產生不可預測的行為,導致人員濫傷和任務失敗。從倫理角度考慮,即使無人機的整體操作實現了智能化,也需要有最終攻擊決策由人類做出的概念。換句話說,關鍵的考慮因素不應該是無人機是否能自主做出攻擊決定,而是無人機如何提供信息,協助人類做出攻擊的最終決定。這些倫理問題與人類的責任和機器的作用有關。
鑒于這些軍事方面的考慮,對自主軍用無人機和民用無人機的研究應以不同的理念推進。有關軍用智能無人機的研究正在積極進行中,但與民用研究不同的是,大部分研究都沒有進入公共領域。因此,本研究有以下目標。
首先,考慮到軍事行動的特殊性,本研究探討了智能軍用無人機的概念。
其次,我們對該領域出現的各種問題進行案例研究,從工程師的角度看待這些問題,并討論從案例研究中得出的直覺。
圖 1. 智能無人機在民用領域的工程研究
軍用無人機根據其使用目的分為偵察、攻擊、欺騙、電子戰和作為目標等類別 [38],[39]。在本案例研究中,我們重點關注偵察無人機的智能化。案例研究中的無人機以韓國 "Poongsan "公司的無人機為模型。根據應用模塊的不同,該模型可以執行多種任務。不過,本研究使用的是配備偵察模塊的無人機。模塊包括攝像頭、LRF、GNSS 等傳感器和系統。在規范假設方面,假定無人機能夠配備物體檢測和強化學習神經網絡。
圖 4. 用于訓練 YOLOv4 微型目標檢測模型的跟蹤車輛圖像。
圖 12. 根據 Unity 中的情景驗證技術應用