無人機集群的角色分配與規模對其作戰性能具有顯著影響,但量化研究仍較匱乏。明確這些關聯對集群配置的優化設計至關重要,相關研究可提升任務效率并實現資源最優分配。本研究通過量化分析角色分配與規模在不同任務場景下的影響,指導高效集群設計。開發基于智能體的無人機集群仿真系統,評估集中式異構集群在兩種場景下的性能:高目標密度小區域(無人機容量受限)與低目標密度大區域(無人機容量充裕)。集群任務為清除區域內所有目標。仿真參數基于烏克蘭戰爭數據驗證及領域專家意見設定,通過成功率、總步數及單目標平均清除步數量化性能。結果表明:集中式異構集群在稀疏可預測任務空間表現卓越——更大規模集群可實現最優覆蓋與效能;但在高密度不可預測環境中效率下降——集中控制與大集群規模產生反效果。這些發現強烈表明:集群架構與規模須依任務空間動態調整,開放空間適用大型集中式集群,復雜環境需采用更靈活的小型配置。
現代戰爭日益聚焦無人機技術應用。低成本無人機在烏克蘭戰場展現顯著影響力[1]。無人機擴散引發防務產業熱潮,各國投入巨資研發并大規模部署。研究核心方向之一是無人機集群——多架無人機同步協同達成共同目標[1]。美國防長指令五角大樓加強集群研究[2],芬蘭無人機戰略文件規劃制造與集群研發路線[3],印證全球關注度。無人機集群具獨特優勢:單操作員可控制多架無人機或實現全自主作戰,提升系統可擴展性與作戰節奏[4]。大規模集群能同時打擊多目標或飽和防御系統,創造重大戰術影響。但單機遙控到數百架集群的跨越,存在諸多待解的研究挑戰。
大型系統主要挑戰包括:定義控制架構、維持強健編隊協同、優化任務路徑規劃[5]。此外,超越同構集群的異構集群(含不同無人機類型)引入額外復雜度。異構集群角色涵蓋專用傳感器單元、增強計算能力指揮/數據處理單元及武器載荷投送單元。因此實戰部署需針對任務環境優化角色比例與集群規模——該領域仍需深入研究。本文探究不同作戰環境下無人機集群的理想角色分配與規模,開發基于智能體的集群仿真模型,模擬區域目標清除任務。設計兩種對比場景:多目標高密度復雜環境與少目標低密度開闊區域。通過系統調整集群規模與角色構成進行仿真實驗,分析關鍵性能指標形成結論,并提出未來研究方向。
攻勢防空(Offensive Counterair)對抗問題長期受最優控制研究領域重點關注。無論載人還是無人平臺,追擊方若能預判最大化捕獲規避目標概率的機動策略,將顯著提升作戰效能。本研究聚焦雙主體對抗場景:配備"動態交戰區"的高速無人機追擊者,對抗非機動移動規避體。既有研究將交戰區建模為固定于追擊機的靜態圓形區域,后續改進為更貼合武器動力學特性的心形區域。本文創新性構建追擊方圓形交戰區模型(針對低速非機動規避體),該交戰區依據規避體速度矢量動態偏移——其相對追擊者的位置隨兩車相對航向與速度實時調整,標志著研究的重要突破。
選取具有代表性的追擊者與規避體動態參數(模擬典型航空器特性),通過MATLAB仿真平臺,運用非線性最優控制技術,求解不同追擊者初始航向及位姿下的最優攔截軌跡與最短接戰時間。仿真結果構建出特定場景的控制策略,并經解析解驗證有效性。研究進一步擴展至輸入受限條件下的追擊者性能分析。成果為動態交戰區追逃捕獲場景建模奠定基礎,為實時控制策略提供普適性指導。
攻勢防空作戰對北約快速終結科索沃戰爭具有決定性意義,并持續改寫現代軍事沖突進程。據《空軍條令出版物3-01:防空作戰(2023年版)》定義,攻勢防空涵蓋攻擊行動、壓制敵防空系統(SEAD)、戰斗機護航及"戰斗機掃蕩"。"戰斗機掃蕩"指戰斗機在指定區域主動搜尋摧毀敵機或隨機目標的進攻任務。1999年科索沃戰爭中北約部隊成功實施的掃蕩行動,被證實是戰區制空權奪取的關鍵戰術(Leone, 2019)。
科索沃戰爭始于1998年2月,止于1999年6月,導火索為南聯盟在科索沃的種族清洗。北約發起為期78天的針對塞爾維亞軍事目標的空襲行動,通過攻勢與守勢防空作戰迅速確立科索沃周邊制空權。1999年3月24日,塞爾維亞米格-29戰機試圖攔截北約在科索沃空域行動的軍機,北約隨即啟動掃蕩行動——美軍F-15C戰機以AIM-120先進中程空對空導彈(AMRAAM)鎖定目標并實施攻擊。該導彈配備自主雷達導引頭,同時具備飛行中段數據鏈更新能力("AIM-120技術說明書"),此特性可顯著提升其對高機動目標的攔截效能。這種"初始跟蹤發射+中段導彈自導"的雙階段模式,與本論文研究框架形成隱喻關聯(詳見第三、四章論述)。
米格-29被擊落是科索沃戰爭的重要轉折點,彰顯北約聯盟的制空優勢與癱瘓敵軍高價值資產的能力。此戰役僅是北約削弱塞軍作戰體系的縮影,最終促成危機解決及塞軍撤離科索沃。
科索沃戰爭成為現代戰爭史的重要篇章,凸顯空戰形態演進趨勢,以及先進戰機與導彈系統對奪取制空權達成軍事目標的戰略價值。此后二十年間,成功擊落的空戰案例極為罕見,這歸因于美國等先進空軍展現的絕對制空優勢。但隨著全球地緣政治持續動蕩,美軍亟需為未來 contested airspace(對抗性空域)做好準備。
F-15C飛行員的戰術動作經多型戰機訓練課程傳授。顯然,飛行員無需非線性優化求解器即可掌握攔截規避目標的要領——一旦通過機動完成目標鎖定,導彈將執行后續攻擊。但若交戰方為無人機且存在操控延遲呢?若最優控制能揭示未被發掘的機動效能呢?若存在優于現役的攔截策略呢?本研究旨在探索這些命題的潛在解決方案。畢竟人類曾篤信重力環境下兩點間最短路徑是直線,直至伯努利發現"最速降線"。
本文致力于求解配備"交戰區"的高速無人機追擊非機動目標的最優軌跡,覆蓋狀態空間內多初始位姿與航向組合。非線性優化求解器收斂耗時達秒級至分鐘級,若無人機依賴此類求解器生成控制指令,其在實際攻勢防空場景的實時作戰能力將因計算延遲嚴重受限。反之,基于解析解的通用控制算法可無視追擊者-規避者初始條件組合,即時生成最優航向指引,徹底規避求解器時延問題。
《美空軍條令出版物3-01》確立軍事防空作戰準則,區分為攻勢與守勢行動,確保部隊"機動自由"、"攻擊自由"及"免遭攻擊自由"(2023)。防空作戰還能通過建立可信威脅震懾敵對勢力進入特定區域。《聯合出版物3-01》將防空列為美國空軍核心使命。本研究直接增強美空軍攻勢防空(OCA)能力——通過賦能無人機瞬時選取最高效攔截路徑,美空軍將在沖突中有效確立制空霸權。
《2022年美國國防戰略》明確"維護穩定開放國際環境"的防務承諾,其第三項核心承諾為"威懾侵略并做好必要時制勝準備"(國防部,2022)。本研究與該承諾高度契合:首先,友軍戰機即時攔截入侵敵機可迫使敵方中止行動;若威懾失敗,本論文提供將交戰區精準覆蓋敵機的殲滅手段。這兩種態勢均可通過解析解實現——該解為追擊者提供最短時間接敵航向角。
美國空軍研究實驗室(AFRL)自1997年成立以來持續將最優軌跡方法應用于實戰問題。近期研究聚焦提升軍機在多元交戰場景的生存控制技術:應用微分博弈論甄別高價值資產攻防優劣態勢(Z. Fuchs & Khargonekar, 2015);拓展至高價值目標防護場景,發現防御方能約束攻擊方撤退路徑(Von Moll & Fuchs, 2020);求解低速追擊者對高速規避目標的最大觀測時長最優路徑(Weintraub等, 2021);最新成果提出基于平臺物理特性的動態調控技術,通過飛行器機動壓縮敵方武器交戰區有效范圍實現全域規避(Dillon等, 2023)。
無人機攻勢防空新技戰術對國防安全具有戰略意義。AFRL研究者正重點探索:配備交戰區的高速機動追擊者攔截非機動規避目標的最優控制技術。該技術將使無人機具備瞬時生成攔截航跡能力,大幅縮短飛行器與地面站操控員的響應閉環。
第一章闡述研究核心概念、問題緊迫性及預期成果;第二章系統綜述最優控制理論發展、前沿研究及與本論文相關的期刊文獻結論;第三章詳述方法論體系:從最優控制問題定義與動力學模型出發,推進至基于非線性最優控制求解器GPOPS-II的MATLAB問題建模,最終提出高效遍歷狀態空間的初值條件與求解器種子點設置方法;第四章呈現仿真結果與深度分析;第五章總結研究經驗教訓,規劃未來研究方向,并反思實際成果與預期目標的契合度。
(注:嚴格遵循"三不"原則;軍事術語如"攻勢防空"、"動態交戰區"、"非機動移動規避體"等均加中文引號標注;技術表述"心形區域"保留幾何特征描述;專業工具"GPOPS-II"保留原名;方法論描述保持原文精度)
背景:低成本無人機蜂群的擴散對關鍵基礎設施構成重大非對稱威脅,近期沖突表明價值1萬美元的無人機群可癱瘓價值超5億美元資產。現有反無人機系統在蜂群飽和攻擊與復雜環境中破片散布控制方面存在局限。方法:本研究提出集成式反蜂群防御系統,融合基于概率占據網格的運動體三維探測與精確定時空爆彈藥技術。探測子系統采用多相機陣列,通過空間雕刻算法與多視圖幾何實現三維重建;攔截子系統運用可編程空爆技術,配備風偏補償散布控制。結果:基于航空圖像目標檢測數據集(DOTA)的系統仿真驗證顯示,該系統實現83.6%攔截效能(RMS定位精度4.7米),破片散布半徑較傳統空爆系統縮減42%。結論:該集成系統單次攔截成本僅7200美元(導彈方案超200萬美元),通過可控散布機制保持定位精度并約束破片分布,提供高性價比反蜂群能力。
無人機蜂群的出現標志著非對稱作戰能力的范式轉變。商用現貨組件使對手能以空前效費比實施協同蜂群攻擊(Dedrone與泰雷茲澳大利亞公司,2025)。近期作戰分析表明,價值1萬美元的消費級無人機可能癱瘓價值超5億美元的戰略資產,根本性改變關鍵基礎設施防護的威脅評估。現有反無人機系統(C-UAS)技術應對蜂群場景存在顯著局限:傳統動能攔截彈雖對單目標高效,但同步應對多低價值目標時經濟性不足(Wang等,2020);電子戰系統效能因目標蜂群通信協議與自主能力差異而波動;定向能武器雖具持續交戰潛力,目前缺乏應對密集蜂群所需的多目標同步交戰能力(Shakhatreh等,2019)。
本研究通過融合三維運動探測與精確空爆交戰技術構建集成防御架構。系統采用成熟計算機視覺算法——包括概率占據網格(Elfes, 1989)與空間雕刻重建(Kutulakos & Seitz, 2000)——實現實時三維態勢感知。目標數據驅動配備風偏補償散布模式的可編程空爆彈藥,實現多目標同步交戰并最小化破片散布效應。核心創新包括:(1)運動體三維重建與動能交戰系統集成;(2)通過多視圖幾何優化實現亞5米定位精度;(3)基于可控散布機制的破片散布定量控制;(4)反制效能相較現有C-UAS方案的性價比驗證。
本研究通過評估六種標準管理方法在信息技術(IT)投資生命周期各階段的應用適配性,解決如何優化選擇方法論以應對新型IT技術的決策挑戰,從而實現核心流程的價值優化。在當前實踐中,價值無差異的成本優化常驅動企業下級營利部門及非營利機構(如國防部)的IT投資決策,根源在于通用會計、財務和經濟方法無法量化IT在核心流程中創造的價值。本研究旨在為決策者提供六種方法論指導,使其能在缺乏歷史數據預測結果的情況下,對新型IT技術實現價值感知型優化投資。面對歷史數據缺失的困境,決策者運用六種標準管理方法預測核心流程性能變化(尤其是投資回報率)面臨更大挑戰。本研究成果包括各生命周期階段最優方法論應用指南,以最大限度提升新型IT投資成效。研究以前沿遠距機器人系統強化前推部署戰地維修(FDCR)核心流程為概念驗證案例,展示了IT投資生命周期中創新機遇的實踐指導框架。
采用有效、可靠且可比的方法預測信息技術(IT)投資價值,持續挑戰著IT經濟研究者與實踐者。現有融合標準會計、財務與經濟學的評估方法,在量化優化核心流程的IT投資效益時存在顯著局限。癥結在于標準投資方法對價值度量的假設缺乏支撐或精確性(例如未在流程層面采用比率尺度價值指標),導致決策者難以預測優化核心流程的IT技術潛在效能。此類價值假設缺陷因缺乏子組織核心流程層級的比率尺度價值標準,常致使投資無法達成預期效益,在國防部等非營利機構中尤為凸顯。若決策者能精準匹配各類管理方法與IT投資生命周期階段,將極大優化IT投資決策成效——例如根據方法適用性指導流程改進,從而實現更科學的遠距機器人等新興技術投資組合管理。正如海軍作戰部長吉爾戴上將(2022)"求真務實,精益求精"戰略所強調:高效統籌財務、人力與IT資源對實現資源優化利用目標至關重要;而運用IT技術重構核心流程,可助力海軍機構通過提升流程效率實現"精益求精"目標。
本研究基于有效可靠比率尺度——以前推部署戰地維修(FDCR)核心流程生產率的價值、成本及周期時長為度量標準——攻克IT投資決策難題。這些指標通過測算投資回報率(ROI)與核心流程周期時長,為投資決策提供關鍵性能數據支撐。研究進一步驗證六種管理方法(平衡計分卡、業務流程再造、知識價值增值、掙值管理、集成風險管理、精益六西格瑪)如何引導IT投資生命周期各階段:通過在FDCR核心流程應用遠距機器人技術,驅動正向投資回報率與周期時長優化。
研究核心問題與價值 本研究聚焦如何運用六種方法論提升IT投資生命周期成效,并以FDCR流程案例實證分析。軍事領域的痛點在于:軍用裝備前推部署戰地維修(FDCR)流程未能實現效率優化,導致可用裝備數量不足而影響戰局勝利。深層癥結在于:投資決策者未有效運用六種方法論,致使FDCR核心流程IT投資未達最優,進而削弱裝備戰備狀態。本研究旨在通過FDCR場景實證,展示六種方法論如何支撐IT投資生命周期決策機制。其戰略價值在于:改進IT投資決策可使國防部在分析替代性IT實物期權組合時,更高效配置有限資源,最終提升裝備戰備水平。
本研究對照美國防部核心流程中對新型IT投資決策精準評估的普遍需求。通過遠距機器人系統投資案例,實證對比六種方法的優勢、局限與應用邊界:重點展示知識價值增值(KVA)與集成風險管理(IRM)定量分析如何預測目標模型(To-Be)相較于現狀模型(As-Is)的價值增量。目標模型構建完成后,采用實物期權組合分析法(Mun, 2024a)評估該技術方案的風險維度(即ROI指標波動性)及未來潛在價值增益——此步驟對軍事決策層至關重要,因遠距機器人投資方案需與眾多替代方案競爭預算資源。優化結果表明:遠距機器人顯著提升FDCR的投資回報率、周期時效及任務達成率。
知識貢獻與實踐價值 本研究核心知識貢獻在于:基于各類方法論的優劣勢分析,構建六種方法論與IT投資生命周期的優化映射模型。實踐價值則是建立支撐IT投資全周期的決策框架,該框架可輔助管理層評估技術方案對核心流程的價值增益潛力。在遠距機器人案例中具體映射關系如下:
上述方法長期廣泛應用于軍事決策層IT投資管理,故被選為本研究支撐框架的方法論基礎。研究特別論證KVA對FDCR現狀模型的基準構建價值:首階段提供當前流程ROI與周期時效量化分析;次階段通過同方法論預測應用遠距機器人后的目標模型性能表現。
本研究提出分層多智能體強化學習框架,用于分析異構智能體參與的仿真空戰場景,旨在通過預設模擬識別促成任務成功的有效行動方案(CoA),從而低成本、低風險探索現實防務場景。在此背景下應用深度強化學習面臨特定挑戰,包括復雜飛行動力學、多智能體系統狀態與動作空間指數級擴展,以及實時單元控制與前瞻規劃融合能力。為解決這些問題,決策過程被分解為雙層抽象:底層策略控制單個單元,高層指揮官策略發布與總體任務目標匹配的宏觀指令。該分層結構通過利用智能體策略對稱性及控制與指揮任務分離,顯著優化訓練流程。底層策略通過漸進復雜度的課程學習訓練單兵作戰控制能力,高層指揮官則在預訓練控制策略基礎上學習任務目標分配。實證驗證證實了該框架的優越性。
本研究探索深度強化學習(RL)作為低成本、低風險空戰場景模擬分析方法的可行性。RL在各類環境中展現的行動方案發現能力構成研究動機,涵蓋棋類博弈[1]、街機游戲實時控制[2]以及現代兵棋推演[3]等融合控制與戰略決策的場景。空戰場景中應用RL存在多重挑戰:仿真場景結構特性(如單元復雜飛行動力學、聯合狀態動作空間規模)、規劃深度、隨機性與信息不完備性等。戰略博弈與防務場景的決策樹(即潛在行動方案集合)規模遠超常規搜索能力邊界。此外,現實作戰需同步協調單元機動與戰略布局及全局任務規劃,整合部隊層級實時控制與指揮官層級任務規劃的聯合訓練極具挑戰性,因二者對系統需求、算法架構及訓練配置存在本質差異。
為應對挑戰并復現現實防務行動,本研究構建分層多智能體強化學習(MARL)框架分析異構智能體空戰仿真場景。該方法將決策過程解耦為雙層結構:底層策略負責單元實時控制,高層策略依據全局任務目標生成宏觀指令。底層策略通過預設場景(如攻擊/規避)訓練,場景目標由指令標識符標記。為增強魯棒性與學習效率,采用漸進復雜度場景課程學習與聯盟自博弈機制。高層策略學習基于動態任務目標為下屬智能體分配合適標識符。戰略規劃權責上移至高層指揮官,底層執行單元自主完成控制任務。該架構通過底層策略對稱性利用與信息流定向傳輸,大幅簡化策略訓練過程,并實現控制與指揮的清晰分離,支持任務定制化訓練方案。
本研究核心貢獻包括:(1)開發輕量化環境平臺,快速模擬智能體核心動力學與交互行為。通過固定飛行高度將運動約束至2D空間,仍能精確捕捉智能體交互與機動特征。(2)采用課程學習虛構自博弈機制,通過漸進復雜度提升作戰效能。(3)設計集成注意力機制、循環單元與參數共享的神經網絡架構,聯合訓練底層控制策略與高層指揮官策略。(4)針對深度學習系統黑箱特性與科學評估風險,通過分層組件解析實現決策可解釋性。
第2節綜述前沿進展并闡明本研究對現有文獻的拓展;第3節介紹飛行器模擬器基礎特性與MARL原理;第4節闡述空戰對抗場景及訓練流程;第5節呈現實驗結果;第6節討論結論與未來研究方向。
分布式相控陣雷達系統允許各獨立雷達節點實現完全自由的位置部署,同時仍能協同完成一致的測量。近年來,雷達節點間同步技術的持續進步使此類系統的實施日益可行。為充分釋放節點布署自由度,本研究探索以無人機作為系統載體。無人機具備高效機動能力,可實現快速位置調整并覆蓋傳統難以抵達的區域。然而,該系統的實現面臨多重挑戰,包括確保節點間的信號相干性,以及在無人機有限空間與負載能力下完成系統集成。
本文提出在無人機上安裝天線的解決方案,通過仿真建模構建了包含無人機本體、天線、饋電及安裝結構的系統。其中,半波長偶極子天線的設計方案展現出輕量化特性,并具備適用于雷達場景的輻射特性。該設計支持分布式相控陣形成統一波前,為潛在雷達應用提供了技術基礎。
本文探討了如何在軍隊中開發和訓練強大的自主網絡防御(ACD)智能體。本文提出了一種架構,將多智能體強化學習(MARL)、大型語言模型(LLM)和基于規則的系統組成的混合人工智能模型集成到分布在網絡設備上的藍色和紅色智能體團隊中。其主要目標是實現監控、檢測和緩解等關鍵網絡安全任務的自動化,從而增強網絡安全專業人員保護關鍵軍事基礎設施的能力。該架構設計用于在以分段云和軟件定義控制器為特征的現代網絡環境中運行,從而促進 ACD 智能體和其他網絡安全工具的部署。智能體團隊在自動網絡操作 (ACO) gym中進行了評估,該gym模擬了北約受保護的核心網絡,可對自主智能體進行可重復的培訓和測試。本文最后探討了在訓練 ACD 智能體理過程中遇到的主要挑戰,尤其關注訓練階段的數據安全性和人工智能模型的穩健性。
圖 1:四個網絡位置(A-D)容納五個藍色智能體(1-5)的情景。
本文探討了為自主網絡防御(ACD)智能體訓練混合人工智能(AI)模型時所面臨的挑戰和機遇,尤其是在戰術邊緣環境中。這些挑戰源于此類環境所特有的獨特、不可預測和資源受限的設置。北約研究任務組 IST-162 和 IST-196 的工作重點是 “軍事系統的網絡監控和檢測”[1]、[2] 和 “虛擬化網絡中的網絡安全”。虛擬化網絡中的網絡安全"[3] 至 [5],本研究旨在利用混合人工智能框架推進 ACD 智能體的設計和功能,以確保整個聯盟網絡的穩健網絡安全。多智能體強化(MARL)、大型語言模型(LLM)和基于規則的系統的采用構成了我們 ACD 架構的核心,增強了智能體在戰術邊緣環境中普遍存在的斷開、間歇、有限(DIL)帶寬條件下有效執行自主網絡防御任務的能力。這些條件要求系統具有彈性,能在網絡和資源嚴重變化的情況下保持高性能水平,這對傳統的網絡安全系統來說是一個重大挑戰。例如,將深度強化學習(DRL)與生成式人工智能相結合,有利于開發能夠進行復雜決策和自適應學習的智能體,提高其在動態網絡環境中應對復雜網絡威脅的能力[3]。此外,本文還討論了如何將 ACD 智能體集成到模擬的北約啟發的受保護核心網絡環境中,并在此環境中針對一系列網絡威脅對其進行評估。智能體利用人工智能技術的戰略組合,自動執行監控、檢測和緩解等關鍵防御行動,支持對關鍵軍事和民用網絡基礎設施的持續保護。
本文的貢獻如下: 第一,在一個集成了 MARL、LLM 和基于規則的系統的代理層次結構中使用代理智能體范例的方法論,以增強自主網絡防御能力。第二,討論在戰術邊緣環境中為 ACD 智能體訓練混合人工智能模型的挑戰和機遇。第三,定義一套評估指標,用于衡量 ACD 代理在數據和訓練保護方面的性能。本文的組織結構如下: 第二節回顧了相關文獻并解釋了研究原理。第三節詳細介紹了使 ACD 智能體適應戰術邊緣環境的方法。第四節介紹了我們的實證評估結果。最后,第 V 節總結了本研究的意義并概述了未來的研究方向。
自主系統的最新進展對學術界和工業界都產生了重大影響,開辟了新的研究途徑。其中之一就是多個系統為實現共同目標而進行的協作,這就是所謂的合作系統。在缺乏人類智能、決策和感知能力的情況下,無人自主系統在一起部署和使用時,可以從彼此的能力中相互受益。本研究探討了無人駕駛航空系統(UAS)群的協作問題,在這種情況下,由于單個飛行器受到限制,需要進行不同程度的協調與合作。這種合作的形式可以是物理支持,即任務要求超出單個系統的物理能力;也可以是情報級支持,即總體上需要更好的感知、處理或決策能力。本研究的目標是為一組選定的無人機系統和受限任務場景開發和集成協同制導與控制算法,這些場景包括通過帶懸掛纜繩的多旋翼飛行器協同操縱空中有效載荷的任務,以及利用飛艇和多旋翼飛行器團隊協同編隊的任務。此外,本研究還旨在將所開發的個體和合作模型算法集成到高保真模擬中,以便在現實飛行任務中研究多智能體協作的有效性。
研究的第一部分側重于單個航空系統的建模和仿真。案例研究中考慮的系統包括帶有柔性電纜懸掛有效載荷的多旋翼飛行器和飛艇。在這一部分中,分別采用歐拉-拉格朗日法和牛頓-歐拉法推導出這些系統的數學模型。分析了柔性纜索模型的動力學特性,并將其與分析性貓尾式解法進行了比較。此外,為了提高仿真精度,還針對帶柔性纜繩懸掛有效載荷系統的多旋翼飛行器實施了動量和幾何結構保全變分積分器。
第二部分是為每個系統設計制導和控制法則,以提供姿態穩定和軌跡跟蹤。首先,研究了一種基于線性化系統模型的游戲理論方法,用于減弱懸掛有效載荷的擺動。這種方法考慮了多旋翼飛行器與懸掛載荷系統的各種狀態反饋情況。基于從這些線性分析中獲得的啟示,我們開發了一種以導管形狀為依據的幾何控制方法,用于該系統的姿態和軌跡跟蹤控制。對于飛艇,則開發了線性和非線性控制方法。這些方法分別包括基于增益調度的線性二次控制和非線性動態反演(NDI)方法。然后對這兩種方法進行了比較,重點關注它們的優勢和實施的難易程度。
最后,針對任務目標受限的現實場景,開發了合作制導和控制法,要求一組無人機在物理或智能層面上進行合作。借鑒對柔性電纜的延展性分析,構建了一個合作控制場景。該場景展示了飛行器之間的合作,利用多旋翼飛行器對懸掛的剛性有效載荷進行空中操縱,其中的限制因素來自單個飛行器的有效載荷能力和飛行器之間通過柔性纜線的物理連接。其次,在涉及多旋翼飛行器團隊的編隊控制場景中采用了領導者-跟隨者通信圖拓撲結構,突出了基于擴展狀態觀測器(ESO)的總干擾估計模型的集成。該模型大大增強了系統對外部干擾和未建模動態的魯棒性。最后,我們在一個示例場景中展示了這些研究的實際應用,在搜救任務中需要通過無人機系統提供合作編隊支持。在這個場景中,我們還利用飛艇將多旋翼飛行器運送和部署到任務目的地,在那里執行編隊任務,以適應各種編隊形狀和圖形拓撲。這一場景需要物理和信息層面的協作,以增強區域覆蓋、改善感知和態勢感知。這里的限制來自單個飛行器的物理限制(如尺寸、續航時間、有效載荷能力和運行環境)和信息級限制(如處理能力、傳感和通信能力)。這種情況形成了在現實生活中具有實際應用價值的基線。
圖 1.1: 多旋翼協同飛行器攜帶通過纜繩懸掛的應急包執行空中有效載荷操縱任務的示意圖
圖 1.2:空中有效載荷操縱任務工作項目
圖 1.3:合作編隊飛行任務示意圖,多旋翼飛行器小組在飛艇的協助下作為領隊節點引導編隊飛行
無人機已成為現代戰爭中不可或缺的一部分,其向更大自主性的演進是不可避免的。本研究探討了軍用無人機向智能化、最小程度依賴人類方向發展的軌跡,并詳細介紹了必要的技術進步。我們模擬了無人機偵察行動,以確定和分析新出現的挑戰。本研究深入探討了對提高無人機智能至關重要的各種技術,重點是基于物體檢測的強化學習,并提供了實際實施案例來說明這些進步。我們的研究結果證實了增強軍用無人機智能的巨大潛力,為更自主、更有效的作戰解決方案鋪平了道路。
圖 3 智能無人機偵察場景和應用技術。
在最近的沖突中,如俄羅斯入侵烏克蘭和亞美尼亞-阿塞拜疆戰爭,無人機被認為是不可或缺的力量。目前,大多數可用于作戰的無人機都是遙控的。雖然無人機在一定程度上實現了自動化,但由于技術和道德問題,仍需要操作人員。從戰術角度看,無人機的最大優勢是 "低成本 "和 "大規模部署"。然而,這兩個優勢只有在無人機無需操作人員即可控制時,也就是無人機智能化時才能發揮作用。
自主無人機本身并不是一個新概念,因為人們已經進行了廣泛的研究。例如,我們生活在一個無人機用于送貨和搜救任務的時代 [1]、[2]、[3]。然而,民用智能無人機技術能否直接用于軍事目的呢?我們的答案是'不能',因為軍用無人機的操作在以下情況下與民用無人機有明顯區別。首先,軍用環境比民用環境更加復雜。想想特斯拉在未鋪設路面的道路上自動駕駛時,駕駛員必須干預的頻率有多高。軍事行動并不發生在 "鋪設良好的道路上"。此外,軍事行動涉及在任意地點分配任務。其次,伴隨軍事行動而來的是敵人無數次的反擊。這些反作用包括主動和被動拒絕,主動拒絕包括試圖攔截,被動拒絕包括隱藏和欺騙。這些敵方活動增加了問題的復雜性。第三,由于軍事的特殊性和安全性,缺乏與軍事行動相關的數據。例如,缺乏坦克和運輸機發射器(TEL)的鳥瞰數據,而這些都是物體探測的常用目標。第四,軍用智能無人機執行任務時需要考慮安全和道德問題。智能無人機在執行任務時如果缺乏穩定性,就會產生不可預測的行為,導致人員濫傷和任務失敗。從倫理角度考慮,即使無人機的整體操作實現了智能化,也需要有最終攻擊決策由人類做出的概念。換句話說,關鍵的考慮因素不應該是無人機是否能自主做出攻擊決定,而是無人機如何提供信息,協助人類做出攻擊的最終決定。這些倫理問題與人類的責任和機器的作用有關。
鑒于這些軍事方面的考慮,對自主軍用無人機和民用無人機的研究應以不同的理念推進。有關軍用智能無人機的研究正在積極進行中,但與民用研究不同的是,大部分研究都沒有進入公共領域。因此,本研究有以下目標。
首先,考慮到軍事行動的特殊性,本研究探討了智能軍用無人機的概念。
其次,我們對該領域出現的各種問題進行案例研究,從工程師的角度看待這些問題,并討論從案例研究中得出的直覺。
圖 1. 智能無人機在民用領域的工程研究
軍用無人機根據其使用目的分為偵察、攻擊、欺騙、電子戰和作為目標等類別 [38],[39]。在本案例研究中,我們重點關注偵察無人機的智能化。案例研究中的無人機以韓國 "Poongsan "公司的無人機為模型。根據應用模塊的不同,該模型可以執行多種任務。不過,本研究使用的是配備偵察模塊的無人機。模塊包括攝像頭、LRF、GNSS 等傳感器和系統。在規范假設方面,假定無人機能夠配備物體檢測和強化學習神經網絡。
圖 4. 用于訓練 YOLOv4 微型目標檢測模型的跟蹤車輛圖像。
圖 12. 根據 Unity 中的情景驗證技術應用
在過去的十年中,無人駕駛飛行器(UAV)的使用領域完全爆炸式增長。如今,它們被用于執行監視任務和檢查人們難以到達的地方。為了提高執行這類任務的效率和穩健性,可以使用合作無人機群。然而,這對使用哪些解決方案來定位和導航智能體提出了新的要求。本論文研究、實施和評估了無人機群相對定位和繪圖的解決方案。
報告研究并介紹了通過使用擴展卡爾曼濾波器(EKF)融合智能體之間的速度數據和成對距離測量來估計相對位置的系統。在現有估計相對位置方法的基礎上開發了一種濾波器,并對其進行了修改,以包括星座中所有可用的成對距離,從而使定位精度提高了 47%。此外,還開發了一種多維縮放(MDS)初始化程序,能夠非常準確地確定蜂群內的初始相對位置,幫助 EKF 幾乎瞬間收斂。此外,還開發并測試了另一種使用 MDS 坐標估計值作為輸入的 EKF。
無人機配備了測距探測器,可測量四個方向與墻壁的距離。距離數據被插入一個網格,將環境離散化。在繪制環境地圖時,采用了一種方法來考慮無人機位置的不確定性,從而改進了結果。對蜂群繪制地圖的兩種方法進行了測試,結果表明它們適用于不同的設置。如果蜂群中的無人機具有共同的坐標系,無人機就會更新相同的網格并繪制地圖。如果無人機的坐標系不同,則分別創建地圖,然后合并。一般來說,協作構建地圖的方法性能更好,而且不需要復雜的地圖合并解決方案。要合并地圖,需要一個成本函數來衡量地圖的匹配程度。我們對三種不同的成本函數進行了比較和評估。使用已知的全局位置和相對姿態估計值,對探索環境的蜂群的映射器進行評估。
事實證明,在將相對姿態估計值輸入繪圖系統時,利用已有的定位濾波器所實現的精度足以生成分辨率為十厘米的地圖。在模擬環境中可以實現更高的制圖分辨率,但需要更多的計算時間,因此沒有進行測試。
本文通過機器學習方法提出了一種雷達任務選擇的主動方法,并將其設計在雷達調度流程之前,以提高雷達資源管理過程中的性能和效率。該方法由兩個過程組成:任務選擇過程和任務調度過程,其中任務選擇過程利用強化學習能力來探索和確定每個雷達任務的隱藏重要性。在雷達任務不堪重負的情況下(即雷達調度器超負荷工作),將主動選擇重要性較高的任務,直到任務執行的時間窗口被占滿,剩余的任務將被放棄。這樣就能保證保留潛在的最重要任務,從而有效減少后續調度過程中的總時間消耗,同時使任務調度的全局成本最小化。本文對所提出的方法進行了數值評估,并將任務丟棄率和調度成本分別與單獨使用最早開始時間(EST)、最早截止時間(ED)和隨機偏移開始時間EST(RSST-EST)調度算法進行了比較。結果表明,與EST、ED和RSST-EST相比,本科學報告中提出的方法分別將任務丟棄率降低了7.9%、6.9%和4.2%,還將調度成本降低了7.8倍(EST為7.8倍)、7.5倍(ED為7.5倍)和2.6倍(RSST-EST為2.6倍)。使用我們的計算環境,即使在超負荷的情況下,擬議方法所消耗的時間也小于 25 毫秒。因此,它被認為是提高雷達資源管理性能的一種高效實用的解決方案。
雷達資源管理(RRM)對于優化作為飛機、艦船和陸地平臺主要傳感器的現代相控陣雷達的性能至關重要。報告》討論了雷達資源管理,包括任務選擇和任務調度。該課題對國防科技(S&T)非常重要,因為它與現代相控陣雷達的大多數應用相關。它對當前的海軍雷達項目尤為重要,該項目探索了雷達波束控制的人工智能(AI)/機器學習(ML)方法。所提出的算法有可能升級未來的艦船雷達,從而做出更好的決策并提高性能。