在復雜環境中, 環境動態性和任務多樣性給無人集群自主協同、有人系統與無人集群協同帶來了巨大挑戰. 為此, 提出了 有人 / 無人集群任務規劃系統集成框架. 該框架集成無人平臺自主行為規劃系統, 無人集群分布式系統與有人 / 無人集群系統. 無 人平臺通過感知、認知、決策與控制完成自主行為規劃. 無人平臺間通過交互信息, 彼此決策方式協同規劃. 有人系統支持在預先 規劃、實時規劃與事后評估階段與無人集群的協同交互.
近年來, 在人工智能、大數據、云計算、物聯網 等先進技術的推動下, 無人平臺已經被廣泛應用到 物品投送、環境保護、搶險救災、農藥噴灑、燈光表 演、地圖測繪、偵察追蹤等領域, 在極大解放勞動力 的同時, 還能夠替代人類執行枯燥、惡劣、危險的任 務, 正在國民經濟建設和國防領域扮演著越來越重 要的角色[1] . 隨著所承擔任務的工作量和復雜性不斷增加, 無人平臺在載荷、續航、決策等方面的負擔不斷加 劇, 逐漸暴露出任務執行能力弱、效率低、靈活性差 等問題. 因受制于現有技術和成本, 依靠無人平臺的 作業能力難以勝任不斷涌現的新任務需求. 無人平 臺的研究在工業生產、搶險救災等實際環境中具有 時代意義. 近些年, 研究者們面向多無人平臺協同任 務規劃方法研究, 依靠無人集群實現目標偵察、跟蹤 與圍捕等實時任務規劃, 在實際的環境中具有廣闊 的應用前景. 特別是在軍事領域, 可以實現對入侵者 的偵察、監視、打擊、毀傷評估等, 提高了軍隊各類 設備的智能化程度, 在安全保障方面提供了新思路、 新方式各軍事強國對無人集群任務規劃能力高度重視, 視之為改變未來戰爭制勝規則的顛覆性力量. 2018 年 8 月, 美國國防部發布了 《無人系統綜合路線圖 2017-2042》[2] , 提出了美國無人系統領域發展的 4 大 主題和 19 項關鍵技術. 4 大主題是互用性、自主性、 網絡安全和人機協同. 19 項關鍵技術包括了機器人 技術、人工智能、集群能力等. 美正在開展的代表性 項目如“小精靈”項目、“進攻性蜂群使能戰術”、“試 驗性驗證網關演習”項目等均取得了突破性進展[3] . 2021 年 10 月,“小精靈”項目空中回收“小精靈”無人 機實驗成功, 邁出無人集群韌性靈活執行任務的關 鍵一步[4] . 2021 年 12 月,“進攻性蜂群使能戰術”項目 融合虛實結合技術, 通過沉浸式蜂群界面對蜂群指 揮控制, 為有人/無人協同執行任務提供了技術支 持[5] . 2022 年 4 月,“試驗性驗證網關演習”完成了由 30 架無人機組成的無人集群作戰試驗. 此次試驗采 用空地協同、分批發射與分布式控制的方式, 依次完 成偵察、防空壓制、打擊與毀傷評估任務. 集群作戰 概念由“無人機蜂群”轉變成“無人機狼群”, 是低成 本無人機集群作戰的全新作戰理念[6] . 在實際戰場中, 2020 年 9 月, 阿塞拜疆部署由 6 架異構無人機組成 的無人機集群, 摧毀了亞美尼亞的防空系統, 導致亞 美尼亞地面資產遭受大量破壞[7] . 在國內, 2021 年 11 月, 中國電子技術標準化研 究院發布《智能無人集群系統發展白皮書》, 指出智 能無人集群系統的任務復雜度普遍提升, 對于集群 系統的智能化、魯棒性提出了更高的功能與性能要 求[8] . 2018 年 1 月, 國防科技大學智能科學學院無人 機系統創新團隊開展了 20 余架次的無人機集群自主 協同飛行試驗, 驗證了空中集結編隊、定向編隊飛行 和編隊協同偵察等任務執行能力[9] . 2020 年 9 月國內 民營企業, 成功地組織了 3 051 架無人機同時集群飛 行, 創下了集群控制新的世界記錄[10] . 這些項目在無 人集群任務規劃相關技術進行了大量深入的探索. 值得注意的是, 目前無人平臺的自主性處于“弱 智能”階段, 無人集群協同感知、決策、控制能力略 顯不足, 逐漸暴露出靈活性差、計算能力低、環境感 知能力差、任務執行能力差等問題, 有人系統與無人 集群之間存在態勢把控難、實時信息交互慢等問題. 傳統的無人集群在態勢感知、資源整合、組織協同 等信息力方面的缺陷直接制約了有人系統與無人集 群協同執行任務的完成率和時效性. 與此同時, 考慮 在復雜環境中目標具有動態性, 任務具有實時性等 特點, 進一步增加了執行任務的難度. 因此, 如何建 立智能有人/無人集群任務規劃系統集成框架, 有效 地組織、管理無人集群, 實現單無人平臺自主行為規 劃、無人集群自主協同、有人系統與無人集群協同, 具有十分重要的研究價值.
針對具有未知擾動的多智能體系統, 設計擴張狀態觀測器, 估計每個智能體的狀態和受到的擾動, 并通過無線網絡發送 給鄰居智能體. 利用 Stackelberg 博弈描述多智能體系統的帶寬分配問題, 設計了可以補償網絡時延的預測云控制方案, 給出了 Stackelberg 博弈的納什均衡解和多智能體系統一致性和穩定性條件, 通過仿真算例驗證了方法的有效性.
隨著計算機科學技術、人工智能技術和網絡控 制技術的飛速發展, 多智能體系統(multi -agent systems, MASs)引起了廣泛的關注, 已應用于智能電 網[1-3]、智能交通[4]、自動駕駛[5]、傳感器網絡[6]等領 域, 一致性問題是 MASs 的基本問題[7-13] , 該問題旨在 通過與鄰居交換信息來使所有智能體達成一致. 大 量的 MASs 通過無線網絡交換信息, 不可避免地受到 噪音信號的干擾. 擾動的存在會影響系統的性能, 甚 至嚴重破壞系統的穩定性. 擴張狀態觀測器作為自 抗擾控制器的核心, 可用于同時估計狀態和擾動. 然 而, 在考慮網絡延遲的情況下, 如何較精確地估計系 統狀態和擾動需要進一步研究. 在 MASs 中, 隨著智能體結構的變化和規模的增 加, 數據的實時處理和計算的速度需要得到嚴格的 保障, 使用傳統分析方法很難處理這樣的實時大數 據和計算. 同時, 控制系統中的海量數據將增加網絡 的通信負擔和系統的計算負擔, 一個高效的帶寬分 配方案就變得尤為重要. 此外, 由于數據是通過網絡 傳輸的, 網絡時延對 MASs 的影響至關重要, 需要設 計相應的控制策略以主動補償網絡時延. 因此, 在大 規模的云控制系統中, 合理分配帶寬以充分利用通 信資源非常重要, 這有助于提高效率, 減少不必要的 資源浪費;另一方面, 如何補償 MASs 存在的網絡時 延和受到的擾動也是一個關鍵問題. 基于以上分析, 研究了一種考慮網絡時延和未 知擾動的 MASs 的帶寬分配和預測云控制方案. 本文 的貢獻總結如下: 1)對于具有未知擾動的 MASs, 提出了一種基于 預測的擴張狀態觀測器, 以估計每個智能體受到的 擾動并設計控制器進行補償. 2)Stackelberg 博弈方法用于解決 MASs 的帶寬 分配問題, 該問題包含預測云控制器之間的非合作 博弈和智能體之間的演化博弈. 3)提出了一種預測云控制方案, 以補償受帶寬 分配影響的網絡時延和擾動. 并給出了保證 MASs 穩 定性和一致性的充分條件.
聚焦陸戰場信息系統設計問題, 結合分布式計算最新成果, 基于“云網端”融合理念, 構建了一套適用于分布式戰場節點 和智能需求的信息系統架構. 針對所構建架構中, 智能應用和智能性提升的關鍵需求, 綜合分布式陸戰場節點資源受限、任務多樣 等特點, 在分層聯邦學習基礎上, 依據資源狀況進行自適應調整, 提供資源開銷和智能提升相均衡的使用途徑. 經實驗驗證, 該架 構和方法效果良好, 更能適應分布式條件下陸戰場節點智能性需求.
從雞鳴狗吠到汽笛轟鳴, 從人喊馬嘶到隆隆炮 聲, 科技在社會生產發展和軍事形態變遷中扮演著 至關重要的角色. 進入信息時代以來, 新興技術已經 邁上爆炸式增長之路, 軍事變革又一次走上歷史舞 臺. 作為繼機械化、信息化之后的又一個峰谷, 智能 化已成為未來戰爭的主要趨勢. 面向新的戰爭起點 和斗爭形態, 美針對中俄日益發展的“反介入/區域拒 止”能力[1] , 提出分布式作戰[2]概念, 通過“馬賽克”[3]編 成作戰力量, 以分布式殺傷網替代原有的集中式殺 傷鏈[4] , 力爭取得決策優勢[5] , 打亂我方作戰節奏, 維 持其世界霸權. 目前, 分布式作戰已經成為美軍主流 作戰概念, 對我軍未來作戰行動具有重大威脅, 亟需 開展針對性的研究. 現有技術條件下, 一旦對方將兵力全部進行分 布式部署, 兵力集中的一方將無法一擊制敵, 并遭到 來自各個方向的打擊. 此時, 必須將兵力進行合理部 署, 以分布式對分布式, 讓對方同樣無法集中火力從 各個方面襲來, 才能形成新型戰線, 層層防御. 因此, 戰場局勢將進一步呈現出分布式態勢, 分布式作戰 條件也必將成為各域戰場所必須解決的問題.
陸地是人類的傳統居住環境, 也是人類戰爭最 終需要控制的目標區域. 在聯合全域作戰視角下, 陸戰場既是決勝之所, 也是制勝之地, 發揮著至關 重要的作用. 智能化戰爭背景下, 智能信息系統是 陸戰場的神經, 是聯結分布式陸戰場節點和作戰體 系中心的重要載體, 也是作戰力量獲取智能能力的 主要途徑, 對于應對智能化背景下的分布式作戰具 有重要意義. 然而, 分布式作戰條件和陸戰場自身 特點使得陸戰場智能信息系統構建存在諸多難點具體如下:1)兵力分布廣, 干擾因素多, 體系支撐難. 現代 戰爭視野下, 陸戰場范圍不斷擴大, 兵力分布更加廣 泛, 難以為所有節點提供遠程體系支撐. 加上地形、 氣象、水文、天候等多維要素影響, 已經和體系聯結 的諸多節點隨時可能與上級斷開而成為孤立節點, 實時提供體系支撐愈發困難. 2)任務多樣化, 人文高復雜, 智能適應難. 兵種 專業分化, 武器裝備操作難度不斷增加, 陸戰場節點 面臨越來越多樣的各類任務, 預先訓練的單一智能 模型存在失效風險. 作為人類的直接居住場所, 陸戰 場復雜的人文環境對智能認知模型的準確率和時效 性提出了巨大挑戰, 更加劇了預訓練智能模型失效 的風險. 3)計算需求大, 資源高受限, 統籌協調難. 智能 信息系統的核心是不斷演化的智能能力, 現有人工 智能手段對算力的需求十分巨大, 而陸戰場資源補 給相對困難, 節點機動能力較弱, 資源高度受限, 此 時, 如何兼顧陸戰場節點智能性需求和計算、電量等 資源效率, 統籌協調全局, 極具挑戰. 為了更好地支撐分布式作戰條件下陸戰場的諸 多作戰力量, 解決分布式陸戰場中信息系統面臨的 諸多問題, 提供高效可靠智能的陸戰場信息系統支 撐, 本文基于“云網端”融合理念, 設計了一種多層自 適應的智能信息系統體系結構, 通過信息流動集成 分布作戰力量, 形成對上聯通體系、向下獲得支撐、 對敵自成體系的高效作戰體系;在此基礎上瞄準分布 式陸戰場節點任務多樣, 預訓練模型易失效的挑戰, 結合分層自適應聯邦學習方法, 進行分布式陸戰場 智能模型訓練, 盤活作戰訓練過程中產生的新數據, 實現持續學習不斷演化的戰場學習能力;對于智能模 型計算需求和分布式陸戰場節點資源受限的問題, 考慮從模型的智能訓練和智能推理兩部分入手, 結 合聯邦學習的模型替換機制, 當計算資源充足時, 參 與作戰模型的持續訓練, 當計算資源不足時, 直接利 用獲得的智能模型進行推理, 實現資源可容忍情況 下的分布式陸戰場節點智能作戰.
為了應對在未來復雜的戰場環境下, 由于通信受限等原因導致的集中式決策模式難以實施的情況, 提出了一個基于多智 能體深度強化學習的分布式作戰體系任務分配算法, 該算法為各作戰單元均設計一個獨立的策略網絡, 并采用集中式訓練、分布 式執行的方法對智能體的策略網絡進行訓練, 結果顯示, 經過學習訓練后的各作戰單元具備一定的自主協同能力, 即使在沒有中 心指揮控制節點協調的情況下, 依然能夠獨立地實現作戰任務的高效分配.
馬賽克戰[1]、聯合全域指揮控制[2]等新型作戰概 念所構想的未來作戰場景中, 傳統的多任務平臺被 分解為了眾多的小型作戰單元, 這些小型作戰單元 通常具備更高的靈活性, 能夠根據戰場環境的變化 快速對自身所承擔的任務進行調整, 以實現更好的 整體作戰效果. 在未來的新型作戰場景中, 傳統的集 中式指揮控制模式存在著指揮鏈路過長、決策復雜 度過高等問題, 從而導致決策時效性和決策質量難 以滿足要求[3] . 近年來, 邊緣指揮控制等新型指揮控制 模式應運而生, 邊緣節點也即各作戰實體將具備一 定程度的自主決策能力[4] . 由于戰場環境的復雜多變 特性, 以及作戰實體的小型化、智能化發展趨勢, 分 布式決策的模式將在未來的戰場決策中發揮越來越 重要的作用. 作戰體系是為了完成特定的作戰任務由一系列 具備各項能力的作戰單元動態構建而成, 在以往的 集中式決策模式下, 體系設計人員會根據作戰任務 的能力需求以及作戰單元所具備的各項能力, 以最 大化作戰效能或最小化作戰單元的使用成本等為目 標, 來統一地對各作戰任務和作戰單元進行匹配. 作 戰體系的“作戰任務—作戰單元”匹配問題可以建模 為一個優化問題, 當問題規模較小時, 可以采用集中 式決策的模式運用整數線性規劃等運籌學方法快速 得到全局最優解[5] , 而當問題規模較大時可以采用遺 傳算法等啟發式算法[6]或者強化學習算法[7] , 得到問 題的近似最優解. 采用集中式決策的一個重要前提 條件是中心決策節點和作戰單元葉節點之間的通信 暢通, 因為葉節點需要將自身的狀態信息和觀測信 息發送給中心決策節點, 而中心節點需要將決策命 令發送給葉節點. 然而在未來的作戰場景中, 由于敵 方的通信干擾等原因, 中心節點和葉節點之間的通 信鏈接很難保證連續暢通, 同時頻繁的信息交互會 造成一定的通信負載和通信延遲, 因此, 在未來很多 的任務場景中, 需要作戰單元根據自身的狀態信息 和觀測到的信息獨立地進行決策.
強化學習是一種利用智能體與環境的交互信息 不斷地對智能體的決策策略進行改進的方法, 隨著深度強化學習技術的快速發展, 強化學習算法在無 人機路徑規劃[8]、無線傳感器方案調度[9]等領域都取 得了非常成功的應用, 同時近年來多智能體強化學 習算法在 StarCraft域[10]等環境中也取得了很好的效 果. 在作戰體系任務分配場景中, 可以將各作戰單元 視為多個決策智能體, 那么“作戰任務—作戰單元” 的匹配任務可以視為一個多智能體強化學習任務. 而當前尚未有將多智能體強化學習方法應用到類似 作戰體系的任務分配環境中的先例. 本文的主要工 作如下: 1)建立一個通信受限情況下的作戰體系“作 戰任務—作戰單元”匹配的任務場景;2)提出了一 個基于多智能體強化學習技術的作戰體系任務分配 算法;3)通過實驗驗證了采用上述算法訓練的各智 能體, 可以在通信受限的場景下, 實現一定程度的自 主協同, 在沒有中心決策節點的情況下依然能夠實 現作戰體系任務的有效分配
無人機集群協同作戰的自主化、智能化是未來軍事指揮控制技術發展的重要趨勢, 為滿足日趨重視的集群應用需求, 提出了面向協同作戰任務的無人機集群自主決策技術概念與體系, 建立了無人機集群多任務的通信-決策-規劃-控制(communication, decision, planning, control;CDPC)自主決策框架. 根據通信拓撲結構建立了集中式、完全分布式和混合式的決策樣式, 在此基礎上, 分別建立了感性任務推理決策模型和理性任務推理決策模型, 探討了模型的求解框架以及關鍵技術解決途徑, 表示無人機集群任務決策對協同作戰的規劃和實施具有較好的指導意義.
2020 年 1 月, 中國科學院發布的 《2019 年人工 智能發展白皮書》中將“群體智能技術”列為八大人工 智能關鍵技術之一[1] , 隨著智能系統與復雜體系、感 知與判斷、分布式協同、人工智能和算法戰等理論 與技術的不斷發展與突破, 智能系統已呈現出無人 化、集群化和自主化等特征[2] . 無人機集群作為未來集 群智能系統的主要形式, 能夠實現單平臺行為決策、 多平臺任務協同, 具有集群涌現特性, 表現出了巨大 的應用前景. 無人機集群任務環境彈性大、態勢變化 快、傳感器信息不完全、通信結構不穩定, 是以決策 為主的對抗. 因此, 協同自主決策作為“感知-判斷決策-行動 (observation-orientation-decision-action, OODA)”環路循環中的關鍵技術引起了國內外廣泛 關注[3-5] . 無人機集群在復雜動態變化的環境下, 如何 根據不確定的態勢信息, 實施可解釋的自主決策推 理, 確定高效可靠的任務協同執行方式對保障集群 安全, 提升作戰效能至關重要.
按照系統科學的觀點[6] , 無人機集群系統多平臺 異構、任務需求眾多、輸入態勢變化、戰術目的復 雜、約束條件耦合, 為解決以上問題, 需要面向無人 機集群多任務設計自主決策規劃框架, 降低系統研 究的復雜性. 文獻[7]基于不確定攻防博弈態勢信息 搭建了無人機集群對抗博弈模型, 并設計博弈成本 函數計算最優策略;文獻[8]提出了一種多無人機分 布式智能自組織算法, 將集群偵察-打擊任務優化問 題分解為多個局部優化問題, 并通過集群與環境和 集群之間的信息交流實現全局優化決策;文獻[9]針 對區域偵察等典型集群任務, 采用深度學習方法構 建任務決策模型, 然后基于遺傳算法對決策模型進 行優化, 為集群實現離線學習和在線決策提供了有 效支撐, 然而現有成果從多任務角度出發, 對集群自 主決策問題進行研究相對較少.
對于集群系統協同作戰任務方面的研究, 主要 以任務規劃問題為主[10] , 此類問題大都是事先擬定好 了任務輸入類型和約束, 是一種有目標信息的多約 束優化問題. 然而對于集群如何獲得準確的任務目 標信息, 并根據態勢進行動態任務調整并沒有考慮, 此問題正是集群協同任務決策的研究重點. 現階段 無人機決策問題研究大都聚焦于空戰過程中的機動 動作決策[11-12] , 或者某個明確任務場景中的決策, 如集 群打擊任務等[13-14] , 沒有從集群協同作戰過程中戰術 戰略及任務的多樣性和復雜性方面開展自主決策研 究. 因此, 本文針對這個問題, 分析了集群任務自主 決策概念、任務定義與分類, 設計了自主決策的流 程;應用分層研究思想提出一種自主決策框架, 并根 據通信結構定義不同的決策模式;結合多種技術途徑 對無人機集群自主決策建模的體系結構和求解框架 進行了分析和探討.
視覺慣性導航系統通過初始化,對尺度信息、重力向量、速度、慣性傳感器偏差等一系列狀態估計所需參數進行快速求解,以提升系統后續導航定位與環境感知的準確性。根據傳感信息耦合方式,視覺慣性導航系統初始化方法可以分為三類:聯合初始化、非聯合初始化和半聯合初始化。基于現有研究工作,從基礎理論、發展與分類、現有方法、性能評估四個方面展開,對目前主流的初始化方法進行綜述,并總結視覺慣性導航系統初始化領域未來的發展趨勢,有利于對視覺慣性導航系統初始化方法形成總體性了解并把握其發展方向。
圖分析用于深入挖掘圖數據的內在特征,然而圖作為非歐幾里德數據,傳統的數據分析方法普遍存在較高的計算量和空間開銷。圖嵌入是一種解決圖分析問題的有效方法,其將原始圖數據轉換到低維空間并保留關鍵信息,從而提升節點分類、鏈接預測、節點聚類等下游任務的性能。與以往的研究不同,同時對靜態圖和動態圖嵌入文獻進行全面回顧,我們提出一種靜態圖嵌入和動態圖嵌入通用分類方法, 即基于矩陣分解的圖嵌入、基于隨機游走的圖嵌入、基于自編碼器的圖嵌入、基于圖神經網絡(GNN)的圖嵌入和基于其他方法的圖嵌入。其次,對靜態圖和動態圖方法的理論相關性進行分析,對模型核心策略、下游任務和數據集進行全面總結。最后,提出了四個圖嵌入的潛在研究方向。
//fcst.ceaj.org/article/2022/1673-9418/1673-9418-16-1-59.shtml
圖是復雜系統中常用的信息載體,可以表示現實中許多復雜關系,如社交網絡[1]、犯罪網絡[2]、交通網絡[3]等。圖結構作為一種非歐幾里德數據,很難直接應用卷積神經網絡(convolutional neural network,CNN)[4]和循環神經網絡(recurrent neural network,RNN)[5]等深度學習方法[6]。為了構造用于圖數據挖掘的特征表示,圖嵌入將節點映射到低維空間,生成保留原始圖中某些重要信息的低維向量。目前,圖嵌入不僅在節點分類[7]、鏈接預測[8]、節點聚類[9]、可視化[10]等復雜網絡上的機器學習任務中獲得成功,還廣泛用于社交影響力建模[11]、內容推薦[12]等現實任務。
早期的圖嵌入算法主要用于數據降維,通過鄰域關系構建相似度圖,將節點嵌入低維向量空間,并保持相連節點向量的相似性。這類方法通常時間復雜度高,很難擴展到大型圖上。近年來,圖嵌入算法轉向擴展性強的方法。例如,矩陣分解方法[13]使用鄰接矩陣的近似分解作為嵌入;隨機游走法[14]將游走序列輸入到Skip-Gram[15]生成嵌入。這些方法利用圖的稀疏性降低了時間復雜度。當前,很多綜述[16,17,18,19,20,21]對圖嵌入方法進行了歸納與總結,但存在兩大局限:一是部分綜述僅涉及傳統方法介紹,許多新模型沒有納入研究;二是這些綜述只關注靜態圖嵌入或動態圖嵌入,忽略了二者之間的關聯性。
本文對圖嵌入方法進行全面系統性綜述,有以下三方面的貢獻:(1)提出一種新的圖嵌入分類法,同時對靜態圖和動態圖方法進行分類;(2)對現有模型進行系統性分析,為理解現有方法提供新視角;(3)提出了四個圖嵌入的潛在研究方向。
摘要: 在大數據時代,圖被用于各種領域表示具有復雜聯系的數據.圖計算應用被廣泛用于各種領域,以挖掘圖數據中潛在的價值.圖計算應用特有的不規則執行行為,引發了不規則負載、密集讀改寫更新操作、不規則訪存和不規則通信等挑戰.現有通用架構無法有效地應對上述挑戰.為了克服加速圖計算應用面臨的挑戰,大量的圖計算硬件加速架構設計被提出.它們為圖計算應用定制了專用的計算流水線、訪存子系統、存儲子系統和通信子系統.得益于這些定制的硬件設計,圖計算加速架構相比于傳統的通用處理器架構,在性能和能效上均取得了顯著的提升.為了讓相關的研究學者深入了解圖計算硬件加速架構,首先基于計算機的金字塔組織結構,從上到下對現有工作進行分類和總結,并以多個完整架構實例分析應用于不同層次的優化技術之間的關系.接著以圖神經網絡加速架構的具體案例討論新興圖計算應用的加速架構設計.最后對該領域的前沿研究方向進行了總結,并放眼于未來探討圖計算加速架構的發展趨勢.