目的 對軍事領域中人機協作的應用現狀和理論現狀進行歸納與分析,指出未來的發展趨勢,旨 在為人機協作軍事系統的技術發展和設計研究提供理論方向。方法 以無人機系統、無人車系統、無人 艇系統的實際應用場景為代表,分析人機協作的軍事應用現狀;剖析軍事背景下國內外人機協作任務分 配、人機交互方式、人機交互界面設計、人機協作效能評估的研究進展;綜合前人的研究現狀對未來的 研究發展趨勢進行總結。結論 根據國內外研究的現狀、熱點與趨勢可知,人機協作的任務分配需綜合 考慮人員行為和任務時序等因素,以提高人機協作效率,探尋更優的分配模式;多模態智能交互將成為 未來人與無人集群交互的主流形態,多通道結合的信息交流將改變操作員與指控系統互動的方式,實現 人與無人集群的高效交互;態勢認知是未來智能戰場面臨的挑戰,人機協作為智能態勢認知領域的研究 奠定了基礎。
隨著戰場信息化趨勢的發展,現代化戰場的整體 規模不斷擴大,戰場要素也愈加復雜,涉及多目標任 務和多資源的體系化作戰成為了主要的戰爭形態。人 機協作是指發生在人和自動化之間的協同交互,通常 被稱作 Human-Agent Teaming 或者 Human-Automation Collaboration[1]。在軍事層面,龐大的有人/無人協同 系統會參與到信息化戰場的協同作業中,復雜的操作 任務和作戰資源需要作戰體系具備規劃任務和自主 完成目標的能力[2]。因此,在復雜多變的戰場環境下, 自主規劃系統及監督指揮人員的協同作業顯得至關 重要[3]。人機協同作戰一直是軍事領域的研究熱點, 是指將無人系統與有人系統進行有機融合,基于共享 任務或信息的形式完成共同目標,這是智能化戰爭中 具有代表性的作戰方式之一[4]。基于對相關領域的研 究及應用資料的調查,美軍于 2003 年的伊拉克戰爭 中首次實現了有人/無人機協同作戰,通過有人機指 揮“MQ-1 捕食者”無人機發射導彈,實現作戰目標 物的發射打擊任務[5]。當前,國內外對無人機領域的 人機協作應用研究愈加廣泛。為實現資源的最大化利 用,通常采用單一操作員監督多個無人機的作戰模 式,但這種方式往往會增加人機系統的總體操作負 荷[6]。例如,美國在 2018 年的“拒止環境下無人機 協同作戰 CODE”項目中采用單一操作員控制多架無 人機的模式,執行偵察、打擊等作戰任務[7]。隨著未 來作戰化的趨勢向協同一體化的方向發展,在操作者 層面和武器平臺層面,實現資源的合理利用及充分配 置是人機協同作業的重要目標。 隨著人工智能、大數據等技術的發展,智能計算 等高新技術廣泛應用于軍事領域中的指揮控制系統、 無人作戰系統及輔助決策系統等自動化系統[8]。上述 系統注重人工智能技術的應用,突破了戰場環境下人 類生理疲勞等方面的限制,通過與人類合作來執行作 戰任務,形成人機協同作戰系統。人機協同作戰主要 有以下三種類型:第一種是智能化無人系統指引有人 系統實施作戰;第二種是智能化無人系統輔助有人系 統實施作戰;第三種是智能化無人系統掩護有人系統 實施作戰[4]。在人機協作系統中,智能系統運行速度 快,適用于執行規范化的繁雜任務,而人擔任監督規 劃的角色,通常在指定或突發階段,與智能系統聯合 完成協同作業[3]。然而,值得注意的是,雖然當前的 自動化系統能夠在一定程度上實現智能化任務,但是 在態勢感知及知識理解等方面仍存在固化思維,難以 完全替代人類[9]。例如,在指揮控制系統中,人類可 以發揮態勢感知的能力優勢,分析敵方的作戰意圖, 合理地分配作戰任務。而自動化系統主要是程序化的 定量感知,對動態的戰場環境感知的靈活度較低[10]。 總體來說,智能化作戰系統距離全自主性仍有較大差 距,需要和操作人員聯合完成作戰任務。 綜上所述,人和智能系統相互配合、執行任務, 可以發揮各自的優勢,提高作戰效率。人機協作過程 涉及任務分配、人機交互、效能評估等諸多方面,只 有實現各層面的高效融合和技術突破,才能達到理想 的協同作戰效果。然而,在動態、大規模的作戰環境 下,受限于智能技術的發展程度及未知的戰場態勢等 因素,人機協同技術仍處于探索階段,有許多工程技 術方面的難題需要解決,比如如何實現合理的協同任 務分配、如何實現靈活的人機交互等問題。因此,現 階段的研究重點是探究如何將人的經驗知識與機器智 能高效融合,最大化地發揮人機協同作戰系統的效能。
隨著軍用地面無人系統研究的深入,單一的地面無人機動平臺或任務載荷很難滿足現代戰場的需求,只有任務載荷和機動平臺協同發展,地面無人系統才能在戰場中真正形成戰斗力。為進一步推動任務載荷與機動底盤協同技術的發展,綜述了搭載任務載荷軍用地面無人系統的發展背景、研究現狀及技術特點,分別從多層次多維度的環境建模、基于多模態數據的通行度估計、基于多智能體協同建模的協同規劃控制優化方法三方面對其關鍵技術進行闡述,總結了相關的研究框架和重點,并對搭載任務載荷軍用地面無人系統未來的發展方向進行了展望。
近年來,由于軍用地面無人系統在戰場中的廣 闊應用前景,世界各國紛紛投入大量的研制資源, 軍用無人系統發展迅猛[1]。軍用地面無人系統一般 由地面無人機動平臺與具有執行特定任務的上裝任 務載荷構成,如偵察設備[2-4]、火力打擊設備[5-6]、排 爆設備[7-8]等。軍用地面無人系統在執行協同打擊、 機動偵察等復合任務中,可以獲取多模態的態勢信 息[9],通過集中式算法快速處理多源信息進而下達 作戰指令;而有人作戰系統中車長、炮長、駕駛員 需要三人協同完成任務,因此在安全性、可靠性、 靈活性上軍用無人系統均具有優勢。順應陸軍新型 的非接觸、非對稱、零傷亡的作戰模式,搭載任務 載荷的軍用地面無人系統開始成為戰場環境中重要 的作戰力[10]。2015年,俄羅斯首次將軍用地面無人 系統投入敘利亞戰場,利用地面無人系統與無人機 形成空地一體戰斗集群系統,俄軍以零傷亡的代價 消滅了近兩百名恐怖分子。2020年7月,美國陸軍將 重型無人戰車納入作戰部隊單位,參加了科羅拉多 州卡森堡的士兵作戰試驗,成功完成相關測試。2023 年,在俄烏沖突中,俄羅斯在烏克蘭軍事沖突區中 投入“馬克”軍用無人打擊系統。
無人集群系統是近年來國內外軍事領域的研究重點, 正在推動無人作戰樣式由 “單平臺遙控作戰” 向海陸空協作的 “智能群體作戰” 轉變. 綜述了近年來國內外在無人集群系統方面的最新研究進展, 包括軍事、國防和學術領域在無人系統自主 協同技術方面的探索和實踐, 闡述了無人集群系統相關的關鍵技術, 包括多 Agent 系統自主協同、多 Agent 系統態勢共識、未 知系統動力學、群體智能理論與技術、機器學習方法、行為決策方法以及實驗場景模擬等, 分析了不同關鍵技術的技術特征、 面臨挑戰和發展趨勢.
2018 年美國國防部頒布《國防部人工智能戰略 摘要》, 強調人工智能技術在軍事領域的應用, 并于 同年發布了無人集群系統并行作戰場景[1]. 2017 年 至今美國戰略和預算評估中心連續發布針對中俄兩 國的馬賽克式集群作戰等顛覆性作戰模式, 打造全 球范圍內的武器系統協同作戰[2] . 我國國務院在 2017 年提出《新一代人工智能發 展規劃》, 倡導人工智能領域的軍民融合, 以加快國 防技術的成果轉化, 并為指揮決策、軍事論證和國防 科研提供有力支撐[3] . 其中, 以群體智能為核心技術 的無人集群系統自主協同作戰是未來戰爭重要樣式, 美軍已經啟動高度自主智能化集群武器裝備的研究. 我軍也在積極探索利用人工智能算法提高無人系統 的智能化水平, 以取得戰爭主動權. 進一步看, 現代 戰爭中戰場環境瞬息萬變, 僅僅通過單系統的協作 不可能完全掌握戰場環境和態勢, 海、陸、空多類智 能系統的協同感知、聯合攻擊必將成為未來戰爭的 作戰模式. 2020 年 1 月, 中國科學院發布的《2019 年 人工智能發展白皮書》中, 將” 群體智能技術” 列為 了 8 大人工智能關鍵技術之一[4] . 同時, 無人裝備具 有低成本、小型化、功能單一、組網靈活等特性, 使 得無人裝備集群作戰通過數量優勢來打擊敵人. 在 網絡環境下, 這類由異質、異智系統 (智能體) 通過 彼此之間的信息交互構成的多維異構無人集群系統, 看作是異構智能群體系統, 即多智能體 (Agent) 系統. 其中, Agent 是對外界的刺激作出適當反應的實體, 不是被動的接受消息和控制. 展望未來, 誰懂得如何最好地使用無人集群智 能系統, 誰就有望在戰爭中取得巨大優勢.
許多研究實驗室和政府機構對開發機器人系統集群的興趣日益濃厚,這些系統有能力協調它們的行動,為執行一個共同的目標而集體工作。作為一個團體,機器人群可以執行簡單和復雜的任務,這是單個機器人無法做到的。蜂群中的每個機器人單元都可以被視為一個自主成員,根據內部規則和環境狀態做出反應。然而,正是機器人的這種自主決策能力(單獨或作為一個群體),引起了國際社會的關注。
2014年,各國政府在《聯合國特定常規武器公約》(CCW)的主持下,開始就致命性自主武器系統(LAWS)領域的新興技術進行國際討論。在這種情況下,對蜂群進行了討論--盡管是小范圍的。各個國家和民間社會行動者都對蜂群作為(致命的自主)武器進行部署表示關切。在2017年《特定常規武器公約》締約國會議期間,民間社會行為者發布了一個虛構的視頻,說明他們對蜂群的擴散以及惡意行為者可能利用蜂群對個人進行大規模致命攻擊的擔憂。
雖然不清楚各國是否也有這種擔憂,但各國至少認識到,在未來的情況下,進攻性措施不太可能由一個單一的系統組成。相反,它們將由具有互補能力的此類系統群組成。機器人群尚未投入使用,而且技術相當脆弱,但機器人群的前景是非常真實的。蜂群可用于情報、監視和偵察行動;周邊監視和保護;分布式攻擊;壓倒敵人的防空設施;部隊保護;欺騙;搜索和救援行動;反擊蜂群;以及枯燥、骯臟和危險的任務。因此,國際社會正在努力解決關于如何--如果有的話--在未來的沖突中負責任地、合法地和安全地使用機器人群的問題。
與機器人群和致命性自主武器系統有關的一個關鍵問題是圍繞著 "人機互動 "和 "人類控制 "等概念的含義和運行。正如主席在2016年《特定常規武器公約》專家會議的總結中所述,在未來的情況下,"如果致命性自主武器系統群作為武力倍增器發揮作用,如何對武力的使用保持有意義的人類控制將是不清楚的"。隨著《特定常規武器公約》致命性武器系統政府專家組進入關鍵的兩年,除其他活動外,它將審查和制定致命性武器系統領域新興技術的規范和操作框架的各個方面,了解這一領域的研究和發展方向至關重要。
本研究報告通過研究蜂群機器人技術對人機互動的影響來支持和指導這些審議工作。本報告對人類控制蜂群的各種方法進行了分析:(1)通過指令進行人機互動;(2)通過設計和使用特定的控制架構,將人機和機機互動結合起來;以及(3)通過設計和使用特定的蜂群內合作方法,實現機機互動。此外,它將人類控制的概念放在軍事決策的背景下,從而引入了一個指揮和控制的框架,在這個框架內可以進一步討論、分析和發展諸如人機互動和人類控制等概念。這項研究的結果與各種各樣的關鍵利益相關者有關,包括政策制定者、軍事組織、外交界、技術界、學術界、私營部門和民間社會組織。
現有的蜂群--在民用和軍用領域--要么正在開發,要么仍處于測試和演示階段。過去和正在進行的項目主要表明,蜂群能夠執行特定的(狹窄的)任務(形成形狀、編隊飛行、前往和搜索或繪制一個區域、在周邊巡邏、保護一個邊界)。因此,蜂群可以被認為是一種新興技術,因此,可以作為一個有用的案例來討論人類控制的方法。
在軍事背景下操作蜂群的主要挑戰涉及到設計和實施適當的人機和機機互動。研究人員和開發人員已經采取了許多方法將人的參與注入蜂群中。在蜂群的背景下,人的參與或控制通常是指指揮、控制或協調:
指揮:人類發出什么命令?(與人機關系有關。)雖然機器人群被期望在大多數情況下自主運作,但它們不會在真空中或沒有指令的情況下運作。機器人群最終在人類決策者的指導下運作。這些指令可能以各種形式出現,包括預編程的行為集或高級或低級的指令。
控制:哪些控制架構決定了蜂群內的任務分配? 與機器-機器關系有關)在人類發出指令后,蜂群依靠算法進行編隊、監測、間隔、飛行路徑、任務分配、目標識別等。這些算法,或如它們也被稱為控制架構,決定了蜂群內的任務分配。例如,命令可以下達給作為中央控制器的一個機器人,但它們也可以下達給幾個小隊長或整個蜂群組合。
協調:蜂群如何執行這些任務?(與機器-機器的關系有關)在人類向蜂群(或蜂群中的特定單元)提供了命令,控制架構也確定了命令的分配方式后,蜂群必須協調其集體行為和分配的任務。蜂群如何行動這些分配的任務,部分取決于協調方法。例子包括領導者-追隨者(一個機器人單元是領導者,其他機器人作為追隨者),以及共識算法(單個機器人相互溝通,通過投票或基于拍賣的方法收斂于一個解決方案)。
目前缺乏研究調查人類如何有效地指揮、控制和協調蜂群,如何對蜂群進行有效和負責任的參與仍然是蜂群機器人技術的一個新興研究領域。關于人類控制致命性自主武器系統和蜂群的討論有許多相似之處。然而,由于兩個原因,蜂群可能使討論進一步復雜化。
首先,在致命性自主武器系統領域關于人機互動的辯論主要集中在人類操作員和一個(或至少是有限數量的)致命性自主武器系統之間的關系。當只有一個車輛(或有限數量的車輛)時,傳統的控制形式是可能的。然而,對于機器人群來說,直接控制單個機器人單元是不可能的,而且會適得其反。對于蜂群,有必要依靠算法來進行編隊、監測、間隔、飛行路徑、任務分配、目標識別等等。因此,為了使人類的參與保持有效,必須越來越多地轉移到蜂群整體上。
第二,除了人機互動,蜂群不可避免地要進行機-機互動。單個機器人與蜂群中的其他機器人互動以完成任務,在此過程中,可能出現集體行為。雖然本報告顯示,有不同的方法來設計指揮、控制架構和合作方法,以幫助減輕蜂群帶來的一些挑戰,但似乎沒有一般的方法來解釋個人規則和(期望的)群體行為之間的關系。有些人可能會爭辯說,蜂群中的機器-機器行為不可避免地意味著沒有人類控制。雖然在某些情況下這可能是真的,但這并不是蜂群技術的必然結果。
隨著國際社會在2020年和2021年繼續討論致命性自主武器系統,并將重點放在指導原則的進一步發展和運作上,人類決策的作用無疑仍將是核心問題之一。通過在審議人類控制和人機互動時利用蜂群等近期技術和相關的指揮和控制模式,國際社會可以著手對軍事實踐中如何行使或不行使控制權有一個更全面的了解--現在和未來的行動。
本研究報告的目的是支持目前關于致命性自主武器系統領域的新興技術和相關概念(如人機互動)的討論并為其提供信息。這項研究的結果與各種關鍵利益相關者有關,包括政策制定者、軍事組織、外交界、技術界、學術界、私營部門和民間社會組織。在此背景下,本報告研究了在蜂群機器人領域的指揮、控制和協調方法。
首先在第2章中闡述了包括蜂群在內的武器將被使用以及人類將行使控制權的背景。了解軍事決策中C2的這一背景框架與討論 "有意義的人類控制 "和 "人機互動 "等概念有關,這與致命性自主武器系統和蜂群有關。
第3章從技術角度介紹了蜂群的定義特征,而第4章解釋了在正在進行的蜂群研發中如何考慮和應用指揮、控制和協調。第5章介紹了不同類型的蜂群及其特征之間的權衡概念,其依據是一些技術屬性。
由于蜂群機器人技術仍然是一門相對年輕的學科,而且目前還沒有(軍事)蜂群投入使用,因此第6章闡述了潛在的軍事應用、蜂群投入使用的挑戰和脆弱性。第7章是本報告的結尾,提出了在目前政府專家組關于致命性自主武器系統討論的背景下,對未來發展的相關考慮。
無人作戰飛行器(UCAV)是一種無人飛行器,用于情報、監視、目標獲取和偵察,并攜帶飛機軍械,如導彈、反坦克導彈和/或炸彈的硬點,用于無人機打擊。這些無人機通常由人類實時控制,具有不同程度的自主性。與無人監視和偵察飛行器不同,UCAVs同時用于無人機打擊和戰場情報。無人駕駛戰斗飛行器(UCAV)的推進技術與UCAV的飛行性能有很大關系,這已經成為航空業最重要的發展方向之一。需要指出的是,UCAVs有三種推進系統,分別是燃油、油電混合和純電動。本文介紹并討論了這三類推進系統的分類、工作原理、特點和關鍵技術。它有助于建立UCAV推進系統的發展框架,并提供電動推進UCAV的基本信息。此外,還討論了電動推進UCAVs的未來技術和發展,包括高功率密度電機、轉換器、電源。在不久的將來,電力推進系統將被廣泛用于UCAVs。高功率密度系統將成為電動UCAVs的發展趨勢。因此,這篇評論文章對UCAVs的推進系統提供了全面的看法和多種比較。
軍事領域體系結構研究已經歷 20 余年,對于促進軍事領域體系建設發揮了重要作用。通過文獻分析識 別出軍事領域體系結構研究的 3 個主要方向,即體系結構框架與設計方法、體系結構概念與建模、體系結構管理設計 與操作,對每個方向的主要內容和研究進展進行了綜述,綜合相關研究情況,提出下一步的研究建議。 現代戰爭強調體系對抗,加強體系建設是軍事 領域的重要課題。自 20 世紀 90 年代美國國防部推 出 C4ISR 體系結構框架后,體系結構方法論在軍事 領域的研究與應用已經歷了 20 余年的歷程,在軍 事體系的需求與設計、集成與構建、演化與評價中 發揮了重要作用,正得到越來越多的關注。軍事領域體系結構研究與其他領域在研究內 容、技術上既有共性也有特性,既包含體系結構基 礎理論探索,也包含大量方法研究和應用實踐。Aier 等在分析國外大量體系結構文獻的基礎上,按照研 究內容把體系結構研究劃分為體系結構理解、體系 結構表達、體系結構使用 3 個方面[1]。Simon 等通過 文獻分析,把體系結構研究劃分為體系結構框架、 體系結構概念與建模、體系結構管理設計與操作 3個方面[2]。高松等從關鍵技術角度劃分為體系結構 框架、體系結構設計方法及工具、體系結構綜合評 估方法 3 個方面[3]。本文綜合上述劃分方式,通過 文獻分析識別出 3 個主要研究方向,即體系結構框 架與設計方法、體系結構概念與建模、體系結構管 理設計與操作,并建立了邏輯關系框圖,如圖 1 所 示。以下分別對 3 個方向研究進行綜述,進而得出 下一步的研究建議。
針對現階段無人機智能化程度相對有限的問題,分析有人/無人機協同作戰。梳理有人/無人機協同作戰 的概念、特點需求及歷史概況;描述美國、俄羅斯、英國等國有人/無人機協同作戰的研究現狀;結合科技進步與戰 爭形態發展,重點梳理有人/無人機協同作戰的關鍵技術,對有人/無人機協同作戰的發展前景進行展望。結果表明, 該分析可為我軍發展有人/無人機混合編隊提供參考。
有人/無人機協同作戰是指空戰戰場中由有人 機與具備一定自主能力的無人機構成的混合編隊協 同遂行上級下達的一系列戰役戰術作戰任務。其中 有人機主要發揮“大腦”作用,具體表現為:與后 方地面站指揮控制中心溝通聯系,傳達/下達任務分 配指令,前方戰場突發情況應急處置等。無人機主 要發揮“肢體軀干”作用,具體表現為:接收并執 行上級下達的任務指令(攻擊、監視、偵察、毀傷評 估、掩護誘導救援),提供局部戰場態勢感知、敵方 防區內火力部署情況、重要重點目標分布情況等高 價值情報信息等[1-4]。無人機投入戰爭使用至今已有數十年,然而其 智能化水平、自主能力以及可靠性等綜合性能仍然 無法達到正常行為人的水平,這就決定了無人機在 戰場上無法像人一樣觀察、思考、判斷、決策、行 為,并且可以預見在未來相當長的一段時間內無人 機仍然無法企及這種水平。而戰場上有人機中的戰 機只是載體,“人類的好幫手”,真正的“掌舵者” 是人,何時攻擊?如何攻擊?攻擊之后怎么辦?這 一系列的思考、分析、動作、評估都需要以人為主(戰 機為輔)來完成,以上事實毫無疑問都佐證了人類在 空戰戰場上無可替代的作用[5-8]。然而,有人機中的 人需要休息,無法全天候連續執行高強度工作,也 無法在不適宜人類生存的環境(火山、高輻射區域等)中工作,而且培養一名優秀戰機飛行員也需要相 當長的時間與成本;因此,有人/無人機協同作戰模 式應運而生。成本代價低的無人機能夠全天候待命, 執行高強度高危以及某些特種工作,昂貴高度智能 的有人機能夠在復雜多變的戰場上臨陣指揮,隨機 應變,兩者相輔相成,相得益彰,進而大力提升有 人機與無人機編隊的整體作戰效能[9-10]。有人/無人機協同作戰在 20 世紀 90 年代由美軍 率先提出,并且美國陸軍、海軍、空軍也相繼進行 了一系列理論與工程試驗研究[11-12]。美國陸軍于 20 世紀 90 年代初首次提出了以有人/無人直升機為研 究對象的“Bird Dog”項目,并于 20 世紀 90 年代 中期啟動了機載有人/無人系統技術(airborne manned unmanned system technology,AMUST)項 目,在一系列相關概念與技術的提出與驗證后,美 國陸軍在 1999、2006、2011、2014、2016 年先后進 行了有人直升機(主要包括阿帕奇、基奧瓦等)與無 人機(主要包括獵人、影子、灰鷹等)協同作戰的試 驗驗證。繼美國陸軍 1996 年啟動 AMUST 項目后, 美國海軍也于 1997 年啟動了“海軍版的有人/無人 機協同作戰”項目—戰術控制系統(tactical control system,TCS)項目,并于 2003、2014、2015 年相 繼開展了一系列有人機(主要包括 P-3C、F/A-18、 AV-8B)與無人機(主要包括 RQ-8A、MQ-4C、 X-47B、UTAP-22)協同作戰項目的試驗驗證。美國 空軍緊隨美國陸軍、海軍,于 2003 年啟動了軟件使 能控制(SEC)項目,2015 年,美國空軍更是正式推 出了當下最著名的有人/無人機協同作戰項目 ——“忠誠僚機”項目,直至今日,美國空軍的“忠 誠僚機”有人機(主要包括 F-16 等)與無人機(主要 包括海弗-空襲者等)協同作戰項目已經進行了多次 試驗驗證。此外,俄羅斯、英國、法國、澳大利亞、 日本等國也先后開展了有人/無人機協同作戰項目 的研究[13-17]。
首先,美國軍隊所支持的作戰任務范圍涵蓋了在日益困難的作戰環境下的廣泛作戰需求。第二,對手的性質和普遍性,不僅包括主權國家,而且包括非國家恐怖組織,威脅到美國利益的關鍵地區穩定和美國在國內和國外的利益安全。 第三,當前和未來行動范圍和速度對及時有效地適應和應對局勢的能力提出了挑戰。預測對手的行動并以否定或最大限度地減少這些行動的影響的能力仍將是發展軍事能力的首要目標。 最后,技術的進步不僅提高了自身支持軍事行動的能力,也提高了敵人的技術先進性。他們在自己的行動中利用越來越多的新興技術能力的能力,或者,可能更具破壞性,利用技術漏洞來對付美軍,增加了新出現的威脅。
雖然美國繼續享有對那些威脅美國和盟國的重大技術優勢,但這種優勢永遠處于危險之中。隨著美國防部試圖處理其目前和未來行動中日益增加的復雜性,自主性的發展、部署和利用被吹捧為擴大作戰能力的基本手段。
盡管幾十年來,自動化一直是軍事和工業應用的主要內容,但自動化系統的早期應用也面臨著類似的挑戰。自動化的可靠性已大大改善,并繼續推進適應不確定和模糊的作戰環境動態的能力。然而,這些同樣的技術,像大多數技術進步一樣,導致了意想不到的,而且往往是不理想的后果。大量的研究致力于了解適應性自動化和人類-自動化協調在校準自動化系統以適應復雜環境中的動態情況方面所發揮的作用。 復雜環境中的動態情況。
第711人類性能聯隊的協作交互和團隊處發起了一項計劃,調查與先進人類自主性互動相關的問題,特別是與現有的人類-自動化協調研究的對比。決策優勢行動工具(COATDS)任務的啟動是為了調查人機交互的問題,了解自主系統發展的原則,并利用這種理解來指導交互的發展,以支持和加強復雜工作領域的人機協調。
這份最終報告總結了 COATDS 工作的整體文獻綜述部分。有關文獻綜述工作的更多信息也可在兩份早期出版物中找到(Hooper 等人,2015 年;Duffy 等人,2016 年)。本報告的主要目的是為讀者提供有價值的信息,讓他們了解算法和技術的工作知識,以及迄今為止為將其應用于集成的人類自主系統而開發的最佳實踐。除非另有說明,否則信息來自普遍接受的知識或人工智能的主要教科書“人工智能:現代方法”(Russell Norvig,2003 年)中的著作。由于本節的目的是收集和呈現為了讓讀者對這些技術有一個粗略的了解,許多示例直接取自本文,沒有明確引用以提高可讀性。此外,我們為這項工作開發的分類法中包含對方法的審查,包括介紹性材料定義關鍵術語并提供統一的框架和描述符。該報告最后對許多解決問題的方法進行了簡短的分析總結,以提供一個方便的參考工具,交互開發人員可以使用該工具快速檢索關鍵信息。
人工智能(AI)應用于武器系統是過去10年研究的一個主要趨勢。這些舉措旨在提高武器的準確性,執行非主動的瞄準手段,幫助導航和制導與控制(例如,在全球定位系統被拒絕的情況下),并減少與傳統的基于物理學的方法相比的整體計算資源,以便在更小、更實惠的武器系統上實現智能瞄準。這項研究還包括將作戰人員的戰斗空間擴展到無人駕駛飛行器,并使用蜂群方法與有人和無人平臺進行合作。
我們首先概述了人工智能的描述和歷史,并概述了人工智能在武器系統中的原理、技術和應用。這包括對監督自主系統;制導、導航和控制;行為和路徑規劃;傳感器和信息融合;智能戰略和規劃;兵棋推演建模;以及認知電子戰的研究和計劃的回顧。
然后,對將人工智能應用于武器系統的系統和項目進行了調查。雖然重點是基于美國的系統和項目,但也包括一個關于俄羅斯和中國相關系統的小節。最后,我們對將人工智能用于武器系統的倫理考慮進行了簡要評論。
機器學習(ML)和人工智能研究的最新進展揭示了人工智能在實現創新、增加機器的效用以及增強人類能力和經驗方面的力量和潛力。人工智能技術的顛覆性和其影響的深度還沒有被廣大公眾完全掌握。考慮到新時代的新興技術威脅,展示關鍵和相關的人工智能研究和最先進的技術是很重要的,這些技術不僅為武器系統提供了比傳統武器系統更多的自主權,而且大大增加了它們的殺傷力和戰斗生存能力。最終,人工智能在開發改變游戲規則的技術方面帶來了巨大的戰略機遇,這將確保國家安全、繁榮和技術領先地位。
美國軍方在創造先進的常規武器技術方面取得了巨大的進步,這些技術支持了士兵在戰場上的任務并增強了他們的能力。這些常規武器技術大多是自動化系統,在計劃、執行和完成一項任務或使命時依靠一套預先編程的規則。然而,在中國和俄羅斯等國家新開發的武器的前沿陣地上,人工智能支持的戰爭和高超音速武器給美國武裝部隊帶來了新一代的質量挑戰。下一代戰斗的步伐要求為戰略決策進行時間緊迫和大量的戰斗信息處理,這使得美國的許多常規武器系統只能執行低風險的任務,并在核領域之外處于威懾力減弱的態勢。
必須承認,人是昂貴的訓練資產。在戰場上增加更多的人員并不是推進最先進的戰爭的優雅或廉價的解決方案。相反,用支持人工智能的智能硬件來增強人在回路中的系統,可以在戰區提供更多的眼睛和耳朵,并通過使人工智能系統執行一些簡單和常規的任務來釋放人類的決策。
此外,無人駕駛作戰飛機系統(UCAS)是一種成熟的具有成本效益的系統解決方案,用于執行情報、監視和偵察(ISR)任務和遠程空襲。然而,自動化能力仍然受到人類在環形操作、評估和接觸的限制。雖然在任何可預見的未來都沒有打算消除武器化人工智能系統中的人類元素,但人類的能力仍然構成這些系統協同潛力的上限。但是,一個由人工智能驅動的智能武器系統的新生態系統將迎來新的戰爭形式和戰略。
人工智能國家安全委員會在其2021年的報告中提出,美國國防部(DoD)的軍事企業在整合人工智能技術方面落后于商業部門,并敦促在2025年前為整個國防部廣泛整合人工智能奠定基礎[1]。
幾個世紀以來,哲學家們一直在考慮以某種形式人工復制人類智能的某個方面的概念。1869年,威廉-杰農創造了第一臺基于布爾邏輯實現邏輯計算的機器。該機器能夠比人類更快地計算布爾代數和維恩圖。隨著這種邏輯計算機器的發展,人們很自然地質疑機器是否可以通過邏輯推理來為人類解決問題并做出決定。圖1-1中的時間軸顯示了人工智能的歷史和演變,并在本節中進行了詳細說明[2]。
在理論計算機科學的一些最早的工作中,英國數學家阿蘭-圖靈(Alan Turing)思考了機器是否能像人類一樣智能地行為和解決問題的問題。他在他的圖靈測試中提出,如果一臺機器能模糊地模仿人類這樣的智能生物,那么這臺機器就是智能的。這一理論測試成為一種指導性的形式主義,在這種形式主義中,當前的機器被測試其模仿人類智能概念的能力或潛力。作為測試的見證,Loebner獎是一個圖靈測試競賽,其任務是根據圖靈提出的基本問題來評估機器智能研究的現狀。
1928年,約翰-馮-諾伊曼證明了Minimax算法的基本定理,該算法旨在提供一種在零和博弈過程中使最大可能損失最小的策略。
圖1-1. AI歷史年表
在第二次世界大戰的高峰期,阿蘭-圖靈和他的團隊開發了一種機器算法,可以破譯德國的英格瑪信息密碼。他的算法的成功,推動了將復雜任務委托給機器的進一步努力,是機器計算的基礎,也是ML發展的先導。
1943年,McCulloch和Pitts開創了神經網絡(NN)的最早概念--McCulloch-Pitts的形式網絡理論--這在1949年馮-紐曼在伊利諾伊大學的四次演講中得到了體現[3]。
大約在同一時間,約翰-麥卡錫,一位計算機科學家,在1955年創造了 "人工智能 "來指代機器智能;計算機科學家艾倫-紐維爾;以及赫伯特-A-西蒙,一位經濟學家和政治學家,開創了第一個旨在自動推理的真正程序(稱為邏輯理論家)。隨著這一突破性的努力,對智能機器的探索開始了,為人工智能作為計算機科學的一個新的學術研究領域鋪平了道路。
1957年,一位名叫弗蘭克-羅森布拉特博士的心理學家開發了一個名為 "感知器 "的簡化數學模型,描述了我們大腦中的神經元如何運作。這一成就被強調為 "Perceptron收斂定理"。
同年,理查德-貝爾曼開發了動態編程,用于解決一類最佳控制問題。他還介紹了離散隨機最優控制問題的馬爾科夫決策過程表述,這為現在所稱的 "強化學習 "奠定了重要基礎。
在這些發展之后,另一位名叫阿瑟-塞繆爾的人工智能先驅利用他早先在ML方面的開創性工作,成功地開發了第一個檢查者算法。他實現了現在被稱為 "Alpha-Beta修剪 "的早期版本,這是一種搜索樹方法,通過Minimax算法減少評估節點的數量。1959年,一位名叫威廉-貝爾森(William Belson)的統計學家開發了一種名為決策樹的非參數、監督學習方法的早期版本。
在20世紀60年代,人工智能研究的重點是解決數學和優化問題。1960年,羅納德-霍華德提出了馬爾科夫決策過程的策略迭代方法,建立了一些與強化學習有關的最早的工作。
到1968年,著名的路徑搜索算法A-star是由計算機科學家尼爾斯-尼爾森提出的。60年代末,機器人建模、控制和機器視覺方面取得了進展,導致在1972年開發了第一個名為WABOT-1的 "智能 "擬人機器人,并整合了肢體操縱、視覺和語音系統。
Harry Klopf的 "適應性系統的異質理論 "的復興對適應性系統的試錯范式的發展有很大影響。1977年,Ian Witten提出了最早的強化學習系統之一,使用了時間差法。理查德-薩頓和安德魯-巴托設計了一種強化學習算法,稱為演員批評法。
由于70年代中期到80年代末計算機的計算能力限制,人工智能研究在有大量數據處理要求的應用中發現了困難,如視覺學習或優化問題。同時,數學研究 "證明 "了(單層)感知器不能學習某些模式。此外,1973年發表的一份Lighthill報告對人工智能的潛力非常悲觀,這導致人工智能研究的資金被削減。結果,資金短缺導致人工智能的研究經歷了一個被稱為 "人工智能冬天 "的時期。
到了80年代中后期,繼1986年多層感知器的發展之后,在NNs方面也做出了重要的理論貢獻。這些貢獻是David Rumelhart在1986年開發的遞歸神經網絡(RNNs),John Denker等人在1987年開發的貝葉斯網絡,以及Yann LeCun在1989年開發的卷積神經網絡(CNNs)。
此外,Chris Watkins在1989年開發了另一種重要的強化學習方法,稱為 "Q-Learning"。1992年,在IBM的Thomas J. Watson研究中心,Gerald Tesauro通過自我強化學習為雙陸棋游戲訓練了TD Gammon程序。1997年,IBM的 "深藍 "計算機使用粗暴的、基于搜索的算法擊敗了國際象棋世界冠軍加里-卡斯帕羅夫,使其成為第一個在國際象棋中戰勝頂級職業選手的程序。
在90年代末和21世紀初,在ML中看到的大部分進展是由計算機處理、存儲和分布式計算方面的指數級進展所推動的。2007年,需要大量計算資源的保證最優玩法在跳棋中得到了解決。在過去的20年里,圖形處理單元用于通用計算的激增導致了今天人工智能應用的進一步進展,特別是在2012年和2014年,不同的NN拓撲結構,如殘差網絡和生成式對抗網絡的發展。
2015年,ImageNet競賽,一個為約400萬張圖像的ImageNet圖像集開發分類器的公開競賽,有一個冠軍,其錯誤率被認為低于一個人。2016年,DeepMind的AlphaGo程序在擊敗當時被認為是最優秀的圍棋選手李世石后,成為最佳AlphaGo選手。繼AlphaGo的學習能力之后,AlphaZero在2017年擴展了AlphaGo,成為國際象棋和Shogi的最佳棋手。
2019年,美國國防部高級研究計劃局(DARPA)推出了AlphaDogfight,這是基于人工智能的空戰算法在模擬的F-16狗斗中與經過頂級訓練的飛行員進行的一系列三輪競賽。第一輪和第二輪比賽中,人工智能程序相互競爭。第三輪將人工智能勝利者的飛行員提煉出來,與美國空軍武器學校的優秀畢業生進行競爭。蒼鷺系統的人工智能飛行員不僅在競爭激烈的人工智能空中戰斗人員中獲勝,而且在與訓練有素的人類F-16飛行員的較量中取得了令人難以置信的五次勝利。
OpenAI在2020年5月推出了一個名為GP3的 "自然語言處理 "模型,它生成的寫作內容與人類無異。其最新版本可以從簡單的描述性語言生成編程語言代碼[4]。人工智能的歷史繼續向前發展,特別是對國防部的武器系統應用。本報告的其余部分將調查與武器系統有關的當代人工智能技術和系統。
根據Barr和Feigenbaum的說法,人工智能被定義為 "計算機科學中與設計智能計算機系統有關的部分,即表現出我們與人類行為中的智能有關的特征的系統--理解語言、學習、推理、解決問題等等"[5]。
Stuart Russel和Peter Norvig在他們的《人工智能:一種現代方法》一書中對人工智能的最新定義是:"設計和建造能夠從環境中接收感知并采取影響環境的行動的智能體" [6]。
Pei Wang優雅地將智能定義為 "在知識和資源不足的情況下的適應"[7]。雖然該定義沒有說明適應的目的(如目標),但它揭示了為達到這種智能需要完成的工作。
如果要以人類為中心定義人工智能,即執行人類智能水平的任務,那么人工智能需要感知、推理、知識構建、推理、決策和計劃、學習、交流,以及有效移動和操縱環境的能力。
人工智能的科學目標是回答哪些關于知識表示、學習、規則系統、搜索等的想法可以解釋各種類型和水平的真實智能。工程目標是為不同的應用領域開發人工智能技術,以解決現實世界的問題。
在人工智能的科學基礎上,我們發現來自不同科學領域的可識別概念--哲學、邏輯/數學、計算、心理學和認知科學、生物學和神經科學以及進化。在尋求發現和更好地理解人工智能是什么或將是什么的過程中,來自這些不同知識領域的貢獻已經被證明是不可避免和不可或缺的了。許多研究人工智能的領域都在同時構建人類認知如何運作的模型,并在它們之間采用有用的概念。例如,NN,一個源于生物學的概念,試圖在簡化的人工神經元的基礎上建立人工系統,這個概念導致了一個簡單的抽象知識結構的表示,足以解決大型計算問題集。
人工智能大致分為三個主要層級--人工狹義智能(ANI)、人工通用智能(AGI)和人工超級智能(ASI)。圖1-2說明了這三個層級中的各種分組,本節將更多地討論這些分組。
ANI是對一個執行狹窄或單一任務的人工智能系統的描述。它可以包括各種方法來獲得結果,如傳統的ML(以圖像分類為例)或目標檢測(包括ML和基于規則的系統)。給定一組規則或約束,它的目標是提供一組代表狹義任務的輸出。ANI不會擴展或學習新的認知,也不會自我學習新的操作模式。數據挖掘、大多數專家系統和針對某一應用的預測功能(例如,垃圾郵件檢測和面部識別)都被認為是ANI的形式。ANI還包括 "有限記憶人工智能"--用于自動駕駛汽車的系統類型,使用過去的經驗(訓練),并學習做決定,隨著時間的推移而改進。
AGI是一種更強大的智能形式,因為它被更多類似人類智能的特征所增強,例如自主學習的能力和解釋情緒和語音語調的能力。這使得與AGI相關的智能與人類的智能水平相當。AGI的一些關鍵核心能力如下:
ASI是一種超越最聰明的人類頭腦的智能模型。實現ASI的方法仍在概念化中,但將是那些超越AGI并需要某種自我意識的系統。這些系統最好能代表所有人類的認知能力,甚至更多。
ML是機器從數據中學習的能力,目的是做出準確的預測。它大致分為四類學習,提供了豐富的專用和通用的技術家族。
在這種形式的學習中,訓練數據使用包含的輸入和標記的或預定的輸出數據。如果有缺失的輸入或輸出條目,它們會被預處理,以便將一個輸入正確地映射到其真正的對應輸出。通過從正確生成的訓練數據集中學習,系統學會了將不在原始數據集中的輸入與預測的輸出(標簽或值)聯系起來。這種類型的訓練解決的典型問題是回歸和分類[8]。
這種形式的學習中,系統直接從未標記的數據中發現有趣的或隱藏的結構[9]。無監督學習被用于聚類分析、降維或估計可能產生輸入數據的密度[8]。
當數據集包含有標記的和無標記的數據時,這種學習形式的系統利用無標記的數據來更好地捕捉潛在的數據分布,并獲得一個更好的預測,如果它只從標記的數據中訓練的話。這種學習形式適用于訓練數據集中的標注數據遠遠少于未標注數據的情況[8]。
在這種學習模式中,系統使用獎勵/懲罰機制進行訓練,這樣它所選擇和執行的行動,當行動可取時,會使系統得到獎勵,當行動不可取時,會受到懲罰。強化學習問題涉及學習如何做(如何將情況映射到行動上)以最大化數字獎勵信號[9]。
人工智能有可能應用于武器系統生態系統的許多方面。它被用來控制系統,從而實現自主性和提高性能,以在具有挑戰性的環境中選擇指導、導航和控制方面的問題。同樣,人工智能可用于解決任務和路徑規劃中的挑戰性問題,從而實現更高水平的復雜任務目標和操作要求。人工智能也被用于電子戰領域的支持、反制,甚至是反制措施。它還可能被用于來自不同系統層次和領域的信息融合,以泄露抽象的高價值戰場情報,并提供關鍵線索和快節奏的決策,從而在現代戰爭中創造寶貴的戰術優勢。
報告的這一部分將強調最先進的人工智能方法在適用于自主和武器系統的各種人工智能問題領域的使用。它是根據以下問題領域來組織的。
自主性
感知中的人工智能
制導、導航和控制中的人工智能
任務和路徑規劃
智能戰略
對手建模
認知型電子戰
第一章 引言
1.1問題陳述
1.2常規武器系統
1.3 AI簡史
1.4什么是AI?
1.4.1 ANI
1.4.2 AGI
1.4.3 ASI
1.5 ML
1.5.1監督學習
1.5.2無監督學習
1.5.3半監督學習
1.5.4強化學習
第二章 最先進的方法
2.1學習人工智能范例
2.1.1深度學習
2.1.2強化學習
2.2隨機優化和搜索算法
2.2.1隨機優化
2.2.2圖形搜索算法
2.3新興人工智能范例
2.3.1神經符號AI
2.3.2 NE
第三章 人工智能在武器系統中的應用
3.1自主性
3.1.1定義、級別和框架
3.1.2自主系統的功能組件
3.2感知中的人工智能
3.2.1圖像分割
3.2.2目標檢測、分類和場景理解
3.2.3傳感器融合
3.3制導、導航和控制中的人工智能
3.3.1 GN&C系統
3.3.2常規控制理論方法
3.3.3智能控制
3.3.4本地化和導航
3.3.5系統識別
3.4任務和路徑規劃
3.4.1GAs
3.4.2群體智能
3.5智能策略
3.6對手建模和兵棋推演
3.7認知電子戰
3.7.1電子支持措施
3.7.2 ECMs
3 .7.3 ECCMs
第四章 將人工智能應用于武器系統的系統和程序
4.1天線系統
4.1.1下一代空中優勢計劃
4.1.2 Shield AI Hivemind
4.1.3 Shield AI V-Bat
4.1.4 Kratos XQ-58 Valkyrie
4.1.5 MQ-20 Avenger UCAS
4.1.6自主彈藥
4.1.7 Dynetics X-61小精靈
4.2 海軍系統
4.3 陸軍系統
4.3.1 QinetiQ/Pratt Miller的遠征自主模塊化飛行器
4.3.2Textron系統公司的Ripsaw M5
4.3.3 Rheinmetall公司的Lynx KF41
4.4 群系統
4.4.1 DARPA的攻擊性蜂群戰術
4.4.2自主協同小直徑炸彈群
4.4.3 Perdix群
4.4.4 Mako UTAP22
4.4.5 Coyote UAS Block 3
4.4.6機器人代理命令和傳感群的控制架構
4.4.7激流勇進微型無人潛水器
4.5戰斗管理和智能指揮與控制
4.6 ISR和目標系統
4.6.1 SRC的HPEC Pod
4.6.2復仇女神
4.7導航
第五章 未來作戰中的AI
第六章 人工智能和外來威脅
6.1俄羅斯
6.2中國
第七章 倫理考量
第八章 總結
參考文獻