在未來智能化戰爭中,瞬息萬變的戰場態勢對防空反導武器系統的探測感知和指揮決策提出了新的挑戰。本文聚焦智能感知技術賦能未來防空反導作戰裝備,剖析了智能感知概念及內涵,圍繞防空反導“觀察、定位、決策、行動”(OODA)環以及典型作戰流程,梳理感知對抗形態,主要包括預警與反預警、探測與反探測、跟蹤與反跟蹤、干擾與反干擾;揭示了智能感知對抗的核心科學問題是特征的隱匿與識別,給出了感知對抗技術在OODA環中的主要應用場景;最后,提出了提高防空反導裝備智能感知對抗水平所需的關鍵技術發展建議。隨著智能時代的日益臨近以及高超聲速武器的 實戰化應用,超視距遠程突襲、無人飛行器集群作戰、 隱身偵察與打擊、分布式殺傷與干擾等各種新型作戰 樣式不斷涌現,使得未來戰場作戰的不確定性大幅增 加[1-4] ,這對防空反導作戰體系提出了新的嚴峻挑戰。 如何利用一切手段縮短指揮員在“觀察、定位、決策、 行動”(Observe, Orient, Decide and Act,OODA)環中 的決策時間,突破隱身或弱小集群目標的探測識別難 題,解決對臨近空間高超聲速進攻導彈的早期預警和 感知問題,提升紅外/電磁干擾對抗技術,已成為現代 化防空反導戰爭中亟需解決的問題。 美、俄等軍事強國把人工智能視為“改變戰爭游戲 規則”的顛覆性技術[5] 。武器系統的智能感知技術可加 快空天態勢監控設備和防空反導預警系統的數據處理 速度,彈上智能系統能夠對防御導彈進行目標識別與 飛行自主控制。事實上,智能感知是武器裝備智能化 的核心,感知對抗是戰場上敵我在信息域上的較量。
隨著當前人工智能和機器學習程序的快速發展,大多數國家都在優先發展新的和改進的自主系統,目的是以更快的反應速度、更低的成本和更少的人力來執行多項任務。現代戰爭正變得越來越自主,包括作戰在內的多項功能正被委托給日益復雜的程序和系統。本文旨在分析使用人工智能的武器系統在軍事上的應用,特別是巡飛彈藥。文章將分析這些系統當前的能力、在納戈爾諾-卡拉巴赫沖突(2020 年)和最近的烏克蘭-俄羅斯戰爭(2022 年)中的應用,同時還將考慮當前和未來系統將面臨的法律和倫理挑戰。文章將從安全角度分析不同自主系統的當前應用和未來趨勢,并從法律和倫理角度分析主要挑戰。
縱觀歷史,戰爭一直主要是人與人之間的摩擦行為,"是人與人之間的肉體較量,每個人都使用武力迫使我們的敵人按照我們的意愿行事"。在這一論點中,技術在戰爭中一直扮演著關鍵角色,往往通過其成功的條令運用來重塑作戰方式。事實上,諸如火器和火車的發明、機械化車輛和后來的裝甲車輛以及作戰飛機的發展,以及核武器的誕生等技術突破,不僅改變了戰爭戰術的動態,而且改變了應如何發動戰爭的戰略。在過去幾十年里,人工智能(AI)領域的技術成就使更新的系統越來越多地融入我們日常生活的許多方面,目前在信息和通信技術(導航、社交媒體算法等)、工業(流程自動化和優化)、市場營銷和銷售甚至醫療保健領域都有應用。人工智能系統也在軍事工業綜合體中大顯身手,既是提供支持功能的平臺,如情報、監視、導航和增強的指揮與控制(C2)能力,也是協助完成識別和選擇目標以及實施打擊等不同復雜任務的平臺。本文將分析人工智能的后一種功能、其目前的應用以及此類能力對國際人道主義法的挑戰。不過,在探討其軍事能力之前,有必要澄清什么是人工智能、自主系統與遙控平臺的區別,以及人與機器如何相互作用。
人工智能有許多不同的定義。最簡單地說,人工智能可以定義為一種系統、程序或機器,能夠以類似人類的智能快速執行不同的復雜任務。由于人工智能技術在各個領域的廣泛應用和可能的應用(及影響),大多數國家的軍隊都實施了自己的人工智能戰略,以利用該技術的固有優勢,如增加反應時間、降低成本和更好地防御網絡威脅。在與武器系統集成方面,應區分兩個不同的類別:a) "自動";b) "自主"。紅十字國際委員會(紅十字委員會)是這一領域的主要機構之一,該委員會認為,這兩類系統在自主程度、功能(即可執行的任務及其復雜性)以及最重要的人類控制或監督程度方面存在很大差異。自動系統可定義為 "非遠程控制,但一旦部署就能以自足和獨立的方式運作 "的武器。自動崗哨槍、傳感器融合彈藥和某些反車輛地雷就屬于此類武器。根據這一定義,一些軍事機構認為,無人機等無人駕駛航空系統(UAS)既不應被視為完全 "自動化",因為它們可以遙控駕駛;也不應被視為完全遙控,因為導航、起飛和著陸等功能可以 "自動化"。英國國防部試圖為自動化系統提供一個包羅萬象的定義,即那些 "根據一個或多個傳感器的輸入,在邏輯上按照預先確定的規則進行編程,以提供可預測結果的系統"。
另一方面,還有 "自主 "武器系統,未來可能會由更先進形式的人工智能集成。雖然沒有一個統一的定義,但許多軍事手冊和國際機構似乎都同意一些核心特征。例如,紅十字國際委員會(ICRC)將自主武器系統定義為 "無需人工干預即可選擇目標并對其施以武力的武器;美國國防部(US DoD)將其定義為 "一旦啟動,無需人類操作員進一步干預即可選擇并攻擊目標的武器系統",而英國國防部(UK MoD)則給出了如下定義:"能夠理解更高層次意圖和方向的系統;根據這種理解和對環境的感知,這種系統能夠采取適當行動,實現理想狀態;它能夠從眾多備選方案中決定行動方案"。因此,從這些定義中可以看出,自主武器系統的共同特征是:a) 此類系統能夠執行多項功能;b) 無需人類監督和/或批準即可運行;c) (至少在未來)還能根據周圍環境的變化進行動態調整。
一些軍事部門還根據復雜程度對自主武器系統進行了進一步分類。例如,美國國防部根據自動化和控制程度,將自主武器系統分為三大類:1)"自主武器系統"(如上定義);2)"人類監督自主武器系統":旨在為人類操作員提供干預和終止交戰的能力;3)"半自主武器系統":一旦啟動,僅用于攻擊人類操作員選定的單個目標或特定目標群(美國國防部,2023 年)。最后,自主武器系統還可根據其人機一體化、控制和監督的程度細分為三個不同類別:1)"人在回路武器":僅能在人類指令下選擇目標和投放力量的系統;2)"人在回路武器": 2)"人在環上武器":可在人類操作員的監督下選擇目標和投放武力,人類操作員可控制其行動;以及 3)"人在環外武器":能夠在沒有任何人類輸入或互動的情況下選擇目標和投放武力的系統。
目前已投入實戰的具有半自主能力、屬于 "人在回路中 "類別的武器系統包括 "法蘭克斯 "1-B 近防武器系統(CIWS),這是一種艦載 20 毫米火炮系統,可自主探測、跟蹤和攻擊目標(雷神公司,2023 年);反火箭和防空平臺,如以色列的 "鐵穹 "和德國的 "歐瑞康天盾",均可自主探測、跟蹤、選擇和交戰。目前具有一定程度自主功能的另一類武器系統是巡飛彈藥,其能力和使用情況將在接下來的章節中分析。
過去十年中,巡飛彈藥的擴散和復雜性迅速增加。如今,20 多個國家正在生產和使用此類系統,預計未來幾年這一趨勢還將加劇。與無人機不同,巡飛彈藥是一種無人駕駛飛行器,旨在識別、跟蹤并在撞擊目標后用重量不等的爆炸彈頭在可視范圍外交戰。巡飛彈藥設計為便攜式、易于發射和一次性使用,使其成為火炮和復雜導彈系統的一種成本效益高、更安全、更靈活的替代品。事實上,得益于這些特點,它們能夠(根據制造商的說法)執行多種類型的任務(情報、監視、偵察、精確打擊、反炮擊等),同時在一定區域上空長時間巡飛,從而有更多的決策選擇。雖然目前使用的巡飛彈藥的大部分任務都是自動執行的,如起飛和著陸,但更先進的系統擁有不同程度的自主能力,如導航、目標探測、跟蹤,有些甚至是交戰。事實上,以色列的 "哈比 "和 "哈羅普 "無人機、俄羅斯的 "柳葉刀-3"、土耳其的 "Kargu-2 "以及美國的 "彈簧刀"(300 和 600 系列)等巡飛彈藥都配備了全球定位系統制導、光電和紅外傳感器以及圖像處理設備,使它們(在不同程度上)能夠自主識別和跟蹤目標。最值得注意的是,"哈比 "和 "哈羅普 "巡飛彈藥被許多分析家認為是自主武器系統的典范,能夠在有限甚至沒有人工干預的情況下攻擊目標(這里指的是來自防空系統的雷達信號)。Kargu-2 是最新的系統之一。它是 STM 于 2020 年為土耳其武裝部隊開發的一款小型四旋翼飛行器,遙控或自主飛行距離為 10 千米,飛行時間為 30 分鐘,據稱配備了電子光學(EO)和紅外(IR)相機,以及使用機器學習算法進行識別的自動目標識別(ATR)系統。它還能與其他機型組成蜂群。雖然該公司稱其系統采用了 "人在環內原則",但聯合國專家小組進行的一項調查似乎表明,利比亞民族和睦政府可能已使用 Kargu-2 無人機自主 "攻擊目標,而無需操作員與彈藥之間的數據連接"。
只是在最近幾年,巡飛彈藥才被廣泛用于沖突場景。本節將分析兩個使用此類系統的案例研究及其軍事影響。
2020 年 9 月,阿塞拜疆部隊在納戈爾諾-卡拉巴赫東部地區發起進攻行動,該地區是阿塞拜疆與現已解體的亞美尼亞阿爾扎赫共和國之間的爭議地區。在這次進攻中,阿澤里部隊廣泛使用以前購買的以色列 Harop 和 Harpy-2 型彈藥,以及其他土耳其制造的無人機,有計劃地消滅目標。這些輕型 "自殺式無人機 "的射程可達 200 公里,可手動或自動操作,并配備 16 公斤重的爆炸彈頭。據 OSINT 消息來源稱,這些系統在 9 月攻勢的最初幾天發揮了巨大作用。事實上,由于這些系統具有反輻射能力,阿塞拜疆在 9 月 30 日期間和之后對亞美尼亞 T-72 坦克縱隊以及亞美尼亞地對空導彈防御系統和炮兵陣地發動了一系列精心協調的攻擊,為阿塞拜疆空軍在一些地區發動攻擊以及阿塞拜疆地面部隊奪取蘇沙等戰略要地鋪平了道路。考慮到亞美尼亞陸軍加強了大量武器庫,這些系統對亞美尼亞軍事裝備和人員造成的影響令人印象深刻。官方數字各不相同,但根據基于 OSINT 的研究,在短短大約 40 天的交火和沖突中,阿塞拜疆無人機和巡飛彈藥成功發現并摧毀了大量坦克、裝甲運兵車、火炮、雷達和防空導彈基地(9K33 Osa、遠程 S-300 和至少 1 個 Tor-M2KM)以及電子戰設備。可以說,阿塞拜疆軍事攻勢的成功在很大程度上歸功于對無人偵察機和自殺式彈藥的協調使用,這些彈藥由于體積小,成功地躲過了亞美尼亞防空系統的雷達信號。雖然亞美尼亞的防空導彈確實擊落了一些自殺式彈藥,但考慮到損失的相對數量,這些系統顯然在有效削弱亞美尼亞防御能力方面發揮了決定性作用。
烏克蘭戰爭是迄今為止最廣泛使用 "自殺式無人機 "的戰爭,尤其是俄羅斯武裝部隊。據報道,在沖突的第一年,俄羅斯空軍由于在烏克蘭防空部隊手中損失了大量飛機而在空中優勢爭奪戰中失去了優勢,此后俄羅斯開始更加重視混合使用各種類型的偵察無人機,如扎拉 421 和奧蘭、埃勒龍系列,以及像柳葉刀-3 這樣的巡飛彈藥,還有數量更多的伊朗制造的沙赫德-136。后兩者已被用于打擊特定的高價值目標,如防空系統、炮兵陣地和其他靜態目標,以及前線后方數公里處的敏感民用基礎設施(發電站、輸電線路、水庫等)。
事實證明,沙赫德-136 尤其是俄羅斯武裝部隊的寶貴資產,也是烏克蘭地對空導彈(SAM)和火炮基地的頭疼問題。該系統于 2022 年 9 月被引入俄羅斯武庫,作為一種臨時且相對廉價的解決方案,旨在填補俄羅斯無人機艦隊和巡航導彈武庫耗盡所造成的能力缺口,同時由于西方長期制裁制造這些系統所必需的高科技組件,導致當地生產能力嚴重下降。沙赫德-136 系統是一種遠程 "單向攻擊 "巡飛彈藥,裝備有用于偵察的照片和視頻設備,以及 30 至 50 公斤重的爆炸彈頭。它的射程據稱超過 2000 公里,巡飛速度高達 180 公里/小時,可巡飛數小時。這些系統中的多個系統還可以從一輛普通卡車上 "齊射 "發射。就自主功能而言,Geran-2 系統非常簡單。最值得注意的是,得益于其導航系統以及衛星和無線電信號的結合,"杰蘭-2 "可以預先編程,自主飛行并攻擊預先設定的特定地點。最新型號還配備了俄羅斯 Komet-M 數字接收器,用于改進導航、信號和抗干擾。一些分析家不排除自殺式無人機的變型也可能安裝用于打擊硬目標的紅外攝像機,使系統能在末端階段直接、更準確、自主地飛向熱源。但這一能力尚未得到證實。與納戈爾諾-卡拉巴赫沖突類似,像 "Geran-2 "這樣的巡飛彈藥從戰術和戰略層面產生的影響都相當大。從作戰角度看,伊朗彈藥提供的更遠射程,加上其低廉的成本、低雷達探測率以及從前線任何地方大量發射的固有能力,正在日益擴大烏克蘭防空系統的缺口,從而使其他高價值目標,如炮兵陣地、補給和通信網絡以及關鍵基礎設施,更容易受到縱深攻擊。雖然大部分攻擊都能被動能防御系統(如 ZSU 和導彈防空系統)有效抵御,但由于隨時發射的系統數量龐大,一些系統還是設法穿過了烏克蘭的防空系統,摧毀了 4 輛自行榴彈炮、2 輛裝甲運兵車以及若干電力基礎設施。其數量之多、用途之廣、射程之遠、續航時間之長,使其非常適合于低成本的 SEAD 行動,以及探索和發現防御漏洞,為巡航導彈攻擊鋪平道路。
國際人道主義法(IHL)是國際公法中關于限制戰爭對非戰斗人員有害影響的規則,在這一法律領域,包括巡飛彈藥在內的自主武器系統一直是學者們爭論的主題。法律學者已經確定了至少三個主要的法律挑戰,這些挑戰是由更多獨立自主系統的潛在發展和使用所帶來的。這些挑戰具體涉及 1949 年日內瓦四公約《第一附加議定書》規定的區分、相稱和預防規則,即
它們區分合法目標與民用目標和平民的能力;
附帶傷害平民和損壞民用物體的風險;
人類操作員理解該系統并驗證其操作符合國際人道主義法的能力。關于第一點,有觀點認為,要使系統能夠自行區分合法與非法目標,就必須為其配備掃描儀和傳感器,使其能夠區分民用物體和軍事目標。然而,在戰爭中,環境往往會迅速發生變化,因此,這些事先根據特定條件和特定參數設計和編程的系統將無法考慮戰場上隨時間發生的所有變化因素和變量,并相應調整其交戰參數,從而導致潛在的不可預測的結果,以及攻擊中的歧視。即使在人類仍能控制觸發器的系統中,研究也表明,在快節奏、壓力大和不確定的條件下,操作員可能只是不加批判地過度依賴系統的建議,這種情況被稱為 "自動化偏差"。第二點與戰爭中的相稱性原則有關,該原則要求軍事指揮官在攻擊前采取一切可能的預防措施,以免造成與預期軍事優勢不相稱的過度損害(《第一附加議定書》第 51.5b 條)。因此,在決定自主實施攻擊時,這些系統需要通過定性分析來判斷對合法目標實施的攻擊是否被認為是相稱的,或者是否已經采取了所有可行的預防措施,從而使程序符合這一規則。有人認為,這種背景評估始終需要人類的判斷。第三點也是最后一點涉及自主系統的可預測性。事實上,為了遵守相稱性和預防性規則,指揮官必須確信他選擇使用的武器將以某種方式發揮作用,并將產生可預測的可靠效果。如果武器在任何環境或情況下的效果都無法控制或無法完全預見,那么他就有可能違反國際人道主義規則(同上)。紅十字國際委員會對這些與注入了更先進、更獨立的人工智能的日益自主的系統相關的法律和倫理風險尤為關注。紅十字國際委員會一直主張為自主武器系統的開發和使用制定一套全面的、具有約束力的規范和規則,例如限制目標類型、地理范圍和使用環境,并規定必須有人類監督。從這個意義上說,2016 年,在《聯合國特定常規武器公約》(CCW)的工作范圍內成立了一個政府專家組,討論與致命性自主武器系統領域的技術有關的問題。2019 年,政府專家小組通過了一份指導原則清單,旨在幫助成員國在討論致命性自主武器系統的法律和倫理風險時找到共同點。雖然政府專家小組定期召開會議討論此類問題,但制定此類系統監管框架的道路似乎還很遙遠,主要原因是對致命性自主武器系統尚無一個共同認可的定義,因為它需要涵蓋更廣泛的人機交互主題。
在過去幾年中,巡飛彈藥的發展、使用和能力都有所提高。最近在納戈爾諾-卡拉巴赫和烏克蘭發生的沖突表明,它們能以相對低廉的價格有效打擊前線后方的高價值目標,通常可替代巡航/SEAD 導彈和火炮系統,在某些情況下,其射程甚至超過它們。然而,正如其他作者所言,巡飛彈藥也有可能用于其他目的,如早期預警和近距離空中支援。在過去幾年中,歐洲各國對投資采購現有或開發本地解決方案的興趣日益濃厚,而大國作為該領域的技術領導者之一,正在從烏克蘭戰爭中吸取教訓,以制定使用和防御巡飛彈藥的進攻和防御條令。就此類系統的能力而言,發展趨勢似乎是提高系統的自主性,這在很大程度上是由于人工智能在機器學習和深度學習領域的進步,以及需要規避預警設備造成的無線電信號干擾,而 AWS 對這些干擾是免疫的。事實上,一些自主系統已經在使用商業化的先進人工智能軟件和硬件,這些軟件和硬件使用不同的傳感器,能夠通過分析大量數據自動識別物體并對其進行分類。例如,烏克蘭武裝部隊最近推出了一款名為 "Saker "的人工智能無人機,它既能進行第一人稱視角(FPV)攻擊,也能在人類監督下自主識別目標并可能與之交戰,其目的是限制反應時間,并消除干擾的影響,否則操作員將無法直接控制。最后,關于與國際人道主義法相關的難題,雖然一些西方國家,最著名的是美國和英國,已經實施了開發和使用 "負責任的 "人工智能和自主系統的指導方針和法規,如全面審查和在交戰階段持續的人類監督,但其他國家可能并不傾向于這樣做。其背后的原因是,由于其生產成本低廉、用途廣泛,再加上易于與日益先進的人工智能集成,大規模生產能夠自主實施攻擊的系統(即使效率較低)將更具優勢,這一點在烏克蘭已經可以看到。
參考來源:MONDO INTERNAZIONALE
智能化是未來軍事發展的重要方向,而智能決策作為智能化的重要手段,深刻 影響著軍隊的作戰體系建設以及裝備武器體系發展規劃。首先,本文給出智能決策的技術內 涵定義,從機器學習、運籌優化、數據/知識驅動、系統支持的視角進行歸納總結,進而闡 述軍事體系工程的定義與結構,梳理出軍事體系工程領域的智能決策流程,對當前智能決策 在軍事體系需求、體系設計、體系建模、體系評估、體系管理等環節的應用現狀進行了總結。 最后給出智能決策技術在軍事體系工程應用的未來展望,以期為軍事智能化發展工作提供一 定的參考價值。 隨著全球新一輪科技革命和產業變革的深 入發展,人工智能、數據挖掘等智能化技術的 不斷突破與創新,并與各領域加速融合[1-2]。各 領域的決策過程中的廣度、深度和復雜度形成 體系,約束條件、策略偏好、不確定性等因素 增多,以及復雜的技術集成和工程管理問題益 發突出,產生了智能決策的需求。隨著美軍提 出馬賽克戰概念[3],拋出“決策中心戰”理念, 智能決策在軍事領域的研究迅速發展,加上未 來復雜戰場多模態信息交織難辨,形成不確定 性極高的復雜體系問題,極大增加了作戰決策 的難度[4]。 智 能 決 策 結 合 人 工 智 能 ( artificial intelligence , AI )、知識發現 (knowledge discovery in database,KDD)等技術,能夠用于 實現不確定環境下的精確決策[5],其可以融入 或集成到軍事系統中,以其高效的數據融合和 深度學習(deep learning,DL)能力,實現軍 事系統即時性和精確性的決策分析。智能決策 涉及國防和軍隊建設各個方面,在無人戰場[6]、 軍事武器選擇[7]、作戰任務規劃[8]、軍事網絡 分析[9]等領域發揮巨大作用。與此同時,人工 智能、信息融合與共享等技術的不斷推進,使 得航空航天系統[10]、軍事系統[11]、智能制造系 統[12]等出現了新的大規模系統集成體的結構 形態,給體系(system of systems)和體系工程 ( system of systems engineering,SoSE)研究注入 新的活力,體系的多模態信息融合、不確定體 系環境下的優化決策、模型驅動的 SoSE 成為 了體系研究熱點[13-15]。 近年來,隨著智能決策研究的不斷深入, 許多學者開展智能決策與各領域結合研究[16], 也產生了關于智能決策在領域應用的綜述,其 中,云計算[17]、大數據[18]等方面成果較為突出。 但目前學術界缺乏對軍事體系工程的智能決策 系統性綜述,對軍事體系領域的智能決策流程 缺少細節描述。基于此,本文首先梳理了軍事 系統工程智能決策流程,結合軍事體系工程的 特點,歸納智能決策在軍事體系工程領域的研 究現狀,最后基于智能決策技術的優越性,提 出了未來軍事體系工程領域應用設想。
無人機在軍事上的應用越來越廣泛和深入,尤其是無人機集群在協同探測、全域打擊、戰術騙擾等作戰任務中,發揮著越來越重要作用,可靠高效的無人機集群博弈方法是當前的研究熱點。本文將反事實基線思想引入到無人機集群對抗博弈環境,提出面向多無人機場景的反事實多智能體策略梯度(Counterfactual multi-agent policy gradients, COMA)博弈方法;在具有連續無限狀態、動作的無人機作戰環境中,構建基于多智能體深度強化學習的無人機集群對抗博弈模型。利用多智能體粒子群環境(Multi-agent particle environment, MPE)對紅藍雙方無人機集群進行非對稱性對抗實驗,實驗結果表明COMA方法在平均累積獎勵、平均命中率和平均勝率方面均優于目前流行的深度強化學習方法。最后,通過對COMA方法的收斂性和穩定性的深入分析,保證了COMA方法在無人機集群對抗博弈任務上的實用性和魯棒性。
無人機 (Unmanned aerial vehicle, UAV) 集群是由若干配備多種任務載荷的低成本小型無人機 組成的無人化作戰系統,通過自主學習共同完成特定復雜作戰任務. 作為典型的多智能體系統,無 人機集群以難防御、強進攻、低成本、自主學習,使用靈活等優勢深刻改變著現代戰爭模式 [1~4].隨著無人機智能化水平的提高和集群控制技術的飛速發展,無人機集群對抗自主決策方法將成為未 來無人機作戰的關鍵技術. 解決無人機集群對抗自主決策問題的一種思路是利用進化方法,進化方法是一類受生物進化理 論啟發而形成的計算方法,常用于解決優化、搜索和對抗等問題,其核心思想是通過模擬生物進化 的過程,找到問題的最優或次優解. John Kaneshige 等 [5] 使用人工免疫機制解決空戰機動選擇問 題,將敵機視為抗原,通過相對位置速度表征,將機動動作視為抗體,利用遺傳算法和進化算法模 仿免疫系統對應抗原的自適應能力,這種機制使得智能體具有較強的記憶能力,能記錄過往成功的 經驗以在相似場景下快速響應. Duan 等 [6] 提出了一種基于捕食者-獵物粒子群優化 (Predator-prey particle swarm optimization,PP-PSO) 的博弈方法,將多無人機作戰任務建模為雙人博弈,并通過 PP-PSO 方法來解決. 周文卿等 [7] 針對多無人機協同飛抵作戰空域完成作戰任務的問題進行了建 模,利用蟻群算法和所提的多無人機控制算法進行仿真實驗,實驗表明該算法能有效提升無人機集 群空戰獲勝率. Isler 等 [8] 將隨機策略與獅子追捕策略結合,研究了兩個追蹤者對一個高速運動逃 跑者的協同追捕算法,在簡單連通多邊形環境中驗證了所提算法的有效性. Chen 等 [9] 利用模糊規 則對多無人機空戰問題進行離散化,并采用粒子群優化方法求解納什均衡,該方法解決了協同博弈 問題,模擬結果呈現了該方法的可行性和有效性. 然而,用進化方法解決博弈問題需要固定一個策 略并且和對手博弈多次,或者與對手的仿真模型進行大量模擬博弈. 盡管獲勝頻率作為該策略獲勝 概率的無偏估計,可用于指導下一輪策略選擇,然而每一次策略的調整都源于多次博弈. 僅有每一 輪比賽的最終結果會被納入考慮,而博弈過程中的中間事件將被忽略. 如果對抗獲勝,就會認為這 次對抗中所有的動作都有功勞,而與每一步具體動作有多關鍵無關. 這些功勞甚至會被分配給那些 從未出現的動作. 因此,進化方法在面對多智能體長時間持續性對抗任務時能力略顯不足. 解決無人機集群對抗自主決策問題的另一種思路是利用強化學習方法 [10]. 強化學習是一種對 目標導向與決策問題進行理解并自動化處理的計算方法,它常用馬爾可夫決策過程建立數學模型, 已在解決智能決策方面體現出不俗能力和良好發展態勢,特別是在復雜動態博弈環境中. 強化學習 在智能體和環境交互的靈活性方面具備天然優勢 [11]. 強化學習利用智能體與環境的直接交互來學 習,不需要可仿效的監督信號和對周圍環境的完全建模,在解決持續性復雜決策任務時有較大優勢. 多智能體強化學習是強化學習的一個分支,其研究多個智能體在共享環境中相互作用,并通過智能 體的學習來實現其目標. 無人機集群屬于典型的多智能體系統,與單智能體強化學習相比,多智能 體強化學習的復雜度更高、更難以訓練:一方面隨著智能體數量的增加,相應的策略空間呈指數級 增加,其難度遠超圍棋等棋類游戲;另一方面隨著異構智能體的加入,多智能體間需要更高效和可 靠的通信、協作和配合. 近年來,隨著 AlphaGo [12]、AlphaGo Zero [13]、AlphaZero [14]、AlphaStar [15]、AlphaFold [16] 等深度強化學習 (Deep reinforcement learning, DRL) 方法的出現,深度強化學習已成為一個熱門 的研究方向. Deepmind 提出了基于值方法的深度 Q 網絡 (Deep Q-networks, DQN) [17],率先將 深度神經網絡與 Q-Learning 相結合,為深度強化學習的發展奠定了堅實基礎. 隨后產生了許多基于 DQN 的變種,如 Dueling DQN [18]、Double DQN [19] 等,并獲得了更好性能. 針對無人機集群博弈的復雜性和強化學習自身特點,一些學者應用強化學習對無人機集群博弈 進行了研究. Gong 等 [20] 針對多無人機協同空戰問題,建立了多無人機空戰環境. 提出了一種基于 網絡化分散的部分可觀測馬爾可夫決策過程 (NDec-POMDP) 的空戰協同策略框架,仿真結果驗證了所提協同空戰決策框架的可行性和有效性. 陳燦等 [21] 基于多智能體強化學習理論,建立多無人 機協同攻防演化模型,提出一種多無人機協同攻防自主決策方法,提高了多無人機攻防對抗的效能. Li 等 [22] 基于強化學習的演員-評論家框架,在無人機的演員網絡中引入門循環單元,使得無人機 能根據歷史決策信息做出合理決策,采用注意力機制來設計集中式的評論家網絡,并在無人機集群 空戰場景中對算法進行了驗證. Zhang 等 [23] 提出了一種基于注意力機制的深度強化學習分布式方 法,該方法設計了可用于無人機協作短程作戰任務的獎勵函數,并采用 Unity3D 無人機仿真平臺進 行了訓練. 但是,在多智能體強化學習環境中,如果團隊內部共同完成一個任務,則智能體會共享一個獎 勵函數,從而帶來多智能體的信用分配問題,即無法區分團隊中某個智能體的策略對整個團隊任務 的貢獻. 如果不考慮信用分配問題,則可能導致智能體學到的策略是局部最優 [24]. 雖然可以為每 個智能體設計單獨的獎勵函數,但這些單獨的獎勵在合作環境中并不普遍存在,也不能鼓勵單個智 能體為更大的團隊利益犧牲,這將在很大程度上阻礙多智能體在挑戰性任務中的學習效率. Foerster 等 [25] 提出了反事實多智能體策略梯度 (Counterfactual multi-agent policy gradient, COMA) 方法, 該方法利用反事實基線來減少估計方差,并解決了多智能體信用分配問題. 事實上,在無人機集群對抗博弈中,無人機集群內部往往需要協調和配合,以提高整體任務完 成率. 如何最大化無人機之間的協同,對信用進行合理分配,以獲得最優的無人機行為策略,仍是當 前需要面對的主要挑戰. 本文將 COMA 方法引入到具有無限連續狀態和動作的無人機作戰環境中, 基于無人機動力學和攻防態勢,設計符合實際環境的擊敵條件和獎勵函數,構建基于多智能體深度 強化學習的無人機集群對抗博弈模型. 紅藍雙方無人機采取不同的對抗博弈方法,利用多智能體粒 子群環境進行非對稱性對抗實驗,使用平均累積獎勵、平均命中率和平均勝率作為評價指標. 結果 表明平均累積獎勵能夠收斂到納什均衡,COMA 方法比其它流行的深度強化學習方法更具優越性, 對 COMA 方法收斂性和穩定性的驗證分析保證了其在無人機集群對抗任務上的實用性和魯棒性.
在現代軍事行動中,陸海空三軍的整合與協調對于成功完成任務至關重要。為了促進這種整合,人工智能指揮與控制(C2)系統已成為強有力的工具。這些系統利用人工智能、數據分析和自主決策的能力來增強態勢感知、優化資源分配和提高作戰效率。本文全面探討了人工智能 C2 系統的相關背景、科學、技術和工藝。文章還重點介紹了正在塑造一體化軍事行動格局的當前和未來項目。
傳統的 C2 系統在很大程度上依賴人工處理和傳播信息,這往往會導致延誤和錯誤。然而,人工智能的出現改變了這些系統,它可以對海量數據進行實時分析,并為指揮官提供可操作的見解。人工智能算法可以識別模式、預測結果并提供決策支持,從而更高效、更有效地管理海陸空一體化行動。
人工智能支持的 C2 系統包含一系列科學原理、技術和工藝,它們有助于提高系統的功能和效率:
機器學習:機器學習算法有助于系統從歷史數據和實時數據中學習,不斷提高系統性能。這些算法分析傳感器數據、情報報告和作戰數據中的模式,為指揮官提供有價值的見解和決策建議。C2 系統通常采用監督學習、無監督學習和強化學習技術來訓練人工智能模型。
數據融合:數據融合技術在整合傳感器、衛星和情報數據庫等不同來源的信息以創建全面準確的作戰圖景方面發揮著至關重要的作用。人工智能算法分析并整合這些來源的數據,為指揮官提供統一的最新態勢感知。融合方法包括傳感器融合、特征級融合和決策級融合,它們將不同抽象層次的數據結合在一起。
自主決策:人工智能系統具有根據預定義規則、算法和任務目標進行自主決策的能力。這些系統會評估多種選擇、評估風險,并根據不斷變化的情況動態調整計劃,從而提高指揮和控制流程的速度和效率。規則系統、專家系統和遺傳算法等技術被用于實現 C2 系統的自主決策。
通信和聯網:人工智能賦能的 C2 系統依賴于先進的通信和網絡技術,以確保不同平臺、單元和指揮中心之間的無縫信息交換。高速數據鏈路、安全通信協議和互操作系統可實現及時準確的信息共享,有助于改進聯合行動。衛星通信、以數據為中心的網絡和軟件定義網絡等技術被用來建立強大而高效的通信網絡。
幾個正在進行的項目體現了人工智能 C2 系統在海陸空一體化作戰中的進步和潛力:
JADC2 項目旨在開發一種先進的網絡系統,將所有軍事領域的傳感器、平臺和決策過程整合在一起。人工智能在加強信息共享、協作規劃和決策以提高行動靈活性和有效性方面發揮著關鍵作用。該項目側重于利用人工智能實現快速數據融合、實時分析和自主決策能力。
FMN 是一個側重于為多國軍事行動建立網絡化指揮和控制基礎設施的項目。FMN 的目標是整合不同的國家系統、提高互操作性和增強態勢感知能力,從而實現高效的聯合行動。該項目強調基于人工智能的數據融合、智能決策支持和安全通信協議。
中國正在積極發展集陸、空、海、天和網絡能力于一體的智能指揮控制系統。人工智能技術是該系統的關鍵組成部分,可實現不同領域的數據融合、實時分析和自主決策。該項目旨在通過先進的人工智能 C2 能力,提高中國軍事行動的有效性和協調性。
人工智能 C2 系統在海陸空一體化作戰中的未來潛力巨大。以下是一些有望塑造未來格局的著名項目:
IAMD 是一個未來項目,旨在加強防空和導彈防御系統的整合與協調。人工智能支持的 C2 系統將通過整合來自各種傳感器和平臺的數據,在探測、跟蹤和攔截敵機威脅方面發揮重要作用。這些系統將實現快速決策和高效的防御資源分配,確保有效防范空中威脅。
美國國防部高級研究計劃局(DARPA)正積極投資于人工智能 C2 系統的研發計劃。這些計劃旨在為軍事行動中的可解釋人工智能、人機協作和動態決策推進人工智能技術。DARPA 的努力將有助于提高人工智能指揮和控制系統的作戰效能、信任度和復原力。
借助人工智能、數據融合、自主決策和通信技術的力量,人工智能指揮與控制系統正在徹底改變陸海空一體化行動。正在進行的項目,如 JADC2、FMN 等,都在推動這一領域的創新。IAMD 和 DARPA 計劃等未來項目將繼續推動人工智能 C2 系統的發展,使軍事行動更加高效、有效和一體化。通過利用人工智能的潛力,軍隊可以實現卓越的態勢感知、更快的決策和優化的資源分配,最終在復雜的作戰環境中取得更大的任務成功。
參考來源:SIAM
無人集群的協同控制策略是影響其軍事應用效益的關鍵技術問題. 系統闡述了 5 類主要的無人集群協同控制策略: “領導者-跟隨者” 模型、虛擬結構控制策略、基于行為的控制策略、人工勢場法和基于人工智能的控制策略, 并對比分析各自優劣勢;重點研究了協同偵察、協同打擊和協同救援 3 類典型軍事應用場景, 對每類應用場景的軍事需求、實現策略和主要挑戰進行剖析;對未來無人集群的軍事應用發展趨勢給出預測分析.
無人機蜂群作戰已經成為軍事領域的熱點,世界各軍事強國對其關注度日益增加。為了深化對無人機蜂群作 戰的理解與認識,首先簡要介紹了概念起源,然后重點對作戰樣式、作戰優勢等進行了分析,最后以無人機蜂群作戰的軍事 應用為牽引,總結了無人機蜂群作戰深入發展需要攻克的關鍵技術難題。自海灣戰爭以來,無人機在戰爭中的應用領域 不斷拓展,深刻影響著戰爭的走向。隨著無人機的 不斷發展完善,其應用范圍不斷擴大、規模數量不 斷增多、作戰樣式不斷翻新,作戰運用已從空中偵 察、戰場監視、電子對抗向通信中繼、精確打擊和后 裝保障等領域延申,正在逐步由輔助作戰手段向基 本作戰手段過渡。綜合來看,無人機在軍事上可代 替有人機執行四類任務,即 4D 任務(枯燥乏味、環 境惡劣、危險性高、深入敵方;Dull,Dirty,Danger? ous and Deep)。 20世紀60年代,法國生物學家皮埃爾·保羅開 始了關于智能蜂群(Swarm Intelligence)的研究。通 過對自然界各類昆蟲群體的深入觀察分析,皮埃 爾·保羅發現某類昆蟲群體內部存在高度結構化的 組織,個體之間分工明確,協同工作,能夠完成遠遠 超出單一個體能力的復雜任務。其中,蟻群是最具 代表性的群體,單體之間通過簡單的信號傳遞,就 能實現較成熟的溝通協調,從而表現出某種規模化 的集群智能行為。在此現象的基礎上,人類不斷深 入研究昆蟲之間的集群行為,最終得出了如蟻群算 法(ACS)和粒子群優化算法(PSO)等諸多智能集群 算法。
本文應用深度學習技術實現海天背景下基于可見光、紅外方式成像的艦船及角反、煙幕干擾的目標檢測,這也是反艦導彈作戰使用的關鍵技術之一。采集的可見光與紅外成像目標檢測數據集涵蓋實施典型干擾下的態勢場景,貼近實戰;結合四種不同的目標檢測機制,選取YOLOV3、Faster R-CNN、SSD及CenterNet四種典型模型分別進行訓練與驗證,通過對比分析進一步提高弱小目標、復雜干擾態勢的的檢測,可以實現端到端的高精度裝備目標檢測模型。在確保精度的前提下基于現場可編程門陣列(FPGA)進行軟硬件協同設計,通過對比分析選定基于Vitis AI的實施方案,經過模型的量化、編譯與優化,可在保證檢測效率的前提下快速實現模型的小型化部署,便于進行裝備移植。研究結果表明,該研究內容可有效提高現役反艦導彈目標檢測的準確率。
目前,軍事應用中通常使用紅外與可見光成 像的手段對導引頭及監控檢測設備進行目標檢 測,實際使用的檢測算法多為基于輪廓和邊緣檢 測的傳統方法,無法應對遮蔽、煙霧及模糊等干 擾因素。近些年來,人工智能尤其是深度學習技 術快速發展成熟,在計算機視覺領域展現出較好 的應用前景。深度學習的方法能夠通過自動特征 提取及大樣本訓練提升模型精度,其提取的復雜 特征是依靠人為設計無法比擬的,可極大改善檢 測精度。 本文擬使用深度學習目標檢測框架實現海 天背景可見光及紅外成像中的目標檢測,選擇目 前最優的深度學習目標檢測方法,如 Faster R-CNN、SSD、YOLO 和 CornerNet 等開展訓練, 在海量目標數據上訓練模型并進行對比分析,驗 證其檢測精度并進行調優改進;在提高準確率的 基礎上進行模型壓縮,然后基于現場可編程門陣 列(Field Programmable Gate Array,簡稱 FPGA) 進行軟硬件協同,實現設計目標。這種軟硬件協 同的實現方案可作為現役裝備紅外與可見光成 像后處理部分的有效補充。
在目標檢測技術的驅動下,被賦予智能感知能力的無人機得以實現高效靈活的數據收集能力。隨著無人機 的普及與智能技術的成熟,無人機視角下的目標檢測在諸多領域中作為關鍵核心技術,具有重要的研究意義。為了 進一步促進無人機視角下目標檢測研究的發展,本文對無人機視角下的目標檢測算法進行了全面的總結,并對已有 算法進行了歸類、分析和比較。首先,介紹無人機視角下的目標檢測概念,并總結了無人機視角下目標檢測所面臨 的目標尺度、空間分布、樣本數量、類別語義以及優化目標等五大不均衡挑戰。**在介紹現有研究方法的基礎上,本 文特別整理并介紹了無人機視角下目標檢測算法在交通監控、電力巡檢、作物分析和災害救援等實際場景中的應用。**然后,重點闡述從數據增強策略、多尺度特征融合、區域聚焦策略、多任務學習、以及模型輕量化等方面來提升無 人機視角下目標檢測性能的方法,總結這些方法的優缺點并分析了其與現存挑戰之間的關聯性。之后,全面介紹基 于無人機視角的目標檢測數據集,并呈現已有算法在兩個較為常用的公共數據集上的性能評估。最后本文對無人機 視角下目標檢測技術的未來發展方向進行了展望。
0. 引言
計算機視覺技術為無人機賦予了自主感知、分 析和決策能力,而目標檢測則是提高無人機感知能 力的關鍵技術之一。無人機結合智能目標檢測技術 可充分發揮其高機動性優勢,在廣闊的空中視野中 定位感興趣目標,進而實現靈活高效的數據收集能 力。在目標檢測技術的驅動下,無人機在交通監控 (Byun 等,2021)、電力巡檢(Abdelfattah 等, 2020)、作物分析(Osco 等,2021a)和災害救援 (Bo?i?-?tuli? 等,2019)等多個領域中展現出廣闊 的應用前景。例如在交通監控領域,無人機可以空 中飛行進行偵測,不受道路限制,具有速度快、自 由度高、視野寬廣等優點。當交通事故等突發事件 發生時,無人機可以第一時間進行響應,到達現場 進行圖像采集與分析,為應急救援與管理提供及時 有效的數據支撐。在深度學習的驅動下,目標檢測 技術獲得了長足的發展,取得了諸多令人矚目的成 就。然而,大多數研究聚焦于地面視頻監控圖像的 分析,面向無人機視角圖像的目標檢測還未得到充 分的研究。目前,即使是最好的目標檢測算法,在 無人機圖像上的平均精確率也難以達到40%(Cao 等,2021)。
**無人機視角下的目標檢測之所以難,其主要原 因在于無人機圖像存在尺度變化、疏密分布、目標 數量較多且小目標占比較高等問題,特別是無人機 高分辨率圖像高計算需求與現階段低功耗芯片有 限算力之間的矛盾難以平衡。**相對于地面視角拍攝 的自然圖像,無人機視角下的廣闊視場意味著更為 復雜的場景和更加多樣的目標,在提供更為豐富的 可視化信息的同時,也帶來了更多無用噪聲的干擾。特別是無人機視角下,圖像中的目標往往因遠端拍 攝、背景遮擋或光照影響等因素檢測難度較大,需 要使用高分辨率圖像提供更多的信息以達到較好 的檢測效果。這極大地增加了目標檢測算法的計算 開銷與內存需求,特別是直接使用未經過特殊設計 的通用目標檢測算法將帶來難以承受的計算開銷 與內存需求,進一步加劇了目標檢測的難度。在實 際應用場景中,往往面臨著類似于識別車輛種類這 種細粒度分類的問題,這些相似目標給模型正確識 別目標帶來了巨大的挑戰。此外,受限于現實世界 中的目標數量,無人機視角下某些類別的樣本數量 往往極為有限,這種數據不均衡的狀況也對模型的 學習能力提出了更高的要求。因此,緊密地結合智能目標檢測技術,針對無 人機圖像的特性設計行之有效的方法,促使模型學 習理解無人機視角下的視覺數據,對于無人機在實 際場景中充分發揮其效用是至關重要的。無人機視 角下的目標檢測在應用廣泛的同時面臨著諸多挑 戰,具有深刻的現實意義與重要的研究意義。對無 人機視角下的目標檢測展開研究將有助于推動目 標檢測領域的進一步發展,增強目標檢測在面對真 實場景時的應用能力。
目標檢測作為計算機視覺領域的基礎研究,已 有學者對此進行研究與總結,并發表許多優秀的綜 述。Zou等人(2019)梳理了400多篇關于目標檢測 技術發展的論文,系統而全面地展現了目標檢測領 域。Oksuz等人(2020)則從目標檢測中存在的類別 不平衡、尺度不平衡、空間不平衡以及優化目標不 平衡等四大不平衡問題出發,對現有的目標檢測算 法進行了深入的總結。Chen等人(2020)則從小目 標四大基礎方法的角度出發,總結并分析了小目標 檢測的相關優化思路。曹家樂等人(2022)回顧并 總結了基于單目相機的視覺目標檢測方法,并對比 介紹了單目目標檢測和雙目目標檢測的國內外研 究進展情況。然而,以上綜述對于無人機視角下目 標檢測的關注不夠,未能系統地梳理無人機視角下 的目標檢測方法和面臨的挑戰。 **聚焦到無人機視角下的目標檢測,Mittal等人 (2020)關注低空無人機數據集,評估并總結了當 前流行的目標檢測算法,但是局限于簡單的性能對 比,沒有深入的總結分析。**Sambolek等人(2020) 介紹了在搜索和救援行動中使用無人機的可能性, 并提供了在無人機圖像中檢測相關人員的方法概 述。Srivastava等人(2021)則關注無人機圖像的車 輛檢測,從提高精度和減少計算開銷兩個方面回顧 了這些工作。Bouguettaya等人(2021)則關注于無 人機視角下的車輛檢測應用,總結并介紹了多種網 絡結構對于改善車輛檢測的貢獻。江波等人(2021) 對常見的航空影像數據集進行了梳理,并對近期的 無人機目標檢測研究進行了歸納和分析。楊浩然等 人(2022a)則對目標檢測相關算法進行了簡單的優 缺點分析。然而,這些綜述對于無人機視角下面臨 的挑戰總結不夠系統,算法方面的趨勢總結較為薄 弱,而且對于目標檢測算法的實際應用闡述也較少。
與以往關注通用領域的目標檢測綜述或僅關 注于無人機相關的特定應用場景下的綜述不同,**本 文著重于對無人機視角下的目標檢測這一意義重大且極具挑戰性的研究領域進行系統且深入的分 析與總結。**本文首先簡要闡述無人機視角下目標檢 測的重要研究意義,然后將對無人機視角下目標檢 測領域中存在的挑戰進行系統的歸納和總結,隨之 將介紹并分析無人機視角下的目標檢測優化思路, 包括數據增強、多尺度特征融合、區域聚焦策略、 多任務學習、模型輕量化以及其他優化策略等。本 文將特別展示無人機視角下目標檢測算法的應用, 闡明該研究的實際意義。此外,本文將介紹無人機 視角下適用于檢測任務的相關數據集,并在常用的 數據集上分析對比現有算法的檢測性能。最后,對 本文內容進行簡要的總結,并討論無人機視角下的 目標檢測未來可能的研究方向和發展趨勢。
這篇文章主要側重于人工智能技術在智能武器裝備中的研究與應用。描述了人工智能的定義,人工智能技術的 發展以及美國對人工智能的重視。探討了人工智能在智能武器裝備中的關鍵技術,包括目標定位與識別技術、 自主攻擊技術、分布式作戰或蜂群作戰技術、作戰機器人技術等,并進一步闡述了在關鍵技術中應該突破的技 術性問題。列舉了人工智能技術在智能武器裝備中的應用實例,對人工智能技術的發展作了總結與展望。
**1. 引言 **
當今時代,國際間的事務深度復雜變化,充滿著不確定性和不穩定性。智能武器裝備對于一個國家 起著非常重要的作用。隨著科技的不斷發展,人工智能技術應用于智能武器裝備顯然成為現代智能武器 裝備發展的一種趨勢。本文的研究內容主要包括目標定位與識別技術、自主攻擊技術、分布式作戰或蜂 群作戰技術、作戰機器人技術。目標定位與識別技術就是利用人工神經網絡,仿照生物機理,搭建像人 一樣的神經網絡,把數據集中的數據輸入到神經網絡中,通過不斷學習和訓練取得訓練模型,從而實現 對目標的定位與識別。自主攻擊技術在本文中主要通過流程圖的形式呈現出來,自主攻擊的核心技術主 要是通過人工智能技術中的目標定位與識別技術、智能認知系統、智能決策系統、智能路徑規劃、智能 控制技術,實現對目標的自主攻擊。分布式作戰或蜂群作戰技術中,主要闡述了智能體之間的關系,現 在的分布式或蜂群作戰的發展概況以及所存在的不足。探討了作戰機器人應該具備的特點和屬性以及研 究作戰機器人需要具備的知識,闡述了現階段作戰機器人需要解決的技術問題。
**2. 人工智能定義 **
人工智能就是利用人工的技術手段使得機器更加智能。人工智能這一名稱的提出距今已有 60 多年, 2015 年人工智能得到了進一步發展,時至今日,人工智能仍然是一個火熱的研究方向之一,人工智能涉 及到生活的方方面面,人臉識別、智能醫療診斷、智能火星探測車等都是利用人工智能技術服務于人類 的實例。人工智能的迅速發展離不開各學科的相互發展。人工智能屬于社會科學與自然科學的交叉學科, 具有高度技術性和專業性的特點,涉及到包括數學、神經科學、計算機科學、哲學和認知科學、控制科 學、生物科學等多門學科[1]。人工智能大致包含的學科如圖 1 所示。
3. 人工智能技術的發展及美國的重視
人工智能技術的迅速發展,一般認為可以分為 4 個階段,以數學等為基礎的弱人工智能階段,以運 算與感知為基礎的強人工智能階段,以認知為基礎的通用人工智能階段和超級人工智能階段[2]。目前世 界各國都高度重視對人工智能技術的研究、開發和應用,但是,現在的人工智能技術仍處在弱人工智能 階段。人工智能技術的主要發展層次大致分為 3 個層級的智能,包括運算、感知和認知,即機器要具有 高效快速運算的能力,同人類類似或超越人類的記憶和存儲信息的能力,同人類的視覺、聽覺、觸覺相 似的感知能力,像人一樣能理解推理、能夠知識表達和會思考的認知能力[3]。根據美國、俄羅斯、印度、日本、國際軍控和裁軍組織,瑞典軍事研究所等媒體和組織對 2020 年世 界軍事強國的排名,排名第一的仍然是美國。美國作為軍事強國之所以保持其軍事強國地位離不開強大 的經濟實力和尖端的軍事科學技術。近年來,隨著人工智能技術的迅速發展,引起了以美國為首的現代軍事強國高度重視。從 2016 年起至 今,美國對于人工智能技術在軍事領域的研究與應用格外重視。2016 年,人工智能技術在全球盛行,也引 起了美國軍方的高度關注,美國為了應對各種復雜嚴峻的軍事挑戰,提出了第三次“抵消戰略”,提出了一 系列優先發展技術的新型作戰概念,例如“分布式作戰”“蜂群”“作戰云”等,美國政府要求優先發展人 工智能技術,推動“智能化導彈”“智能無人機”“無人自主空中加油”等相關人工智能技術在軍事方面的 研究與應用。美國的《國防戰略》,將先進與智能計算、大數據、自主智能、智能機器人等新型人工智能技 術作為美國在軍事領域打贏智能化戰爭的核心技術。2019 年 11 月 21 日,美國國會在《人工智能與國家安 全》報告中指出,人工智能是一個新興創新發展的技術,對維護國家安全具有舉足輕重的重要意義。2020 年,美國加大人工智能領域投入和布局。2021 年,美國在人工智能相關研發項目上投資超過 60 億美元。美 國國會已經指示國防部聯合人工智能中心在 4 月底之前向國會國防委員會提供一份國防部所有人工智能活 動的清單。這充分表明,美國對人工智能的重視,尤其是在軍事領域,美國更加傾注于人工智能技術的發展。
4. 人工智能在智能武器裝備中的關鍵技術
智能武器裝備的核心是先進技術,將人工智能技術應用到智能武器中,將大大增強軍事戰斗力。本 文主要探究了 4 種人工智能技術在智能武器裝備中的作用,分別為目標定位與識別技術、自主攻擊技術、 分布式作戰或蜂群作戰技術、作戰機器人技術。
4.1. 目標定位與識別技術
作戰狀態中,以對敵軍武器及敵人進行精準打擊為目的,這就需要智能武器裝備在外部環境干擾的 情況下,采用武器內部的自主定位與識別系統對敵方目標精準定位與識別,人工智能技術中的目標定位 與識別技術顯得尤為重要。目前,以卷積神經網絡為基礎的深度學習、機器學習是各國在目標定位與識 別研究領域之一,它主要解決的是在目標定位與識別中的準確度和效率。基于計算機視覺的低層理論是 卷積神經網絡[4]。如圖 2、圖 3 所示。由圖可知,卷積神經網絡的運算方式是從一端輸入相關的信息數據,經過卷積神經網絡的隱藏層, 最后從另一端輸出運算模型。例如,通過數據集、YOLO 系列算法等,將處理后的圖像數據輸入到卷積 神經網絡結構,通過優化參數學習率、激活函數、分類函數等參數的優化,進行不斷的迭代與訓練,提 取數據的特征,從而獲得目標定位與識別模型,通過測試程序調用卷積神經網絡學習和訓練好的模型, 實現對目標的定位與識別功能。在人工智能研究領域,目標定位與識別方面要具有良好的魯棒性,包括 精準定位、精準識別、運算效率高、中央處理器消耗低、數據集樣本量少、無需人為設定參數等,還應 該具有最優的回歸函數、損失函數、神經網絡的激活函數等。目前,上述技術還需進一步突破。
戰時狀態下的環境錯綜復雜,智能武器裝備在目標定位與識別中擁有核心算法是不可或缺的條件。 這里分別列舉了 2019 年、2020 年、2021 年的人工智能目標定位與識別的高性能算法模型,如表 1 所 示。戰時狀態下,毫秒必爭,敵軍的目標處于變動的狀態,快速精準鎖定目標與實現精準識別打擊功能 是現代武器裝備作戰具備的必要條件,如圖 4 所示。圖中為陸地作戰的場景,智能化的戰場,首要任務 是精準定位與識別目標,采用基于人工智能技術的自主定位識別系統,能夠快速鎖定目標,實現對目標 的精準打擊。
4.2. 自主攻擊技術
自主攻擊技術無需遠程人員操控,只是依賴于智能武器裝備本身所攜帶的傳感器、計算機、智能芯 片等先進部件,對敵方的信息自動搜索、識別、智能決策、選擇與自主攻擊。最具代表性的是無人作戰 機,使得無人作戰機不僅具有隱身的功能,還應具有自行完成起飛、自主攻擊,返回與降落等功能,其 中,自主攻擊是取得勝利的關鍵因素。圖 5 為自主攻擊技術流程圖。
上圖中,無人作戰機主要是通過自主攻擊系統實現對目標的自主攻擊。自主攻擊系統依賴的核心是智能裝備中的人工智能技術,它包含目標定位與識別、智能認知與決策、攻擊軌跡的生成、智能控制等關鍵技術。首先,無人作戰機獲取攻擊目標,這一步主要是通過基于深度學習的算法來實現。其次,是對目標的認知和決策,通過智能認知和決策算法對攻擊的目標篩查與檢測,實現精準攻擊目標的目的。無人作戰機獲得智能認知、決策后,接下來就需要對攻擊目標的軌跡進行規劃,主要采用的是軌跡路徑規劃算法。在智能控制部分,主要采用的是智能控制算法,實現多功能、全方位的智能控制,包括武器控制系統、目標定位與識別、攻擊軌跡的生成、飛行控制等。上述是實現自主攻擊功能的大致流程,但上述的每一部分所采用的技術都還不成熟,還需進一步研究。以下分別就上述技術的簡單論述。
4.2.1. 智能認知系統
智能認知系統是人工智能技術之一[23],無人作戰機具有智能認知的功能才能夠自主攻擊目標。認知 計算是建立在神經網絡和深度學習的基礎之上,基于人工智能和信息科學的技術平臺,這些平臺包括機 器學習、推理與表達、自然語言處理、計算機視覺、人機交互、定性空間表示等技術,通過運用認知科 學知識構建模擬人類思維過程的系統。智能認知系統離不開認知計算,目前,量子認知計算成為認知計 算發展的一大方向[24]-[29]。量子認知計算是當代量子計算與認知科學相結合的一個新型邊緣學科,通過 對認知科學中的現象進行建模,運用量子理論的計算方法,研究與描述人的認知及其決策的交叉科學。量子認知計算通過人的大腦接受外界所獲得的數據信息,經過人的大腦的加工處理,通過某種方式轉換 成內在的心理活動和心智活動,進而支配人的行為的信息加工過程,應用量子理論的數學形式為語言符 號、人類記憶符號、演繹推理、人類判斷邏輯等,以突破傳統認知科學的障礙。量子認知計算構架如圖 6 所示。
從上圖可知,為了實現智能認知,主要有 3 部分組成,以基礎學科為依托,通過認知計算算法使得 機器計算能力更強,認知計算更廣,與量子科學中的量子算法相結合,從而使得量子認知計算的功能接 近于人類的認知功能。將量子認知計算技術應用到智能武器裝備,實現智能武器裝備具備認知功能是現 今研究的課題之一。
4.2.2. 智能決策系統
未來戰場必將是智能化的戰場,智能決策在智能武器裝備中起著關鍵性的作用。智能決策主要分為 3 個層次:人來決策、輔助決策、機器自主決策。人來決策的主體是人,戰時狀態下,通過遠程操控, 由人來做出決策。輔助決策是人通過借助外在智能設備做出科學決策。最理想的狀態是機器能夠像人一 樣的智能甚至超越人的智能做出精準、高效、合理的決策。借助人工智能技術使得機器自主決策是智能 決策研究的重要方向之一。智能決策系統結構如圖 7 所示。
從圖 7 可以看出,要想實現機器自主決策,機器應當具備方法庫、數據庫、模型庫和知識庫 4 個主 要模塊。方法庫是存儲方法模塊的系統,有各種為了解決問題的算法組成;數據庫是收集數據信息、存 儲數據信息和加工處理數據信息的模塊系統;模型庫存儲著各種模型,用于支持決策系統;知識庫是對 輸入和輸出智能系統的信息數據進行編碼和解碼,包括知識定量和定性的表示,知識表達,知識推理決 策等。4 個主要模塊相互作用,從而實現對問題的智能決策。智能決策算法模型是目前研究的重要課題 之一[30]。人工智能技術中,馬爾可夫決策算法和決策樹算法是典型的代表。
4.3. 分布式作戰或蜂群作戰技術
分布式作戰包括空中分布式作戰、陸路分布式作戰、海上分布式殺傷、水下分布式作戰、空間分布 式結構等,蜂群作戰是一種仿照生物作戰的結構體系,如圖 9 所示。圖 9 作為一個分布式作戰體系結構,由一個指揮中心控制多個智能體,這里用智能體 1、2、3、4、 5 表示。每一個或多個智能體與指揮中心之間、多個智能體之間相互關聯,協同作戰,包括自主攻擊、 智能規避威脅、信息數據高速傳輸與共享等,形成一個亂中有序的蜂群作戰模式。作戰狀態下,智能武器裝備之間不僅可以協調配合,還可以協同配合,通過自主協同、群體智能技 術提高作戰能力,具有靈活性強,對抗性強的特點。目前,分布式作戰或蜂群作戰應該在以下方面還需 取得進一步研究。一是戰場信息化網絡技術。由單一智能體轉為多智能體,智能體之間需要由協調轉為協同,在特定 戰場中,依賴于智能網絡組成的作戰體系,要求智能體之間的數據傳輸極強,實時性極高,能夠保證智 能體之間的穩定性、可靠性。二是分布式或蜂群人工智能技術。戰時狀態下智能體要具有智能定位與識別目標、智能決策、智能控 制、智能協同、智能認知、自組織等作戰能力,這就需要在分布式或蜂群人工智能技術方面取得新突破。三是分布式或蜂群協同作戰技術。分布式或蜂群作戰,每一個子成員都是一個智能體,既能夠單獨 完成任務,也可以協同自身以外的子成員完成任務,單個或多個智能體之間都具有自主控制、自主決策、 自主認知的能力,這就需要在協同作戰技術上取得新突破。四是分布式或蜂群編隊控制技術。作戰環境中,只有一定的戰術策略才能夠贏得戰場的主動權。分 布式或蜂群之間要具有極高效的控制能力,包括自主控制、障礙回避,自主威脅識別能力,需要在編隊 控制技術上取得新進展。
4.4. 作戰機器人技術
作戰機器人作為未來戰爭的主力軍,是擁有人類智慧的參戰者,從作戰指揮到協同推進,從物質運 輸到偵查勘探以及實戰進攻都扮演著重要的角色,必須具備自我認知與推理能力、定量或定性空間表示、 知識表示、智能規劃、感知與認知能力等。如圖 10 所示。圖 10 為作戰機器人的概念圖,環境為地面作戰,要求機器人之間協同配合,精準識別目標,對目標 進行精準打擊,這就需要機器人獲取外界信息和高效計算的能力,智能控制能力等。除了上述的作戰場 景的之外,智能作戰無人機、水下智能機器人、空間智能機器人等都可以在復雜不確定的環境下參與作 戰。作戰機器人技術主要包含以下方面。一是如何賦予機器人人的的智慧或者超越人的智慧。復雜的作戰環境下,要求機器人必須要有人的 感知能力、認知能力、創造力,機器人的靈活性和靈敏性必須能夠達到人的靈活性和靈敏性,應當具備 群體智能的能力。二是作戰機器人自我隱蔽技術。戰爭狀態下,要求作戰機器人要具有極強的隱蔽性,動作靈活,特 別是偵查機器人,不能夠發出噪聲。三是作戰機器人超長待機技術。戰場中環境復雜多變,機器人必須保證自己的能量不受威脅,長期 作戰情況下,機器人要具有獲取能量自我補充的能力。四是人工智能芯片技術。作戰機器人的智能芯片有待發展,智能芯片作為機器人的核心部分,需要 具備更加完備的能力。將人工智能技術應用到作戰機器人已成為該領域研究的一大方向。
5. 人工智能技術在智能武器裝備中的應用
人工智能武器應當具有機智的決策、理性的辨別目標能力,具有明辨自然語言的能力,是一種能夠 對外部環境具有極強的洞察力、實時應對各種復雜挑戰,能認知會思考的武器系統[32]。科技發展至今, 利用人工智能技術的智能武器裝備也在不斷研制和應用,例如,目前美國的聯合全域指揮控制系統 (JADC2)正處在研發階段,根據五角大樓的最新規劃,現代軍隊總參謀部的每一個組成部分,包括作戰計 劃、信息采集、情報收集、后勤與保障、通信和決策都將移交給由傳感器、計算機和軟件、算法和模型 組成的復雜集合體負責。所有這些組成部分隨后都會被整合進一個“綜合各個系統的系統”。最終,這 種多系統集合體可能會代替人類的職能,甚至超越人類所應承擔的職能,以此來代替美軍高級將領及其 資深參謀所承擔的大部分職能。如圖 11 所示。除了 JADC2 外,美軍在役或在研的智能化導彈主要有戰術戰斧、遠程反艦導彈(LRASM)、標準-3、 灰狼等,它們都是運用人工智能技術的產物,將人工智能技術應用到導彈中,使得智能導彈具備自主識 別目標和自主攻擊的能力。以下是不同的智能化導彈、類型和狀態的基本情況,如表 3 所示。在分布式作戰和蜂群作戰方面,2020 年 9 月,俄羅斯軍方采用蘇-57 戰斗機進行試驗,在真實作戰 條件下,利用一架蘇-57 戰斗機作為指揮和控制多架蘇-35 戰斗機,執行協同攻擊任務。美國軍方也正在 利用新型 F-35 戰斗機進行類似的分布式作戰或蜂群作戰試驗。另外,灰狼巡航導彈試驗成功也將具備蜂 群攻擊的能力。不過,無論是分布式作戰,還是蜂群作戰,目前還處于初級試驗階段。其核心是先進的 算法模型和合理的數據以及高效的運算能力,因此還需要不斷探究。
類似的,利用人工智能技術在軍事中的應用實例還包括在信息化武器裝備中的應用[33]、在導彈領域 的應用[34]、導彈控制技術[35]、美軍智能武器裝備的發展等[36],雖然這些人工智能技術有些已經付諸 實踐之中,有些還在研究中,但是總體還不夠成熟,需要進一步的研究與技術突破。