元宇宙沉浸感強、虛實融合的特征為作戰推演的發展提供了新機遇. 從作戰推演指揮決策的需求出發, 依據元宇宙的主要特性, 探討其賦能作戰推演領域的著力點;深度討論作戰推演元宇宙的架構及關鍵技術;詳細介紹作戰推演元宇宙的應用場景以及面向未來戰爭的應用展望. 在元宇宙的加持下, 作戰推演將會形成具身體驗的態勢認知、虛實融合的智能決策、深度沉浸的推演評估以及跨域協作的指揮控制等核心功能的新形態, 在實戰化軍事訓練、虛實協同作戰等方面具有突出應用優勢.
2021 年 10 月 , Facebook 公 司 宣 布 其 更 名 為 “Meta”, 引爆元宇宙[1] ,“元宇宙”這一概念迅速引起世 界各國的廣泛關注, 2021 年被稱為元宇宙元年[2] . 元宇宙理念的出現與發展, 來自于人們對高度沉 浸感的異度空間以及超現實能力的強烈幻想與不斷 探索. 而隨著人工智能(artificial intelligence, AI)、虛擬 現實(virtual reality, VR)、區塊鏈(blockchain)等信息 技術的日臻成熟, 打造元宇宙的基本條件正在形成[3] . 清華大學新聞學院沈陽教授定義元宇宙, 是整合多 種新技術而產生的新型虛實相融的互聯網應用和社 會形態, 它基于擴展現實技術提供沉浸式體驗, 以及 數字孿生技術生成現實世界的鏡像, 通過區塊鏈技術 搭建經濟體系, 將虛擬世界與現實世界在經濟系統、 社交系統、身份系統上密切融合, 并且允許每個用戶 進行內容生產和編輯[4] . 也就是說, 元宇宙是在擴展現 實、數字孿生的基礎上發展起來的, 兼具跨時空性、真 實性、連接性、獨立性為一體.
元宇宙時代的到來將成為指揮控制系統的“賦能 器”, 尤其對于為指揮控制決策籌劃環節提供技術和 手段的作戰推演, 實現身臨其境的態勢感知、深度沉 浸的推演評估體驗等提供新機遇. 此前王飛躍研究員 就提出“平行智能指揮與控制”的核心理念, 即為虛實 互動的平行思想[5] , 其主要思路是以數據為驅動, 構建 一系列人工系統, 即軍事組織與系統, 通過實際環境 與人工系統虛實互動來完成特定軍事任務及目標, 并 能實時反饋效果, 從而提升作戰能力與執行效果. 而 指揮控制元宇宙正是平行智能指揮與控制的發展趨 勢, 其典型應用是作戰仿真推演. 世界各國均認識到仿真推演技術在軍事領域的 巨大作用. 美國防部高級研究計劃局(DefenseAdvanced Research Projects Agency, DARPA)機構于 2007 年啟 動的“深綠”計劃(deep green, DG), 旨在動態預測戰 場的變化趨勢, 為指揮決策提供支持, 其核心技術是 實時的態勢仿真[6] . 該計劃雖于 2011 年暫停, 但其思路和方法為作戰仿真推演技術的發展奠定了基礎. 從 2016 年 AlphaGo 戰勝李世石, 到 2017 年 AlphaGo Zero 再度刷新紀錄, 再到 2019 年 AlphaStar 在即時戰 略游戲《星際爭霸 2》中以 10∶1 戰勝職業高手, 其核 心思路都是從基于仿真推演的實踐出發, 從中汲取經 驗或訓練機器學習模型[7] . 美國陸軍研究院在 2021 年嘗試將星際爭霸游戲環境 SC2LE 改造成作戰推演 軟件, 并在其中利用深度強化學習技術進行作戰方案 推演[8] . 英國國防科技實驗室同樣在 2021 年提出將深 度強化學習應用于軍事智能博弈仿真環境, 并在美國 軍事學院舉行了美國、英國、澳大利亞、加拿大與新西 蘭 5 個國家的兵棋智能博弈比賽[9] . 以上研究進展不 僅證明了多智能體強化學習在作戰仿真推演中重要 的實用價值, 也展示了虛擬空間對于仿真對抗訓練的 巨大優勢與前景. 而元宇宙作為與現實世界映射與交 互的新型虛擬現實空間, 對于促進仿真推演的發展具 有重要作用. 因此, 本文從作戰推演指揮決策的發展 需求出發, 依據元宇宙的定義及主要特性探討元宇宙 賦能作戰推演領域的主要著力點;前瞻性分析元宇宙 時代作戰推演虛實融生的新形態, 深度討論作戰推演 元宇宙的架構以及關鍵技術;最后詳細介紹作戰推演 元宇宙的應用優勢, 以及面向未來多域聯合作戰場景 的應用展望.
介紹了數字孿生技術的起源及概念,分析了數字孿生系統與平行系統/仿真推演系統等區別,針對數字孿生在武器裝備系統中的應用,進行了技術框架和應用框架設計,并提出了武器裝備系統數字孿生在裝備感知、模型構建、系統集成、評估預測、交互控制五大領域的關鍵技術,給出了武器裝備系統數字孿生發展在理論及實踐方面的啟示,以期對武器裝備系統中數字孿生技術的應用提供技術支撐。
數字孿生技術起源于 2002 年,到 2017 年進入快速 發展期。 目前,國內工業領域、軍事領域等也掀起了數 字孿生技術研究的熱潮。 數字孿生作為一種描述、優 化物理實體的重要技術,在計算機仿真、數據采集等技 術的支撐下,既可以實現物理實體靜態特性的數字化 模擬,又可以實現物理實體隨時間展現的動態特性,甚 至可與物理實體交互、共生,從而為物理實體的調試、 保障、升級等提供了方法和手段。 在數字孿生技術發展和應用過程中,因應用領域、 裝備類型、運用階段等不同,各領域對數字孿生的理解 和實踐不同。 作為實現武器裝備數字化、智能化的重 要使能技術,在武器裝備領域,數字孿生首先應用于航 空航天裝備領域,后陸續應用于其他武器裝備領域,向 研發設計和生產制造領域延伸,且覆蓋產品全生命周 期發展。 本文通過梳理數字孿生技術的內涵,研究了武器 裝備系統數字孿生要素、總體框架及關鍵技術,為武器 裝備系統的數字孿生發展提供了支撐。
隨著無人機戰技性能的不斷提升以及戰術戰法的廣泛運用,無人機蜂群協同作戰給當前防空系統帶來了全新的挑戰。通過梳理分析近年來無人機蜂群作戰運用案例,總結了當前無人機蜂群作戰運用的特點,闡述了發展反無人機蜂群作戰指揮控制系統的必要性和緊迫性。由此,結合當前世界各軍事強國反無人機蜂群作戰指揮控制系統的現狀,對未來反無人機蜂群作戰指控系統發展提出了一些啟示建議。
近年來,世界各國大力推進軍用無人機裝備技術 的發展,加上自組網通信、人工智能、無人控制等技術 的迅猛發展,無人機蜂群作戰作為一種全新的作戰模 式[1]登上了歷史舞臺,其可以在極端惡劣條件下,零傷 亡、高效率地協同完成預警探測、欺騙干擾、通信中繼、 超飽和式打擊等作戰任務[2] 。隨著無人機蜂群作戰運用不斷成熟,其給世界各 國防空系統帶來了新的挑戰,反無人機蜂群作戰體系 建設也成了世界各國關注的重點[3] 。美、俄、英、以色 列等軍事強國不斷探索反無人機蜂群的新用法,其中 包括電磁脈沖炮、高功率微波武器、高能激光武器、電 子干擾、密集炮、網捕等手段,美國每年都進行“黑色飛 鏢”反無人機試驗[4] 來提高反無人機作戰能力。在反 無人機蜂群作戰中,除了作戰武器外,指揮控制系統也 是反蜂群作戰的核心中樞,其貫穿了預警探測、信息處 理、決策分析、武器控制等全流程作戰,也是世界各國 大力發展的重點之一。本文分析了無人機蜂群作戰運用的主要特點,介 紹了當前世界各國反無人機蜂群作戰指控系統發展現 狀,并對反無人機蜂群作戰指揮控制系統未來發展方 向進行分析闡述。
軍事網絡戰的前景正在發生變化,這是因為數據生成和可訪問性的發展、持續的技術進步及其(公共)可用性、技術和人類(相互)聯系的增加,以及參與其規劃、執行和評估階段的專家活力、需求、不同性質、觀點和技能。這種行動每天都在進行,最近被人工智能賦予了更多能力,以達到或保護他們的目標,并處理產生的意外影響。然而,這些行動受到不同的不確定性水平制約和包圍,例如,預期效果的預測,有效替代方案的考慮,以及對可能的(戰略)未來新層面的理解。因此,應確保這些行動的合法性和道德性;特別是在攻擊性軍事網絡戰(OMCO)中,參與其設計/部署的智能體應考慮、開發和提出適當的(智能)措施/方法。這種機制可以通過像數字孿生這樣的新型系統,在硬件、軟件和通信數據以及專家知識的基礎上嵌入智能技術。雖然數字孿生在軍事、網絡和人工智能的學術研究和討論中處于起步階段,但它們已經開始在不同的行業應用中展示其建模和仿真潛力以及有效的實時決策支持。然而,本研究旨在(i)理解數字孿生在OMCO背景下的意義,同時嵌入可解釋人工智能和負責任人工智能的觀點,以及(ii)捕捉其發展的挑戰和益處。因此,通過對相關領域的廣泛審查,考慮采取多學科的立場,將其包裝在一個設計框架中,以協助參與其開發和部署的智能體。
盡管數字孿生被認為是在工業4.0的數字化轉型過程中引入的一項關鍵技術,但它們有二十年的歷史,甚至更早的基礎。其起源是Michael Grieves的鏡像空間模型,以及他與John Vickers在NASA宇航和航空航天領域項目中的進一步研究(Grieves & Vickers,2017),將數字孿生定義為 "物理產品的虛擬代表",融合了物理和虛擬世界的優勢,它包含三個組成部分:物理產品、物理產品的虛擬代表,以及從物理產品到虛擬代表的雙向數據連接,以及從虛擬代表到物理產品的信息和流程(Jones等人,2020)。
對數字孿生概念的理解有不同的角度和方式,其含義可以根據應用領域進行調整(Vielberth等人,2021)。考慮到與數字模型或數字影子等相關主題存在誤解和混淆,以及數字孿生不存在一致的定義(Hribernik等人,2021;Fuller等人,2020),為了確保其在攻擊性軍事網絡戰(OMCO)中的正確設計、開發和部署,采用了系統性觀點,并提出以下定義:
攻擊性軍事網絡戰(OMCO)中的數字孿生子 = 一個技術系統,在其現實環境中嵌入物理系統,及物理系統的網絡抽象、表示和鏡像,以及它們在OMCO中的相應數據和通信流。
這個定義的要素是:
換句話說,OMCO中的數字孿生是一個先進的(智能)系統,它嵌入了OMCO系統/實體的虛擬、物理以及數據和通信元素。鑒于此,在圖2中提出了以下對訓練、演習和實際行動有用的OMCO數字孿生架構,其中連續的箭頭描述了行動中目標階段之間的信息和結果交流,帶點的箭頭描述了集成部件和其他部件之間的信息和結果。該架構應該是模塊化和可配置的(Silvera等人,2020),并包含兩個組件:
數字孿生層,即三個數字孿生模塊和一個集成模塊或四個獨立的數字孿生模塊,其中集成DT與其他三個獨立的數字孿生模塊通信并獲取結果。
數字孿生層,即整個數字孿生或四個集成數字孿生的物理、數據和通信以及網絡組件。
此外,認識到系統將具有分析、預測或模擬功能,以支持不同的軍事網絡決策過程,軍事指揮官及其團隊有責任如何解釋和使用數字孿生所呈現的結果,因此,有必要從設計階段就將XAI和RAI方法嵌入其中。RAI必須尊重并納入社會道德規范和價值觀,XAI在整個過程中以及在呈現最終結果時,必須尊重軍事技術和社會法律道德要求、規范和價值觀(Arrieta等人,2009, 2020;Agarwal和Mishra,2021;Maathuis,2022a;Maathuis,2022b)。這些措施保證了負責任的OMCO發展和部署。
為了進行示范,OMCO的開發、部署和評估是在架構左側所示的階段進行的,其中集成DT的最終結果可以作為經驗教訓或對未來行動、網絡或其他行動的投入而進一步使用。例如,在設計和開發階段,選擇目標,確定其核心弱點,并進一步在智能網絡武器中建立一個漏洞,可以預測(非)預期效果的水平和概率,并對目標交戰進行負責任和可解釋的比例評估;此外,效果評估與定義的目標和依賴性有關。在這里,一個原型將通過定義和部署系統的多個實例來實現,這些實例將被匯總,同時考慮到要求以及與物理和網絡環境的相互作用(Grieves, M., & Vickers; Jones等人,2020)。
作為數字化轉型過程的一部分,并與若干數字和智能技術緊密相連,與其他類型的技術一樣,數字孿生帶來了挑戰和機遇。
挑戰:
考慮多利益相關者視角的標準化、管理和監管(Talkhestani等人,2019年;Singh等人,2021年;Flamigni等人,2021年):由于這些系統是在多利益相關者參與開發和部署的,在匹配所定義的目標和功能時應考慮適當的標準、管理和監管機制。
數據和算法(Jones等人,2020;Qian等人,2022;Song等人,2022):這類系統對數據敏感,依賴于相關的高保真表示和數據添加到正確構建和部署的人工智能模型中,例如,相關數據應該被收集、分析、使用,并在系統的各個層面和層次之間共享。
安全、安保、隱私和可靠性(Glaessgen & Stargel, 2012; Vielberth et al., 2021; Chockalingam & Maathuis, 2022)和可靠性問題:如果管理不當,并且通過其在數字孿生的設計階段就沒有整合到所有層面和層次,這些有可能通過改變系統的行為來打開意外和有意的網絡安全和安保事件的大門,產生大規模的影響。例如,這樣的行動可能無法區分軍事和民用目標,從而在民用方面產生大量的附帶損害,因此系統在行動中是不可靠的。
機遇:
認識和理解、決策支持和教育(Mendi, Erol & Dogan, 2021; Talkhestani et al., 2019):這些系統有利于理解系統的行為,支持具體的決策過程,并產生/增強不同的學習活動。例如,這些系統不僅可以對當前的行動產生情報,而且還可以通過對未來行動的評估產生情報。
建模和仿真,例如現場生命周期測試、監測、優化(Steinmetz等人,2018;Jones等人,2020;Hribernik等人,2021):通過其性質,數字孿生對不同的系統和過程進行建模和仿真,例如,允許鏡像和測試雙重用途目標的行動執行,以避免預期產生的意外影響;或允許使用不同的優化技術對智能網絡武器實施的路徑和行動進行現場監測。
可訪問性和成本降低(Barricelli, Casiraghi & Fogli, 2019;Jones等人,2020;Aheleroff等人,2021):通過其設計界面,此類系統可被用戶直接訪問,有利于普遍降低實施和部署的成本。
2021年10月28日,當Meta的創始人馬克-扎克伯格提出元宇宙,即一系列能夠完全改變我們交流方式的相互連接的虛擬世界時,很少有人能夠理解這只是又一次品牌重塑和營銷炒作,還是我們生活中的下一個進化步驟;創造一個先進的、網絡化的虛擬現實(VR)。意識到這項新技術重要性之一是微軟聯合創始人比爾-蓋茨,他在一次Ted演講活動中預示了在COVID-19大流行病實際爆發的五年前,傳染性病毒所帶來的威脅。
他在2021年12月的年度博客中說:"在未來兩到三年內,虛擬會議將從二維攝像機圖像網格格式轉變為帶有數字頭像的三維空間。比爾-蓋茨對他過去幾乎是預言性的預測充滿信心,他看到在不久的將來,人們將在互聯的數字環境中,在 "化身 "的幫助下進行虛擬會面,真實地模擬當面會面的情況。
由于這種大流行病,人類被迫在技術使用方面實現了巨大的飛躍。在過去的兩年里,技術的發展、變化和加速是如此的迅速和廣泛,而通常情況下,這需要幾十年的時間。在這樣一個充滿挑戰的環境中,像北約這樣的組織是否有能力審查長期形成的做法,并調整傳統的作戰程序,以保持其戰略優勢?
在20世紀90年代,互聯網、計算機網絡和數字通信的使用在世界范圍內激增,永遠改變了我們的生活和互動方式。這些技術革新構成了第四次工業革命的縮影和信息時代的開始。自1991年以來,萬維網已成為公眾可訪問的網絡,超越了美國政府和大學的邊界。它需要不到十年的時間來擴展到全球。相比之下,第一個2G蜂窩網絡在同一年發布,不到30年后,5G網絡已經建立并運行。
今天,逐漸發生的不僅是互聯網從二維(2D)網站過渡到三維(3D)網絡空間,而且還出現了其無限的繼任者--元宇宙(Metaverse)。在這個元宇宙世界中,當它被完全開發時,人們將以自我設計的化身出現。他們將參與日常活動,如談話和調情,甚至爭吵,甚至達到間諜活動的極端。一個無限的虛擬現實將允許人們居住和控制角色,這些角色將在一個類似于多人在線游戲的數字空間中移動和社交。這意味著我們不僅可以玩游戲、聊天、看電影、參加活動、購物、散步,以及做與現實世界類似的虛擬事情,還可以以無數種不可預測的方式與現實世界互動。與宇宙一樣,元宇宙包括空間和時間,不僅是一種物質形式,也是一種能量形式。特別是,元宇宙"講述的是這樣一個時代:基本上沉浸式的數字世界成為我們生活和消磨時間的主要方式。"現實世界和數字世界之間的界限將越來越模糊,元宇宙將成為社會運作和解決爭端或沖突的重要場所。
基礎設施和處理能力仍不足以用設想中的沉浸式、網絡化的3D虛擬世界來取代現有的2D互聯網。雖然已經在全球范圍內建立了數百個超大規模的云計算數據中心,以有效地支持強大的、可擴展的應用程序,但完全形成的元宇宙及其無數的實時、同步連接將需要大數據生產公司,如Alphabet、亞馬遜、Facebook、蘋果或微軟的更多投資。令人驚訝的是,加速和徹底改變我們工作和互動方式的最有影響力的因素無疑是COVID-19大流行病。
根據比爾-蓋茨的預測,該大流行病對數字化的影響至少還需要十年才能實現。在此期間,必須開發新的技術和產品,以成為進入元宇宙的最終門戶(VR頭盔、智能眼鏡、觸覺手套),并增強人們的互動和共享體驗。同時,由于互聯設備的數量呈指數級增長,黑客的攻擊面和潛在進入點將急劇增加,破壞了現有網絡入侵檢測系統的有效性。
在一個共享的網絡世界中,物理、增強和虛擬現實的融合,即 "具象的互聯網",將為其 "公民"提供前所未有的互操作性,并為政府和機構提供不可預見的安全挑戰。沒有任何一家公司或機構可以獨家經營元宇宙;因此,各種多角色和團體將分散地經營它。數字化將繼續存在,并將影響人們工作、學習或娛樂的方式,以及國家和軍事利益的競爭和戰斗方式。
在這樣一個數字化的世界中,逐漸和穩定地轉變為一個虛擬的世界,國防和安全政策和戰略必須作出相應的調整。新興的和顛覆性的技術可以產生風險和機遇。全球化、通信進步和兩用技術,如人工智能、量子計算、機器學習、大數據管理、區塊鏈網絡、自主性和生物技術,都有可能威脅到北約的軍事技術優勢。未來的國防環境不僅需要新的技術,還需要新的方式來處理和利用這些技術挑戰。
被先進的 "社會媒體2.0 "應用強化的新信息領域不僅導致技術發展,也導致社會學變化。假新聞的傳播加上信息戰運動可以影響、操縱、打擊甚至激化公眾輿論和行為,破壞對民主機構和進程的信任。
北約明白,"用昨天的方法無法在明天的戰斗中取得成功"。北約需要不斷轉型,"以塑造和爭奪環境,并在現在和未來保持對對手和競爭者的優勢"。"作戰環境在高速變化。未來的軍事戰斗空間正在擴大,需要在陸地、空中、海上和空間領域進行更多的協作、高效、數字化、安全和網絡抗擊能力。
北約的多域作戰方法認識到并有效地解決了在普遍存在的信息環境下日益模糊的地理和組織邊界問題。盡管需要處理的信息量不斷增加,但現代決策周期需要能夠以相關的速度做出決定。傳統的環境和文化領域的界限需要被打破,因為這些領域目前靜態的、分散的、指揮和控制(C2)的架構被證明是不夠的。新的方法應該利用未來類似云的戰斗環境,在多個通信網絡中即時分享和傳輸來自物理和非物理領域的數據。
今天,數十億互聯的智能設備和傳感器,就像 "萬物互聯 "的網絡,需要基于網絡的、分散的和敏捷的C2架構,以使決策過程能夠在最小的人為干預下快速和自主地適應任務環境。此外,腦機接口可以將大腦的低電活動轉化為強大的數字信號,由外部設備進行分析并轉化為命令和所需的行動。
決策者,無論他們的層次如何,都需要 "獲取信息,以便利用突襲和快速持續整合[多個]領域的能力進行同步和連續作戰"。利用新技術將有助于快速了解戰斗空間,比敵人更快地指揮部隊,并提供同步的多領域效果。如果每個過程(計劃、部署、交戰)都能及時獲得所有必要的信息,那么就可以實現所謂的 "信息優勢",導致更好的態勢感知和決策優勢。
隨著物理環境逐漸轉變為實時的、受數據約束的數字復制品,以創建所謂的數字孿生,其中每個物理對象都與虛擬對應物相連,新的操作平臺和先進技術需要應用于制定的混合現實生態系統。正在進行的物理和數字物體的融合有可能徹底改變和刺激未來的軍事行動,即時利用所有分配給物理和非物理領域的傳感器和效應器,并相應地同步預期效果。
基于數字孿生的方法為先進的軍事系統和平臺提供了一致的、可重復使用的、可用的數據的前景,為供應鏈管理、測試、培訓和實驗能力提供了以前不可能得到的好處,并引入了沉浸式任務規劃流程。基于具有高度真實性和可信度的先進模擬的游戲化原則,可以 "通過激勵訓練過程來改善復雜而昂貴的軍事飛行訓練過程 "。
此外,基于先進分析、數據建模、巧妙模擬、自主控制、腦機接口和現場互動的操作平臺的整合,可以改變和加速決策過程,同時確保其準確性。信息優勢和有效的態勢感知在一個動態的、多領域的戰斗場景中是至關重要的。所有經過評估的相關數據都需要高速流通,并傳播給關鍵行動者,以使部隊能夠 "知情[......],統一行動 "。
當然,對手會試圖打斷聯盟的殺傷鏈,在作戰計劃過程中注入影響,損害其機器學習算法的準確性,以控制和操縱有爭議的地區,并在任何動能戰斗中獲勝。在未來的戰爭環境中,C2鏈需要靈活、有彈性和相互連接。在一個快節奏、多領域、完全數字化的環境中,可訪問性、敏捷性和靈活性是必不可少的操作要求。內容、產品和服務必須通過低成本、強大的網絡化基礎設施從可持續的設備上按需提供。
向 "元域運營 "概念的過渡,其中頭像、三維模型、混合現實和空間環境是主要的資產類別,這意味著平臺和網絡之間的互操作性限制被克服。傳統的互操作性標準不能以綜合方式支持新的媒體類型,也不能說明大量的非結構化數據。所有的組織,包括軍事組織,都必須采用新的思維方式,并在其文化、結構、運營和服務的各個方面進行快速的數字化轉型,以進入Metaverse。各種Metaverse平臺需要提供方便的、可移植的、實用的和安全的系統和界面,以實現無縫過渡。
隨著技術和數字化的不斷變化和發展,元宇宙中的資產和數據需要在其整個生命周期中不斷發展,并且可以在一個擴大的、開放的生態系統中從任何平臺訪問。通過采用仿真、遷移和表示的最佳做法,元域可以在支持現代軍事環境方面具有高度的有效性、彈性和期望。在網絡衛生生態系統下構建的元域環境,考慮到其虛擬能力和腦機接口,可以在多域作戰中產生同步和決定性的效果。
北約要想保持對其競爭對手的優勢,并將其軍事力量和資產保持在較高的準備和能力水平上,就必須重新思考它如何看待世界,包括在物理和虛擬意義上。如果沒有敏捷性、數字互聯、數據共享以及在認知、物理和虛擬領域所有層面的協作,就不可能在一個擴展和混合的未來戰斗空間中取得優勢。為了使北約向真正的數字化部隊過渡,元空間將是達到這一目標的最終工具。
Fotios Kanellos,少校,于2003年畢業于希臘空軍(HAF)學院,是一名電氣工程師,專業是電信和計算機科學。他擁有三個碩士學位。雅典國立技術大學(NTUA)的技術-經濟系統,帕特雷大學的環境科學,以及雅典國立和卡波迪斯特拉大學的歐洲和國際研究。
他曾在卡拉馬塔的希臘空軍訓練司令部擔任T-2 C/E飛機的檢查工程師和T-6A飛行模擬器的系統工程師。他之前的任命是在希臘空軍支援司令部管理信息技術和網絡安全項目。目前,他是JAPCC的網絡空間中小企業。
智能博弈領域已逐漸成為當前AI研究的熱點之一,游戲AI領域、智能兵棋領域都在近年取得了一系列的研究突破。但是,游戲 AI 如何應用到實際的智能作戰推演依然面臨巨大的困難。綜合分析智能博弈領域的國內外整體研究進展,詳細剖析智能作戰推演的主要屬性需求,并結合當前最新的強化學習發展概況進行闡述。從智能博弈領域主流研究技術、相關智能決策技術、作戰推演技術難點3個維度綜合分析游戲AI發展為智能作戰推演的可行性,最后給出未來智能作戰推演的發展建議。以期為智能博弈領域的研究人員介紹一個比較清晰的發展現狀并提供有價值的研究思路。
以2016年AlphaGo的成功研發為起點,對智能博弈領域的研究獲得突飛猛進的進展。2016年之前,對兵棋推演的研究還主要集中在基于事件驅動、規則驅動等比較固定的思路。到2016年,受AlphaGo的啟發,研究人員發現智能兵棋、智能作戰推演的實現并沒有想象得那么遙遠。隨著機器學習技術的發展,很多玩家十分憧憬游戲中有 AI 加入從而改善自己的游戲體驗[1]。同時,在智能作戰推演領域,不斷發展的機器學習游戲 AI 技術也為智能作戰推演的發展提供了可行思路[2]。傳統作戰推演AI主要以基于規則的AI和分層狀態機的AI決策為主,同時以基于事件驅動的機制進行推演[3-4]。然而,隨著近些年國內外在各種棋類、策略類游戲領域取得新突破,智能作戰推演的發展迎來了新的機遇[5]。
國內游戲 AI 領域取得了標志性的進步。騰訊《王者榮耀》的《覺悟AI》作為一款策略對抗游戲取得了顯著成績,可以擊敗97%的玩家,并且多次擊敗頂尖職業團隊[6]。網易伏羲人工智能實驗室在很多游戲環境都進行了強化學習游戲 AI 的嘗試[6],如《潮人籃球》《逆水寒》《倩女幽魂》。超參數科技(深圳)有限公司打造了游戲AI平臺“Delta”,集成機器學習、強化學習、大系統工程等技術,通過將AI與游戲場景結合,提供人工智能解決方案[7]。啟元AI“星際指揮官”在與職業選手的對抗中也取得了勝利[8]。北京字節跳動科技有限公司也收購了上海沐瞳科技有限公司和北京深極智能科技有限公司,準備在游戲AI領域發力。除了游戲AI領域,國內在智能兵棋推演領域也發展迅速。國防大學兵棋團隊研制了戰略、戰役級兵棋系統,并分析了將人工智能特別是深度學習技術運用在兵棋系統上需要解決的問題[9]。中國科學院自動化研究所在2017年首次推出《CASIA-先知1.0》兵棋推演人機對抗AI[10],并在近期上線“廟算·智勝”即時策略人機對抗平臺[11]。此外,由中國指揮與控制學會和北京華戍防務技術有限公司共同推出的專業級兵棋《智戎·未來指揮官》在第三屆、第四屆全國兵棋推演大賽中成為官方指定平臺。中國電科認知與智能技術重點實驗室開發了MaCA智能博弈平臺,也成功以此平臺為基礎舉辦了相關智能博弈賽事。南京大學、中國人民解放軍陸軍工程大學、中國電子科技集團公司第五十二研究所等相關單位也開發研制了具有自主知識產權的兵棋推演系統[12,13,14,15]。2020年,國內舉辦了4次大型智能兵棋推演比賽,這些比賽對于國內智能博弈推演的發展、作戰推演領域的推進具有積極影響。游戲 AI 和智能兵棋的發展也逐漸獲得了國內學者的關注,胡曉峰等人[5]提出了從游戲博弈到作戰指揮的決策差異,分析了將現有主流人工智能技術應用到戰爭對抗過程中的局限性。南京理工大學張振、李琛等人利用PPO、A3C算法實現了簡易環境下的智能兵棋推演,取得了較好的智能性[16-17]。中國人民解放軍陸軍工程大學程愷、張可等人利用知識驅動及遺傳模糊算法等提高了兵棋推演的智能性[18-19]。中國人民解放軍海軍研究院和中國科學院自動化研究所分別設計和開發了智能博弈對抗系統,對于國內智能兵棋推演系統的開發具有重要參考價值[20]。中國人民解放軍國防科技大學劉忠教授團隊利用深度強化學習技術在《墨子?未來指揮官系統》中進行了一系列智能博弈的研究,取得了突出的成果[21]。中國科學院大學人工智能學院倪晚成團隊提出一種基于深度神經網絡從復盤數據中學習戰術機動策略模型的方法,對于智能博弈中的態勢認知研究具有重要參考價值[22]。
總體來說,國內在智能博弈領域進行了一系列的研究,嘗試將該技術應用到作戰推演領域,建立了具有自主產權的博弈平臺,技術層面也不斷突破,不再局限于傳統的行為決策樹、專家知識庫等,開始將強化學習技術、深度學習技術、遺傳模糊算法等引入智能博弈,取得了一系列的關鍵技術的突破。但是,當前的研究主要聚焦在比較簡單的智能博弈環境,對復雜環境及不完全信息的博弈對抗研究仍然需要進一步探索。
國外游戲 AI 領域則取得了一系列突出成果,尤其是深度強化學習技術的不斷發展,游戲 AI 開始稱霸各類型的游戲[23]。2015年DeepMind團隊發表了深度Q網絡的文章,認為深度強化學習可以實現人類水平的控制[24]。2017年,DeepMind團隊根據深度學習和策略搜索的方法推出了AlphaGo[25],擊敗了圍棋世界冠軍李世石。此后,基于深度強化學習的 AlphaGo Zero[26]在不需要人類經驗的幫助下,經過短時間的訓練就擊敗了AlphaGo。2019年, DeepMind 團隊基于多智能體(agent)深度強化學習推出的AlphaStar[27]在《星際爭霸II》游戲中達到了人類大師級的水平,并且在《星際爭霸II》的官方排名中超越了 99.8%的人類玩家。《Dota 2》AI“OpenAI Five”在電競游戲中擊敗世界冠軍[28], Pluribus 在 6 人無限制德州撲克中擊敗人類職業選手[29]。同時DeepMind推出的MuZero在沒有傳授棋類運行規則的情況下,通過自我觀察掌握圍棋、國際象棋、將棋和雅達利(Atari)游戲[30]。與軍事推演直接相關的《CMANO》和《戰爭游戲:紅龍》(Wargame:Red Dragon),同樣也結合了最新的機器學習技術提升了其智能性[31]。美國蘭德公司也對兵棋推演的應用進行相關研究,利用兵棋推演假設分析了俄羅斯和北大西洋公約組織之間的對抗結果,并利用智能兵棋推演去發現新的戰術[32]。蘭德研究員也提出將兵棋作為美國軍事人員學習戰術戰法的工具[33]。美國海軍研究院嘗試使用深度強化學習技術開發能夠在多種單元和地形類型的簡單場景中學習最佳行為的人工智能代理,并將其應用到軍事訓練及軍事演習[34-35]。
但就目前而言,國外的研究也遇到了瓶頸。雖然也嘗試將深度強化學習技術利用到作戰領域,但是就目前發表的論文和報告來看,國外學者、研究人員將機器學習技術應用到作戰推演 AI 中還有很多問題需要解決,現階段也是主要在游戲 AI 領域及簡單的作戰場景進行實驗驗證及分析。作戰推演AI 的設計也不僅僅是把機器學習技術照搬照用這么簡單。但是必須肯定的是,隨著未來計算機硬件的發展和機器學習技術的完善,作戰推演 AI 會迎來一波革命式的發展,給各類作戰智能指揮決策帶來翻天覆地的變化。本文從智能博弈的重要應用領域——作戰推演分析了國內外整體背景,進而引出作戰推演的技術需求,并給出當前可參考的主流及小眾技術思路。同時,對可能出現的技術難點進行了分析并給出解決方案建議。最后,對作戰推演的未來發展提出建議。
狀態空間是作戰推演中的每個作戰實體的位置坐標、所處環境、所處狀態等要素的表現,是深度強化學習進行訓練的基礎。在圍棋中,狀態空間就是棋盤上每個點是否有棋子。在《覺悟AI》中,狀態空間是每一幀、每個單位可能有的狀態,如生命值、級別、金幣[36,37,38,39]。在《墨子·未來指揮官系統》中,狀態空間主要是每個作戰單元實體的狀態信息,是由想定中敵我雙方所有的作戰單元信息匯聚形成的。本節尤其要明確狀態空間和可觀察空間是可區分的,可觀察空間主要是每個 agent 可以觀察到的狀態信息,是整個狀態空間的一部分。作戰推演中的狀態空間將更加復雜,具有更多的作戰單位和單位狀態。針對敵我雙方的不同作戰單位、不同單位屬性、不同環境屬性等定義作戰推演的狀態空間屬性。例如敵我雙方坦克單元應包括坐標、速度、朝向、載彈量、攻擊武器、規模等。陸戰環境應包括周圍道路信息、城鎮居民地、奪控點等。
動作空間是指在策略對抗游戲中玩家控制算子或游戲單元可以進行的所有動作的集合。對于圍棋來說,動作空間為361個,是棋盤上所有可以落子的點。對于《王者榮耀》和《Dota》這類游戲來說,動作空間主要是玩家控制一個“英雄”進行的一系列操作,玩家平均水平是每秒可以進行一個動作,但是需要結合走位、釋放技能、查看資源信息等操作。例如《覺悟AI》的玩家有幾十個動作選項,包括24個方向的移動按鈕和一些釋放位置/方向的技能按鈕[34]。因此每局多人在線戰術競技(multiplayer online battle arena,MOBA)游戲的動作空間可以達到1060 000+。假設游戲時長為45 min,每秒30幀,共計81 000幀,AI每4幀進行一次操作,共計20 250次操作,這是游戲長度。任何時刻每個“英雄”可能的操作數是170 000,但考慮到其中大部分是不可執行的(例如使用一個尚處于冷卻狀態的技能),平均的可執行動作數約為1 000,即動作空間[37]。因此,操作序列空間約等于1 00020 250= 1060 750。而對于《星際爭霸》這類實時策略對抗游戲來說,因為需要控制大量的作戰單元和建筑單元,動作空間可以達到1052 000[38]。而對于《CMANO》和《墨子·未來指揮官系統》這類更加貼近軍事作戰推演的游戲來說,需要對每個作戰單元進行大量精細的控制。在作戰推演中,每個作戰單元實際都包括大量的具體執行動作,以作戰飛機為例,應包括飛行航向、飛行高度、飛行速度、自動開火距離、導彈齊射數量等。因此,實際作戰推演需要考慮的動作空間可以達到10100 000+。可以看出,對于作戰推演來說,龐大的動作空間一直是游戲 AI 邁進實際作戰推演的門檻。現有的解決思路主要是考慮利用宏觀AI訓練戰略決策,根據戰略決策構建一系列綁定的宏函數,進行動作腳本設計。這樣的好處是有效降低了動作空間設計的復雜度,同時也方便高效訓練,但是實際問題是訓練出來的 AI 總體缺乏靈活性,過于僵化。
對于動作空間,還需要考慮其是離散的還是連續的,Atari和圍棋這類游戲動作都是離散動作空間[25,39-40],《星際爭霸》《CMANO》《墨子·未來指揮官系統》這類游戲主要是連續動作空間[38]。對于離散動作,可以考慮基于值函數的強化學習進行訓練,而對于連續動作,可以考慮利用基于策略函數的強化學習進行訓練。同時,離散動作和連續動作也可以互相轉化。國內某兵棋推演平臺由原先的回合制改為時間連續推演,即把回合制轉化為固定的時間表達。同時對于連續動作,也可以在固定節點提取對應的動作,然后將其轉化為離散動作。
智能博弈中的決策主要是指博弈對抗過程中的宏觀戰略的選擇以及微觀具體動作的選擇。宏觀戰略的選擇在《墨子·未來指揮官系統》推演平臺中體現得比較明顯。在推演比賽開始前,每個選手要進行任務規劃,這個任務規劃是開始推演前的整體戰略部署,例如分配導彈打擊目標,規劃艦艇、戰斗機活動的大致區域,以及各個任務的開始執行時間等。這一決策空間與想定中的作戰單元數量、任務規劃數量相關。在制定完成宏觀戰略決策后,推演階段即自主執行所制定的宏觀戰略決策。同時,在推演過程中也可以進行微觀具體動作的干預,這一階段的具體動作和作戰單元數量、作戰單元動作空間成正比。在實際作戰推演中利用智能算法進行智能決策,首先需要明確決策空間數量。在現有的《墨子·未來指揮官系統》中,針對大型對抗想定,計算機基本需要每秒進行數百個決策,一局想定推演中雙方博弈決策空間數量預估為 1080+個,而對于《星際爭霸》《Dota 2》和《王者榮耀》這類即時戰略(real-time strategy,RTS)游戲,決策空間會低一些。實際作戰推演每小時的決策空間數量將高于 1050+個。對于這類智能決策的方案,現有 RTS游戲中提出的思路是利用分層強化學習的方法進行解決,根據具體對抗態勢進行宏觀戰略決策的選擇,然后根據不同的決策再分別執行對應的微觀具體動作,這樣可以有效降低智能決策數量,明顯提高智能決策的執行效率。
博弈對抗的勝利是一局游戲結束的標志。而不同游戲中的勝利條件類型也不同,圍棋、國際象棋這些棋類博弈對抗過程中有清晰明確的獲勝條件[30]。而 Atari 這類游戲[40]只需要獲得足夠的分數即可獲得勝利。對于《王者榮耀》這類推塔游戲,不管過程如何,只要最終攻破敵方水晶就可以獲取勝利。這些勝利條件使得基于深度強化學習技術的游戲AI開發相對容易,在回報值設置中給予最終獎勵更高的回報值,總歸能訓練出較好的 AI 智能。然而對于策略對抗游戲,甚至實際作戰推演來說,獲勝條件更加復雜,目標更多。比如,有時可能需要考慮在我方損失最低的情況下實現作戰目標,而有時則需要不計代價地快速實現作戰目標,這些復雜多元的獲勝條件設置將使得強化學習的回報值設置不能是簡單地根據專家經驗進行賦值,而需要根據真實演習數據構建獎賞函數,通過逆強化學習技術滿足復雜多變的作戰場景中不同階段、不同目標的作戰要求。
博弈對抗過程中最核心的環節是設置回報值,合理有效的回報值可以保證高效地訓練出高水平AI。對于《星際爭霸》《王者榮耀》等游戲,可以按照固定的條件設置明確的回報值,例如將取得最終勝利設置為固定的回報值。但是一局游戲的時間有時較長,在整局對抗過程中,如果只有最終的回報值將導致訓練非常低效。這就是作戰推演中遇到的一個難題,即回報值稀疏問題。為了解決這個難題,現有的解決方案都是在對抗過程中設置許多細節條件,如獲得回報值或損失回報值的具體行為。比如在“廟算·智勝”平臺中的博弈對抗,可以設置坦克擊毀對手、占領奪控點即可獲得回報值,如果被打擊、失去奪控點等則會損失回報值,甚至為了加快收斂防止算子長期不能達到有效地點,會在每步(step)都損失微小的回報值。《覺悟AI》也同樣設置了詳細的獎賞表[36],從資源、KDA(殺人率(kill,K),死亡率(death,D),支援率(assista, A))、打擊、推進、輸贏 5 個維度設置了非常詳細的具體動作回報值。這樣就可以有效解決回報值稀疏的問題。但是,對于復雜的作戰推演來說,設計回報函數可能還需要更多的細節。因為作戰情況將更加復雜多樣,需要利用逆強化學習[41-42],通過以往的作戰數據反向構建獎賞函數。
戰爭迷霧主要是指在博弈對抗過程中存在信息的不完全情況,我方并不了解未探索的區域實際的態勢信息。圍棋、國際象棋這類博弈對抗游戲中不存在這類問題。但是在《星際爭霸》《Dota 2》《王者榮耀》以及《CMANO》等RTS游戲中設計了這一機制。實際的作戰推演過程中同樣也存在此類問題,但是情況更加復雜。在實際作戰推演中,可以考慮利用不完全信息博弈解決這個問題,已有學者利用不完全信息博弈解決了德州撲克中的不完全信息問題[29],但是在實際作戰推演中這一問題還需要進一步探討研究。
這里需要對智能博弈中的觀察信息與游戲狀態空間進行區分,觀察信息主要是指博弈的 agent在當前態勢下可以獲取的態勢信息,是部分狀態信息。由于在智能博弈對抗過程中會產生戰爭迷霧問題,因此需要在處理博弈信息時設置 agent 可以獲取到的信息。《星際爭霸》中觀察信息主要有兩層意思,一個層面是屏幕限制的區域更易于獲取態勢信息,因為玩家更直觀的注意力在屏幕局域,部分注意力在小地圖局域。為了更加符合實際, AlphaStar也按照這種限制對《星際爭霸》中的注意力區域進行限制,從而更好地防止 AI 產生作弊行為。而這也是部分《星際爭霸》AI被人詬病的原因,即沒有限制機器的關注區域。另一個層面是對《星際爭霸》中作戰單元可觀察區域內的態勢信息進行獲取,對于不能獲取的態勢信息則只能評估預測,而這一部分則涉及對手建模部分,主要利用部分可觀察馬爾可夫決策過程(partially observable Markov decision process,POMDP)[43],這一技術明顯難于完全信息博弈。而對于圍棋游戲來說,其中的態勢信息是完全可獲取的,屬于完全信息博弈,態勢信息即觀察信息。并且圍棋游戲屬于回合制,相對于即時策略游戲,其有更加充分的獲取態勢信息的時間。因此,則可以利用蒙特卡洛樹搜索(Monte Carlo tree search,MCTS)算法對所獲取的圍棋游戲中的觀察信息進行詳細分析,計算出所有可能的結果,進而得出最佳的方案策略。《Dota 2》中的觀察信息是指所控制的某個“英雄”所獲取的態勢信息,其主要也是對主屏幕的態勢信息和小地圖的態勢信息進行結合處理。《王者榮耀》也與此類似,其主要以小地圖的宏觀信息進行訓練,然后以此為基礎為戰略方案提供支持,如游戲中的“英雄”是去野區發育還是去中路對抗。同時,對主屏幕態勢信息進行特征提取,結合強化學習訓練,可以得出戰術層面的方案和建議,是去選擇回塔防御還是進草叢躲避,或者推塔進攻。墨子兵棋推演系統和《CMANO》則更加接近真實作戰推演,在作戰信息獲取各個方面都高度模擬了作戰推演的場景,需要獲取具體的對空雷達、對地雷達、導彈探測、艦艇雷達等信息后才能判斷態勢信息,這部分可觀察信息非常復雜,需要結合各種情況才能發現部分目標,對于戰爭迷霧更加真實。因此,作戰推演觀察信息完全可以借鑒POMDP進行可觀察信息建模,但還需要設置各種更加符合真實裝備的作戰情況,需要在環境中提前設置有針對性的條件。
在博弈對抗過程中對手 AI 的建模也是至關重要的,不同水平的AI會導致博弈對抗的勝率不同,并且直接影響推演對抗的價值[39,40,41,42,43,44,45]。如果對手 AI水平過低,就不能逼真地模擬假設對手,博弈過程和推演結果也價值不高。在 DeepMind 開發的AlphaGo和AlphaStar中,AI性能已經可以擊敗職業選手,通過訓練后產生的決策方案已經可以給職業選手新的戰術啟發。國內《墨子?未來指揮官系統》也與國內高校合作,研發的基于深度強化學習的智能 AI 已經可以擊敗全國兵棋大賽十強選手。而在中國科學院自動化研究所開發的“廟算?智勝”上,積分排名前三名的均是AI選手,勝率均在80%以上[11]。但是,現有對手建模主要還是聚焦在一對一的對手建模,很少學者研究多方博弈,而這在實際作戰推演中更加需要。在實際作戰對抗博弈過程中普遍會考慮多方博弈,如在《墨子?未來指揮官系統》的海峽大潮想定中,紅方不僅面對藍方,還有綠方,藍方和綠方屬于聯盟關系。這就需要在對手建模中充分考慮這種復雜的博弈關系。
博弈對抗的環境因素也是影響智能決策的重要因素之一。在圍棋、國際象棋這些棋類游戲中,想定是永久固定不變的,而且也完全沒有環境的影響,因此AlphaGo這類智能AI完全沒有考慮環境的因素。在《覺悟 AI》《Dota 2》這類游戲中就需要考慮不同“英雄”在同一個場景中會產生不同的影響。不同的“英雄”陣容搭配也會對推演結果產生不同的影響,《覺悟AI》嘗試利用強化學習技術,結合歷史數據解決這一問題。這對于作戰推演的武器裝備搭配也具有啟發價值。但是在實時策略游戲中要考慮更加復雜的環境因素及其影響,不僅作戰單元會產生變化,并且在不同的作戰推演中,不同的環境之中也會有不同的地形、地貌,這些因素會對作戰推演的過程產生非常重要的影響。《CMANO》《墨子·未來指揮官系統》《戰爭游戲:紅龍》中都需要考慮地形因素。例如《CMANO》中登陸作戰需要考慮水雷所在區域、登陸艦艇吃水深度,否則會產生擱淺,不能在理想區域登陸會對作戰目標產生較大負面影響。因此,對于實際作戰推演來說,最大的挑戰是防止訓練的深度強化學習AI 對某個想定產生過擬合。作戰場景是千變萬化的,傳統的基于規則的AI就很難適應變化的想定,早期的《先知?兵圣》比賽中就比較突出地顯示了這一問題。強化學習也容易訓練出某個過擬合的模型,導致只在某個想定會有較好的AI智能性,假如更換作戰想定就需要重新訓練很長時間。為了解決這一問題,現有思路是利用遷移學習、先驗知識和強化學習的思路來增強算法的適應性,并可以加速回報函數收斂,保證快速訓練出高水平的AI模型。
本節針對智能作戰推演所需要的關鍵屬性,結合當前游戲AI、智能兵棋等相關博弈平臺,利用相關文獻[6,8,24-25,29-30,37-39,43,46-49]進行分析,經過對比不難發現游戲 AI 過渡到智能兵棋,甚至是智能作戰推演的難度,各個關鍵屬性也是未來需要研究突破的關鍵點,具體見表1。
2 作戰推演的智能決策核心技術思路
2.1 強化學習技術框架 強化學習的核心思想是不斷地在環境中探索試錯,并通過得到的回報值來判定當前動作的好壞,從而訓練出高水平的智能AI[50]。馬爾可夫決策過程(Markov decision process,MDP)是強化學習的基礎模型,環境通過狀態與動作建模,描述agent與環境的交互過程。一般地,MDP可表示為四元組<S,A,R,T >[44]:
agent從環境中感知當前狀態st,從動作空間A中選擇能夠獲取的動作at;執行at后,環境給agent相應的獎賞信號反饋 rt+1,環境以一定概率轉移到新的狀態st+1,等待agent做出下一步決策。在與環境的交互過程中,agent有兩處不確定性,一處是在狀態 s 處選擇什么樣的動作,用策略π(a|s)表示agent的某個策略;另一處則是環境本身產生的狀態轉移概率Pass′,強化學習的目標是找到一個最優策略π*,使得它在任意狀態s和任意時間步驟t都能夠獲得最大的長期累計獎賞,即:
2.2.1 基于值函數的強化學習
強化學習早期利用Q-learning算法來建立游戲AI,通過預先設計每步動作可以獲得的回報值來采取動作。Q-learning 最大的局限是需要提前設計好所有執行動作的回報值,它用一張Q表來保存所有的Q值,當動作空間巨大時,該算法難以適應。因此,Q-learning 算法只能在比較簡單的環境中建模使用,如在簡單的迷宮問題中,讓 agent 通過Q-learning算法自動尋找出口。
DeepMind在2015年第一次利用DQN(deep Q network)算法在Atari游戲環境中實現了高水平的智能AI,該AI綜合評定達到了人類專業玩家的水平[24]。這也使得DQN算法成為強化學習的經典算法。DQN算法通過神經網絡擬合Q值,通過訓練不斷調整神經網絡中的權重,獲得精準的預測 Q值,并通過最大的Q值進行動作選擇。DQN算法有效地解決了Q-learning算法中存儲的Q值有限的問題,可以解決大量的離散動作估值問題,并且DQN算法主要使用經驗回放機制(experience replay),即將每次和環境交互得到的獎勵與狀態更新情況都保存起來,用于后面的Q值更新,從而明顯增強了算法的適應性。DQN由于對價值函數做了近似表示,因此強化學習算法有了解決大規模強化學習問題的能力。但是 DQN 算法主要被應用于離散的動作空間,且DQN算法的訓練不一定能保證Q值網絡收斂,這就會導致在狀態比較復雜的情況下,訓練出的模型效果很差。在 DQN 算法的基礎上,衍生出了一系列新的改進 DQN 算法,如 DDQN (double DQN )算法[51]、優先級經驗回放 DQN (prioritized experience replay DQN)算法[52]、競爭構架Q網絡(dueling DQN)算法[53]等。這些算法主要是在改進Q網絡過擬合、改進經驗回放中的采樣機制、改進目標Q值計算等方面提升傳統DQN算法網絡的性能。總體來說,DQN系列強化學習算法都屬于基于值函數的強化學習算法類型。基于值函數的強化學習算法主要存在 3點不足:對連續動作的處理能力不足、對受限狀態下的問題處理能力不足、無法解決隨機策略問題。由于這些原因,基于值函數的強化學習方法不能適用所有的場景,因此需要新的方法解決上述問題,例如基于策略的強化學習方法。
2.2.2 基于策略的強化學習
在基于值函數的強化學習方法中,主要是對價值函數進行了近似表示,引入了一個動作價值函數q,這個函數由參數w描述,以狀態s與動作a為輸入,計算后得到近似的動作價值,即式(4):
在基于策略的強化學習方法中,主要采用類似的思路,只不過主要對策略進行近似表示。此時,策略可以被描述為一個包含參數θ的函數,θ主要為神經網絡中的權重,即式(5):
在基于策略的強化學習方法中,比較經典的就是理查德·薩頓(Richard S.Sutton)在2000年提出的 AC(actor-critic)框架強化學習算法。AC 包括兩部分:演員(actor)和評價者(critic)。其中actor使用策略函數負責生成動作(action),通過動作與環境進行交互。而critic使用第2.2.1節提到的價值函數來評估actor的表現,并指導actor下一階段的動作。總體來說,critic 通過 Q 網絡計算狀態的最優價值Vt,而actor利用Vt迭代更新策略函數的參數,進而選擇動作,并得到反饋和新的狀態, critic 使用反饋和新的狀態更新 Q 網絡參數 w,在后面critic會使用新的網絡參數w幫助actor計算狀態的最優價值Vt。
2016 年 DeepMind 在國際機器學習大會(International Conference on Machine Learning)提出了A3C算法[54]。之前的DQN算法為了方便收斂使用了經驗回放的技巧;AC 也可以使用經驗回放的技巧。A3C更進一步,還克服了一些經驗回放的問題,主要采取隨機性策略[55]。這里確定性策略和隨機性策略是相對而言的,對于某一些動作集合來說,它可能是連續值,或者非常高維的離散值,這導致動作的空間維度極大。如果使用隨機性策略,即像DQN算法一樣研究它所有的可能動作的概率,并計算各個可能動作的價值,那需要的樣本量是非常大的。于是DeepMind就想出使用確定性策略來簡化這個問題[56]。作為深度確定性策略梯度(deep deterministic policy gradient)、critic目標網絡和深度雙Q網絡(double DQN )的當前Q網絡,目標Q網絡的功能定位基本類似,但是DDPG有自己的actor策略網絡,因此不需要貪婪法這樣的選擇方法,這部分DDQN的功能到了DDPG可以在actor當前網絡完成。而對經驗回放池中采樣的下一狀態s'使用貪婪法選擇動作a',這部分工作的作用是估計目標 Q 值,因此可以放到 actor 目標網絡完成。
此外,actor當前網絡也會基于critic目標網絡計算出的目標Q值進行網絡參數的更新,并定期將網絡參數復制到 actor 目標網絡。DDPG 參考了DDQN的算法思想,通過雙網絡和經驗回放,以及一些其他的優化,比較好地解決了AC難收斂的問題。因此在實際產品中尤其是與自動化相關的產品中使用得比較多,是一個比較成熟的AC算法。2017年, Open AI在神經信息處理系統大會(Conference and Workshop on Neural Information Processing Systems)上又提出了改進的多 agent 深度確定性策略梯度(multi-agent deep deterministic policy gradient)算法[57],把強化學習算法進一步推廣應用到多agent環境。在AC框架下,比較經典的算法還有近端策略優化(proximal policy optimization)算法[58]、柔性演員-評論家(soft actor-critic)算法[59]、雙延遲深度確定性策略梯度(twin delayed deep deterministic policy gradient)算法[60]等,這些算法也都是在樣本提取效率、探索能力增強方面進一步改進優化AC框架的。
在現有策略對抗游戲中利用深度學習技術結合強化學習來實現游戲AI已成為主流研究方向[52]。其主要思路為在游戲對抗過程中利用圖像特征的卷積提取技術。如在《覺悟AI》中,圖像特征的提取采取了分層的思想,在主視野和小地圖中,對不同種類的要素進行提取并合并到一個層中,最終每層都提取到一類關鍵屬性節點信息,形成“英雄”“野怪”“小兵”位置矩陣[6]。最終將多尺度特征的信息融合形成全局態勢特征信息,這一工作同樣應用在AlphaStar中。對于作戰推演來說,態勢理解一直是研究的難點,那么考慮利用深度學習技術來實現態勢圖像特征的提取,進而最終輸出態勢圖的關鍵信息將是解決方案之一。此外,筆者所在團隊也嘗試利用深度學習技術對態勢信息進行卷積提取,然后將提取信息與語義模型結合,生成當前態勢的直觀文本語義。而在前端利用強化學習進行實體單元控制,這樣就可以將強化學習、深度學習、自然語言處理融合,在推演過程中實時生成方便人類理解的智能決策文本語義信息,這一工作對于實現推演系統中的人機融合具有積極意義。
智能博弈對抗的建模過程面臨兩個難題,一個是動作空間龐大,另一個是獎勵稀疏問題。面對這兩個問題,有研究人員提出了分層強化學習的解決思路。該思路的核心是對動作進行分層,將低層級(low-level)動作組成高層級(high-level)動作,這樣搜索空間就會被減小[52]。同時基于分層的思想,在一個預訓練的環境中學習有用的技能,這些技能是通用的,與要解決的對抗任務的關系不太緊密。學習一個高層的控制策略能夠使 agent 根據狀態調用技能,并且該方法能夠很好地解決探索效率較低的問題,該方法已在一系列稀疏獎勵的任務中表現出色[61-62]。《覺悟 AI》同樣設計了分層強化學習的動作標簽來控制“英雄”的微觀操作。具體來說,每個標簽由兩個層級(或子標簽)組成,它們表示一級和二級操作。第一個動作,即一級動作,表示要采取的動作,包括移動、普通攻擊、一技能、二技能、三技能、回血、回城等。第二個是二級動作,它告訴玩家如何根據動作類型具體地執行動作。例如,如果第一個層級是移動動作,那么第二個層級就是選擇一個二維坐標來選擇移動的方向;當第一個層級為普通攻擊時,第二個層級將成為選擇攻擊目標;如果第一個層級是一技能(或二技能、三技能),那么第二個層級將針對不同技能選擇釋放技能的類型、目標和區域。這對于作戰推演中不同算子如何執行動作也具有參考價值,每一個類型的算子同樣存在不同的動作,例如坦克可以選擇直瞄射擊、間瞄射擊、移動方向等,實際作戰推演不同裝備同樣具有眾多復雜的動作,通過這樣的特征和標簽設計,可以將人工智能建模任務作為一個層次化的多類分類問題來完成。具體來說,一個深層次的神經網絡模型被訓練以預測在給定的情境下要采取的行動。作戰推演也可以參考層次化的動作標簽來不斷細化動作執行過程,進而訓練解決復雜的動作執行難題。在作戰推演中完全可以借鑒這種思路設計適用于作戰場景的分層強化學習框架。南京大學的研究人員利用分層強化學習建立宏觀策略模型和微觀策略模型,根據具體的態勢評估宏觀策略模型,然后利用宏函數批量綁定選擇微觀動作,這樣可以在不同的局勢下選擇對應的一系列動作,進而實現了分層強化學習在《星際爭霸》環境中的應用[63]。分層強化學習比較通用的框架是兩層,頂層策略被稱為元控制器(meta-controller),負責生成總體宏觀目標,底層策略被稱為控制器(controller),負責完成給定的子目標,這種機制本質也對應作戰推演中的戰略、戰役、戰術3個層次,不同層次關注的作戰目標各有不同,但又互相關聯。其他相關改進是學者在獎賞函數設置、增加分層結構、保持分層同步、提高采樣效率等方面改進分層強化學習[64]。
在游戲博弈對抗過程中必然需要考慮多 agent建模,而在作戰推演中利用多 agent 技術實現不同作戰單元的協同合作也是博弈智能研究的重點之一。在這方面OpenAI和AlphaStar在多agent深度強化學習方面使用了不同的技術思路。OpenAI 使用的是分布異構的多agent建模思路,每一個agent都有一個相同的訓練神經網絡,但是沒有全局控制網絡[37,47]。AlphaStar則是使用了一個集中的控制網絡對不同的單元進行控制。還有一種思路是對于每一個agent,都建立屬于各自的神經網絡進行訓練。第三種思路是最理想的,但是訓練過程復雜,也難以適用于大規模的推演過程[43]。對于實際作戰推演來說,除了要考慮多 agent 建模方法,還需要讓每個 agent 具有柔性加入的能力,在對抗過程中可以按照需要隨時加入所需要的作戰單元,而不需要每次加入作戰單元后,再重新訓練一遍網絡。基于此考慮,讓每一個 agent 具有自己獨立的神經網絡將是更好的選擇。
《覺悟 AI》在設計過程中利用深度學習不斷提取游戲界面的態勢信息。利用深度學習雖然可以把一個對抗界面的所有特征提取出來,但是提取的是靜態的某一幀的界面信息,并沒有把時間步之間的信息關聯起來。時間步一般指一幀,也可以指多幀,其關鍵是將歷史的幀信息和現在的信息關聯起來。基于此,需要引入長短期記憶(long short-term memory,LSTM)網絡。讓 LSTM 一次接收多個時間步信息來學習這些時間步之間的關聯信息,從而讓 LSTM 幫助“英雄”學習技能組合,并選擇“英雄”應該關注的主視野和小地圖的具體方面,進而綜合輸出合理的動作,也通過 LSTM 關聯歷史數據來訓練強化學習的神經網絡模型[65]。在實際作戰推演過程中同樣需要考慮這種情況,防止出現訓練的AI為了某個戰術目標而忽視了整體戰略目標。
強化學習的回報值往往根據專家經驗手工設置,但是這種手工設置的回報值的收斂性及智能性均難以保證,并且長時間訓練才能評估設置的回報值的效果。因此可以考慮結合推演數據,結合多屬性決策方法進行客觀分析,總結提煉出合適的回報值。首先,從推演環境中獲取各關鍵屬性數據,如在陸戰對抗環境提取作戰單元位置、高程、類型、射程屬性、打擊屬性、裝甲屬性等。以這些屬性數據為基礎,計算出對應的評估指標,如目標距離威脅、目標攻擊威脅、目標速度威脅等,通過熵權法計算相應權重,并最終結合多屬性方法對敵方威脅度進行排序,將其和強化學習的回報值函數進行關聯,進而設置出更加客觀合理的回報值函數,這樣有利于提高強化學習訓練的智能性,并有利于加快收斂。
在對強化學習的訓練過程中,研究人員總是會遇到訓練過程時間長、難以收斂的問題,這種情況通常被稱為冷啟動問題。針對這個問題,現有研究人員提出了多種解決方案,比較有效的解決方案是利用專家的領域知識預先設計固定的先驗知識,利用先驗知識進行智能博弈訓練,進而在強化學習的經驗存儲中得到高水平的訓練數據。在強化學習的后期訓練中直接利用這些先驗知識對抗出來的經驗數據進行模型訓練,從而可以有效縮小探索空間和動作空間,進而保證強化學習可以快速訓練出高水平的AI,避免了前期盲目探索的情況。在實際作戰推演過程中,也可以考慮使用高水平指揮員的先驗知識,提前進行形式化存儲,進而在強化學習訓練過程中導入先驗知識,加快訓練結果的收斂,得到較高水平的智能AI。
在智能博弈對抗過程中經常會出現訓練一定階段后陷入局部最優結果的情況。表現為在智能兵棋比賽中,經過長時間訓練后,強化學習訓練出的結果是控制算子進行固定的線路和射擊套路,這種情況可被稱為過擬合現象。為了避免這種情況的出現,應該在算法設計中加入隨機可能性,在一定比例的動作選擇概率下隨機探索,而不是完全按照強化學習算法給出的結果進行執行。其次,按照貝爾曼方程,應該在獎勵函數設計過程中,考慮當前影響和未來影響的可變比重,即回報函數設計包括一定的可變性,而不是固定不變的。當然也可以利用強大的計算力,生成大量新的對手,從不同方面與需要訓練的 agent 進行對抗,從而避免因為固定對手而導致的過擬合現象。
智能博弈的 AI 建模普遍存在適應性不高的問題,有部分研究人員開發的 AI 是針對某個固定想定開發的,導致更換博弈想定后AI性能大幅下降。考慮到大部分數據或任務是存在相關性的,通過遷移學習可以將已經學到的模型參數通過某種方式分享給新模型,從而加快優化模型效率。中國科學院自動化研究所的研究人員引入了課程遷移學習,將強化學習模型擴展到各種不同博弈場景,并且提升了采樣效率[81]。DeepMind 在 AlphaZero 中使用同樣的算法設置、網絡架構和超參數,得到了一種適用于圍棋、國際象棋和將棋的通用算法,并戰勝了基于其他技術的棋類游戲AI[82]。《覺悟AI》引入了課程學習方法,將訓練至符合要求的參數遷移至同一個神經網絡再次訓練、迭代、修正以提高效率,使《覺悟AI》模型能熟練掌握40多個“英雄”[6,36]。在作戰推演中,更需要這種適用性強的通用 AI 算法,不需要在更換作戰想定后重新訓練模型,也只有這樣才可以更加適應實時性要求極高的作戰場景。
對手建模指在兩個 agent 博弈的環境中,為了獲得更高的收益,需要對對手的策略進行建模,利用模型(隱式)推斷其所采取的策略來輔助決策。智能藍方建模主要是在具有戰爭迷霧的情況下,對對手進行建模,并預測對手的未來動作。其前提通常是博弈環境存在戰爭迷霧,我方在無法獲取準確的對手信息的情況下,針對對方進行預測評估。在對抗過程中,一種假設是對手是完全理性的,對對手(隊友)進行建模是為了尋找博弈中的納什均衡策略。為了解決這一難點問題,阿爾伯塔大學的研究人員提出了反事實遺憾最小化(counterfactual regret minimization,CFR)技術,該技術不再需要一次性推理一棵完整的博弈樹,而是允許從博弈的當前狀態使用啟發式搜索。另外,對手建模可分為隱式建模和顯式建模。通常隱式建模直接將對手信息作為自身博弈模型的一部分來處理對手信息缺失的問題,通過最大化agent期望回報的方式將對手的決策行為隱式引進自身模型,構成隱式建模方法。顯式建模則直接根據觀測到的對手歷史行為數據進行推理優化,通過模型擬合對手行為策略,掌握對手意圖,降低對手信息缺失帶來的影響[83]。總體來說,對手建模技術是智能博弈對抗是否有效的關鍵,只有建立一個可以高效預估對手行為的模型,才能保證智能博弈AI的有效性。
路徑規劃作為智能博弈中的重要組成部分,其主要任務是根據不同的想定,針對每個單元在起始點和終止點之間快速規劃一條由多個路徑點依次連接而成的最優路徑[84]。在智能博弈的背景下,最優路徑的含義不僅僅是兩點之間的距離最短,而是綜合考慮博弈態勢、資源情況和綜合威脅后的最佳路徑。但是,已有的路徑規劃算法主要以A-Star算法、Dijkstra算法、D算法、LPA算法、D* lite算法等為典型代表,在物流運輸、無人駕駛、航空航天等領域都取得了顯著成效。同時也有學者提出其他的路徑規劃算法,如基于神經網絡和人工勢場的協同博弈路徑規劃方法[85]等,但是在智能博弈的環境下,需要考慮的問題更加復雜,需要進一步對這些算法進行改進優化。
現有的游戲平臺中也有比較成熟的AI開發通用框架(如 pysc2[86-87]),但是相比成熟的作戰推演通用框架還有較大差距。智能作戰推演系統可以設計一個適用于復雜環境的通用框架,該框架包括作戰推演算子、地圖、規則、想定。同時最關鍵的是設計通用的算法接口,這些接口可以方便智能博弈算法的設計與實現,如環境加載接口、環境重置接口、環境渲染接口、動作隨機選擇接口、執行動作接口等。同時,也可以提前設計智能作戰推演的基本功能框架,包括地圖編輯模塊、想定編輯模塊、算子管理模塊、規則編輯模塊、推演設置模塊、數據分析模塊、系統配置模塊。其中最核心的是推演設置模塊可以自由選擇每局推演使用的智能算法,從而實現智能算法設計和作戰推演環境開發的解耦,這樣才可以保證智能作戰推演的靈活適應性。通用框架中另一個重要的因素是可以提供AI使用的工具,例如對于深度學習的分層態勢顯示,可以直觀地提供一個通用接口進行展現,方便指揮人員快速調用該接口實現智能算法的輔助決策功能。
智能作戰推演必然面對的問題是選擇在戰略、戰役還是戰術場景下應用。現階段主要還是在戰術層面進行智能算法的研究,包括國內的某智能兵棋推演大賽,各種想定只有算子數量種類的差別,但本質上都還屬于戰術智能決策。《墨子?未來指揮官系統》中的對抗想定更接近于戰役層面的智能決策方案,現階段對戰略層面的智能決策的研究還比較少。其原因就在于面臨的想定越宏觀,智能決策的技術挑戰越大,包括動作空間、狀態空間的變化以及現階段 agent 之間的協同交互還并沒有很成熟。因此,當前考慮戰術層面的智能決策更容易。如果要解決戰略層面的智能決策,必然需要研究各agent之間的協同機制,還要考慮作戰的后勤支持機制。然而當前尚未有游戲、作戰推演在智能推演中考慮后勤機制的影響。另外,戰術、戰役、戰略層面的方案制定技術思路也并不相同,有的研究以各agent獨自訓練、交互,進而涌現出智能決策方案。這一技術思路更加逼近真實場景,但是算力要求和技術實現難度都較高。另一思路是建立統一的宏觀agent 模型,利用宏觀 agent 控制所有算子進行推演,這一技術思路實現比較簡單,所需的算力也較低,可以考慮將其作為初期實現的路徑之一。
智能作戰推演的未來趨勢主要分為人不在環和人在環兩種類型。人不在環主要類似于AlphaStar、OpenAI 的游戲智能,通過預先訓練完成agent,完全由訓練好的agent自主進行博弈對抗,左右互搏,實現方案的預演和推測。人在環的模式又分為兩種,一種是實現人機對抗,國內已有這方面的比賽,通過開發訓練好的智能算法 agent 與高水平指揮人員進行對抗,探測發現自身指揮問題并不斷提高,可用于指揮人員訓練場景。另一種人在環更加困難,即 agent 可以響應人的指令,并完成低層次的規劃任務。主要還是由指揮人員進行整體戰略宏觀判斷,并通過指令交互部署 agent 完成低層次任務,最后總體實現戰略目標。同時,也需要對人機融合模式的框架進行探索,如將人類領域知識引入智能算法中,幫助智能算法更高效地實現智能作戰推演。
隨著智能博弈的興起,國內外高校、研究所、企業都已逐漸開發完成各種類型的智能博弈平臺。但是不同平臺之間并不互通,相互獨立,形成了各個平臺的信息孤島,在智能算法開發的過程中,面對新的平臺就需要研究人員重新學習適應新的平臺接口和架構,這浪費了研究人員大部分精力。另外,智能博弈的強化學習接口以及其他算法雖然在不同平臺體現不同,但本質都一樣,很有必要構建一個通用一體化智能博弈平臺框架,減少不斷重新開發、學習的過程,提高智能博弈平臺的研究效率也勢在必行。
本文構建并梳理了智能作戰推演的國內外發展概況,詳細介紹了智能作戰推演所需要的各項技術難點及國內外進展,同時借鑒游戲 AI 領域的發展現狀并將其與智能作戰推演所需要的技術需求進行對比,分析現有技術還需要改進和優化的方向,也對智能作戰推演的各個研究方向進行了歸納。可以為從事游戲AI、智能兵棋、智能作戰推演等智能博弈領域的研究人員提供一定的思路。當前智能博弈的研究思路還主要以深度強化學習為基礎,但絕不僅僅是深度強化學習技術,各種傳統的智能算法和新的機器學習算法都可以作為智能博弈領域補充完善的技術力量。本文以作戰推演技術需求為牽引,結合國內外游戲AI、兵棋推演相關實際發展情況,總結出雖然智能博弈依然還有很多難題需要解決,現有技術實現程度相比于實際應用還有較大差距,但智能博弈這一研究方向是未來智能決策研究發展的必由之路,相信最終會在各個相關領域得以實現。
參考文獻
[1] 沈宇, 韓金朋, 李靈犀, 等. 游戲智能中的 AI: 從多角色博弈到平 行博弈[J]. 智能科學與技術學報, 2020, 2(3): 205-213. [2] 胡曉峰, 賀筱媛, 陶九陽. AlphaGo 的突破與兵棋推演的挑戰[J]. 科技導報, 2017, 35(21): 49-60. [3] 葉利民, 龔立, 劉忠. 兵棋推演系統設計與建模研究[J]. 計算機與 數字工程, 2011, 39(12): 58-61. [4] 譚鑫. 基于規則的計算機兵棋系統技術研究[D]. 長沙: 國防科學 技術大學, 2010.
空軍將在一個多極世界中作戰,其特點是持續的、低于閾值的交戰,其中多層和多速的戰斗空間延伸到很遠距離。空軍將需要變得高度適應,并能夠通過在高速作戰環境中實時超越威脅,快速從協調過渡到同步,不僅在移動資產和人員方面具有敏捷性,而且在至關重要的信息方面也具有敏捷性。新作戰優勢的釋放將取決于空軍加強部隊之間的連通性和整合的能力,以便信息共享能夠比以往更快、更廣泛地進行。
空軍已經嚴重依賴跨五個作戰域的作戰能力——但這些域都將變得非常混亂和具有競爭性。空軍將需要改變他們使用的網絡、系統和流程,以及他們廣泛和基本的工作方式,以便能夠在現代戰場的長度、寬度和高度上思考、戰斗和取勝。多域作戰 (MDO) 為空軍引入新的作戰指揮、控制和作戰管理 (C2BM) 提供了先導,這有望以多種方式從根本上提高在跨多域戰斗空間同步部隊要素和協調效果方面的聯合效率,這在以前不可能實現。
本報告通過將關鍵的作戰范式、挑戰和戰略轉型的推動因素相互關聯,以向新的作戰方式演進,綜合了空軍向多域作戰 (MDO) 過渡的最新觀點。
隨著國家競爭再次成為常態,全球競爭正處于新的十字路口。未來的戰略環境將引發新形式的競爭,將包括恐怖組織、叛亂分子、雇傭軍和網絡犯罪分子等非國家行為者在內的敵人聯系起來。對手將在物理和虛擬領域從事合法和非法活動,一方面模糊了和平與戰爭之間的區別,另一方面模糊了本土和遠距離之間的區別。傳統的防御方法將受到可能不承認國界或不遵守國際規范和做法威脅的根本挑戰。
因此,空軍將在一個多極世界中作戰,其特點是持續的低閾值交戰,戰場空間延伸到很遠距離。空軍作為一個在行動中持續活躍的軍種——進行訓練和演習、保障任務或在運輸途中——以保持全天候的任務準備狀態,未來面臨的挑戰尤其明顯。引入多層次和多速度的戰場從根本上破壞了經濟和戰爭的性質,因此空軍將需要加速變革并建立新戰爭方式的能力,使他們能夠在高度復雜和緊張的競爭連續體中贏得未來沖突場景的全部內容,否則就有成為多余的風險。
面對在密集的反介入/區域拒止 (A2AD) 環境中使用先進網絡和武器系統能力的對手,競爭連續體將變得競爭激烈、混亂且受限。隨著空中作戰中心 (AOC)、指揮與控制 (C2) 節點和傳統機載平臺遠離戰斗,空軍執行的全方位保障和戰斗任務將變得更加復雜。因此,空軍將需要新的方法來提高生存能力,并在密集威脅環境中以相關的速度提供效果。空軍將需要變得具有高度適應性,并能夠迅速從協調過渡到同步,以在高速作戰環境中實時超越威脅,不僅在移動資產和人員方面具有敏捷性,而且在至關重要的信息方面也具有敏捷性。
當代威脅發展太快,通過電子手段的連接來應對威脅至關重要,因為無法再在聯絡層面有效協調行動。例如,考慮聯合空中作戰中心 (COAC) 和防空作戰中心(ADOC)并不總是明確定義為總部,可以將作戰 C2 要素在防御性防空和區域防空方面分開。常規和新出現的空中和導彈以不同的方式威脅,因此防御它們通常屬于不同的指揮機構。由于一個威脅概況對于地面指揮官來說可能太大,而對于空戰指揮官來說又太小,因此需要一個無縫集成的多層全域作戰架構來生成共享態勢感知 (SA) 并確保將正確的射手分配給在正確權限下的相應傳入威脅目標。
未來沖突的結果將有利于那些在競爭中獲得信息優勢的空軍,在競爭中各作戰領域被融合在一起,而不是基于優越的武器系統和獨立的能力。新的作戰優勢的釋放將取決于空軍是否有能力加強部隊成員之間的連接和整合,從而使信息共享比以往更快、更廣泛地發生。在這樣做的過程中,為了實現更有力的協調,指揮關系和結構將需要進行調整,甚至為新的戰爭方式重新定義。多域作戰(MDO)為空軍提供了未來新的作戰指揮、控制和戰斗管理(C2BM)的先導,它有望從根本上提高部隊成員的同步性和協調多域作戰空間的效果,這是以前不可能的。
多域作戰(MDO)的概念與聯合和集合作戰的概念不同,因為它提出了在各作戰領域執行基于效果的、同步的和戰術整合的任務,從而使空軍能夠在現代戰斗空間的長度、寬度和高度上思考、戰斗和獲勝。在過渡到MDO的過程中,空軍將需要對他們使用的網絡、系統和流程以及他們的工作方式進行廣泛和根本性的轉變。為了以相關速度運作,各級指揮官將需要獲得通過聯合共同作戰圖景(COP)提供的強大的、不斷更新的SA,以便比對手更好地了解作戰環境。此外,從機密和公開來源的數據和情報流中收集、存儲、分析、融合、分發和可視化信息的能力,以便在盡可能低的層次上更快地做出決策,這對作戰成功至關重要。
但是,如果沒有適當地過濾和管理,同樣可以創造作戰優勢的大量信息也可能使決策過程不堪重負。除了簡單地將每個傳感器集成到網絡中并集成跟蹤數據之外 從多個來源實時共享,必須對持續流向指揮官的數據和信息流進行智能融合和共享,以便只提供與給定任務或作戰要求相關的數據和信息。在一個信息就是力量、信息可以比以往更快、更遠、但也有太多數據和信息需要處理和吸收的時代,防止指揮官和作戰人員面臨信息負擔和認知超載的危險將是至關重要的。因此,需要新的數字解決方案和工具包,利用自動化和人工智能 (AI) 來支持信息可視化,以便更好地理解和改進決策。
信息優勢對于空軍將戰略意圖轉化為及時的作戰和戰術效果,并在現代戰斗空間的流動作戰領域進行協調,將是決定性的。管理、分析、融合、可視化的工具包,以及關鍵的是,更好地理解來自多源情報流的大量信息,將在未來幾年重新定義作戰規劃和執行。空軍將需要利用新興技術來塑造現代戰爭環境的數字層面,因為新的作戰C2可以支持未來戰斗空間所要求的性能水平。
在目前的配置中,作戰C2 仍然過于人工手動,并且與隨著傳感器和射擊者被合并到一個單一的主網格網絡中而變得可用數據大量混亂、信息不兼容。
傳統的 C2 指令、結構和流程可以基于 24 小時周期的決策循環,不足以應對未來的破壞性威脅和預期的行動速度。任何水平的技術進步都不會使傳統 C2 對未來作戰的預期步伐更加有效。人工智能、自動化、增強現實和量子技術為過濾、可視化和幫助理解大量信息提供了新的可能性,而利用大數據處理的數據分析和融合引擎將為個人平臺、能力和決策者帶來新的機會從聯合甚至泛政府的角度將其整合到一個共同的數字環境中。
一個共同的數字環境和作戰云的實現將使任何地點的部隊和用戶都可以訪問相同的數據和信息流,無論是實時規劃還是執行,并且以與執行任務相同的速率。高度適應不斷變化的任務要求的數字工具包將需要在作戰云上隨時可用,并使用軍事證書按需訪問幫助各級做出更好更快的決策。指揮官和作戰人員之間共享通用數字環境的發展將使作戰指揮控制的分散化和空中作戰中心傳統職能的地理點對點分布成為可能。
分布式 AOC 可以理解為同時在不同的地方,而不是在一個或另一個地方,它代表了空軍未來作戰方式的游戲規則改變者。空中作戰中心傳統上由空軍從一個擁有重要基礎設施的固定位置操作,以允許接收大量通信和大量多專業人員。這種集中式 C2 模型在過去為空軍提供了很好的服務,但是隨著威脅形勢的演變,從執行作戰 C2 的單個固定位置的概念使得空中作戰容易受到能力越來越強的對手的攻擊,這些對手可以通過動能和非-動力學手段。在任何接收關鍵通信和提供可操作 C2 的集中位置發生自然災害、火災或停電成為潛在單點故障的情況下,同樣存在風險。
點對點分布的AOC將與位于不同地點的高級指揮部更好地保持一致,而在聯盟的情況下,則與世界不同地區保持一致。分布式AOC還將使空軍有可能與更多不同的專業人員聯系起來--在任何特定時間,在一個以上的地方經常需要這些專業人員--以解決復雜的作戰挑戰。空軍將獲得決定性的優勢,最大限度地減少非周期性工作的需要,以便在需要的地方和時間獲得信息,關鍵是要建立冗余,以提高行動的適應性。隨著AOC功能的分布,空軍將有能力迅速適應動態作戰場景中不斷變化的需求,包括C2網絡中任何關鍵節點的潛在損失,使邊緣作戰人員能夠以更加安全和靈活的方式行動。
然而,分布式空中作戰中心架構所承諾的最顯著的力量倍增效應是使空軍能夠無縫地連接到位于不同位置的伙伴要素和能力。將位于不同地點的盟軍和伙伴空中作戰中心虛擬地聚集在一起,將使空軍能夠整合可用的聯軍能力,以便在任何給定時間和地點利用最有效和最致命的空中力量組合。通過以增強力量和提供綜合威懾的方式整合聯軍能力,可以減輕空軍單獨面臨資源或人員壓力的現實和日常挑戰。因此,空軍將更少地依賴單個平臺能力,而更多地依賴于具有集成作戰 C2 的共享能力架構的力量,該架構從根本上優化了傳感器/射擊者的任務和分配。
作為指導任務和加快行動步伐的過程的一部分,通過替換會減慢行動周期(從而降低反應時間)的傳統方法,必須明確授權給每個級別的指揮部,以便確定決策的優先級可能的最低水平。因此,連接到接收數據和中繼命令的敏捷、適應性強和有保障的網絡的單個指揮官應該能夠專門指揮下屬單位的活動。對交付作戰能力的命令進行適當的優先排序仍然至關重要,但未來的挑戰將與誰指揮指揮官有關——尤其是在對多個任務有明顯壓力的情況下 政府部門將被納入 C2 決策過程。即使授權保持不變,集中控制/分布式執行和任務指揮的模式也可能受到挑戰,因此空軍必須更新正式關系和開展業務的方式。
開放式架構、系統體系(SoS) 網絡,專為高速、大容量而設計,在廣泛而分散的用戶群中進行數據交換對于在需要的時間和地點向合適的人提供相關信息至關重要。Link 16 為互連性和互操作性提供了一個通用標準,對聯軍行動仍然至關重要,但即使有一個在其用戶之間全面設計和實施的現代化計劃,其本身也不夠。更強大的作戰 C2 的基本原理推動了聯合全域指揮與控制 (JADC2) 結構和先進戰斗管理系統 (ABMS) 在美國的發展。JADC2 設想將整個部隊的傳感器、射手和支持平臺連接到主網格網絡,以便作戰指揮控制從以服務為中心的架構有效地推進到高度靈活的聯合全域架構。美國空軍打算利用 JADC2 實時融合來自無數不同來源的數據,而 ABMS 打算通過將正確的傳感器連接到正確的射手來感知、理解并允許指揮官比對手更快地采取行動。
在一個沒有任何單一平臺或武器系統本身能夠確保作戰成功的未來,JADC2和ABMS的目的是用其他系統的優勢來系統地減輕單個組件系統的局限性。沒有與ABMS或同等的作戰管理(BM)系統連接的平臺將具有較低的生存能力,并最終成為多余的。JADC2和ABMS是美國在每個戰爭場景中取得戰斗成功的基礎,它們為未來的作戰C2提供了將正確的傳感器連接到正確的射擊者的基礎。開發一個高度可擴展的、完全集成的、具有明確授權的多分類網絡架構,將是實現信息優勢的關鍵,它使指揮官和作戰人員能夠更有效和高效地執行。目前的網絡和系統需要進行現代化改造和調整,以實現更大程度的戰斗空間信息,然而,全面的網絡整合帶來了相當大的技術挑戰,因為各個系統并不總是使用一種共同的語言或順利地相互連接,特別是在涉及盟國和伙伴空軍的多國背景下。
互操作性是未來戰爭的關鍵,而協同作戰的步驟設想跨所有平臺進行信息交換,而不僅僅是戰斗人員。除了由新的具有指揮能力的戰斗機領導的傳統戰斗機之外,隨著第五代平臺的出現,互操作性將需要擴展到所有平臺,包括遙控飛行器 (RPV) 和自主系統。在強大的聯合任務指揮下,互操作性與綜合規劃和作戰指揮控制將允許加速作戰,以克服具有先進網絡能力和武器系統的對手。將遺留系統調整為單一網格、多域網絡是空軍面臨的最關鍵挑戰,必須進行戰略轉變,優先考慮全面的網絡集成和互操作性以及必要的財務資源、時間和人員。
整合帶來了復雜的挑戰,有時需要比預期更長的時間才能實現結果,正如之前在 Link 16 上采用、適應和實施變化的國家經驗所表明的那樣。空軍必須迫使行業合作伙伴更廣泛地采用數據協議和工程系統的標準化,以便能夠有效和高效地實現未來所需級別的互操作性。同時,空軍必須 打破狹隘的思維方式、過時的數據和信息共享政策以及阻礙他們作為組織利用信息真正力量的文化障礙。軍事背景下與美國前總統羅納德·里根(Ronald Reagan)的話有了新的關聯,他將信息稱為現代的氧氣,因為信息力量是未來戰場上有效作戰的基礎。
將盟軍和合作伙伴的資產、資源和專業知識進一步互連,超出單個固定地點的定位,這將成為空軍在未來沖突中保持競爭力的必要條件。三十年前,可能有二三十人,包括指揮官及其參謀參與作戰計劃、執行和 C2。今天,視頻電話會議和數字應用程序使分布在不同地點和時區的數百名員工的點對點協作和信息共享成為可能。與盟國和合作伙伴互操作性的障礙在邏輯上需要考慮并更緊密地結合在一起 - 旨在確保數字環境得到主動保護和防御的國家網絡安全方法及其警告。依賴網絡空間和在網絡空間中作戰的固有脆弱性將使信息戰在傳統作戰之外占有一席之地。同時,空間領域和量子加密技術的進步將開始通過徹底改變軍事行動中的通信方式來減輕復雜網絡空間威脅的影響。
互操作性是衡量聯盟有效性的關鍵,并將決定在未來的同行競爭環境中的戰斗成功。在沒有盟友和合作伙伴的幫助下,單獨過渡到全域作戰戰略是不可行的,但從聯盟的角度來看,要實現真正的互操作性,必須對空軍設計和規劃未來能力進行戰略反思。互操作性通常可以通過調整現有的系統而得到改善,但如果要以未來沖突所要求的方式在戰略上推進互操作性,以達到戰斗和勝利所必需的聯盟效力的程度,則需要成為一種采購考慮。
互操作性存在著重要的政策層面障礙,例如,與采購項目的過度分類和軍事系統的轉讓有關。這種對聯盟有效性的障礙在近年來的聯盟作戰活動中已變得很明顯,并促使美國引入新的方法,如國防出口特性計劃,該計劃旨在為優先考慮和追求互操作性的方式帶來范式的轉變。將互操作性考慮納入主要采購項目的初始能力文件的作戰概念(CONOPS),將確保它在未來系統的設計階段得到適當的規劃,并戰略性地納入采購過程本身,而不是作為事后的想法被編入。
美國還將更加強調與盟友和合作伙伴共同開發系統,并以系統的早期出口為目標,這一方面有助于改善整體系統設計和安全性,另一方面也能壓縮開發時間和降低成本。任何空軍都不能假設自己總是擁有最好的技術解決方案和概念,因此,當國際市場上有更優越的替代品時,進口能力將需要更高的優先權。軍事系統的本土開發提供了次要的優勢,如經濟效益的本地化和通過國內創造就業機會來培養高技能的勞動力,但也有一些權衡,如較低的性價比或系統不能與替代品提供的相同水平的性能。
在系統層面上,設備之間的互操作性是至關重要的,但是作戰平臺本身和確保它們的互連性本身并不足以實現互操作性,也不會自動轉化為改善聯盟的有效性。空軍必須通過制定共同的作戰方案和戰術、技術和程序(TTPs)來加強聯盟層面互操作性的概念基礎。空軍共同訓練、合作和培養工作關系的方式是打開未來作戰優勢的關鍵。建立信任需要時間,而作戰層面的互操作性--相對于系統層面的互操作性--是建立在多年的訓練和并肩工作上的,以了解和推進可以共同實現的目標。不可能在危機時期尋找信任,也不可能期望能夠以未來所需的行動水平和速度來運作。
空軍有必要作出新的努力,以改善與關聯部門以及盟國和伙伴空軍的同步和協調。建立一個更強大的傳感器網絡和發展收集、存儲、處理、分析、融合和分享適當安全級別的信息的能力的途徑始于雙邊討論,隨著聯合演習的推進,并隨著從持續努力和互動中獲得的經驗教訓被廣泛實施到培訓、教育和最終的積極行動本身而得以實現。歸根結底,在擴大力量和試圖實現聯盟伙伴之間的綜合威懾方面,信任的概念將比技術因素更重要。盟友和合作伙伴可以成為非常有價值的見解的來源,空軍必須變得更加開放,不斷地與同行分享威脅情況,并保持思想的持續互動,以支持持續改進。
在這個時代,信息被視為力量,但只有當它被分享時才會變得真正強大,在評估盟友和合作伙伴之間的信任時,信息共享的方式是衡量有效性的關鍵。人工智能和神經網絡將能夠實時處理和分析目前需要數周時間的大量信息,然而,空軍的思考和反應速度將取決于他們在正確的時間向正確的人提供正確和相關的分類信息的能力。考慮到信息共享的三個基本要素(需求方面的理由;使之成為可能的技術和基礎設施;以及受其支配的政策和規則),理由越來越被認為是合法的,使之成為可能的手段在大多數情況下也是現成的。然而,以父權為框架的政策和信息發布規則與文化障礙相結合,阻礙了盟友和合作伙伴之間及時有效的信息共享,甚至經常是根本沒有。
古老的信息可釋放性政策和僵化的數據所有權文化,限制了實時甚至是歷史信息流向需要的地方。盡管空軍擁有與盟友和合作伙伴更緊密合作的動力,但他們總體上仍然落后于更有效作戰所需的信息共享水平。有效的信息共享的障礙和阻礙可歸因于傳統的模式,然而過去有效的東西不一定在未來有效。并非所有的信息都需要與所有級別和所有項目的人共享,但確保正確的人能夠獲得正確的信息是可能的,一方面,重新設計適用的信息共享政策、規則和分類以消除瓶頸,另一方面,通過硬件和軟件解決方案,降低工業規模的信息共享的操作安全(OPSEC)風險。
從商業部門的成功經驗中可以學到寶貴的經驗,即如何安全地改善企業層面的連接和信息共享,關鍵是與外部合作伙伴的連接和信息共享,從而提高生產力,為股東創造更高的價值。建立新的授權、政策和信息保護程序是必要的,以便讓信息在行動領域之間以及在共享的任務伙伴網絡中的不同安全分類之間安全和無縫移動。空軍將需要促進和實施更強大的信息和數據安全,同時通過與聯合和盟國或聯盟伙伴更好地協調技術和程序來建立一個共同的數據結構。跨作戰領域的信息和數據網絡的可訪問性和安全性將成為重中之重,而信息的完整性、可信度和可靠性則是剩余的問題。
隨著數字技術和創新的加速作用和采用,空軍的運作方式正變得越來越復雜。然而,機遇也伴隨著風險,因為支持空軍的信息技術和系統本身就成為一種威脅。網絡空間對于彌合現代戰斗空間所跨越的巨大距離至關重要,因此將繼續成為軍事行動中一個永久的、日益突出的要素。然而,大量信息的快速收集、控制和傳播產生了一種新的戰爭類型,即產生了傳統軍事系統必須能夠對抗和防御的具有普遍性的持續威脅。網絡空間和電磁頻譜為信息系統、武器和平臺的運作提供了重要的地形,指揮官的首要考慮之一是需要支配流動的作戰領域,使其盡可能受到抑制和保護,以防止可能帶來區域拒絕問題的攻擊。
網絡保護和通過一切必要手段捍衛網絡空間對軍隊來說是勢在必行的,但未來更重視的是數據和信息資源本身,而不是為它們提供地形的網絡。密碼學的現代化對于實現有保障的安全通信至關重要,但對部隊進行數據保護和信息安全教育是空軍需要解決的一個挑戰。軍隊需要重新培訓組織心態,并制定源自零信任文化的標準操作程序(SOP),以便作戰人員嚴重依賴的信息在所有層面上不斷得到認證和驗證。更廣泛地說,軍隊在網絡空間的主要重點仍將是通過網絡安全軟件和計算機網絡操作來保護C2的物理和電子。
盡管在網絡空間建立交戰規則(RoE)的挑戰仍然存在,但在未來幾年,信息作戰將不可避免地成為與傳統作戰一樣的核心能力。軍隊已經觀察到戰斗之王從火炮過渡到空中力量,空中力量穩步發展,可以在任何時候和任何地方使用。盡管在過去的30年里,空中力量是火力的 "首選",但不確定的是,在未來的30年里,空中力量是否會成為戰斗之王,或者動能能力是否會像其他傳統能力一樣,被更有效、更精確和更經濟的替代品所取代。預測未來總是很困難的,但目前的軌跡表明,非動能能力將最終成為戰斗之王,火力將從硬件過渡到軟件,因為不再需要飛行的效果,因為計算機代碼和遙遠的點擊將變得比動能武器的震蕩效果更具破壞力。
衛星能夠以最快和最安全的方式將信息傳遞到最底層的指揮部,其數據鏈接對于在高度競爭的環境中同步部隊成員,加速觀察、定位、決定和行動(OODA)的循環,以及在行動前和行動中加強部隊的安全和保障至關重要。
空間領域為全球通信、高空情報、監視和偵察(ISR)以及為保持對空域的控制和執行未來預測的高節奏行動所必需的定位、導航和定時(PNT)解決方案提供無與倫比的覆蓋范圍和持久性。將空間領域納入MDO將釋放出一種力量倍增效應,因為它允許創建跨作戰領域的新網絡,并為分布式聯合規劃和執行建立新機制。隨著傳統的地面和空中指揮要素被推到離戰斗更遠的地方,向空間領域的邁進對于在地面要素和遠程載體之間更廣泛地傳播連接是至關重要的,從而使部隊要素能夠彼此和總部要素之間更理想地運作。
擴大的地球同步衛星群將通過為所有類型的載人平臺、遙控飛行器和自主系統提供連接,使它們能夠一起遠程操作,從而實現一種新形式的作戰C2。隨著目前的限制因素--即計算能力、通信帶寬和太陽能電池板產生的電力--被克服,空軍將通過多種類型的新情報產品和服務呈現革命性的新前景。在未來幾年,利用大數據處理、人工智能和機器學習(ML)來生成、處理、分析和過濾衛星上的大量信息,并自主地向指揮官和作戰人員提供實時的關鍵信息服務將成為可能。空中和太空力量交織在一起,如果沒有所需的最低水平的天基能力,任何向MDO的過渡--設想進入所有作戰領域,但可以說以太空領域為核心--將仍然無法實現。
進入空間領域的初步步驟側重于發展空間態勢感知(SSA),在推進到天基傳感器和其他能力之前,從地面的雷達和強大的望遠鏡開始。在最基本的層面上,SSA必須允許空軍評估發射,監測衛星和運載火箭重返大氣層,跟蹤軌道上的衛星并提供潛在碰撞的預警。從這一初步步驟開始,需要由地面站、空間飛行器和通信鏈路組成的空間基礎設施,而作戰效果的提供則取決于專門的空間工作人員、操作人員及其工具包,這些因素綜合起來考慮,有可能消耗大量的財政資源。
空軍需要發展主權控制的空間能力的方法,這些方法既要有成本效益,又要有靈活性,例如插入硬件和軟件更新。提供即插即用解決方案的商業現成(COTS)技術和納米衛星--其開發成本相對較低,并能以低成本迅速復制--降低了進入空間領域的門檻,并將在允許空軍以必要的速度前進方面發揮重要作用,同時,越來越多的商業衛星運營商能夠有競爭力地為軍事行動提供帶寬和其他關鍵產品。
然而,空間領域的物理復雜性使得任何空軍或任何國家發展空間力量的相關技術復雜性和成本負擔本身完全不現實。空間領域構成了空間中較大和較小的軍事行為者的需要--無論大小--密切協作,甚至共同發展空間軍事力量。對空軍的要求是與盟友和伙伴協調步驟,無論他們是已經有了既定的程序和方案,還是處于啟動階段,對于利用空間領域為軍事行動提供的真正潛力將是至關重要的。
政府間、商業和研究伙伴關系將需要構成軍事空間戰略的基石,以便有可能從大量的現有知識中獲益,并應用從既定的空間行為者和遺留計劃的經驗中獲得的教訓。應用實驗對于空軍培養專業知識和能夠更迅速地確定能力差距和優先事項非常重要,當與盟友和伙伴合作推進時,可以大大簡化空間能力的開發周期,并為擴大長期的共享利益提供基礎。
通過戰略協調,資源單獨緊張的盟國和伙伴國空軍將能夠把他們的重點限制在建立具有利基能力、機制和軌道的小型衛星星座上,以便以后匯集起來,合并成更大或超大的星座。盟友和合作伙伴之間形成的超大型衛星星座有望提供一個更加多樣化和強大的共享能力架構,否則是無法實現的,關鍵是要建立冗余,以防止突然失敗或失去服務。建立冗余是必要的,因為在未來十年,新的空間行為者和空間威脅的引入使空間領域不僅更加擁擠,這本身就帶來了重大的新風險,而且還首次出現了軍事競爭。
作為通常負責領導軍隊進入空間領域的軍種,當空軍開始考慮發展空間足跡和作戰能力時,眼前的挑戰是制定能夠在預算限制內和以相關速度提供需求的方案。
"盟國和伙伴之間形成的超大型衛星星座有望提供一個更加多樣化和強大的共享能力架構,否則是無法實現的,關鍵是要建立冗余,以防止突發故障或服務損失。"
通過將天基能力分布在一個與盟國和伙伴共享的更廣泛的空間架構中,空軍將能夠從更多樣化的能力套件、更高的可用性和全球安全通信的延伸中獲益。隨著天基能力向盟國和伙伴之間共享的架構發展,控制目前被隔開的衛星的地面站將需要互聯并更接近AOC,以改善C2的決策。由于空間資產為民用和軍用用戶提供產品和服務,然而空間領域的使用使作戰C2變得復雜,可能需要其他政府部門參與傳統上由軍事指揮官負責的決策。
軍事指揮官很可能在特定情況下優先考慮或在空間領域的正確時間作出反應的能力減少或受到限制。在某種程度上,在可能的情況下插入的常設協議,可能會澄清如果向另一用戶提供的服務受到軍事行動的影響而需要遵循的具體程序。傳統的C2周期、程序和結構是為了對實體單位行使權力,而空間領域則側重于獲取和傳輸數據和通信以實現效果,需要不同的考慮。因此,一個專門的軍事空間指揮部是必要的,以滿足居住在各兄弟部門、其他政府部門以及外部盟友和合作伙伴的空間工作人員之間所需的巨大的整合和協調程度。
空軍在提供解決方案以有效利用空間進行多域作戰方面發揮著至關重要的作用,并且通常將負責從國防角度領導、管理和培育空間--例如在英國、澳大利亞和荷蘭,其空軍最近已經建立了初步的空間指揮部。一旦空軍建立了初步的操作能力,空間領域的C2結構和程序將隨著新框架的建立而發展,以產生綜合的空間領域意識,捍衛主權、盟國和伙伴的空間能力,并全面推進軍事空間行動、計劃和能力。一個專門的空間指揮部除了使可能沒有共同愿景的姐妹部門在空間領域的使用上保持戰略一致,甚至沒有充分認識到它的潛力外,還對培養空軍多領域行動所需的新的專業空間工作人員和專業知識的骨干隊伍至關重要。
為了使空軍有能力在各作戰領域進行思考、戰斗和取勝,幾乎所有的遺留系統都需要升級,而且空軍需要提高他們在面對快速技術進步時吸收有任務能力的技術的能力。隨著在采購周期的關鍵決策點上做出判斷的挑戰加劇,空軍采購規劃人員必須走一條鋼絲。在追求提供革命性能力的新解決方案、購買成本較低的商業現成技術(COTS)以彌補能力差距或試圖升級遺留系統之間做出選擇將變得更加微妙。在投入使用的新系統和升級遺留系統之間取得適當的平衡將被新系統的挑戰所加劇,這些新系統往往無法迅速投入使用。
為了滿足未來的作戰要求并保持機動自由,遙控飛行器和自主系統在多領域的戰斗空間中發揮著重要作用。人們普遍承認,無人駕駛和自主系統反映了未來的空中力量,但是空軍仍然傾向于主要從載人平臺和系統的角度考慮問題。對載人威脅和平臺的傳統關注導致了訓練和模擬的發展,TTPs甚至C2流程都是圍繞著提高載人系統對抗載人威脅的能力而設計的。空軍必須在載人、遙控和自主系統方面進行更全面的思考,其中人工智能具有巨大的作用,以確保它們得到適當的考慮,并適當推動對未來威脅、能力發展、培訓、實戰飛行和C2本身的思考。
下一代空域和戰斗管理將需要大數據處理和人工智能來擴展人類的決策空間,同時也有一個潛在的需求,即空軍能夠依靠快速軟件開發來提供基于云的服務解決方案,通過認證的軍事證書安全地訪問。人工智能的最大挑戰是與它的使用相關的控制水平。出于道德、法律和安全的原因,完全不對人工智能施加任何控制是不可行的--然而,施加人類控制超過一定程度,就會有效地減慢其旨在加速的決策過程。目前,無論是在駕駛艙還是在C2中心,人工智能都需要面向為決策者生成和提供選擇,但隨著作戰周期的加快和戰爭的自動化,它的作用將越來越大。
建立快速能力辦公室可能有助于解決采購挑戰,為關鍵任務的前線需求提供更快的周轉,然而,盡管有可能實現快速采購,空軍必須確保他們能夠在沒有特定系統的情況下通過產生開箱即用的解決方案,將現有技術與人類的洞察力和創新相結合。世界上最具創新精神的組織都能有效地利用集體天才的力量,而空軍必須更好地通過培養有利的程序、伙伴關系和心態來培養創新文化,直至最低層。思想沒有等級之分,當空軍領導人創造出創新蓬勃發展的組織環境時,基層人員或非入伍軍官可以成為解決行動挑戰的重要媒介和催化劑。通過扁平化組織,減少等級之間的縱向距離和部門之間的橫向距離,空軍可以實現一個更深入參與的員工隊伍,以更好地收獲創新的好處。
為了提高技術適應性,空軍必須使用通用的開放式架構開發未來的系統和數字解決方案,并更好地將操作人員和最終用戶與開發系統和工具的工程師和技術團隊以及負責采購和維持決策的辦公室聯系起來。通過迭代開發系統和工具來實現更深層次的合作,與操作人員建立共同的所有權,并使修訂工作能夠即時進行。用戶的直接、持續的參與將提高標準化程度--如圖形用戶界面--支持操作人員的培訓,并能確保服務成員為成功做好準備。與工業伙伴和學術界的伙伴關系將對壓縮系統從構思到原型的開發周期起到關鍵作用,確保更快的失敗途徑,并使空軍在技術上的適應性更強。
促進創新文化
空中力量仍然是今天動能效應和空運的最具決定性的能力,但空軍領導人必須確保空中力量在2030年及以后仍然具有相關性。空軍已經嚴重依賴在五個作戰領域的行動能力--然而這些領域都將變得非常混亂和有爭議。一系列的安全挑戰已經加大,變化的速度也在增加,因為潛在的威脅在破壞性技術武器化的推動下加速。空軍將面臨的挑戰是為潛在的安全損失找到解決方案,并保持他們在未來受限和退化的作戰空間繼續作戰的能力。為了變得更有生存能力、更靈活和更有彈性,以威脅為中心的聯合反應將是至關重要的,空軍必須重新定義他們如何與兄弟部門、盟友和合作伙伴進行合作、共存和競爭。空軍將需要在內部變得更加互聯互通,并與姐妹軍種、盟友和合作伙伴一起,在多領域的整合中取得成功,并在未來延伸的戰斗空間中提供協調的效果。
雖然世界各地的空軍確實無法在單一領域充分發揮優勢,更不用說在多領域背景下,但從過去的經驗中可以學到豐富的教訓。歷史上充滿了破壞性的挑戰,空軍必須制定戰略來推動執行MDO所需的轉型變化。這種轉變必須從擴大演示開始加速,以連接整個作戰領域的傳感器、射手和部隊要素。MDO范式廣泛要求平臺和專業人員同時支持各種各樣的作戰要求和聯合指揮官的連接。因此,在向MDO過渡的過程中,人的因素將比技術更具有決定性,如果要實現全面的網絡整合和戰斗云在軍事行動中的實際應用,必須更新培訓、發展和領導人員的方法以反映新的現實和戰爭方式。
空軍需要變得能夠利用流動領域,有效地結合航空、空間和網絡空間,在全球舞臺上采取戰略行動(或發出信號)--在范圍和速度上有更多的選擇和最小的政治風險。
"為了變得更有生存能力、更靈活和更有彈性,以威脅為中心的聯合反應將是至關重要的,空軍必須重新定義他們如何共同運作、共同存在并與兄弟部門、盟友和合作伙伴競爭。
摘要: 元宇宙作為一個新興的概念受到了產業界、學術界、媒體界及公眾的廣泛關注,國內外眾多公司也紛紛在“元宇宙”領域布局,但布局的背后離不開強大的技術支持。本文從技術維度深入剖析元宇宙。首先,從科學與技術的角度論述元宇宙的概念及內涵,并總結了目前從業者、專家以及學者對元宇宙的不同見解。其次,概述了元宇宙相關關鍵技術,包括網絡及運算技術(5G、6G、物聯網、云計算、霧計算及邊緣計算)、管理技術(能耗管理、資源管理、會話管理及時空一致性管理)、虛實對象連接、建模與管理技術(X聯網、身份建模、社會計算、去中心化管理技術)、虛實空間交互與融合技術(拓展現實、電子游戲技術、腦機接口技術)等。元宇宙不宜稱為新技術,而是IT新技術的綜合運用。技術的進步與發展,將為元宇宙的實現和應用奠定堅實的基礎,同時元宇宙的發展也會促進現有技術的升級換代。最后,展望了元宇宙發展面臨的諸多挑戰,以清晰認識、理智決策、穩步探索元宇宙。
1992 年,美國著名作家Neal Stephenson在《Snow Crash》中提到元宇宙(Metaverse)一詞,他這樣描述:“戴上耳機和目鏡,找到連接終端,就能夠以虛擬分身的方式進入由計算機模擬、與真實世界平行的虛擬空間。”[1] 其實Metaverse這個概念的思想源頭是由美國數學家和計算機專家Vernor Vinge教授在 1981 年出版的《True Names》中描述的通過腦機接口技術進入并獲得真實感官體驗的虛擬世界[2]。 在元宇宙時代,人類的生活方式會受到較大的影響。其一,傳統的哲學與科學會受到巨大的沖擊,需要不斷挖掘和研究新的理論與方法;其二,元宇宙的興起將推動人類社會邁進一個新階段,相應地,時代的演變又進一步為技術的發展添磚加瓦。元宇宙技術在融合已有技術的同時,也將不斷衍生出更多的新技術。本文先從科學與技術的角度論述元宇宙的概念及內涵,并總結了目前從業者、專家以及學者對元宇宙的見解;其次,從技術維度深入剖析元宇宙,即從網絡及運算技術、管理技術、元宇宙虛實對象連接、建模與管理技術以及虛實空間交互與融合技術四個方面闡述元宇宙中涉及的關鍵技術。最后,對未來元宇宙技術發展所面臨的挑戰進行歸納與總結。
元宇宙作為一個新興的概念,受到了產業界、學術界、媒體界及公眾的廣泛關注,但對于元宇宙的定義及概念還不夠統一和明確,不同從業者、專家以及機構給出了對元宇宙的見解,如表1所示
為進一步理解元宇宙的概念及內涵,本文從科學和技術的角度對其進行剖析,具體如下: 從科學角度上說,元宇宙的誕生是多學科融合的結果。元宇宙將促進信息科學、量子科學、數學和生命科學等學科的融合與互動,創新科學范式,推動傳統的哲學、社會學甚至人文科學體系的突破。元宇宙,實質上就是廣義網絡空間[7],在涵蓋物理空間、社會空間、賽博空間以及思維空間的基礎上,融合多種數字技術,將網絡、軟硬件設備和用戶聚合在一個虛擬現實系統之中,形成一個既映射于、又獨立于現實世界的虛擬世界。
從技術角度上說,元宇宙不宜稱為新技術,而是現有IT技術的綜合集成運用,它是信息化發展的一個新階段。因此,隨著元宇宙的發展不僅會促進現有技術的升級換代,而且也會促進新技術的出現。本文將從技術維度對元宇宙中涉及的關鍵技術進行概述,如圖1 所示
網絡及運算技術是元宇宙的基礎設施,可為元宇宙提供高速通信、泛在連接以及共享資源等功能,本節主要介紹5G、6G、物聯網、云計算、邊緣計算、互聯網等在元宇宙中的作用。
無論是遠程執行計算繁重的任務、訪問大型數據庫、還是在用戶之間提供共享體驗,都離不開網絡與通信[8],元宇宙時代所需要的沉浸式體驗,要求網絡具有低延遲、大帶寬、高可靠性等特點。5G作為新一代信息化基礎設施的出現,為元宇宙的沉浸式體驗提供可能。為了滿足不同行業和市場的需求,國際電信聯盟(The International Telecommunication Union, ITU)將5G劃分為超可靠低延遲通信(Ultra-reliable low-latency communication, URRLC)、增強移動帶寬(Enhanced mobile broadband, eMBB)和海量機器類通信(Massive machine-type communications, mMTC)[9], URRLC 和 eMBB 恰好可滿足元宇宙對沉浸感體驗的需求[10],眾多學者近年來不斷為 URRLC 和 eMBB 做研究,以提高 5G 的通信效率,減少能源消耗。例如,Kumar和Ahmad[11] 提出基于 ANFIS 的 5G 新空口技術(5G New radio, 5G NR)中 URRLC 和 eMBB多路復用反應策略,為 URLLC 流量提供高優先級,同時保證了 5G 蜂窩網絡場景中其他 eMBB 流量的可靠性。Malik等[12]提出一種干擾感知無線資源分配方法,并與傳統的循環調度算法作比較,結果表明,提出的算法比傳統的循環調度算法在鏈路可靠性和延遲降低方面有明顯的改善。Buccheri等[13]提出混合重傳策略,以滿足URRLC需求并最小化消耗資源。
6G 作為 5G 的必然演進方向,6G 將打破時間、虛實的限制,為元宇宙的實現提供網絡基礎。6G 的出現,更多地實現現實世界與虛擬世界的交互和未來的共存共生。中國移動通信研究副院長黃宇紅表示,未來不僅會有物理世界,也將有數字世界,一方面是物理世界的孿生世界,另一方面會演變成元宇宙和平行世界 。未來,元宇宙將不僅是對現實世界的模擬與仿真,更重要的是物理世界與虛擬世界的融合與交互發展,6G 將對其發展提供強大的驅動力。東南大學尤肖虎教授團隊[14]在“6G 的最新進展及發展趨勢”一文中,提出 6G 無線通信網絡有望提供更高的頻譜、能量、更高地傳輸速率、更低傳輸時延、超大連接密度、更高覆蓋率和亞毫秒級的時間同步,6G 所具有的特征將在元宇宙中大顯身手。
在 5G、6G 網絡環境下,利用量子通信保障通信安全方面,Chowdhury等[15]提出基于量子不可克隆性定理和測不準原理,量子通信通過應用量子密鑰提供了強大的安全性。
物聯網(Internet of Things, IoT)在元宇宙的網絡基礎設施的實現和發展中將發揮重要作用。虛擬世界與現實世界的泛在連接,離不開大量傳感器、智能終端等物聯網設備實時采集和處理數據,故物聯網可為用戶提供真實、持久且順暢的交互體驗,是虛擬世界與現實世界的聯接和橋梁。物聯網經典的三層架構,即感知層、網絡層和應用層,與元宇宙的建立緊密聯系。表2 列舉了近年來部分學者對物聯網三層架構的研究成果,將來為物聯網技術在元宇宙中的應用做好鋪墊,支撐元宇宙的發展。
從物聯網的三層架構來看,要想支撐元宇宙的發展,仍存在一些瓶頸,例如,存在于感知層的數據爆炸與有限感知資源之間的不平衡問題,Shi等[27]提出了將人工智能與選擇性感知相結合的解決方案;傳感器/制動器性能不佳問題,Ning和Liu[28]提出使用納米技術用于改善傳感器/制動器的性能(例如,更高的靈敏度和選擇性、更短的響應時間和更長的使用壽命)。因此,納米材料(如石墨烯、納米線等)的應用將為元宇宙的感知與通信領域提供可選性。存在于網絡層的連接爆炸與高效通信之間的問題[29];存在于應用層的應用爆炸與精準服務之間的矛盾[30],都是現在正面臨的問題。未來隨著科技的進步,解決上述“卡脖子”問題,將為構建元宇宙提供進一步的支撐。
另外,觸覺互聯網也是支撐元宇宙發展的一種新的物聯網形式。觸覺互聯網是由Fettweis[31]提出,它允許人和機器能夠在移動中和特定空間通信范圍內,通過觸覺實時地與周圍環境進行互動。觸覺互聯網有潛力使元宇宙更具有沉浸感。5G 關于低時延、高可靠性的研究客觀上是為觸覺互聯網作了鋪墊,Saches等[32]描述了 5G 在觸覺互聯網(Tactile internet)中發揮的基礎作用,并展示了 5G 新空口技術(5G NR)和 5G 長期演進技術(5G LTE)如何實現有保證的低遲延無線傳輸,提出了基于分布式云平臺的 5G 系統架構,以滿足觸覺互聯網對可靠性和低延遲方面的苛刻通信需求。Antonakoglou等[33]關注 5G 如何結合觸覺數據通信協議、雙邊遠程操作控制方案和觸覺數據處理,讓觸覺應用發揮作用。
有十余年發展史的云計算,成為元宇宙中可以大量賦能的領域。元宇宙所需要的身份建模、現實世界與虛擬世界的交互以及多元宇宙之間的互動,都會產生難以想象的海量數據,這離不開云計算的支持。本節將從數據處理和數據存儲兩個維度論述云計算的重要作用。
(1) 數據處理。 具有算力動態分配的云計算是元宇宙最重要的網絡基礎設施。元宇宙的構建需要一個強大的算力系統處理數據,當前的算力架構依然無法滿足元宇宙對于低用戶門檻、高體驗感的需求,云計算一定程度上能夠推動算力發展。日前,元宇宙借助游戲技術來展現,大型游戲采用的客戶端與服務器結合的模式,其對客戶端設備的性能和服務器的承載能力有較高要求[34],并且在全球范圍內集中部署的云數據中心[35],旨在處理來自物聯網設備的傳感數據或基于嵌入式設備的實時視頻、圖像等非結構化數據。例如,Zhang等[36]提出了用于嵌入式設備實時視頻處理的流式云平臺,并對該平臺的處理速度、功耗和網絡吞吐量等進行評估。
(2) 數據存儲。 在云上存儲數據,即云存儲(Cloud storage),一般不用考慮存儲容量、存儲設備類型、數據存儲位置以及數據的可用性、可靠性和安全性等繁瑣的底層技術細節,按需付費就可以從云服務提供商那里獲得近乎無限大的存儲空間和企業級的服務質量[37]。近幾年來學者們一直在云存儲方面的研究,如Sharma等[38]綜述了區塊鏈技術在云存儲安全方面的應用;Qiu等[39]提出了基于可逆小波變換的以用戶為中心的云存儲數據保護方法;Doan等[40]提出云存儲系統中數據一致性維護的虛擬服務器解決方案。 元宇宙在構建過程中產生的大量數據需要云計算按需調配資源,以進行海量數據處理及存儲,但若把所有的資源都集中在云端,那對于元宇宙的沉浸感體驗、負載均衡以及能量消耗將帶來巨大的挑戰。對此,需要在本地部署帶有計算和存儲功能的設備,以縮短終端用戶到計算和存儲資源的距離,這就需要霧計算來支撐[41]。霧計算由終端用戶層、霧層及云層構成,霧層的存在極大地降低傳統云計算的時延,可以自己向用戶直接提供服務,還可以利用云層強大的算力和存儲能力協同進行服務。
另外,霧計算中更加靠近邊緣終端的部分,稱之為邊緣計算(Edge computing)。邊緣計算可將元宇宙計算所需的大型服務分解為小巧且易于管理的子任務,并將這些任務分散到邊緣節點去處理。邊緣計算在物理上更接近終端用戶,進一步將遲延時間最小化,為用戶流暢、優質的體驗提供保障[42]。另外,當元宇宙的內容涉及多個用戶時,會大大增加網絡流量負載,Kim[43]提出了一種在邊緣網絡中基于云 VR 的服務配置和部署方法,這只是對其的初步探索。由于云計算、邊緣計算以及霧計算各有優缺點及特性,如表3 所示,故利用云邊協同策略降低網絡時延及流量負載[44–45]受到關注,為元宇宙關鍵技術的研究提供一種選擇。
元宇宙將用戶與互聯網交互的界面(體驗感)從“二維”上升到“三維”,將對互聯網的技術和發展起到推動作用。值得注意的是,元宇宙是互聯網之上的應用,二者不宜等同起來,更不能將元宇宙簡單地看成下一代互聯網。對行業、企業來說,互聯網的“升維”將催生新的生產力,但是找到“入口”僅是第一步。還要在技術層面上,提供更多的連接與通信方式,以及基礎設施。硬件設施也要不斷適配升級,這也將是一個相對艱難的探索過程[46]。
元宇宙管理技術保障虛擬空間(即賽博空間)與真實空間(含物理空間、社會空間及思維空間)的泛在連接與空間融合所需要的軟硬件環境,主要包括能耗管理、資源管理、會話管理、時空一致性管理等。
節能環保一直是信息系統所追求的,未來的元宇宙一大挑戰便是能耗。元宇宙中能耗管理的目標和理念是實現最低能耗和綠色能源占比最大化,提高能源利用效率。在元宇宙中,傳感器設備、網絡及通信基礎設施(如,5G、6G、云計算系統等)、虛擬世界與現實世界的交互(如,VR/AR/MR、腦機接口等)等需要大量的能源消耗。許多學者提出了能源監測的方法。例如,Somula 和Sasikala[47]提出基于物聯網的方法監控負載消耗并以高效的方式節約能源。Bi等[48]創建了 Elman 遞歸神經網絡模型和指數電力預測模型,幫助減少電力損耗、節約成本。能源可持續發展既是元宇宙的核心約束也是投資機遇。 元宇宙中節能環保的目標是建立綠色元宇宙。這需要我們做到兩點:一是不斷創新與發展先進的能源基礎設施,實現對能源的自動測量、收集、存儲、分析等智能化處理,以提高能源的高效循環利用率為目的,研發能源循環設備,加速能源網絡的變革;二是優化能源管理的算法與模型,通過對物理空間、社會空間及思維空間的資源創建虛擬資源以便實現能源重組織與優化,提高能源利用率。未來,隨著納米及量子等技術的成熟,將研發出新型材料并應用于高性能設備、裝備或平臺,以獲取納米級別或量子級別的網絡,從而增強高性能能源使用率、降低能耗[49]。
元宇宙,本質上就是廣義網絡空間[7,49],在涵蓋物理空間、社會空間、賽博空間及思維空間的基礎上,共享資源。資源管理主要包括資源描述、資源尋址、資源發現和資源分配等,以滿足元宇宙的低延遲、高度沉浸等需求。目前,在資源管理的四個典型階段上已經有了一些較為成熟的技術,如表4 所示。
元宇宙的會話管理,是管理異構網絡中無處不在的資源和資源用戶之間的交互[28]。在元宇宙中,會話管理主要針對具有動態特性的長時間、持久性交互,特別是針對具有多個資源用戶參與的會話。會話管理需要解決切換延遲、瞬時數據包丟失、端到端通信延遲以及跨異構網絡的無縫會話切換等問題,以提高用戶的沉浸感體驗。例如,針對5G網絡基礎設施,學者們研究在5G網絡上的會話管理方法,以盡可能地滿足未來元宇宙對實時性、低能耗等需求,如,Kim等[51]提出了一種有效的5G系統低延遲通信會話管理方案,并且避免了移動設備的網絡資源浪費和電池消耗。Park等[52]探討了如何在5G無線網絡環境中實現用戶的高性能會話管理。另外,元宇宙中的會話管理還應預防會話過程被攻擊的情況發生。Nadar等[53]研究了一種針對破壞性身份驗證和會話管理攻擊的防御方法。Marlinspike等[54]研究了Sesame算法,對異步消息進行加密,提高會話過程中的安全系數。
在物理空間、社會空間及思維空間中的實體與賽博空間實體映射過程中離不開時空一致性管理。元宇宙實質上是廣義網絡空間,它是一個虛實結合的世界,人在現實世界中,時間、空間的連續和唯一是嚴格按照物理規律,若要在虛擬世界中享受到沉浸式體驗,故也需要考慮時空一致性管理。現在已有學者提出一些管理時空一致性的方法,例如,時間同步法、目標定位法、時間配準法及空間配準法等時空一致性管理方案[28]。一致的時空數據對現實世界和虛擬世界之間的映射非常重要,Atluri等[55]綜述了時空數據的挖掘方法。
現實世界中的人和物以另一種虛擬身份的形式存在于元宇宙,這將構建成一種新型的虛擬社會,并在新的虛擬社會中重塑數字經濟體系、社會關系等。然而,虛實對象的映射與連接、虛擬社會的構建與管理離不開X聯網(Internet of X, IoX)、身份建模、社會計算、去中心化管理技術的支持。
X聯網包括物聯網、人聯網和思維聯網。物聯網(IoT)在物理空間和元宇宙之間建立虛實對象的泛在連接,將物理對象映射到虛擬世界中。人聯網(Internet of People, IoP)描述的是由各種人類節點組成的互連網絡[56]。節點的互連離不開人與人之間的社會關系、以物為媒介的社會關系、與時空屬性相關的社會關系等。在元宇宙時代,IoP在人類社會和元宇宙之間建立了虛實對象的泛在連接,從“社會關系的數字化”過渡到“人與世界的關系數字化”。在元宇宙內容不斷豐富的過程中,不僅僅要賦予虛擬原生人與數字人身份,還要考慮其認知與思維。思維聯網(Internet of Thinking, IoTk)強調思維創造的過程,進一步深化思維空間與元宇宙之間的互動,使得元宇宙中的對象擁有自動獲取、處理、學習和思考知識的自適應感知能力,克服時間和空間的限制,可在不同的地點和時間交換思想,實現準確、高效及便利的合作與交流[57]。
隨著多種技術的融合以及新興技術的出現,進入元宇宙的對象數量和種類將急劇增長,如何對物理對象的身份標識進行建模及解析,以實現物理對象在與元宇宙的感知和映射,這將是未來發展元宇宙的核心問題之一。物理對象身份標識主要包括唯一標識法和非唯一標識法。其中,唯一標識法采用外界賦予對象的標識號,標識身份并應用于對象的網絡身份/資源的發現、尋址和訪問等,除了使用Bar Code技術、QR code技術、RFID技術等外界賦予的對象身份,還有利用對象的生物屬性、時空屬性等自身屬性信息進行身份標識[58],典型的有利用虹膜、人臉、指紋等生物特征標識與解析技術等。
除元宇宙中映射的物理對象外,存在于元宇宙的人類也需要身份標識,其被稱為“虛擬數字人”。“虛擬數字人”是元宇宙的重要參與者,也是大眾最能接受的元宇宙表現形式之一。在未來,元宇宙用戶分為兩類:虛擬原生人和數字人。虛擬原生人(如,虛擬偶像、虛擬主持人、虛擬記者等),與現實世界不存在映射關系,脫離現實世界而存在;數字人則是指現實世界中的人類在虛擬世界的數字分身。無論是虛擬原生人還是數字人,都需要身份標識以便對其管理及研究。目前,身份建模與解析在物聯網領域比較常見,如Verma等[59]提出了基于區塊鏈的身份管理系統建模;Ning等[60]綜述了身份建模與解析現狀,以及其未來的發展趨勢與挑戰; Bouras等[61]提出了一種基于輕量級區塊鏈的物聯網身份管理方法。未來,隨著身份建模與解析技術應用領域的擴大,也將是元宇宙時代重要的研究領域。
首先,通過身份建模技術,對數據、信息以及屬性進行描述,構建出進入元宇宙的實體對象。進一步,通過IoP、社會計算等技術進行實體的關系建模與行為形式化,從而實現實體的關聯及行為挖掘、理解與分析[62]。社會計算具體包括社交網絡分析(Social network analysis)、群體智能(Swarm intelligence)、人工社會(Artificial society)等。社交網絡分析指的是利用圖論、代理模型等方法對個體之間通過社會關系結成的網絡體系進行研究。群體智能指的是在集體層面表現得分散的、去中心化的自組織行為。人工社會指的是通過對復雜社會問題建立計算機模型,進行實驗分析并提供決策支持。 社會計算以處理社會關系為導向。元宇宙的出現,虛擬社會關系不會取代現實中的社會關系,但會催生線上線下一體的新型社會關系。通過社會計算研究人類的行為、新型社會關系能夠預測元宇宙的運行規律及未來發展趨勢,同時在元宇宙中更容易收集用戶的位置、年齡、偏好等數據信息,進行深度挖掘以更好地構建元宇宙中的社會運行機制。
元宇宙中的對象在身份建模、IoP、IoTk、社會計算等技術的支持下,擁有獨立的身份、思維、行為及社會關系。根據需求,可在元宇宙中組建社區、城市,共同構建區別于或類似于現實世界的法律法規,衍生出新的虛擬社會文明。但實現這一切的前提是,元宇宙需要擁有獨立的經濟系統和經濟屬性。元宇宙的每一塊組成部分信奉的是去中心化概念,需要借助去中心化底層技術來重塑元宇宙的數字經濟系統。去中心化技術的典型代表區塊鏈[63],借助區塊鏈加密算法、共識機制、智能合約等技術,可能會為元宇宙發展提供新的金融體系,為用戶提供保險、交易、證券化等虛擬資產的金融服務,也可實現虛擬世界與現實世界經濟體系的聯動。但是元宇宙經濟系統不等價于互聯網經濟系統,它不是互聯網經濟系統的復制品。需要說明的是,獨立的去中心化金融體系,與現實社會中的國家治理、主權貨幣等機制往往是矛盾的,這也許是元宇宙未來發展的制約。
區塊鏈技術主要包括點對點傳輸、數字加密技術、分布式存儲、共識機制和智能合約等[64],這也決定了基于區塊鏈的經濟系統將為元宇宙經濟系統的實現奠定基礎。因為,數字加密技術在區塊鏈中具有核心地位,可以保證元宇宙用戶身份信息和交易數據的安全,文獻[64]中簡要介紹了哈希函數、對稱加密算法、非對稱加密算法、數字簽名等加密技術原理;分布式存儲系統(例如,Storj, IPFS),將數據分布式存儲于各個節點,可以保證數據的安全與隱私;雖然共識機制在公鏈和私鏈/聯盟鏈上有很大的差別,公鏈上使用的POW/POS共識機制[65],私鏈上使用PBFT及其變種算法的共識機制,但元宇宙將會基于區塊鏈形成自己的共識機制,去約束去中心化網絡中的每一個分散節點,并驗證每個節點的身份產生信任,保障元宇宙的去中心化價值網絡;基于以太坊的智能合約,一旦寫入無法篡改的特點及其可追蹤性,為元宇宙用戶提供可信交易。
除此之外,還有一些去中心化交易載體、組織機構也為元宇宙經濟系統建設增磚添瓦。目前,去中心化交易載體——數字貨幣,幣種已達21種 [66],包括MANA, AXS, SAND, CHR, TLM, SLP, ILV, ALICE, STARL, GHST, DPET等。另外,非同質化代幣(Non-fungible token, NFT)的出現引爆了元宇宙,可充當元宇宙激勵環節的媒介。它表示獨特物品所有權的代幣,包含特定商品或資產的獨特信息,實現虛擬物品的資產化,由于自身的數字稀缺性被率先應用于收藏、藝術品以及游戲場景。去中心化自治組織(Decentralized Autonomous Organization, DAO)將組織的管理和運營規則以智能合約的形式編碼在區塊鏈上,從而在沒有集中控制或第三方干預的情況下自主運行[67]。去中心化交易所(Decentralized Exchange, DEX)將資金保管在用戶的錢包中,交易平臺只負責提供數字貨幣流動性,撮合交易由智能合約來完成。現在DEX比較著名的有基于以太坊網絡的Uniswap、Sushiswap、IDEX、Bancor、Kyber,基于幣安智能鏈的Pancakeswap,基于Heco鏈上的MDEX [68]。
去中心化管理技術不僅在構建元宇宙經濟系統上起到了關鍵性作用,而且去中心化數據傳輸、存儲與管理等方面至關重要。如,數據傳輸和存儲過于集中,會出現單點故障和數據安全問題,文獻[69]提出了基于區塊鏈技術、門限代理重加密技術以及IPFS技術的去中心化數據共享方案;文獻[70]提出了基于分布式賬本的去中心化存儲系統框架,以提供可靠的數據存儲服務。因此未來去中心化管理技術將作為核心技術之一,保障元宇宙數據及經濟體系的安全,同時也能保障元宇宙中用戶的信息安全。
虛實世界的交互、虛實世界視覺、聽覺、觸覺、嗅覺的統一,是元宇宙虛實空間融合的基石,這離不開擴展現實、電子游戲及腦機接口等技術。
在較長的一段時間,人們與機器的交互拘泥于鍵盤、鼠標及顯示屏等外部設備。隨著科技的進步,擴展現實技術誕生,將人機交互從二維界面過渡到了三維交互,大大增加了人們的沉浸感體驗,這逐步變成了構建元宇宙技術支柱之一。實現其中的交互效果,XR及全息影像將承擔重要角色。 虛擬現實 (Virtual reality, VR)是一個先進的、理想化的虛擬現實系統,為用戶提供了完全沉浸式的體驗,讓他們感覺自己置身于現實世界。增強現實 (Augment reality, AR) 通過設備識別和判斷(二維、三維、GPS、體感、人臉和其他識別對象)將虛擬信息疊加在基于識別對象的位置上,并顯示在設備屏幕上,從而實現虛擬信息的實時交互。混合現實 (Mix reality, MR) 是一種結合現實世界和虛擬世界的新型可視化環境。在新的可視化環境中,物理對象和數字對象實時共存和交互。VR/AR/MR的邊界將在未來變得模糊,成為一種融合產品。目前,元宇宙采用的主要交互方式是為用戶創建高度交互的虛擬世界。 全息影像是通過光學的手段呈現物體真實的三維圖像的記錄和再現技術,是計算機技術和電子成像技術結合的產物。利用相干光干涉,記錄光波的振幅信息和相位信息,得到物體包含形狀、大小等的全部信息。全息影像技術是真正的三維立體影像,用戶在不借助可穿戴設備的情況下,就可以在不同的角度裸眼觀看全息影像。隨著技術的發展,全息影像技術可以模糊現實世界和虛擬世界的邊界,這將為真正實現元宇宙打下堅實的基礎。
電子游戲技術,是元宇宙的最直觀的表現方式,不僅可以為元宇宙提供內容創作平臺,還可以實現娛樂、社交場景的聚合。元宇宙產品實質是游戲的泛化(娛樂游戲、嚴肅游戲等),比如,美國著名歌手Travis Scott在《堡壘之夜》舉辦元宇宙演唱會;GUCCI與Roblox推出的“元宇宙GUCCI品牌展覽會”;歐萊雅發布的全球首個品牌虛擬代言人“M姐”等等。游戲開發中,最重要的是游戲引擎,類似于制造機床的母機床,這也將是大規模元宇宙平臺的“卡脖子”技術之一。游戲引擎的出現降低了游戲設計者及開發者建立虛擬場景的難度,使他們無需從基礎的代碼做起。其發展決定了元宇宙中NPC建模、場景實時渲染、用戶操作與交互等方面的質量及性能,讓用戶有更加接近于真實世界的體驗。目前,比較知名的游戲引擎如表5 所示。
腦機接口(Brain-computer interface, BCI)是通過識別大腦信號,對大腦活動過程中腦信號進行編碼和解碼。用戶通過腦機接口進行操作,如玩游戲、打字等。腦機接口技術通過將個人的大腦信號解碼成計算機設備可識別的命令,將人類的神經世界和外部物理世界連接起來[71],其過程主要包括:腦電信號采集、腦信號處理、設備控制及信息反饋四個方面[72]。腦機接口技術讓人類突破身體、可穿戴設備的限制,特別是可以幫助殘障人士以一種新的姿態重新融入到社會中。這種姿態是意識與思維的融入,將真正達到虛實空間融合,助力元宇宙虛實相生。 BCI目前已經有了許多可行的方法,Abiri等[73]綜述了基于腦電圖的腦機接口方法,其他學者基于人工智能算法的腦機接口進行了研究[71,74–75]。根據傳感器和計算設備的部署方式,可以分為侵入式接口和非侵入式接口,由于侵入式接口會對生物體造成一定的損傷,而且考慮到元宇宙的沉浸式體驗,未來元宇宙研究將重點關注非侵入式接口的研究,為元宇宙虛實空間融合奠定基礎。
2021年被成為元宇宙元年,自此,“元宇宙”概念和應用不斷地出現在我們視野中,國內外許多科技公司(例如,Facebook、英偉達、字節跳動等)開始布局元宇宙。隨著各種信息技術的逐漸成熟,元宇宙時代已經悄然來臨,并被應用于房地產、服裝、娛樂、會議、教育等應用場景。當前元宇宙正處于一個起步發力階段,潛力巨大,但它也會面臨諸多挑戰,具體如下所示。
元宇宙是否能夠被社會所接受,以及接受之后隨之而來產生的倫理與道德問題,比如,人機相處、虛擬婚姻家庭、虛假身份和信息、知識產權等[76]。也許在未來,會有公司/研究機構開發道德與倫理的數字協議,作為底層的技術來支撐元宇宙的運行。元宇宙概念構建的是一種高自由度、高包容度的“烏托邦”世界,如何在去中心化的框架中構架元宇宙的倫理與道德共識并被真實社會所接受,這需要從多視角進行探索。
另外,元宇宙的法律法規建設問題也需要同步研究。現實世界里用法律法規來約束正常的社會秩序,而元宇宙還處于初步探索期,是繼續沿用現實世界的法律還是依靠群體共識來約束元宇宙中人的行為及社會治理,都需要進一步研究。
元宇宙的發展,會帶來眾多的安全與隱私問題。其一,國家信息平臺整體安全問題。元宇宙作為新興的數字生態,其將遭受網絡攻擊。網絡攻擊既可針對元宇宙的最終用戶和設備終端,也可針對元宇宙的運營商或關鍵服務提供商,這將會影響國家的關鍵基礎設施。而且,元宇宙促進虛擬世界與現實世界的融合,將擴大網絡攻擊的危害性,嚴重影響國家信息平臺的整體安全。另外,由于元宇宙的技術發展模式,造成元宇宙產品蘊藏較多的設計缺陷和漏洞,這將威脅用戶在元宇宙中的“化身”資產,加大數字內容治理難度。其二,用戶數據的安全與隱私保護問題。元宇宙的出現,收集個人數據的數量以及豐富程度是前所未有的。在未來極有可能是多個公司/機構一起打造一個或多個元宇宙,那么公司/機構之間如何進行數據協調消除“數據孤島”問題以及不同元宇宙之間如何進行數據交互,保障元宇宙中用戶的隱私及安全成為亟待解決的問題。例如,Zhang等[77]從人工智能的角度概述了用戶訪問認證、網絡態勢感知、危險行為監控和異常流量識別等方面的研究,為優化元宇宙安全與隱私保護手段提供參考;Falchuk等[78]也提出了在元宇宙中面臨的隱私問題。
當前的技術遠不能實現概念中所描述的理想元宇宙,現在進入元宇宙空間主要依靠高沉浸感的XR(VR/AR/MR)設備,但當前的虛擬實現技術很難將設備小型化、便攜化以及低成本化,供用戶隨時隨地的進入元宇宙,而且長時間佩戴XR設備會讓人感覺不舒服。 元宇宙將會大量使用人工智能(Artificial intelligence, AI)算法(如機器學習、深度學習、強化學習等)。AI三要素,即數據、算法及算力,對元宇宙的建立及發展具有關鍵性的作用,助力實現超越現實世界限制的社會和經濟活動[79],但人工智能還存在諸多缺陷[80]。利用計算機視覺、智能語音、自然語言處理等技術可以產生逼真的視覺、聽覺等感覺。不管是硬件發展水平,還是數據、算法、算力的發展水平使得元宇宙目前遠不能達到高沉浸感體驗,而且體驗過程中,對于可靠性、穩定性及舒適度等方面具有較高要求,這些都還需要繼續和深度研究。
元宇宙強調了去中心化管理、用戶定制內容和高沉浸感等特點,尤其是去中心化的社會和經濟模式,一方面,包括貨幣、交易、資產、司法等都嚴重依賴現實世界的相應機構進行約束;二方面,去中心化模式發展的天花板是現實世界的各種限制,尤其是超大規模的元宇宙平臺實際上挑戰的是國家主權。因此,需要辯證地看待元宇宙的發展:小規模的元宇宙應用(平臺)可能會發展很快很廣泛;中等規模的元宇宙平臺(如社交網絡、購物平臺)受投資規模及運營風險等限制,進入的門檻還是很高的;至于超大規模的元宇宙社區,挑戰的是現實世界的國家主權,發展一定會受到限制。
元宇宙的誕生將促進現實世界與虛擬世界的聯接與融合,可能會成為人類社會發展的新形態,改變人們的生活方式。在元宇宙的發展初期,技術是根,技術的發展與創新是重中之重,本文概述了元宇宙涉及的網絡及運算技術、管理技術、虛實對象連接、建模與管理技術和虛實空間融合技術,為研究人員提供參考,推動技術創新來帶動產品、場景和應用創新。但是,“元宇宙”概念的爆火,其發展速度、終極形態,甚至對哲學、文化、社會及經濟治理,以及對人類的影響都還未知。隨著元宇宙應用雛形的落地,賦能實體經濟也將成為熱點方向,在政府堅持以技術賦能實體經濟的政策導向下,其在“元宇宙”時代仍將適用。當下“元宇宙”概念逐漸回歸理性,行業開始逐漸顯現出脫虛向實的趨勢。此外,隨著元宇宙的發展和應用的逐漸落地,其安全與監管問題,也將逐步提上日程。總之,無論處于何種趨勢,我們要清晰認識、理智決策、穩步探索元宇宙!
[1] What is the metaverse of the recent fire? [EB/OL]. CNR(2021-09-13) [2021-11-18].//baijiahao.baidu.com/s?id=37385158&wfr=spider&for=pc 最近大火的元宇宙是什么?[EB/OL]. 央廣網(2021-9-13) [2021-11-18]. [2] What is the metaverse of the recent fire [EB/ OL]. Mr. Xiong Hongmeng development (2021-11-09) [2021-11-18]. 最近大火的“元宇宙”到底是什么[EB/OL]. 鴻蒙開發大熊老師(2021-11-09) [2021-11-18].
當前的流程和網絡限制迫使軍隊員工在物理上聚集在一起進行操作。Metaverse 提供了一種潛在的解決方案,可以在通過分發操作使指揮所更易于生存的同時啟用操作
共同的操作畫面
“我需要理解”也許是任務指揮技術背后的主要驅動力。制定和維護共同作戰圖的基本概念是增強態勢感知,實現態勢理解并促進所有梯隊的共同理解。通過連接數字系統以在 2D 和 3D 地圖上顯示信息或通過在紙質地圖上手動跟蹤友軍和敵方信息的復雜應用程序編程接口執行,該過程在過去 30 年中沒有太大發展。這項工作需要大型、繁瑣的指揮所,配備集中的人員和技術,以執行作戰過程并最終生成通用的作戰畫面,指揮官和參謀人員可以利用該畫面做出最及時、最準確的決策。 不幸的是,隨著運營變得越來越復雜,數據越來越多,各單位一直在努力有效地進行信息和知識管理。指揮所的規模和范圍已經擴大以滿足需要。人員數量的增加和對網絡的依賴使今天的指揮所容易受到敵人的攻擊,沒有足夠的機動性和生存能力。元宇宙提供了一種潛在的解決方案,可以使操作過程成為可能,同時通過分布操作固有地使指揮所更具生存能力,以及減少物理和電磁足跡。
在 元宇宙中與我會面:在未來,士兵們可以“進入”虛擬環境,在執行任務之前進行任務規劃。盡管“軍事虛擬世界”仍然只是一個概念,但整個美國陸軍的研究人員和科學家正在探索潛在的應用
什么是元宇宙?
由尼爾斯蒂芬森在他 1992 年的小說“Snow Crash” 中創造為了描述用戶在虛擬空間中交互的在線世界,元宇宙已經通過大型多人在線游戲和虛擬世界(如 Second Life、Roblox 或 Minecraft)變得熟悉。正如移動設備在過去 10 年中改變了互聯網的消費方式一樣,新一代技術——在這種情況下是虛擬和增強現實耳機——正在為我們如何消費內容提供新的視角。這些頭顯不再受平面屏幕的限制,讓用戶能夠感知在物理世界之上或代替物理世界呈現的 3D 對象和媒體并與之交互。隨著大流行驅動的遠程工作加速,這一概念變得更加流行。Facebook 甚至將其未來寄托在這一轉變上。
風險基金合伙人和受人尊敬的商業作家馬修·鮑爾( Matthew Ball )將元宇宙最徹底的探索之一寫成了一個由九部分組成的博客系列。Ball 的入門書著重于元宇宙的八個方面:
硬件:用于訪問、交互或開發元宇宙的物理技術和設備的銷售和支持。這包括但不限于面向消費者的硬件(例如 VR 耳機、手機和觸覺手套)以及企業硬件(例如用于操作或創建虛擬或基于 AR 的環境的硬件,例如工業相機、投影和跟蹤系統以及掃描傳感器)。此類別不包括特定于計算的硬件,例如 GPU 芯片和服務器,以及特定于網絡的硬件,例如光纖電纜或無線芯片組。
網絡:由骨干提供商、網絡、交換中心和在它們之間路由的服務以及管理“最后一英里”數據給消費者的服務提供持久、實時的連接、高帶寬和分散的數據傳輸。
計算:支持元宇宙的計算能力的啟用和供應,支持物理計算、渲染、數據協調和同步、人工智能、投影、動作捕捉和翻譯等多樣化和高要求的功能。
虛擬平臺:沉浸式數字和通常是 3D 模擬、環境和世界的開發和運營,用戶和企業可以在其中探索、創造、社交和參與各種體驗(例如賽車、繪畫、上課,聽音樂),從事經濟活動。這些業務與傳統在線體驗和多人視頻游戲的區別在于,存在一個由開發人員和內容創建者組成的大型生態系統,這些生態系統在底層平臺上生成大部分內容和/或收集大部分收入。
交換工具和標準:工具、協議、格式、服務和引擎,它們充當互操作性的實際或事實上的標準,并支持元宇宙的創建、操作和持續改進。這些標準支持渲染、物理和 AI 等活動,以及資產格式及其從體驗到體驗的導入/導出、前向兼容性管理和更新、工具和創作活動以及信息管理。
支付:支持數字支付流程、平臺和運營,包括法定入口(一種數字貨幣兌換形式)到純數字貨幣和金融服務,包括比特幣和以太幣等加密貨幣以及其他區塊鏈技術。
元宇宙內容、服務和資產:與用戶數據和身份相關的數字資產(例如虛擬商品和貨幣)的設計/創建、銷售、轉售、存儲、安全保護和財務管理。這包含所有“建立在”元宇宙之上和/或“服務于”元宇宙的所有業務和服務,并且沒有被平臺所有者垂直整合到虛擬平臺中,包括專門為元宇宙構建的、獨立于虛擬界的內容平臺。
用戶行為:消費者和商業行為(包括花費和投資、時間和注意力、決策和能力)的可觀察變化,這些變化要么與元宇宙直接相關,要么以其他方式促成或反映其原則和理念。這些行為在最初出現時幾乎總是看起來像“趨勢”(或者,更貶義地,“時尚”),但后來顯示出持久的全球社會意義。
他討論了每個領域的進展,以及充分啟用和采用元宇宙作為移動互聯網繼任者的方法。
從虛擬到現實:隨著大型指揮所分解其物理足跡并依賴數字環境,諸如元宇宙之類的概念可以幫助參謀人員對現實世界的行動進行規劃
聯網
帶寬是當今戰場上的稀缺資源,需要技術突破才能完全啟用虛擬世界。然而,許多戰術場景可以受益于不是特別密集的信息,因此需要較少的帶寬來傳輸,例如地理空間位置、單位狀態摘要、當前目標等。此外,更密集的信息,例如用于訓練輔助目標識別算法的作戰區域3D 地形模型或未知敵方車輛的視頻,無需通過網絡實時發送。這將要求陸軍利用云服務,云服務不僅能高效地移動和處理信息,而且由情報部門控制,這些情報部門了解客戶請求或可能請求的數據和服務的信息價值。
關乎生死的一個關鍵問題是信息延遲。友方單位位置的潛在變化可能會導致整個元宇宙的決策瀑布式變化,并改變任務狀態的視角。為了做出更好的決策,陸軍必須創建一個超高效的網絡,只傳輸正確的相關信息。這種實時信息更新的概念是在虛擬世界中沉浸式硬件的關鍵組成部分,因為“數字孿生”士兵的表示和動作必須在連接到其共享空間的所有其他設備上同步。與商業世界不同,元宇宙戰場涉及戰斗人員試圖摧毀對手的網絡。
微軟飛行模擬器
流行的 Microsoft Flight Simulator 視頻游戲系列包括地球的“數字孿生”,結合地圖和衛星圖像,可以對天氣和空中交通、建筑物甚至樹木實時渲染。這是一個巨大的模型,對于戰術邊緣的受限帶寬來說是不切實際的,但是這個模型和其他類似的模型可以允許在更高的、云連接的梯隊或在本站上對車輛和武器效果進行超現實建模。NVIDIA 的 Omniverse等世界構建工具包有助于渲染新對象,其中包括材質、紋理和運動構建塊。甚至這些基于世界的模型的低分辨率版本也可用于概念演練或任務演練,無論單位是否位于同一地點。
想象一下:今天使用的沉浸式硬件幾乎完全掩蓋了用戶對現實世界的看法;最終,顯示器將需要在現實之上渲染內容或用合成內容替換所有內容之間進行動態調整。(由任務指揮戰斗實驗室提供)
虛擬平臺
整合軍用數字訓練、戰斗和企業級系統的精簡平臺不足以實現元宇宙。元宇宙要求士兵的數字存在超越不同的訓練平臺,并無縫集成到其他作戰工具中。這些工具還必須使用戶能夠從不同的角度與戰場數據進行交互,無論是在傳統的 2D 顯示器上還是從沉浸式共享虛擬空間。這將需要能夠使來自現實世界或模擬的數據在各種顯示媒體上無縫呈現的架構,無論它們是如何部署的。商業游戲世界一直在適應這一挑戰,支持在不同類型的硬件(如 PC 和游戲機)之間交叉玩同一游戲。
雖然化身的出現對我們的士兵來說可能不是那么優先,但數字資產可以以其他方式使用,這可能是有用的--例如,包括在一個人的身份系統偏好或自定義語言模型中,即使在用戶登錄一個新系統時也可以幫助人機合作。此外,一些游戲使一部分用戶能夠戴著虛擬現實設備從神一樣的俯視角度進行游戲,而其他玩家則化身為化身,從地面上以第一人稱觀看世界。像這樣的游戲概念似乎很適合在不同的梯隊中使用這種能力,在那里不同類型的數據和互動是必要的。
從戰術的角度來看,陸軍必須建立具有共同視野和感受的系統,無論系統是的佩戴方式或交互方式如何。士兵應該能夠以相同的配置文件使用他們的頭戴式顯示器、他們的手持系統和他們的桌面系統,并在這些系統間能夠以相同的角色輕松地切換。
硬件
Android Tactical Assault Kit (ATAK)等系統是一款裝在堅固外殼中的手持平板電腦或手機,可為作戰人員提供其作戰環境的數字化視角。ATAK 可以可視化 2D 和 3D 地圖,以及一系列圖形控制措施來表示友軍和敵軍的位置。雖然不像民用領域的消費類智能手機那樣無處不在,但這些設備代表了將物理和數字領域融合到一個手持套件中的首次嘗試之一。
然而,增強現實系統中的當前硬件限制了全息內容的視野質量。虛擬現實頭戴式顯示器提供高質量的視覺效果,但代價是幾乎完全遮擋了用戶對自然世界的看法。雖然陸軍開始評估在指揮所等不太致命的環境中使用虛擬現實,但沉浸式硬件的未來最終將融合到一個頭戴式顯示器中,該顯示器可以在現實之上的渲染內容或替換所有內容之間動態調整合成內容。這對于在未來的戰場環境中完全實現元宇宙是必要的。
結論
盡管推動了未來的發展,但我們也必須承認目前的技術仍然面臨著局限性--例如,訪問問題、延遲。這些問題不會因為升級到元宇宙而得到解決,必須隨著元宇宙的發展而得到解決。在規劃、準備、執行和評估行動方面轉向元宇宙模式,將使分散的工作人員能夠在一個協作的虛擬節點內更有效地同步作戰功能,這將與現有的實體指揮所相媲美。臨時會議可以超越簡單的電話和視頻會議,允許用戶占據一個包含所有相關數據的虛擬規劃空間來做出決定:一個顯示友軍和敵軍位置、情報產品、相對戰斗力、維持估計等的交互式三維共同作戰圖。
與人工智能一樣,元宇宙技術為解決戰場上的問題帶來了一套新的工具,包括當前和預期的問題。也像人工智能一樣,如果沒有標準和基礎設施來啟用這些工具,其結果將是零碎的和令人沮喪的。重要的是,陸軍要向前傾斜并認識到新技術的潛力,不僅因為它們在物資方面帶來了什么,而且還因為它們對我們未來的戰斗方式的影響。