亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

摘要

指揮偵察區域協調和控制環境網絡(CRACCEN)是加拿大國防研究與發展部(DRDC)-大西洋研究中心正在開發的決策輔助系統,旨在徹底改變加拿大皇家海軍(RCN)進行水下戰爭(UWW)的方式。本科學報告概述了CRACCEN系統的高級目標和要求,并審查了幾個研究領域,以確定開發該系統的適當候選技術。根據任務要求和UWW任務環境的特點,對各種潛在的顯示和輸入硬件技術進行了評估。審查結果表明,應采用能夠容納一組同時使用的桌面顯示器作為CRACCEN系統的中央顯示器,并有可能使用其他顯示器和顯示模式來增強UWW團隊的能力。建議與主題專家(SMEs)進一步研究,以驗證這些顯示器的可行性、可用性和附加值,并反復設計適合顯示器類型和CRACCEN用戶需求的界面。

對國防和安全的意義

皇家海軍有一個長期目標,即徹底改變WW的行為并使之現代化,而指揮偵察區域協調和控制環境網絡CRACCEN系統將在這個目標中發揮核心作用。為了進行CRACCEN系統的開發和原型設計,需要有適當的技術來適應任務的要求和任務環境的條件。本報告針對這些要求審查和分析了各種潛在的顯示和輸入技術,并為原型開發和未來研究提供了具體建議,以便最終整合到CRACCEN中。

1 引言

加拿大皇家海軍(RCN)正致力于水下戰爭(UWW)的革新和現代化。指揮部偵察區協調和控制環境網絡(CRACCEN)項目是實現這一目標的第一步。該項目不是對UWW系統的各個部分進行漸進式的改進,而是旨在重新思考現有的指揮和控制(C2)結構。雖然用革命性的新系統和結構取代現有系統和結構的潛力為精簡和改善UWW的行為提供了寶貴的機會,而不受現有系統的限制,但項目的開放式性質帶來了新的復雜性。

也就是說,這樣一個革命性的系統應該是什么樣子的問題是完全開放的。任何數量的現有的、新興的或未來的顯示和交互技術都可以應用于這個問題,并具有不同程度的有效性。為了進行CRACCEN系統的開發和原型設計,必須縮小設計空間,并選擇適當的技術。本科學報告針對CRACCEN系統要完成的任務要求,對現有的顯示和輸入技術進行了審查,并對技術選擇和未來研究提出了具體建議。

1.1 報告綱要

本報告的組織結構如下。

  • 第2節描述了CRACCEN項目和系統,并利用以前的工作來定義系統要求,為隨后的審查和分析奠定基礎。

  • 第3節討論了這次綜合審查所采取的方法。

  • 第4節回顧了可能應用于CRACCEN系統的技術。

  • 第5節評估了這些技術在兩類限制條件下的適用性:UWW團隊使用CRACCEN系統所要完成的任務的特點,以及艦載UWW任務環境的條件。

  • 第6節從綜合審查的結果中得出了顯示和輸入技術選擇的建議,并概述了驗證和建立這些建議所需的未來研究。

  • 第7節對CRACCEN系統的顯示和輸入技術選擇進行討論。

2 CRACCEN

在漫長的和平時期,在皇家海軍內部進行UWW需要最小的現代化。相比之下,在同一時期,技術領域發生了巨大的變化,因此進行UWW的環境也發生了變化。2017年,加拿大國防研究與發展部(DRDC)--大西洋研究中心對科學與技術總監--海軍發布的直接客戶支持任務做出了回應,該系統將使RCN計劃和進行UWW的方式現代化和革命化[1]。DRDC-大西洋研究中心的提案包括一個為期五年的系統研究和開發項目,以徹底改變現有的預測性態勢感知、戰斗空間管理、作戰計劃和任務執行的方法和程序[2]。

2.1 CRACCEN項目

早期的一份內部出版物將CRACCEN項目分解為可操作的工作分解要素(WBEs),涵蓋了徹底改變UWW行為所需的廣泛努力[2]。本報告屬于WBE 1:革命性C2系統的設計概念,其目標是為CRACCEN開發設計概念和工作流程,并確定可視化的最佳方法。CRACCEN系統的開發預計將遠遠超過本項目的五年時間框架,其目的只是為革新的WWW系統奠定基礎。在本報告中,對CRACCEN的提及是指預期的未來系統,而不是五年期項目。

2.2 CRACCEN系統

CRACCEN系統旨在通過自動信息整理、環境預測、實時建模和模擬工具以及新型決策支持工具來支持UWW指揮團隊[2]。目前WW指揮小組的規劃和決策結構是,小組成員操作各自的桌面軟件,手工整理數據以發展態勢感知(SA),并為作戰方案(COA)的開發和任務規劃編制自己的視覺輔助工具[3]。相比之下,CRACCEN系統的概念是成為一個中央協作環境,為指揮小組提供與其任務規劃和決策相關的所有信息,并支持小組討論、協作制定COA,以及建立和維護共享SA。

本報告的主要重點是CRACCEN的協作界面,供指揮小組使用。正如定向客戶支持的海軍命令所描述的,CRACCEN應涉及一個協作界面,能夠顯示動態(如海洋條件預測、環境風險評估、水下威脅軌跡)和靜態(如圖示沉船、海洋哺乳動物目擊、歷史測深)信息層,以便為UWW任務規劃和執行提供一個中央指揮和控制環境[4]。在本報告的范圍之外,該系統將更廣泛地涉及一個廣泛的信息骨干和一套算法,以支持這些數據的自動收集、整理、處理、分析、共享和動態可視化[2] 。

2.3 CRACCEN的系統要求

2.3.1 引出要求

可以采用一些半正式和描述性的分析來描述C2環境的性質,目的是為了改進C2工作系統。分層目標分析(HGA)確定了工作系統需要實現的目標,以支持其操作者[5]。因為HGA關注的是可能是非線性或平行的目標,而不是使用當前系統完成目標的線性任務流,所以它是一種理想的分析方法,可以為設計新的或革命性的系統(如CRACCEN)得出需求[6]。

過去的工作利用HGA[3][7][8][9]探討了RCN中UWW C2環境的性質。最近的一份報告具體確定了在設計CRACCEN時需要考慮的四個高層次目標[10]。為實現這些目標,對CRACCEN的要求描述如下。

1.評估準備情況。CRACCEN應自動收集和整理有關自身艦艇和任務組(TG)資產狀態(如位置、方位、武器狀態、傳感器狀態和定位)的信息,并在接到命令后,以易于解析和直觀互動的空間可視化媒介向UWW小組提供這些信息。

2.規劃和管理。CRACCEN應通過以下方式促進短期和長期規劃工作:a)自動收集和整理來自多個數據流的數據,以協助建立公認的海上圖景;b)使用人工智能(AI)預測數據流的未來狀態,并提出規劃建議;c)提供工具,幫助UWW團隊合作建立、可視化和頒布COA和計劃。

3.維護SA。CRACCEN應簡化SA的開發并使其自動化,以便在中央顯示器上向UWW團隊提供行動區(AOO)的實時概覽。這將減少相關信息被忽視的可能性,將認知負擔降到最低,并使團隊能夠專注于任務規劃和執行任務。CRACCEN中央顯示器顯示與SA相關的信息,也可以讓UWW團隊成員之間共享SA,從而促進COA的合作開發。

4.行動任務。CRACCEN應通過以下方式促進任務的執行:a)將多種信息來源(如水深測量、戰術、關于所看到的敵人行為的歷史數據、情報)納入預測敵方潛艇活動高風險區域的算法;b)使用人工智能預測以前看到的潛艇的未來位置;以及c)為傳感器和資產布置提出建議,以便最好地保護TG免受威脅。

這些高層次的目標之間存在重疊和相互依賴,它們共同闡明了CRACCEN的預定和預期用例。本報告的重點是能夠支持這些要求的顯示和輸入技術。

2.3.2 根據需求來限制顯示和輸入技術的選擇

可以在上述要求的基礎上建立技術選擇的初步約束。為了滿足CRACCEN的要求,至少需要一個中央顯示器;這個中央顯示器的確切性質和互動方法有待探討。由于WWW必然發生在一個三維(3D)空間,從水面到海底,所以也必須考慮三維顯示能力,以最好地支持SA。本報告將探討幾種三維顯示的方法,以確定其與CRACCEN整合的可行性。最后,UWW團隊的每個成員都是各自領域和角色的專家,他們需要在CRACCEN促進的合作工作中完成持續的個人工作。事實上,任務規劃和執行的合作工作取決于個人對問題的專業知識。因此,也應考慮將多個顯示器結合起來,靈活地融合個人和小組工作。

盡管與上級指揮部或其他TG成員進行遠程協作的能力可能是未來需要的一種能力,但目前的工作僅集中在同地辦公的情況下。

2.4 系統用戶

已經進行了任務分析、目標分解分析和任務分析,以確定預期使用CRACCEN的人員,并通過與主題專家(SMEs)的訪談加以證實[10][11] 。預計使用該系統的人員包括反潛計劃官員(ASPO)、反潛戰指揮官(ASWC)、指揮官(CO)、當前行動官員(COpsO)、未來行動官員(FOpsO)、水下部隊追蹤協調員(FTC-SS)、行動室官員(ORO)、聲納控制主管(SCS)和水下戰爭主管(UWWD)。這些用戶共同組成了UWW的指揮團隊,盡管所有這些角色都不可能同時參與規劃和決策。CRACCEN應能容納三到五個同時在同一地點的用戶,并能根據需要靈活地容納更多的用戶。

3 方法

本報告的中心研究問題可以概括為 "哪些顯示和輸入技術最適合于為WW指揮小組提供革命性的決策輔助工具的預期使用情況?" 即使在這種最簡化的形式下,這個問題也跨越了幾個學科,因為它必須考慮到顯示和輸入技術、要完成的任務的特點以及環境和其他實用的限制。其中一些學科包括C2、工程、人體工程學、人機交互、人類因素、團隊認知和心理學。因此,本報告的方法遵循綜合評論的方法,其目的是通過回顧和綜合現有的文獻,對一個主題產生新的框架和觀點[12]。當一個研究問題過于寬泛或跨學科,無法進行完全系統的回顧時,這種文獻回顧的方法特別有用。

研究問題(即,哪些顯示和輸入技術最適合于WWW指揮小組的革命性決策輔助工具的預期使用情況)可以分解為三個不同的部分,需要采用不同的文獻搜索和審查方法。(1)潛在技術的描述;(2)技術對團隊工作和協作的適用性;以及(3)技術對UWW團隊完成任務的船上環境條件的適用性。第5節綜合了所有三個方面的審查結果,可與附件A中提供的結果匯總表一起閱讀。

3.1 數據庫

綜合性審查所參考的數據庫有。電氣和電子工程師協會(IEEE)Xplore、Inspec、ScienceDirect、加拿大國防信息數據庫(CANDID)、國防技術信息中心(DTIC)和谷歌學術。

3.2 檢索參數

對于下面描述的所有文獻搜索,結果僅限于那些用英語寫的,并且在2010年至2022年之間發表的文獻,以確保調查結果與當前和未來的需求相關。不是來自同行評議的期刊文章、書籍章節、會議記錄或軍事報告的結果被放棄考慮。根據已發表的關于最佳實踐的文獻,對谷歌學術數據庫的搜索只限于前100個結果,按相關性排序[13]。對DTIC技術報告數據庫的搜索也同樣受到限制,因為該數據庫由谷歌提供,即使搜索結果超過100條,也不會顯示超過前100條按相關性排序的結果。對于所有其他的數據庫,沒有這種限制。

對于所有的搜索,感興趣的關鍵詞必須包含在摘要或文件標題中1。閱讀所有結果的標題和摘要,評估其相關性,并在認為不相關的情況下予以舍棄;例如,在搜索中產生的關于某項技術是否適合團隊工作的結果,如果實際上與團隊活動無關,則予以舍棄。保留下來的項目被充分閱讀,并進一步篩選其相關性。在閱讀過程中,掃描了參考文獻列表,以尋找數據庫搜索中沒有發現的其他相關參考文獻。這些二手資料被標記出來,并以類似的方式進行評估;這些二手資料不考慮出版年份,因為它們通常提供背景信息或更多的基礎性證據。

在某些情況下,在數據庫搜索中發現的文章顯示了與研究問題直接相關的專門議題的會議記錄(例如,IEEE水平互動人機系統國際研討會)。在這些情況下,對會議記錄進行了手工搜索,以獲得更多的相關結果。

3.3 審查主題

3.3.1 對顯示和輸入技術的審查

對于這方面的審查,潛在技術領域來自第2節討論的系統要求。也就是說,CRACCEN將需要至少一個中央顯示屏,并有可能將顯示屏增加到三維空間。技術審查的結果可在第4節找到。

對顯示技術的描述是從現有的評論文章中發展出來的,這些文章用于定義可能的技術空間。在描述二維(2D)顯示技術時,沒有參考任何評論文章,因為該技術已經很成熟了,在以后考慮輸入方法和任務需求時,會出現最有意義的差異。兩篇評論文章為三維顯示技術的回顧提供了基礎[14][15]。在討論擴展現實時還參考了其他評論文章,其中包括增強現實(AR)和虛擬現實(VR)頭戴式顯示器(HMD),以及手持設備的AR[16][17]。

3.3.2 顯示和輸入技術對團隊工作的適用性

在這一方面的審查中,使用關鍵詞 "團隊工作"、"團隊"、"協作 "和 "小組工作",對具體與團隊工作有關的個別技術或技術類別進行了搜索。為每項技術選擇的其他關鍵詞列于表1。這一部分的審查結果收集在第5.1節中討論。

表1:用于審查顯示和輸入技術是否適合團隊工作的搜索詞列表。

主題 關鍵詞
顯示屏尺寸 顯示尺寸、屏幕尺寸、大型顯示器
顯示方向 桌面、水平顯示、水平屏幕、垂直顯示、垂直屏幕、顯示方向、屏幕方向
鼠標輸入 鼠標輸入、電腦鼠標、多用鼠標
筆輸入 手寫筆,手電筒,筆輸入,多筆,筆觸摸
觸摸輸入 觸摸屏,觸摸屏,觸摸輸入,多點觸摸
軌跡球輸入 軌跡球
文本輸入 文本輸入,鍵盤,語音識別,手寫
3D顯示器 3D眼鏡,眼鏡,3D顯示,視差顯示
擴展現實 虛擬現實、增強現實、擴展現實、共處一地、共處一地

本綜述的范圍集中在真實人類的同地協作上,因此放棄了與遠程協作和人類-機器人協作有關的結果。大部分關于擴展現實技術的搜索結果都與遠程和/或網絡協作設置有關。因此,在這個特定的搜索中加入了額外的關鍵詞 "共同定位或共同定位",以排除這些結果,并更好地集中在感興趣的結果上。

3.3.3 UWW任務環境的顯示和輸入技術的適用性

在這方面的審查中,使用關鍵詞 "人機工程學",對個別技術或技術類別的人機工程學特性進行了搜索。每個技術或技術類別所使用的其他關鍵詞與表1中給出的相同。請注意,在這些搜索中,為了獲得更多的結果,出版年份的納入范圍被擴大到2000-2022年。

這些搜索還輔以針對眼睛疲勞和網絡病主題的搜索,這些都是已知的問題,特別是對于VR和AR HMD來說。請注意,對于這些有針對性的搜索,作者把重點放在比較技術的實驗和評論研究上,而不是測試可能的病因或探索實時檢測和預測現象的廣泛的實驗研究。最后,有針對性地搜索了船上UWW任務環境的已知環境條件對顯示和輸入技術的影響:船舶運動和振動。

這些補充搜索的關鍵詞在表2中給出。這一部分的審查結果收集在第5.2節中討論。

表2:用于審查UWW任務環境的顯示和輸入技術的適用性的補充搜索詞列表。

主題 關鍵詞
眼睛疲勞 眼睛疲勞,視覺疲勞,虛擬現實,增強現實,HMD,頭戴式顯示器
暈機 暈機,模擬器暈機,虛擬現實,增強現實,頭戴式顯示器,頭戴式顯示器
船舶運動和振動 船舶運動,物理運動,發動機振動,運動技能,手動控制,輸入設備,文本輸入,虛擬現實,增強現實,人為因素

4 對顯示和輸入技術的審查

本審查概述了CRACCEN可能考慮的顯示和輸入技術。本節無意對所有可能的顯示和輸入技術進行深入審查,而是對許多至少大致符合先前確定的系統要求的技術進行簡要概述,以便在第5節中更仔細地探討它們是否適合CRACCEN。

4.1 二維顯示器

二維顯示器是人們熟悉的、無處不在的技術,有各種各樣的尺寸。對于CRACCEN來說,中央二維顯示器的目標尺寸是大到足以容納多個用戶,但又不至于大到不適合安裝在軍艦上。二維顯示器的方向也同樣可以變化,從垂直方向到水平方向,或以垂直和水平之間的某個角度傾斜。

大型顯示器的尺寸和方向對一些設計限制有影響,這些限制將在第5節中考慮,包括有多少用戶可以同時觀看和與顯示器互動,各種輸入方法的可行性,以及顯示器的人體工程學。水平方向的二維顯示器在面向多個用戶時通常被稱為桌面顯示器,因為它們允許用戶站在或坐在一個桌子大小的水平顯示器周圍,從上面向下看信息。桌面顯示器經常被用來以數字方式重現圍繞物理桌面的協作工作的體驗。在本報告中,"桌面顯示器 "一詞將被用來指代這種水平方向的二維顯示器。

4.2 三維顯示

從水面延伸到海底的UWW場館是三維的。因此,二維顯示器準確表現AOO的能力有內在的限制。UWW團隊目前使用各種二維圖形系統進行操作,但CRACCEN的開發代表了一個徹底改變和簡化工作流程的機會。盡管三維空間可以從二維視圖的組合和/或操作中推斷出來,但提供一個直觀的三維視圖可能會減輕WWW團隊的認知負擔,并釋放出額外的精神資源來完成他們所需的復雜的任務規劃和執行任務[18]。以下是對三維顯示技術的簡要概述,這是從最近的兩篇評論文章中整理出來的[14][15]。雖然許多三維顯示技術的開發只是為了顯示目的(即不考慮用戶互動),但下面的重點是那些已經開發了互動機制的三維顯示技術,以滿足CRACCEN的要求。

也許最熟悉的3D顯示器類型是波長選擇立體系統,它向用戶展示兩個略微偏移和色變的圖像。用戶戴上特殊的立體眼鏡,過濾信息,使每只眼睛只能看到特定的波長(即顏色),當兩幅圖像被大腦合并時,其效果就是三維視圖[19]。類似的系統使用偏振鏡來過濾掉每只眼睛的不同圖像,每幅圖像要么同時呈現[20],要么非常快速地連續呈現[21]。

自動立體(AS)系統通過向每只眼睛呈現略微不同的信息來喚起深度幻覺,從而允許在沒有任何特殊眼鏡的情況下對3D場景進行立體觀看。這些系統可以是時間順序的,以快速交替的順序從兩個不同的方向(即分別朝向一只眼睛)呈現光線[22];或者是時間平行的,在觀看者和顯示器之間有一個層,同時向每只眼睛呈現略有不同的畫面。雖然AS消除了對專門的可穿戴設備的需求,但它往往需要其他高度專業化的硬件(例如,[23][24])。其他的AS三維顯示系統產生多個不同的、略微偏移的圖像,每個圖像只在有限的觀察區域內可見,因此每次只對一只眼睛可見[25][26][27][28]。當用戶移動她的頭部時,她就會在觀察區中移動,從而改變三維物體的視圖。最后,容積式三維顯示器通過照亮懸浮在半空中的容積式像素,在真正的三維空間中呈現圖像,通常是在一個封閉的表面內[29]。體積顯示需要專門的硬件(即顯示體積),并產生高計算成本。

4.3 擴展現實顯示

擴展現實是一個總括性術語,包括虛擬和現實環境的結合,特別強調沉浸感和互動:擴展現實技術允許用戶不僅查看虛擬的三維信息,而且在真實或虛擬環境中移動時與真實或虛擬物體互動。

根據[15]的分類法,虛擬現實(VR)和增強現實(AR)頭戴式3D顯示器(HMD)是采用先進立體眼鏡的雙視角立體顯示器。然而,它們在此類技術中有些特別,因為它們提供了完全的視差體驗,其中3D視圖隨著頭部的水平和垂直運動而變化。因此,近年來它們比非沉浸式3D顯示器獲得了更多的關注和研究努力。下文將單獨考慮每一種,以及手持式AR和空間AR。

4.3.1 虛擬現實HMDs

VR HMDs將一個虛擬渲染的環境投射到安裝在用戶眼前的小型光學顯示器上,以獲得完全沉浸式的體驗[14][16]。在HMD內,用戶不能看到外部世界,包括他們自己的身體和手,除非外部世界的物體被跟蹤并在虛擬世界內再現。因此,用戶通常被賦予相機追蹤的手持遙控器,以便與虛擬世界互動。VR HMD通常通過直接放置在HMD上的揚聲器向用戶展示聽覺信息。

目前一些常用的商業VR HMD系統是HTC Vive(HTC)和Oculus Rift(Meta Technologies, LLC)。這兩個系統目前都需要將HMD,也就是用戶的頭部,與一臺功能強大的電腦進行物理連接,并且建議每臺電腦只能連接一個頭顯,以確保顯示的虛擬環境的低延遲。這兩種系統也都采用了手持式控制器,使用戶能夠瀏覽虛擬環境并與虛擬物體互動。一些VR系統采用頭戴式攝像機,而另一些則需要一套外部攝像機來跟蹤頭戴式攝像機和控制器的運動。外部攝像機每次移動時都必須仔細校準,因此一般建議在校準后保持在一個地方。其他消費級的VR HMD系統已經被開發出來,在不使用外圍攝像頭或系繩的情況下也能發揮作用(例如,Oculus Go、Oculus Quest、Lenovo Mirage)。

4.3.2 增強現實HMDs

AR HMDs是將虛擬渲染的元素疊加到用戶對真實世界的看法上的設備[14][16]。面向前方的攝像頭跟蹤現實世界環境的三維結構,面向用戶的傳感器跟蹤頭部和/或眼睛的運動,使用戶能夠通過在物理空間中的移動從各個角度觀看三維物體。面向前方的攝像頭也可以用來跟蹤用戶的手部運動,從而使他們能夠操縱虛擬物體。與VR HMD一樣,AR HMD通常通過設置在HMD耳朵附近的揚聲器直接向用戶呈現聽覺信息。

與VR HMD一樣,AR HMD也可以在用戶眼前有一個完整的視頻屏幕,然后呈現真實世界的視頻資料并與虛擬物體重疊。然而,更常見的是,AR HMD屏幕是透明的,允許直接看到現實世界,然后在一定的視覺范圍內與虛擬物體重疊。微軟Hololens2是目前最常用的透明AR HMD的例子。

4.3.3 手持設備的AR

用戶可以通過舉起手持設備(如智能手機、平板電腦)作為虛擬增強環境的窗口來體驗視頻傳輸的AR,而不是佩戴HMD[16][17]。設備中面向前方的攝像頭可以感知真實的三維環境,并將實時視頻傳輸到手持顯示器上,與虛擬渲染的物體一起呈現。當用戶(或設備)在物理空間中移動時,來自設備的加速計和陀螺儀數據幫助系統跟蹤運動并準確地渲染三維物體,而設備的觸摸屏允許用戶與顯示在上面的虛擬物體進行互動。

4.3.4 空間AR

空間AR,也被稱為有形AR,使用相機和投影儀系統來跟蹤環境中的物理對象,并將虛擬信息投射到它們身上。這使得用戶可以有形地查看和互動物理物體,這些物體被數字增強了額外的視覺信息,不需要眼鏡、HMD或專門的顯示器[17][30]。該技術可用于在實物上顯示補充文字注釋,在無紋理的物體上展示紋理,為用戶提供進入物體三維內部的虛擬視圖,或將非數字物體(如一張紙)轉化為數字顯示。常見的空間AR系統采用了一個桌面沙盤,用戶可以在沙盤中移動沙子以使物理景觀變形,環境細節可以通過光學方式投射在沙盤上。

空間AR對建筑和設計領域特別有用(例如,能夠與新產品的快速數字模擬進行物理互動),也可用于某些培訓目的(例如,能夠將3D器官投射到物理假人上進行手術培訓)。然而,它對WW戰斗空間的有用性是值得商榷的,因為期望的互動目標是整個AOO的表面和次表面。盡管將WW的戰斗空間投射到一個大的物理3D盒子上可以幫助一般的SA,但用戶的互動將受到物理盒子的外部尺寸的限制。操作的自由度將不足以支持探索和與該三維空間的互動,以進行任務規劃和執行。因此,本報告中沒有進一步考慮空間AR。

5 對技術適用性的審查

如第2節所述,CRACCEN的要求建議至少有一個用于規劃和決策的中央二維團隊顯示屏,一種納入互動三維信息的方法,以及納入多個顯示屏的可能性。本報告的主要考慮是顯示和輸入技術對團隊工作和協作的適用性。次要考慮的是每種技術是否適合于船上UWW任務環境的特殊限制。技術對個人工作的適用性被認為是一個基線,特別是涉及到輸入方法和人體工程學的選擇,這在協作環境中并不經常被研究。附件A中列出了一個總結研究結果的表格,這有利于在不同技術之間進行直接比較。

5.1 顯示和輸入技術對團隊工作的適用性

5.1.1 二維中央顯示屏

同時使用CRACCEN的人數可能會對適當的二維中央顯示技術產生重要制約。早期的任務、使命和工作分析結果表明,CRACCEN應該能夠容納三到五個同地的中小企業,并根據需要為更多的用戶提供空間[10][11]。由于預計多個用戶將同時與CRACCEN互動,應考慮將更大的顯示器(即大于32英寸)作為CRACCEN的中心顯示技術。最近對大型顯示器的審查發現,在促進交流、協調和工作空間意識方面,大型顯示器比更傳統的單個顯示器(如臺式機、筆記本電腦)有明顯的優勢[32]。直接比較 "小"(17英寸)和 "大"(33英寸)顯示器的研究表明,大顯示器比小顯示器更容易支持協作任務活動的公平分配[33](參見[34],該研究發現較小的中央顯示器增加了交流的數量,這可能是對較小和不太有效的信息顯示的一種補償)。手持二維顯示設備本身并不是協作工作的理想選擇,因為相對于較大的共享工作空間而言,它們阻礙了交流,降低了工作量的公平性,也降低了解決方案的質量[35]。海軍艦艇上的空間限制通常為中央二維顯示器的尺寸提供了實際的上限,盡管以前的工作表明,全墻(如120英寸)顯示器可以改善陸上指揮中心的軍事指揮團隊的共享SA[36][37]。

屏幕顯示方向包括垂直、水平(如桌面),或介于垂直和桌面方向之間的傾斜顯示。需要用戶花大部分時間與系統互動的任務可能更受益于垂直顯示,而需要大量人際互動的任務,包括小組情景理解、討論和非平行工作,可能更受益于桌面顯示[38]。事實上,據報道,桌面顯示器通常能夠自然而舒適地支持高效的協作和面對面的交流,通過利用熟悉的圍繞物理桌子的協作模式,并結合自然的交流模式來促進知識轉移[33][39][40][41][42][43][44]。在屏幕的任何邊緣工作的能力也允許對個人的工作空間進行劃分,這些空間以后可以合并為小組級活動[45][46]。關于其他用戶行動的反饋通知可以減少工作的冗余,并在這種平行任務中增加SA[47]。相比之下,圍繞垂直屏幕的交流不那么自然,而且更加不對稱(例如,一個人在說話,其他人在聽),并且通常與角色轉換、想法探索和他人意識的減少有關[39](參見[48])。

垂直顯示器更適合于時間較短、用戶較少的重點任務,因為垂直方向限制了用戶與屏幕互動而不互相碰撞的能力,而桌面顯示器則更適合于持續時間較長、需要更多討論的任務[33]。一些研究表明,在少數合作者之間共享的全墻顯示器并不像較小的垂直顯示器那樣對合作工作帶來限制[49],這可能是由于增加了表面積和交流空間。對介于垂直和桌面方向的傾斜屏幕的研究較少。盡管最初的證據表明,對于一對合作的用戶來說,傾斜的屏幕可能比垂直和桌面的屏幕更受歡迎[50],但目前還不清楚這種偏好是否預示著更好的表現,也不清楚這種偏好是否對兩個以上的用戶之間的合作有效。

盡管桌面屏幕對協作工作有明顯的好處,但必須注意的是,將用戶分布在桌面屏幕的所有邊緣會對顯示元素的方向產生復雜的影響[51][52]。在桌面顯示器的用戶界面設計中,需要考慮到方向問題,以確保多個用戶能夠有效地理解、交流和協調所呈現的信息[53]。文本信息的方向對桌面顯示器來說是一個特別的挑戰,因為文本相對于讀者的方向對閱讀速度和準確性有很大影響。然而,在水平觸摸顯示器上存在旋轉和翻譯數字對象的解決方案,無論是手動還是通過檢測用戶的傳感器自動進行[54][55]。當需要呈現的主要信息是空間或圖形而不是文字時,用戶在桌面顯示器周圍的方向就不那么令人擔憂了。然而,值得注意的是,研究表明,群體傾向于聚集在桌面顯示器的一個邊緣,以分享二維地圖的共同視角[56],因為當用戶從不同角度觀看地圖時,他們會發現空間導航是混亂的[57]。

CRACCEN系統可以具有靈活性,允許中央二維顯示器在垂直和桌面方向之間轉換,以適應不同的任務要求[58]。

5.1.1.1 二維顯示器的輸入方法

輸入法是指允許用戶與顯示器上的信息進行交互的技術和機制。輸入方法可以包括用戶的動作和顯示器之間的直接映射(例如,直接觸摸屏、筆式手寫器6),也可以是間接映射,即用戶的動作被一些設備捕捉,并轉化為顯示器上的動作(例如,鼠標、軌跡球)。

對單個用戶的直接和間接輸入法進行比較,直接觸摸輸入更快、更準確,相對于鼠標輸入來說,當任務是雙手操作時,直接觸摸輸入是首選。相比之下,在大多數單點交互的研究中,所有指標都普遍偏向于鼠標(例如,[59][60]),除非任務涉及繪畫或游戲時[61]。[62]發現相對于鼠標和手寫筆輸入,單點觸摸輸入的速度提高了,但準確度卻降低了。對于要求高精度的任務,鼠標輸入通常比觸摸輸入更受歡迎[59][62][63],除非需要操作三維信息[64]。當一項任務不需要高精度時,鼠標輸入比直接觸摸輸入要慢[65]。

鼠標輸入的熟悉程度可能是上述許多比較中的一個因素,因為觸摸輸入的準確性似乎會隨著經驗的積累而提高[66]。事實上,最近的研究表明,在某些任務中,觸摸輸入和鼠標輸入的差別不大,這也許反映了自手持觸摸設備的商業化普及以來,公眾對觸摸屏技術越來越熟悉[67]。對直接觸摸輸入的各種基于軟件的調整顯示,有希望克服其對小目標的不精確性[68]。筆觸也可以提供更好的精確度,因為它們的接觸點更小,產生的遮擋和偶然的觸摸比手指更少[62][69][70],但與手指觸摸相比,其代價可能是速度降低[71]。當追蹤筆在表面上懸停時,納入視覺反饋(例如,與鼠標光標相當)可以略微提高速度,并極大地提高精確度。

在大多數任務中,軌跡球運動比傳統的鼠標運動既慢又不準確,因為很難將軌跡球的旋轉運動轉化為二維顯示器的線性空間[73] 。在更大的顯示器上,保持對間接輸入映射的光標的跟蹤可能被證明是一種挑戰,特別是當鼠標或軌跡球的加速度被設置為高時[74]。當輸入設備的加速度被設置為低時,在大型顯示器上移動光標會變得很乏味。有證據表明,在大屏幕上高速移動時,軌跡球有優勢,但用戶在放慢速度選擇目標時,速度和準確性仍然會下降[75]。

直接觸摸輸入對于大型顯示器來說有其自身的缺點。例如,用戶發現隨著顯示器尺寸的增加,拖動和旋轉物體的任務更加困難[76]。用戶與屏幕上的信息互動的能力也必然受到她的觸及范圍的限制,而這又受到顯示器方向以及她是坐著還是站著的限制[77]。外部跟蹤攝像機可以與基于手勢的輸入一起使用,以擴大在大型顯示器上的觸及范圍[78],或者識別和區分個別用戶的輸入[79]。筆觸也可以用來區分多個用戶的同時輸入。

最后,鼠標和軌跡球輸入的相對性在桌面顯示器上變得不那么直觀,因為用戶可能位于屏幕的任何邊緣,這樣光標的相對運動可能與用戶視角下的鼠標或軌跡球的移動方向不一致。對于CRACCEN的多用戶設置來說,至關重要的是,當使用多個間接輸入時,用戶很難定位彼此的光標并跟蹤運動[38][80][81][82]。

與單鼠標設置相比,多鼠標也可能降低他人意識和協作,而傾向于分而治之的策略[83](參見[84],它顯示了多鼠標在墻壁大小的顯示器上的混合焦點協作任務的潛在作用)。相比之下,直接觸摸輸入能提高協作任務中的他人意識,因為可以很容易地看到他人與顯示器的互動[82][85][86][87] 。同樣,與帶鍵盤的小型筆記本相比,團隊使用單個平板電腦時,語言和非語言交流都得到了改善[88],這表明無論屏幕大小如何,直接觸摸輸入對團隊工作的好處可能都是真實的。事實上,與間接(如鼠標)輸入相比,直接觸摸和筆輸入為協作顯示器周圍的人際互動提供了更好的支持,因為它們允許做手勢,更輕松地意識到其他用戶的行動,以及對意圖進行更自然的推斷[80][81](參見[89],該研究顯示在桌面顯示器的鼠標和觸摸輸入之間沒有協作任務表現或個人偏好的差異)。與單次觸摸、單次鼠標和多次鼠標輸入相比,圍繞桌面的直接多點觸摸特別有利于交流和公平協作[90]。目前可用的觸摸屏支持高水平的多點觸摸(例如,多達30個以上的同時觸摸輸入),允許多個用戶直觀地同時與顯示器互動,無論是否有筆觸的幫助。

5.1.1.2 二維顯示器的文字輸入

盡管對指揮小組成員進行的各種任務分析表明,CRACCEN的使用不會涉及大量的文字輸入[10],但用戶可能還是有必要輸入數據、注釋信息或互相輸入簡短的說明。

一般來說,物理鍵盤提供了最熟悉的文本輸入方法,因此無需培訓就能產生最快和最準確的結果。然而,多用戶與顯示器的互動需要多個物理鍵盤,這將占用空間并使工作站雜亂無章,或者需要一個可以輪流使用的單一鍵盤。對于垂直方向的顯示器,物理鍵盤的位置是不言而喻的,因為將鍵盤放在垂直顯示器的前面符合人體工程學。然而,對于桌面顯示器來說,物理鍵盤的適當位置并不明顯,因為用戶可以在任何邊緣與桌面顯示器互動。

物理鍵盤的另一個選擇是數字觸摸或軟鍵盤,它們可以與任何觸摸顯示器一起使用。與物理鍵盤不同,軟鍵盤可以旋轉、移動和調整大小,以適應用戶在垂直或桌面顯示器周圍的需要,而且多個軟鍵盤可用于同時進行文字輸入任務。因此,軟鍵盤可能比物理鍵盤更適合在大型顯示器上進行協作工作,盡管在設計階段應該考慮提高速度和準確性的方法。例如,可用性研究發現,軟鍵盤產生的速度和準確性比物理鍵盤低,這可能是由于缺乏物理按鍵的觸覺反饋[91][92]。基于字母預測算法的動態調整按鍵大小,在提高速度和準確性方面顯示出一定的前景[93],正如根據個人的人體工程學習慣自適應地調整按鍵間距[94][95]。應注意盡量減少輸入延遲,并在可能的情況下,引入其他方式的按鍵反饋(如聲音、振動),以提高性能和可用性[96][97]。

軟鍵盤也可以通過鋼筆觸摸來激活,盡管相對于使用所有十個手指來說,這大大限制了輸入速度。基于手勢的解決方案允許用戶在移動視覺呈現的字母時,無需抬起手指或手寫筆就能打字[98]。然而,由于這些鍵盤以旨在提高手勢流暢性的布局(即圓形布局)來呈現字符,它們并不熟悉,因此難以使用[99]。

在觸摸表面上用筆式或手指自然書寫,可以實現直觀的文字輸入方法,而且手寫識別算法現在已經足夠先進,可以提供快速而準確的輸入處理。值得注意的是,用鋼筆手寫的速度和準確性要比用指尖手寫的高得多[100]。然而,這種方法的速度受限于人類手寫的速度,使其明顯慢于其他文本輸入方法[91][99]。因此,手寫文本輸入可能適用于簡短的注釋,但不太適合較長的條目。

語音識別軟件采用自然語言處理來聆聽和解釋語音,是另一種直觀的文本輸入方法,對于短信息來說,可能比打字有好處[91][101]。然而,這種方法在CRACCEN中的可行性不太樂觀,因為該軟件需要能夠在環境噪音大、領域特定術語和縮略語多的環境中識別和區分多個用戶。協作環境中的語音識別軟件的一個主要障礙是,系統需要區分用于系統的口頭輸入和隊友之間正在進行的交流[102]。

5.1.2 納入三維信息

由于UWW是在三維空間中進行的,CRACCEN應該納入一些三維可視化和與AOO互動的能力。第4節概述了幾種潛在的三維增強方法。下面將簡要討論3D顯示的適用性,然后再具體討論VR和AR顯示,對其在團隊工作中的應用還有很多研究。

5.1.2.1 立體和自動立體的三維顯示器

總的來說,很少有工作直接研究多人同時使用立體和自動立體三維顯示的問題。然而,從單個用戶對這種顯示的用戶體驗中可以推斷出一些結論。

與通過立體眼鏡觀看的3D顯示器的互動面臨著3D圖像的虛幻性帶來的復雜問題:雖然圖像是3D的,但用戶可以與圖像互動的表面仍然是二維的。這對觸摸輸入的準確性有影響[103],因為用戶不能同時將目光集中在屏幕表面的手指/手指關節和出現在屏幕前后的物體的三維圖像上[104]。其結果是,她的手指/腳趾或三維圖像會顯得模糊和加倍。為了解決這個問題,可以用跟蹤手/手指運動的攝像頭來支持半空中的三維觸摸[105][106][107][108][109]。然而,通過立體眼鏡看到的圖像是扭曲的,當以不同于正面和中間的垂直或水平角度觀看時,會引起用戶的不適[110]。這種局限性使人們對立體眼鏡在多個用戶圍繞顯示屏互動時的可行性產生了疑問,特別是在桌面顯示屏所需的角度上。

其他技術,如Euclideon Holographic Table(Euclideon Pty Ltd),允許多個佩戴特殊立體眼鏡的用戶以模仿全息技術的方式觀看詳細的三維物體并與之互動(另見[111][112])。三維圖像從桌面表面投射出來,攝像機跟蹤用戶的眼鏡,以便在他們在桌子上移動時顯示正確的觀看角度。多個用戶能夠同時看到不同的角度,因為計算機為所有用戶在各自的光頻范圍內向桌子上投射適當的視角。用戶的眼鏡會過濾光線,以便只看到適合其視角的頻率范圍。此外,追蹤式測針允許多個用戶與3D圖像互動。

自動立體視覺(AS)系統在可以準確觀看三維物體的 "甜蜜點 "的數量上是有限的[15];因此用戶數量是有限的,觀看角度也受到限制。最近的創新加入了眼睛或頭部追蹤,以調整顯示器,使 "甜蜜點 "隨用戶移動[113],而多用戶追蹤的進一步創新使AS的三維視圖可以同時進行[114][115]。在所有情況下,當屏幕表面與用戶的臉部大致平行時,這些技術的效果最好,因此對顯示方向和多個用戶的分布有限制。因為它們依賴于二維顯示表面,AS系統通常對用戶的交互有同樣的限制,就像立體眼鏡一樣,盡管在運動追蹤的空中手勢輸入方面已經顯示出一些前景[115]。相比之下,體積顯示器,即像素懸浮在一個封閉的三維表面內的半空中,對交互沒有同樣的限制。用戶可以通過觸摸外殼的外表面與三維圖像進行有限的互動[29],而最近的創新則允許通過運動追蹤的手勢輸入[30]或角度和壓力敏感的手寫筆輸入[116]實現更高層次的互動。

5.1.2.2 擴展現實顯示器

VR HMD已經顯示出在協作規劃任務中增強SA的一些前景,作為對傳統的二維地圖規劃的補充[117]。事實上,VR HMD系統經常被提議用于遠程協作,因為它們允許共享對虛擬環境的認識,并促進其他困難的遠距離互動(例如,[118][119])。然而,這種系統對同地協作的能力造成了限制,因為外部世界,包括一個人的合作者,都被遮蔽了,被全視角的虛擬顯示所取代。與真實環境中面對面的協作工作相比,使用VR HMD的協作工作受到了溝通不暢和碰撞的影響[120]。這是由于無法看到合作者的行動、目光、動作和非語言線索。其結果是,與透明的AR HMD相比,一些協作任務的表現有所下降[120]。通過跟蹤用戶的身體運動,并將每個用戶的數字頭像納入虛擬世界,可以在一定程度上緩解這種影響[121][122]。但是重要的線索,如凝視方向,不容易從這樣的化身中讀出,它們可能無法幫助任務執行[123]。其他解決這些限制的方法是將用戶的指向(例如,通過手指或輸入設備)渲染成共享虛擬環境中的可見光線,或者采用算法將不同用戶的視圖結合起來,以獲得協作虛擬環境的更完整的視圖[124]。

當需要完成的大部分工作是松散耦合的個人工作時,VR HMD可能更合適,其中穿插著短時間的討論和緊密耦合的合作[125]。一些研究提出將單個VR HMD與手持AR設備上的虛擬場景的次要視圖結合起來,這產生了與兩個VR HMD的設置類似的交流和性能結果[126](也見[127][128][129])。關于這種不對稱使用VR HMD的研究仍處于早期階段,并可能很快為不同風格的協作工作提供不對稱設置的指導[130][131][132]。

相比之下,微軟HoloLens2等透視AR HMD允許多個用戶在同一空間內安全互動。AR HMD的同地協作使用已經被證明可以同時容納八個以上的用戶[133]。事實上,文獻推薦了透明的AR HMD,以便在共處一地的合作用戶之間進行成功和安全的交流[120][134]。多個AR-HMD設置支持每個:

1)緊密耦合的交互,每個用戶都可以操縱同一個三維場景(例如,[31][134]);2)驅動-跟隨的交互,其中一個用戶主動控制場景,其他用戶只是查看正在進行的改變(例如,[136]);以及3)松散耦合的交互,其中每個用戶操縱自己的獨立視圖(例如,[137])。這種在多層次交互性之間切換的能力為協作工作提供了重要的靈活性。與VR HMD一樣,使用AR HMD的協作和交流可以通過將用戶的點或目光渲染成共享虛擬環境中的可見光線而得到促進[138]。

與VR HMD相比,使用AR HMD完成任務的用戶對現實世界保持更大的意識,并且與不使用任何HMD完成相同任務的水平相當[139]。AR HMD系統減少了任務空間和交流空間之間的分離,促進了自然的交流線索,以改善任務表現和交流指標[140][141]。此外,AR HMDS的透視特性允許用戶之間繼續互動和協作,即使有些人沒有戴HMD[142]。相對于沒有AR HMD的團隊來說,這種在團隊中不對稱地使用AR HMD可能事實上提高了溝通質量[143]。研究表明,在由消防員、警察和軍事規劃人員組成的共處一地的團隊中,AR系統比傳統的SA和規劃方法更具優勢[144]。這一用例與CRACCEN的預期應用有明顯的相似之處。同樣,美國海軍和陸軍最近也展示了AR HMD作為協作指揮和控制任務的有用工具[145][146]。

AR HMD可能特別適合與桌面顯示器結合使用,這樣用戶就可以在桌面上充分移動,從各個角度觀看3D場景,而不會失去對桌面或現實世界中的合作者的視線(例如,[147])。這種設置也將解決桌面顯示器上文本方向的復雜問題,因為AR HMD可以以適合每個用戶的方向呈現文本。這種組合得益于AR提供的豐富的深度線索來實現信息的可視化,以及桌面顯示器上觸摸輸入的便利性和熟悉性[137]。它已被證明是城市可視化[148][149]、建筑設計[150]和空中任務監測[134]的有用組合,所有這些都涉及到三維物體(即建筑物、飛機)和三維空間從地面水平表面延伸的可視化。UWW同樣可以從AR HMD和桌面顯示器的結合中獲益,因為這個領域的SA涉及到3D物體(即船舶和潛艇)的可視化和從海底表面延伸的3D空間。

手持式AR提供了HMD的替代方案,盡管通過平板電腦與3D物體的互動已被證明比AR HMD更慢、更耗費體力,也更不可取[151]。對用于協作導航任務的手持式AR的研究發現,與傳統的二維虛擬地圖相比,手持式AR地圖在促進交流、建立共同理解和鼓勵討論方面具有明顯的優勢[152]。同樣,允許對一個三維物體進行單獨操作的視圖可以幫助教學和學習[153]。然而,用于小組工作的手持式AR可能與較高的工作量有關,特別是對于復雜的問題,這反過來會阻礙交流和合作[154]。事實上,雖然VR HMD在促進合作者之間的有效溝通方面不如完全透視(如AR)HMD[120],但與VR HMD相比,手持式(如視頻傳輸)AR的任務和溝通性能都受到影響[126]。關于合作任務環境中的混合現實和增強現實的全面回顧,見[155][156]。

5.1.2.3 3D顯示和擴展現實的輸入方法

當3D信息呈現在2D顯示器上時,存在幾種熟悉的輸入方法。直接觸摸(例如,在手持AR設備上)和間接的鼠標拖動可以用來在3D空間中平移、傾斜和旋轉,而游戲控制器通常使用雙操縱桿來促進3D導航。在設計行業,三維鼠標是在二維顯示器上操縱三維物體的常見解決方案,它提供了沿所有軸線運動的六個自由度(例如,羅技3DConnexion的SpaceMouse)。基于手勢的方法也已經被開發出來,用于在二維顯示器上直接觸摸操縱三維物體[157]。

這樣的輸入方法在與VR和AR HMD的交互中不太可行[158]。更常見的是,HMD使用基于運動的手部跟蹤來支持半空中的虛擬 "直接 "觸摸,或者使用基于紅外傳感器的手持遙控器跟蹤來間接選擇和操縱虛擬物體。這兩種輸入方法都允許用戶與虛擬物體進行互動,以加強對三維環境的沉浸感。

大多數現成的VR HMD都配備了紅外跟蹤的手持遙控器。用戶將遙控器上的激光光標投射到虛擬物體上,并可以按下幾個按鈕中的一個來進行不同的互動。VR HMD系統也可以追蹤手部動作,進行無遙控手勢輸入,并提供與手持遙控器相當的性能和可用性[159]。

由于AR環境的性質,手勢和半空中的 "直接 "觸摸是AR HMD最常見的輸入形式。研究表明,通過提供用戶自己的身體作為自然的空間參照物,對3D場景的雙肢操作有助于用戶對3D空間的理解[160]。盡管執行起來很直觀和自然,但預先定義的手勢可能不符合用戶的假設和偏好的功能,因此可能難以學習和記憶[161][162]。用戶定義的手勢可以規避其中的一些復雜問題[162][163]。微軟HoloLens2支持通過向外的跟蹤攝像頭對簡單的手勢進行準確的板上識別,以便輸入。其他設備,如微軟Kinect,可以與AR或VR HMD系統相連,以擴大可用的手勢輸入范圍,并允許自定義用戶定義的手勢[163]。

追蹤式遙控器在現成的AR HMD中不太常見,但與半空中的 "直接 "觸摸相比,可能提供一些可用性和人體工程學方面的優勢[164]。與追蹤式手持遙控器不同,空中 "直接 "觸摸缺乏觸覺反饋,這可能會影響準確性、速度和感知到的使用便利性[164]。最近的工作研究了使用系留的智能手機[165]或平板電腦[166]作為AR環境中協作工作的有形輸入設備。其他形式的反饋,如聽覺提示,可以被納入支持AR HMD上顯示的虛擬物體的空中操作,但必須考慮到船上操作環境中的環境噪音[167]。

由于特定的三維輸入法的特殊性與顯示技術密切相關(例如,VR HMD的專有遙控器和AR HMD的內置手勢),并且由于文獻搜索沒有得到與三維輸入法對團隊工作和協作的適用性有關的結果,本節的結果沒有在附件A的匯總表中獨立考慮。

5.1.3 結合多個顯示器

盡管CRACCEN的要求表明至少需要一個中央二維顯示器,但該系統不必局限于單一的顯示技術。事實上,對于涉及多個用戶的復雜任務,采用多種技術可能會有一些好處[168][169]。研究小組協作工作時考慮到了耦合的概念,這是衡量合作者對彼此工作的參與程度的標準(例如,[170])。對于緊耦合的任務,小組成員朝著一個或幾個共同的目標緊密合作,通過小組層面的討論和共識來做決定和實施改變。對于松散耦合的任務,小組成員可以在問題的不同方面平行工作,以便共同達到一個目標;決定是在個人層面做出的,或者偶爾與其他小組成員進行松散的協商。混合重點的協作任務涉及松散和緊密耦合的混合,并根據任務要求的流動在兩者之間進行轉換[56][84][168]。一個特定任務的工作量水平也可能影響到耦合和信息共享的要求。例如,當耦合太松(例如,團隊成員之間不共享信息)或太緊(例如,團隊成員之間共享所有信息)時,高工作量下的團隊表現可能會受到影響,而低工作量的情況可能會從較松的耦合中受益[171]。

UWW團隊使用CRACCEN完成的各種復雜的任務規劃和執行任務,預計將涉及混合焦點和各種工作負荷條件。因為在混合焦點工作中,松散和緊密耦合的平衡可能會因各個UWW指揮小組[40],以及不同的任務和工作量條件而有所不同,所以所選技術的靈活性可能具有普遍的好處。結合CRACCEN的多個顯示器可以促進這種靈活的耦合。

在一種可能的配置中,可以提供用于個人工作的手持設備,這些設備隨后可以將數據發送到中央小組顯示器,供討論和進一步協作工作[34][35][172][173][174][175][176]。同樣,系留的手持設備也被證明可以作為大型群體顯示器的替代輸入方法[175][176][177]。有趣的是,上述垂直方向和桌面方向在促進協作和交流方面的差異(例如[39])可能會因為引入輔助的手持設備而減少,這使得工作更加分散[178]。將手持設備保持在一個舒適的高度和角度的對接架(例如[179])可以放在小組顯示器周圍,以促進個人工作的匯總和討論。臺式電腦也可以被納入混合焦點協作系統,為小組工作的不同方面組合多個顯示器,在復雜的決策任務中顯示了前景[172]。

混合焦點系統設計的主要障礙之一是意識的平衡:確保合作者保持對彼此的行動和小組層面的任務進展狀態的了解,同時也能保持對自己個人工作的關注[170][180]。一些研究發現,當手持設備與平板電腦結合在一起時,合作的水平會下降[181]。這種有害的影響可能會被有助于保持他人意識的通知和提醒所緩解[47],而設備之間的信息聯系可以幫助用戶在設備和任務模式之間順利切換[182][183][184][185]。

針對多種集成技術的設計還必須考慮系統復雜性和技術故障排除等更實際的挑戰。聯網到中央小組顯示器和/或相互之間的輔助設備可能會帶來挫折和使用障礙,表現為集成度低、軟件更新不匹配、帶寬限制、網絡連接、設備通信問題,以及對多個設備及其集成的更高維護要求。必須進一步研究系統靈活性和復雜性之間的權衡。

5.2 顯示和輸入技術對UWW任務環境的適用性

UWW的任務環境必然受到UWW指揮小組使用CRACCEN的實際艦上環境的限制。環境因素,如環境噪音、物理空間、溫度、濕度和照明,肯定會在CRACCEN的開發和使用中發揮作用。然而,CRACCEN是為未來船舶開發的未來技術,因此不受現有船舶上物理環境的限制。本節只關注WW任務環境中那些不能由未來船舶設計選擇解決的條件,這些條件將有助于區分考慮中的不同顯示和輸入技術。

5.2.1 顯示技術帶來的眼睛疲勞

盡管任何電子顯示器都會引起眼睛疲勞和視覺疲勞,特別是在長時間使用后,但有證據表明,AR和VR HMD的癥狀的可能性和嚴重程度比普通2D顯示器更大[186][187][188](參見[189])。立體觀看,包括通過HMD和立體眼鏡系統,在觀看虛擬3D物體時,由于輻輳(調整眼睛的轉動以匯聚到物體的距離)和調節(調整眼睛的焦點以匯聚到物體的距離)之間的不匹配,可能會加劇眼睛的疲勞[190][191][192][193][194]。

盡管一些研究表明,與VR HMDS相比,透視AR HMD可以促進更好的深度估計、更高的交互精度和更少的眼睛疲勞[195][196],但眼睛疲勞癥狀的可能性應該是AR和VR HMD的一個嚴肅考慮。設計師必須了解最佳做法,以盡量減少眼睛疲勞,提高用戶體驗和健康水平[197][198]。常見的AR和VR HMD的焦距設定為無限遠(HTC Vive)或大約2米(Oculus Rift、Microsoft HoloLens2)。無限的焦距為開發者簡化了數學運算,但增加了眼睛疲勞的可能性[199]。

用戶需要關注的虛擬物體應該投射在離用戶眼睛不少于0.5米的感知距離上[200]。應該避免要求用戶在更近和更遠的界面之間切換的任務,因為沿Z軸移動焦點會加劇輻輳沖突和緊張[199][200][201]。值得注意的是,透明的AR HMD系統可能需要用戶在投射在眼睛附近的虛擬物體和更遠的真實世界物體之間切換焦點。建議此類系統中的虛擬物體投射在離用戶1.2米到5米之間的感知距離,以獲得最佳的舒適度和抗眼疲勞的效果[200][202]。

各種自適應算法已經被開發出來,通過動態調整用戶的視線,可以最大限度地減少HMD使用中出現的眼睛疲勞和視覺疲勞[203][204] 。使用 "黑暗模式 "圖形,將淺色文本和圖形置于深色背景下,可以減輕VR HMDS中的眼睛疲勞癥狀[205]。同樣,在昏暗的環境中采用淺色的圖形會使用戶對AR HMD的體驗和舒適度達到最佳[206]。也有一些證據表明,訓練和使用HMD的經驗可以改善眼睛疲勞的癥狀[207][208]。

5.2.2 擴展現實HMD帶來的暈機現象

VR用戶經常經歷一種被稱為 "bersickness "或 "模擬器病 "的現象,其癥狀包括惡心、疲勞、迷失方向、頭痛和全身不適[209][210][211]。這些癥狀在移除VR HMD后會持續數小時,并可能最終阻礙使用或妨礙在現實世界中的任務表現[211][212][213]8。雖然還沒有完全理解,但研究表明,暈機是由感官沖突或期望與感知現實之間的不匹配引起的--無論是由于投影圖像的刷新率不足、延遲問題、對用戶頭部運動的跟蹤不佳,還是視覺和前庭系統之間的不匹配(即用戶看到他們正在快速穿過一個場景,但耳朵里的前庭系統沒有記錄任何運動)[209][212][215][216][217][218] 。在使用VR之前立即進行眼動訓練可能會減輕暈機癥狀的可能性[219],盡管還需要更多的研究來驗證這一效果,以擴大樣本量。同樣,用于調節個人暈動癥的技術可能會隨著時間的推移減輕暈機的傾向[220]。

暈車的傾向在不同的人和不同的VR應用之間是不同的,很多人都在努力開發實時檢測和減輕暈車的手段(例如,[221][222][223][224])。由于HMD使用時間的增加通常與暈機癥狀的可能性和嚴重性有關,設計者應該只考慮將HMD作為CRACCEN的補充顯示(參見[225])。多篇綜述論文對使用HMD的經驗和暈機的時間過程中的高度個體差異進行了編目[226][227]。

很少有研究探討虛擬世界中的暈船效應與真實的全身運動之間可能存在的相互作用。用戶在海上會經歷持續的全身運動,特別是在波濤洶涌的海面上(見第5.2.3節),這可能會放大VR環境中感知和預期之間的不匹配,從而增加暈車的風險。在移動的車輛或運動平臺上的乘客使用VR HMD時,已經觀察到了這種放大效應(參見[228]),努力將外部運動的同步視覺指標納入其中,可能會緩解[229][230]或進一步加劇[231]癥狀。其他研究沒有發現在模擬船舶運動的條件下使用AR或VR HMD時,與沒有運動相比,暈船癥狀的風險增加。然而,沒有評估沒有HMD的船舶運動的影響,所以不能區分暈船和暈機的影響[232]。作為進一步的復雜性,一些研究表明,VR HMD用戶在經歷船上運動時可能會有意識或下意識地限制他們的頭部運動,以抵消感覺到的或預期的暈船影響[233]。也有一些證據表明,VR HMD帶來的暈機可能會對平衡和姿勢的穩定性產生負面影響[234][235],這可能是在移動的船上發生事故或受傷的一個風險因素。毋庸置疑的是,需要進一步的研究,特別是在有經驗的海軍人員這一獨特的人群中,對網絡沖突和船舶運動的互動進行研究。

盡管AR HMDs似乎不像VR HMDs那樣容易誘發暈船[195][236](參見[237][238],其中沒有發現使用VR或AR HMDs出現暈船的證據),但AR HMD用戶仍然可以經歷由眼球運動引起的暈船癥狀[239]。例如,瞳孔間的距離因人而異,與HMD的設置不一致會使立體適應和會聚受挫,導致一些用戶出現疲勞和頭痛的癥狀[240][241]。一些HMD系統,如HoloLens2,有內置的設置,可以為獨特的用戶調整瞳孔間距離,并可以通過本地存儲的視網膜數據庫識別個人用戶,自動調整瞳孔間距離以達到最佳的立體觀看效果。然而,與手持式AR相比,使用AR HMD引起的暈機發生率更高,一些初步證據表明,癥狀在長期使用后可能會像VR HMD一樣持續存在[239]。需要更多的研究來驗證在海軍艦艇上使用AR HMD的健康和安全問題。

5.2.3 船舶運動對輸入技術的影響

湍流條件,如波濤洶涌的海面上的船舶運動引起的湍流,會對電子設備的輸入準確性產生負面影響[242][243],無論是直接影響還是間接影響(例如,通過增加疲勞或暈船[244],或損害視覺跟蹤[245])。精細運動尤其受到影響,這使得直接輸入(即觸摸、筆觸)比間接方法如鼠標、軌跡球或鍵盤輸入更困難[246][247]。在模擬船舶運動的研究中,觸摸輸入的準確性隨著船舶運動的增加而急劇惡化,特別是對于較小的目標和基于手勢的輸入[248][249]。相比之下,鼠標輸入對模擬船舶運動有相當大的適應性[248]。盡管軌跡球通常被認為是承受船舶運動的最佳輸入設備,但[248]也發現,軌跡球輸入始終比鼠標和觸摸輸入慢,而且準確度低,即使在嚴重的模擬船舶運動下也是如此(也見[250])。

在模擬湍流的飛機條件下,觸摸屏用戶的整體性能、可用性和舒適性都有所下降[251]。隨著顯示器尺寸的減小,這種情況尤其明顯,這表明大型群體顯示器可能不會像手持設備那樣受到運動的不利影響[252]。當用戶可以以某種方式支撐他們的手或手腕時,觸摸性能會得到改善,但這可能會因手指伸得不自然或困難而帶來新的人體工程學問題[253][254] 。目前還不知道擴展現實手勢輸入的準確性在多大程度上會受到飛船運動的類似阻礙,未來的研究必須探索這種可能性。然而,研究表明,當軍人在模擬艦艇運動的條件下佩戴AR或VR HMD時,對使用物理輸入(即計算機化的射擊任務)的準確性有明顯的不利影響[232];兩種類型的HMD之間的影響沒有差別。

次要考慮的是,使用外設進行間接(如鼠標)或直接(如筆式)輸入,會引入船舶運動帶來的額外復雜問題。外圍設備如果沒有固定好,無人看管,就會從其顯示設備上滑落,造成損壞或損失。

5.2.4 船舶振動對顯示和輸入技術的影響

雖然船舶在波濤洶涌的海面上的運動可以被認為是低頻振動,但通常所說的那種全身性的高頻振動也會對船舶人員的運動和認知能力產生影響,因此在顯示和輸入技術的選擇上都必須加以考慮[255]。較高頻率的振動,如發動機或其他船上機械產生的振動,會影響視覺和精細運動技能的穩定性[256],導致感知和輸入準確性方面的錯誤[257]。一項薈萃分析發現,高頻率的全身振動可能比低頻率的振動對表現有更大的不利影響,特別是對于需要高度輸入準確性的任務[258],盡管振動的幅度可能是比其頻率更關鍵的因素[255]。與低頻率的船舶運動一樣,人們期望在大型顯示器上的輸入性能,即提供更大的目標,因此需要更少的精度來操作,會比小型顯示器更少受到高頻振動的影響。比較輸入方法的研究發現,軌跡球輸入的速度和準確性受發動機振動的負面影響比鼠標或觸摸輸入更大,兩者之間并無差異[259]。

HMD可能會加劇振動對視覺的有害影響,因為眼睛和眼前的屏幕都可能經歷振動的抖動。在操作室中經歷的振動量會在多大程度上阻礙HMD的舒適使用,這是一個值得進一步研究的課題,然后才能將擴展現實HMD納入艦載系統。以前在軍事環境中使用的HMD表明,如果仔細注意將HMD正確地安裝在用戶的頭上,就可以改善空中和地面車輛的振動問題[260]。然而,這種反饋涉及到定制設計的美國軍用HMD,可能并不適用于RCN最終采購的系統。

最后,如果振動反饋或警報與CRACCEN的功能有關,那么需要評估用戶通過全身振動的噪音感知這種反饋的能力。這對手持設備來說是一個特別相關的問題,但也可能是軟鍵盤和大型顯示器上的直接觸摸輸入的一個因素,這可能得益于振動式按鍵反饋[96][97]。

5.2.5 顯示和輸入技術的人機工程學

設備的人機工程學特性對于長期或頻繁的技術使用是至關重要的,因為它們會極大地影響用戶的士氣和健康。例如,人們早就知道,長期使用電腦鼠標與肌肉骨骼疾病有關,如腕管綜合癥(例如,[261])。替代的輸入設備已經被開發出來,以減輕人體工程學的壓力,但用戶往往更喜歡傳統的鼠標,而不愿意學習新的輸入方法,這往往需要大量的培訓才能顯示出任何人體工程學或可用性的好處[262][263][264][265]。軌跡球可能比傳統的鼠標輸入設備提供更多的人體工程學支持,只要在放置軌跡球時注意減少極端的手腕姿勢,并考慮到個別用戶的人體工程學[266]。對前臂和手掌的支持可以抵消標準鼠標[267]和鍵盤[268]輸入的人體工程學壓力。標準電腦鼠標和鋼筆輸入(即在水平輸入板上)與桌面設置的比較表明,肌肉負荷沒有差異[269],或者使用鋼筆的肌肉負荷更大[270],這取決于實驗設置的具體情況。相比之下,在傾斜的觸摸屏平板電腦上使用鋼筆輸入,前臂和平板電腦都靠在水平面上,與標準的電腦鼠標輸入相比,引起的腕部負荷更小,用戶的舒適度更高[271]。對于文本輸入,軟鍵盤在短期內由于減少了輸入力而顯示出相對于物理鍵盤的人機工程學優勢,但從長期來看,其缺點是增加了肩部勞損[272] 。

對比平板電腦、筆記本電腦、平板電腦、垂直顯示器和智能手機,發現只有筆記本電腦適合長期使用,而且只有在鼓勵正確坐姿的情況下[273]。其余的設備被證明會對肩部、頸部和手臂造成重大壓力。同一研究顯示,大型垂直顯示器在站立狀態下使用時,特別容易造成疲勞,不建議長期使用(另見[274])。

大型觸摸屏顯示器被證明在垂直而非桌面方向顯示時,會引起更多的肌肉疲勞[275][276],這可能會復合成對肌肉骨骼系統更持久的損害。研究人員建議減少所需的連續交互程度,并通過讓重要的界面靠近用戶來規避在大型顯示器上進行遠距離交互的需要[275][277]。例如,在桌面顯示器上進行舒適的觸摸互動的觸及距離比許多大型顯示器的尺寸還要小[77],所以設計者需要仔細考慮界面的布局。與垂直或水平顯示器相比,傾斜45o的觸摸屏顯示器引起的自我感覺不適更少,自我感覺可用性更高[278]。當參與者可以選擇幾個屏幕角度時,他們傾向于選擇30-45o之間的角度[50][279]。在使用觸摸屏時,用雙手而不是用單手做手勢似乎可以減少主觀上的不適感,尤其是在較長的使用時間內[279]。然而,更復雜的手勢,如捏住旋轉或輕掃,與簡單的點擊手勢相比,有更多的關節活動,這可能構成更高的傷害風險[276][280]。在開發可用的手勢和界面時,需要同時考慮舒適的手指位置和顯示方向的人體工程學限制[281]。

桌面顯示器的高度對其使用的人體工程學舒適度有很大影響,頭部和屏幕之間的垂直距離越大,不適感就越強,可用性就越低[278];因此,站著的時候喜歡抬高屏幕,坐著的時候喜歡降低屏幕。使用時間對于桌面顯示器來說是一個特別相關的因素,因為桌面使用所需的頭部向下的角度會對頸部和脊椎周圍的肌肉造成很大的壓力[273][282]。此外,相對于在筆記本電腦上執行的類似任務,在桌面顯示器上長時間的閱讀任務會增加感知的視覺疲勞和所需的頭部運動,從而增加頸部疲勞[282]。輸入方法同樣在桌面使用的人體工程學方面起著作用,對于長期使用來說,鼠標輸入通常比直接輸入(如觸摸或筆式)更受歡迎[80],但對于短期使用則不一定[86]。與鼠標輸入相比,軌跡球輸入可能會減少手部的不適感,但其代價是增加手臂、頸部和肩部的不適感[73]。使用手寫筆的手寫識別可能會減輕圍繞鍵盤使用的一些人體工程學問題[283],但對于CRACCEN使用中預計涉及的相對較少的文本輸入,人體工程學的優勢可能對整體用戶體驗沒有什么影響。

值得注意的是,桌面顯示器的一些人體工程學復雜問題可以通過將二維圖像增強為三維來緩解。虛擬三維信息可以在眼睛的高度呈現給HMD用戶,而不是要求他們低頭看桌面顯示器。與垂直顯示相比,用3D AR HMD和精心設計的手勢輸入對桌面顯示進行增強,有助于使用戶的手保持在肩部和腰部之間相對舒適的位置,從而最大限度地減少疲勞[284][285]。然而,半空中的互動可能容易導致手臂疲勞[160][286](參見[287],該研究顯示,與標準鼠標相比,用戶用半空中的手勢玩2D游戲時沒有額外的疲勞感)。其他研究發現,在虛擬世界中通過VR HMD進行的手勢比在現實世界中進行的相同手勢導致了更高的自我報告的疲勞程度[288]。輸入放大的方法可以減少半空中輸入帶來的肌肉疲勞[289]。

VR和AR HMD也會給頭部和頸部肌肉帶來額外的壓力[290][291][292][294],并引起不適和疲勞[294][295][296],盡管用戶報告的不適程度似乎主要取決于HMD的整體重量和重量分布[293][297][298]。一般來說,不建議長時間使用。最近由DRDC承包的一項審查表明,像微軟Hololens2這樣的AR HMD在UWW中使用一般是安全的,盡管人體工程學的考慮表明使用的時間是有限的[297]。

相比之下,3D AR互動在通過手持設備而不是通過HMD進行時,身體會更加疲憊[151]。研究發現,長時間使用手持設備后,頸部、背部和手臂都會有明顯的勞損[61][273][299]。坐著時將手持設備放在腿上,頸部和背部的不適尤其明顯[300],而用一只手高舉設備,另一只手進行觸摸操作,會對支持的手腕造成很大的壓力[301]。手持設備在人體工程學上的缺點可以通過整合對接架來緩解,對接架可以支持設備并允許在相對于用戶的舒適高度和角度進行雙手觸摸輸入[302],但手持AR設備通常需要高舉并移動以查看3D場景。

6 建議

第2節中概述的CRACCEN的需求分析確定,鑒于UWW環境的三維性質,至少需要一個中央二維群組顯示器,以及可視化和與三維信息互動的能力。還討論了結合多個顯示器的可能性,以適應UWW任務工作中個人和團體之間的靈活轉換。第4節和第5節對文獻進行了廣泛和跨學科的審查,以確定哪些顯示和輸入技術最適合促進UWW環境中的團隊工作。

附件A中列出了一份總結審查結果的表格,這有利于在不同技術之間進行直接比較。總結表中提供了指導每項技術評估的參考文獻的完整清單,為了簡潔起見,下面的書面建議中沒有轉載。下面依次討論從審查中得出的建議。

1.一個大型的桌面二維顯示器應作為中心組的顯示器。

2.應選擇安裝硬件,使中央顯示器能夠根據需要在水平和垂直方向上靈活轉換;以及

3.可選的額外設備可以與中央顯示器聯網,以改善戰斗空間的三維可視化(即AR HMD),并更好地支持個人工作,隨后可以在中央顯示器上進行組合和共享(即手持設備或桌面工作站)。

6.1 大型中央桌面二維顯示器

圍著桌子工作是人們熟悉的小組討論、商議、信息共享和決策的配置,而多點觸摸屏幕的直觀性使所有用戶很容易做出貢獻,無論是同時還是輪流。這種布局提高了協作任務中的溝通和互動質量,從任何邊緣與顯示屏互動的能力大大增加了同時使用的能力。該技術與熟悉的、經常使用的技術(如臺式電腦和智能手機)有相似之處,這將使用戶能夠利用現有的知識框架,從而減少學習時間。閱讀地圖的知識框架經常發生在水平面上,也可以利用空間導航規劃和SA。

直接觸摸是二維桌面顯示器的理想輸入方法。當需要進行小組工作時尤其如此,因為它允許用戶輕松地跟隨他們的合作者的行動。用鋼筆觸控器可以提高精確度,而且還可以用手寫識別作為文本輸入方法,不過考慮到船舶運動和移動的外圍設備可能會超過觸控器的任何附加價值。軟鍵盤可以根據需要供UWW團隊使用。

在設計階段必須特別考慮到使用的人機工程學,確保重要的顯示菜單容易獲得和/或可以靈活地在屏幕上移動以方便使用。桌面上的二維顯示器如果相對于用戶的位置太低,有可能對頸部和脊柱造成壓力,而大型顯示器上的觸摸式互動在長時間使用后會造成肌肉疲勞。

6.2 靈活的顯示角度

由于需要支持混合焦點任務,靈活性將大大有利于CRACCEN的可用性。只需花很少的額外費用購買專門的安裝硬件,以協作為重點的桌面顯示器就可以根據需要轉換成以演示為重點的垂直顯示器。垂直方向將支持更多的演講式交流;將促進簡報;并可作為背景顯示器,在不積極用于協作任務規劃或執行任務時,保持任務、平臺和任務狀態的SA。

在設計階段必須特別考慮靈活的界面,因為屏幕的方向將極大地影響到要顯示的信息類型和交互空間的組織。例如,到達左上角的菜單對于在桌面顯示器上邊緣的用戶來說可能是件小事,但對于位于垂直顯示器前的用戶來說卻是件非常費力的事。靈活的系統應該能夠自動識別顯示器的方向并相應地調整輸出和界面。雖然現有的研究提供了一些一般的指導原則(如[38][39]),但未來探索不同顯示方向的具體海軍用例的研究應該指導CRACCEN的界面設計。

6.3 用于個人工作的可選AR HMD和設備

由于UWW的環境是3D的,SA和任務規劃可能會從其3D表現中獲益匪淺。盡管VR和AR HMD都支持與虛擬三維物體的沉浸式互動,但透明的AR HMD為交流和小組工作提供了更好的支持,也降低了暈機的可能性。AR HMD可以作為3D可視化和互動的可選輔助工具提供給CRACCEN用戶,研究表明,即使在一些合作者佩戴HMD而其他合作者不佩戴的情況下,有效的合作和交流也可以保持在較高水平。

AR HMD的用例已經在各種軍事環境中進行了探索,包括城市環境中的導航和SA[303][304]、軍隊的地面和車輛作戰場景[260]、空軍飛行員的平視顯示器[260],以及高風險場景的模擬訓練[305]。到目前為止,很少有工作評估AR HMD在艦艇環境中的可用性(但見[232][306])。在開發之前,必須進行研究以測試AR HMD在船上環境中的可行性,因為船舶運動和振動的影響可能從一開始就阻礙或排除了可用性。

盡管CRACCEN的重點是小組工作,但UWW小組成員個人仍需要將其個人專長應用于協作任務的規劃和決策任務。平板電腦或臺式電腦系統可以作為個人工作的可選支持,具有聯網功能,在積極的任務規劃任務中向中央小組顯示器傳輸信息。科學文獻目前沒有提供明確的指導方針,說明一種設備(如臺式電腦或平板電腦)比另一種設備更適合于混合焦點任務,因此在最初的研究中應考慮這兩種設備。以前的工作結合了平板電腦、平板電腦、3D增強和AR HMD等技術,用于考古學的多用戶可視化,可以作為一個有用的概念證明:提供多種方法來探索和瀏覽復雜的3D環境,可以幫助可視化和SA,從而支持解釋和決策[307]。

靈活耦合的CRACCEN系統的設計者將需要考慮個人工作的最佳界面,如何在顯示器之間傳輸信息,以及如何將傳輸的信息納入中央小組顯示器的可視化中。還必須仔細考慮系統的靈活性和整合多個設備的額外實際復雜性(如設備間的通信挑戰、軟件更新、帶寬限制)之間的權衡。

6.4 未來的研究

需要進行更多的研究來驗證上述建議在RCN的艦載UWW指揮小組的獨特操作環境中的有效性。下文按優先順序介紹了開發過程中下一步的未來研究建議,盡管幾條研究路線可能同時進行。在所有建議的研究案例中,原型開發和用戶研究是同步進行的,每一項都為另一項提供信息。

6.4.1 靈活顯示器的構思研究

到目前為止,本報告建議使用一個中央二維桌面顯示器,可選擇垂直方向,可選擇AR HMD來顯示三維信息,可選擇桌面或平板設備來進行個人工作。然而,目前還不清楚哪些信息和能力最適合在哪些顯示器上以何種組合方式呈現。一個初步的想法研究可以讓中小企業進行頭腦風暴活動,讓他們想象在不同的顯示器選項上進行各種任務規劃、執行和決策任務。這個研究方向的問題包括:中小企業希望通過每個顯示選項完成哪些任務,他們在尋求特定信息時可能會參考哪些顯示選項,他們在使用某個顯示選項時預見了哪些問題,以及他們可以想象自己在UWW團隊中使用每個顯示選項會有哪些貢獻。

在這個最初的構思活動的基礎上,后續的研究應該評估設計概念和每個顯示器的界面的靜態模型。最初的模型和概念將從現有的用戶體驗專業知識中開發出來,然后提交給用戶測試和完善。在這個階段感興趣的問題包括:所展示的界面布局的可感知的可用性,中小型企業可能會建議做哪些改變來改善特定顯示器的布局,中小型企業可能會建議對信息或功能在顯示器上的分布做哪些改變(例如,驗證最初的構想研究),以及中小型企業如何想象自己與顯示器的互動。很可能需要幾次反復的設計概念開發和用戶測試,而且這些初步研究的結論有可能與本初步報告中提供的建議相反。例如,可能會出現這樣的情況:WWW團隊現有的臺式工作站可能被證明足以滿足CRACCEN個別工作方面的能力要求,在這種情況下,不需要進一步開發個別臺式或平板電腦界面。這樣一來,這些研究的結果將為下面的額外研究建議提供信息和約束方向。

研究人員還可以考慮采用VR技術,在模擬的艦船環境中與中小企業一起測試設計概念。這將使中小企業在開發的早期階段,在真實工作環境的虛擬模擬中,而不是在不太現實的實驗室環境中,體驗和評估CRACCEN的外觀和感覺[308][309]。

6.4.2 測試中央顯示屏的原型

本報告的結論所建議的下一步是為CRACCEN桌面開發一個低保真度的初始原型,重點是一個可用的二維界面,有一個模擬場景,UWW團隊可以作為一個小組進行工作。然后,研究人員可以使用這個原型,與中小企業和中小企業團隊一起測試系統的可用性[310]。

原型設計和開發的早期迭代可以集中在高層次的目標上,早期的測試同樣可以涉及相對簡單的反饋方法,例如特征捕捉網格,它將反饋組織成喜歡、批評、問題和想法,以便完善后來的設計迭代[6]。

后續的原型迭代應該包括越來越詳細的目標和具體的能力。這些后期迭代的用戶測試可以包括對任務表現、可用性(例如,桌面協作可用性評估[311])、系統使用的口頭走過(例如,[312])、場景后訪談、工作量和認知負荷的測量(例如,NASA-TLX[313]),以及團隊溝通和凝聚力的測量。眼球追蹤測量可以被納入,以幫助改善界面設計[314]。根據[315]的建議,在對原型熟悉一段時間后,應該對任務技術匹配度(TTF)進行正式評估,以驗證其與任務的匹配度。

6.4.3 測試AR HMD和個人工作原型

必須在海上測試AR HMD在艦船環境中的可行性。只要這些測試證明AR HMD可以在其所處的環境中安全使用,原型的開發和測試就應該按照對中央顯示器建議的方式進行:從高層次的目標和簡單的反饋到具有全套措施的具體能力測試。開發應考慮設計啟發式,以最大限度地減少人體工程學的壓力和最大限度地提高可用性[319]。最初的評估可能會孤立地檢查AR HMD,但以后的研究必須也包括桌面顯示器的原型。中小企業可以單獨承擔任務,為CRACCEN使用AR HMD提供初步的高水平評估和投入。

對于協作任務來說,混合現實系統的虛擬性和沉浸感水平應該只根據任務需求來增加,以使用戶保持對物理空間和合作者的認識[17]。AR HMD的測試和開發周期不僅需要檢查可用性和TTF,還需要比較納入HMD和3D信息所增加的價值[320],相對于任務表現、認知負荷、團隊合作或溝通質量的任何變化。

如果上述構思研究的結果驗證了平板電腦或臺式電腦對個人工作的有用性,那么對這個原型的測試也同樣應該從高層次的目標和簡單的反饋開始,到用一整套措施對具體能力進行測試。最初的評估可以孤立地檢查個人工作原型,但以后的研究必須把桌面顯示器的原型也納入其中。因為這些設備是為個人工作準備的,所以最初的評估可以與單個的中小企業一起進行。

個人工作原型的測試和發展需要檢查可用性,TTF,以及比較納入這些額外的設備所增加的價值,相對于任何任務執行質量的變化,認知負荷,團隊合作,或溝通。

7 結論

CRACCEN系統預計將徹底改變在RCN內進行UWW的方式,不僅有可能重塑UWW任務的技術使用方式,而且有可能重塑指揮小組成員之間的相關任務分配和完成方式。為了適應這種重新設想的任務和人員空間,系統應該是什么樣子是一個關鍵問題,因為在早期高水平設計階段做出的決定可能會限制和確定未來RCN的UWW的性質。本報告試圖通過審查這些技術與一些高層次的任務要求和約束條件的關系,來確定最適合艦載UWW團隊使用的顯示和輸入技術。

第2.3節提出的初步需求分析表明,至少需要一個中央二維顯示屏幕,能夠顯示并與三維信息互動,并有可能結合多個顯示器進行靈活的混合焦點工作。本報告審查了多種顯示技術、輸入方法和三維增強的方法,考慮了各種技術對團隊工作和UWW任務環境的限制的適用性。

根據綜合文獻審查的結果,作者建議采用二維桌面顯示器作為CRACCEN的中央顯示屏,具有靈活的顯示方向,可選擇AR HMD來增強UWW環境的三維可視化,可選擇桌面或手持顯示器進行個人工作,隨后可以在中央團隊顯示器上共享規劃和討論。然而,UWW指揮小組及其作戰環境的特點可能會影響這些技術和技術組合的實用性和可用性。與中小企業的進一步研究必須驗證這些技術,并在原型開發過程中測試界面設計的實用性。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

美國軍隊繼續在日益復雜的安全環境中作戰,不能再期望在每個領域都有無爭議的或主導性的優勢。由特種作戰部隊(SOF)操作的飛機需要改進防御能力,以支持在非許可環境下的任務。將自動化和人機協作納入現有的防御能力,可以減少威脅的反應時間,提高有人和無人飛機配置的防御機動的有效性。這篇論文研究了作為威脅反應一部分的飛機機動的價值,以確定人類干預對時間和準確性產生負面影響的情況。它還考慮了復制Merlin實驗室的飛行自動化方法和將能夠進行防御性機動的機器訓練系統納入現有飛機的機會。分析表明,飛機的機動性對于有效的威脅反應至關重要,自動選擇操作者的行動可以提高對某些地對空威脅的生存能力。這篇論文建議重新關注特種部隊飛機的防御能力,并贊同將機載自主系統整合到傳統的載人平臺上,以提高防御性威脅反應。它還主張繼續研究在SOF任務中使用可選的載人飛機,以完善其操作效用,并在各種任務平臺上擴大能力。

美國軍隊繼續在日益復雜的安全環境中運作,不能再期望在每個領域都有無爭議的或主導性的優勢。由于地對空威脅已經擴散到在世界各地活動的敵對行為者,未來的作戰環境將以有爭議的空域為特征,這將對有人和無人駕駛飛機的操作構成挑戰。由特種作戰部隊(SOF)操作的飛機需要改進防御能力,以便在這些有爭議的地區進行機動,同時支持傳統SOF任務。這篇論文研究了商業能力的進步,以減少威脅的反應時間,提高有人和無人駕駛飛機配置的防御性機動的有效性。

通過與位于波士頓的飛行自動化初創公司Merlin實驗室合作,本分析探討了防御性機動的潛在自動化。飛機機動是對威脅作出有效反應的一個關鍵方面,自動選擇操作者的行動可以提高對某些地對空威脅的生存能力。通過確定AC-130J威脅反應中人為干預影響飛機操縱時機和準確性的步驟,這項分析揭示了復制梅林實驗室的飛行自動化方法和將能夠執行防御性操縱的機器訓練系統納入現有飛機的機會。

在威脅反應過程中確定的關鍵步驟包括威脅指示、威脅作戰識別和威脅反應配對。目前,機組人員手動執行這些步驟來完成防御性威脅機動。然而,這些步驟中的每一個都可以從自動化和人機協作中受益,通過三種明顯的方式提高整體性能。首先,生成簡化的視覺和聽覺威脅指示,確保及時通知威脅的存在。其次,自動識別過程以準確識別威脅的變體,減少了反應時間和人類識別錯誤的可能性。最后,將威脅識別與適當的飛機反應同步配對,減少了不必要的延誤,并提高了威脅操縱的準確性。

這篇論文建議重新關注SOF飛機的防御能力,并贊同將機載自主系統整合到傳統的載人平臺上,以改善防御性威脅反應。將人機協作和自主能力納入飛機防御系統,可以使防御機動性能優于傳統系統,并允許在更廣泛的環境中作戰。除了改善防御性機動,梅林實驗室的自動飛行甲板在各種不同的飛機和任務中提供了潛在的用途。繼續研究應該調查在SOF任務中使用可選擇的載人飛機,以完善其操作效用,并在各種任務平臺上擴大能力。最后,在整個特種部隊中采用梅林系統將顛覆既定的操作慣例,需要個人和組織行為的改變。為了緩解過渡期并提高采用率,AFSOC應采取步驟,盡量減少利益相關者的行為變化,同時最大限度地提高系統的操作效益。培養對人工智能、機器學習和自動化的理解,將使這些行為者為軍事技術的快速變化和戰爭特征的變化做好準備。

圖 9. AC-130 防御性威脅反應圖。

付費5元查看完整內容

本專著的目的是從防空歷史和空中力量穿透這些防御的工作中提煉出教訓。它從第一次世界大戰、第二次世界大戰、越南、"沙漠風暴 "以及俄羅斯和中國的現代發展中確定了六條經驗。這六條經驗為空軍和地面部隊在未來進行壓制敵方防空(SEAD)和滲透行動的努力提供參考。本專著探討了聯合部隊應如何對待SEAD任務的問題,以及來自陸地領域的部隊是否應在穿透地基防空系統方面發揮更重要的作用。

T.R. Fehrenbach提醒我們注意戰爭的一個持久特征。無論我們的技術變得多么復雜和先進,武裝沖突仍然需要士兵參與。空中力量理論家認為,在未來的戰爭中,人類可能不再需要近距離的暴力對抗,僅靠空中手段就能達到目的。雖然純粹的空戰仍然是一個遙遠的想象,但地面部隊將繼續奮勇向前,與泥濘中的人們一起奪取目標。本專論并不是說空中力量是不必要的;相反,它是至關重要的。空軍的覆蓋面和影響力已經與地面機動密不可分,在最近的戰爭中,空軍已經成為軍隊進攻的必要先導。然而,空中優勢作為地面進展的先決條件的模式可能不再成立了。移動式和便攜式防空系統的擴散,加上危害地面部隊的遠程打擊能力,無論其位置如何,都可能迫使地面作戰先于其空中補充。

本專著討論了聯合部隊在未來應如何進行壓制敵方防空(SEAD)。它考慮了攻擊性空軍和地面防御者之間的斗爭。具體來說,它討論了防空系統的進步已經發展到了美國空軍無法繼續承擔壓制和穿透它們的主要份額的程度。在未來,美國陸軍可能不得不對綜合防空系統(IADS)進行第一輪打擊,為美國空軍開始空中優勢的戰斗打開大門。

海上防空對于地面部隊的機動自由至關重要。在減少對手的防空資產之前,敵人的空軍可以隨意攻擊機動編隊。自從20世紀初早期的飛行者從飛機上投下第一件武器以來,空中力量對現代機動作戰一直是至關重要的。空中和地面防御系統已經發展到這樣的程度,即一支軍隊如果不首先擊敗其競爭對手的空軍就進行攻擊是不可想象的。迅速而徹底地擊敗伊拉克的防空系統并隨后摧毀其空軍,對于聯軍在 "沙漠風暴 "行動中的快速機動和壓倒性勝利至關重要。 以美國空軍為先導,然后是地面機動的SEAD模式是如此強大,以至于美國和北約的競爭對手注意到并進行了調整。今天的綜合防空系統(IADS)是高度網絡化的,相互支持的,并且是分層深入的。 這些防御網絡,再加上遠程彈藥的出現,造成了一個多層面的問題。國際防空系統迷惑了敵方空軍為其地面部隊建立機動空間的能力,同時遠程火力也使這些攻擊部隊受到威脅。先進的IADS與遠程彈藥的雙重困境,要求我們考慮我們目前的SEAD方法是否足夠。

所提出的假設是,聯合部隊應該作為一個密切協調的地面和空中團隊進行未來的SEAD。美國陸軍應該為反應靈敏、強大和機動的防空和導彈防御系統、遠程精確火力、地面發射的反輻射制導導彈(ARGM)和游動彈藥提供資源。

所采用的方法是對SEAD的歷史、理論和學說的研究。它考慮了SEAD從第一次世界大戰到現在的歷史。反擊空中和導彈威脅(聯合出版物3-01)將SEAD歸類為主要的進攻性反空(OCA)任務。其目的是 "通過破壞性或擾亂性的手段使敵方的地表防空系統失效、摧毀或暫時退化。" 美國部隊發展SEAD是為了應對日益復雜和有效的地基防空系統,它與防空的進步有效地共同發展。本專著中的防空歷史有五個主要部分。第一部分討論了第一次世界大戰中的空中力量發展,以及早期空軍能力的提高如何為地面機動提供了機會。一戰中對空襲的反應導致了二戰期間為防止滲透而對空中武裝進行牽制的武器的產生。二戰的戰斗人員完善了一戰中創造的技術,為進攻的空軍和地面的防御者開發了更致命的瞄準系統和改進的彈藥。在越南戰爭期間,越南人民軍(PAVN)采用了密集的防空武器組合,這需要美國裝備和訓練專門的飛機來壓制北越的防御;這是SEAD能力的第一個例子。接下來,該專著回顧了美國在 "沙漠風暴 "行動中對空地戰的運用,以顯示SEAD的有效性,以及它如何為其他世界大國進一步調整以對抗FM100-5中的理論提供了基礎。 第五章考慮了俄羅斯新一代戰爭(RNGW)、中國遠程導彈以及防空武器的擴散以防止滲透。作者將SEAD理論和學說的演變與歷史實例結合起來,說明空軍與IADS之間的競爭是如何發展到今天的高精尖系統的。最后,該專著提出了一個地面部分未來在對抗現代IADS的戰斗中的貢獻模式。

聯合部隊如何進行未來的海空防務行動,對于各軍種在面對未來的國際防空系統時如何整合和合作至關重要。現代國際防空系統對未來的空中行動,以及暗示的地面行動構成了一個重大障礙。國家和非國家行為者對地對空武器的使用加劇了國際防空系統的瓦解問題。它極大地提高了進行海空導彈和滲透敵占區所需的戰斗力水平。阿富汗圣戰者組織在蘇聯-阿富汗戰爭中使用 "毒刺 "導彈,以及最近在烏克蘭上空擊落馬來西亞航空公司MH17航班,都是這些系統的擴散已經超出既定軍隊嚴格使用的例子。在未來的戰爭中,雙方都可能面臨一個連續的國際防空系統和非正規部隊采用的未聯網的防空。聯合部隊必須開發多種方案來擊敗這些系統,并擴大他們的方法,以最大限度地提高靈活性,使空中和地面部隊能夠對由國際防空系統和獨立的地對空武器防御的對手構成眾多威脅。

付費5元查看完整內容

美國海軍陸戰隊正在探索使用人機協作來控制前線部署環境中的無人駕駛航空系統(UAS),其任務范圍廣泛,包括情報、監視和偵察(ISR)、電子戰(EW)、通信中繼和動能殺傷。美國海軍陸戰隊設想使用未來的垂直起降平臺(VTOL)來支持混合戰爭任務并實現軍事優勢。對于美國海軍陸戰隊的混合戰爭應用,以實現任務優勢和戰爭主導權,美國海軍陸戰隊需要了解VTOL機組和無人機系統之間錯綜復雜的人機互動和關系,以獲得戰斗空間態勢感知,并有效地計劃和執行針對常規和不對稱威脅的旋轉翼行動。這項研究的重點是美國海軍陸戰隊在海洋環境中的打擊協調和偵察(SCAR)任務,以促進遠征基地先進作戰(EABO)在沿岸地區。有多種復雜的功能必須加以考慮和評估,以支持人機協作互動,提高任務的有效性:任務規劃、移動和滲透、區域偵察、偵察戰斗交接和過渡。

這份頂點報告探討了SCAR任務期間三個系統之間的人機協作:UAS、VTOL和地面控制站(GCS)。該研究從VTOL項目的文獻回顧開始,研究了美國海軍陸戰隊SCAR任務戰術和用于促進EABO的理論概念。此外,它還包括對自主性和自動化、人工智能和機器學習的研究。通過使用合作設計模型來探索這三個系統的人機協作互動和過程,文獻回顧探討了如何使用基于三個因素的相互依賴性分析(IA)框架來確定人類執行者和機器團隊成員之間的相互依賴性:可觀察性、可預測性和可指導性。

通過基于模型的系統工程(MBSE)工具,將SCAR任務的高級功能分解為分層次的任務和子任務,系統分析被用來支持聯合設計方法。根據Johnson(2014)的說法,合作設計方法研究了相互依賴的概念,并使用IA框架作為設計工具。IA框架捕捉了主要執行者和支持團隊成員之間的互動,以發展支持每個主要任務和分層子任務的所需能力,從而產生HMT要求。這份頂點報告分析了兩種選擇。第一個方案認為UAS是主要執行者,VTOL和GCS是輔助團隊成員。第二種方案認為VTOL是主要執行者,UAS和GCS是輔助團隊成員。基于這兩種選擇,IA框架評估了17個主要任務、33個分層子任務和85個執行SCAR任務的所需能力。

此外,研究發現需要一個強大的數字任務規劃系統,如升級后的海軍陸戰隊規劃和行動后系統(MPAAS),通過存儲以前的任務和經驗教訓的數據來促進機器學習。美國海軍陸戰隊將面臨無人機系統的處理能力和信息存儲方面的挑戰。應盡一切努力增加UAS的處理能力。必須實施一個有效的主要、備用、應急和緊急(PACE)通信計劃,以確保UAS、VTOL和GCS之間所有通信平臺的冗余。美國海軍陸戰隊必須實施支持信任、提供快速反饋和簡單操作的接口。

最后,為了準確評估VTOL、UAS和GCS之間的HMT要求,頂點報告促成了一個探索性實驗的發展,該實驗將在海軍研究生院(NPS)建模虛擬環境和模擬(MOVES)實驗室使用,以促進未來的研究。制定了操作要求和測量方法,以確定HMT要求的有效性。

這項頂點研究為在SCAR任務中執行VTOL/UAS混合行動的人機互動復雜性提供了明確的證據。該頂點研究確定了使用系統分析和協同設計作為一種有效的方法,通過IA框架促進人機協作需求的發展。此外,該研究確定了對復雜的自主性和技術準備程度的需求,這可能是目前還沒有的。頂點建議美國海軍陸戰隊繼續研究人機協作,并利用SCAR任務探索性實驗來進一步完善和研究VTOL/UAS的高級系統要求,以支持具有前沿部署的UAS的混合行動,重點是實現4級自主權。

付費5元查看完整內容

這份頂點報告分析了增材制造(AM)技術在美國國防部(DOD)當前和未來的使用情況。該分析為開發增材制造工藝和分析工具(AMPAT)提供了必要的技術背景。AMPAT將幫助利益相關者確定哪些增材制造設備能最好地服務于作戰人員和他們在遠征環境中的任務。此外,該工具可以被利益相關者用來確定AM能力在整個艦隊中最有利的分布,并就這些能力應該如何被整合到更大的海軍任務和更大的國防部企業中做出決定。采用系統工程(SE)方法來收集關于當前和未來的AM方法的信息,以了解和定義AM系統的操作要求。此外,還利用SE過程來分析建立工具的替代軟件選項,實施敏捷軟件開發過程來開發工具,并驗證和確認該工具符合項目要求。研究發現,AMPAT根據用戶定義的輸入參數和加權值,成功地輸出了一個AM系統建議的排名列表。關于選擇AM設備和為艦隊制定分散計劃的建議包括使用AMPAT的可交付成果,利用用戶定義的輸入值進行定制的、迭代的分析,以適應特定的遠征環境

執行摘要

美國海軍和海軍陸戰隊一直在各種作戰環境和任務場景中增加使用增材制造(AM)能力,以快速交付作戰設備,降低成本,更換和維修部件。美國海軍研究生院(NPS)海軍遠征增材制造(NEAM)團隊的成立是為了解決海軍遠征作戰司令部(NECC)提出的幾個研究問題。該團隊開發了一個名為增材制造過程和分析工具(AMPAT)的工具,該工具將:1)確定具體的增材制造設備,以便在遠征環境中為部隊提供最佳服務,包括分布式海上行動(DMO)、有爭議環境中的沿岸行動(LOCE)和遠征先進基地行動(EABO);2)輸出建議,可用于幫助通知整個艦隊的增材制造設備分散計劃;以及3)幫助NECC更好地將其能力融入更大的海軍任務。

NEAM團隊使用修改過的瀑布過程模型系統工程方法來開發一個工具來回答這些問題。NEAM團隊進行了詳細的文獻審查,以收集有關各種AM技術、AM零件的設計考慮因素、材料處理以及AM在國防部的使用的信息。此外,該團隊還會見了許多從事AM技術工作的組織的主題專家(SMEs),包括海軍設施(NAVFAC)工程和遠征作戰中心、海軍海上系統司令部技術辦公室、海軍陸戰隊系統司令部、海軍水面作戰中心Indian Head分部、海軍水面作戰中心Pt. Hueneme分部、海軍陸戰隊第一后勤集團、海軍供應系統司令部(NAVSUP)、太平洋海軍信息戰中心和海軍研究辦公室。

AMPAT是一個基于Excel的工具,用Visual Basic for Applications(VBA)編程語言編寫。AMPAT包括一個數據庫,供用戶輸入各種AM系統的信息和數據,以及一個工具儀表板,使用戶能夠在進行分析所需的輸入和分析的輸出之間輕松瀏覽。儀表板允許用戶行使工具功能,包括調整分析標準和用戶選擇,向AM數據庫添加打印機,檢查AM數據庫的錯誤,運行分析,以及清除結果。用戶可以定制AMPAT分析,對一組具有不同規格和特性的AM打印機進行排名,以確定在特定環境下滿足作戰人員需求的最佳AM系統設計。關于如何使用AMPAT的每個功能,可以在《用戶指南》中找到全面的、分步驟的說明。

本報告為用戶提供了一個執行AMPAT以獲得分析結果的方法。首先,用戶通過確定感興趣的具體屬性(如故障率、運行可用性、環境條件)來設置分析參數。接下來,用戶為每個選定的屬性設置加權值,以排列每個屬性相對于另一個屬性的重要性。用戶必須設置權重值,以便AMPAT進行必要的數學分析,提供具體的AM系統建議。數學分析將根據用戶對每個屬性的權重輸入,計算出每個AM系統的加權分數,并將其標準化。AMPAT將生成一個過濾的數據庫表,其中包括滿足用戶在運行分析之前確定的輸入參數的AM系統。此外,根據分配給每個參數的權重值,將提供這些AM系統的排名列表。最后,AMPAT將繪制分析結果;用戶可以選擇特定的參數,以包括在繪圖中,并決定是按系統繪圖還是按屬性繪圖。

NEAM團隊建議NECC使用AMPAT進行迭代分析,并繼續向數據庫添加新的AM系統和系統屬性。隨著新的信息被輸入該工具,用戶將收到更詳細的結果,這可能會影響最終的AM排名。AMPAT提供的排名將為決策者提供建議,說明哪種AM設備在執行DMO、LOCE和EABO環境中最能為部隊服務。此外,NEAM團隊建議NECC將AMPAT升級到具有適當安全分類的環境中,以定制該工具的分析,為艦隊的特定地點提供AM系統的建議。如果有適當的輸入,該分析的結果可用于確定在整個艦隊中預置AM技術的最佳策略。

為了統一國防部和國防部,AM領域的專家必須共同制定一份戰略文件,確定批準AM系統用于國防部的必要標準。AMPAT應被串聯使用,以協助社區評估不同的AM技術,以確定是否適合于國防部的任務和作戰方案。隨著用戶繼續用更多的AM系統填充AMPAT,并反復進行不同參數的分析,該工具的結果和輸出可用于證明國防部的批準決定。

NEAM團隊還建議,AMPAT應擴大到包括一個零件和零件規格的圖書館或資料庫。這將擴大AMPAT的效用,使其能夠為AM系統提供建議,這些系統應被用來打印特定的零件,以支持船舶、潛艇、飛機和其他車輛或設備。最終,這將減少成本并縮短艦隊的時間表,以快速生產量身定做的部件,提高作戰人員的準備程度。

AMPAT提供了一個決策分析過程,以確定最理想的AM設備來支持特定任務,并提高整個國防部對AM能力的認識。AM技術在確保迅速和有條不紊地維持作戰設備和加強艦隊準備方面發揮了關鍵作用。AMPAT的使用將有助于使國防部和國防部統一努力推進AM技術,以支持更大的海軍任務的需要。

I. 簡介

本章定義了本研究項目的問題陳述、目標、范圍和操作方案。此外,本章還解釋了用于開發工具的方法,以及該工具將如何被主要利益相關者--海軍遠征作戰司令部(NECC)和其他利益相關者使用,以滿足研究目標。

A. 問題陳述

幾年來,美國海軍和海軍陸戰隊一直在作戰環境中采用增材制造(AM)能力來快速交付作戰裝備。必須進行研究,以確定如何整合未來的AM能力,同時最大限度地提高投資回報,并盡量減少重復工作。首要的目標是將這項研究應用于部署在各種環境中的能力,如:分布式海上行動(DMO)、有爭議環境中的沿岸行動(LOCE)和遠征先進基地行動(EABO)。就本報告而言,重點是開發一個工具和數據庫,以協助決策者確定在這些環境中使用適當的增材制造。

增材制造已經被證明是非常有益的,它提供了降低成本和快速的部件更換和維修;本報告的以下部分將更詳細地討論AM的具體優勢和劣勢。由于AM是一個快速發展的技術領域,很難持續比較和權衡技術能力和屬性以滿足不斷變化的需求。需要一個工具,讓領導層充分了解當前和新的AM技術提供了哪些能力,這樣他們就可以做出明智的決定,使國防部(DOD)的投資回報最大化,以支持作戰人員和他們的任務。決策者需要考慮的一些特性包括:移動性、易用性、培訓、打印材料和打印機床尺寸。

本項目的目的是提供一個總體決策分析方法和工具,其中包括一個易于修改的NECC當前3D打印機和部件的數據庫,以有效地將當前和未來的AM能力整合到更廣泛的海軍遠征任務中。海軍遠征增材制造(NEAM)團隊廣泛研究了當前的AM能力及其在遠征部隊中的應用,以幫助開發分析方法、工具和數據庫,NECC可以采用并用于確定如何在整個美國海軍艦隊中最佳地分散AM能力并實現利益最大化。雖然在海軍遠征軍內,以及在海軍和國防部內廣泛存在著對AM集成的廣泛需求和巨大潛力,但NEAM項目側重于將AM作為部署系統、平臺和車輛的支持能力。最終,該計劃將作為NECC的參考和指南,以便在海軍和海軍陸戰隊的AM設備部署戰略和采購方面做出明智的決定。

B. 研究目標和項目范圍

本項目的重點是NECC在部署AM設備供遠征軍使用時,如何使投資回報最大化,并盡量減少重復工作。這項研究有助于實現在DMO、LOCE、EABO和其他情況下部署AM能力的總體目標,同時確保與現有工作的互操作性,盡量減少重復的工作,并使投資回報最大化。為了不重復工作,該團隊利用以前為類似工作完成的工作,并與海軍內部正在進行的AM工作協調。這項研究的目的是為NECC提供一個決策分析過程,以指導決策者選擇最有效的AM技術來滿足遠征環境中的具體使用情況。

上述三種遠征環境(即DMO、LOCE和EABO)對AM技術都有自己獨特的需求。DMO環境將海軍的注意力集中在同行和近鄰的競爭者身上,這需要艦隊級別的參與主要作戰行動。為了做到這一點,它在各司令部之間建立了更加一體化的關系,并促進了對風險的計算接受。同樣,EABO手冊指出,"EABO是一個未來的海軍作戰概念,滿足美國聯合遠征作戰的下一個范式的彈性和前沿存在要求"(海軍陸戰隊協會2018,5)。這一戰略提供了進行遠征作戰的機會,在不摧毀所有敵軍的情況下擊敗對手的戰略。此外,EABO手冊 "鼓勵海軍陸戰隊和海軍發展優化的內部力量能力,以服務于整個DMO結構"(海軍陸戰隊協會2018,22)。LOCE概念描述了沿海環境中的海軍行動,考慮到新出現的威脅,為海軍和海軍陸戰隊提供了一個創新的、聯合的框架(有爭議環境中的沿海行動,2020)。AM在確保作戰人員在這些環境中得到適當裝備方面發揮著關鍵作用。

考慮到這些環境,NEAM項目重點關注以下問題,以利用AM技術解決作戰人員能力方面的關鍵差距。

1.什么樣的AM設備能夠最好地服務于執行DMO/LOCE/EABO的部隊,包括考慮與其他美國海軍陸戰隊和海軍部隊的互操作性?

2.在整個艦隊中,什么是最有利的AM能力的分散,以使利益最大化,包括潛在的設備預置?

3.NECC如何將其能力更好地整合到更大的海軍任務中?

這個項目并不打算分析AM實施的每一部分;因此,未來的工作將建立在這個項目的基礎上。未來的工作也被認為是減少范圍蠕變風險的一個緩解因素。NEAM團隊對未來工作的建議可以在第七章A節中找到。

C. 方法

為了實現協助NECC最大限度地提高投資回報和減少重復的項目目標,這項研究的重點是開發一個數據庫和工具,以協助決策和增加對特定任務和目標的可用AM能力的接觸。該工具和數據庫是使用微軟Office產品開發的,因為它在整個聯邦政府的計算機系統中通常是可用的。這將有助于確保它能在整個海軍中被廣泛傳播并被大量受眾使用。

該工具是使用系統工程過程中選擇的軟件開發的。它側重于由利益相關者和NECC定義的AM系統的各種能力。用戶可以使用內置的圖形用戶界面(GUI)加載AM系統的各種特性并分配權重。該工具根據所期望的遠征環境的特征分配權重,輸出AM系統建議。

為了確保交付物滿足利益相關者的需求,NEAM團隊采用了一種系統工程方法,包括利益相關者的持續反饋,這在第四章有詳細描述。這使得利益相關者能夠在項目進展過程中對研究的具體方向提供意見,并使NEAM團隊能夠在獲得信息和分析結果時提供。

D. 報告結構

本報告第一章解釋了問題陳述、研究的目標和范圍,以及用于開發本項目中可交付成果的方法。

第二章包括對NEAM團隊為收集不同類型的AM技術、如何設計AM零件、材料處理方面的考慮以及AM在國防部的具體使用情況而進行的文獻審查的廣泛和詳細描述。此外,第二章描述了NEAM團隊用來完成項目的系統工程方法,以及考慮過的其他方法。

第三章著重于利益相關者的識別和分析,并描述了主要利益相關者的需求,用于將其轉化為具體要求的過程,以及當前AM能力中存在的差距。

第四章概述了增材制造工藝和分析工具(AMPAT)的代碼開發過程和所遵循的軟件流程,以及該工具的能力和限制。

第五章提供了AMPAT的幾個使用案例,并描述了該工具所要使用的操作環境。

第六章全面解釋了AMPAT如何用于檢索特定任務的分析結果,并解釋了用于確保該工具滿足項目要求和利益相關者需求的驗證和確認(V&V)方法。

第七章記錄了開發團隊得出的結論,總結了研究和分析對利益相關者和國防部的益處,并對未來工作提出了建議。

付費5元查看完整內容

人工智能正在改變戰爭。英國防部如何準備應對未來的變化?

對于人工智能的軍事用途所帶來的接受挑戰,傳統的反應是堅持要求人類保持 "有意義的人類控制",作為一種產生信心和信任的方式。考慮到人工智能和相關基礎技術的普遍性和快速發展,這不再是一個適當的回應。人工智能將在整個軍事行動范圍內廣泛的指揮和控制(C2)活動中發揮重要的、日益增長的作用。雖然在公眾心目中,人工智能的威脅沒有 "殺手機器人 "那么直接,但在軍事決策中使用人工智能會帶來關鍵的挑戰,同時也有巨大的優勢。加強人類對技術本身的監督并不能防止無意的(更不用說有意的)濫用。

本文以各級(作戰操作員、指揮官、政治領導人和公眾)的信任對有效采用人工智能進行軍事決策至關重要這一前提為基礎,探討了關鍵的相關問題。對人工智能的信任究竟意味著什么?如何建立和維持它以支持軍事決策?人類操作員和人工智能體之間的共生關系對未來的指揮需要作出哪些改變?

當人類對人工智能的行為持有某些期望,而不考慮人工智能體的意圖或道德時,可以說存在對人工智能的信任。然而,與此同時,信任不僅僅是技術性能和可靠性的一個功能--它不能僅僅通過解決數據完整性和可解釋性問題來保證,盡管它們很重要。軍事人工智能中的信任建設還必須解決軍事組織和指揮結構、文化和領導力方面的必要變化。實現總體上適當的信任水平需要一個整體的方法。除了信任人工智能的使用目的之外,軍事指揮官和操作人員還需要充分信任--并且在如何信任--支撐任何特定人工智能模型的輸入、過程和輸出方面得到充分的培訓和具有豐富經驗。然而,最困難的,也可以說是最關鍵的層面是組織生態系統層面的信任。如果不改變軍事決策的體制因素,未來人工智能在C2中的使用將仍然是次優的,被限制在一個模擬框架內。有效引進任何新技術,更不用說像人工智能這樣的變革性技術,需要從根本上重新思考人類活動的組織方式。

優先考慮人和制度層面并不意味著對技術進行更多的控制;相反,它需要在不斷發展的人機認知系統中重新思考人的作用和貢獻。未來的指揮官將需要能夠在一個真正的 "整體部隊"中領導不同的團隊,整合來自軍事、政府和民事領域的貢獻。他們必須對他們的人工隊友有足夠的了解,以便能夠與他們合作并挑戰他們。這更類似于海鷗的雜音,而不是個別 "翠鳥"領導人的天才。為了發展新的指揮和領導概念,英國防部必須重新思考其方法,不僅是培訓和職業管理,還有決策結構和程序,包括未來總部的規模、位置和組成。

人工智能已經在改變戰爭,挑戰人類長期的習慣。通過在訓練和演習中接受更多的實驗,以及探索C2的替代模式,國防部可以更好地準備迎接未來不可避免的變化。

前言

人工智能正在改變人類的思維和決策方式。未來,它將越來越多地影響人類如何確定各種認知過程的優先次序,調整他們的學習、行為和訓練,并更廣泛地改造他們的機構。這些變化在整個軍隊中仍不完全明顯。盡管有新的技術和戰爭迅速發展的特點,今天的武裝部隊在組織結構上與后拿破侖時代歐洲的職業軍隊并沒有很大的區別。太多的人仍然參與到軍事任務中,而這些任務技術可以做得更好更快,并且對于重新思考人類對人機團隊的認知貢獻也沒有給予足夠的重視,而這正是解決未來指揮和控制(C2)問題所需要的。

本文以QinetiQ公司早先的一份報告為基礎,該報告將信任視為軍事能力的基本組成部分和2020年代軍事適應性的基本要求。本文探討了在軍事決策中越來越多地使用人工智能的最新趨勢和想法。本文并不直接關注這一趨勢的倫理(或法律)問題,盡管這些問題很重要。相反,本文強調了信任作為人工智能時代軍事指揮的一個因素的重要性和意義。

人工智能對軍事決策和C2的潛在深遠影響很少引起專家團體以外的關注。大多數公眾關注的是技術的優勢和風險,而不是人類認知和制度構建的潛力和限制。20多年前,著名的社會生物學家E-O-威爾遜抓住了人類當前的挑戰。威爾遜說,真正的問題是,"我們有舊石器時代的情感;中世紀的制度;和神一樣的技術。"在過去的幾十年里,技術的發展速度遠遠超過了人類適應它的能力。強調人工智能的技術屬性,而忽略其日益增長使用中的人類和制度層面,只會使挑戰更加復雜。

在許多領域,人工智能的軍事經驗仍然有限,需要做更多的工作來了解人工智能在人類決策中作用日益增長的影響。本文旨在引發一場更廣泛的辯論,討論英國國防企業內部所需的文化和組織變革,包括指揮部和指揮官的作用,以確保人工智能在未來軍事決策中的最佳使用。

本文的見解來自與人工智能、人類認知、軍事決策和信任理論有關的更廣泛的文獻。這項研究在2021年9月至2022年2月期間進行,大大受益于與來自國防、學術界和工業界的廣泛專家和用戶的訪談。

前兩章提供了本文的理論背景。第一章探討了人工智能和信任的概念,第二章則分析了人類機構的作用以及人工智能對人類做出選擇和決定的認知能力的影響。第三章結合信任、人工智能和人類機構的概念,提出了一個在人工智能支持的軍事決策中發展信任的五維框架。第四章擴大了對C2的分析范圍,特別關注人工智能對傳統上支撐武裝部隊行使權力和指導的人和體制結構的影響。最后一章提出了對未來指揮、領導和 "全軍 "團隊的進一步研究領域。

1. 人工智能和信任

對于人工智能或與人工智能有關的信任,并沒有標準的定義。這兩個概念都有不同的解釋,有時也會有激烈的爭論。本章沒有試圖綜合所有關于這兩個術語的文獻,而是建立了一個基準定義,為隨后討論關于人工智能應用于軍事C2的信任作用提供框架。

1.1 人工智能的性質和類型

人工智能的概念起源于1950年著名的圖靈測試,該測試發生在這個詞被創造出來的幾年前。通過關注它做什么而不是它是什么,更容易將人工智能概念化。人工智能 "試圖讓計算機做人類思想能做的各種事情"。在最基本的方面,它可以被理解為追求特定任務的虛擬信息處理能力。正如 "智能"(或 "思想")有許多層面和不同的用途,人工智能也是如此。因此,人工智能從廣泛的學科中汲取不同的想法和技術,不僅包括數學和計算機工程,還包括哲學、經濟學、神經科學、心理學和語言學。

廣義上講,有三種不同層次的人工智能:人工狹義智能,通常被稱為 "狹義人工智能";人工通用智能,有時被稱為人類水平的人工智能;或者更強大的人工超級智能,超過人類的智能水平。在這一點上,有些人認為會出現一個奇點,在這個奇點中,人工智能要么變得有自我意識,要么達到持續改進的能力,使它的發展超出人類控制。后兩種水平被認為仍有一段距離,盡管距離有多遠還存在爭議。不過,就目前而言,狹義人工智能更先進應用的出現,如先進的機器人技術,加上計算能力的爆炸,才是目前關于人工智能的軍事用途辯論的主要動力。本文重點討論狹義人工智能的應用。

圖 1:AI 類型的簡化分類

在狹義的人工智能中,還有更多的類別,盡管這些技術并不完全是離散的,而且經常被結合使用。最常見的區別是符號人工智能和亞符號或非符號人工智能,前者通常被描述為基于邏輯,后者基于自適應或學習。符號人工智能依賴于順序指令和自上而下的控制,使其特別適合于確定的問題和基于規則的過程。非符號人工智能,其中神經網絡是一種常見的方法,涉及并行、自下而上的處理和近似推理;這與動態條件和數據不完整的情況最相關。符號人工智能提供了精確性和可解釋性,而涉及神經網絡的非符號人工智能則不那么脆弱(網絡中缺少一個節點并不會導致整個網絡無法運行),并且能夠在沒有明確規則或一致證據的情況下識別模式。

有三種常見的機器學習類型,根據有助于智能體學習過程的反饋類型進行區分:監督學習;無監督學習;以及強化學習。在監督學習中,系統被訓練來產生假設或采取具體行動,以追求基于特定輸入的目標值或輸出(被稱為標簽)(例如,圖像識別)。無監督學習沒有設定規格或標簽,也沒有明確的反饋;相反,系統通過尋找數據中的模式進行學習(例如,DNA序列聚類)。強化學習依賴于一個反饋回路,通過試錯或獎懲機制穩定地強化系統的學習行為(例如,先進的機器人技術或無人駕駛汽車)。與監督學習不同,強化學習中使用的輸入數據不是預先定義的,這允許更廣泛的探索,但與無監督學習不同,它有一個預期的應用或總體目標(與總體獎勵最大化相關)。

所有三種類型的機器學習,無論監督或自律的程度如何,都提出了重要的信任和值得信賴的問題。所需的信任程度和性質因使用人工智能的目的不同而不同。

1.2 概念:信任(Trust)

信任描述了兩個或多個智能體之間的互動。信任的傳統定義是假設信任者對受托人的能力和善意(或動機)存在合理的信念。對許多人來說,道德誠信(或意圖)的問題是信任與其他概念(如信心)的區別。另一些人認為,信任的范圍和所指比信心更廣,后者被視為與具體事件相關的獨立判斷。大多數信任的定義趨于統一的是一種脆弱的感覺。沒有背叛的可能性,沒有風險的存在,就不可能有信任。

正是因為經典的信任概念中隱含著假定的道德因素,一些人質疑使用該術語來描述人類與人工智能體的關系。他們認為,在目前狹義人工智能的水平上,我們不能將意向性或道德機構歸于人工智能系統,因此使用 "信任 "一詞是不恰當的。另一些人采取了不那么純粹的觀點,并以反映日常使用的方式應用該術語,意味著對系統的可靠性有信心。

信任作為一個術語在計算機科學中被廣泛使用。更重要的是,信任仍然是公眾和用戶接受人工智能的一個基本方面。今天,關于人工智能的國家政策、法規和專家建議經常強調 "值得信賴的人工智能 "的必要性。例如,DARPA的空戰進化計劃正在探索方法,以模擬和客觀地衡量飛行員在斗狗時對人工智能的信任。認識到這些尚未解決的定義問題,作者選擇了略微調整 "信任 "一詞,使之與通常的做法一致。

作者調整后的信任概念需要對人工智能的表現有一定的預期,而不需要假設人工智能方面的特定動機。因此,對人工智能體行為的積極預期可能是信任存在的充分條件,而不考慮意圖。

在目前大多數關于人工智能的討論中,重點往往是人作為信任者,系統作為受托人,盡管任何認知智能體,包括自主機器人和智能機器,原則上也可以履行信任者的角色。這樣理解的話,信任就成了 "系統成員之間互動的促進者,無論這些成員是人類智能體、人工智能體還是兩者的組合(混合系統)"。事實上,在人工智能更成熟的應用案例中,受托人最有可能同時包括人工智能支持的系統(人工智能體)和該系統的提供者(人類智能體)。在目前的人工智能水平上,信任似乎是一種單向的關系,涉及人類 "信任 "人工智能的程度,而不是真正的雙向信任,即人工智能對人類表現的看法。

各種因素決定了(人類)對技術的信任,包括但不限于信任者的能力水平和信任傾向,以及整體環境或背景(包括更廣泛的文化和機構動態)。除了這些針對人類和環境的考慮,決定一個人或組織對人工智能的信任程度的是技術的性能、過程(它如何產生特定的輸出),以及重要的是目的。所有這三者都決定了人工智能系統的設計和部署。

除了技術的穩健性和安全性,隱私、公平、透明度和問責制是一些最常被提出的影響公眾對人工智能信任的問題。然而,主要是由于設計適當的算法、理解復雜軟件系統的內部結構以及為基于算法的決策賦予責任等方面的困難,所以在值得信賴的人工智能的關鍵屬性列表中總是會加入進一步的考慮:這被交替稱為人類機構、監督或有意義的控制。在某些情況下,保持人類對技術使用的監督可能是唯一的保護措施,以防止無意中出現有偏見的、不可捉摸的和/或監管不力的人工智能系統的風險。

1.3 概念:控制(Control)

控制通常被看作是信任的反面。當對智能體執行任務的能力有信任時,就不需要監督。然而,即使在人工智能更適合做決定的情況下,人類也會經常傾向于干預。信任不足可能和過度信任一樣有風險或適得其反。事實上,正如絕對的控制是罕見的,絕對的信任也是如此。在開發和使用人工智能的過程中,有必要在適當的信任水平和適當的控制水平之間取得謹慎的平衡。這是 "校準的信任 "或可適應/適應性自主性等概念的核心。信任是根據人工智能的能力來校準的,對人工智能能做什么或不能做什么的期望將影響信任的水平。同樣,在可適應的自主性的情況下,用戶定制自主性水平的能力可以支持更大的信任水平。這在國家安全決策中尤為關鍵,因為信任或不信任人工智能的影響可能是最大的。

對技術在人類事務中的作用的擔憂并不新鮮。許多人認為關于人工智能的辯論與之前關于技術的爭論沒有什么不同。根據這一論點,人工智能構成了一種進化,而不是對過去活動的徹底背離,即使人類有時可能在背離以前的自動化水平的情況下被從決策圈中移除。雖然信任仍然是一個挑戰,特別是在機構和社會層面,但穩步應用最初仍然有限的人工智能來支持軍事活動,隨著時間的推移,可以培養出熟悉和越來越多的信心。

其他人,通常是政府以外的人,質疑這種漸進式的方法。他們認為人工智能的崛起是一種范式的轉變,與以前的任何技術都有質的不同。以前的技術都沒有將人工智能的雙重用途特性、傳播的便利性和實質性的破壞潛力結合起來。在過去,最具破壞性的技術都在政府的控制之下,或者在軍事領域之外幾乎沒有應用。此外,雖然以前政府主導了大部分新技術的開發,但這種趨勢幾乎完全逆轉;現在大部分投資和創新來自于工業。鑒于軍事和民用界限的模糊,以及我們的對手和競爭者對人工智能的投資,認為我們可以控制人工智能發展和使用的速度和程度是不明智的。在反思算法技術的進步時,一些人甚至進一步聲稱技術和人類之間的角色發生了逆轉,人們正在成為 "人類的人工制品"和"(技術系統的)智能體"。

如果我們接受對人工智能系統在未來如何操作(和運行)進行完全控制的限制,關鍵問題是我們如何在算法超過目前的性能水平后長期確保適當的交互和人類判斷。反應時間是軍事競賽中的一個關鍵優勢;加快OODA(觀察--方向--決定--行動)循環的各個方面,通常會給那些先到者帶來領先優勢。而這樣做只要一方開始使用人工智能來加快他們的決策和反應時間,另一方就會受到壓力。

2. 人工智能和人類機構

2020年12月,美國空軍首次使用人工智能副駕駛飛行了一架軍用飛機。這種被稱為ARTUμ的算法完全控制了傳感器的使用和戰術導航,而其人類隊友則駕駛著U2間諜飛機。這是首次出現人工智能控制軍事系統的情況。用美國空軍前首席采購官員威爾-羅珀的話說,ARTUμ "是任務指揮官,是人機團隊的最終決定者"。

甚至在ARTUμ演示之前,美國國防部已經開始了其全域聯合指揮控制(JADC2)計劃的工作。JADC2旨在打造連接五個軍種的傳感器,承諾對作戰環境進行快速分析,以便在幾小時或幾分鐘內做出決策。在未來的JADC2中,人工智能將允許快速處理數據,為目標識別提供信息,并推薦最佳的交戰武器(無論是動能還是非動能)。美國空軍的先進作戰管理系統、美國陸軍的 "聚合項目"(被稱為 "學習運動")和美國海軍的 "超配項目 "都在嘗試使用人工智能與自主性相結合的方式來支持JADC2。

其他國家,包括英國通過英國陸軍的 "Theia計劃"等項目,以及北約也已經開始嘗試使用人工智能來支持C2和決策。然而,這種試驗的規模和范圍仍然有限。與數據挖掘和語言翻譯等領域不同,人工智能在軍事決策中的應用仍處于起步階段。

美國國防部高級研究計劃局目前開展的工作提供了對未來的一瞥。作為其 "AI Next "項目的一部分,該機構的第三波人工智能投資尋求 "將計算機從工具轉變為解決問題的伙伴",并 "使人工智能系統能夠解釋其行動,并獲得常識性知識并進行推理"。

2.1 人工智能的民事與軍事用途

人工智能已經塑造或推動了我們的許多日常決策。在某些情況下,它已經改變了整個行業。在高度交易性的活動中尤其如此,如保險或零售部門。人類已經將關鍵活動的責任交給了人工智能,讓算法在沒有人類干預的情況下做出決定。今天,人工智能塑造了谷歌和Facebook等網絡平臺提供的內容,也決定了哪些內容被刪除或屏蔽。保留了人類因素的人工智能決策支持系統也在激增,被用于從醫療診斷到改善制造工藝的各個方面。

很少有地方像金融業那樣,人工智能從根本上改變了人與機器的關系。人工智能現在負責絕大多數的高頻交易。在幾毫秒內做出的數千項微觀決定有能力改變整個財富,有時會帶來毀滅性的后果,2010年的 "閃電風暴 "證明了這一點。人類的決定對于金融市場的效率不再是必要的,事實上,甚至可能會起到反作用。無形的算法似乎已經超越了無形的手。

至于社會的其他部分,人工智能的潛在軍事用途涵蓋了廣泛的應用范圍。這些可以有效地分為企業、任務支持和業務人工智能應用。人工智能的軍事應用,特別是與任務支持和作戰用途有關的應用,在一些基本方面與日常的民用活動不同。在平民生活中,人工智能有機會利用大量容易獲得的數據,不斷針對現實生活中的例子進行訓練和學習。對于軍隊來說,與對手的接觸是零星的,來自真實行動的教訓或 "數據 "在數量和頻率上都相對較低。除了軍事對抗的偶發性質,國家安全決策通常依賴于一套復雜得多的條件,涉及多個參數和利益相關者(更不用說對手的意圖),而今天的算法沒有能力再現這些條件。最后,也是最重要的一點,在國防和國家安全問題上,面臨風險的不僅僅是財富,還有生命。數學邏輯不足以為決策提供依據;在使用武力時,道德和倫理考慮比任何其他人類活動都要突出。當人類生命的完整性受到質疑時,我們為技術設定的標準將永遠高于我們為容易出錯的人類設定的標準。

除了美國、英國和北約等國的現行政策外,人們普遍認為人類將在決策中保留一個關鍵角色。美國國防部的人工智能戰略指示以 "以人為本的方式 "使用人工智能,有可能 "將人類的注意力轉移到更高層次的推理和判斷"。納入人工智能的武器系統設計應 "允許指揮官和操作人員對武力的使用進行適當的人類判斷",并確保 "清晰的人機交互"。提到人類總是 "在循環中 "和 "完全負責選項的開發、解決方案的選擇和執行"--這是以前對我們日益自動化的未來的評估中的常見說法--已經被一種更細微的觀點所取代。

所謂的有監督的自主系統是指人類坐在 "循環 "上。雖然人類在理論上保持監督,但一些批評者認為,在實踐中,他們可能無法真正控制自動決策,因為他們可能不熟悉為他們提供決策信息的環境和人工智能程序。在這些情況下,人類的干預能力,除了停止機器之外,被降到最低,沒有達到"有意義的人類控制 "的想法。只有在完全自主系統的情況下,人類的干預才會被完全消除。然而,最終,試圖定義自主性水平的做法可能會產生誤導,因為它們假定人類和機器之間的認知活動是簡單分離的。2012年美國國防科學委員會的一份報告描述了如何:

  • 沒有完全自主的系統,就像沒有完全自主的士兵、水手、空軍或海軍陸戰隊一樣。也許對指揮官來說最重要的信息是,所有的系統在某種程度上都由人類監督,而最好的能力來自于人類和機器的協調和合作。

兩個領域的發展揭示了各國政府在國防和國家安全的關鍵決策中信任先進的自動化方面已經走了多遠。一個是導彈防御,另一個是網絡防御。兩者的有效性都取決于反應速度,這通常超過了最有經驗的人類操作員的能力。

大多數防御性武器系統,從短程點防御到反彈道導彈系統,都采用先進的自動化操作,使其能夠在沒有人類干預的情況下探測和摧毀來襲導彈。算法實際上是在發號施令。在這種系統中,人類被稱為 "循環",在事先經過嚴格的人類測試后,在有限的設計空間內運作,因此其控制范圍受到限制。雖然錯誤永遠不可能被完全消除,但在大多數情況下,不做出反應或反應遲緩的風險可能超過偶爾發生事故的風險。雖然事故促使人們對這些自主系統的操作進行審查,并可能導致引入一些進一步的人為檢查,但這種干預也帶來了進一步的復雜性。對越來越快的導彈,特別是高超音速導彈的防御將繼續推動人工智能在導彈防御中的應用。

網絡戰是人工智能相對于人類具有明顯優勢的另一個領域,而這往往需要人類保持置身事外。人類操作員缺乏算法快速檢測和應對網絡事件以及不斷調整系統防御的能力。所謂的認知電子戰(EW)系統應用人工智能技術來自動檢測對EW系統的威脅,而不是依賴人類操作員。

2.2 人類和人工的局限性

將決策過程中高度耗時、勞動密集型和需要低層次人類推理的部分自動化,有巨大的好處。軍事評估過程是軍事決策過程的一個關鍵部分,一直是參謀學院教授的標準作戰計劃過程。這種方法的一部分涉及收集和處理信息,為一個或多個行動方案提供信息。由于信息時代的決策需要更大的速度和敏捷性,達成決策的過程將需要加速。人工智能已經證明了它在基于明確定義的規則、輸入和假設快速執行理性過程中的效用。只要人類負責設定假設并定義產生替代方案和概率評估的輸入,人工智能就能增強整個決策過程。

可以理解的是,政府內部和外部都不愿意讓人工智能發揮超出決策支持和適當決策的作用。"指揮和控制"的概念在軍隊的心理和結構中根深蒂固,許多人無法接受一個在某種程度上不涉及人類控制軍事行動或指揮任務的未來。人被要求帶著他們對問題的創造性見解,像現代的亞歷山大一樣解開這個死結。沒有什么比對 "翠鳥時刻 "的信念更能體現這種對直覺型指揮官形象的依戀。這種技能,即指揮官藝術的精髓,只限于那些在最苛刻的情況下能夠憑直覺做出決定的少數人。人工智能提供并非基于人類邏輯或經驗的獨特見解的能力,對這種思維提出了深刻的挑戰,并可能在未來改變指揮官的形象。

許多人將人工智能稱為決策支持而不是決策工具,其推論是人類最終仍然是所有決策的仲裁者。這樣的區別造成了一種令人放心的錯覺,即人工智能只是協助實現一種效果。人類根據一套算法挖掘、篩選和解釋的數據做出的致命行動決定,是否比由智能機器完全執行的決定需要更多的人類機構?對 "行動 "的癡迷--更不用說致命行動--作為更廣泛的 "殺傷鏈 "的最后元素,掩蓋了人工智能在整個行動范圍內的一系列C2活動中日益增長的影響。

許多專家對人類是否有能力控制由人工智能促成或驅動的決策持懷疑態度。這種懷疑往往圍繞著所謂的黑盒問題:高級人工智能,如深度學習,在本質上是無法被人類理解的。這不僅僅是由于它的工作速度,也是由于算法網絡相互作用的方式,以及它們所操作的數據的規模和復雜性。我們不能簡單地詢問系統以了解其思維過程。我們可能知道一個模型的輸入和輸出,但卻無法理解這中間發生的事情。一個相關的、更微妙的論點是,算法對人類的認知攝入施加了 "權力"。人工智能可以決定人類處理哪些信息,而不向他們透露哪些信息被遺漏或拒絕。它還挑戰了這樣一個概念,即如果人類的行動受到數據呈現的內容和方式的制約,他們可以行使 "有意義的 "控制。這與人工智能的好處之一正好相反,即它能夠減少人類的認知負荷,使人類能夠集中精力思考和作出最高價值的活動。

對黑盒挑戰的典型解決方案是開發可解釋的人工智能(XAI)。盡管能夠自我解釋的人工智能可能有助于理解,但它并不必然會導致信任。XAI并不等同于可解釋的AI;解釋不是一個決定,而是一個關于決定的敘事。因此,即使是一個令人信服的解釋也不一定是真的。對于許多潛在的用例,我們還遠遠沒有能力開發出足夠的可解釋(Explainability)的人工智能,更不用說可因果解釋(Interpretability)的了。對更先進的人工智能系統進行嚴格的測試可能會證明它們的部署是足夠的,即使是在沒有人類能力遵循其推理過程的情況下。不過,從根本上說,我們對測試的傳統方法需要重新思考。沒有充分的測試和評估,對不可解釋/可解釋的人工智能的信任將是 "盲目的信任"。對于美國前國防部副部長鮑勃-沃克的問題,我們仍然缺乏一個令人滿意的答案:你如何對學習系統進行測試和評估?

當存在不確定性或缺乏知識時,人類會應用啟發式方法來近似解決復雜問題。啟發式方法是驅動直覺思維的因素;它依賴于經驗法則,通常是通過經驗和實驗來了解。因此,它可能存在偏見和盲點,但它也可以作為一種非常強大和有效的快速認知形式。機器缺乏類似人類的直覺,但它們確實依靠啟發式方法來解決問題。與人類推理的關鍵區別在于,機器不需要記憶或 "個人 "經驗就能進行 "直覺 "或推理。它們利用巨大的數據庫和卓越的概率能力為決策提供信息。強大的模擬與先進的計算能力相結合,提供了一個測試和 "訓練 "算法的機會,其重復程度是人類無法想象的。在宣布任務準備就緒之前,ARTUμ在短短一個多月內經歷了超過一百萬次的訓練模擬。

即使在XAI領域取得了重大進展,仍然會有謹慎的理由,特別是在需要復雜決策的情況下。人工智能通常不善于看到 "全局",也不善于根據相關的內容做出決定。像人類一樣,它也會把相關性或偶然事件誤認為因果關系。人類和機器在處理復雜問題時都會遇到 "正常的意外"。創造力是人類通常具有的特質,但一些先進的人工智能可以產生人類無法企及的驚人結果。簡而言之,許多通常被認為是人類特有的屬性,如創造力和直覺,也可以說適用于人工智能系統--盡管方式不同,速度超過人類能力。

目前機器所缺乏的是人類思維的靈活性和關聯感("框架 "的能力)。人類可以橫向思考,通過實用主義得出合理的結果(這一過程被稱為歸納推理),并反思自己的思維過程(這一能力被稱為元認知)。這些心理過程可以產生驚人的適應和創新的壯舉。

人工智能的出現意味著未來的軍事決策將幾乎肯定需要更強大的人機共生關系,就像在已經接受該技術的商業組織中看到的那樣。目前的討論大多是假設人類繼續控制,或尋求將人類的屬性應用于未來的機器。一些人提倡一種新的 "決策演習"概念,將 "人的指揮和機器的控制"結合起來。但更有可能的是,指揮和控制的責任將越來越多地由人類和人工智能系統分擔,其方式可能是目前難以設想的。人類與人工智能的合作提供了利用各自優勢和減少不足的最佳方式,特別是在戰爭方面(目前戰爭的性質仍然沒有改變)有四個連續性:政治層面;人類層面;不確定性的存在;以及戰爭是一場意志的較量。

3. 信任的維度

信任是動態的;它隨時間而變化。它的最初形成是至關重要的,但它的持續發展也是如此。信任是隨著熟悉程度的提高而自然產生的,因此,假設經驗是積極的,即使是在對技術不完全了解的情況下,技術的使用也會擴大信任的范圍。反過來也是如此,不好的經驗會促進不信任。移動電話技術復雜性對大多數用戶來說是未知的,但人們的積極經驗給了他們使用的信心。這種信心導致了與手機使用所形成的決定相適應的信任感。然而,手機一般不會決定生死大事,盡管它們會將盲目聽從指示的不謹慎的司機置于危險之中。在軍事背景下,賭注更大,用戶和策略制定者非常清楚他們的決定的潛在后果--信任門檻很高。

軍隊作為應急組織,不需要定期交付其主要產出,這影響了可以獲得最直接相關經驗的速度。與金融服務業不同的是,在金融服務業中,交易為人工智能決策提供了頻繁的驗證,而國防部門的時間線往往更長,結果在一個單一的因果鏈中也沒有明確的聯系。做出決定和觀察其影響之間的時間間隔更長,并受制于多種干預變量。雖然模擬演習創造了獲得經驗的機會,但它們只是現實的近似值。

3.1 信任點(Trust Points)

建立和維持信任涉及五個主要的 "Trust Points"--在這些點上,擁有適當水平的信任問題是至關重要的。這些點是:

  • 部署信任:使用人工智能的目的
  • 數據信任:正在使用的數據輸入
  • 過程信任:數據如何被處理
  • 輸出信任:由人工智能產生的輸出
  • 組織系統的信任:優化使用人工智能的整體生態系統

總的來說,這些Trust Points定義了一個整體的信任水平,并且是乘法的:如果對其中一個的信任是 "零",那么整體就是 "零"。只要整體信任是正向的,每個人的信任水平都可以變化--在不同的時間。

部署信任

對在特定情況下使用人工智能的決定的信任是至關重要的。對于人工智能的軍事使用(以及許多民用應用),這在三個層面上運作:社會;組織;和個人。第一個層面考慮的是整個社會是否愿意允許人工智能的使用,這將決定策略制定者如何看待它的使用。組織本身也必須愿意認可這一點。最后,個人必須愿意在這個角色中與人工智能合作。所有這三個層次都需要接受使用人工智能的必要性或其可取性的必然性。可取性可能反映了人工智能在以超過人類操作員的速度或數量(或兩者)處理數據方面的優勢,或在承擔枯燥或危險的工作方面的優勢。而軍方可能會認為,人工智能既實用又要避免將優勢讓給對手,但社會似乎更傾向于將致命的使用視為一個倫理問題,在這個問題上,人類生命的神圣性要求道德行為者決定奪取人的生命。

社會對人工智能使用的接受程度在很大程度上取決于其經驗、有效的溝通和教育,這將有助于為人工智能的使用選擇提供依據。在許多情況下,社會的某些部分可能會比軍方更多地接觸、熟悉和信任人工智能,但致命自主權可能仍然存在問題。雖然沒有致命自主權那么直接的威脅,但在決策中使用人工智能會帶來自己的挑戰,其中最重要的是在一個算法越來越強大、人機協作越來越緊密的世界里,"有意義的人類控制 "究竟意味著什么。

在組織層面,存在關于如何部署作戰和任務支持人工智能的重要問題:是以集中的方式在更高的戰略層面運作,還是以更分散的方式在戰術層面運作。在后一種情況下,人工智能將進一步滲透到組織中,變得更加分散,并用于反應時間可能限制人類干預或驗證人工智能的范圍。組織需要明確決定是否使用人工智能的原則,以及管理其使用的方法(見下文 "過程信任")。關于使用人工智能的決定必須考慮如果系統失敗會發生什么。美國國家航空航天局(NASA)由于擔心系統故障的后果而沒有充分利用其早期火星車的自主能力,對火星車進行微觀管理,并通過大型人類工程師團隊減輕風險。外部組織,如商業技術供應商,的想法也很重要。例如,谷歌的員工迫使該公司在2018年退出一份軍事合同,因為他們擔心軍方對面部識別技術的使用。

個人對人工智能的熟悉程度也將是重要的。目前,從事軍事人工智能工作的人是其使用的倡導者,但隨著接觸人工智能的人群的增加,這種情況將發生變化。與前幾代人相比,接觸技術較多的年輕軍人可能更容易接受人工智能在軍事決策中的應用,但在基礎等級的聯邦結構中,人才幾乎完全來自內部,對其使用的阻力可能來自那些有權力的人;這可能造成機構接受問題。然而,在 "代際特征 "方面,存在著過度簡化的危險。雖然年輕人是在較新的技術中長大的,而且可能更信任它,但技術是可以學習的。代際假設不能成為不使用現代技術的借口。

部署信任是復雜的,因為大多數西方國家的大規模防務活動都是以聯盟行動為前提的,而不是每個盟友或伙伴都對什么是可接受的人工智能的軍事用途有共同的看法。國防部和政府需要更好地傳達他們在使用人工智能方面的方法、用途和保障措施,包括向盟友傳達,而不向對手透露太多信息,因為他們可以制定戰略來抵消(或更糟)人工智能功能的優勢。北約將通過其公共宣傳活動、與成員國在政治層面的聯系以及在不同技術發展階段的軍隊中建立規范,在這方面發揮關鍵作用。

數據信任

這涉及到對人工智能做出判斷的數據的信任程度,這些數據為人類決策提供了依據。雖然測試硬件和軟件相對容易,但測試數據,甚至是準備讓人工智能接受訓練的數據,則更加困難。數據對于人工智能的有效學習至關重要。一些數據將被控制,駐留在現有的國防系統內,或從可靠的外部來源進行驗證,盡管國防部在數據的分類(不一致或不準確)、存儲、訪問和共享方面存在困難,特別是在較高的分類級別。不受控制的數據,如開放源碼數據,是在沒有人類知識或理解的情況下通過聚合產生的,這更具挑戰性。此外,狡猾的對手會試圖注入虛假數據,以破壞決策過程,或用不相關或不準確的數據淹沒決策過程。

武裝部隊需要定義、構建、清理和分析數據的能力,以及開發和維護底層基礎設施(如連接、安全和存儲容量)的能力。這是一個多學科的團隊工作,需要能夠在數據科學生命周期的所有階段工作的 "全棧 "數據科學家。現代戰場將需要更加多樣化的技能,包括心理學家、律師和通信專家。鑒于商業世界對這些技能的需求,吸引和保留這些專家的數量將是困難的。這將需要更靈活的人力資源做法和/或對整個部隊更復雜的理解和使用,包括允許非軍事人員在軍事總部擔任有影響力的職位。

過程信任

過程信任指的是人工智能系統如何運作,包括數據如何處理(匯總、分析和解釋)。目前英國國防部的(狹義的)人工智能決策支持系統吸引了高信任度,因為算法相對簡單且可預測。它們也僅限于參與開發的一小群用戶,或者認識那些開發了人工智能系統的用戶,并且了解該技術。該技術受益于一種源自人們對人類的信任的過渡性信任。雖然不是人工智能,但法國陸軍引進的包裝降落傘的機器導致了降落傘團的信心喪失。堅持要求機器的主管用機器隨機選擇的降落傘打包跳傘,有助于恢復用戶的信心。讓開發人員更接近指揮系統的用戶會有所幫助。法國的采購程序允許某些單位直接與人工智能供應商接觸,以建立對開發商的了解和關系。開發商成為一個關鍵的信任點,如果不是軍隊,他們必須了解和熟悉軍隊的情況。這可能需要加大投資,讓商業伙伴了解軍隊的工作方式,并確保軍事人員了解其文職同事。

要求高水平的可解釋性和透明度并不是一個永久的解決方案,目前限制了英國防部對更強大的、非符號形式的人工智能的訪問。隨著機器學習使技術超越其最初編程的參數,將需要不同的方式來確保對可能看起來是黑盒的信任。隨著這種人工智能系統的使用激增,因了解設計者而產生的過渡性信任將減少,在這個過程中克服最初的信任不足或過度信任將更加困難。應避免過度依賴過程信任,并加強其他信任點,以開發適應能力越來越強的人工智能。

過程信任必須超越技術本身。它需要信任那些為技術提供能量、與技術一起工作并接受技術產出的人類過程。因此,必須同樣重視那些共同構成整體過程的其他活動。這包括培訓和人員的過程,以及如何組建團隊。

輸出信任

對人工智能產出的信任對決策者根據他們收到的信息采取行動至關重要。即使是人類提供的情報,如果原始信息指向不同的方向,指揮官要求新的情報來支持他們的先入之見(一種 "基于決策的證據制作")也不是沒有。而隨著數據的激增,不同的解釋將成為可能,合法的或符合先入為主的解釋。因此,出現了這樣的問題,即人工智能或事實上的人類分析能夠現實地提供什么答案,以及如何驗證輸出。在友軍的部署和對手的物理位置方面,人工智能有可能提供更快的態勢感知。然而,盡管可以從現有的數據中得出更好的推論,但對手的實際意圖是無法可靠地確定的。可預測性通常被視為信任的關鍵因素,但在不穩定的環境中,能夠適應不穩定環境的人工智能輸出會被解釋為不可預測。為了克服這個問題,Bonnie M Muir認為,人類操作員必須具備估計技術可預測性的能力。這種可預測性也會影響整個部署和過程信任點,但在輸出信任方面最為敏感,以反映軍事行動等流動性和不可預測的環境。在這些情況下,數據還必須反映軍事決策者所面臨的大多數情況的離散性和特定對手的獨特文化方式,這加劇了建立大量訓練數據的難度。即使在情況類似于過去的事件時,由于缺乏可比的歷史數據來說明廣泛的變量,使得概率推理變得困難。

用Patricia L McDermott和Ronna N ten Brink的話說,輸出的校準是至關重要的。這可以通過更多地使用企業人工智能和模擬來實現,它擴大了信任的邊界,可以幫助開發輸出信任。如果經驗是積極的,與技術互動并看到它的輸出將產生信任。在作戰環境中,當描述可以知道和檢查的東西時,驗證將是最容易的(例如,關于自己部隊的數據和潛在的對手部隊的布局)。要接近了解對手的意圖是比較困難的,因此需要更高水平的輸出信任。這將包括提高描述的準確性和對從大數據處理中得出的推論進行更多的測試。分享演習和行動的正面敘事,對于實現過渡性信任和緩解從相對不頻繁的行動中積累成功證據的緩慢速度至關重要。

組織系統的信任

生態系統的信任涉及調整更廣泛的組織系統以最大化人工智能的價值所需的信任。C2系統作為一個整體必須被配置為利用人工智能輔助決策的好處,并有適當的檢查和平衡,以在可接受的風險水平內運作。當人工智能的弱點或失敗是在主管的專業知識之外的領域,需要在組織的不同部分進行校準時,這一點尤其重要。如果不在生態系統和組織層面上進行變革,組織將只是將其人類系統數字化。

需要生態系統的信任,以確保結構--包括軍事總部的組織、指揮官的角色以及集中式與更分散或分布式的決策權的平衡--準備好利用人工智能的機會。如果沒有準備好,采用人工智能的漸進式方法往往會鼓勵對結構和整體生態系統的變化采取被動或消極的方法。相比之下,實現人工智能變革力量的專門戰略將迫使人們盡早重新思考支持這種戰略所需的組織。這需要重新思考傳統的軍事結構,但對于走多遠并沒有共識。一些人設想總部變得更扁平,并將非軍事人員納入高級職位,在決策過程中擁有權力。對另一些人來說,生態系統的變化更為深刻;它要求完全取消目前被視為工業時代遺留的工作人員組織系統。這樣做,他們打算消除扼殺理解的信息邊界,并挑戰決策金字塔尖上的獨當一面指揮官的想法。這種轉變需要整個組織生態系統的信任。對于像軍隊這樣的保守組織來說,這將是困難的,在指揮部的激進替代方案被接受之前,需要得到保證。實驗、戰爭游戲和模擬環境提供了低風險的選擇,以測試為特定類型的任務(例如,戰爭、和平行動和能力建設)配置的不同總部結構。

3.2 多少信任是足夠的?

信任是根本,但為技術設定一個不可能高的標準也有風險。幾千年來,指揮官和決策者們一直信任易變的人類。當人工智能開始觀察到輸入數據分布的變化時,技術可以通過自我監測的方式提供幫助,提醒人類 "操作員",或以以前未曾見過的方式進行操作,這樣錯誤輸出的風險會更大。風險容忍度,無論是關于人類還是機器演員,最終都是信任的表達。國防組織需要對自己是否是快速采用者或快速或緩慢的追隨者持誠實態度:商業世界的人工智能發展速度使大多數武裝部隊極不可能成為人工智能決策的 "第一用戶"。漸進派和未來派都是人工智能的支持者,他們之間的差異主要是風險問題,以及針對不同信任點的可實現的信任水平。

通過熟悉產生信任是至關重要的,這可能涉及到將軍事人員嵌入到使用復雜人工智能的商業組織中,或將平民帶入國防。這種變化需要在足夠高的級別上進行,以促進生態系統的信任。模擬、實驗和演習是重要的工具,而且必須足夠廣泛,以便不局限于一小群狂熱者。英國電信公司用人工智能決策支持工具取代英國的電話網絡的項目,當服務時間最長、知識最豐富的工程師與人工智能和數據專家合作時,效果最好,他們可能會對人工智能產生懷疑。將企業人工智能引入改革業務流程,如財務和人力資源,是將熟悉程度擴大到目前直接參與人工智能開發和使用的少數干部之外的另一種方式。

一旦熟悉的東西,信任是人類的天性,但信任的習慣會帶來自身的風險。眾所周知,人類不善于設定正確的目標,當遇到 "專家意見"(無論是人為的還是其他的)時,他們更容易同意而不是懷疑。必須避免 "信任和忘記 "的動態。一個考慮因素是為人工智能系統制定一個 "持續可信性 "的概念,類似于航空平臺的持續適航性,以確保它們仍然適合使用。因此,建立對人工智能的信任(并避免過度信任)的努力必須解決所有的信任點,并包括整個人類-機器團隊,其中人類操作員是其數字對應方的有效合作者和建設性批評者。

4. 對指揮部和指揮員的影響

人工智能對決策的知情、制定和實施方式的影響將是深遠的。通過以超越目前人類進程的速度處理大量的數據,人工智能可以提高對作戰環境的理解,并減少決策者的認知負擔。這不僅僅是今天工作方式的演變。僅僅加快當前C2系統的速度是不切實際的。一輛設計為以70英里/小時速度行駛的汽車是為以該速度運行而配置的。將發動機調整到每小時100英里的速度也許是可能的,但會給車輛系統和駕駛員帶來無法承受的壓力。由人工智能驅動的決策所代表的不連續性需要一種新的方法。正如多國能力發展運動(MCDC)所述。

無論我們未來的C2模型、系統和行為是什么樣子,它們都不能是線性的、確定的和靜態的。它們必須是靈活的、自主的、自適應的和自我調節的,并且至少與它們形成和運行的環境一樣具有偶然性和突發性。

軍隊必須為明天的C2進行重組,并以不同的方式培養他們的指揮官和工作人員。如果沒有這些變化,"生態系統信任"可能被證明是不可能實現的。

4.1 指揮和控制

C2包含兩個不同的元素:指揮,通常與創造力、靈活性和領導力相關;以及控制,與規則、可預測性和標準化相關。人工智能將首先影響控制功能,目前,指揮仍主要是人類的活動。人工智能的數據處理能力將消除控制的大量負擔,例如,為指揮官提供對其部隊的更好理解(如部署、狀態、設備和供應水平),目前這需要消耗大量的注意力和時間。它還將改變向指揮官提供信息的方式。目前,這些數據大部分是在 "拉取"的基礎上提供的--根據總部的報告程序要求或零星地收集。然而,人工智能可以持續監測局勢,并通過強調相關變化的活文件將信息推送給指揮官--類似于24小時的新聞編輯部。然而,通過進一步進入控制領域,人工智能將不可避免地影響指揮權的行使,并形成指揮決策;這對上述指揮和控制之間過于整齊的區分提出了挑戰。在未來的C2系統中,可以想象人工智能可以限制指揮權的行使,就像防抱死制動系統、牽引力控制和電子穩定性允許人類駕駛員指揮車輛,直到失去控制,此時系統會接管,直到情況穩定下來。

人工智能給人類指揮帶來了一個悖論。它同時使更多的知識被集中掌握,使總部能夠看到并與 "前線 "發生的事情互動,并將知識擴散到整個指揮系統,使較低級別的編隊能夠獲得以前只有高級指揮官才有的信息。將更多的權力下放給地方指揮官可以提高反應能力,這在事件發展不可預測、需要快速反應的情況下非常重要。西方武裝部隊傾向于采用(或多或少)任務指揮的概念,即指揮官的意圖描述了預期的效果,并允許下級指揮官根據他們面臨的情況自由執行。軍隊的學習和發展系統以及演習嵌入了這種方法--指揮官將需要相信人工智能能夠在其操作中實施這一意圖。鑒于數據和獎勵功能的戰略復雜性和模糊性,人工智能在戰術和作戰層面的使用可能比在戰略層面的指揮更有效,盡管這些層面并不離散,在現實中也不容易被分割開來。人工智能和更大的網絡連接將提供一個結構、流程和技術網絡,連接多個小型、分散的前方總部和分布式(和加固的)后方功能,即使在更透明的戰斗空間,也更難發現和反擊。如果敵人以C2系統為目標,這將增強復原力。

在每個層面上處理更大數據量的能力必須被仔細引導。人們應該能夠獲得與他們的地位和相對能力有關的信息,以影響他們在環境中發展。W-羅斯-阿什比將此描述為 "必要的多樣性 "問題:一個可行的(生態)系統是一個能夠處理其環境變化的系統。行為者應該在適合其任務的抽象水平上運作。一個旅部不能處理也不需要關于單個士兵的詳細信息;它需要對其下屬單位的身體和道德狀況有一個良好的總體了解。在更多的戰術層面上,NCO指揮官應該對他們團隊中的個人狀態保持警惕。戰略和作戰指揮官可能需要放松控制,讓戰術指揮官在更接近戰斗的地方利用新出現的機會。雖然任務指揮已經允許這樣做,但隨著高級別的指揮官獲得關于戰術層面發生的信息的空前機會,"控制"的誘惑會更大。

人工智能也需要使用抽象、近似和校準的杠桿,以避免將總部淹沒在數據洪流中。這需要在使用這些抽象和近似時的 "過程信任"。總部也可能需要使用不同的人工智能系統,其能力更適合或不適合不同時間范圍內的不同場景。決策也可能包括確定在特定情況下信任哪種人工智能模型(部署和過程信任)的因素。

人機聯合系統的自動化將提高人類的表現,在某些情況下,改變任務本身的性質。無論在什么層面上部署,人工智能不僅會影響人類執行任務的方式,也會影響人類執行的任務。目前的方法通常從研究哪些人類過程可以自動化開始,即人類工作的數字化。有可能從使用人工智能的假設開始,只有在人類是必要(出于法律、政策或道德原因)或可取(更適合這項任務)時才將人類放入系統中--決定什么不應該,而不是什么可以被數字化。這種方法挑戰了目前關于總部的規模、組織、人員配置和運作的概念。

4.2 對未來總體結構的影響

聯合概念說明(JCN)2/17指出,C2有可能在不同的戰爭層次(戰略、作戰和戰術)上發生變化,并對作戰環境的變化特征做出反應,因為作戰環境不再僅僅是物理環境。戰爭與和平的模糊性--強調了在 "行動 "和 "作戰 "之間的連續過程中有效的必要性--以及英國向能夠持續參與的部隊結構的轉變,將需要超越戰斗所需的方法。然而,可能沒有單一的總部原型;因此,為戰斗而配置的總部將與處理上游參與和能力建設的總部不同。雖然現在確定人工智能對軍事總部的影響還為時過早,但商業組織已經發現,與傳統的垂直層次結構相比,具有更多橫向信息共享的扁平結構更適合利用人工智能的優勢,因為在垂直層次結構中,每一層都要保證和授權數據才會被發布。因此,軍事總部--無論其具體形式如何--很可能會比現在更小、更扁平,能夠更快地沿著水平線工作。

探索替代的總部概念可以通過更多地使用實驗和模擬來實現。這應該對經典的J1-9參謀部提出挑戰,或許可以用新的分組來反映人工智能取代人類密集型數據處理和共享任務的能力。在J3/5區域尤其如此,這是計劃和行動之間的界限;由更快的決策帶來的更快節奏的沖突使這種界限變得過時。組織總部的替代方法可能包括那些注重結果的方法。JCN 2/17中描述的英國常設聯合部隊總部(SJFHQ)的結構是圍繞著四個職能來組織的:理解;設計;操作;和啟用。SJFHQ后來又恢復了傳統的J1-9人員分支。然而,"聯合保護者2021 "演習是一項復雜的亞門檻行動,其中使用了人工智能決策支持工具,揭示了J1-9架構的弱點。總部開始演習時是為高強度戰爭而配置的,但隨后調整為更適合與其他機構合作的配置。SJFHQ內部正在開展工作,應用2021年聯合保護者的經驗教訓,并確定這對總部結構意味著什么。然而,不太可能有一個完美的總部模式適用于所有行動類型。需要進一步的實驗,不限于SJFHQ。很能說明問題的是,自JCN 2/17發布以來的四年多時間里,在實施其中的一些建議方面幾乎沒有取得進展。即使英國國防部采用技術的速度相對緩慢,但這也超過了國防部探索改變結構的能力,超越了小規模的愛好者群體。"生態系統信任"是至關重要的,需要有機會在模擬或真實的環境中對各種任務類型的替代方法進行測試,并讓更多的人參與進來,這對有效采用新技術、結構和過程至關重要。

現有的程序需要改變以連接和優化新的結構。這可能需要改變構成武裝部隊規劃過程基礎的軍事評估。雖然它是一個復雜的、符合邏輯的規劃工具,但它是相當線性的、確定性的,并且嚴重依賴于指揮官,特別是在 "指揮官領導 "的英國方法中。在其他國家,參謀部在推動解決方案方面發揮了更大的作用,這可能更適合于人工智能的方法。人工智能為更多的迭代和協作過程提供了機會,它能更好地響應軍事和民防資源中心的要求,轉向更敏捷的模式。新的方法應該給指揮官帶來更少的壓力,要求提供信息(指揮官的關鍵信息要求)。人工智能還可以構建、分析和比較作戰行動方案,允許在做出大規模投入部隊的選擇之前對情景進行建模、測試和完善。

英國常設聯合總部(PJHQ)的情報評估過程自動化的思想實驗發現了取代大量工作人員的機會,加快了總部的戰斗節奏,并允許使用自動總結和自然語言處理來橫向共享信息。在一次作戰部署中測試了這一點,英國第20裝甲步兵旅戰斗隊將部分計劃過程縮短了10倍。然而,當人類仍在環路中時,決策環路的速度可能是有限的。在某些時候,人類決策者將無法跟上,成為決策監控者。如果仍然需要人類來做人工智能自己不能做的決定,這將是一個問題,而這可能是最困難的決定。

盡管有明顯的優勢,但總部不太可能在技術允許的范圍內減少。目前的總部通過規模和保證程序的冗余來補償人類的脆弱性,這對于減輕人工智能團隊成員的脆弱性可能仍然是正確的。此外,隨著戰斗節奏演變成連續的24小時規劃周期,節奏的加快可能會推動某些領域的需求上升。這些壓力可能并不局限于總部本身;它可能會推動前線單位的活動增加,他們必須處理數據并對所發出的指令作出反應。人類行為者仍然需要時間來休息,即使技術不需要。此外,與商業組織不同,軍隊需要冗余,以應對競爭對手蓄意破壞或擾亂他們的決策機構,并需要確保固定基礎設施的安全,以建立他們的網絡。簡而言之,對彈性和流動性的需求影響了軍事C2系統的穩健性和效率。因此,軍隊將需要保留不完全依賴人工智能進行有效操作的結構,并確保在人工智能失敗或故意削弱對人工智能信任的情況下,有恢復性程序可用。

4.3 培養指揮官

傳統上,指揮官是垂直決策結構的頂點,是所有信息的匯集點。雖然不是所有的軍事文化都強調個人的天才,正如 "翠鳥時刻"的概念所體現的那樣,但指揮官獲得信息的特權被總部的低層人員所拒絕。人工智能使信息民主化的潛力將改變這種情況;指揮可能會成為一種更加合議和反復的活動,不僅涉及那些穿制服的人,而且包括情報機構和具有數據科學多方面專業知識的承包商在內的更加折衷的組合--一種 "全部隊"的貢獻。面對一個復雜和適應性強的戰斗空間,另一種鳥也許為未來的指揮提供了一個更好的比喻:椋鳥。它們集體的、高度適應性的雜音為英國的發展、概念和理論中心的C2概念提供了一個更好的形象,即 "為設計和執行聯合行動而配置的動態和適應性的社會技術系統"。

指揮官必須繼續能夠處理動態環境;"沒有計劃能在與敵人的接觸中幸存下來 "這句話仍然是正確的。鑒于技術能夠提高速度(減少反應時間)和復雜性(通過更透明的戰斗空間),處理復雜、快速演變的問題將尤為重要。軍事組織正在試驗人工智能將如何改變C2,包括北約卓越指揮與控制中心、美國JADC2和英國軍隊的數字準備實驗。早期的跡象表明,指揮官將不得不更多地關注問題的框架,并確保在更小、更扁平的結構中的更多不同團隊之間的理解和目標的統一。這表明需要一個不同類型的指揮官和不同類型的工作人員;他們能夠整合由不同學科的成員組成的不同團隊的工作,而且往往是來自軍隊以外的成員。

確保指揮官能夠正確地設定問題的框架是至關重要的。人工智能非常善于在框架內操作,但目前至少在 "閱讀字里行間 "或從定義不明確的數據集中推斷方面很差--這種脆弱性仍然依賴于有人類來設定框架。在確定了問題的框架后,指揮官必須能夠判斷產出在該框架內是否合理。這需要能夠看到大局的人,武裝部隊需要通過在總部的參謀經驗來培養未來的指揮官,使他們熟悉環境和流程,從而能夠在越來越高的級別上進行指揮。模擬可以促進對總部的接觸,同樣可以確保較小的總部仍然保留人們獲得經驗的作用,通過這些經驗可以獲得必要的指揮技能。

雖然指揮官需要知道如何與技術互動,但他們必須繼續關注人工智能所要服務的作戰要求,并對其持適當的懷疑態度,以便他們成為這一過程中的知情者,而不是算法輸出的被動接受者。指揮官需要類似于工業界的 "π型領導人",在軍事專業的同時具有數字和數據意識。他們不需要成為技術專家,但應該有足夠的知識來了解其局限性,能夠與團隊中的專家合作,并有足夠的滿意度來允許對數據、流程和產出的信任。

集體而言,總部團隊需要這些技能,各個團隊成員能夠相互交流和理解。這超出了情報分析員的范圍,包括來自武裝部隊內部和外部的廣泛的行動、技術和數據專家。它還包括對風險更復雜的理解和溝通能力。戰爭從根本上說是一個風險管理的問題,這需要以經驗的方式來理解和溝通風險。因此,了解概率和信心水平是一項關鍵的指揮技能,但諸如沖突中的一次性決定也需要長期的判斷。

軍事教育需要通過在職業生涯中更早地引入數據和技術意識來應對。此外,軍隊對不同能力的評價方式也需要改變。據傳聞,英國陸軍的職業管理流程往往將那些在計算能力上取得好成績的人引向采購等領域,而不是作戰,被選入參謀學院的專業人員往往在計算能力上處于較低的四分之一。這不僅僅是軍隊面臨的挑戰:有望成功競爭的國家需要國家教育系統認識到數據和技術素養技能的價值,并從小培養他們。作者并不主張將教育變成就業前培訓;雖然需要STEM技能(數量比現在多),但人文和社會科學仍然很重要,培養出的畢業生適應性強,能夠解決復雜的問題,并以影響力進行溝通。國家的成功取決于學術和其他形式的多樣性,培養人們在數字世界中茁壯成長,不僅需要技術能力,還需要(人文)特質,如創造力和情商。指揮官和工作人員在未來將需要這兩套技能,也許比今天更需要。

除了分析之外,直覺是信息處理中的一個補充部分。在指揮官需要行使的雙軌制決策方法中,它是人類認知的一個重要部分。有效的決策結合了直覺和分析的優勢。當數據和直覺一致時,決策者可以放心地采取行動。如果它們不一致,則需要在行動前進一步探索。1983年,俄羅斯中校Stanislav Petrov避免了潛在的核戰爭。他的導彈探測系統報告說美國發射了五枚洲際彈道導彈,但他沒有立即報告,而是決定等待,因為這個信息感覺不對。他的(下意識的)雙模式決策使他做出了正確的決定。人工智能更強的數據處理和分析能力可以增強決策過程中的分析要素,但它需要指揮官認識到直覺的價值和局限性。專業軍事教育需要反映出對數據和直覺這兩個組成部分的平衡方法。

4.4 管理整個部隊

未來的指揮官所指揮的團隊必然比今天更加多樣化,領導跨學科團隊為復雜問題帶來新的見解。人類有效構思和發展直覺的能力通過接觸不同的看世界的方式得到加強。這不僅僅是改善受保護特征方面的多樣性,盡管這很重要,還包括確保整個部隊團隊中教育、經驗和觀點的廣泛性。整個部隊的不同元素是這種多樣性的一部分。

越來越多的跨軍事領域的綜合活動要求整個部隊的各軍事部門有效合作。對于正規軍事人員,在 "聯合"方面已經取得了進展,但還需要做更多的工作。在軍事生涯的早期引入聯合訓練是實現這一目標的一種方式;這可能需要重新思考軍事人員何時接受專業軍事教育,目前在英國是在30歲左右。相比之下,澳大利亞國防軍為參加澳大利亞國防軍學院的人員提供了基本的聯合軍事課程,海軍、陸軍和空軍專家也接受了單一軍種培訓。這為未來的指揮官在軍事生涯早期的成長提供了一個跨學科的 "聯合 "模式。正規軍的進展需要擴展到后備軍的整合,因為未來可能會有更多的技術專家駐扎在這里。

事實證明,整合整個部隊的非軍事因素更為困難。Serco研究所的一份報告指出,"盡管在過去十年中,整個部隊的運作取得了進展,但在實現軍事和工業之間的無縫合作方面的努力卻停滯不前。雖然武裝部隊在將非軍事人員帶入其總部方面做得更好,但在場和被納入之間有很大區別。如2021年聯合保護者等演習,經常邀請國際合作伙伴和民間主題專家來幫助規劃過程,但他們往往在軍事規劃人員完成工作后才被邀請對計劃發表意見。許多總部的規劃周期缺乏靈活性,這意味著當規劃被提出來供審查時,可能已經來不及進行修改了。

這不僅僅是對軍隊的觀察;文職專家往往不熟悉軍事進程,等待被邀請做出貢獻,這削弱了他們的影響力。軍事人員沒有本能地理解他們的非軍事同事所能做出的全部貢獻,因此沒有將他們納入其中。人工智能將迫使人們從一開始就需要在規劃過程中建立整個部隊的多樣性,從而使計劃成為真正的合作。

有了人工智能的能力,技術將越來越多地成為整個部隊的一個成員。國際象棋大師加里-卡斯帕羅夫(Gary Kasparov)曾指出,好的技術和好的人類棋手的結合,往往比卓越的技術或更好的人類棋手單獨工作更成功。在某些情況下,人和機器可能在共享任務中緊密結合,以至于他們變得相互依賴,在這種情況下,任務交接的想法就變得不協調了。這在支持網絡感知的工作設計中已經很明顯了,在這種情況下,人類分析員與軟件智能體相結合,以近乎實時的方式理解、預測和回應正在發生的事件。

從這些人機一體的團隊中獲得最大利益,不僅僅是有效的任務分配。它涉及到找到支持和提高每個成員(人或機器)績效的方法,從而使集體產出大于單個部分的總和。正確的行為和創造包容性文化的能力對于從這樣的團隊中獲得最大收益至關重要。指揮官不應專注于試圖管理 "突發事件"--一個試圖描述簡單的事情如何在互動中導致復雜和不可預測的結果概念--或團隊成員的活動,而是需要在塑造團隊和培養團隊內部的關系方面投入更多。

雖然人工智能目前作為一種工具,但隨著技術的發展,它應該被視為團隊的真正成員,擁有影響人類隊友的權利和對他們的責任。然而,無論其最終地位如何,人工智能都可能改變團隊的動態和對人類團隊成員的期望。將人工智能引入一個團隊會改變團隊的動態,而它與人類團隊成員的不同會使團隊的形成更加困難。通過布魯斯-塔克曼(Bruce W Tuckman)的經典階段,即形成、沖刺、規范和執行,需要妥協和適應。人工智能目前不太能做到這一點,需要人類參與者有更大的靈活性,這使得建立人機團隊更加困難,也更難恢復已經失去的信任。

高級人工智能,如果可以說有動機或偏見的話,很可能是以邏輯和任務為導向的(用實力部署清單術語來說,就是綠色和紅色)。一個平衡的團隊將越來越需要能夠維持團隊關系的人類,無論是內部還是跨團隊。因此,人機團隊將是不同的,盡管他們可能與包括神經多樣性同事在內的純人類團隊有一些相似之處,因為對他們來說,感同身受或理解情感線索是困難的。與神經多樣性團隊一樣,人機團隊將受益于團隊成員的多樣性給整體帶來的價值,但也需要進行調整,以最大限度地提高團隊績效的機會。人工智能作為團隊成員的概念究竟會如何發展,目前還不清楚,但有人呼吁組織在更平等的基礎上考慮先進技術的需求。加強企業人工智能在業務支持活動中的使用,將為探索人機團隊如何最有效地合作提供機會,并有可能實現預期運行成本的降低,使人類在價值鏈上從事更有意義的工作。

4.5 職業管理

需要的新的領導風格、新的技能和對技術、數據和風險的進一步理解也需要新的職業管理方法。軍隊的職業管理系統(過于)頻繁地調動人員,但要形成具有必要信任度的有效團隊需要時間。軍隊可能會放慢關鍵人員的流動,甚至可能放慢團隊的流動,從而使總部高級團隊作為一個集體實體而不是個人來管理。然而,目前的人力資源實踐使軍隊或工業界不太可能愿意無限期地保留人們的職位以期待未來的需求。用拉斐爾-帕斯卡爾和西蒙-鮑耶的話說,這就產生了 "混合團隊",即那些成員不固定的團隊,對他們來說,迅速建立團隊信任的能力至關重要。即使是常設總部也會受此影響,特別是當他們成為 "整體部隊 "時。對于'臨時團隊',例如為特定任務而設立的臨時總部,這個問題就更加突出。需要有機制來加速信任的發展,經驗表明,這可以通過早期的行為實踐來實現,包括展示 "技術能力、信息公開、支持互惠和決策中被認為的誠信"。

放慢總部高級職位人員的流動速度將有所幫助,但這還不夠。在無法保證預先建立的團隊在需要時隨時準備好執行任務的情況下,需要有一種方法來減少組建新的部隊團隊的時間。模擬提供了一種方法,通過壓縮任務演練的時間來準備新組建的團隊,并為整個部隊的不同組成部分提供共同工作的經驗。軍隊在這方面做得很好;軍隊的社會化進程創造了強大的紐帶,包括派人到合作伙伴那里進行培訓、演習和任務。對于整個部隊的其他部分來說,這種對跨文化理解的投資是缺乏的。建立對對方的了解,從而建立信任,對文職部門來說同樣重要。軍隊可以做得更多,為其工作人員提供與商業部門合作的經驗,包括與技術專家、數據專家和編碼人員合作,而文職人員也需要更好地了解軍隊、其語言、流程和價值觀。武裝部隊可以通過提供交流任命和模塊化和/或縮短其課程來協助這一進程,使文職人員有可能參加。冠狀病毒大流行引入了新的工作方式,并加速了軍事訓練和教育的變化,這可以為信任提供基礎,在此基礎上可以出現新的團隊和總部類型。

簡而言之,人工智能輔助決策不僅僅是一個技術問題;它需要改變指揮結構、流程和人員技能,才能發揮其潛力,成為武裝部隊在所有任務中運作的一場革命。然而,至關重要的是,在適應不斷變化的戰爭特征時,武裝部隊不能忽視戰爭的持久性:指揮官必須保持領導者和戰士的身份,能夠激勵普通人在最困難的情況下做出非凡的事情,而不僅僅是善于管理戰斗的人。在軍事方面,人工智能是一種工具,可以最大限度地提高武裝部隊在激烈競爭環境中的獲勝機會。

5 結論

人工智能正迅速成為我們國家安全結構的一個核心部分。軍方和情報機構正在嘗試用算法來理解大量的數據,縮短處理時間,并加速和改善他們的決策。對人工智能越來越多的使用和熟悉可以促進對它的信任,但正如專家們的辯論所表明的那樣,要建立和維持對像人工智能這樣的變革性技術的信任,存在著嚴重挑戰。

本文重點討論了人工智能的作戰和任務支持應用,并探討了不斷發展的人與人工智能關系對未來軍事決策和指揮的重要性和影響。當軍事指揮官的角色從控制者轉變為團隊伙伴時,當我們不能再將輔助功能只賦予人工智能體時,那么我們就需要從根本上重新思考人類的角色和我們的機構結構。簡而言之,我們需要重新評估人機決策中信任的條件和意義。沒有這種信任,人工智能的有效采用將繼續比技術的發展更慢,而且重要的是,落后于我們一些對手采用人工智能的速度。

一個稍加修改的信任概念--一個不需要將意向性或道德性歸于人工智能體的概念--可以而且確實適用于AI。只要我們委托機器做可能對人類產生嚴重甚至致命后果的事情,我們就會讓自己變得脆弱。只要存在人工智能的表現達不到我們預期的風險,對它的任何使用基本上都是一種信任的行為。

除了最罕見的情況,對人工智能的信任永遠不會是完全的;在某些情況下,用戶可能有意識地同意較低的信任水平。這種信任需要考慮五個不同的元素,作者稱之為 "信任點"。我們不應該依賴任何一個單一的點來產生整體的信任。事實上,往往得到最多關注的領域--關于數據質量或人工智能輸出的可解釋性問題--從長遠來看,必然會提供不令人滿意的答案,并有可能對技術產生錯位的放心感。

最常被忽視的是在組織生態系統層面上對信任的需求。這需要重新思考武裝部隊的組織及其C2結構。如果說機器的作用越來越大曾經是官僚軍隊結構興起的關鍵驅動力,以集中管理手段,那么人工智能正在以根本的方式挑戰常備軍的這一特點。如果人工智能的使用不僅僅是模擬工作方式的數字化,國防部必須改變其在 "行動(operate)"和 "作戰(warfight)"方面的決策結構。它還需要與整體部隊的各個方面進行更密切的接觸和參與,包括其未被充分利用的后備部隊以及工業和更廣泛的政府。

領導力作為軍事職業的一個持久要素也需要重新考慮。人們傾向于將領導力視為軍事指揮的一種抽象或不可改變的品質。在人工智能時代,指揮任務或領導團隊既需要新的技能(如 "表達數字(speak digital)"的能力),也需要更多樣化的特質(例如,在數據和直覺發生沖突時,橫向思考的能力,構建問題的框架,并應用批判性的判斷)。與以往相比,人工智能更需要那些能夠理解復雜性、構建問題并根據情況提出正確問題的指揮官。這些 "故意的業余愛好者 "摒棄了早期狹隘的專業化,選擇了范圍和實驗思維;他們可以建立專家團隊,吸取專家的意見,使集體人才既廣泛又深入。這些全軍團隊將包括人類和機器,所有這些人都將根據他們在塑造和決策方面的專長作出貢獻。

在尋求回答信任如何影響軍事決策中不斷發展的人與人工智能關系時,本文提出了幾個需要進一步研究的關鍵問題:

  • 我們如何建立必要的信任,在戰術、作戰和戰略層面上重新配置指揮部的組織,其規模、結構、位置和組成
  • 我們如何調整軍事教育,使指揮官為人工智能時代做更好的準備
  • 我們如何優化和改造所有領域的集體訓練,以改善涉及與人工智能體更多協作的指揮
  • 我們如何運作 "全軍 "的概念,以更好地利用我們社會、工業和研究機構中的大量人才
  • 我們如何定義人工智能和人類在人機團隊中的需求和目標

如果我們不從根本上改變如何獲取、培訓和培養領導崗位的人員,以及如何改革他們所處的機構和團隊,我們就有可能在人機關系的信任平衡上出錯,并將無法利用人工智能的全部變革潛力。

作者

克里斯蒂娜-巴利斯是QinetiQ公司的培訓和任務演練的全球活動總監。她在大西洋兩岸有20年的經驗,包括咨詢、工業和公共政策環境,特別關注國防、全球安全和跨大西洋關系。她曾是華盛頓特區戰略與國際研究中心歐洲項目的研究員,Serco公司負責戰略和企業發展的副總裁,以及巴黎Avascent公司的負責人和歐洲業務主管。她擁有華盛頓特區約翰霍普金斯大學高級國際研究學院和意大利博洛尼亞大學的國際關系碩士和博士學位,以及英國和德國的商業學位。

保羅-奧尼爾是RUSI的軍事科學部主任。他在戰略和人力資源方面有超過30年的經驗,他的研究興趣包括國家安全戰略和國防與安全的組織方面,特別是組織設計、人力資源、專業軍事教育和決策。他是CBE,英國特許人事與發展協會的會員,溫徹斯特大學的客座教授,英國后備部隊外部審查小組的成員。

付費5元查看完整內容

在未來的軍事行動中,通過協調多智能體系統(MAS)來實施戰略機動以獲得對對手的優勢,是一個很重要的途徑。最近探索MAS協作的工作主要集中在識別、分類、驗證、實施,以及通過多智能體強化學習(RL)來研究新興的協作方式。強化學習方法可以通過探索和利用選定行動來響應特定環境中的突發行為,這有可能抑制對抗性協作,反過來又可以為各種情報、監視、目標獲取和偵察任務提供機會窗口。本報告簡要介紹了RL領域的突出工作及其在自主戰略機動協作式MAS中的潛在應用。

1 引言

美國陸軍現代化激增是由對手在多個領域(如陸地、海洋、空中、網絡、電磁和空間)對美國構成的威脅所推動的,這對美國利益的威脅超出了常規戰爭。預計未來的戰斗將在這些復雜的多領域環境中進行,人工智能(AI)將指導與人類士兵一起協同工作的機器人Agent的戰術、技術和過程(TTPs)。這些機器人將聚集在一起,形成智能多Agent團隊,與人類士兵有效協作,完成任務。

美國陸軍作戰能力發展司令部(DEVCOM)陸軍研究實驗室(ARL)的基本研究計劃(ERPs)構建了開發和實施智能多Agent系統(MAS)的具體計劃路徑。此類陸軍計劃為美國國防行動提供了關鍵研究問題的答案,這些問題匯聚在一起,指明陸軍未來司令部的現代化努力方向。人工智能用于自主機動性(AIMM)和新興超限技術(EOT)是ERP的例子,明確側重于使下一代戰車具有自主感知、學習、推理、規劃和機動能力。這些未來的自主系統將與人類智能體合作進行預測和規劃,并通過戰場上的自主機動(AIMM)和保護(EOT)向士兵提供支持。本報告重點關注需要進行的自主協作,以使多智能體系統(即人類、智能體或人類和智能體混合)在未來的軍事行動中取得成功。

集成和協調的MAS將需要技術的進步,重點是超越我們目前的能力,以有效地對付同等裝備的對手(同行或接近同行)的協作戰略機動性。一個直接的挑戰是開發能夠以良好協調方式自主和智能地工作的智能體團隊。這種能力要求智能體在執行關鍵任務時與士兵一起觀察、定位、決定和行動(OODA-Loop)。雖然新的努力促進了對多智能體范式中情報的一般理解,但目前對情報的解釋并不明確。最近的文獻表明,基于強化學習(RL)的方法可能為實現這種技術進步提供了一條可行的途徑,本文介紹的一系列工作就是證明。

在本報告中,介紹了RL領域的貢獻,以及它們在軍事環境中的潛在應用--特別是通過戰略編隊機動來抑制對手的協作,以實現戰場上的超越。最小化、限制或完全抑制對抗性多Agent行為中的協作是探索和執行在模擬情況下通過RL實驗得出戰略機動的一種手段。此外,協作的戰略機動可以通過各種RL方法學習,以告知防御部隊創造機會或優勢窗口的潛在途徑。

為了在模擬環境中通過戰略機動的RL方法實現MAS協作,我們首先介紹了近年來一些最突出的RL研究。最近在RL領域的進展(如alphago)促進了更復雜的多智能體強化學習(MARL)算法在現實世界應用。此外,近年來也有一些框架來實現多智能體協作。這些努力加在一起,可以為開發和實施多機器人協作提供一條道路,以便在為未來戰場設計的多機器人系統中實現戰略機動。

在下面的章節中,對近年來突出的RL方法進行了分類和概述,并表明這些方法與DEVCOM陸軍研究實驗室目前的研究和開發項目相一致。具體來說,本報告的重點是確定戰略機動的特定算法的優勢和劣勢。此外,對選定的RL方法類別進行了分類,以深入了解戰略機動的潛在實施,并考慮到情報、監視、目標獲取和偵察(ISTAR)任務。

2. 多域作戰中多智能體系統的戰略機動

簡單地說,戰略機動可以解釋為一組智能體協調他們的行動,通過戰勝對手來實現一個共同的目標。破壞,是戰略機動的一個特例,可以表示為對對手協作戰略機動的抑制。因此,戰略機動一詞的使用意味著至少存在兩個對立的或敵對的雙方,他們處于動態的斗爭中,通過限制、抑制或以其他方式破壞對手的協調或戰術,并強加自己的協作戰術來獲得對對方的優勢。

在本節中,提供了一個對抗性的交戰場景,其核心是使用選定的遠程資產,這些資產本質上破壞了友好部隊的交戰。圖1顯示了一個圖例,描述了與所述多域作戰(MDO)情景相關的選定資產和部隊的軍事符號學。根據MDO理論,在武裝沖突中,對手的遠程反介入和區域拒止(A2AD)火力系統可以被用來拒絕友軍在戰區的機動自由(見圖1)。這是通過將情報、監視和偵察(ISR)資產與致命性和非致命性火力相結合來實現的,以攻擊戰略和行動支持區的友軍指揮結構、維持能力和部隊編隊。這些地區是近距離地區作戰資產(如部隊和裝備)的傳統集結地(見圖2)。對手有能力在友軍后方深處識別和攻擊目標,導致這些實體在地理上與戰術支持區和近距離區分離,這有效地提高了友軍的損耗率,即所謂的對峙。鑒于前線部隊與戰略和作戰機動支援相分離,敵對勢力可以利用這種友軍孤立無援的情況,將其消滅。

圖1 友軍(BLUEFOR,左)和敵軍(OPFOR,右)部隊的資產和資源。在所描述的MDO情景中,假設BLUEFOR和OPFOR的所有資產都是自主化的編隊。

圖2 敵軍(OPFOR)使用遠程導彈和火箭炮干擾或破壞友軍(BLUEFOR)戰略支援區的維持行動,這使得友軍無法以有利的條件與近距離地區的敵軍機動部隊交戰。為了應對這一戰略,BLUEFOR執行反擊任務,以摧毀位于深火區的OPFOR遠程火力系統(藍色箭頭)。從深層機動區的BLUEFOR SOF發出的三叉箭頭代表了一種 "破壞 "戰術,它打破了對手的隊形和節奏。

圖3 壓制(S)或解除(N)敵方遠程火力系統和ISR資產,使友軍能夠穿透敵方的A2AD保護傘。這使友軍能夠在近距離地區擊敗敵人,并使機動指揮官有能力利用他們的成功,迅速將部隊轉移到深度機動區,摧毀(D)脆弱的敵方資產并追擊撤退的敵軍。F表示 "固定",可有效減緩敵軍的行動。粗箭頭代表部隊移動的方向。

MDO理論規定了擊敗對手A2AD能力的計劃(即對峙),以便戰略和作戰機動能夠使前沿部署的友軍以有利的條件與對手交戰(即穿透和瓦解A2AD系統以利用機動自由)。在這里,我們只關注友軍(BLUEFOR)野戰軍和軍團與敵方A2AD系統交戰時的滲透和瓦解部分,這可能需要在未來的戰斗中使用自主MAS。此外,據推測,圖1中友軍(BLUEFOR)和敵軍(OPFOR)的所有符號都將包含自主化的編隊(例如,機器人戰車、自動瞄準系統、地面和空中的機器人ISR資產)。圖2和圖3分別顯示了利用這種符號學與自主化編隊進行戰略機動的情景圖。

如圖2所示,敵對的A2AD火力系統通過攻擊戰略和作戰支持區來創造對峙局面。友軍火力和防空部隊從太空和高空監視(未顯示)接收有針對性的情報,在狹窄的時間窗口內打擊高價值目標(即多管火箭系統[MLRS]),以減少對手的位置調整。除了監視之外,還可以采用戰略刺激--打擊來穿透和瓦解對手的遠程火力系統。

在ISTAR任務中,MARL可以通過利用敵軍理論和敵軍行動中的局部觀察,戰略性地照亮和跟蹤敵軍目標的位置。此外,經過MARL訓練的具有自主能力的編隊,結合高度機動和分散的空中和地面火力,可以開始壓倒對手的遠程防空。友軍可以利用經過訓練的MARL方法來利用對手的TTP,進行防空和地面火力的戰略機動。這些具有自主能力的編隊根據從戰略空基刺激收集的監視數據選擇地理位置。隨著對手的遠程火力系統被消滅,戰略和作戰支援部隊能夠向前方的作戰部隊推進(機動)(見圖2)。

敵軍利用ISR資產識別作戰支援區的友軍資產,并從作戰縱深火力區用遠程火力系統(即多管火箭炮)攻擊友軍。這些敵方火力擾亂了友軍在該地區進行傳統支援行動的能力,這反過來又導致這些活動在離部隊前線更遠的地方進行。這通過擴大戰場和緊張的補給線而造成地理上的對峙。此外,這還允許敵方機動部隊以有利于敵方既成事實的條件與近距離地區的友軍作戰。根據MDO的理論,為了消除對峙,友軍的炮兵系統必須在敵軍的火力和ISR資產部署之前識別、交戰并摧毀它們。友軍SOF通過破壞補給和指揮與控制(C2)節點以及為聯合火力提供目標數據來協助這項工作。這在敵人的A2AD保護中創造了缺口,可以被機動指揮官所利用。在這種覆蓋下,友軍機動部隊穿透并利用近距離和深層機動區域的缺口。

在作戰區,近距離和縱深地區的聯合部隊的戰略編隊可能是自主啟用的編隊(即MAS),利用MARL訓練的策略來利用對手的TTP(來自理論)、本地觀察和ISR收集的信息。如圖2所示,聯合部隊將協調其ISR和遠程精確火力的能力,為前沿部署的BLUEFOR部隊提供支持。在戰略和作戰單位的支持下,擁有自主能力的前線部隊可以在近距離和縱深地區進行協調,以分離和擊敗敵方資產。這將促進消滅敵對的前沿機動部隊(OPFOR),使遠程火力系統容易受到地面攻擊(瓦解),如圖2所示。

聯合火力(即友軍或BLUEFOR)壓制或消滅對手的遠程火力系統,使友軍機動部隊能夠進入并擊敗近距離區域的作戰部隊(見圖3)。然后,友軍機動部隊利用這一優勢,在深度機動區(見圖3中的D區)摧毀敵方的助推器。這將導致剩余的敵對機動編隊從近距離區域撤出,并在深層機動區域建立一個新的戰線。這個過程不斷重復,直到達到戰略目標或打敗OPFOR。這些協調活動在理論上可以通過人類士兵和自主多智能體系統之間的合作來實現。此外,鑒于目前正在積極研究開發和部署這種自主系統,預計未來的戰場將需要考慮像這樣的場景來規劃戰略機動。

本節提供了一個可以應用MARL方法訓練自主化編隊的場景;然而,在這種復雜的MDO環境中執行的具體RL方法還沒有經過測試,或者可能還不存在。下一節闡明了與利用RL方法為未來的MDO交戰訓練MAS有關的一些挑戰。

3 挑戰

在這項工作中,我們將重點聚焦到可以指導MAS克服與軍事防御MDO中戰略機動相關挑戰的RL方法。從技術上講,RL是機器學習(ML)的一個分支,它超越了從數據中建立精確的預測,通過在環境中產生行動來展示學習。這種學習的展示可以被認為是一種決策形式,但更準確的描述是通過狀態空間探索進行戰略行動選擇。

RL智能體在獎勵函數的基礎上進行學習(或訓練),最終確定在當前情況下(即該智能體在環境中的狀態),哪一個是智能體要選擇的最佳行動。例如,RL智能體可以與環境互動,產生與獎勵掛鉤的經驗,這將形成學習的策略(即一系列的狀態-行動對)。然而,在后面的章節中強調,目前的RL方法可能還不夠成熟,無法克服與人類類似的適應性相關的挑戰,以便在新情況或環境中進行智能決策。盡管RL算法有其缺點,但它們似乎是在軍事防御MDO中實現協調的MAS執行戰略機動的最有希望的途徑之一。

在多智能體任務中,協作通常是定義不清的,而且經常被用來表示一組智能體在某些合作任務領域中成功地執行了任務。在以前的工作中,開發并采用了各種新方法來測量執行合作任務時智能體行動之間的相互依賴性,以確認這些智能體事實上已經學會了協作。對協作的確認是確定MAS有能力與其伙伴合作的先決條件,而不是簡單地采取導致某種程度的優化行動。雖然在某些情況下,最佳行為可能是可取的,但如果任務以某種不可預見的方式發生了變化,一個簡單的最佳行為的智能體可能會在戰場上導致災難性的損失。因此,未來防御行動的MAS必須具有明確協作的能力。

在本節的其余部分,描述了與開發戰略機動MAS有關的一些挑戰,其中時間尺度、能力和局部目標可能有很大的不同(例如,MDO),但需要某種程度的協作。此外,假設更大程度的靈活協作可以促進任務執行的改進(例如,更快、更少的損失、非直觀的策略、有效處理不斷變化的能力/團隊組成)。

隨著環境在動態戰場上的變化,敵對雙方(至少)可能需要重復規劃和預測,以便1)跟上,或2)領先于對手的規劃和預測。經過RL訓練的MAS能夠學習這種動態的規劃和預測循環。另外,如果學習智能體建立了一個關于對手協作行動的適當模型,然后采取行動破壞這種協作,也可以實現這一目標。

在一個理想的情況下,一個被選來指導MAS行為的算法將學會處理環境、對手戰術和能力、自身能力(獲得新的能力或失去以前的能力)、團隊組成(例如,改變合作者)和局部目標的變化。然而,大多數最先進的(sota)方法受到經驗的限制(正如許多RL方法的情況一樣)。此外,在大多數模擬中,團隊的能力和組成通常是固定的,不能為算法提供足夠的數據來操作和處理任何上述的特征變化。因此,在選擇一種算法來指導旨在產生戰略機動的MAS的行為時,必須考慮新的或動態的事件、行為、資產和實體。

總之,目前的算法方法在復雜的軍事防御MDO環境中沒有達到所需的能力。目前的缺點可以分為三類。1)數據要求,由于情況的新穎性,數據是有限的,數據集不足以產生準確的預測,或者數據以某種方式被污染(例如,嘈雜、臟亂或對手的改變),2)有限的計算資源,以及3)算法不能泛化到訓練期間遇到的情況之外(例如,不同的目標、改變的能力或修改的團隊組成),導致狹隘或脆弱的MAS解決方案。

在下一節中,我們將更詳細地討論RL的缺點,以闡明如何克服這些問題,為軍事防御MDO環境提供解決方案。為此,我們介紹了現有的RL算法的分類法。這一努力應提供對有前途的RL技術更好的洞察力,這可能有助于確定最終應用于美國國防MDO的可行途徑。

4. RL技術和方法

學習算法的可擴展性是MDO中軍事任務的主要關注點之一,特別是因為這種任務可能需要大量的智能體來完成一個目標。此外,軍事任務可能涉及多個子任務,每個子任務都有自己的子目標,從而進一步復雜化了場景。在MDO中,預計一個子目標由無數復雜的戰略演習組成,這需要MAS的快速計算,以及使用最小計算資源(如在戰術邊緣計算)的最佳(或至少足夠)戰略。因此,一個可擴展的RL算法必須考慮到:1)環境和任務的復雜性;2)智能體(伙伴和對手)的數量,以便每個智能體能夠在通過RL學習過程中收集經驗時正確選擇行動。

環境復雜性(即智能體的狀態和行動空間的大小)可以指環境的狀態空間中可用的狀態數量,以及該環境中智能體可用的行動方案數量。RL算法的可擴展性是指在足夠復雜的狀態和行動空間中,在合理的時間和計算能力內計算最優策略的能力。環境的復雜性還包括納入額外的智能體(例如,擴展到MAS),其中狀態空間被放大以考慮到額外的智能體,而行動空間的大小被乘以該之智能體的數量。

通過使用狀態-動作對的表格來解決RL的可擴展性問題是不實際的,因為連續的領域會使表格無法維持,而且在合理的時間內同時更新所有智能體的表格條目是不可行的。即使有足夠大的計算資源(如過多的計算機內存)來包含所有的狀態,在每個狀態-動作對之間的學習也會太慢。與利用表格跟蹤狀態-動作對相反,一個解決方案是使用非參數函數近似器(例如,權重為參數的深度神經網絡)來近似整個狀態空間的值。然而,函數近似器必須是可微分的,這樣就可以計算出一個梯度,以提供參數調整的方向。

有兩種方法來訓練值函數近似器:1)增量方法和2)批量方法。增量方法使用隨機梯度,在梯度方向上調整近似器的參數,使估計值和目標值之間的誤差最小。然而,增量方法的樣本效率不高,因此不具備可擴展性。相比之下,批量處理方法從一組經驗中保存數據,并使用它們來計算函數近似值估計和目標值之間的誤差。批量方法與傳統的監督學習有共同之處,即結果是已知的(例如,數據被標記),計算近似值的估計值和實際結果值之間的誤差。這種類型的批量學習通常被稱為經驗重放。重復這個過程將導致最小平方誤差的解決方案。最近一個成功的經驗重放的例子是用深度Q網絡(DQN)玩雅達利游戲演示的。盡管函數近似法在復雜的環境中顯示出了成功,但如果不考慮額外智能體的加入(即非平穩性或部分可觀察性),單靠這種方法不太可能足以訓練出MDO場景的MAS。

與價值函數近似法相比,策略學習方法依靠策略梯度(PG)的計算來明確優化策略,而不是間接依靠價值函數。與函數近似方法相比,PG具有更好的收斂特性。PG方法比價值近似方法更受歡迎的主要原因是它們能夠在高維和連續的行動空間中有效(即在復雜環境中可擴展)。在蒙特卡洛(MC)策略梯度(例如REINFORCE算法)中,實際回報(選擇行動)與一個分數函數相乘,以計算梯度。該梯度被用于策略調整(通過改變參數值)以找到最大的回報行動。MC策略梯度具有高方差,收斂速度慢,因為它使用智能體的狀態-行動對在不同時間的整個軌跡來獲得一個返回值。另一種可能超越傳統函數近似方法缺點的解決方案是利用 "演員評論"方法。

在演員-評論家方法中,PG方程被修改為使用價值函數的近似值,而不是使用真實的行動-價值函數乘以分數(如REINFORCE算法)。這表明行為者按照評論者所指向的方向調整策略,以便使總的累積獎勵能夠達到最大。評論者的這一策略評估步驟可以通過使用組合值近似方法(即MC、時差-TD(0)和TD(λ))來完成。為了減少策略梯度的差異,可以使用一個優勢函數。優勢函數告訴我們,與一般的狀態值函數相比,一個行動比另一個行動(Q值)好多少。這意味著評論者必須估計Q值。一個有效的方法是使用TD-error,它是優勢函數的無偏樣本,評論者對一組參數進行近似。TD(λ)資格跟蹤也可用于評論者估計不同時間步長的值。有趣的是,MC(高方差)和TD方法可以與行為人一起使用,隨著時間的推移(即收集的經驗)修改策略。

由于MDO涉及軍事任務,RL算法必須有能力與許多其他智能體協調,以實現最佳的戰略機動,因此MAS的算法必須能夠與大量的智能體和異質資產一起擴展。算法的另一個重要能力是處理復雜狀態空間(即許多智能體)和多領域環境的大量觀察能力。在接下來的章節中,我們將討論在MDO中使用不同種類的RL算法對戰略機動的影響。

無模型算法可分為非策略性和策略性算法,其中狀態行動空間可以是連續的或離散的。在這一節中,討論了無模型算法的優勢和劣勢,以及它們如何與戰略機動相一致,從而實現MDO的目標。這一分析的目的是為尋找在MDO環境中實現戰略機動性的潛在算法方法提供方向。

4.1 深度Q網絡(DQN)

深度Q網絡(DQN)是一種單一的RL智能體算法,它被訓練用來玩行動空間離散、狀態空間連續的Atari 2600游戲。DQN使用一個用Q-learning訓練的卷積神經網絡,從高維輸入(連續圖像)中學習。

DQN算法是一種有效的樣本方法,因為它利用所有收集到的經驗來提取盡可能多的信息。DQN足夠強大,可以使用相同的超參數進行訓練,玩六種不同的Atari游戲,其中智能體在其中三個游戲中的表現比人類專家更好。

然而,DQN的一個缺點是,在理論上不能保證訓練好的神經網絡實現穩定的Q值預測(即在不同的獨立模型中,訓練好的策略可能會有很大的差異)。

鑒于DQN本質上是一個單一的RL智能體模型,它應該不足以在MDO中進行戰略機動。在MDO中,多智能體RL算法可能更適合,因為智能體在執行時間內典型的分散化,允許智能體彼此獨立運作。此外,DQN的原始實現只利用了四個觀察序列來學習Q值,這對于MDO中的戰略機動來說是不夠的。多個資產的戰略機動通常不能在如此短的時間間隔內被捕獲。事實上,這是DQN在評估的三個Atari游戲(即Q*bert、Seaquest和Space Invaders)中與人類相比表現不好的主要原因。然而,存在一些DQN的變體來解決這個問題和其他弱點。

Bootstrap DQN就是這樣一個變體,它學習了一個Q網絡的集合,以提高采樣效率,并克服了傳統DQN的不足之處。行動消除是另一種與DQN一起使用的方法,以解決大的行動空間。帶有記憶類型的DQN(即循環神經網絡)也可以用來處理部分可觀察性。如果一個智能體需要為完成任務而導航環境,這種方法就特別有用。另外,分布式DQN返回一個分布信息,可用于評估策略風險和減少最佳解決方案周圍的方差或噪音。

盡管DQN及其修改后的變體在處理比簡單的Atari游戲更復雜的任務方面很有前途,但DQN方法本質上缺乏一個多智能體預測機制來進行協作戰術,而這是MDO中戰略機動的需要。此外,DQN在大多數情況下計算量太大,無法用于軍事相關環境。最后,DQN算法方法對未見過的例子(例如,伙伴的新行為或環境中出現的實體/障礙)缺乏足夠的適應性。

4.2 深度確定性策略梯度(DDPG)

在現實世界中,大多數常規任務涉及連續狀態和行動空間。然而,DQN只考慮離散的狀態空間和低維的行動空間。處理連續狀態和行動空間的DQN的另一種方法是深度確定型策略梯度(DDPG)方法。DDPG通過結合價值函數近似和確定性策略梯度(DPG),推進了DQN方法的進展。DDPG利用行為批判的方法,可以克服連續空間的復雜性。這種無模式、非策略預測和控制算法可以執行物理控制任務(如車桿、靈巧的操縱、腿部運動或汽車駕駛)。

另一種使用深度神經網絡的方法是信任區域策略優化(TRPO)。這種方法直接構建一個隨機策略,而不需要演員-評論者模型(不要與環境模型混淆,這將使其成為一種基于模型的方法)。與TRPO類似,引導式策略搜索(GPS)不需要角色評論模型,而是使用軌跡引導的監督式策略學習以及一些額外的技術(例如,減少視覺特征的維度,在網絡的第一層增加機器人配置動態的信息)。因此,GPS的數據效率很高,如果需要的話,可以改編成DDPG。另一方面,PILCO首先學習一個概率模型,然后找到一個最佳策略。PILCO在某些問題領域具有很高的數據效率;然而,它的計算量很大。此外,D4PG對DDPG算法提出了一些改進:分布式評論者更新、分布式并行演員、N步返回和經驗重放的優先級,以實現對不同類別任務的更穩定和更好的解決方案。

從戰略機動的角度來看,DDPG算法的主要缺點是它被設計成一個完全分散的單一智能體算法(即獨立學習者)。因此,DDPG算法不便于在多智能體場景中進行協作。因此,使用DDPG所產生的戰略機動將不會產生協作的團隊行為。此外,DDPG不具備處理基于角色的多目標任務的能力,而這是軍事行動中戰略機動的要求。

4.3 多智能體深度確定性策略梯度(MADDPG)

RL智能體互動對于戰略機動的人工智能系統至關重要,不同的智能體可能需要組成團隊來抑制對手的戰略合作或抑制對手的協調。Q-Learning和PG方法分別受到非平穩性和高方差的影響。為了克服這些問題,多智能體深度確定性策略梯度(MADDPG)算法擴展了一個演員評論家方法,這使得它可以通過集中智能體訓練而對多智能體系統發揮作用。MADDPG框架采用集中式評論家家進行訓練,并在測試期間部署分散的演員。一個評論者(每個智能體都有一個)接收每個智能體的策略,這允許開發具有潛在不同獎勵功能的依賴性策略(例如,MADDPG允許訓練具有相反獎勵功能的對抗性團隊)。相反,演員(即策略網絡)在訓練和測試期間只擁有本地知識。演員(通過訓練)在與評論者評價一致的方向上反復改進策略。

MADDPG的一個主要弱點是,對Q函數的輸入隨著環境中智能體數量的增加而增加(不可擴展)。這給MDO中的戰略機動性帶來了問題。如果智能體需要被替換、添加、修改或移除,可能需要進行再訓練。在戰略機動中,智能體可能需要定期轉換角色或改變能力,這對MADDPG適應軍事領域構成了重大挑戰。此外,頻繁的再訓練將使快速戰略機動變得不可能。縮短訓練時間將減少邊緣的計算負荷,使快速戰略機動成為可能。MADDPG不能適應這種極端情況。對于軍事應用,希望有一個強大的對手或智能體模型,以便使作戰時間最大化(即有足夠的時間來執行戰略機動)。

為解決其可擴展性問題,對MADDPG的一個潛在修改是形成智能體集群,為集群而不是每個智能體單獨學習一個策略。在發生新事件的情況下,可以推遲重新訓練的需要,因為從理論上講,一個智能體集群將有一套處理動態情況的可變能力。此外,這將避免隨著智能體的修改或新智能體的引入而增加Q函數的輸入空間。然而,問題來了。我們怎樣才能將一個任務分解成部分獨立的子任務,并使最優分組策略的退化程度最小?

雖然MADDPG可以形成一組異質的多智能體策略,能夠完成不同的任務,但這種方法不能很好地擴展到十幾個智能體。隨著智能體數量的增加,策略梯度的方差會呈指數級增長。因此,這種方法不太適合MDO中的戰略機動,在這種情況下,必須考慮到40多個異質智能體的對抗情況。克服這一可擴展性問題的方法是均值場多智能體RL算法,該算法計算鄰近智能體Q值的均值估計,當智能體之間的鄰近互動變得復雜時,可能導致高誤差率。此外,進化種群課程算法的設計是為了通過將遺傳算法方法與RL相結合,使MADDPG具有可擴展性。隨著MADDPG的進步和該方法所顯示的成功,可以想象這些算法的進步會導致在模擬實驗中對MDO內的戰略機動性進行強有力的演示。

與MADDPG不同的是,反事實多智能體(COMA)方法對所有智能體使用一個集中的評論家,但被設計用于離散的行動空間。COMA比MADDPG更具可擴展性,但它可能導致一套同質的策略,在智能體能力充分不同、局部目標不同或獎勵函數不同的情況下可能失敗。與MADDPG類似,Minmax多智能體DDPG(M3DDPG)比MADDPG的原始版本增加了一項改進,允許智能體制定更穩健的策略來對抗對手(即具有對立獎勵結構的競爭游戲)。然而,M3DDPG仍然無法處理異質智能體被引入系統的情況。

在具有連續狀態和行動空間的環境中實施算法,有時需要利用常見的技術來操作輸入或輸出,如離散化狀態和行動空間或將離散的策略輸出轉換為連續輸出。轉換策略輸出的一個例子是OpenAI多智能體粒子環境中MADDPG的實現。在這個例子中,離散的策略組件被用來計算連續的行動。從另一個角度來看,多智能體轉化器軟雙Q學習算法將連續行動空間離散為一組速度和角速度控制,然后可以在運動模型中使用。盡管這些技術允許在連續環境中使用這種算法,但這些算法方法沒有用連續信息進行訓練,這可能會限制它們在物理環境中進行戰略機動的功效。

4.4 價值為本

最近的一個基于價值的MARL算法系列在非常復雜的《星際爭霸2》模擬環境中被證明是相當成功的,其中根據智能體的本地Qa值學習了一個集中的聯合行動值Qtot。然后通過線性argmax算子從Qa中提取一個分散的策略。這種非常簡單而有效的分解方法避免了學習聯合行動值,而聯合行動值的規模并不大。如果增加新的智能體或用新的能力替換智能體,仍需進行再訓練。然而,與MADDPG相比,它更具有可擴展性,因為單個Q值僅從局部觀察中學習,避免了通過學習因子化的Qtot來學習聯合行動值。但是,當有超過40個智能體時,這個系列的算法的可擴展性可能會受到挑戰。為了使其更具可擴展性,已經提出了基于角色的算法RODE,其中智能體的角色是根據他們對環境的影響對他們的行動進行聚類來確定。該算法對于大量的智能體顯示了非常有希望的結果。

對于戰略機動,RODE算法是非常有前途的,因為各組智能體可以被分配到不同的角色,其中角色可以基于他們的行動和對環境的影響或任何其他固定的行為(對于盟友或甚至敵人)。然后,該算法可用于不同群體的戰略角色轉換。由于不同角色的行動空間受到限制,該算法收斂得非常快。這種算法也適合于基于角色的技術的戰略使用,這可能會在未來的工作中進行研究。即使RODE是非常可擴展的,我們也不清楚當新的智能體將被添加到環境中時如何調整它;需要學習一個集中的策略以實現最佳協作。

與RODE算法相比,一種可擴展的多智能體強化學習方法部署了一種熵-規則化的非策略方法來學習隨機價值函數策略,實驗表明它能夠擴展到1000多個智能體。如前所述,可擴展的RL算法關注環境的復雜性--系統或團隊中的智能體越多,狀態空間越大。RODE是有限的,因為它使用一個集中的策略,當更多的智能體被引入到環境中時必須重新訓練。多智能體轉化器軟雙Q學習算法是一種集中訓練的非策略學習算法(即共享一個中央經驗重放緩沖器),其執行是分布式的(即每個智能體根據其本地觀察做出自己的控制決定),而不是來自中央控制器。由于這種分布式的方案,當智能體被添加或從系統中移除時,團隊不受影響,繼續執行他們的策略。

在可擴展性方面,訓練大型MAS(即許多智能體)是很困難的,而且已經表明,即使是最先進的算法也不能為復雜的MARL任務學習到高性能的策略。多智能體變換器軟雙Q學習通過在訓練期間利用啟發式方法緩解了這一可擴展性問題,該方法允許在較小的智能體集合上訓練策略(例如,在目標追蹤場景中,四個智能體追蹤四個目標),并且該策略已被證明可以在執行中與更多的智能體一起工作而不需要任何調整(即用1000個智能體測試和評估)。訓練和執行過程中使用的啟發式方法使算法能夠解決智能體數量的巨大分布變化:它基本上將測試時的大型復雜觀察空間縮減為接近智能體策略最初訓練的內容。從軍事角度看,這種提法是戰略機動的理想選擇,因為現場的智能體可能會在原地丟失或獲得,可能要考慮額外的戰略信息。一個靈活和可擴展的算法提供了MDO中所需要的能力。

5. 洞察力和結論

由于一些因素,包括科技進步,美國的對手正在變得更加先進。在未來的MAS自主戰爭中,協作的戰略機動可以為國防軍帶來某些優勢。在這篇文章中,我們討論了一些最突出的RL算法,以發現訓練MAS的可行候選策略,這些MAS可以有效地進行戰略機動,從而在未來潛在的軍事行動中打開機會之窗。本文描述了RL方法的分類法,并對最突出的RL算法進行了概述。研究發現,由于訓練和測試因素的不同,大多數RL算法缺乏處理與未來潛在沖突相關的復雜性的能力。

DEVCOM ARL ERPs為開發和實施智能MAS提供了一個規劃性的路徑。鑒于陸軍研究項目為美國國防行動提供了關鍵研究問題的答案,AIMM和EOT ERPs特別促成了研究,可以為協作的自主MAS提供一個路徑,可以克服與1)環境,2)對手戰術和能力,3)自身能力(即,獲得新的能力,失去以前的能力,或能力被改變),4)團隊組成(例如,增加、刪除或交換隊友),5)戰略團隊定位、進入、導航(機動)以支持部隊并壓倒對手,以及6)任務目標。最近,AIMM和EOT ERP在這一領域的工作闡明了衡量MAS協調性的方法,并允許開發一個框架來訓練和測試執行各種任務的MAS的協調性,此外還評估了利用一系列集中訓練技術的新算法方法。

此外,還需要進行更多的調查,以闡明有利于在ISTAR任務和其他交戰場景中利用MAS的軍事戰略。在淺顯的情況下,將完全自主的MAS送入高風險情況(即預期因果率高的情況)是可取的;然而,由于目前的技術限制,僅僅期望MAS能夠在沒有人類監督或干預的情況下完成任務是不夠的。因此,在未來的工作中,將進行研究以確定一套強有力的交戰方案。最后,這項工作將導致自主MAS的最終整合,以便在未來的軍事行動中盡可能地協調戰略機動。

付費5元查看完整內容

執行摘要

這項工作是在任務9 "關于指揮和控制系統的信息融合、數據分析和決策支持的人為因素問題 "下,由Calian和C3人為因素咨詢公司為加拿大國防研究和發展部(DRDC)進行的,作為更大的人機交互(HAI)任務授權合同(TAC;合同號W/001/TOR)的一部分。HAI TAC的目標是設計、開發、實施和評估人機協作(HAT)概念、方法和技術,以改善加拿大武裝部隊的整體人機系統性能。北美航空航天防御司令部(NORAD)是美國和加拿大的聯合軍事組織,一直在為北美大陸提供航空航天預警、空中主權和保護。自1957年以來,它一直在為整個北美大陸提供航空航天警報、空中主權和保護。現在已經超過60年了,面對新出現的威脅,北美防空司令部及其相關的機場、雷達站和衛星網絡需要進行一次大修。例如,美國和加拿大的對手專門開發了朝鮮彈道導彈、快速發展的巡航導彈技術和高超音速滑翔飛行器,以繞過NORAD主要是冷戰時期的防御系統。

北美防空司令部未來的現代化努力已經確定了 "探路者計劃",以建立國土防御數據生態系統(HDE)的原型,通過更多地采用自動化、人工智能(Al)和機器學習(ML)技術,提高防御決策的及時性。DRDC是對這一努力做出貢獻的關鍵參與者。如何融合信息,如何通過交互式界面向操作人員展示和解釋人工智能和ML模型所提供的決策,是探路者的關鍵人因(HF)問題。為了確保改進決策,減少操作人員的認知負荷,增加自動化的采用,需要使用HF原則、措施、方法和/或最佳實踐來設計和評估開拓者的技術。

這項工作的目的是審查現有的文獻和資源,并與DRDC中小型企業就指揮和控制(C2)系統的信息融合、數據分析和決策支持方面的高頻問題進行訪談,為NORAD提供初步的高頻建議,并確定可以探索的研究差距,以幫助改善開拓者的整體系統性能和未來行動的有效性。為此,我們對文獻進行了回顧,并與DRDC主題專家(SMEs)進行了訪談,以更好地了解從高頻角度設計、開發和評估信息融合、數據分析和決策支持系統的復雜性、挑戰和最佳實踐。文獻回顧和中小企業訪談集中在以下領域。

1.交互和界面設計。回顧C2系統的信息融合(即原則、措施、方法)的交互和界面設計的最新進展。系統和基于Al和ML的決策支持系統的交互和界面設計的最新進展,特別關注于可解釋的Al決策的設計。

2.人為因素的挑戰。確定信息融合和基于Al/ML的決策支持系統的以人為本的關鍵分析和設計挑戰,這些系統可用于航空航天防御任務的C2系統。

3.培訓系統。回顧在C2系統的信息融合和Al/ML決策輔助的背景下,針對操作者-自主性/操作者-操作者互動的培訓系統(如智能輔導系統)設計的最新進展。

總之,文獻審查包括HF、人機交互和Al領域的總共189篇文章。在這些文章中,134篇文章的子集在本報告的第3節中報告。此外,項目組還采訪了四個DRDC中小企業。

本報告還概述了由多倫多DRDC開發的高頻分析和設計框架--以交互為中心的設計(ICD),該框架已成功應用于智能自適應系統(IASs)的設計。兩個DRDC項目被確定為相關的案例研究,以展示如何將ICD框架應用于支持NORAD的開拓者計劃。具體而言。

1.創新戰斗管理決策支持技術演示項目(INCOMMANDS TDP)由DRDC Valcartier在2006年至2009年期間實施,旨在為加拿大皇家海軍哈利法克斯級護衛艦的指揮團隊開發和演示先進的指揮決策支持能力(CDSC)原型,以提高威脅評估(TE)和戰斗力管理(CPM)的整體決策效率。

2.多倫多DRDC在2014年至2019年期間開發了武器交戰的權威路徑(APWE)決策支持工具,以協助加拿大皇家空軍無人機系統機組人員在使用致命武器攻擊目標時遵循正確的交戰規則和武裝沖突法。

這兩個用例都與開拓者計劃的目標一致,即利用Al/ML技術將人類的參與從處理 "大數據 "轉移到關注高階決策過程。這樣一來,操作人員可以在比對手更清晰的數據基礎上做出更快、更好的決定,從而實現 "決策優勢"。

未來的研究可能會試圖確定INCOMMANDS CDSC和APWE與開拓者計劃的相關性。此外,作為ICD的延伸,人類-自主性信任的意圖、可測量性、可預測性、敏捷性、溝通、透明度和安全性(IMPACTS)模型可用于指導開拓者計劃中IAS設計概念的發展,以幫助運營商和半自主的TE和CPM系統之間建立有效的伙伴關系,實現共同目標。

總之,從文獻綜述和與多倫多DRDC和瓦爾卡蒂爾的中小企業的訪談中收集到的信息,以及本報告中的報告,提供了豐富的信息,DRDC可以在此基礎上為開拓者計劃做出重大貢獻;特別是通過利用他們現有的HAT工作,以及高頻分析和設計框架,如感知控制理論、以交互為中心的設計方法來設計IAS以及HAT信任的IMPACTS模型。

付費5元查看完整內容
北京阿比特科技有限公司