亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

引言

2020年12月,美國防部長發布了 《美國防部5G戰略實施計劃》。在該計劃中,國防部(DoD)描述了將5G和邊緣計算整合到軍事行動中的重要性,主要是為了其更高的性能、數據驅動的應用以及機器對機器的通信。該戰略為5G能力的開發、實驗和原型設計提供了基準路線圖,同時確保國防部將促進5G技術的發展和采用。該計劃強調了該技術的重要性和新興能力,以及正在進行的具有無限實施可能性的努力。然而,5G和邊緣計算可以實現更多。它是軍方聯合全域指揮與控制(JADC2)概念的關鍵,可極大改善指揮與控制(C2)、后勤、未來武器能力以及大規模作戰行動實施等領域。

隨著《美國國防戰略》引導聯合部隊走向大國競爭的環境,并抵御近鄰對手,JADC2概念已成為統一網絡、傳感器和武器系統,在各軍種、司令部、決策者和作戰人員之間分發信息的基石。JADC2促進了所有領域的統一努力,以利用聯合和伙伴國能力的優勢,為任務指揮官提供快速開發、執行或在殺傷鏈之間轉換的能力,以壓垮對手的防御,使敵人陷入多重困境。圖1顯示了JADC2布局圖,以及所有領域必須如何連接成一個 "作戰網絡",以促進決策周期。

圖1:JADC2結構圖

此外,空軍還提出了 "敏捷作戰"(ACE)的概念,以應對太平洋戰區的威脅和挑戰。國家已經進入了遠距離的大國競爭領域,指揮官需要有能力根據經驗數據實時做出近乎瞬時的決策。更重要的是,作戰信息和目標數據必須在不同的單個平臺和整個部隊之間無縫共享。已經開始開發所需的解決方案,通過作戰人員在作戰戰術邊緣的開發,實現不同系統和波形之間的互操作性;事實上,這正是最需要創新的地方。

自動戰術瞄準和反火力殺傷鏈系統等有能力連接不同的傳感器和射手,并自主提供近乎即時的目標數據。然而,這些開發中的系統所缺乏的是一個可擴展的集成5G網絡,該網絡與戰場前沿的邊緣計算相結合。這種網絡不僅能讓網絡上的所有單位立即共享信息,還能讓前線戰士之間立即處理數據,而無需將數據傳送回作戰中心供決策者重新發布。隨著指揮權的下放,分布式執行將變得無縫銜接。

5G和邊緣計算

目前,軍方嚴重依賴不同的C2系統,如Link-16、Blue Force Tracker、Riverjack Tracker和Situational Awareness Data Link。此外,已開始利用內華達山脈公司的戰術無線電應用擴展(TraX)等軟件開發連接這些系統的能力,該軟件能夠理解多種軍用標準通信協議并進行通信,從而連接跨域和波形的信息。雖然TraX可以幫助系統 "對話",但它需要將軟件連接到每個網絡,以創建一個共同的操作畫面,并共享來自不同網絡資產的數據。隨后需要的是將每個人置于同一網絡的前向能力。TraX只是這項技術的開端。

5G是下一代蜂窩網絡,速度比4G網絡快100倍。它是一種能夠創建物聯網(IoT)的網絡,因為它具有99.999%的可靠性、5毫秒的端到端延遲、10Gb/s的峰值數據傳輸速率、500公里的移動性、高能效,并且能夠維持10Tb/s/km2的移動數據量。物聯網本身是一個由聯網設備或系統組成的集體網絡,其技術可促進這些設備和云之間以及設備本身之間的通信。有了5G網絡,美國防部將有能力管理和運營大規模物聯網網絡,提供單位自主權、終端用戶計算、自主系統和更快的延遲速度。

通過5G網絡,視頻、語音、傳感器、目標定位、偵察,甚至步兵武器瞄準鏡等數據的訪問將變得非常容易,而且對任何需要的人來說都是即時的。前線的士兵可以自主、實時地向后方部隊多路廣播他們看到的前方情況。為了實現這種能力,美國防部必須找到新的方法來實現數據流邊緣計算解決方案,或者建立一個能夠提供更多地理分布訪問的網絡。目標是讓軍隊能夠使用邊緣計算,而無需重新規劃現有的基礎設施。采用邊緣計算系統的5G將使網絡連接速度與5G同步,并提供近乎即時的通信。因此,美國防部必須采用邊緣計算技術支持的5G網絡,以創建一個能夠擴展到其龐大基礎設施中的新網絡。

這種令人難以置信的網絡能力與多接入邊緣計算(MEC)相結合,為連接部隊并即時共享時間敏感數據和信息提供了無限的技術可能性。MEC使云服務器能夠更靠近終端運行,從而減少延遲并加快本地處理速度(圖2顯示了傳統云結構與MEC網絡之間的區別)。

圖2:傳統云網絡與多接入邊緣計算(MEC)

這就提供了支持更多時間敏感型應用的能力,并能在戰場最前沿與最終用戶一起立即處理數據。邊緣計算的分散式架構使技術資源更接近數據產生地,減少了響應時間滯后。邊緣計算與5G的大帶寬、超高速和顯著降低的延遲相結合,有望使軍隊充分發揮人工智能(AI)、物聯網、大規模機器型通信(mMTC)、超可靠和低延遲通信(URLLC)、沉浸式現實和自動化等創新的潛力。

聯合全域指揮與控制

解決JADC2的概念問題一直處于軍事創新的前沿。幾乎所有與開發或支持該概念相關的東西都能獲得資金和研究批準。每個人都在研究如何將單項技術結合起來支持JADC2。雖然這是發展未來軍事C2概念的一大部分,但需要將創新從單個 "管道 "能力擴展到重建網絡。5G的真正意義在于其對未來戰爭網絡的影響。更多成本更低、連接性更強、功能更強大的系統能夠在瞬息萬變的作戰場景中運行,這將為該網絡提供支持。此外,5G將把分散的網絡整合為單一網絡,使士兵能夠更清楚地了解自己的位置并做出更好的決策。在后勤和維護層面也將產生積極影響。一旦網絡開發完成,個人技術和軟件就可以重新編程,以便集成到網絡中。

實現這一目標將是一個巨大的步驟,需要軍方創建一個新的網絡基礎設施。與Verizon和T-Mobile等私營網絡合作,可為5G網絡奠定基礎,同時開發創新系統,將該網絡推向世界任何地方。可在前沿基地建立移動5G塔臺,而機載C2平臺,如E-3 AWACS、P-3 Orion、RC-135 Rivet Joint或新平臺,可提供機載網絡擴展或中繼,類似于已建立的戰場機載通信節點(BACN)。其擴展能力與Link-16類似,在視線范圍之外的用戶仍可通過它們之間的中繼器進行通信。

一旦網絡建立起來,所有前向傳感器都可以聯網并相互通信。該網絡將通過所有連接的用戶創建一個物聯網,先進的人工智能將對從前線傳輸到后方決策者的大量數據進行優先排序和列表。這一過程將是無縫和近乎同步的。一旦聯網,后方作戰中心將獲得巨大的戰場態勢感知能力,從完整部隊的位置到前線無人機(UAV)的視頻畫面,甚至是M1艾布拉姆斯坦克的瞄準畫面。對射雷達會自動向飛機發送目標數據,飛機可以發布它們看到的目標,這些目標會出現在離它們最近的地面部隊中。前方觀察員可以標記目標,同時立即將數據推送給在其領空內自主飛行的徘徊彈藥。飛機將能夠通過與其他飛機的近距離傳感器輕松地進行自我沖突。安裝在火炮表面的傳感器可以在空域內創建禁飛區,因為飛行員將能夠看到在空中飛行的單個彈藥。5G和邊緣計算可創建mMTC和URLLC網絡。

無論哪個分支機構、單位或系統,5G都將使一切能夠相互 "對話"。只有不兼容的5G系統才需要TraX等系統。TraX可以轉換來自不同平臺的無線電頻率,并將其轉化為5G信息,就像它可以將藍色力量追蹤器的位置信息發布到Link-16上一樣。這種將傳感器無縫、自主地連接到射手的能力將大大縮短軍事瞄準和決策過程,從幾分鐘縮短到幾秒鐘。聯合部隊指揮官將全面了解其所有資產和單位的態勢。海軍驅逐艦將有能力與陸軍前線觀察員進行通信,空軍部隊將能夠在同一聯合作戰中心的監督下與海軍陸戰隊炮兵進行通信。前方偵察機將有能力定位縱深目標,并將目標數據傳遞給途中的多管火箭炮系統(MLRS)。一旦多管火箭炮系統到達ACE機場,就能立即向目標開火。這是JADC2在5G網絡上的近期能力。

敏捷作戰部署

為支持JADC2,空軍正在試驗基于5G網絡互聯的游牧和移動分布式C2車輛的彈性C2。這種移動C2能力經過測試,證明能夠為指揮官提供JADC2概念的解決方案。一個關鍵要求是接收和傳輸來自任何軍事來源的數據,無論平臺如何。由第1聯合特種作戰航空分隊(1st JSOAC)開發和測試的多域作戰管理小組(MBMT)是一種經過驗證的即插即用移動C2系統,可整合不同的網絡并創建一個物聯網,使不同的平臺能夠相互 "看見 "并進行通信。此外,該系統還可為指揮官創建一個共同的作戰畫面,否則,該畫面不會包括所有資產,而且延遲時間較長,可能會影響決策者。通過將這一移動C2系統集成到5G網絡中,再加上邊緣計算,美國防部將擁有強大的JADC2能力,可將其覆蓋范圍擴展到戰場上的任何地方,同時足夠靈活,可在威脅時限內執行任務,并通過移動性和較小的占地面積提高生存能力。

空軍的ACE戰略是C2的下一個障礙。ACE是一種在威脅時限內執行的主動和被動機動作戰方案,在產生戰斗力的同時提高生存能力。ACE是一個支持JADC2的作戰概念,但需要軍方全面重新審視C2、后勤、進攻和防御能力系統。它將作戰從集中的有形基礎設施和基地轉移到由較小的分散地點組成的網絡。集中指揮、分布控制和分散執行為ACE的C2提供了框架。通過在每個分散地點建立一個集成的5G網絡,這種C2框架是非常容易實現的。

通過5G網絡,指揮官可根據具體情況制定一攬子部隊計劃,并將其從一個基地機動或重新分配到另一個基地,同時將所需的后勤支援任務分配到同一地點。例如,如果一名指揮官需要4架轟炸機和6架攻擊機,任務命令將通過5G網絡發送,并由每個部隊的系統接收,盡管只有那些被委派任務的部隊才能看到。在網絡中,這些飛機系統有一個配對的后勤包,無論它們飛到哪里都需要。這些后勤包同時被訂購到同一地點,5G智能倉庫技術自動提供所需的維護和設備支持。與5G網絡綁定的運輸飛機將不斷廣播其位置、貨艙、路線和運輸時間。與之前的步驟同時,所需的設備和支持將被分配到最合適的運輸方式,以到達部隊包裹的前方基地。

對后勤的影響

ACE概念所需的能力發展和可能被忽視的復雜問題是為分散地點的快速部署部隊開發、支持和維持可擴展的后勤包的能力。德懷特-D-艾森豪威爾說過:"你不難發現,要證明戰斗、戰役甚至戰爭的輸贏主要是因為后勤。ACE將對軍隊現有的后勤系統構成巨大的挑戰和壓力。轉型和自動化后勤將滿足ACE概念的要求。除了預先部署物資包和利用商業手段外,軍方還必須開發可量身定制的后勤物資包,并將其分配給所支持的一攬子部隊。隨著分散地點的數量在更廣闊的作戰區域內不斷增加,維持計劃和系統也應能夠擴大維持行動的規模。一旦建立了5G網絡,為多個地點快速移動的部隊包提供支持的后勤工作將幾乎實現自主化。

實現這一目標的第一步是在軍隊的維持倉庫內建立5G網絡。盡管邊緣計算和5G在后勤和供應鏈中的應用還不夠廣泛,但它們將成為成功組織未來基礎設施的一部分,因為它們能提供更強的計算能力、性能和可靠性,以支持倉庫自動化和自動物料處理等領域。這種自動化包括資產跟蹤和追蹤,以避免供應鏈中的數據盲點,并消除系統停機時間,以避免損失和故障。私人使用情況已經表明,5G在制造業中的應用已經實現了先進的遠程工業機器人技術、能耗更低的遠程控制工廠運營以及實時數字工廠管理,以確定產能、跟蹤生產和優化運營。同樣的制造能力也可應用于復雜的軍事后勤領域。

海軍陸戰隊已經在試驗用于車輛存儲和維護的5G智能倉庫技術,這種能力可以集成到ACE概念中。 據美國防部稱,目前的5G倉庫實驗重點是提高倉庫運作的效率,包括接收、存儲、庫存控制和跟蹤、發放和交付。通過物聯網以及mMTC和URLLC的功能,JADC2可通過完全自主的后勤系統得到支持。mMTC和URLLC為自動駕駛汽車、智能城市和工業自動化構建了網絡框架,所有這些都可用于美國防部的后勤網絡。一旦指揮官了解了實現其目標所需的一攬子部隊類型和位置,就會向網絡發布命令,要求這些資產就位。

特定兵力包的移動將通過機對機通信實時觸發后勤和補給包,該通信完全基于發布的命令和輸入到領航飛行員航空電子設備中的計劃飛行路徑。然后,該一攬子計劃只需在集中指揮層面上獲得批準,但復雜性已經完成,后勤團隊和供應系統在獲得批準后將自動接收任務命令。在網絡內,這些資產將有數據標識符,有一個共享的后勤需求清單。如果清單上的物品在增援地點無法獲得,后勤網絡就會啟動。如果需要更多物品來維持,5G倉庫將自動收到通知,倉庫內的自動駕駛車輛將開始將物品碼垛,并啟動裝運流程。在訂單發布后的幾分鐘內,支持新部隊的所需物資就會被處理并運往新地點。如果單個倉庫或單位沒有足夠的供應,系統會自動向能夠提供供應的相鄰單位發送信息。在后勤系統中利用這項技術的可能性是無限的。

未來武器能力

除了JADC2的進步和能力之外,5G和邊緣計算將為未來武器技術的開發和應用提供極大的優勢。5G和邊緣計算將推動監視和態勢感知技術的發展。無人機可實時傳輸照片和視頻,并利用人工智能創建近乎實時的數字三維地圖,從而提高態勢感知能力,使領導者能夠做出更加明智的決策。指揮官可以使用從現場物聯網傳感器收集數據的平臺,并利用人工智能將數據處理為可操作的見解,為決策提供依據。所有這些都可以與網絡武器相結合,在戰場上產生立竿見影的效果。

空軍的新型B-21遠程轟炸機是首批在 "系統家族 "中運行的資產之一,該系統將在作戰期間伴隨飛機運行。盡管目前對其具體內容知之甚少,但它可能包括自主協作平臺,如與飛機并肩飛行并為其提供支持的無人機。5G傳感器和邊緣計算將使該系統能夠完全自主,并在其內部和與外部障礙物之間消除沖突。巡航彈藥是一種自主平臺,其操作類似于無人機,可長時間飛行,唯一目的是發現和打擊敵方目標。它們可以在地面發射,也可以搭載在支援飛機上,在需要時發射。空軍正在繼續投資這種被稱為 "協同作戰飛機"[24]的能力。

空軍正在繼續投資這種被稱為 "協同作戰飛機 "的能力。

除協同作戰飛機外,通過mMTC和URLLC,軍方還可利用網絡彈藥實現大規模近瞬時自主打擊能力。這些遠程彈藥將有更長的閑逛時間,并能自主飛到戰場前沿附近的空域協調區(ACA),同時與ACA內的其他彈藥通話,以保持飛行中的互不干擾。從該協調區,它們將不斷接收來自網絡內前沿傳感器、士兵、無人機、雷達等的目標數據。具備網絡功能的武器將允許通過多種類型的平臺進行空中或地面發射,并立即攻擊目標或進入指定的閑置區域,以備未來交戰。

在師和旅的空域內規劃的 "ACA "網絡化閑置彈藥將為地面威脅提供即時的動能響應。從鄰近行動區攜帶這些彈藥的機載資產也可將其武器發送到鄰近閑置區,供鄰近部隊使用。該武器的5G自主性還將自動消除與其他跨境彈藥的沖突,包括地面火力。炮彈將安裝小型傳感器,提供炮彈在網絡中的位置,并允許同時使用地面和空中火力支援,大大降低自相殘殺的風險。

一旦前方目標被傳感器識別,數據將立即發布到5G網絡。擁有終端用戶設備的前沿控制人員,結合瞄準軟件和TraX,將立即在地圖上看到目標列表,并立即使用可用的閑散彈藥。一旦確定了優先目標,控制人員就會批準使用閑散彈藥離開ACA。彈藥正瞄準正確區域的信息被推送給控制員,并通過按下按鈕下達交戰的最終命令。目標被摧毀,整個過程在識別目標后幾秒鐘內完成(圖3進一步詳細說明了這一過程)。

圖3:5G網絡支持的巡航彈藥概念的實現

協同作戰飛機和具備網絡功能的巡航彈藥僅僅是戰場武器無限可能性的開始。未來的戰場網絡將成為一個有生命的實體,通過其廣闊性和成千上萬的互聯平臺提供網絡延伸,使其難以被干擾。未來的現代戰爭將要求在數秒內而不是數小時或數分鐘內做出決策,要在C2內實現這種能力,需要分散和近乎自主的執行。軍隊的物聯網將成為其戰勝對手的最大優勢,并創造出一種聯合火力能力,為彌合不同數據鏈架構上傳感器和射手之間的連接差距指明了前進的道路。隨著這種新生能力的應用不斷完善和發展,它將開始納入更多的傳感器和更多的武器系統。

結論

為了提高JADC2、ACE、自主后勤和未來武器的能力,軍方必須開始發展部署系統的能力,以創建前沿5G網絡。軍方面臨著更嚴峻的技術挑戰,因為需要在戰場前沿部署5G能力,而戰場前沿幾乎不存在任何5G基礎設施,而且很可能受到敵人的蓄意射頻干擾或其他類型的干擾。與私營企業的合作對于在美國防部框架內實施5G網絡的各個方面都至關重要。與包括5G微電子制造商、電信公司和應用開發商在內的全球行業領導者合作,對于在前沿和艱苦地區創建新的5G網絡至關重要。一旦具備在世界任何地方建立5G網絡的能力,該網絡所提供的可能性將為當前的任何對手帶來巨大的戰略和作戰優勢。

美國防部采用了部分并行的開發流程,其中部分(或全部)開發活動至少有部分重疊。這意味著,當各軍種為同一目標進行創新時,他們在設計流程和系統的同時也在開發概念。這增加了創新過程中各軍種之間交叉協調的難度,并且由于多個單位花費資源開發相同的系統而增加了成本。為了有效實施JADC2這樣的新概念并整合新興技術,美國防部必須首先重組其開發流程,減少研究重疊和成本。在單位甚至分支機構層面的開發可能會造成能力或組織上的偏差和不足,因為他們對 "全局 "考慮不夠。這種新的開發理念將是全面掌握5G和邊緣計算能力的第一步。

作者

Molinari上尉是北卡羅來納州自由堡第一聯合特種作戰司令部的聯合火力規劃師。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

美國防部增材制造戰略(2021年)和陸軍指令2019-29(2019年)(通過先進制造業實現戰備和現代化)表明,軍方正在努力將增材制造融入軍事系統。這項定性研究的目的是探索增材制造技術的進展,以評估增材制造部件在陸軍旋翼飛機上關鍵安全應用的可行性。本研究概述了陸軍飛機關鍵安全項目的鑒定過程,回顧了美國防部和陸軍的增材制造政策,詳細解釋了粉床聚變和定向能處置增材制造工藝,并回顧了一個案例研究。增材制造技術需要嚴格的材料和工藝控制,以及重要的鑒定檢查和測試,以支持陸軍航空的關鍵安全應用。然而,增材制造技術已經成熟,現在該技術已經準備好為關鍵應用生產高質量的復雜旋轉翼零件。

概念框架

本研究的概念框架定義了研究過程的目標。首先,本研究將提供一個陸軍航空CSI資格認證過程的概述。本研究將簡要討論與AM和航空有關的陸軍和國防部政策,以便為AM在陸軍航空中的相關性提供背景。然后,本研究將提供適用于陸軍旋翼飛機關鍵應用的金屬部件制造的AM工藝研究。最后,本研究將以一個案例來結束,該案例提供了一個陸軍旋轉翼飛機上使用AM部件的鑒定過程的例子。圖1顯示了生產增材制造關鍵安全項目的研究的概念框架圖。

付費5元查看完整內容

美國海軍部長以審慎的方式分布海軍兵力,以支持美國防部(DoD)的指導、政策和預算。目前的戰略、部署和分布(SLD)過程是勞動密集型的,時間密集型的,而且在考慮競爭性的替代計劃方面的敏捷性較差。SLD可以從人工智能的實施中受益。本文引入了一種相對較新的方法來解決這些問題,該方法最近來自于海軍研究辦公室資助的一個早期項目,該項目結合了機器學習、優化和兵棋推演的深度分析。這種方法被稱為LAILOW,它包含了利用人工智能學習、優化和兵棋推演(LAILOW)。在本文中,我們開發了一套獨立的偽數據,模仿了實際的、分類的數據,這樣就可以安全地進行實驗性游覽。我們展示了LAILOW為每一艘可能被移動的可用船只產生了一個類似于兵棋推演場景的分數。每艘船的分值都會增加,因為需要較少的資源(如較低的成本)來滿足SLD計劃的要求,將該船轉移到一個新的母港。這就產生了一個數學模型,能夠立即比較可能被選擇的競爭性或替代性船舶移動方案。我們設想一個更加綜合、一致和大規模的深度分析工作,利用與現有真實數據源相聯系的方法,更容易地對通過SLD過程考慮的平臺移動的潛在方案進行直接比較。由此產生的產品可以促進決策者學習、記錄和跟蹤每個SLD過程中復雜決策的原因,并確定部隊發展和部隊組建的潛在改進和效率。

圖1. 在共同進化兵棋推演模擬中查看LAILOW;ML算法(即SoarRL)被用來模擬雙方的玩家或效用函數。

方法

本文詳細介紹了與研究問題和規定階段有關的方法。我們應用一個數學模型(即Leverage AI to Learn, Optimize, and Wargame[LAILOW]模型)來解決研究的深度分析問題。LAILOW源于ONR資助的一個項目,該項目專注于機器學習、優化和兵棋推演的深度分析,本質上是Leveraging AI,由以下步驟組成:

學習: D數據、數據挖掘、機器學習和預測算法被用來從歷史數據中學習關于什么和如何做出決定的模式。來自競爭需求的數據是指來自艦隊指揮官、國家領導人的游覽建議和要求,以及在不同安裝地點的各個功能區所做的評估數據。目前的人工程序主要是平衡單位搬家費用的預算和已知的需求。搬家費用是根據人力和基礎設施準備情況的永久換站(PCS)訂單制定的。這些數據以結構化數據庫和非結構化數據的形式存在,如PowerPoint幻燈片和.pdf文件。

優化: 來自學習的模式被表示為Soar強化學習(SoarRL)規則或AGI轉化器模型,用于優化未來的SLD計劃。一個SLD計劃包括每個設施、母港、基地、樞紐和岸上態勢位置(Fd)和人員(Fg)的海軍資產的完整增益或損失。考慮到眾多的組合,這種優化可能是令人難以承受的。相反,LAILOW使用集成的Soar-RL和協同進化算法,將總的SLD計劃映射到遠航建議、評估報告和其他假設分析中提到的各個單位。

兵棋推演:可能沒有或很少有關于新的作戰要求和能力的數據。這就促使了兵棋推演的模擬。一個SLD計劃可以包括狀態變量或問題(例如,未來的全球和戰區態勢、威脅特征),這些問題只能被觀察、感知,并且不能被改變。控制變量是解決方案(例如,一個SLD計劃)。LAILOW在狀態和控制變量之間設置了一個兵棋推演。問題和解決方案根據選擇、變異和交叉的進化原則共同演化。

如圖1所示,LAILOW框架可以被設定為一個由自我玩家和對手進行的多段兵棋推演。自我游戲者或防御者是SLD企業。對手或攻擊者是包括競爭性需求的環境。在應用LAILOW時,我們首先將過程分為狀態變量和決策變量,如下所示:

狀態變量: 這些變量和數據可以被感知、觀察和估計,但是,不能由自我角色決定或改變。它們是輸入變量,或自我游戲者必須考慮的問題。它們也被稱為SLD企業的測試或攻擊。

決策變量: 這些變量是使用優化算法來解決問題所需要的。在LAILOW中,決策變量的優化是通過整合Soar-RL和協同進化搜索和優化算法來實現的(Back, 1996; O'Reilly等人, 2020)。

對手(測試)和自己的玩家(解決方案)都像兵棋推演中一樣演化和競爭。LAILOW就像一個蒙特卡洛模擬,但由ML/AI學習的模式與優化算法指導。在兵棋推演中,對手產生大規模的假設測試,以挑戰自我玩家提出更好的解決方案,例如,SLD配置,以回答諸如 "如果我選擇一個不同的決定會發生什么?"的系統模擬問題。

每個 "學習、優化、兵棋推演"周期在每個階段和所有價值領域動態地迭代,其分析組件和算法詳見下文。

在LAILOW框架中,"學習 "部分通常采用有監督的ML算法,如分類、回歸和預測算法。例如,人們可以應用scikit-learn python中的各種最先進的監督ML算法,如邏輯回歸、決策樹、天真貝葉斯、隨機森林、k-近鄰和神經網絡。深度學習或AGI Transformers也可以放在這個類別中,輸入數據是多樣化的。一個AGI框架通常包含大規模的機器學習模型(例如,ChatGPT模型中的數十億個參數;OpenAI,2023),以從多模態數據中學習和識別模式。

監督的ML算法可用于學習潛在的SLD和偏離計劃的功能區的狀態變量和評估措施,如部署和執行的速度、質量和適用性,競爭性需求和約束的平衡(例如,避免不可接受的能力下降),以及Fd和Fg措施。

在LAILOW中,我們使用Soar-RL來分別學習自玩家和對手的兩個健身函數。在強化學習中,代理人根據其當前狀態和它從內部模型中估計的期望值,采取一個行動并產生一個新的狀態(Sutton & Barto, 2014)。它還通過修改其內部模型從環境的獎勵數據中學習。Soar-RL可以將基于規則的人工智能系統與許多其他能力,包括短期和長期記憶,進行可擴展的整合(Laird,2012)。Soar-RL在軍事應用中具有以下優勢,因為它

  • 可以包括現有的知識(例如,SLD的交戰規則),也可以從數據中修改和發現新規則
  • 以在線、實時、漸進的方式學習,因此不需要批量處理(潛在的大)數據
  • 提供可解釋的人工智能的優勢,因為發現的模式被表示為規則
  • 與因果學習相聯系,因為它符合因果學習的支柱(例如,關聯、干預和反事實;Pearl & Mackenzie,2018),通過使用干預產生預期效果數據(Wager & Athey,2018)。

"學習 "組件也可以應用無監督的學習算法。自玩家執行無監督的機器學習算法,如k-means、原理成分分析(PCA)和詞匯鏈接分析(LLA; Zhao & Stevens, 2020; Zhao et al., 2016)來發現鏈接。

一個SLD過程需要進行what-if分析,因為這促使了兵棋推演的模擬。一個SLD計劃可以包括狀態變量或問題(例如,未來的全球和戰區態勢、威脅特征、處理這些威脅的艦隊需求),這些問題只能被觀察、感知,不能被改變。控制變量是解決方案(例如,一個SLD計劃)。LAILOW在狀態和控制變量之間設置了一個兵棋推演。問題和解決方案根據選擇、變異和交叉的進化原則共同演化。

SLD計劃和偏移模型的狀態和決策變量的數量可能非常大。協同進化算法可以模擬未來作戰要求、威脅和全球環境及未來能力的動態配置,以及兵棋推演模擬中的其他競爭因素。如圖1所示,競爭性協同進化算法用于解決生成對抗網絡(GANs;Goodfellow等人,2014;Arora等人,2017)所遇到的minmax-問題。玩家的對抗性交戰可以通過計算建模來實現。競爭性協同進化算法采取基于種群的方法來迭代對抗性交戰,可以探索不同的行為空間。用例測試(對抗性攻擊者群體)是主動或被動地阻撓問題解決方案(防御者)的有效性。協同進化算法被用來識別成功的、新穎的以及最有效的解決手段(防御者)來對抗各種測試(攻擊)。在這種競爭性游戲中,測試(攻擊者)和解決方案(防御者)的策略會導致對手之間的軍備競賽,雙方在追求沖突的目標時都在適應或進化。

一個基本的協同進化算法用錦標賽選擇和用于變異的方法(如交叉和變異)來進化兩個種群。一個種群包括測試(攻擊)和另一個解決方案(防御)。在每一代中,通過配對攻擊和防御形成交戰。這些種群以交替的步驟進行進化: 首先,測試種群被選擇、改變、更新并針對解決方案進行評估,然后解決方案的種群被選擇、改變、更新并針對測試進行評估。每個測試--解決方案對都被派往參與組件,其結果被用作每個組件的適配度的一部分。適應性是根據對手的交戰情況整體計算的。

每個SLD配置都有一個健身值,它與需要優化的措施有關,如部隊發展(Fd)和部隊生成(Fg)效率。來自 "學習 "的模式被用來優化未來的SLD計劃,其措施如下:

  • SLD的成本:對于一艘船來說,從一個地方移動到另一個地方
    • 移動人員的成本是多少: 每個人的PCS成本 x 坯料的數量?
    • 準備必要的基礎設施(匹配的評估)以支持船舶移動的成本是多少?
  • Fd/Fg效率: 有多少游覽或需求得到滿足(匹配)?

優化可能是壓倒性的。LAILOW使用綜合Soar-RL和協同進化算法,簡化了優化過程。

LAILOW已被用于DMO和EABO的兵棋推演(Zhao, 2021),發現海軍艦艇和海軍陸戰隊的維修和供應鏈的物流操作的脆弱性和彈性(Zhao & Mata, 2020),以及超視距打擊任務規劃(Zhao等,2020;Zhao & Nagy, 2020)。

付費5元查看完整內容

美國仍然是世界上最突出的軍事和技術力量。在過去十年中,美國認識到人工智能作為力量倍增器的潛力,越來越多地將人工智能(AI)的熟練程度視為美國重要利益和保證美國軍事和經濟實力的機制。特別是,在過去十年中,人工智能已成為美國國防的一項關鍵能力,特別是考慮到2022年美國國防戰略對印度-太平洋地區的關注。

因此,美國國防部(DoD)(以及美國政府和國防機構總體上)對人工智能和相關新興技術表現出越來越大的熱情。然而,雖然美國目前在學術界和私營部門的人工智能研究和開發方面取得了巨大進展,但國防部尚未在廣泛范圍內成功地將商業人工智能的發展轉化為真正的軍事能力。

美國政府在利用國防人工智能和人工智能支持的系統方面通常處于有利地位。然而,在過去的幾年里,各種官僚主義、組織和程序上的障礙減緩了國防部在國防人工智能采用和基于技術的創新方面的進展。最關鍵的是,國防部遭受了復雜的收購過程和廣泛的數據、STEM和AI人才和培訓的短缺。從事人工智能和人工智能相關技術和項目的組織往往是孤立的,而且還存在必要的數據和其他資源相互分離。在美國防部內部存在一種傾向于可靠方法和系統的文化,有時趨向于勒德主義。所有這些因素都導致了人工智能采用的速度出奇的緩慢。美國家安全委員會2021年提交給國會的最終報告總結說,"盡管有令人興奮的實驗和一些小型的人工智能項目,但美國政府離人工智能就緒還有很長的路要走"。

因此,盡管人工智能有可能增強美國的國家安全并成為一個優勢領域,而且鑒于美國在軍事、創新和技術領導方面的長期傳統,人工智能有可能成為一個薄弱點,擴大 "美國已經進入的脆弱窗口"。 如果美國不加快創新步伐,達到負責任的速度,并奠定必要的制度基礎,以支持一支精通人工智能的軍隊,人工智能將繼續成為一個不安全點。

去年,美國防部在這些挑戰中的一些方面取得了進展,調整了國防人工智能的方法。2022年6月,美國防部發布了《負責任人工智能戰略和實施途徑》,將更有數據依據的、負責任的、可操作的人工智能工作列為優先事項,此后開始執行。最重要的是,美國防部已經啟動了對其人工智能組織結構的重大改革,創建了一個新的首席數字和人工智能辦公室(CDAO),以整合其不同的人工智能項目和利益相關者,并使其與該部門的數據流更好地協調。值得注意的是,美國國防部目前正在對其國防人工智能的整體方法進行重大變革和振興。然而,這些新的人工智能努力是否足以讓美國彌補失去的時間,還有待觀察。

付費5元查看完整內容

無人機系統和下一代戰車(NGCV)集成的重點是由美國國防部航空航天教育、研究和創新中心團隊推動的,以支持美國陸軍士兵的項目合作。通過與克里斯-克羅寧格和巴勃羅-古茲曼的雙周互動,與美國陸軍作戰能力發展中心陸軍研究實驗室合作,提出了創造一個盒子的想法,這個盒子可以作為無人機的存儲和平臺,讓無人機降落、起飛,并在航行中得到保護。這項工作的最初目標是開發一個高效和有效的移動無人機平臺原型,供士兵們在戰場上最終使用。計劃是對無人機停留在盒子的蓋子(平臺)上的方法進行多次測試,在盒子里時提供額外保護。

付費5元查看完整內容

摘要

指揮偵察區域協調和控制環境網絡(CRACCEN)是加拿大國防研究與發展部(DRDC)-大西洋研究中心正在開發的決策輔助系統,旨在徹底改變加拿大皇家海軍(RCN)進行水下戰爭(UWW)的方式。本科學報告概述了CRACCEN系統的高級目標和要求,并審查了幾個研究領域,以確定開發該系統的適當候選技術。根據任務要求和UWW任務環境的特點,對各種潛在的顯示和輸入硬件技術進行了評估。審查結果表明,應采用能夠容納一組同時使用的桌面顯示器作為CRACCEN系統的中央顯示器,并有可能使用其他顯示器和顯示模式來增強UWW團隊的能力。建議與主題專家(SMEs)進一步研究,以驗證這些顯示器的可行性、可用性和附加值,并反復設計適合顯示器類型和CRACCEN用戶需求的界面。

對國防和安全的意義

皇家海軍有一個長期目標,即徹底改變WW的行為并使之現代化,而指揮偵察區域協調和控制環境網絡CRACCEN系統將在這個目標中發揮核心作用。為了進行CRACCEN系統的開發和原型設計,需要有適當的技術來適應任務的要求和任務環境的條件。本報告針對這些要求審查和分析了各種潛在的顯示和輸入技術,并為原型開發和未來研究提供了具體建議,以便最終整合到CRACCEN中。

1 引言

加拿大皇家海軍(RCN)正致力于水下戰爭(UWW)的革新和現代化。指揮部偵察區協調和控制環境網絡(CRACCEN)項目是實現這一目標的第一步。該項目不是對UWW系統的各個部分進行漸進式的改進,而是旨在重新思考現有的指揮和控制(C2)結構。雖然用革命性的新系統和結構取代現有系統和結構的潛力為精簡和改善UWW的行為提供了寶貴的機會,而不受現有系統的限制,但項目的開放式性質帶來了新的復雜性。

也就是說,這樣一個革命性的系統應該是什么樣子的問題是完全開放的。任何數量的現有的、新興的或未來的顯示和交互技術都可以應用于這個問題,并具有不同程度的有效性。為了進行CRACCEN系統的開發和原型設計,必須縮小設計空間,并選擇適當的技術。本科學報告針對CRACCEN系統要完成的任務要求,對現有的顯示和輸入技術進行了審查,并對技術選擇和未來研究提出了具體建議。

1.1 報告綱要

本報告的組織結構如下。

  • 第2節描述了CRACCEN項目和系統,并利用以前的工作來定義系統要求,為隨后的審查和分析奠定基礎。

  • 第3節討論了這次綜合審查所采取的方法。

  • 第4節回顧了可能應用于CRACCEN系統的技術。

  • 第5節評估了這些技術在兩類限制條件下的適用性:UWW團隊使用CRACCEN系統所要完成的任務的特點,以及艦載UWW任務環境的條件。

  • 第6節從綜合審查的結果中得出了顯示和輸入技術選擇的建議,并概述了驗證和建立這些建議所需的未來研究。

  • 第7節對CRACCEN系統的顯示和輸入技術選擇進行討論。

2 CRACCEN

在漫長的和平時期,在皇家海軍內部進行UWW需要最小的現代化。相比之下,在同一時期,技術領域發生了巨大的變化,因此進行UWW的環境也發生了變化。2017年,加拿大國防研究與發展部(DRDC)--大西洋研究中心對科學與技術總監--海軍發布的直接客戶支持任務做出了回應,該系統將使RCN計劃和進行UWW的方式現代化和革命化[1]。DRDC-大西洋研究中心的提案包括一個為期五年的系統研究和開發項目,以徹底改變現有的預測性態勢感知、戰斗空間管理、作戰計劃和任務執行的方法和程序[2]。

2.1 CRACCEN項目

早期的一份內部出版物將CRACCEN項目分解為可操作的工作分解要素(WBEs),涵蓋了徹底改變UWW行為所需的廣泛努力[2]。本報告屬于WBE 1:革命性C2系統的設計概念,其目標是為CRACCEN開發設計概念和工作流程,并確定可視化的最佳方法。CRACCEN系統的開發預計將遠遠超過本項目的五年時間框架,其目的只是為革新的WWW系統奠定基礎。在本報告中,對CRACCEN的提及是指預期的未來系統,而不是五年期項目。

2.2 CRACCEN系統

CRACCEN系統旨在通過自動信息整理、環境預測、實時建模和模擬工具以及新型決策支持工具來支持UWW指揮團隊[2]。目前WW指揮小組的規劃和決策結構是,小組成員操作各自的桌面軟件,手工整理數據以發展態勢感知(SA),并為作戰方案(COA)的開發和任務規劃編制自己的視覺輔助工具[3]。相比之下,CRACCEN系統的概念是成為一個中央協作環境,為指揮小組提供與其任務規劃和決策相關的所有信息,并支持小組討論、協作制定COA,以及建立和維護共享SA。

本報告的主要重點是CRACCEN的協作界面,供指揮小組使用。正如定向客戶支持的海軍命令所描述的,CRACCEN應涉及一個協作界面,能夠顯示動態(如海洋條件預測、環境風險評估、水下威脅軌跡)和靜態(如圖示沉船、海洋哺乳動物目擊、歷史測深)信息層,以便為UWW任務規劃和執行提供一個中央指揮和控制環境[4]。在本報告的范圍之外,該系統將更廣泛地涉及一個廣泛的信息骨干和一套算法,以支持這些數據的自動收集、整理、處理、分析、共享和動態可視化[2] 。

2.3 CRACCEN的系統要求

2.3.1 引出要求

可以采用一些半正式和描述性的分析來描述C2環境的性質,目的是為了改進C2工作系統。分層目標分析(HGA)確定了工作系統需要實現的目標,以支持其操作者[5]。因為HGA關注的是可能是非線性或平行的目標,而不是使用當前系統完成目標的線性任務流,所以它是一種理想的分析方法,可以為設計新的或革命性的系統(如CRACCEN)得出需求[6]。

過去的工作利用HGA[3][7][8][9]探討了RCN中UWW C2環境的性質。最近的一份報告具體確定了在設計CRACCEN時需要考慮的四個高層次目標[10]。為實現這些目標,對CRACCEN的要求描述如下。

1.評估準備情況。CRACCEN應自動收集和整理有關自身艦艇和任務組(TG)資產狀態(如位置、方位、武器狀態、傳感器狀態和定位)的信息,并在接到命令后,以易于解析和直觀互動的空間可視化媒介向UWW小組提供這些信息。

2.規劃和管理。CRACCEN應通過以下方式促進短期和長期規劃工作:a)自動收集和整理來自多個數據流的數據,以協助建立公認的海上圖景;b)使用人工智能(AI)預測數據流的未來狀態,并提出規劃建議;c)提供工具,幫助UWW團隊合作建立、可視化和頒布COA和計劃。

3.維護SA。CRACCEN應簡化SA的開發并使其自動化,以便在中央顯示器上向UWW團隊提供行動區(AOO)的實時概覽。這將減少相關信息被忽視的可能性,將認知負擔降到最低,并使團隊能夠專注于任務規劃和執行任務。CRACCEN中央顯示器顯示與SA相關的信息,也可以讓UWW團隊成員之間共享SA,從而促進COA的合作開發。

4.行動任務。CRACCEN應通過以下方式促進任務的執行:a)將多種信息來源(如水深測量、戰術、關于所看到的敵人行為的歷史數據、情報)納入預測敵方潛艇活動高風險區域的算法;b)使用人工智能預測以前看到的潛艇的未來位置;以及c)為傳感器和資產布置提出建議,以便最好地保護TG免受威脅。

這些高層次的目標之間存在重疊和相互依賴,它們共同闡明了CRACCEN的預定和預期用例。本報告的重點是能夠支持這些要求的顯示和輸入技術。

2.3.2 根據需求來限制顯示和輸入技術的選擇

可以在上述要求的基礎上建立技術選擇的初步約束。為了滿足CRACCEN的要求,至少需要一個中央顯示器;這個中央顯示器的確切性質和互動方法有待探討。由于WWW必然發生在一個三維(3D)空間,從水面到海底,所以也必須考慮三維顯示能力,以最好地支持SA。本報告將探討幾種三維顯示的方法,以確定其與CRACCEN整合的可行性。最后,UWW團隊的每個成員都是各自領域和角色的專家,他們需要在CRACCEN促進的合作工作中完成持續的個人工作。事實上,任務規劃和執行的合作工作取決于個人對問題的專業知識。因此,也應考慮將多個顯示器結合起來,靈活地融合個人和小組工作。

盡管與上級指揮部或其他TG成員進行遠程協作的能力可能是未來需要的一種能力,但目前的工作僅集中在同地辦公的情況下。

2.4 系統用戶

已經進行了任務分析、目標分解分析和任務分析,以確定預期使用CRACCEN的人員,并通過與主題專家(SMEs)的訪談加以證實[10][11] 。預計使用該系統的人員包括反潛計劃官員(ASPO)、反潛戰指揮官(ASWC)、指揮官(CO)、當前行動官員(COpsO)、未來行動官員(FOpsO)、水下部隊追蹤協調員(FTC-SS)、行動室官員(ORO)、聲納控制主管(SCS)和水下戰爭主管(UWWD)。這些用戶共同組成了UWW的指揮團隊,盡管所有這些角色都不可能同時參與規劃和決策。CRACCEN應能容納三到五個同時在同一地點的用戶,并能根據需要靈活地容納更多的用戶。

3 方法

本報告的中心研究問題可以概括為 "哪些顯示和輸入技術最適合于為WW指揮小組提供革命性的決策輔助工具的預期使用情況?" 即使在這種最簡化的形式下,這個問題也跨越了幾個學科,因為它必須考慮到顯示和輸入技術、要完成的任務的特點以及環境和其他實用的限制。其中一些學科包括C2、工程、人體工程學、人機交互、人類因素、團隊認知和心理學。因此,本報告的方法遵循綜合評論的方法,其目的是通過回顧和綜合現有的文獻,對一個主題產生新的框架和觀點[12]。當一個研究問題過于寬泛或跨學科,無法進行完全系統的回顧時,這種文獻回顧的方法特別有用。

研究問題(即,哪些顯示和輸入技術最適合于WWW指揮小組的革命性決策輔助工具的預期使用情況)可以分解為三個不同的部分,需要采用不同的文獻搜索和審查方法。(1)潛在技術的描述;(2)技術對團隊工作和協作的適用性;以及(3)技術對UWW團隊完成任務的船上環境條件的適用性。第5節綜合了所有三個方面的審查結果,可與附件A中提供的結果匯總表一起閱讀。

3.1 數據庫

綜合性審查所參考的數據庫有。電氣和電子工程師協會(IEEE)Xplore、Inspec、ScienceDirect、加拿大國防信息數據庫(CANDID)、國防技術信息中心(DTIC)和谷歌學術。

3.2 檢索參數

對于下面描述的所有文獻搜索,結果僅限于那些用英語寫的,并且在2010年至2022年之間發表的文獻,以確保調查結果與當前和未來的需求相關。不是來自同行評議的期刊文章、書籍章節、會議記錄或軍事報告的結果被放棄考慮。根據已發表的關于最佳實踐的文獻,對谷歌學術數據庫的搜索只限于前100個結果,按相關性排序[13]。對DTIC技術報告數據庫的搜索也同樣受到限制,因為該數據庫由谷歌提供,即使搜索結果超過100條,也不會顯示超過前100條按相關性排序的結果。對于所有其他的數據庫,沒有這種限制。

對于所有的搜索,感興趣的關鍵詞必須包含在摘要或文件標題中1。閱讀所有結果的標題和摘要,評估其相關性,并在認為不相關的情況下予以舍棄;例如,在搜索中產生的關于某項技術是否適合團隊工作的結果,如果實際上與團隊活動無關,則予以舍棄。保留下來的項目被充分閱讀,并進一步篩選其相關性。在閱讀過程中,掃描了參考文獻列表,以尋找數據庫搜索中沒有發現的其他相關參考文獻。這些二手資料被標記出來,并以類似的方式進行評估;這些二手資料不考慮出版年份,因為它們通常提供背景信息或更多的基礎性證據。

在某些情況下,在數據庫搜索中發現的文章顯示了與研究問題直接相關的專門議題的會議記錄(例如,IEEE水平互動人機系統國際研討會)。在這些情況下,對會議記錄進行了手工搜索,以獲得更多的相關結果。

3.3 審查主題

3.3.1 對顯示和輸入技術的審查

對于這方面的審查,潛在技術領域來自第2節討論的系統要求。也就是說,CRACCEN將需要至少一個中央顯示屏,并有可能將顯示屏增加到三維空間。技術審查的結果可在第4節找到。

對顯示技術的描述是從現有的評論文章中發展出來的,這些文章用于定義可能的技術空間。在描述二維(2D)顯示技術時,沒有參考任何評論文章,因為該技術已經很成熟了,在以后考慮輸入方法和任務需求時,會出現最有意義的差異。兩篇評論文章為三維顯示技術的回顧提供了基礎[14][15]。在討論擴展現實時還參考了其他評論文章,其中包括增強現實(AR)和虛擬現實(VR)頭戴式顯示器(HMD),以及手持設備的AR[16][17]。

3.3.2 顯示和輸入技術對團隊工作的適用性

在這一方面的審查中,使用關鍵詞 "團隊工作"、"團隊"、"協作 "和 "小組工作",對具體與團隊工作有關的個別技術或技術類別進行了搜索。為每項技術選擇的其他關鍵詞列于表1。這一部分的審查結果收集在第5.1節中討論。

表1:用于審查顯示和輸入技術是否適合團隊工作的搜索詞列表。

主題 關鍵詞
顯示屏尺寸 顯示尺寸、屏幕尺寸、大型顯示器
顯示方向 桌面、水平顯示、水平屏幕、垂直顯示、垂直屏幕、顯示方向、屏幕方向
鼠標輸入 鼠標輸入、電腦鼠標、多用鼠標
筆輸入 手寫筆,手電筒,筆輸入,多筆,筆觸摸
觸摸輸入 觸摸屏,觸摸屏,觸摸輸入,多點觸摸
軌跡球輸入 軌跡球
文本輸入 文本輸入,鍵盤,語音識別,手寫
3D顯示器 3D眼鏡,眼鏡,3D顯示,視差顯示
擴展現實 虛擬現實、增強現實、擴展現實、共處一地、共處一地

本綜述的范圍集中在真實人類的同地協作上,因此放棄了與遠程協作和人類-機器人協作有關的結果。大部分關于擴展現實技術的搜索結果都與遠程和/或網絡協作設置有關。因此,在這個特定的搜索中加入了額外的關鍵詞 "共同定位或共同定位",以排除這些結果,并更好地集中在感興趣的結果上。

3.3.3 UWW任務環境的顯示和輸入技術的適用性

在這方面的審查中,使用關鍵詞 "人機工程學",對個別技術或技術類別的人機工程學特性進行了搜索。每個技術或技術類別所使用的其他關鍵詞與表1中給出的相同。請注意,在這些搜索中,為了獲得更多的結果,出版年份的納入范圍被擴大到2000-2022年。

這些搜索還輔以針對眼睛疲勞和網絡病主題的搜索,這些都是已知的問題,特別是對于VR和AR HMD來說。請注意,對于這些有針對性的搜索,作者把重點放在比較技術的實驗和評論研究上,而不是測試可能的病因或探索實時檢測和預測現象的廣泛的實驗研究。最后,有針對性地搜索了船上UWW任務環境的已知環境條件對顯示和輸入技術的影響:船舶運動和振動。

這些補充搜索的關鍵詞在表2中給出。這一部分的審查結果收集在第5.2節中討論。

表2:用于審查UWW任務環境的顯示和輸入技術的適用性的補充搜索詞列表。

主題 關鍵詞
眼睛疲勞 眼睛疲勞,視覺疲勞,虛擬現實,增強現實,HMD,頭戴式顯示器
暈機 暈機,模擬器暈機,虛擬現實,增強現實,頭戴式顯示器,頭戴式顯示器
船舶運動和振動 船舶運動,物理運動,發動機振動,運動技能,手動控制,輸入設備,文本輸入,虛擬現實,增強現實,人為因素

4 對顯示和輸入技術的審查

本審查概述了CRACCEN可能考慮的顯示和輸入技術。本節無意對所有可能的顯示和輸入技術進行深入審查,而是對許多至少大致符合先前確定的系統要求的技術進行簡要概述,以便在第5節中更仔細地探討它們是否適合CRACCEN。

4.1 二維顯示器

二維顯示器是人們熟悉的、無處不在的技術,有各種各樣的尺寸。對于CRACCEN來說,中央二維顯示器的目標尺寸是大到足以容納多個用戶,但又不至于大到不適合安裝在軍艦上。二維顯示器的方向也同樣可以變化,從垂直方向到水平方向,或以垂直和水平之間的某個角度傾斜。

大型顯示器的尺寸和方向對一些設計限制有影響,這些限制將在第5節中考慮,包括有多少用戶可以同時觀看和與顯示器互動,各種輸入方法的可行性,以及顯示器的人體工程學。水平方向的二維顯示器在面向多個用戶時通常被稱為桌面顯示器,因為它們允許用戶站在或坐在一個桌子大小的水平顯示器周圍,從上面向下看信息。桌面顯示器經常被用來以數字方式重現圍繞物理桌面的協作工作的體驗。在本報告中,"桌面顯示器 "一詞將被用來指代這種水平方向的二維顯示器。

4.2 三維顯示

從水面延伸到海底的UWW場館是三維的。因此,二維顯示器準確表現AOO的能力有內在的限制。UWW團隊目前使用各種二維圖形系統進行操作,但CRACCEN的開發代表了一個徹底改變和簡化工作流程的機會。盡管三維空間可以從二維視圖的組合和/或操作中推斷出來,但提供一個直觀的三維視圖可能會減輕WWW團隊的認知負擔,并釋放出額外的精神資源來完成他們所需的復雜的任務規劃和執行任務[18]。以下是對三維顯示技術的簡要概述,這是從最近的兩篇評論文章中整理出來的[14][15]。雖然許多三維顯示技術的開發只是為了顯示目的(即不考慮用戶互動),但下面的重點是那些已經開發了互動機制的三維顯示技術,以滿足CRACCEN的要求。

也許最熟悉的3D顯示器類型是波長選擇立體系統,它向用戶展示兩個略微偏移和色變的圖像。用戶戴上特殊的立體眼鏡,過濾信息,使每只眼睛只能看到特定的波長(即顏色),當兩幅圖像被大腦合并時,其效果就是三維視圖[19]。類似的系統使用偏振鏡來過濾掉每只眼睛的不同圖像,每幅圖像要么同時呈現[20],要么非常快速地連續呈現[21]。

自動立體(AS)系統通過向每只眼睛呈現略微不同的信息來喚起深度幻覺,從而允許在沒有任何特殊眼鏡的情況下對3D場景進行立體觀看。這些系統可以是時間順序的,以快速交替的順序從兩個不同的方向(即分別朝向一只眼睛)呈現光線[22];或者是時間平行的,在觀看者和顯示器之間有一個層,同時向每只眼睛呈現略有不同的畫面。雖然AS消除了對專門的可穿戴設備的需求,但它往往需要其他高度專業化的硬件(例如,[23][24])。其他的AS三維顯示系統產生多個不同的、略微偏移的圖像,每個圖像只在有限的觀察區域內可見,因此每次只對一只眼睛可見[25][26][27][28]。當用戶移動她的頭部時,她就會在觀察區中移動,從而改變三維物體的視圖。最后,容積式三維顯示器通過照亮懸浮在半空中的容積式像素,在真正的三維空間中呈現圖像,通常是在一個封閉的表面內[29]。體積顯示需要專門的硬件(即顯示體積),并產生高計算成本。

4.3 擴展現實顯示

擴展現實是一個總括性術語,包括虛擬和現實環境的結合,特別強調沉浸感和互動:擴展現實技術允許用戶不僅查看虛擬的三維信息,而且在真實或虛擬環境中移動時與真實或虛擬物體互動。

根據[15]的分類法,虛擬現實(VR)和增強現實(AR)頭戴式3D顯示器(HMD)是采用先進立體眼鏡的雙視角立體顯示器。然而,它們在此類技術中有些特別,因為它們提供了完全的視差體驗,其中3D視圖隨著頭部的水平和垂直運動而變化。因此,近年來它們比非沉浸式3D顯示器獲得了更多的關注和研究努力。下文將單獨考慮每一種,以及手持式AR和空間AR。

4.3.1 虛擬現實HMDs

VR HMDs將一個虛擬渲染的環境投射到安裝在用戶眼前的小型光學顯示器上,以獲得完全沉浸式的體驗[14][16]。在HMD內,用戶不能看到外部世界,包括他們自己的身體和手,除非外部世界的物體被跟蹤并在虛擬世界內再現。因此,用戶通常被賦予相機追蹤的手持遙控器,以便與虛擬世界互動。VR HMD通常通過直接放置在HMD上的揚聲器向用戶展示聽覺信息。

目前一些常用的商業VR HMD系統是HTC Vive(HTC)和Oculus Rift(Meta Technologies, LLC)。這兩個系統目前都需要將HMD,也就是用戶的頭部,與一臺功能強大的電腦進行物理連接,并且建議每臺電腦只能連接一個頭顯,以確保顯示的虛擬環境的低延遲。這兩種系統也都采用了手持式控制器,使用戶能夠瀏覽虛擬環境并與虛擬物體互動。一些VR系統采用頭戴式攝像機,而另一些則需要一套外部攝像機來跟蹤頭戴式攝像機和控制器的運動。外部攝像機每次移動時都必須仔細校準,因此一般建議在校準后保持在一個地方。其他消費級的VR HMD系統已經被開發出來,在不使用外圍攝像頭或系繩的情況下也能發揮作用(例如,Oculus Go、Oculus Quest、Lenovo Mirage)。

4.3.2 增強現實HMDs

AR HMDs是將虛擬渲染的元素疊加到用戶對真實世界的看法上的設備[14][16]。面向前方的攝像頭跟蹤現實世界環境的三維結構,面向用戶的傳感器跟蹤頭部和/或眼睛的運動,使用戶能夠通過在物理空間中的移動從各個角度觀看三維物體。面向前方的攝像頭也可以用來跟蹤用戶的手部運動,從而使他們能夠操縱虛擬物體。與VR HMD一樣,AR HMD通常通過設置在HMD耳朵附近的揚聲器直接向用戶呈現聽覺信息。

與VR HMD一樣,AR HMD也可以在用戶眼前有一個完整的視頻屏幕,然后呈現真實世界的視頻資料并與虛擬物體重疊。然而,更常見的是,AR HMD屏幕是透明的,允許直接看到現實世界,然后在一定的視覺范圍內與虛擬物體重疊。微軟Hololens2是目前最常用的透明AR HMD的例子。

4.3.3 手持設備的AR

用戶可以通過舉起手持設備(如智能手機、平板電腦)作為虛擬增強環境的窗口來體驗視頻傳輸的AR,而不是佩戴HMD[16][17]。設備中面向前方的攝像頭可以感知真實的三維環境,并將實時視頻傳輸到手持顯示器上,與虛擬渲染的物體一起呈現。當用戶(或設備)在物理空間中移動時,來自設備的加速計和陀螺儀數據幫助系統跟蹤運動并準確地渲染三維物體,而設備的觸摸屏允許用戶與顯示在上面的虛擬物體進行互動。

4.3.4 空間AR

空間AR,也被稱為有形AR,使用相機和投影儀系統來跟蹤環境中的物理對象,并將虛擬信息投射到它們身上。這使得用戶可以有形地查看和互動物理物體,這些物體被數字增強了額外的視覺信息,不需要眼鏡、HMD或專門的顯示器[17][30]。該技術可用于在實物上顯示補充文字注釋,在無紋理的物體上展示紋理,為用戶提供進入物體三維內部的虛擬視圖,或將非數字物體(如一張紙)轉化為數字顯示。常見的空間AR系統采用了一個桌面沙盤,用戶可以在沙盤中移動沙子以使物理景觀變形,環境細節可以通過光學方式投射在沙盤上。

空間AR對建筑和設計領域特別有用(例如,能夠與新產品的快速數字模擬進行物理互動),也可用于某些培訓目的(例如,能夠將3D器官投射到物理假人上進行手術培訓)。然而,它對WW戰斗空間的有用性是值得商榷的,因為期望的互動目標是整個AOO的表面和次表面。盡管將WW的戰斗空間投射到一個大的物理3D盒子上可以幫助一般的SA,但用戶的互動將受到物理盒子的外部尺寸的限制。操作的自由度將不足以支持探索和與該三維空間的互動,以進行任務規劃和執行。因此,本報告中沒有進一步考慮空間AR。

5 對技術適用性的審查

如第2節所述,CRACCEN的要求建議至少有一個用于規劃和決策的中央二維團隊顯示屏,一種納入互動三維信息的方法,以及納入多個顯示屏的可能性。本報告的主要考慮是顯示和輸入技術對團隊工作和協作的適用性。次要考慮的是每種技術是否適合于船上UWW任務環境的特殊限制。技術對個人工作的適用性被認為是一個基線,特別是涉及到輸入方法和人體工程學的選擇,這在協作環境中并不經常被研究。附件A中列出了一個總結研究結果的表格,這有利于在不同技術之間進行直接比較。

5.1 顯示和輸入技術對團隊工作的適用性

5.1.1 二維中央顯示屏

同時使用CRACCEN的人數可能會對適當的二維中央顯示技術產生重要制約。早期的任務、使命和工作分析結果表明,CRACCEN應該能夠容納三到五個同地的中小企業,并根據需要為更多的用戶提供空間[10][11]。由于預計多個用戶將同時與CRACCEN互動,應考慮將更大的顯示器(即大于32英寸)作為CRACCEN的中心顯示技術。最近對大型顯示器的審查發現,在促進交流、協調和工作空間意識方面,大型顯示器比更傳統的單個顯示器(如臺式機、筆記本電腦)有明顯的優勢[32]。直接比較 "小"(17英寸)和 "大"(33英寸)顯示器的研究表明,大顯示器比小顯示器更容易支持協作任務活動的公平分配[33](參見[34],該研究發現較小的中央顯示器增加了交流的數量,這可能是對較小和不太有效的信息顯示的一種補償)。手持二維顯示設備本身并不是協作工作的理想選擇,因為相對于較大的共享工作空間而言,它們阻礙了交流,降低了工作量的公平性,也降低了解決方案的質量[35]。海軍艦艇上的空間限制通常為中央二維顯示器的尺寸提供了實際的上限,盡管以前的工作表明,全墻(如120英寸)顯示器可以改善陸上指揮中心的軍事指揮團隊的共享SA[36][37]。

屏幕顯示方向包括垂直、水平(如桌面),或介于垂直和桌面方向之間的傾斜顯示。需要用戶花大部分時間與系統互動的任務可能更受益于垂直顯示,而需要大量人際互動的任務,包括小組情景理解、討論和非平行工作,可能更受益于桌面顯示[38]。事實上,據報道,桌面顯示器通常能夠自然而舒適地支持高效的協作和面對面的交流,通過利用熟悉的圍繞物理桌子的協作模式,并結合自然的交流模式來促進知識轉移[33][39][40][41][42][43][44]。在屏幕的任何邊緣工作的能力也允許對個人的工作空間進行劃分,這些空間以后可以合并為小組級活動[45][46]。關于其他用戶行動的反饋通知可以減少工作的冗余,并在這種平行任務中增加SA[47]。相比之下,圍繞垂直屏幕的交流不那么自然,而且更加不對稱(例如,一個人在說話,其他人在聽),并且通常與角色轉換、想法探索和他人意識的減少有關[39](參見[48])。

垂直顯示器更適合于時間較短、用戶較少的重點任務,因為垂直方向限制了用戶與屏幕互動而不互相碰撞的能力,而桌面顯示器則更適合于持續時間較長、需要更多討論的任務[33]。一些研究表明,在少數合作者之間共享的全墻顯示器并不像較小的垂直顯示器那樣對合作工作帶來限制[49],這可能是由于增加了表面積和交流空間。對介于垂直和桌面方向的傾斜屏幕的研究較少。盡管最初的證據表明,對于一對合作的用戶來說,傾斜的屏幕可能比垂直和桌面的屏幕更受歡迎[50],但目前還不清楚這種偏好是否預示著更好的表現,也不清楚這種偏好是否對兩個以上的用戶之間的合作有效。

盡管桌面屏幕對協作工作有明顯的好處,但必須注意的是,將用戶分布在桌面屏幕的所有邊緣會對顯示元素的方向產生復雜的影響[51][52]。在桌面顯示器的用戶界面設計中,需要考慮到方向問題,以確保多個用戶能夠有效地理解、交流和協調所呈現的信息[53]。文本信息的方向對桌面顯示器來說是一個特別的挑戰,因為文本相對于讀者的方向對閱讀速度和準確性有很大影響。然而,在水平觸摸顯示器上存在旋轉和翻譯數字對象的解決方案,無論是手動還是通過檢測用戶的傳感器自動進行[54][55]。當需要呈現的主要信息是空間或圖形而不是文字時,用戶在桌面顯示器周圍的方向就不那么令人擔憂了。然而,值得注意的是,研究表明,群體傾向于聚集在桌面顯示器的一個邊緣,以分享二維地圖的共同視角[56],因為當用戶從不同角度觀看地圖時,他們會發現空間導航是混亂的[57]。

CRACCEN系統可以具有靈活性,允許中央二維顯示器在垂直和桌面方向之間轉換,以適應不同的任務要求[58]。

5.1.1.1 二維顯示器的輸入方法

輸入法是指允許用戶與顯示器上的信息進行交互的技術和機制。輸入方法可以包括用戶的動作和顯示器之間的直接映射(例如,直接觸摸屏、筆式手寫器6),也可以是間接映射,即用戶的動作被一些設備捕捉,并轉化為顯示器上的動作(例如,鼠標、軌跡球)。

對單個用戶的直接和間接輸入法進行比較,直接觸摸輸入更快、更準確,相對于鼠標輸入來說,當任務是雙手操作時,直接觸摸輸入是首選。相比之下,在大多數單點交互的研究中,所有指標都普遍偏向于鼠標(例如,[59][60]),除非任務涉及繪畫或游戲時[61]。[62]發現相對于鼠標和手寫筆輸入,單點觸摸輸入的速度提高了,但準確度卻降低了。對于要求高精度的任務,鼠標輸入通常比觸摸輸入更受歡迎[59][62][63],除非需要操作三維信息[64]。當一項任務不需要高精度時,鼠標輸入比直接觸摸輸入要慢[65]。

鼠標輸入的熟悉程度可能是上述許多比較中的一個因素,因為觸摸輸入的準確性似乎會隨著經驗的積累而提高[66]。事實上,最近的研究表明,在某些任務中,觸摸輸入和鼠標輸入的差別不大,這也許反映了自手持觸摸設備的商業化普及以來,公眾對觸摸屏技術越來越熟悉[67]。對直接觸摸輸入的各種基于軟件的調整顯示,有希望克服其對小目標的不精確性[68]。筆觸也可以提供更好的精確度,因為它們的接觸點更小,產生的遮擋和偶然的觸摸比手指更少[62][69][70],但與手指觸摸相比,其代價可能是速度降低[71]。當追蹤筆在表面上懸停時,納入視覺反饋(例如,與鼠標光標相當)可以略微提高速度,并極大地提高精確度。

在大多數任務中,軌跡球運動比傳統的鼠標運動既慢又不準確,因為很難將軌跡球的旋轉運動轉化為二維顯示器的線性空間[73] 。在更大的顯示器上,保持對間接輸入映射的光標的跟蹤可能被證明是一種挑戰,特別是當鼠標或軌跡球的加速度被設置為高時[74]。當輸入設備的加速度被設置為低時,在大型顯示器上移動光標會變得很乏味。有證據表明,在大屏幕上高速移動時,軌跡球有優勢,但用戶在放慢速度選擇目標時,速度和準確性仍然會下降[75]。

直接觸摸輸入對于大型顯示器來說有其自身的缺點。例如,用戶發現隨著顯示器尺寸的增加,拖動和旋轉物體的任務更加困難[76]。用戶與屏幕上的信息互動的能力也必然受到她的觸及范圍的限制,而這又受到顯示器方向以及她是坐著還是站著的限制[77]。外部跟蹤攝像機可以與基于手勢的輸入一起使用,以擴大在大型顯示器上的觸及范圍[78],或者識別和區分個別用戶的輸入[79]。筆觸也可以用來區分多個用戶的同時輸入。

最后,鼠標和軌跡球輸入的相對性在桌面顯示器上變得不那么直觀,因為用戶可能位于屏幕的任何邊緣,這樣光標的相對運動可能與用戶視角下的鼠標或軌跡球的移動方向不一致。對于CRACCEN的多用戶設置來說,至關重要的是,當使用多個間接輸入時,用戶很難定位彼此的光標并跟蹤運動[38][80][81][82]。

與單鼠標設置相比,多鼠標也可能降低他人意識和協作,而傾向于分而治之的策略[83](參見[84],它顯示了多鼠標在墻壁大小的顯示器上的混合焦點協作任務的潛在作用)。相比之下,直接觸摸輸入能提高協作任務中的他人意識,因為可以很容易地看到他人與顯示器的互動[82][85][86][87] 。同樣,與帶鍵盤的小型筆記本相比,團隊使用單個平板電腦時,語言和非語言交流都得到了改善[88],這表明無論屏幕大小如何,直接觸摸輸入對團隊工作的好處可能都是真實的。事實上,與間接(如鼠標)輸入相比,直接觸摸和筆輸入為協作顯示器周圍的人際互動提供了更好的支持,因為它們允許做手勢,更輕松地意識到其他用戶的行動,以及對意圖進行更自然的推斷[80][81](參見[89],該研究顯示在桌面顯示器的鼠標和觸摸輸入之間沒有協作任務表現或個人偏好的差異)。與單次觸摸、單次鼠標和多次鼠標輸入相比,圍繞桌面的直接多點觸摸特別有利于交流和公平協作[90]。目前可用的觸摸屏支持高水平的多點觸摸(例如,多達30個以上的同時觸摸輸入),允許多個用戶直觀地同時與顯示器互動,無論是否有筆觸的幫助。

5.1.1.2 二維顯示器的文字輸入

盡管對指揮小組成員進行的各種任務分析表明,CRACCEN的使用不會涉及大量的文字輸入[10],但用戶可能還是有必要輸入數據、注釋信息或互相輸入簡短的說明。

一般來說,物理鍵盤提供了最熟悉的文本輸入方法,因此無需培訓就能產生最快和最準確的結果。然而,多用戶與顯示器的互動需要多個物理鍵盤,這將占用空間并使工作站雜亂無章,或者需要一個可以輪流使用的單一鍵盤。對于垂直方向的顯示器,物理鍵盤的位置是不言而喻的,因為將鍵盤放在垂直顯示器的前面符合人體工程學。然而,對于桌面顯示器來說,物理鍵盤的適當位置并不明顯,因為用戶可以在任何邊緣與桌面顯示器互動。

物理鍵盤的另一個選擇是數字觸摸或軟鍵盤,它們可以與任何觸摸顯示器一起使用。與物理鍵盤不同,軟鍵盤可以旋轉、移動和調整大小,以適應用戶在垂直或桌面顯示器周圍的需要,而且多個軟鍵盤可用于同時進行文字輸入任務。因此,軟鍵盤可能比物理鍵盤更適合在大型顯示器上進行協作工作,盡管在設計階段應該考慮提高速度和準確性的方法。例如,可用性研究發現,軟鍵盤產生的速度和準確性比物理鍵盤低,這可能是由于缺乏物理按鍵的觸覺反饋[91][92]。基于字母預測算法的動態調整按鍵大小,在提高速度和準確性方面顯示出一定的前景[93],正如根據個人的人體工程學習慣自適應地調整按鍵間距[94][95]。應注意盡量減少輸入延遲,并在可能的情況下,引入其他方式的按鍵反饋(如聲音、振動),以提高性能和可用性[96][97]。

軟鍵盤也可以通過鋼筆觸摸來激活,盡管相對于使用所有十個手指來說,這大大限制了輸入速度。基于手勢的解決方案允許用戶在移動視覺呈現的字母時,無需抬起手指或手寫筆就能打字[98]。然而,由于這些鍵盤以旨在提高手勢流暢性的布局(即圓形布局)來呈現字符,它們并不熟悉,因此難以使用[99]。

在觸摸表面上用筆式或手指自然書寫,可以實現直觀的文字輸入方法,而且手寫識別算法現在已經足夠先進,可以提供快速而準確的輸入處理。值得注意的是,用鋼筆手寫的速度和準確性要比用指尖手寫的高得多[100]。然而,這種方法的速度受限于人類手寫的速度,使其明顯慢于其他文本輸入方法[91][99]。因此,手寫文本輸入可能適用于簡短的注釋,但不太適合較長的條目。

語音識別軟件采用自然語言處理來聆聽和解釋語音,是另一種直觀的文本輸入方法,對于短信息來說,可能比打字有好處[91][101]。然而,這種方法在CRACCEN中的可行性不太樂觀,因為該軟件需要能夠在環境噪音大、領域特定術語和縮略語多的環境中識別和區分多個用戶。協作環境中的語音識別軟件的一個主要障礙是,系統需要區分用于系統的口頭輸入和隊友之間正在進行的交流[102]。

5.1.2 納入三維信息

由于UWW是在三維空間中進行的,CRACCEN應該納入一些三維可視化和與AOO互動的能力。第4節概述了幾種潛在的三維增強方法。下面將簡要討論3D顯示的適用性,然后再具體討論VR和AR顯示,對其在團隊工作中的應用還有很多研究。

5.1.2.1 立體和自動立體的三維顯示器

總的來說,很少有工作直接研究多人同時使用立體和自動立體三維顯示的問題。然而,從單個用戶對這種顯示的用戶體驗中可以推斷出一些結論。

與通過立體眼鏡觀看的3D顯示器的互動面臨著3D圖像的虛幻性帶來的復雜問題:雖然圖像是3D的,但用戶可以與圖像互動的表面仍然是二維的。這對觸摸輸入的準確性有影響[103],因為用戶不能同時將目光集中在屏幕表面的手指/手指關節和出現在屏幕前后的物體的三維圖像上[104]。其結果是,她的手指/腳趾或三維圖像會顯得模糊和加倍。為了解決這個問題,可以用跟蹤手/手指運動的攝像頭來支持半空中的三維觸摸[105][106][107][108][109]。然而,通過立體眼鏡看到的圖像是扭曲的,當以不同于正面和中間的垂直或水平角度觀看時,會引起用戶的不適[110]。這種局限性使人們對立體眼鏡在多個用戶圍繞顯示屏互動時的可行性產生了疑問,特別是在桌面顯示屏所需的角度上。

其他技術,如Euclideon Holographic Table(Euclideon Pty Ltd),允許多個佩戴特殊立體眼鏡的用戶以模仿全息技術的方式觀看詳細的三維物體并與之互動(另見[111][112])。三維圖像從桌面表面投射出來,攝像機跟蹤用戶的眼鏡,以便在他們在桌子上移動時顯示正確的觀看角度。多個用戶能夠同時看到不同的角度,因為計算機為所有用戶在各自的光頻范圍內向桌子上投射適當的視角。用戶的眼鏡會過濾光線,以便只看到適合其視角的頻率范圍。此外,追蹤式測針允許多個用戶與3D圖像互動。

自動立體視覺(AS)系統在可以準確觀看三維物體的 "甜蜜點 "的數量上是有限的[15];因此用戶數量是有限的,觀看角度也受到限制。最近的創新加入了眼睛或頭部追蹤,以調整顯示器,使 "甜蜜點 "隨用戶移動[113],而多用戶追蹤的進一步創新使AS的三維視圖可以同時進行[114][115]。在所有情況下,當屏幕表面與用戶的臉部大致平行時,這些技術的效果最好,因此對顯示方向和多個用戶的分布有限制。因為它們依賴于二維顯示表面,AS系統通常對用戶的交互有同樣的限制,就像立體眼鏡一樣,盡管在運動追蹤的空中手勢輸入方面已經顯示出一些前景[115]。相比之下,體積顯示器,即像素懸浮在一個封閉的三維表面內的半空中,對交互沒有同樣的限制。用戶可以通過觸摸外殼的外表面與三維圖像進行有限的互動[29],而最近的創新則允許通過運動追蹤的手勢輸入[30]或角度和壓力敏感的手寫筆輸入[116]實現更高層次的互動。

5.1.2.2 擴展現實顯示器

VR HMD已經顯示出在協作規劃任務中增強SA的一些前景,作為對傳統的二維地圖規劃的補充[117]。事實上,VR HMD系統經常被提議用于遠程協作,因為它們允許共享對虛擬環境的認識,并促進其他困難的遠距離互動(例如,[118][119])。然而,這種系統對同地協作的能力造成了限制,因為外部世界,包括一個人的合作者,都被遮蔽了,被全視角的虛擬顯示所取代。與真實環境中面對面的協作工作相比,使用VR HMD的協作工作受到了溝通不暢和碰撞的影響[120]。這是由于無法看到合作者的行動、目光、動作和非語言線索。其結果是,與透明的AR HMD相比,一些協作任務的表現有所下降[120]。通過跟蹤用戶的身體運動,并將每個用戶的數字頭像納入虛擬世界,可以在一定程度上緩解這種影響[121][122]。但是重要的線索,如凝視方向,不容易從這樣的化身中讀出,它們可能無法幫助任務執行[123]。其他解決這些限制的方法是將用戶的指向(例如,通過手指或輸入設備)渲染成共享虛擬環境中的可見光線,或者采用算法將不同用戶的視圖結合起來,以獲得協作虛擬環境的更完整的視圖[124]。

當需要完成的大部分工作是松散耦合的個人工作時,VR HMD可能更合適,其中穿插著短時間的討論和緊密耦合的合作[125]。一些研究提出將單個VR HMD與手持AR設備上的虛擬場景的次要視圖結合起來,這產生了與兩個VR HMD的設置類似的交流和性能結果[126](也見[127][128][129])。關于這種不對稱使用VR HMD的研究仍處于早期階段,并可能很快為不同風格的協作工作提供不對稱設置的指導[130][131][132]。

相比之下,微軟HoloLens2等透視AR HMD允許多個用戶在同一空間內安全互動。AR HMD的同地協作使用已經被證明可以同時容納八個以上的用戶[133]。事實上,文獻推薦了透明的AR HMD,以便在共處一地的合作用戶之間進行成功和安全的交流[120][134]。多個AR-HMD設置支持每個:

1)緊密耦合的交互,每個用戶都可以操縱同一個三維場景(例如,[31][134]);2)驅動-跟隨的交互,其中一個用戶主動控制場景,其他用戶只是查看正在進行的改變(例如,[136]);以及3)松散耦合的交互,其中每個用戶操縱自己的獨立視圖(例如,[137])。這種在多層次交互性之間切換的能力為協作工作提供了重要的靈活性。與VR HMD一樣,使用AR HMD的協作和交流可以通過將用戶的點或目光渲染成共享虛擬環境中的可見光線而得到促進[138]。

與VR HMD相比,使用AR HMD完成任務的用戶對現實世界保持更大的意識,并且與不使用任何HMD完成相同任務的水平相當[139]。AR HMD系統減少了任務空間和交流空間之間的分離,促進了自然的交流線索,以改善任務表現和交流指標[140][141]。此外,AR HMDS的透視特性允許用戶之間繼續互動和協作,即使有些人沒有戴HMD[142]。相對于沒有AR HMD的團隊來說,這種在團隊中不對稱地使用AR HMD可能事實上提高了溝通質量[143]。研究表明,在由消防員、警察和軍事規劃人員組成的共處一地的團隊中,AR系統比傳統的SA和規劃方法更具優勢[144]。這一用例與CRACCEN的預期應用有明顯的相似之處。同樣,美國海軍和陸軍最近也展示了AR HMD作為協作指揮和控制任務的有用工具[145][146]。

AR HMD可能特別適合與桌面顯示器結合使用,這樣用戶就可以在桌面上充分移動,從各個角度觀看3D場景,而不會失去對桌面或現實世界中的合作者的視線(例如,[147])。這種設置也將解決桌面顯示器上文本方向的復雜問題,因為AR HMD可以以適合每個用戶的方向呈現文本。這種組合得益于AR提供的豐富的深度線索來實現信息的可視化,以及桌面顯示器上觸摸輸入的便利性和熟悉性[137]。它已被證明是城市可視化[148][149]、建筑設計[150]和空中任務監測[134]的有用組合,所有這些都涉及到三維物體(即建筑物、飛機)和三維空間從地面水平表面延伸的可視化。UWW同樣可以從AR HMD和桌面顯示器的結合中獲益,因為這個領域的SA涉及到3D物體(即船舶和潛艇)的可視化和從海底表面延伸的3D空間。

手持式AR提供了HMD的替代方案,盡管通過平板電腦與3D物體的互動已被證明比AR HMD更慢、更耗費體力,也更不可取[151]。對用于協作導航任務的手持式AR的研究發現,與傳統的二維虛擬地圖相比,手持式AR地圖在促進交流、建立共同理解和鼓勵討論方面具有明顯的優勢[152]。同樣,允許對一個三維物體進行單獨操作的視圖可以幫助教學和學習[153]。然而,用于小組工作的手持式AR可能與較高的工作量有關,特別是對于復雜的問題,這反過來會阻礙交流和合作[154]。事實上,雖然VR HMD在促進合作者之間的有效溝通方面不如完全透視(如AR)HMD[120],但與VR HMD相比,手持式(如視頻傳輸)AR的任務和溝通性能都受到影響[126]。關于合作任務環境中的混合現實和增強現實的全面回顧,見[155][156]。

5.1.2.3 3D顯示和擴展現實的輸入方法

當3D信息呈現在2D顯示器上時,存在幾種熟悉的輸入方法。直接觸摸(例如,在手持AR設備上)和間接的鼠標拖動可以用來在3D空間中平移、傾斜和旋轉,而游戲控制器通常使用雙操縱桿來促進3D導航。在設計行業,三維鼠標是在二維顯示器上操縱三維物體的常見解決方案,它提供了沿所有軸線運動的六個自由度(例如,羅技3DConnexion的SpaceMouse)。基于手勢的方法也已經被開發出來,用于在二維顯示器上直接觸摸操縱三維物體[157]。

這樣的輸入方法在與VR和AR HMD的交互中不太可行[158]。更常見的是,HMD使用基于運動的手部跟蹤來支持半空中的虛擬 "直接 "觸摸,或者使用基于紅外傳感器的手持遙控器跟蹤來間接選擇和操縱虛擬物體。這兩種輸入方法都允許用戶與虛擬物體進行互動,以加強對三維環境的沉浸感。

大多數現成的VR HMD都配備了紅外跟蹤的手持遙控器。用戶將遙控器上的激光光標投射到虛擬物體上,并可以按下幾個按鈕中的一個來進行不同的互動。VR HMD系統也可以追蹤手部動作,進行無遙控手勢輸入,并提供與手持遙控器相當的性能和可用性[159]。

由于AR環境的性質,手勢和半空中的 "直接 "觸摸是AR HMD最常見的輸入形式。研究表明,通過提供用戶自己的身體作為自然的空間參照物,對3D場景的雙肢操作有助于用戶對3D空間的理解[160]。盡管執行起來很直觀和自然,但預先定義的手勢可能不符合用戶的假設和偏好的功能,因此可能難以學習和記憶[161][162]。用戶定義的手勢可以規避其中的一些復雜問題[162][163]。微軟HoloLens2支持通過向外的跟蹤攝像頭對簡單的手勢進行準確的板上識別,以便輸入。其他設備,如微軟Kinect,可以與AR或VR HMD系統相連,以擴大可用的手勢輸入范圍,并允許自定義用戶定義的手勢[163]。

追蹤式遙控器在現成的AR HMD中不太常見,但與半空中的 "直接 "觸摸相比,可能提供一些可用性和人體工程學方面的優勢[164]。與追蹤式手持遙控器不同,空中 "直接 "觸摸缺乏觸覺反饋,這可能會影響準確性、速度和感知到的使用便利性[164]。最近的工作研究了使用系留的智能手機[165]或平板電腦[166]作為AR環境中協作工作的有形輸入設備。其他形式的反饋,如聽覺提示,可以被納入支持AR HMD上顯示的虛擬物體的空中操作,但必須考慮到船上操作環境中的環境噪音[167]。

由于特定的三維輸入法的特殊性與顯示技術密切相關(例如,VR HMD的專有遙控器和AR HMD的內置手勢),并且由于文獻搜索沒有得到與三維輸入法對團隊工作和協作的適用性有關的結果,本節的結果沒有在附件A的匯總表中獨立考慮。

5.1.3 結合多個顯示器

盡管CRACCEN的要求表明至少需要一個中央二維顯示器,但該系統不必局限于單一的顯示技術。事實上,對于涉及多個用戶的復雜任務,采用多種技術可能會有一些好處[168][169]。研究小組協作工作時考慮到了耦合的概念,這是衡量合作者對彼此工作的參與程度的標準(例如,[170])。對于緊耦合的任務,小組成員朝著一個或幾個共同的目標緊密合作,通過小組層面的討論和共識來做決定和實施改變。對于松散耦合的任務,小組成員可以在問題的不同方面平行工作,以便共同達到一個目標;決定是在個人層面做出的,或者偶爾與其他小組成員進行松散的協商。混合重點的協作任務涉及松散和緊密耦合的混合,并根據任務要求的流動在兩者之間進行轉換[56][84][168]。一個特定任務的工作量水平也可能影響到耦合和信息共享的要求。例如,當耦合太松(例如,團隊成員之間不共享信息)或太緊(例如,團隊成員之間共享所有信息)時,高工作量下的團隊表現可能會受到影響,而低工作量的情況可能會從較松的耦合中受益[171]。

UWW團隊使用CRACCEN完成的各種復雜的任務規劃和執行任務,預計將涉及混合焦點和各種工作負荷條件。因為在混合焦點工作中,松散和緊密耦合的平衡可能會因各個UWW指揮小組[40],以及不同的任務和工作量條件而有所不同,所以所選技術的靈活性可能具有普遍的好處。結合CRACCEN的多個顯示器可以促進這種靈活的耦合。

在一種可能的配置中,可以提供用于個人工作的手持設備,這些設備隨后可以將數據發送到中央小組顯示器,供討論和進一步協作工作[34][35][172][173][174][175][176]。同樣,系留的手持設備也被證明可以作為大型群體顯示器的替代輸入方法[175][176][177]。有趣的是,上述垂直方向和桌面方向在促進協作和交流方面的差異(例如[39])可能會因為引入輔助的手持設備而減少,這使得工作更加分散[178]。將手持設備保持在一個舒適的高度和角度的對接架(例如[179])可以放在小組顯示器周圍,以促進個人工作的匯總和討論。臺式電腦也可以被納入混合焦點協作系統,為小組工作的不同方面組合多個顯示器,在復雜的決策任務中顯示了前景[172]。

混合焦點系統設計的主要障礙之一是意識的平衡:確保合作者保持對彼此的行動和小組層面的任務進展狀態的了解,同時也能保持對自己個人工作的關注[170][180]。一些研究發現,當手持設備與平板電腦結合在一起時,合作的水平會下降[181]。這種有害的影響可能會被有助于保持他人意識的通知和提醒所緩解[47],而設備之間的信息聯系可以幫助用戶在設備和任務模式之間順利切換[182][183][184][185]。

針對多種集成技術的設計還必須考慮系統復雜性和技術故障排除等更實際的挑戰。聯網到中央小組顯示器和/或相互之間的輔助設備可能會帶來挫折和使用障礙,表現為集成度低、軟件更新不匹配、帶寬限制、網絡連接、設備通信問題,以及對多個設備及其集成的更高維護要求。必須進一步研究系統靈活性和復雜性之間的權衡。

5.2 顯示和輸入技術對UWW任務環境的適用性

UWW的任務環境必然受到UWW指揮小組使用CRACCEN的實際艦上環境的限制。環境因素,如環境噪音、物理空間、溫度、濕度和照明,肯定會在CRACCEN的開發和使用中發揮作用。然而,CRACCEN是為未來船舶開發的未來技術,因此不受現有船舶上物理環境的限制。本節只關注WW任務環境中那些不能由未來船舶設計選擇解決的條件,這些條件將有助于區分考慮中的不同顯示和輸入技術。

5.2.1 顯示技術帶來的眼睛疲勞

盡管任何電子顯示器都會引起眼睛疲勞和視覺疲勞,特別是在長時間使用后,但有證據表明,AR和VR HMD的癥狀的可能性和嚴重程度比普通2D顯示器更大[186][187][188](參見[189])。立體觀看,包括通過HMD和立體眼鏡系統,在觀看虛擬3D物體時,由于輻輳(調整眼睛的轉動以匯聚到物體的距離)和調節(調整眼睛的焦點以匯聚到物體的距離)之間的不匹配,可能會加劇眼睛的疲勞[190][191][192][193][194]。

盡管一些研究表明,與VR HMDS相比,透視AR HMD可以促進更好的深度估計、更高的交互精度和更少的眼睛疲勞[195][196],但眼睛疲勞癥狀的可能性應該是AR和VR HMD的一個嚴肅考慮。設計師必須了解最佳做法,以盡量減少眼睛疲勞,提高用戶體驗和健康水平[197][198]。常見的AR和VR HMD的焦距設定為無限遠(HTC Vive)或大約2米(Oculus Rift、Microsoft HoloLens2)。無限的焦距為開發者簡化了數學運算,但增加了眼睛疲勞的可能性[199]。

用戶需要關注的虛擬物體應該投射在離用戶眼睛不少于0.5米的感知距離上[200]。應該避免要求用戶在更近和更遠的界面之間切換的任務,因為沿Z軸移動焦點會加劇輻輳沖突和緊張[199][200][201]。值得注意的是,透明的AR HMD系統可能需要用戶在投射在眼睛附近的虛擬物體和更遠的真實世界物體之間切換焦點。建議此類系統中的虛擬物體投射在離用戶1.2米到5米之間的感知距離,以獲得最佳的舒適度和抗眼疲勞的效果[200][202]。

各種自適應算法已經被開發出來,通過動態調整用戶的視線,可以最大限度地減少HMD使用中出現的眼睛疲勞和視覺疲勞[203][204] 。使用 "黑暗模式 "圖形,將淺色文本和圖形置于深色背景下,可以減輕VR HMDS中的眼睛疲勞癥狀[205]。同樣,在昏暗的環境中采用淺色的圖形會使用戶對AR HMD的體驗和舒適度達到最佳[206]。也有一些證據表明,訓練和使用HMD的經驗可以改善眼睛疲勞的癥狀[207][208]。

5.2.2 擴展現實HMD帶來的暈機現象

VR用戶經常經歷一種被稱為 "bersickness "或 "模擬器病 "的現象,其癥狀包括惡心、疲勞、迷失方向、頭痛和全身不適[209][210][211]。這些癥狀在移除VR HMD后會持續數小時,并可能最終阻礙使用或妨礙在現實世界中的任務表現[211][212][213]8。雖然還沒有完全理解,但研究表明,暈機是由感官沖突或期望與感知現實之間的不匹配引起的--無論是由于投影圖像的刷新率不足、延遲問題、對用戶頭部運動的跟蹤不佳,還是視覺和前庭系統之間的不匹配(即用戶看到他們正在快速穿過一個場景,但耳朵里的前庭系統沒有記錄任何運動)[209][212][215][216][217][218] 。在使用VR之前立即進行眼動訓練可能會減輕暈機癥狀的可能性[219],盡管還需要更多的研究來驗證這一效果,以擴大樣本量。同樣,用于調節個人暈動癥的技術可能會隨著時間的推移減輕暈機的傾向[220]。

暈車的傾向在不同的人和不同的VR應用之間是不同的,很多人都在努力開發實時檢測和減輕暈車的手段(例如,[221][222][223][224])。由于HMD使用時間的增加通常與暈機癥狀的可能性和嚴重性有關,設計者應該只考慮將HMD作為CRACCEN的補充顯示(參見[225])。多篇綜述論文對使用HMD的經驗和暈機的時間過程中的高度個體差異進行了編目[226][227]。

很少有研究探討虛擬世界中的暈船效應與真實的全身運動之間可能存在的相互作用。用戶在海上會經歷持續的全身運動,特別是在波濤洶涌的海面上(見第5.2.3節),這可能會放大VR環境中感知和預期之間的不匹配,從而增加暈車的風險。在移動的車輛或運動平臺上的乘客使用VR HMD時,已經觀察到了這種放大效應(參見[228]),努力將外部運動的同步視覺指標納入其中,可能會緩解[229][230]或進一步加劇[231]癥狀。其他研究沒有發現在模擬船舶運動的條件下使用AR或VR HMD時,與沒有運動相比,暈船癥狀的風險增加。然而,沒有評估沒有HMD的船舶運動的影響,所以不能區分暈船和暈機的影響[232]。作為進一步的復雜性,一些研究表明,VR HMD用戶在經歷船上運動時可能會有意識或下意識地限制他們的頭部運動,以抵消感覺到的或預期的暈船影響[233]。也有一些證據表明,VR HMD帶來的暈機可能會對平衡和姿勢的穩定性產生負面影響[234][235],這可能是在移動的船上發生事故或受傷的一個風險因素。毋庸置疑的是,需要進一步的研究,特別是在有經驗的海軍人員這一獨特的人群中,對網絡沖突和船舶運動的互動進行研究。

盡管AR HMDs似乎不像VR HMDs那樣容易誘發暈船[195][236](參見[237][238],其中沒有發現使用VR或AR HMDs出現暈船的證據),但AR HMD用戶仍然可以經歷由眼球運動引起的暈船癥狀[239]。例如,瞳孔間的距離因人而異,與HMD的設置不一致會使立體適應和會聚受挫,導致一些用戶出現疲勞和頭痛的癥狀[240][241]。一些HMD系統,如HoloLens2,有內置的設置,可以為獨特的用戶調整瞳孔間距離,并可以通過本地存儲的視網膜數據庫識別個人用戶,自動調整瞳孔間距離以達到最佳的立體觀看效果。然而,與手持式AR相比,使用AR HMD引起的暈機發生率更高,一些初步證據表明,癥狀在長期使用后可能會像VR HMD一樣持續存在[239]。需要更多的研究來驗證在海軍艦艇上使用AR HMD的健康和安全問題。

5.2.3 船舶運動對輸入技術的影響

湍流條件,如波濤洶涌的海面上的船舶運動引起的湍流,會對電子設備的輸入準確性產生負面影響[242][243],無論是直接影響還是間接影響(例如,通過增加疲勞或暈船[244],或損害視覺跟蹤[245])。精細運動尤其受到影響,這使得直接輸入(即觸摸、筆觸)比間接方法如鼠標、軌跡球或鍵盤輸入更困難[246][247]。在模擬船舶運動的研究中,觸摸輸入的準確性隨著船舶運動的增加而急劇惡化,特別是對于較小的目標和基于手勢的輸入[248][249]。相比之下,鼠標輸入對模擬船舶運動有相當大的適應性[248]。盡管軌跡球通常被認為是承受船舶運動的最佳輸入設備,但[248]也發現,軌跡球輸入始終比鼠標和觸摸輸入慢,而且準確度低,即使在嚴重的模擬船舶運動下也是如此(也見[250])。

在模擬湍流的飛機條件下,觸摸屏用戶的整體性能、可用性和舒適性都有所下降[251]。隨著顯示器尺寸的減小,這種情況尤其明顯,這表明大型群體顯示器可能不會像手持設備那樣受到運動的不利影響[252]。當用戶可以以某種方式支撐他們的手或手腕時,觸摸性能會得到改善,但這可能會因手指伸得不自然或困難而帶來新的人體工程學問題[253][254] 。目前還不知道擴展現實手勢輸入的準確性在多大程度上會受到飛船運動的類似阻礙,未來的研究必須探索這種可能性。然而,研究表明,當軍人在模擬艦艇運動的條件下佩戴AR或VR HMD時,對使用物理輸入(即計算機化的射擊任務)的準確性有明顯的不利影響[232];兩種類型的HMD之間的影響沒有差別。

次要考慮的是,使用外設進行間接(如鼠標)或直接(如筆式)輸入,會引入船舶運動帶來的額外復雜問題。外圍設備如果沒有固定好,無人看管,就會從其顯示設備上滑落,造成損壞或損失。

5.2.4 船舶振動對顯示和輸入技術的影響

雖然船舶在波濤洶涌的海面上的運動可以被認為是低頻振動,但通常所說的那種全身性的高頻振動也會對船舶人員的運動和認知能力產生影響,因此在顯示和輸入技術的選擇上都必須加以考慮[255]。較高頻率的振動,如發動機或其他船上機械產生的振動,會影響視覺和精細運動技能的穩定性[256],導致感知和輸入準確性方面的錯誤[257]。一項薈萃分析發現,高頻率的全身振動可能比低頻率的振動對表現有更大的不利影響,特別是對于需要高度輸入準確性的任務[258],盡管振動的幅度可能是比其頻率更關鍵的因素[255]。與低頻率的船舶運動一樣,人們期望在大型顯示器上的輸入性能,即提供更大的目標,因此需要更少的精度來操作,會比小型顯示器更少受到高頻振動的影響。比較輸入方法的研究發現,軌跡球輸入的速度和準確性受發動機振動的負面影響比鼠標或觸摸輸入更大,兩者之間并無差異[259]。

HMD可能會加劇振動對視覺的有害影響,因為眼睛和眼前的屏幕都可能經歷振動的抖動。在操作室中經歷的振動量會在多大程度上阻礙HMD的舒適使用,這是一個值得進一步研究的課題,然后才能將擴展現實HMD納入艦載系統。以前在軍事環境中使用的HMD表明,如果仔細注意將HMD正確地安裝在用戶的頭上,就可以改善空中和地面車輛的振動問題[260]。然而,這種反饋涉及到定制設計的美國軍用HMD,可能并不適用于RCN最終采購的系統。

最后,如果振動反饋或警報與CRACCEN的功能有關,那么需要評估用戶通過全身振動的噪音感知這種反饋的能力。這對手持設備來說是一個特別相關的問題,但也可能是軟鍵盤和大型顯示器上的直接觸摸輸入的一個因素,這可能得益于振動式按鍵反饋[96][97]。

5.2.5 顯示和輸入技術的人機工程學

設備的人機工程學特性對于長期或頻繁的技術使用是至關重要的,因為它們會極大地影響用戶的士氣和健康。例如,人們早就知道,長期使用電腦鼠標與肌肉骨骼疾病有關,如腕管綜合癥(例如,[261])。替代的輸入設備已經被開發出來,以減輕人體工程學的壓力,但用戶往往更喜歡傳統的鼠標,而不愿意學習新的輸入方法,這往往需要大量的培訓才能顯示出任何人體工程學或可用性的好處[262][263][264][265]。軌跡球可能比傳統的鼠標輸入設備提供更多的人體工程學支持,只要在放置軌跡球時注意減少極端的手腕姿勢,并考慮到個別用戶的人體工程學[266]。對前臂和手掌的支持可以抵消標準鼠標[267]和鍵盤[268]輸入的人體工程學壓力。標準電腦鼠標和鋼筆輸入(即在水平輸入板上)與桌面設置的比較表明,肌肉負荷沒有差異[269],或者使用鋼筆的肌肉負荷更大[270],這取決于實驗設置的具體情況。相比之下,在傾斜的觸摸屏平板電腦上使用鋼筆輸入,前臂和平板電腦都靠在水平面上,與標準的電腦鼠標輸入相比,引起的腕部負荷更小,用戶的舒適度更高[271]。對于文本輸入,軟鍵盤在短期內由于減少了輸入力而顯示出相對于物理鍵盤的人機工程學優勢,但從長期來看,其缺點是增加了肩部勞損[272] 。

對比平板電腦、筆記本電腦、平板電腦、垂直顯示器和智能手機,發現只有筆記本電腦適合長期使用,而且只有在鼓勵正確坐姿的情況下[273]。其余的設備被證明會對肩部、頸部和手臂造成重大壓力。同一研究顯示,大型垂直顯示器在站立狀態下使用時,特別容易造成疲勞,不建議長期使用(另見[274])。

大型觸摸屏顯示器被證明在垂直而非桌面方向顯示時,會引起更多的肌肉疲勞[275][276],這可能會復合成對肌肉骨骼系統更持久的損害。研究人員建議減少所需的連續交互程度,并通過讓重要的界面靠近用戶來規避在大型顯示器上進行遠距離交互的需要[275][277]。例如,在桌面顯示器上進行舒適的觸摸互動的觸及距離比許多大型顯示器的尺寸還要小[77],所以設計者需要仔細考慮界面的布局。與垂直或水平顯示器相比,傾斜45o的觸摸屏顯示器引起的自我感覺不適更少,自我感覺可用性更高[278]。當參與者可以選擇幾個屏幕角度時,他們傾向于選擇30-45o之間的角度[50][279]。在使用觸摸屏時,用雙手而不是用單手做手勢似乎可以減少主觀上的不適感,尤其是在較長的使用時間內[279]。然而,更復雜的手勢,如捏住旋轉或輕掃,與簡單的點擊手勢相比,有更多的關節活動,這可能構成更高的傷害風險[276][280]。在開發可用的手勢和界面時,需要同時考慮舒適的手指位置和顯示方向的人體工程學限制[281]。

桌面顯示器的高度對其使用的人體工程學舒適度有很大影響,頭部和屏幕之間的垂直距離越大,不適感就越強,可用性就越低[278];因此,站著的時候喜歡抬高屏幕,坐著的時候喜歡降低屏幕。使用時間對于桌面顯示器來說是一個特別相關的因素,因為桌面使用所需的頭部向下的角度會對頸部和脊椎周圍的肌肉造成很大的壓力[273][282]。此外,相對于在筆記本電腦上執行的類似任務,在桌面顯示器上長時間的閱讀任務會增加感知的視覺疲勞和所需的頭部運動,從而增加頸部疲勞[282]。輸入方法同樣在桌面使用的人體工程學方面起著作用,對于長期使用來說,鼠標輸入通常比直接輸入(如觸摸或筆式)更受歡迎[80],但對于短期使用則不一定[86]。與鼠標輸入相比,軌跡球輸入可能會減少手部的不適感,但其代價是增加手臂、頸部和肩部的不適感[73]。使用手寫筆的手寫識別可能會減輕圍繞鍵盤使用的一些人體工程學問題[283],但對于CRACCEN使用中預計涉及的相對較少的文本輸入,人體工程學的優勢可能對整體用戶體驗沒有什么影響。

值得注意的是,桌面顯示器的一些人體工程學復雜問題可以通過將二維圖像增強為三維來緩解。虛擬三維信息可以在眼睛的高度呈現給HMD用戶,而不是要求他們低頭看桌面顯示器。與垂直顯示相比,用3D AR HMD和精心設計的手勢輸入對桌面顯示進行增強,有助于使用戶的手保持在肩部和腰部之間相對舒適的位置,從而最大限度地減少疲勞[284][285]。然而,半空中的互動可能容易導致手臂疲勞[160][286](參見[287],該研究顯示,與標準鼠標相比,用戶用半空中的手勢玩2D游戲時沒有額外的疲勞感)。其他研究發現,在虛擬世界中通過VR HMD進行的手勢比在現實世界中進行的相同手勢導致了更高的自我報告的疲勞程度[288]。輸入放大的方法可以減少半空中輸入帶來的肌肉疲勞[289]。

VR和AR HMD也會給頭部和頸部肌肉帶來額外的壓力[290][291][292][294],并引起不適和疲勞[294][295][296],盡管用戶報告的不適程度似乎主要取決于HMD的整體重量和重量分布[293][297][298]。一般來說,不建議長時間使用。最近由DRDC承包的一項審查表明,像微軟Hololens2這樣的AR HMD在UWW中使用一般是安全的,盡管人體工程學的考慮表明使用的時間是有限的[297]。

相比之下,3D AR互動在通過手持設備而不是通過HMD進行時,身體會更加疲憊[151]。研究發現,長時間使用手持設備后,頸部、背部和手臂都會有明顯的勞損[61][273][299]。坐著時將手持設備放在腿上,頸部和背部的不適尤其明顯[300],而用一只手高舉設備,另一只手進行觸摸操作,會對支持的手腕造成很大的壓力[301]。手持設備在人體工程學上的缺點可以通過整合對接架來緩解,對接架可以支持設備并允許在相對于用戶的舒適高度和角度進行雙手觸摸輸入[302],但手持AR設備通常需要高舉并移動以查看3D場景。

6 建議

第2節中概述的CRACCEN的需求分析確定,鑒于UWW環境的三維性質,至少需要一個中央二維群組顯示器,以及可視化和與三維信息互動的能力。還討論了結合多個顯示器的可能性,以適應UWW任務工作中個人和團體之間的靈活轉換。第4節和第5節對文獻進行了廣泛和跨學科的審查,以確定哪些顯示和輸入技術最適合促進UWW環境中的團隊工作。

附件A中列出了一份總結審查結果的表格,這有利于在不同技術之間進行直接比較。總結表中提供了指導每項技術評估的參考文獻的完整清單,為了簡潔起見,下面的書面建議中沒有轉載。下面依次討論從審查中得出的建議。

1.一個大型的桌面二維顯示器應作為中心組的顯示器。

2.應選擇安裝硬件,使中央顯示器能夠根據需要在水平和垂直方向上靈活轉換;以及

3.可選的額外設備可以與中央顯示器聯網,以改善戰斗空間的三維可視化(即AR HMD),并更好地支持個人工作,隨后可以在中央顯示器上進行組合和共享(即手持設備或桌面工作站)。

6.1 大型中央桌面二維顯示器

圍著桌子工作是人們熟悉的小組討論、商議、信息共享和決策的配置,而多點觸摸屏幕的直觀性使所有用戶很容易做出貢獻,無論是同時還是輪流。這種布局提高了協作任務中的溝通和互動質量,從任何邊緣與顯示屏互動的能力大大增加了同時使用的能力。該技術與熟悉的、經常使用的技術(如臺式電腦和智能手機)有相似之處,這將使用戶能夠利用現有的知識框架,從而減少學習時間。閱讀地圖的知識框架經常發生在水平面上,也可以利用空間導航規劃和SA。

直接觸摸是二維桌面顯示器的理想輸入方法。當需要進行小組工作時尤其如此,因為它允許用戶輕松地跟隨他們的合作者的行動。用鋼筆觸控器可以提高精確度,而且還可以用手寫識別作為文本輸入方法,不過考慮到船舶運動和移動的外圍設備可能會超過觸控器的任何附加價值。軟鍵盤可以根據需要供UWW團隊使用。

在設計階段必須特別考慮到使用的人機工程學,確保重要的顯示菜單容易獲得和/或可以靈活地在屏幕上移動以方便使用。桌面上的二維顯示器如果相對于用戶的位置太低,有可能對頸部和脊柱造成壓力,而大型顯示器上的觸摸式互動在長時間使用后會造成肌肉疲勞。

6.2 靈活的顯示角度

由于需要支持混合焦點任務,靈活性將大大有利于CRACCEN的可用性。只需花很少的額外費用購買專門的安裝硬件,以協作為重點的桌面顯示器就可以根據需要轉換成以演示為重點的垂直顯示器。垂直方向將支持更多的演講式交流;將促進簡報;并可作為背景顯示器,在不積極用于協作任務規劃或執行任務時,保持任務、平臺和任務狀態的SA。

在設計階段必須特別考慮靈活的界面,因為屏幕的方向將極大地影響到要顯示的信息類型和交互空間的組織。例如,到達左上角的菜單對于在桌面顯示器上邊緣的用戶來說可能是件小事,但對于位于垂直顯示器前的用戶來說卻是件非常費力的事。靈活的系統應該能夠自動識別顯示器的方向并相應地調整輸出和界面。雖然現有的研究提供了一些一般的指導原則(如[38][39]),但未來探索不同顯示方向的具體海軍用例的研究應該指導CRACCEN的界面設計。

6.3 用于個人工作的可選AR HMD和設備

由于UWW的環境是3D的,SA和任務規劃可能會從其3D表現中獲益匪淺。盡管VR和AR HMD都支持與虛擬三維物體的沉浸式互動,但透明的AR HMD為交流和小組工作提供了更好的支持,也降低了暈機的可能性。AR HMD可以作為3D可視化和互動的可選輔助工具提供給CRACCEN用戶,研究表明,即使在一些合作者佩戴HMD而其他合作者不佩戴的情況下,有效的合作和交流也可以保持在較高水平。

AR HMD的用例已經在各種軍事環境中進行了探索,包括城市環境中的導航和SA[303][304]、軍隊的地面和車輛作戰場景[260]、空軍飛行員的平視顯示器[260],以及高風險場景的模擬訓練[305]。到目前為止,很少有工作評估AR HMD在艦艇環境中的可用性(但見[232][306])。在開發之前,必須進行研究以測試AR HMD在船上環境中的可行性,因為船舶運動和振動的影響可能從一開始就阻礙或排除了可用性。

盡管CRACCEN的重點是小組工作,但UWW小組成員個人仍需要將其個人專長應用于協作任務的規劃和決策任務。平板電腦或臺式電腦系統可以作為個人工作的可選支持,具有聯網功能,在積極的任務規劃任務中向中央小組顯示器傳輸信息。科學文獻目前沒有提供明確的指導方針,說明一種設備(如臺式電腦或平板電腦)比另一種設備更適合于混合焦點任務,因此在最初的研究中應考慮這兩種設備。以前的工作結合了平板電腦、平板電腦、3D增強和AR HMD等技術,用于考古學的多用戶可視化,可以作為一個有用的概念證明:提供多種方法來探索和瀏覽復雜的3D環境,可以幫助可視化和SA,從而支持解釋和決策[307]。

靈活耦合的CRACCEN系統的設計者將需要考慮個人工作的最佳界面,如何在顯示器之間傳輸信息,以及如何將傳輸的信息納入中央小組顯示器的可視化中。還必須仔細考慮系統的靈活性和整合多個設備的額外實際復雜性(如設備間的通信挑戰、軟件更新、帶寬限制)之間的權衡。

6.4 未來的研究

需要進行更多的研究來驗證上述建議在RCN的艦載UWW指揮小組的獨特操作環境中的有效性。下文按優先順序介紹了開發過程中下一步的未來研究建議,盡管幾條研究路線可能同時進行。在所有建議的研究案例中,原型開發和用戶研究是同步進行的,每一項都為另一項提供信息。

6.4.1 靈活顯示器的構思研究

到目前為止,本報告建議使用一個中央二維桌面顯示器,可選擇垂直方向,可選擇AR HMD來顯示三維信息,可選擇桌面或平板設備來進行個人工作。然而,目前還不清楚哪些信息和能力最適合在哪些顯示器上以何種組合方式呈現。一個初步的想法研究可以讓中小企業進行頭腦風暴活動,讓他們想象在不同的顯示器選項上進行各種任務規劃、執行和決策任務。這個研究方向的問題包括:中小企業希望通過每個顯示選項完成哪些任務,他們在尋求特定信息時可能會參考哪些顯示選項,他們在使用某個顯示選項時預見了哪些問題,以及他們可以想象自己在UWW團隊中使用每個顯示選項會有哪些貢獻。

在這個最初的構思活動的基礎上,后續的研究應該評估設計概念和每個顯示器的界面的靜態模型。最初的模型和概念將從現有的用戶體驗專業知識中開發出來,然后提交給用戶測試和完善。在這個階段感興趣的問題包括:所展示的界面布局的可感知的可用性,中小型企業可能會建議做哪些改變來改善特定顯示器的布局,中小型企業可能會建議對信息或功能在顯示器上的分布做哪些改變(例如,驗證最初的構想研究),以及中小型企業如何想象自己與顯示器的互動。很可能需要幾次反復的設計概念開發和用戶測試,而且這些初步研究的結論有可能與本初步報告中提供的建議相反。例如,可能會出現這樣的情況:WWW團隊現有的臺式工作站可能被證明足以滿足CRACCEN個別工作方面的能力要求,在這種情況下,不需要進一步開發個別臺式或平板電腦界面。這樣一來,這些研究的結果將為下面的額外研究建議提供信息和約束方向。

研究人員還可以考慮采用VR技術,在模擬的艦船環境中與中小企業一起測試設計概念。這將使中小企業在開發的早期階段,在真實工作環境的虛擬模擬中,而不是在不太現實的實驗室環境中,體驗和評估CRACCEN的外觀和感覺[308][309]。

6.4.2 測試中央顯示屏的原型

本報告的結論所建議的下一步是為CRACCEN桌面開發一個低保真度的初始原型,重點是一個可用的二維界面,有一個模擬場景,UWW團隊可以作為一個小組進行工作。然后,研究人員可以使用這個原型,與中小企業和中小企業團隊一起測試系統的可用性[310]。

原型設計和開發的早期迭代可以集中在高層次的目標上,早期的測試同樣可以涉及相對簡單的反饋方法,例如特征捕捉網格,它將反饋組織成喜歡、批評、問題和想法,以便完善后來的設計迭代[6]。

后續的原型迭代應該包括越來越詳細的目標和具體的能力。這些后期迭代的用戶測試可以包括對任務表現、可用性(例如,桌面協作可用性評估[311])、系統使用的口頭走過(例如,[312])、場景后訪談、工作量和認知負荷的測量(例如,NASA-TLX[313]),以及團隊溝通和凝聚力的測量。眼球追蹤測量可以被納入,以幫助改善界面設計[314]。根據[315]的建議,在對原型熟悉一段時間后,應該對任務技術匹配度(TTF)進行正式評估,以驗證其與任務的匹配度。

6.4.3 測試AR HMD和個人工作原型

必須在海上測試AR HMD在艦船環境中的可行性。只要這些測試證明AR HMD可以在其所處的環境中安全使用,原型的開發和測試就應該按照對中央顯示器建議的方式進行:從高層次的目標和簡單的反饋到具有全套措施的具體能力測試。開發應考慮設計啟發式,以最大限度地減少人體工程學的壓力和最大限度地提高可用性[319]。最初的評估可能會孤立地檢查AR HMD,但以后的研究必須也包括桌面顯示器的原型。中小企業可以單獨承擔任務,為CRACCEN使用AR HMD提供初步的高水平評估和投入。

對于協作任務來說,混合現實系統的虛擬性和沉浸感水平應該只根據任務需求來增加,以使用戶保持對物理空間和合作者的認識[17]。AR HMD的測試和開發周期不僅需要檢查可用性和TTF,還需要比較納入HMD和3D信息所增加的價值[320],相對于任務表現、認知負荷、團隊合作或溝通質量的任何變化。

如果上述構思研究的結果驗證了平板電腦或臺式電腦對個人工作的有用性,那么對這個原型的測試也同樣應該從高層次的目標和簡單的反饋開始,到用一整套措施對具體能力進行測試。最初的評估可以孤立地檢查個人工作原型,但以后的研究必須把桌面顯示器的原型也納入其中。因為這些設備是為個人工作準備的,所以最初的評估可以與單個的中小企業一起進行。

個人工作原型的測試和發展需要檢查可用性,TTF,以及比較納入這些額外的設備所增加的價值,相對于任何任務執行質量的變化,認知負荷,團隊合作,或溝通。

7 結論

CRACCEN系統預計將徹底改變在RCN內進行UWW的方式,不僅有可能重塑UWW任務的技術使用方式,而且有可能重塑指揮小組成員之間的相關任務分配和完成方式。為了適應這種重新設想的任務和人員空間,系統應該是什么樣子是一個關鍵問題,因為在早期高水平設計階段做出的決定可能會限制和確定未來RCN的UWW的性質。本報告試圖通過審查這些技術與一些高層次的任務要求和約束條件的關系,來確定最適合艦載UWW團隊使用的顯示和輸入技術。

第2.3節提出的初步需求分析表明,至少需要一個中央二維顯示屏幕,能夠顯示并與三維信息互動,并有可能結合多個顯示器進行靈活的混合焦點工作。本報告審查了多種顯示技術、輸入方法和三維增強的方法,考慮了各種技術對團隊工作和UWW任務環境的限制的適用性。

根據綜合文獻審查的結果,作者建議采用二維桌面顯示器作為CRACCEN的中央顯示屏,具有靈活的顯示方向,可選擇AR HMD來增強UWW環境的三維可視化,可選擇桌面或手持顯示器進行個人工作,隨后可以在中央團隊顯示器上共享規劃和討論。然而,UWW指揮小組及其作戰環境的特點可能會影響這些技術和技術組合的實用性和可用性。與中小企業的進一步研究必須驗證這些技術,并在原型開發過程中測試界面設計的實用性。

付費5元查看完整內容

本報告描述了2021財年美國陸軍作戰能力發展司令部(DEVCOM)陸軍研究實驗室(ARL)未來風險項目 "決策動力學、欺騙和博弈論"的研究工作。為了提高指揮和控制多域作戰的決策輔助工具的有效性,有必要開發能夠協助復雜決策的人工智能(AI)工具。該項目開發了一個人工智能測試平臺--ARL戰斗空間(ARL Battlespace),用于創建和研究復雜推理的人工智能決策輔助工具。ARL Battlespace是一個由友好和敵對的人類和人工智能Agent組成的多人網絡兵棋推演工具。分層貝葉斯模型的初步結果說明,在具有不確定性、欺騙和博弈論的情況下,具有復雜推理功能的人工智能多學科發展框架具有潛力。該項目還開始開發一個基于與戰場可視化和交互平臺以及高性能計算持久服務框架的潛在集成的人機協作決策框架。這些成果為改善人-人工智能團隊的復雜決策和協作能力開啟了研究的大門

1. 簡介

作為美國防部人工智能(AI)戰略的一部分,美國陸軍作戰能力發展司令部(DEVCOM)陸軍研究實驗室(ARL)正在開發基于人類系統適應戰略的研究項目和技術,包括開發基于人-AI團隊決策和相互適應的超人能力的目標。這些新能力對于解決陸軍的多域作戰(MDO)戰略是必要的,特別是其滲透和分解階段,在此期間,人工智能輔助決策可以增強指揮官處理高速和大量信息以及地面、海上、空中、太空和網絡領域的復雜動態的能力。一個關鍵的挑戰是,現有的人工智能算法,對于復雜的決策來說是遠遠不夠的,而且對MDO相關場景的概括能力有限。另一個挑戰是,現有的陸軍理論和決策支持程序沒有將人工智能納入軍事決策過程(MDMP),而陸軍的自動規劃框架(APF)剛剛開始解決這一差距。此外,現有的人-人工智能編隊決策理論和技術僅限于簡單的決策,為復雜的深度決策在提供人工智能透明度方面非常有限,在這種情況下,多種依賴性、不確定性以及信息領域和行為者與復雜的人類、物資和環境動態相交。它們與人類專家的隱性推理協同工作的能力也很有限。發展這些能力需要一個綜合的、多學科的研究方法,包括為新的人工智能研究和人類與人工智能的編隊協作開發人工智能試驗基地。

對于兵棋推演,有必要開發能夠模擬包括戰術和戰略層面在內的多個梯隊的決策測試平臺。現有的兵棋推演決策工具,如Opsim、AFSIM和OneSAF,可以在多個規模上對許多因素進行建模和模擬,以預測基于戰略、物資能力和資源的結果,但它們受到老化系統的限制,有經驗的士兵可能難以學習,也不太適合開發人工智能和人類+人工智能編隊協作的能力。最近,人工智能能力的快速上升為開發和納入新型人工智能作為兵棋推演的決策輔助工具打開了研究的大門。最近人工智能推理的改進(例如,基于深度強化學習)是基于環境狀態完全已知的“開放”游戲(例如,跳棋、國際象棋和圍棋),它們是基于有限的合作性或欺騙性。即使在有額外復雜性的情況下,如環境的不確定性(憤怒的小鳥、雅達利),決策的復雜性、靈活性和對多人兵棋推演的可轉移性也是有限的(如撲克、Minecraft、星際爭霸[圖1])。盡管這些模型可以深入探索決策,但它們只限于選擇結果的潛在價值可以很容易測量和量化的條件。兵棋推演環境給人工智能學習帶來了困難和未解決的挑戰,因為有許多信息不確定性的來源,不僅來自環境,也來自人類和人工智能Agent。人工智能需要適應不斷變化的規則和戰略,迅速減輕出乎意料的敵方能力,并利用新的機會和友好的能力。人工智能還需要與他們的人類隊友相互適應,他們需要有默契的推理能力來與人類專家協同工作,并補償個人的偏見和啟發式方法以及變化的認知狀態。與博弈論等經典方法不同的是,未來狀態的預期效用可以根據合作或不合作的選擇對有限的行動集進行明確的量化,兵棋推演提出了跨環境和社會動態(包括合作性和欺騙性)以及跨多個時空尺度和領域的相互作用的可能性,這使人工智能學習決策如何與未來狀態價值相聯系的能力受到影響。

圖1 ARL在更廣泛的人工智能研究戰略中的Battlespace平臺

解決這一差距需要持續的基礎研究工作,實驗的重點是為決策中的具體問題發現原則和開發新的算法,并有能力將這些原則和算法與MDO的兵棋推演聯系起來。例如,在具有不完善的知識和不確定性的復雜情況下,提供接近最佳解決方案的人工智能可能比提供單一的"最佳"解決方案更有幫助。這種解決問題的方式與人工智能的透明度也需要探討。對近乎最優和不確定性等條件進行實驗,并采用新的作戰人員機器界面(WMIs),可以產生新的算法、通用工具和原則,更好地協同人類和人工智能對復雜決策的探索。

1.1 軍隊的相關性和問題領域

陸軍戰略科技(S&T)計劃的一部分是為 "超人類"的決策和行動開發能力。對于科技計劃中的"人-系統適應"部分,預期的結果是將人類特有的能力和機器的新興能力結合起來,最大限度地提高速度和選擇,以有效應對2035年及以后的社會技術環境的復雜性、智能化和動態性。預計這些研究工作將為人類引導的機器適應、訓練精通技術的士兵、混合人機思維、以及下一代人類系統集成和系統級分析創造新的能力。由于戰爭正在快速變化,包括不斷的技術變化,實現這樣的能力需要制定一個研究計劃,以推進人工智能、人類與人工智能的合作,專門用于復雜的決策。

作為DEVCOM陸軍研究實驗室未來風險投資(DFV)計劃的一部分,這個項目的目標是開發一個跨學科的計劃,以解決人工智能決策的復雜性和人類-人工智能團隊決策中的差距。這包括開發一個人工智能研究測試平臺--ARL戰斗空間,將復雜的兵棋推演決策抽象為關鍵要素,以便人工智能和人類-人工智能團隊的發展可以專門關注復雜的決策過程本身,同時避免物理現實主義和當今材料和理論的計算和概念限制。這也包括為如何發展人類-人工智能協作決策創造新的概念,了解如何塑造信息流以實現人類-人工智能決策的相互透明,以及在人類和人工智能都難以篩選出不確定性和欺騙的條件下實現相互適應性學習。顯性和隱性的決策框架都需要通過這個抽象的兵棋推演測試平臺來實現,以便人工智能可以在多個推理層次上學習和接受挑戰。還需要一個適當的抽象水平,以使多種類型的研究,包括神經科學、人工智能和決策理論交叉的學術研究,以提高人工智能決策的能力和復雜性,并改善其在軍事方面的轉化。

1.2 長期目標

根據設想,在2035年及以后的陸軍中,指揮與控制(C2)決策將由決策輔助系統來激活,該系統利用分布在多個梯隊的人工智能能力,并以復雜和快速的方式攝取所有領域的數據,這將使沒有輔助的士兵感到不知所措。啟用人工智能的決策輔助工具將能夠對戰斗空間進行前沿模擬和分布式訓練;在MDO的滲透和解除整合階段,能夠對條件、友軍和敵軍戰略以及能力變化的可能影響進行調整和前瞻預測;并能夠對關鍵決策進行事后審查。人工智能將為其決策提供透明度,使真實和抽象的決策空間互動可視化,并根據陸軍理論和未來理論的要求,對士兵的個體化和情境進行優化。相反,人工智能將與士兵共同適應,學習如何在信息不足、沖突或欺騙的情況下做出復雜的決定,并為有效的團隊決策重新塑造、完善和展示信息。有了人工智能Agent作為數據有效轉化和行動化以及利用顯性和隱性知識的合作伙伴,預計分布式C2指揮官將能夠在MDO的許多時空尺度和維度上共同制定和協調行動方案,并且戰術和戰略的跨領域互動將被向前模擬,對環境、人和戰略的動態有更強的彈性。除了增加復雜決策的能力外,預計決策過程本身將通過消除繁瑣的計算和其他延遲而加速,從而使計劃和戰略能夠比實時更快適應不斷變化的戰場和外部(如外交、經濟)因素。

為了實現這一未來,為復雜決策開發新型人工智能的計劃的長期目標是利用多個學科的持續進步。用于推理的"核心人工智能"的發展,在為簡單決策迅速取得進展的同時,需要持續的協同創新,以及來自神經科學和心理學等領域的研究,以便在獎勵難以分配給具體事件或行動的條件下(例如,因為不清楚以何種程度的確定性將獎勵的原因歸于誰、什么、何時、何地或為何),為強化學習開發新型理論。需要機械層面的理論(例如,神經膠質網絡如何支持將不同的事件與獎勵聯系起來)和更高層次的理論(例如,社會規則如何塑造學習)來彌補目前核心人工智能的有限能力和C2決策的需求之間的差距。還需要協同創新和研究,將人工智能的發展與士兵的隱性推理過程相結合,以實現元學習和元推理的決策互動。

1.3 DFV項目的目標

ARL DFV項目是一種機制,旨在促進跨學科基礎和應用研究的新方向,解決研究差距,并為軍隊的任務創造新的能力。DEVCOM ARL研究員認為分析科學是一個需要能力的領域,具有高回報的潛力,需要對現有項目進行重新規劃和擴展,并需要新的項目來建立新的核心能力和建立內部的專業知識。

為了創造這些能力,這個DFV項目的主要目標是建立一個新的研究項目,為C2決策輔助工具的復雜推理開發新型人工智能。這包括開發一個人工智能測試平臺:ARL Battlespace,以便靈活地開發專門用于MDO C2決策的復雜推理的新型人工智能。現有的兵棋推演人工智能測試平臺往往局限于較簡單的決策,更注重于戰術性的地面行動。例如,正在進行的人工智能測試平臺開發工作,如ARL Simple Yeho人工智能測試平臺,側重于環境的真實性,有多個地圖層,包括道路、樹葉和海拔高度,向排長推薦決策,如路線規劃和士兵重新分配任務。由于對當地地形環境的關注,在該環境中開發的人工智能推理將集中在精細的社會和生態動態上,對協作和敵對決策動態進行深入訓練的機會比較稀少。這些稀少和復雜的問題("微小的、骯臟的、動態的和欺騙性的數據")迷惑了發展人工智能的經典方法,尤其是復雜推理。相反,這個DFV項目的ARL戰斗空間人工智能測試平臺抽象了當地地形的元素,將人工智能的學習和推理更具體地集中在復雜的MDO相關的C2深度推理上(多個決策步驟,包括更頻繁的合作和欺騙的機會)。這使得在C2兵棋推演的背景下,更有針對性地發展人工智能對復雜的多Agent(人、人工智能和人+人工智能團隊)的決策能力。

第二個目標是通過開發一個有效的WMI來研究和開發如何呈現人工智能的理解和預測以及如何利用人類的理解和預測,為復雜決策的有效人類-人工智能團隊合作創造條件。這項工作包括利用和開發高性能計算(HPC)資源進行計算支持,同時開發用于決策的商業二維交互和混合現實交互的定制軟件(例如,基于增強現實沙盤[ARES]平臺的戰斗空間可視化和互動(BVI)平臺)。通過開發多種WMI方法,我們期望這些平臺能夠實現復雜決策的快速原型研究,并能夠將我們的新型AI與更成熟的兵棋推演訓練和模擬框架與團隊進行整合。

我們預計,在新型人工智能開發、HPC計算支持和用于決策空間現實表現的WMI開發方面的這些努力將為人類-人工智能團隊的發展創造一個新的范例,為未來多個陸軍理論(MDMP、DOTMLPF、27 METT-TC28)的進步和現代化鋪平道路(圖2)。

圖2 在更廣泛的人類-Agent團隊決策研究戰略中的新型人工智能開發

這個項目開發了兩個研究框架 。首先,它開發了一個人工智能測試平臺,被稱為ARL戰斗空間,用于創建和調查人工智能的復雜協作和敵對決策。其次,它認識到目前軍事決策過程中的局限性,構思了一個用于人與人工智能協作的復雜決策的WMI,利用軍隊和商業開發的戰斗空間可視化平臺,與非傳統的HPC資源進行潛在的連接,實現人工智能增強的兵棋推演平臺。

2. ARL戰斗空間人工智能測試平臺

這里,我們描述了我們開發ARL Battlespace的方法,這是一個開源的靈活的兵棋推演平臺,將促進開發基于強化學習算法的新決策輔助工具。特別是,我們關注的是有三個或更多合作和敵對玩家的博弈論的理論和算法能力的差距。雖然博弈論的概念,如囚徒困境和Brinksmanship("吃雞"),對于兩個玩家已經發展得很好,但它們還沒有擴展到三個或更多的玩家,由于鞍點和局部最小值的存在,決策環境可能很復雜,這可能混淆了強化學習的作用。在戰爭中可能出現的情況下,理解和預測三個或更多的合作和敵對玩家的納什均衡,需要一個靈活的兵棋推演平臺,允許跨學科地探索這種決策空間。該兵棋推演平臺還需要能夠開發、理解和發現玩家和人工智能之間的新型互動和協同作用,使人類能夠利用人工智能快速找到最佳和接近最佳的解決方案。這些解決方案將使人工智能能夠從人類的決策模式中學習,以及如何優化其對決策空間的搜索。

2.1 框架

為了實現這些解決方案,我們開發了一個類似于國際象棋的棋盤游戲,由兩支隊伍組成,一支紅色部隊和一支藍色部隊,每支隊伍可以有多個聯盟(玩家)。游戲是在一個共同的戰斗空間上進行的,這個戰斗空間目前被設計為MDO每個領域的一套棋盤。圖3顯示了一組游戲棋盤的例子,我們考慮了一個"空中"和一個"陸地"棋盤。每個棋盤都被劃分為一組單元格,"空中"棋盤被放在"陸地"棋盤上,形成一個共同的戰斗空間。在這個例子中,我們選擇了創建方形網格,并且只考慮兩個領域。然而,在一般情況下,棋盤格可以采取任何形狀,并且可以任意縮小,而棋盤的數量可以靈活處理MDO中的每一個域。例如,"空中"盤可以由多個代表不同海拔高度的板組成。這種提法提供了一個通用的應用編程接口(API),允許在兵棋推演中取得基本的研究進展,因為它可以被定制以適應任何兵棋推演的場景。

圖3 用于復雜決策的ARL戰斗空間AI測試平臺

每個聯盟都被假定有一組部件,我們稱之為單位。目前,我們假設有四個地面單位和一個空中單位。地面單位由士兵、坦克、卡車和旗幟組成,而空中單位是飛機。每個地面單位目前都有相同的能力(即,相同的行動和視圖集)。然而,API的設計是為了使聯盟的每個單位都有定制的能力,從而使設計特定場景變得容易。

目前各單位的規則和行動如下。士兵、坦克和卡車都有一個目標,描述他們的導向。他們的行動包括 "什么都不做(doNothing)"、"轉向(turnH)"、"前進1(advance1)"、"射擊(shoot)"和"沖撞(ram)"。"doNothing"意味著該單位停留在他們的位置,不改變他們的狀態。"turnH"將單位的方向旋轉H度,其中H∈{-135,-90,- 45,45,90,135,180}。"advance1 "使其方向上向前移動一個單元。"shoot"向單位的方向射出一個彈丸,彈丸繼續向前推進一個單元,直到它與另一個單位相撞或在游戲盤外飛行。最后,"ram"行動使單位在其方向上向前推進一格,同時進行攻擊。與 "advance1"行動相比,"ram"行動總是有利的,因為攻擊可以消滅敵方單位。

飛機單位的規則和行動與士兵、坦克和卡車相似。這些行動是"什么都不做(doNothing)"、"轉向(turnH)"、"前進X、Y(advanceX,Y)"、"射擊(shoot)"和 "轟炸(ram)"。“doNothing”、“turnH”和“shoot”的動作與地面單位相同。行動“advanceX,Y”允許該單位沿東西軸線移動X單元,沿南北軸線移動Y單元。飛機也可以 "上升(ascend)"和 "下降(descend)"來起飛和降落。最后,"炸彈(bomb)"行動在飛機的正下方射出一個彈丸到陸地游戲盤上。旗幟單位無法移動,如果被俘,則被清除。

目前游戲玩法的實施很簡單。最初,每個聯盟(玩家)將其單位放在游戲盤的各自區域。當每隊有多個聯盟時,各隊的游戲板部分被平均分配給各聯盟。請注意,每個單位的位置對所有其他聯盟都是未知的。然后,每個單位觀察其可見范圍內是否有其他單位,提供一個戰爭迷霧的場景。我們將每個單位的觀察范圍定義為從該單位的當前位置開始的一個方塊;然而,可視范圍可以根據場景和單位的情況進行定制。一旦每個單位觀察到了,同一團隊的聯盟就會合作確定他們想為每個單位采取的行動集。這允許每個聯盟觀察其隊友的單位位置,并進行溝通以協調他們的計劃。接下來,每個聯盟為每個單位選擇一個行動。請注意,所選擇的行動只有屬于同一團隊的聯盟才知道。在選擇了行動后,游戲決議被應用,根據他們選擇的行動移動單位,并解決是否有任何單位被攻擊或與另一個單位相撞。如果一個單位被攻擊或與另一個單位相撞,它將被從棋盤上移走。這個過程不斷重復,直到游戲結束。

完成游戲取決于游戲的基本規則,這些規則可以根據具體場景進行定制。在這里,我們研究了兩種類型的游戲:(1)奪旗和(2)殲滅。奪旗游戲的目標是操縱地面部隊進入敵方領土以奪取對方的旗幟,旗幟的位置是未知的,必須通過探索才能發現。一旦所有的敵方旗幟被占領,游戲就會終止。殲滅戰的目標是發現并攻擊所有敵人的地面單位。在這里,一旦發現并消滅了所有敵人的地面單位,游戲就終止了。每種游戲的基本規則都是相同的,但實現每個目標的最佳策略是不同的。在這兩種類型的游戲中,由于敵方單位和旗幟的能見度有限,存在著高度的不確定性。

2.2 分層貝葉斯模型的試點實驗

接下來,我們報告了我們在開發基于模仿學習思想的人工智能Agent方面的初步結果,模仿學習使用的是由人類演示構建的分層貝葉斯模型。我們從討論數據收集過程開始,對數據進行分析,最后用啟發式方法使一個簡單的人工智能Agent勝過一個隨機Agent。

2.2.1 實驗設計

為了學習人類的策略,我們讓五個人類受試者組合在一起,針對第2.1節中討論的兩類游戲(即奪旗和殲滅),與兩個隨機Agent進行ARL戰斗空間游戲。在每個回合中,每個隨機Agent根據一個固定的分類分布為每個單位??選擇一個行動,其中采取一個行動的概率 取決于單位??可以采取的行動數。回顧一下,每個單位的行動在第2.1節中有描述。

每個游戲由一對人類受試者對兩個隨機Agent組成,在每個游戲開始時,人類受試者合作討論他們對該游戲類型的整體策略。這導致了20場游戲的收集,其中奪旗和殲滅戰各10場。一旦所有的游戲都進行了,就對游戲數據進行分析以確定人類的策略。

2.2.2 游戲數據結果和分析

分析游戲數據的第一個方法是研究人類玩家的行動頻率。行動頻率被定義為 ,其中D代表奪旗或殲滅的游戲數據。 是指在所有游戲中,單位??采取的行動次數,而??(??)是所有游戲中的總回合數。

圖4顯示了地面單位(即士兵、坦克和卡車)的行動頻率,圖5顯示了空中單位(即飛機)的行動概率。游戲的總體目標決定了所選擇的行動,使我們能夠確定所玩游戲的類型。如圖4所示,奪旗游戲的地面單位更有可能選擇前進和攻擊的方式,用 "沖撞"的動作來尋找旗子。此外,"什么也不做"的行動也被更頻繁地選擇。這是因為一旦團隊找到旗子,離旗子最近的單位就會采取行動去搶奪旗子,而其余單位則什么都不做。對于空中單位,人類受試者更傾向于選擇 "advance0,-2 "的行動,即把單位推進到敵人的領土上尋找國旗。

圖4 從人類游戲中產生的所有地面單位,以游戲類型為條件的行動概率

圖5 從人類游戲中產生的空中單位,以游戲類型為條件的行動概率

在 "殲滅"游戲中,人類Agent更傾向于選擇攻擊行動來消滅敵人的目標(即對地面單位采取 "射擊",對空中單位采取 "射擊"和 "轟炸")。為了進一步驗證這一策略,圖6顯示了每回合平均射彈數量的累積總和。顯然,"殲滅"游戲的射彈數量比"奪旗"游戲要多。

圖6 每一回合中射彈總數的平均累積總和

兩種游戲的另一個區別是,奪旗游戲的總回合數要比殲滅游戲少得多。這是因為人類Agent找到旗子的速度比他們找到敵方單位并消滅它們的速度要快。

基于對人類Agent如何與隨機Agent玩游戲的簡單理解,我們可以按照類似的方法來學習策略,為簡單的人工智能Agent開發啟發式方法。

2.2.3 從人類演示中學習的簡單人工智能Agent的性能

一個簡單的人工智能Agent的算法如下。最初,Agent隨機地將他們的單位放置在棋盤的指定區域。然后,每個Agent確定每個單位的狀態。考慮到狀態和游戲的目標,Agent從預定的概率分布中為每個單位抽取一個行動。

這個過程在每個回合中都會重復,直到游戲結束。預定的概率分布遵循一個分層貝葉斯模型。為了便于表述,我們在附錄中提供了相關理論。對于最簡單的情況,我們認為單位在每個回合中可能處于兩種狀態,。然后,概率分布根據附錄中的公式A-1定義,與圖4和圖5中的行動頻率類似。然后我們將這個分布實現在兩個簡單的人工智能Agent中,并與兩個隨機Agent進行比賽。作為一個基線性能,我們與兩個隨機Agent進行了比較。在這兩種情況下,都進行了1000場比賽,并計算了獲勝百分比。通過使用雙狀態概率分布,簡單的人工智能Agent能夠在奪旗游戲中贏得84.5%的時間,在殲滅游戲中贏得76.9%的時間。

接下來,我們為每個單位i考慮了一個更大的九態狀態空間,定義為,其中??r0和??r1分別表示一個友好單位是否被i單位觀察。??0和??1分別表示i單位是否觀察到敵方單位;以及??l0和??l1分別為團隊是否看到敵方旗幟。同樣,概率分布然后根據附錄中的公式A-1定義,并落實到兩個簡單的人工智能Agent。在奪旗游戲中,簡單人工智能Agent對兩個隨機Agent的獲勝比例為89.4%,在殲滅游戲中為82.3%。

結果摘要見圖7。有趣的是,在兩種形式的概率分布(即雙狀態分布和九狀態分布)中,奪旗策略都優于殲滅策略。這是因為 "消滅 "游戲中的Agent更有可能選擇 "射擊 "行動,由于隨機的初始位置,這將導致更多的友好射擊。因此,作為一個簡單的人工智能Agent,采取先攻后守的方法更有利。此外,當我們考慮到單位的額外狀態時,獲勝的百分比會增加。未來工作的一個可能方向是開發深度強化學習策略,以學習最大化獲勝比例所需的狀態定義和數量,即使是面對人類Agent,也要為MDO中的C2提供建議。

圖7 簡單AI Agent的獲勝比例

3. 復雜決策的實例場景

ARL戰斗空間測試平臺的關鍵優勢在于其靈活性和適應MDO任務規劃的變化需求。它的抽象性使關鍵的決策過程及其互動和動態被壓縮到一個較小的游戲盤中,并有更多可量化的人與人工智能的互動,用于開發人與人工智能的團隊合作。這使得人工智能的開發能夠集中于復雜決策的獎勵塑造,同時減少由于滋擾因素(如時空縮放)造成的學習障礙,這些因素使決策在時間和空間上變得稀疏,因此,更多的努力(人工智能以及人工智能開發者的部分)可以被用于在各種時空尺度的不確定性和欺騙下的學習。它還將兵棋推演互動中可能不容易被整合到人與人工智能團隊中的特質(例如,人類心理學的某些方面,如個人關系)放在一邊,以利于在人工智能推理發展方面取得更切實的進展。在下面一節中,我們介紹了幾個挑戰和發展人工智能進行復雜推理的例子。這些例子包括博弈論、元推理和網絡欺騙,涉及到現有人工智能算法尚未處理或解決的各種復雜決策。由于人工智能的C2決策輔助工具將有望超過人類水平的決策,不僅在速度上,而且在復雜性上,我們設想這樣的C2決策輔助工具需要能夠解決大多數(如果不是所有)的情景。

3.1 突破情景和重新想象博弈論

我們首先關注博弈論和兵棋推演之間的差距,在一個簡單的突破場景中,這是兵棋推演中經常遇到的一個經典問題(例如,在橋梁交叉口、地雷區和山口[圖8])。在經典的博弈論概念Brinksmanship("吃雞")中,友好的藍色和綠色坦克被激勵著越過缺口到達另一邊。通常情況下,這些坦克會協調他們的行動,但如果藍、綠坦克之間的通信被破壞,一個單位(如藍坦克)的行動可能會因為與另一個單位(綠坦克)的碰撞或友好射擊而導致低回報。如果還包括囚徒困境的元素,那么這個場景就迅速超越了經典的博弈論,因為可能需要綠色和藍色坦克一起穿越,共同攻擊更強大的紅色坦克,這需要仔細協調。額外單位的存在(例如,綠色飛機對敵對單位提供觀察、轟炸或干擾,如黃色士兵提供可能的增援)能夠進一步操縱動態和環境對決策的限制或機會。飛機也可能發現第二個缺口,或者 "墻"可以滲透,以創造缺口(例如,清除地雷或建立額外的橋梁交叉點)。

在粗略尺度(如10×10板)和背景下學到的行為可以通過獎勵塑造逐步推廣到更細的尺度和其他背景下。額外的地圖層也可以被添加到諸如快速地下運輸等領域,以繞過地面層中的墻壁。環境因素,如天氣,也可以包括在內,以改變機動性。因此,即使是一個看似簡單的場景,也可以提供豐富的機會來操縱影響決策動態和結果的因素,并探索不同類型的不確定性之間的相互作用如何改變決策景觀,以創建鞍點和局部最小值,從而混淆強化學習的作用。在戰爭中可能出現的情況下,理解和預測三個或更多的合作和敵對玩家的納什均衡,需要一個靈活的兵棋推演平臺,允許跨學科地探索這種決策空間。兵棋推演平臺還需要能夠開發、理解和發現玩家和人工智能之間的新型互動和協同作用,使人類能夠利用人工智能快速找到最佳和接近最佳的解決方案。這些解決方案將使人工智能能夠從人類的決策模式中學習,以及如何優化其對決策空間的搜索。

圖8 帶有豐富博弈論條件的場景

3.2 元推理場景、任務背景和戰略

在ARL戰斗空間游戲中,每個玩家都有一面彩色的旗幟,游戲可以通過殲滅所有對方的地面單位或奪取對方的所有旗幟來獲得勝利(現實生活中的一個等價物是奪取所有關鍵的橋梁或指揮中心)。根據游戲的狀態,指揮官可以決定改變整體策略(殲滅戰與奪旗戰),以更快地取得勝利。例如,如果一輛坦克已經接近一面旗幟,那么將剩余的單位轉到其他地方尋找剩余的旗幟可能是有利的(圖9)。相反,如果一支敵對部隊守衛著第一面旗幟,那么優先奪取這面旗幟可能會更好,這樣搜索第二面旗幟的效率會更高。這種未闡明的推理,或稱 "默契推理",往往在自然的人類決策中根深蒂固,這是一種需要開發的人工智能能力,以便人工智能能夠有效地參與人類-人工智能團隊的決策,使人工智能的發展能夠開始有工具來獲得人類決策的創造性。

圖9 帶有隱性推理和任務重新分配的元推理標志方案

對于人工智能的發展,這就需要一個額外的更高級別的推理Agent不斷地監測游戲的狀態,以做出切換策略的選擇,并將此傳達給控制各個單位的Agent。元推理包括監測推理所涉及的步驟,以及平衡影響活動結果的標準。此外,元推理結合了不同信息的不確定性,以產生更有意義的、符合背景的決策建議。納入元推理可以使約束條件和各種決策方法得到權衡,為行動方案提供不同的選擇。例如,基于元推理的替代選擇可以決定是否優先考慮探索與攻擊已知敵方單位與防御,部署哪種機動戰略,或者考慮到敵方部隊的可觀察位置如何重新分配任務。由于ARL戰斗空間環境的網格大小較小,游戲可以快速進行,導致經常有機會使用元推理,并使人工智能有機會學習結合和預測多種類型的元推理方法的相互作用。由于抽象環境增加了人工智能學習戰略如何交互的頻率,這將使人工智能學習更高級的戰略,例如需要平衡不同戰略、能力和任務要求之間的交互,保持選擇的自由,并產生戰略模糊性以迷惑對手。總的來說,這種方法的好處是通過增加控制和監測機制來改善決策,這些機制包括一個平衡行動和環境約束的元推理Agent。

3.3 簡單的欺騙和人工智能的心智理論

對抗性決策的一個關鍵方面,特別是在戰爭中,就是欺騙。欺騙可以發生在多個層面,包括戰略、可觀察的信息、單位能力和位置。在ARL戰斗空間中,單位的可觀察性有限,這自然為欺騙創造了機會,而飛機在敵方空間深處的探索能力也為揭開單位位置的欺騙提供了機會。圖10展示了一個簡單的欺騙場景的例子,在這個場景中,友軍的藍色和綠色部隊試圖穿越到另一邊。左下方的友軍士兵開始通過左邊的缺口發射導彈,因為他們的Agent推斷(通過對方Agent的人工智能心智理論),看到導彈后,敵方Agent會推斷出友軍正準備通過該缺口進行攻擊。這種欺騙,通過將敵方Agent的注意力和計劃集中到左邊的缺口,使他們偏離右邊的缺口,為藍綠坦克從右邊進入創造機會。通過設計有兩個缺口的情景,該情景建立在經典心理學的兩個替代性強迫選擇任務的基礎上,能夠應用敏感的心理學工具進行決策分析,并開發動物模型,從神經生理學和行為學上剖析支配欺騙的情境依賴性學習和決策的基本細胞和分子機制。例如,人們可以引入一些因素,使友好或敵對的決策出現偏差(例如,通過操縱傳感器的噪音或操縱總部的命令),或應用光遺傳學和化學遺傳學工具等方法,了解他人的認知、信念或策略的神經表征(例如,在前扣帶回和眶額皮層中)對決策計算的貢獻(在前額皮層中)。這種調查還可以發現決定一意孤行、啟發式方法和隱性偏見與對其他假設的開放性的因素,這可以幫助確定在特定條件下如何最好地重新分配任務(例如,當一個人對等級指揮結構有偏見時,他可能不太愿意追求與總部的命令相矛盾的傳感器信息)。這種固有的偏見、啟發式方法和默契的推理是人類推理的自然組成部分,在我們與他人的互動中會被預期到;人工智能的心智理論包括這種偏見補償,對優化人類+人工智能的團隊合作可能是有益的。

圖 10 需要人工智能心智理論的簡單欺騙場景

3.4 網絡欺騙、多領域整合和可信度

在人類的決策中,來自不同領域的信息可以結合起來,產生意想不到的效果。心理上的McGurk效應是指口型"ga"和聽覺上的音節"ba"在時間上有很強的同步性,從而產生幻覺"da"。雖然多感官整合似乎沒有在C2決策中得到探索,但MDO中多個領域的匯合,特別是其在穿透和分解整合階段的高容量和高速度,可能會產生意想不到的非線性跨領域的相互作用(這可能有助于"戰爭迷霧")。圖11說明了一個例子,在這個例子中,實際跡象(導彈)和坦克誘餌(由中間人[MITM]網絡攻擊產生)的組合可以協同作用,迫使敵方單位向左側缺口移動。為網絡欺騙創造趨同的跡象線是一種普遍的策略,然而特定的欺騙模式可能比其他模式更有效。例如,人們認為大腦會將相似或相關的跡象分組,以進行有效的處理(如格式塔分組),這樣就可以克服信息瓶頸(如處理七個以上的名義項目,從而減少單個項目的影響)。如果進行每一次網絡攻擊都會產生一定的成本或風險,那么了解如何將這些成本分配到不同的線索特征中,以便以最小的風險提供最有效的影響可能是有益的(例如,如果MITM攻擊產生導彈誘餌,那么它的效果可能會降低,甚至是反作用)。了解不同的線索組合如何被不同的士兵所感知,也可能是有意義的。具有不同偏見或處于不同角色或梯隊的指揮官可能對相同的跡象組合有不同的感知、解釋或行動(例如,一個誘餌的有效性可能取決于它與目標指揮官的距離以及與他的決策過程的相關性)。更高級的策略可能包括主動防御(例如,通過 "蜜罐 "策略[圖12]),以提高網絡欺騙的有效性。為了給MDO提供超人的能力,人工智能決策輔助工具可能需要根據即時可用的跡象在多個領域協助生成可信的誘餌,以網絡的速度迅速調整這些展示,并保持虛擬和現實世界之間的一致性,以保持幻覺的有效性。

圖11 帶有中間人攻擊的網絡場景

圖12 帶有蜜罐的網絡場景

4. 人與人工智能編隊協作的復雜決策

上一節所述的ARL戰斗空間人工智能測試平臺通過將戰斗空間地形抽象為一個沒有現實表現的網格狀環境,提供了人工智能開發和測試所需的靈活性。例如,圖8顯示了一個類似于墻的障礙物,它被表示為幾個網格塊,與單位互動時應用的環境約束條件有關。人類團隊和AI都在共同的雙級網格化戰斗空間內進行游戲。人類玩家通過在控制臺窗口中輸入基于文本的編碼命令與ARL戰斗空間互動。這種命令行的交互和顯示加速了人工智能算法的開發過程,并為人工智能兵棋推演所需的大規模實時計算建立了與計算資源的潛在聯系。為人工智能兵棋推演測試平臺(如ARL Battlespace)構思一個用戶界面,并建立通往外部計算服務的管道,構成了DFV第二個目標的基本組成部分--開發一個用于復雜決策的WMI。

一個跨梯隊和作戰級別的軍事決策過程模型構成了為人類和人工智能兵棋推演開發一個有效的WMI的基礎。在傳統的兵棋推演中,指揮官利用一個共同的基于地圖的作戰地形,并模擬MDMP中各種因素的組合如何產生行動方案(COAs)、可能的反擊行動、資源使用估計和預測結果。在幾天或幾周內,MDMP過程形成一套精煉的COAs,對作戰環境做出某些假設,包括地形、天氣和設置戰場的單位的可用性和能力(即為支持主要作戰行動而塑造活動)。

盡管MDMP幫助指揮人員了解作戰環境和考慮作戰方法,但這個過程有許多局限性,如時間密集性、假設的僵硬性、跨場景變化的訓練機會有限,以及很少有機會將人工智能指導納入決策過程。傳統上,一項任務的成功與指揮部執行MDMP的能力直接相關。然而,鑒于MDO的復雜性增加,有大量的任務指揮系統和流程,與行動相關的所有活動的整合和同步變得越來越困難,甚至到了人力無法完成的地步。缺少MDMP所導致的規劃專業知識的缺乏會導致行動的不同步和不協調,并最終導致士兵的生命損失。

MDMP中沒有具體描述戰斗空間的可視化能力,但它顯然在決策過程中發揮著重要作用。最近,整合了先進可視化能力的新系統和技術已經被開發出來,這些系統和技術可以提高對局勢的認識,從而加強決策過程。陸軍的例子包括Nett Warrior,它使下馬的戰士能夠直觀地看到附近的友軍和敵軍,同時根據當地的地形協作規劃戰術任務。盡管這項技術將無線電和數字地圖擴展到了下馬戰士,但它缺乏一個提供決策幫助的基礎人工智能引擎。BVI是陸軍技術的另一個例子,它能夠為任務規劃提供分布式協作,具有從任意視角和廣泛選擇的設備對共同作戰圖進行2D和3D可視化的能力。BVI架構可以被制定,以拉入外部計算服務,如分析管道、模型和AI引擎。

目前,MDMP并沒有將人工智能指導納入整體任務規劃方法中。陸軍的APF開始通過將自主技術插入MDMP工作流程來解決人工智能輔助決策的問題。指揮人員可以通過APF的數字規劃顯示、規劃創建者和規劃監控工具,在任務規劃和COA開發過程中獲得背景援助。任務執行和估計能力通過監測任務的規劃和實際進展,為改進決策跟蹤和支持活動提供自動協助。盡管APF在MDMP中引入了基本的自動化水平,但它缺乏Nett Warrior和BVI所提供的高級可視化和用戶交互能力。

除了MDMP之外,最近將人工智能納入決策過程的努力包括了一些方法,在模擬人類決策過程方面取得了一些成功。一般來說,對于決策變量有限的問題,如資源分配、飛行模擬器和較簡單的場景,人工智能取得了一些成功。目前面臨的挑戰包括:需要提高人工智能的能力,以解決有多個行動者、不完整和可能相互沖突或欺騙的信息、不斷變化的單位行動和環境屬性的復雜決策,以及需要將這些決策的后果在許多空間和時間尺度上可視化。

4.1 未來MDMP需要的進步

MDMP在支持MDO復雜決策方面的局限性,突出表明需要在三個方面進行改進。首先,有必要將人工智能生成的指導和輔助決策支持納入MDMP。這包括進一步發展和整合人工智能到戰斗空間決策規劃,以及進一步改善人工智能決策過程的可解釋性和透明度。第二,有必要在可能的情況下,將決策分析與戰略層面以及戰術邊緣的HPC的力量結合起來。這將能夠利用HPC系統的力量來改善建模、分析和計算時間,同時整合和同步來自所有戰區領域的信息。最后,有必要利用先進的可視化技術,如混合現實技術,對決策空間進行更準確和互動的展現。不是簡單地在一個固定的時間尺度上顯示地形的二維渲染,而是需要可視化不同領域的決策是如何互動的,并利用混合現實技術來提高理解的吞吐量和深度,并實現平面顯示不可能的洞察力。

MDMP是陸軍設計方法的核心,用于應用批判性和創造性思維來理解、可視化和描述問題以及解決這些問題的方法。作為解決問題的行之有效的分析過程,必須克服前面描述的MDMP的局限性,以便快速制定一個靈活的、戰術上合理的、完全整合的、同步的規劃,以最小的傷亡增加任務成功的可能性。下面的小節描述了對MDMP的潛在改進,以支持人類與人工智能的合作決策。

4.1.1 人工智能引導的決策指導

需要新的人工智能支持的WMI,以利用人工智能決策的持續進步,并為復雜的適應性決策的人工智能學習做出貢獻。通過匯集所有領域的信息,計算人類和人工智能Agent的風險和預期回報,人工智能決策輔助工具的發展將提供能力越來越強的COA建議。現有的人工智能有幾個局限性,特別是對于有不確定性的復雜和適應性決策,以及人類和人工智能Agent的協作和對抗。對多Agent的協作和對抗性決策進行建模可能特別復雜,因為它的遞歸性質,其他Agent是模型的一部分,需要對決策特征、個性化的價值、風險規避、記憶和注意力進行動態和不斷發展的估計。這些具有高度不確定性、復雜性和動態性的情況是人類擅長的領域,適當設計的人機協作交互可以提供加速和更有效的決策。為了實現有效的團隊合作,新穎的WMI應該幫助作戰人員篩選復雜的信息,幫助人工智能發現決策的隱含規則。在此,我們提供了關于人機協作如何有效的案例。

多域兵棋推演中需要的復雜決策是開發有效的人工智能決策輔助工具的直接挑戰。最近人工智能在圍棋和國際象棋等游戲中的成功是基于對世界現有狀態的完全了解(即 "開放"游戲),而兵棋推演通常包括關于作戰環境的不完整(如星際爭霸)、不確定和/或欺騙性的信息。由于世界狀態、不同行動者的狀態以及所采取的行動影響的不確定性,知識的缺乏使得人工智能Agent難以計算未來行動的風險回報情況。不確定性也限制了人工智能估計其他行為者的風險回報概況的能力,而這是計算有效博弈論策略所需要的。人工智能被可能的最優和近似最優選擇的廣度所淹沒(即由于信息有限而選擇錯誤)的情況并不少見,因為人類在制定有效探索隱藏信息的策略時,會采用啟發式方法來進行有效的選擇和預測。為了幫助發展人工智能的隱性知識和探索能力,新型的WMI需要有效地解釋和展示決策圖,以使作戰人員能夠快速和自然地瀏覽可能的選擇,同時使人工智能能夠適時地從人類的決策中學習,而不施加認知負荷。

開發人工智能的WMI的另一個基本挑戰是如何有效地整合和顯示MDO中所有五個領域的信息,特別是空間和網絡,因為這些領域的信息具有不同的時空尺度。對于網絡,決策的規模和速度可能比人類處理和理解的能力更快,需要人類的輸入來指導半自動的決策,以及一個實施進攻和防御欺騙策略的人工智能。WMI需要能夠以這樣的方式顯示決策圖,即一小部分最優和接近最優的決策策略清單是可以解釋的(例如,通過決策樹)。這應該包括對關鍵Agent在不確定情況下的未來狀態和風險回報情況的估計,以使有效的博弈論決策能夠被共同開發和相互理解。

這些挑戰為有效的WMIs的可能設計提供了參考。也就是說,我們需要有能力從不同的來源(包括從其他國家的決策輔助工具)攝取信息,以及一個能夠承載整合這些信息的計算能力架構,同時還要處理基礎的人工智能計算(包括學習和部署)。我們還需要共同開發一個交互和算法設計,以適時地利用人類和人工智能Agent的優勢并減少其局限性。

4.1.2 高計算能力下的決策過程

在MDO兵棋推演的復雜決策過程中,需要大量的計算能力來處理和記錄所有組件、實體和狀態空間。從動態狀態空間的累積數據集中建立過去、現在和預測模型,需要利用HPC資源來產生分析見解,并創建在復雜決策背景下有用的表示。

實施HPC分析工作流程的一種方法是使用持久性服務框架(PSF)。PSF是一個最近可用的分布式虛擬化解決方案,它可以通過一個基于網絡的前端實現對高性能計算服務的非傳統訪問,而不像傳統的HPC環境那樣,計算節點在特定時期內以批處理模式分配給用戶。此外,PSF可以提供對數據、數據庫、容器化工具集和其他托管平臺的分布式持續訪問。

在一個PSF方法的例子中,一個模擬引擎連接到PSF,用于記錄人類和人工智能做出的所有決策。這允許分析在任務規劃和COA開發過程中發生的決策行為,以及識別決策模式和戰略,以開發競爭和現實的兵棋推演場景。一個戰斗空間可視化平臺可以托管在PSF上,并使用信息傳遞協議來更新所有連接的設備接口。來自模擬引擎的狀態信息可用于生成戰斗空間和參與作戰單位的圖形表示。

使用PSF方法并利用HPC資源,可以實現利用大數據攝取和分析的人工智能輔助決策機制,同時可供地理分布的用戶用于協作決策工作。連接到PSF托管服務器的各種混合現實顯示模式可以支持從戰略層面的C2到作戰邊緣的更多移動戰術使用等一系列作戰場景。

4.1.3 決策空間的逼真呈現

用圖形表示各級行動的軍事決策戰略需要新的可視化方法,這些方法可以應用于以規則變化、認知狀態、不確定性以及個人偏見和啟發式方法為特征的動態環境。

戰斗空間的視覺表現應該在技術上盡可能準確和逼真,但又保持在人類可以理解和解釋的認知水平。融合了混合現實技術的先進可視化方法有可能更好地表現多領域戰爭的變化特征及其不斷變化的威脅和動態環境。隨著最近混合現實可視化設備的技術進步,成本降低,硬件的可靠性和實用性顯著提高,混合二維和三維可視化方法現在已經成為可能。

由多個二維顯示器組成的混合現實方法增強了更先進的三維可視化能力,可以為指揮人員提供了解復雜的戰爭游戲狀態空間所需的洞察力。例如,BVI平臺可以使用多種可視化模式的組合,真實地呈現地理空間的地形。作為一個數據服務器,BVI向支持多種可視化模式的客戶端應用程序分發地形、作戰和Agent行為數據,包括頭戴式顯示器設備、基于網絡的界面、移動安卓平板設備和混合現實設備(例如,HoloLens 2、Oculus Quest)。

圖13(頂部)顯示了位于加利福尼亞州圣貝納迪諾縣歐文堡國家訓練中心的高分辨率地形上的友軍與敵軍的兵棋推演場景。與MDMP期間經常使用的傳統2D地圖顯示相比,戰斗空間的3D視圖可以從多個觀察角度提供更豐富的用戶體驗。三維視圖,在BVI的網絡戰術計劃器(WTP)中,將地形和人工特征的空間信息以及由MIL-STD 2525C符號描繪的單位位置可視化。

可以想象,地理空間視角,如BVI提供的視角,支持決策者對動態戰斗空間環境的理解。與可導航的人工智能增強的決策空間(圖13,底部)搭配,組合的視角可以使人們更好地理解視覺空間依賴性、影響和因果關系、估計的風險和價值、不確定性以及復雜決策的欺騙性。將這種以地理空間和決策為中心的視角與人工智能相結合,可以提供必要的廣度,以協調物理行動與網絡和其他非空間領域的行動,跨越多個時間尺度,并具有快速適應變化的任務目標的靈活性

圖13 BVI網絡戰術規劃器中的兵棋推演場景的三維視圖(上)與人工智能決策樹的概念(下)。

5. 討論

人工智能對人類自然決策行為的機會性學習,以及學習環境的適當結構和順序,使人工智能被訓練過程有效地塑造,是已經建立起來的提高人工智能快速學習困難挑戰能力的框架。要進一步提高人工智能在兵棋推演中的復雜決策能力,需要提高人工智能在具有高度不確定性的MDO背景下處理決策的能力、欺騙性和博弈論,這些都是人工智能發展過程中獎勵分配的挑戰。克服這些挑戰需要利用多學科的進展,從了解大腦的決策、獎勵和計算的神經生物學進展到專業知識、隱性知識、心智理論、博弈論和元推理在復雜決策過程中如何應用的心理學進展。

人工智能如何能夠最好地學習人類的復雜決策仍然是一個開放的問題。盡管對復雜決策進行獎勵塑造的確切機制還沒有被發現,但這個項目已經產生了如何通過一個新的人工智能測試平臺和WMIs來發現這種機制的設想。ARL戰斗空間人工智能測試平臺和場景將人類和人工智能置于與MDO相關的決策環境中,使人工智能能夠學習不同的決策和因素如何相互作用,以及人類如何通過這種復雜的決策樹進行合作和對抗。一個關鍵的進展是,測試平臺和場景提供了一個豐富的環境,通過抽象化那些會使決策要領稀疏化和阻礙學習的因素,有效地開發人工智能心智理論和與MDO相關的元推理,以進行復雜的決策。

另一個進展是開發高性能計算框架,以實現人工智能決策支持的連續分布式訓練。這將使人工智能決策輔助系統能夠托管在ARL的持久性服務框架上,因此,將來士兵可以隨時隨地以人類和人工智能混合團隊的形式,針對人工智能兵棋推演Agent進行單獨或協作訓練。

這個項目的第三個進展是開發了一種可視化人工智能決策過程的方法,以實現人工智能的透明度和信任,以及人類與人工智能團隊的合作決策。人工智能的推理必須既抽象又與兵棋推演環境相關,這樣人類就可以理解人工智能對不同決策結果的評價,并有效地瀏覽人工智能的決策樹,而不會造成過度的認知負擔。我們已經向人工智能增強的WMI邁出了第一步,它基于三維混合現實,利用和增強人類固有的三維認知和預測的能力。隨著進一步的設計,我們設想它的界面將給人以自然的感覺,同時擴大顯示多個領域的信息,并使人工智能能夠適時地從用戶的決策中學習。這種自然的、直觀的人工智能輔助決策系統,是為了支持MDO C2決策而開發的,包括隱性推理,以及協作和對抗推理,對于人類在復雜決策中信任人工智能對COA結果的估計至關重要。

5.1 進一步發展人工智能測試平臺和人工智能Agent的潛力

雖然最近在游戲中對深度強化學習算法的利用顯示出巨大的前景,但這種成功的前提是與一個相對簡單、結構良好的游戲合作。真正的挑戰出現了,因為環境越來越依賴于稀疏的觀察數據、復雜和動態的Agent策略。完全在內部開發平臺與在現有的開放源碼庫上建立平臺相比,有幾個權衡因素--主要是限制因素的最小化和環境開發的純粹工作量。創建一個全新的定制平臺可以完全定制與游戲相關的錯綜復雜的問題,盡管變得非常耗時。相反,在使用現有的庫,如StarCraft2LearningEnvironment(SC2LE)時,會出現各種不可逾越的限制,但投入游戲開發的工作量會減少十倍。我們正在進行的ARL戰斗空間人工智能測試平臺的第二代開發,名為Simple Yeho(圖14),是建立在天平兩端的平衡上的,OpenAI Gym是一個用于開發強化學習算法的工具包,對輸入的Agent和環境結構不做任何假設。顯然必須遵循一個基本的框架,但OpenAI Gym除了提供大量的文件和例子供客戶參考外,還提供了完全的設計自由。從游戲開發的角度來看,并沒有立即需要解決的問題,但它確實需要成為未來一個更優先的事項。

圖14 簡單的Yeho人工智能測試平臺

未來的問題并不局限于游戲環境,因為它們將不可避免地延伸到理論上的強化學習挑戰,如無縫的多Agent通信、任務協調和固定的策略。更多需要關注的實際問題包括算法效率(限制計算密集型任務以及內存分配的心態),一種新穎的去中心化強化學習算法,以及跨多個領域的數據泛化。過度消耗硬件資源是人工智能所有分支中的一個共同瓶頸。從軟件的角度來看,ARL Battlespace AI測試平臺對資源消耗很少,該環境仍然專注于AI發展的研究問題,而不是全面的MDO實施,這就是為什么計算效率還不是一個緊迫的問題。歸納游戲狀態信息的潛在解決方案,特別是在動態環境中,包括時差變異自動編碼器和分布式時差強化學習,因為它們除了在數據點之間提供一個平滑的潛在空間外,還允許對未來的幾個狀態有明確的信念(這在元推理方面起作用)。我們的新型強化學習算法應該解決的其他主要問題是安全/認證、Agent決策透明度和Agent間的實時通信。將區塊鏈整合到DEVCOM ARL框架中,將確保節點之間的安全通信線路,提供一個不可改變的分布式賬本,以揭示Agent的低級決策,并向Agent引入民主投票系統,以促進團體合作,同時仍然保持個人的自私性。

5.2 進一步發展人類-人工智能協作交互的潛力

目前軍事決策過程中的局限性確定了一個多學科的研究方法,用于開發復雜決策的人類和人工智能WMI。作為基礎層的決策空間的現實表示,包括具有地理空間精確性的自然和人工制作的戰斗空間地形。一個先進而直觀的用戶交互允許混合現實視角的戰斗空間,使決策者能夠根據作戰因素探索COA的替代方案。這兩個要求指導了對陸軍和商業開發的戰斗空間交互系統BVI的選擇,作為ARL戰斗空間人工智能測試平臺中實現的人工智能和人類-人工智能團隊發展的潛在過渡媒介。

過渡的第一步是將ARL戰斗空間的網格狀環境疊加到BVI真實世界的作戰地形上,并將現有的BVI多模態用戶交互調整為兵棋推演。圖15顯示了使用BVI的網絡戰術規劃器3D視角在歐文堡地形上疊加的擴展網格的一個部分,其中友軍和敵軍單位位于兵棋推演會話的開始。在瀏覽器窗口中,可以使用戰術規劃工具欄的鼠標、觸控板或觸摸屏互動來放置和操作單位。BVI提供了添加單位的功能;路線點、戰術符號和圖形;以及繪制線條、多邊形和文本框等特征。

圖15 BVI網絡戰術規劃器中帶有網格覆蓋的兵棋推演場景的三維視圖

一個尚未解決的問題是,如何最好地利用BVI的混合現實(XR)可視化功能來進行協作決策(例如,在兵棋推演期間,通過加強決策者對地形的地理空間因素的理解)。加載不同的地形和創建定制的訓練場景可能來自于多維數據,并以各種身臨其境的形式觀看,這超過了陸軍其他系統的可視化能力。根據這些三維地形的廣度和細節,當決策者使用一系列強大的交互方式在大面積的地形上進行操作時,界面如何顯示這些信息可能會造成大量的信息過載或混亂。一個有效的界面需要被設計成不僅要選擇傳達哪些環境和決策空間信息,而且要選擇如何從用戶的有利位置呈現這些信息。

如果不可能有開發時間和精力,BVI的API提供了機會,以標記、標簽和定位在地形之上的場景適應性網格的形式嵌入視覺輔助,作為決策者的空間管理干預措施。例如,圖15中描述的網格的行和列可以被標記或編碼,以快速定位實時事件和人工智能產生的活動。多維網格結構和編碼方案可以將兵棋推演提升到以MDO為特征的復雜水平,同時減輕一些基于地形的空間管理問題。

在空間和時間領域的數據分析中協調戰斗空間的多個視圖,可視化提供了額外的方法,促進兵棋推演期間的復雜決策。當需要一個共享的MDO戰斗空間呈現時,可以通過在不同的可視化模式上實施多個協調視圖來實現協作戰略規劃模式,根據分布式指揮人員的輸入進行互動更新。指揮人員的輸入也可以指導視覺過濾器對協調視圖的應用,從而減少不必要的復雜性,突出場景或任務關鍵的戰斗空間信息。

圖16顯示了SyncVis視覺分析系統,該系統旨在顯示多個協調的數據分析視圖,支持數據探索和理解。SyncVis通過用戶互動將每個視圖中顯示的信息與其他視圖聯系起來,從而產生多種數據可視化。這個例子顯示了SyncVis在四個協調視圖中對COVID分類人群數據分析的二維界面。變量選擇器(選擇六個屬性)、地圖/地形、相互信息圖和每個選定變量的疊加區域圖。

圖16 SyncVis二維界面顯示COVID數據分析的多種協調的可視化效果

SyncVis的可視化功能可以與使用PSF的HPC分析工作流程后端集成。PSF服務器可以向BVI和SyncVis流傳作戰和Agent行為數據,創造一個統一的戰斗空間探索體驗。基于用戶按需輸入和過濾的協調戰斗空間視圖的好處有待研究。

一個靈活的兵棋推演環境似乎是關鍵,因為每個訓練場景、COA和任務計劃都是在MDMP和相關軍事理論的約束下制定的,但又是獨一無二的,并取決于戰斗空間及其操作變量。一個HPC PSF數據分析處理管道為WMI提供動力,士兵或指揮官按需協調戰斗空間的BVI和SyncVis可視化,將徹底改變現有的兵棋推演范式,并觸及MDO固有的復雜程度,以及贏得勝利所需的人類和AI指導的決策水平。

6.結論

我們強調了三個關鍵的發展領域,即人工智能引導的決策指導,支持這種指導的計算基礎設施,以及決策透明度的混合現實表現的發展。這些領域的進步需要跨越許多不同學科的專業知識。新的人工智能發展需要融合神經科學、心理學和數學的思想,以克服復雜決策中長期存在的問題的瓶頸。這包括跨時間尺度的學習和變化環境下的災難性遺忘,以及更具體的兵棋推演問題,如具有不確定性、欺騙和博弈論的多Agent決策。計算基礎設施也需要發展,因為計算能力和數據框架對于在戰術邊緣產生人-人工智能團隊的共同操作圖來說都是必不可少的。為了有效地開發,應該通過一個共同的框架來抽象出專有的限制和軟件的依賴性,并為使用和故障排除提供清晰的文檔,以使學術界、政府和工業界更好地專注于解決人與人工智能的合作問題。這個通用框架應該包括有效的信息傳遞,同時提供靈活性和適應性,以滿足人工智能開發和人類用戶在訓練和實際使用環境中的需求。最后,交互技術的開發本身需要跨學科的協同專業技術。一個基礎性的問題是如何壓縮信息使之被用戶有效地理解,以及如何最好地利用用戶的互動來進行機會主義學習。人類的大腦并不處理所有的感官信息,而是對世界進行預測和假設,以便在信息不完整的環境下節約計算。一個有效的WMI應該同時預測潛在的決策結果以及個人用戶的期望和假設。此外,人工智能決策輔助工具必須估計用戶的默契,使其能夠提供最相關的信息和最有希望的選擇,這些信息來自整個作戰領域。

付費5元查看完整內容

在未來的軍事行動中,通過協調多智能體系統(MAS)來實施戰略機動以獲得對對手的優勢,是一個很重要的途徑。最近探索MAS協作的工作主要集中在識別、分類、驗證、實施,以及通過多智能體強化學習(RL)來研究新興的協作方式。強化學習方法可以通過探索和利用選定行動來響應特定環境中的突發行為,這有可能抑制對抗性協作,反過來又可以為各種情報、監視、目標獲取和偵察任務提供機會窗口。本報告簡要介紹了RL領域的突出工作及其在自主戰略機動協作式MAS中的潛在應用。

1 引言

美國陸軍現代化激增是由對手在多個領域(如陸地、海洋、空中、網絡、電磁和空間)對美國構成的威脅所推動的,這對美國利益的威脅超出了常規戰爭。預計未來的戰斗將在這些復雜的多領域環境中進行,人工智能(AI)將指導與人類士兵一起協同工作的機器人Agent的戰術、技術和過程(TTPs)。這些機器人將聚集在一起,形成智能多Agent團隊,與人類士兵有效協作,完成任務。

美國陸軍作戰能力發展司令部(DEVCOM)陸軍研究實驗室(ARL)的基本研究計劃(ERPs)構建了開發和實施智能多Agent系統(MAS)的具體計劃路徑。此類陸軍計劃為美國國防行動提供了關鍵研究問題的答案,這些問題匯聚在一起,指明陸軍未來司令部的現代化努力方向。人工智能用于自主機動性(AIMM)和新興超限技術(EOT)是ERP的例子,明確側重于使下一代戰車具有自主感知、學習、推理、規劃和機動能力。這些未來的自主系統將與人類智能體合作進行預測和規劃,并通過戰場上的自主機動(AIMM)和保護(EOT)向士兵提供支持。本報告重點關注需要進行的自主協作,以使多智能體系統(即人類、智能體或人類和智能體混合)在未來的軍事行動中取得成功。

集成和協調的MAS將需要技術的進步,重點是超越我們目前的能力,以有效地對付同等裝備的對手(同行或接近同行)的協作戰略機動性。一個直接的挑戰是開發能夠以良好協調方式自主和智能地工作的智能體團隊。這種能力要求智能體在執行關鍵任務時與士兵一起觀察、定位、決定和行動(OODA-Loop)。雖然新的努力促進了對多智能體范式中情報的一般理解,但目前對情報的解釋并不明確。最近的文獻表明,基于強化學習(RL)的方法可能為實現這種技術進步提供了一條可行的途徑,本文介紹的一系列工作就是證明。

在本報告中,介紹了RL領域的貢獻,以及它們在軍事環境中的潛在應用--特別是通過戰略編隊機動來抑制對手的協作,以實現戰場上的超越。最小化、限制或完全抑制對抗性多Agent行為中的協作是探索和執行在模擬情況下通過RL實驗得出戰略機動的一種手段。此外,協作的戰略機動可以通過各種RL方法學習,以告知防御部隊創造機會或優勢窗口的潛在途徑。

為了在模擬環境中通過戰略機動的RL方法實現MAS協作,我們首先介紹了近年來一些最突出的RL研究。最近在RL領域的進展(如alphago)促進了更復雜的多智能體強化學習(MARL)算法在現實世界應用。此外,近年來也有一些框架來實現多智能體協作。這些努力加在一起,可以為開發和實施多機器人協作提供一條道路,以便在為未來戰場設計的多機器人系統中實現戰略機動。

在下面的章節中,對近年來突出的RL方法進行了分類和概述,并表明這些方法與DEVCOM陸軍研究實驗室目前的研究和開發項目相一致。具體來說,本報告的重點是確定戰略機動的特定算法的優勢和劣勢。此外,對選定的RL方法類別進行了分類,以深入了解戰略機動的潛在實施,并考慮到情報、監視、目標獲取和偵察(ISTAR)任務。

2. 多域作戰中多智能體系統的戰略機動

簡單地說,戰略機動可以解釋為一組智能體協調他們的行動,通過戰勝對手來實現一個共同的目標。破壞,是戰略機動的一個特例,可以表示為對對手協作戰略機動的抑制。因此,戰略機動一詞的使用意味著至少存在兩個對立的或敵對的雙方,他們處于動態的斗爭中,通過限制、抑制或以其他方式破壞對手的協調或戰術,并強加自己的協作戰術來獲得對對方的優勢。

在本節中,提供了一個對抗性的交戰場景,其核心是使用選定的遠程資產,這些資產本質上破壞了友好部隊的交戰。圖1顯示了一個圖例,描述了與所述多域作戰(MDO)情景相關的選定資產和部隊的軍事符號學。根據MDO理論,在武裝沖突中,對手的遠程反介入和區域拒止(A2AD)火力系統可以被用來拒絕友軍在戰區的機動自由(見圖1)。這是通過將情報、監視和偵察(ISR)資產與致命性和非致命性火力相結合來實現的,以攻擊戰略和行動支持區的友軍指揮結構、維持能力和部隊編隊。這些地區是近距離地區作戰資產(如部隊和裝備)的傳統集結地(見圖2)。對手有能力在友軍后方深處識別和攻擊目標,導致這些實體在地理上與戰術支持區和近距離區分離,這有效地提高了友軍的損耗率,即所謂的對峙。鑒于前線部隊與戰略和作戰機動支援相分離,敵對勢力可以利用這種友軍孤立無援的情況,將其消滅。

圖1 友軍(BLUEFOR,左)和敵軍(OPFOR,右)部隊的資產和資源。在所描述的MDO情景中,假設BLUEFOR和OPFOR的所有資產都是自主化的編隊。

圖2 敵軍(OPFOR)使用遠程導彈和火箭炮干擾或破壞友軍(BLUEFOR)戰略支援區的維持行動,這使得友軍無法以有利的條件與近距離地區的敵軍機動部隊交戰。為了應對這一戰略,BLUEFOR執行反擊任務,以摧毀位于深火區的OPFOR遠程火力系統(藍色箭頭)。從深層機動區的BLUEFOR SOF發出的三叉箭頭代表了一種 "破壞 "戰術,它打破了對手的隊形和節奏。

圖3 壓制(S)或解除(N)敵方遠程火力系統和ISR資產,使友軍能夠穿透敵方的A2AD保護傘。這使友軍能夠在近距離地區擊敗敵人,并使機動指揮官有能力利用他們的成功,迅速將部隊轉移到深度機動區,摧毀(D)脆弱的敵方資產并追擊撤退的敵軍。F表示 "固定",可有效減緩敵軍的行動。粗箭頭代表部隊移動的方向。

MDO理論規定了擊敗對手A2AD能力的計劃(即對峙),以便戰略和作戰機動能夠使前沿部署的友軍以有利的條件與對手交戰(即穿透和瓦解A2AD系統以利用機動自由)。在這里,我們只關注友軍(BLUEFOR)野戰軍和軍團與敵方A2AD系統交戰時的滲透和瓦解部分,這可能需要在未來的戰斗中使用自主MAS。此外,據推測,圖1中友軍(BLUEFOR)和敵軍(OPFOR)的所有符號都將包含自主化的編隊(例如,機器人戰車、自動瞄準系統、地面和空中的機器人ISR資產)。圖2和圖3分別顯示了利用這種符號學與自主化編隊進行戰略機動的情景圖。

如圖2所示,敵對的A2AD火力系統通過攻擊戰略和作戰支持區來創造對峙局面。友軍火力和防空部隊從太空和高空監視(未顯示)接收有針對性的情報,在狹窄的時間窗口內打擊高價值目標(即多管火箭系統[MLRS]),以減少對手的位置調整。除了監視之外,還可以采用戰略刺激--打擊來穿透和瓦解對手的遠程火力系統。

在ISTAR任務中,MARL可以通過利用敵軍理論和敵軍行動中的局部觀察,戰略性地照亮和跟蹤敵軍目標的位置。此外,經過MARL訓練的具有自主能力的編隊,結合高度機動和分散的空中和地面火力,可以開始壓倒對手的遠程防空。友軍可以利用經過訓練的MARL方法來利用對手的TTP,進行防空和地面火力的戰略機動。這些具有自主能力的編隊根據從戰略空基刺激收集的監視數據選擇地理位置。隨著對手的遠程火力系統被消滅,戰略和作戰支援部隊能夠向前方的作戰部隊推進(機動)(見圖2)。

敵軍利用ISR資產識別作戰支援區的友軍資產,并從作戰縱深火力區用遠程火力系統(即多管火箭炮)攻擊友軍。這些敵方火力擾亂了友軍在該地區進行傳統支援行動的能力,這反過來又導致這些活動在離部隊前線更遠的地方進行。這通過擴大戰場和緊張的補給線而造成地理上的對峙。此外,這還允許敵方機動部隊以有利于敵方既成事實的條件與近距離地區的友軍作戰。根據MDO的理論,為了消除對峙,友軍的炮兵系統必須在敵軍的火力和ISR資產部署之前識別、交戰并摧毀它們。友軍SOF通過破壞補給和指揮與控制(C2)節點以及為聯合火力提供目標數據來協助這項工作。這在敵人的A2AD保護中創造了缺口,可以被機動指揮官所利用。在這種覆蓋下,友軍機動部隊穿透并利用近距離和深層機動區域的缺口。

在作戰區,近距離和縱深地區的聯合部隊的戰略編隊可能是自主啟用的編隊(即MAS),利用MARL訓練的策略來利用對手的TTP(來自理論)、本地觀察和ISR收集的信息。如圖2所示,聯合部隊將協調其ISR和遠程精確火力的能力,為前沿部署的BLUEFOR部隊提供支持。在戰略和作戰單位的支持下,擁有自主能力的前線部隊可以在近距離和縱深地區進行協調,以分離和擊敗敵方資產。這將促進消滅敵對的前沿機動部隊(OPFOR),使遠程火力系統容易受到地面攻擊(瓦解),如圖2所示。

聯合火力(即友軍或BLUEFOR)壓制或消滅對手的遠程火力系統,使友軍機動部隊能夠進入并擊敗近距離區域的作戰部隊(見圖3)。然后,友軍機動部隊利用這一優勢,在深度機動區(見圖3中的D區)摧毀敵方的助推器。這將導致剩余的敵對機動編隊從近距離區域撤出,并在深層機動區域建立一個新的戰線。這個過程不斷重復,直到達到戰略目標或打敗OPFOR。這些協調活動在理論上可以通過人類士兵和自主多智能體系統之間的合作來實現。此外,鑒于目前正在積極研究開發和部署這種自主系統,預計未來的戰場將需要考慮像這樣的場景來規劃戰略機動。

本節提供了一個可以應用MARL方法訓練自主化編隊的場景;然而,在這種復雜的MDO環境中執行的具體RL方法還沒有經過測試,或者可能還不存在。下一節闡明了與利用RL方法為未來的MDO交戰訓練MAS有關的一些挑戰。

3 挑戰

在這項工作中,我們將重點聚焦到可以指導MAS克服與軍事防御MDO中戰略機動相關挑戰的RL方法。從技術上講,RL是機器學習(ML)的一個分支,它超越了從數據中建立精確的預測,通過在環境中產生行動來展示學習。這種學習的展示可以被認為是一種決策形式,但更準確的描述是通過狀態空間探索進行戰略行動選擇。

RL智能體在獎勵函數的基礎上進行學習(或訓練),最終確定在當前情況下(即該智能體在環境中的狀態),哪一個是智能體要選擇的最佳行動。例如,RL智能體可以與環境互動,產生與獎勵掛鉤的經驗,這將形成學習的策略(即一系列的狀態-行動對)。然而,在后面的章節中強調,目前的RL方法可能還不夠成熟,無法克服與人類類似的適應性相關的挑戰,以便在新情況或環境中進行智能決策。盡管RL算法有其缺點,但它們似乎是在軍事防御MDO中實現協調的MAS執行戰略機動的最有希望的途徑之一。

在多智能體任務中,協作通常是定義不清的,而且經常被用來表示一組智能體在某些合作任務領域中成功地執行了任務。在以前的工作中,開發并采用了各種新方法來測量執行合作任務時智能體行動之間的相互依賴性,以確認這些智能體事實上已經學會了協作。對協作的確認是確定MAS有能力與其伙伴合作的先決條件,而不是簡單地采取導致某種程度的優化行動。雖然在某些情況下,最佳行為可能是可取的,但如果任務以某種不可預見的方式發生了變化,一個簡單的最佳行為的智能體可能會在戰場上導致災難性的損失。因此,未來防御行動的MAS必須具有明確協作的能力。

在本節的其余部分,描述了與開發戰略機動MAS有關的一些挑戰,其中時間尺度、能力和局部目標可能有很大的不同(例如,MDO),但需要某種程度的協作。此外,假設更大程度的靈活協作可以促進任務執行的改進(例如,更快、更少的損失、非直觀的策略、有效處理不斷變化的能力/團隊組成)。

隨著環境在動態戰場上的變化,敵對雙方(至少)可能需要重復規劃和預測,以便1)跟上,或2)領先于對手的規劃和預測。經過RL訓練的MAS能夠學習這種動態的規劃和預測循環。另外,如果學習智能體建立了一個關于對手協作行動的適當模型,然后采取行動破壞這種協作,也可以實現這一目標。

在一個理想的情況下,一個被選來指導MAS行為的算法將學會處理環境、對手戰術和能力、自身能力(獲得新的能力或失去以前的能力)、團隊組成(例如,改變合作者)和局部目標的變化。然而,大多數最先進的(sota)方法受到經驗的限制(正如許多RL方法的情況一樣)。此外,在大多數模擬中,團隊的能力和組成通常是固定的,不能為算法提供足夠的數據來操作和處理任何上述的特征變化。因此,在選擇一種算法來指導旨在產生戰略機動的MAS的行為時,必須考慮新的或動態的事件、行為、資產和實體。

總之,目前的算法方法在復雜的軍事防御MDO環境中沒有達到所需的能力。目前的缺點可以分為三類。1)數據要求,由于情況的新穎性,數據是有限的,數據集不足以產生準確的預測,或者數據以某種方式被污染(例如,嘈雜、臟亂或對手的改變),2)有限的計算資源,以及3)算法不能泛化到訓練期間遇到的情況之外(例如,不同的目標、改變的能力或修改的團隊組成),導致狹隘或脆弱的MAS解決方案。

在下一節中,我們將更詳細地討論RL的缺點,以闡明如何克服這些問題,為軍事防御MDO環境提供解決方案。為此,我們介紹了現有的RL算法的分類法。這一努力應提供對有前途的RL技術更好的洞察力,這可能有助于確定最終應用于美國國防MDO的可行途徑。

4. RL技術和方法

學習算法的可擴展性是MDO中軍事任務的主要關注點之一,特別是因為這種任務可能需要大量的智能體來完成一個目標。此外,軍事任務可能涉及多個子任務,每個子任務都有自己的子目標,從而進一步復雜化了場景。在MDO中,預計一個子目標由無數復雜的戰略演習組成,這需要MAS的快速計算,以及使用最小計算資源(如在戰術邊緣計算)的最佳(或至少足夠)戰略。因此,一個可擴展的RL算法必須考慮到:1)環境和任務的復雜性;2)智能體(伙伴和對手)的數量,以便每個智能體能夠在通過RL學習過程中收集經驗時正確選擇行動。

環境復雜性(即智能體的狀態和行動空間的大小)可以指環境的狀態空間中可用的狀態數量,以及該環境中智能體可用的行動方案數量。RL算法的可擴展性是指在足夠復雜的狀態和行動空間中,在合理的時間和計算能力內計算最優策略的能力。環境的復雜性還包括納入額外的智能體(例如,擴展到MAS),其中狀態空間被放大以考慮到額外的智能體,而行動空間的大小被乘以該之智能體的數量。

通過使用狀態-動作對的表格來解決RL的可擴展性問題是不實際的,因為連續的領域會使表格無法維持,而且在合理的時間內同時更新所有智能體的表格條目是不可行的。即使有足夠大的計算資源(如過多的計算機內存)來包含所有的狀態,在每個狀態-動作對之間的學習也會太慢。與利用表格跟蹤狀態-動作對相反,一個解決方案是使用非參數函數近似器(例如,權重為參數的深度神經網絡)來近似整個狀態空間的值。然而,函數近似器必須是可微分的,這樣就可以計算出一個梯度,以提供參數調整的方向。

有兩種方法來訓練值函數近似器:1)增量方法和2)批量方法。增量方法使用隨機梯度,在梯度方向上調整近似器的參數,使估計值和目標值之間的誤差最小。然而,增量方法的樣本效率不高,因此不具備可擴展性。相比之下,批量處理方法從一組經驗中保存數據,并使用它們來計算函數近似值估計和目標值之間的誤差。批量方法與傳統的監督學習有共同之處,即結果是已知的(例如,數據被標記),計算近似值的估計值和實際結果值之間的誤差。這種類型的批量學習通常被稱為經驗重放。重復這個過程將導致最小平方誤差的解決方案。最近一個成功的經驗重放的例子是用深度Q網絡(DQN)玩雅達利游戲演示的。盡管函數近似法在復雜的環境中顯示出了成功,但如果不考慮額外智能體的加入(即非平穩性或部分可觀察性),單靠這種方法不太可能足以訓練出MDO場景的MAS。

與價值函數近似法相比,策略學習方法依靠策略梯度(PG)的計算來明確優化策略,而不是間接依靠價值函數。與函數近似方法相比,PG具有更好的收斂特性。PG方法比價值近似方法更受歡迎的主要原因是它們能夠在高維和連續的行動空間中有效(即在復雜環境中可擴展)。在蒙特卡洛(MC)策略梯度(例如REINFORCE算法)中,實際回報(選擇行動)與一個分數函數相乘,以計算梯度。該梯度被用于策略調整(通過改變參數值)以找到最大的回報行動。MC策略梯度具有高方差,收斂速度慢,因為它使用智能體的狀態-行動對在不同時間的整個軌跡來獲得一個返回值。另一種可能超越傳統函數近似方法缺點的解決方案是利用 "演員評論"方法。

在演員-評論家方法中,PG方程被修改為使用價值函數的近似值,而不是使用真實的行動-價值函數乘以分數(如REINFORCE算法)。這表明行為者按照評論者所指向的方向調整策略,以便使總的累積獎勵能夠達到最大。評論者的這一策略評估步驟可以通過使用組合值近似方法(即MC、時差-TD(0)和TD(λ))來完成。為了減少策略梯度的差異,可以使用一個優勢函數。優勢函數告訴我們,與一般的狀態值函數相比,一個行動比另一個行動(Q值)好多少。這意味著評論者必須估計Q值。一個有效的方法是使用TD-error,它是優勢函數的無偏樣本,評論者對一組參數進行近似。TD(λ)資格跟蹤也可用于評論者估計不同時間步長的值。有趣的是,MC(高方差)和TD方法可以與行為人一起使用,隨著時間的推移(即收集的經驗)修改策略。

由于MDO涉及軍事任務,RL算法必須有能力與許多其他智能體協調,以實現最佳的戰略機動,因此MAS的算法必須能夠與大量的智能體和異質資產一起擴展。算法的另一個重要能力是處理復雜狀態空間(即許多智能體)和多領域環境的大量觀察能力。在接下來的章節中,我們將討論在MDO中使用不同種類的RL算法對戰略機動的影響。

無模型算法可分為非策略性和策略性算法,其中狀態行動空間可以是連續的或離散的。在這一節中,討論了無模型算法的優勢和劣勢,以及它們如何與戰略機動相一致,從而實現MDO的目標。這一分析的目的是為尋找在MDO環境中實現戰略機動性的潛在算法方法提供方向。

4.1 深度Q網絡(DQN)

深度Q網絡(DQN)是一種單一的RL智能體算法,它被訓練用來玩行動空間離散、狀態空間連續的Atari 2600游戲。DQN使用一個用Q-learning訓練的卷積神經網絡,從高維輸入(連續圖像)中學習。

DQN算法是一種有效的樣本方法,因為它利用所有收集到的經驗來提取盡可能多的信息。DQN足夠強大,可以使用相同的超參數進行訓練,玩六種不同的Atari游戲,其中智能體在其中三個游戲中的表現比人類專家更好。

然而,DQN的一個缺點是,在理論上不能保證訓練好的神經網絡實現穩定的Q值預測(即在不同的獨立模型中,訓練好的策略可能會有很大的差異)。

鑒于DQN本質上是一個單一的RL智能體模型,它應該不足以在MDO中進行戰略機動。在MDO中,多智能體RL算法可能更適合,因為智能體在執行時間內典型的分散化,允許智能體彼此獨立運作。此外,DQN的原始實現只利用了四個觀察序列來學習Q值,這對于MDO中的戰略機動來說是不夠的。多個資產的戰略機動通常不能在如此短的時間間隔內被捕獲。事實上,這是DQN在評估的三個Atari游戲(即Q*bert、Seaquest和Space Invaders)中與人類相比表現不好的主要原因。然而,存在一些DQN的變體來解決這個問題和其他弱點。

Bootstrap DQN就是這樣一個變體,它學習了一個Q網絡的集合,以提高采樣效率,并克服了傳統DQN的不足之處。行動消除是另一種與DQN一起使用的方法,以解決大的行動空間。帶有記憶類型的DQN(即循環神經網絡)也可以用來處理部分可觀察性。如果一個智能體需要為完成任務而導航環境,這種方法就特別有用。另外,分布式DQN返回一個分布信息,可用于評估策略風險和減少最佳解決方案周圍的方差或噪音。

盡管DQN及其修改后的變體在處理比簡單的Atari游戲更復雜的任務方面很有前途,但DQN方法本質上缺乏一個多智能體預測機制來進行協作戰術,而這是MDO中戰略機動的需要。此外,DQN在大多數情況下計算量太大,無法用于軍事相關環境。最后,DQN算法方法對未見過的例子(例如,伙伴的新行為或環境中出現的實體/障礙)缺乏足夠的適應性。

4.2 深度確定性策略梯度(DDPG)

在現實世界中,大多數常規任務涉及連續狀態和行動空間。然而,DQN只考慮離散的狀態空間和低維的行動空間。處理連續狀態和行動空間的DQN的另一種方法是深度確定型策略梯度(DDPG)方法。DDPG通過結合價值函數近似和確定性策略梯度(DPG),推進了DQN方法的進展。DDPG利用行為批判的方法,可以克服連續空間的復雜性。這種無模式、非策略預測和控制算法可以執行物理控制任務(如車桿、靈巧的操縱、腿部運動或汽車駕駛)。

另一種使用深度神經網絡的方法是信任區域策略優化(TRPO)。這種方法直接構建一個隨機策略,而不需要演員-評論者模型(不要與環境模型混淆,這將使其成為一種基于模型的方法)。與TRPO類似,引導式策略搜索(GPS)不需要角色評論模型,而是使用軌跡引導的監督式策略學習以及一些額外的技術(例如,減少視覺特征的維度,在網絡的第一層增加機器人配置動態的信息)。因此,GPS的數據效率很高,如果需要的話,可以改編成DDPG。另一方面,PILCO首先學習一個概率模型,然后找到一個最佳策略。PILCO在某些問題領域具有很高的數據效率;然而,它的計算量很大。此外,D4PG對DDPG算法提出了一些改進:分布式評論者更新、分布式并行演員、N步返回和經驗重放的優先級,以實現對不同類別任務的更穩定和更好的解決方案。

從戰略機動的角度來看,DDPG算法的主要缺點是它被設計成一個完全分散的單一智能體算法(即獨立學習者)。因此,DDPG算法不便于在多智能體場景中進行協作。因此,使用DDPG所產生的戰略機動將不會產生協作的團隊行為。此外,DDPG不具備處理基于角色的多目標任務的能力,而這是軍事行動中戰略機動的要求。

4.3 多智能體深度確定性策略梯度(MADDPG)

RL智能體互動對于戰略機動的人工智能系統至關重要,不同的智能體可能需要組成團隊來抑制對手的戰略合作或抑制對手的協調。Q-Learning和PG方法分別受到非平穩性和高方差的影響。為了克服這些問題,多智能體深度確定性策略梯度(MADDPG)算法擴展了一個演員評論家方法,這使得它可以通過集中智能體訓練而對多智能體系統發揮作用。MADDPG框架采用集中式評論家家進行訓練,并在測試期間部署分散的演員。一個評論者(每個智能體都有一個)接收每個智能體的策略,這允許開發具有潛在不同獎勵功能的依賴性策略(例如,MADDPG允許訓練具有相反獎勵功能的對抗性團隊)。相反,演員(即策略網絡)在訓練和測試期間只擁有本地知識。演員(通過訓練)在與評論者評價一致的方向上反復改進策略。

MADDPG的一個主要弱點是,對Q函數的輸入隨著環境中智能體數量的增加而增加(不可擴展)。這給MDO中的戰略機動性帶來了問題。如果智能體需要被替換、添加、修改或移除,可能需要進行再訓練。在戰略機動中,智能體可能需要定期轉換角色或改變能力,這對MADDPG適應軍事領域構成了重大挑戰。此外,頻繁的再訓練將使快速戰略機動變得不可能。縮短訓練時間將減少邊緣的計算負荷,使快速戰略機動成為可能。MADDPG不能適應這種極端情況。對于軍事應用,希望有一個強大的對手或智能體模型,以便使作戰時間最大化(即有足夠的時間來執行戰略機動)。

為解決其可擴展性問題,對MADDPG的一個潛在修改是形成智能體集群,為集群而不是每個智能體單獨學習一個策略。在發生新事件的情況下,可以推遲重新訓練的需要,因為從理論上講,一個智能體集群將有一套處理動態情況的可變能力。此外,這將避免隨著智能體的修改或新智能體的引入而增加Q函數的輸入空間。然而,問題來了。我們怎樣才能將一個任務分解成部分獨立的子任務,并使最優分組策略的退化程度最小?

雖然MADDPG可以形成一組異質的多智能體策略,能夠完成不同的任務,但這種方法不能很好地擴展到十幾個智能體。隨著智能體數量的增加,策略梯度的方差會呈指數級增長。因此,這種方法不太適合MDO中的戰略機動,在這種情況下,必須考慮到40多個異質智能體的對抗情況。克服這一可擴展性問題的方法是均值場多智能體RL算法,該算法計算鄰近智能體Q值的均值估計,當智能體之間的鄰近互動變得復雜時,可能導致高誤差率。此外,進化種群課程算法的設計是為了通過將遺傳算法方法與RL相結合,使MADDPG具有可擴展性。隨著MADDPG的進步和該方法所顯示的成功,可以想象這些算法的進步會導致在模擬實驗中對MDO內的戰略機動性進行強有力的演示。

與MADDPG不同的是,反事實多智能體(COMA)方法對所有智能體使用一個集中的評論家,但被設計用于離散的行動空間。COMA比MADDPG更具可擴展性,但它可能導致一套同質的策略,在智能體能力充分不同、局部目標不同或獎勵函數不同的情況下可能失敗。與MADDPG類似,Minmax多智能體DDPG(M3DDPG)比MADDPG的原始版本增加了一項改進,允許智能體制定更穩健的策略來對抗對手(即具有對立獎勵結構的競爭游戲)。然而,M3DDPG仍然無法處理異質智能體被引入系統的情況。

在具有連續狀態和行動空間的環境中實施算法,有時需要利用常見的技術來操作輸入或輸出,如離散化狀態和行動空間或將離散的策略輸出轉換為連續輸出。轉換策略輸出的一個例子是OpenAI多智能體粒子環境中MADDPG的實現。在這個例子中,離散的策略組件被用來計算連續的行動。從另一個角度來看,多智能體轉化器軟雙Q學習算法將連續行動空間離散為一組速度和角速度控制,然后可以在運動模型中使用。盡管這些技術允許在連續環境中使用這種算法,但這些算法方法沒有用連續信息進行訓練,這可能會限制它們在物理環境中進行戰略機動的功效。

4.4 價值為本

最近的一個基于價值的MARL算法系列在非常復雜的《星際爭霸2》模擬環境中被證明是相當成功的,其中根據智能體的本地Qa值學習了一個集中的聯合行動值Qtot。然后通過線性argmax算子從Qa中提取一個分散的策略。這種非常簡單而有效的分解方法避免了學習聯合行動值,而聯合行動值的規模并不大。如果增加新的智能體或用新的能力替換智能體,仍需進行再訓練。然而,與MADDPG相比,它更具有可擴展性,因為單個Q值僅從局部觀察中學習,避免了通過學習因子化的Qtot來學習聯合行動值。但是,當有超過40個智能體時,這個系列的算法的可擴展性可能會受到挑戰。為了使其更具可擴展性,已經提出了基于角色的算法RODE,其中智能體的角色是根據他們對環境的影響對他們的行動進行聚類來確定。該算法對于大量的智能體顯示了非常有希望的結果。

對于戰略機動,RODE算法是非常有前途的,因為各組智能體可以被分配到不同的角色,其中角色可以基于他們的行動和對環境的影響或任何其他固定的行為(對于盟友或甚至敵人)。然后,該算法可用于不同群體的戰略角色轉換。由于不同角色的行動空間受到限制,該算法收斂得非常快。這種算法也適合于基于角色的技術的戰略使用,這可能會在未來的工作中進行研究。即使RODE是非常可擴展的,我們也不清楚當新的智能體將被添加到環境中時如何調整它;需要學習一個集中的策略以實現最佳協作。

與RODE算法相比,一種可擴展的多智能體強化學習方法部署了一種熵-規則化的非策略方法來學習隨機價值函數策略,實驗表明它能夠擴展到1000多個智能體。如前所述,可擴展的RL算法關注環境的復雜性--系統或團隊中的智能體越多,狀態空間越大。RODE是有限的,因為它使用一個集中的策略,當更多的智能體被引入到環境中時必須重新訓練。多智能體轉化器軟雙Q學習算法是一種集中訓練的非策略學習算法(即共享一個中央經驗重放緩沖器),其執行是分布式的(即每個智能體根據其本地觀察做出自己的控制決定),而不是來自中央控制器。由于這種分布式的方案,當智能體被添加或從系統中移除時,團隊不受影響,繼續執行他們的策略。

在可擴展性方面,訓練大型MAS(即許多智能體)是很困難的,而且已經表明,即使是最先進的算法也不能為復雜的MARL任務學習到高性能的策略。多智能體變換器軟雙Q學習通過在訓練期間利用啟發式方法緩解了這一可擴展性問題,該方法允許在較小的智能體集合上訓練策略(例如,在目標追蹤場景中,四個智能體追蹤四個目標),并且該策略已被證明可以在執行中與更多的智能體一起工作而不需要任何調整(即用1000個智能體測試和評估)。訓練和執行過程中使用的啟發式方法使算法能夠解決智能體數量的巨大分布變化:它基本上將測試時的大型復雜觀察空間縮減為接近智能體策略最初訓練的內容。從軍事角度看,這種提法是戰略機動的理想選擇,因為現場的智能體可能會在原地丟失或獲得,可能要考慮額外的戰略信息。一個靈活和可擴展的算法提供了MDO中所需要的能力。

5. 洞察力和結論

由于一些因素,包括科技進步,美國的對手正在變得更加先進。在未來的MAS自主戰爭中,協作的戰略機動可以為國防軍帶來某些優勢。在這篇文章中,我們討論了一些最突出的RL算法,以發現訓練MAS的可行候選策略,這些MAS可以有效地進行戰略機動,從而在未來潛在的軍事行動中打開機會之窗。本文描述了RL方法的分類法,并對最突出的RL算法進行了概述。研究發現,由于訓練和測試因素的不同,大多數RL算法缺乏處理與未來潛在沖突相關的復雜性的能力。

DEVCOM ARL ERPs為開發和實施智能MAS提供了一個規劃性的路徑。鑒于陸軍研究項目為美國國防行動提供了關鍵研究問題的答案,AIMM和EOT ERPs特別促成了研究,可以為協作的自主MAS提供一個路徑,可以克服與1)環境,2)對手戰術和能力,3)自身能力(即,獲得新的能力,失去以前的能力,或能力被改變),4)團隊組成(例如,增加、刪除或交換隊友),5)戰略團隊定位、進入、導航(機動)以支持部隊并壓倒對手,以及6)任務目標。最近,AIMM和EOT ERP在這一領域的工作闡明了衡量MAS協調性的方法,并允許開發一個框架來訓練和測試執行各種任務的MAS的協調性,此外還評估了利用一系列集中訓練技術的新算法方法。

此外,還需要進行更多的調查,以闡明有利于在ISTAR任務和其他交戰場景中利用MAS的軍事戰略。在淺顯的情況下,將完全自主的MAS送入高風險情況(即預期因果率高的情況)是可取的;然而,由于目前的技術限制,僅僅期望MAS能夠在沒有人類監督或干預的情況下完成任務是不夠的。因此,在未來的工作中,將進行研究以確定一套強有力的交戰方案。最后,這項工作將導致自主MAS的最終整合,以便在未來的軍事行動中盡可能地協調戰略機動。

付費5元查看完整內容

先進作戰管理系統(ABMS)是美國空軍創建下一代指揮和控制(C2)系統的最新計劃項目。ABMS建議使用云環境和新的通信方法,使空軍和太空部隊系統能夠使用人工智能無縫共享數據,以實現更快的決策。空軍將ABMS描述為其創建物聯網的努力,這將使傳感器和C2系統相互分解(與空軍傳統上執行C2的方式相反)。該計劃是空軍對國防部全域聯合指揮與控制(JADC2)工作的貢獻,重點是使國防部的作戰決策過程現代化。

ABMS最初的設想是取代目前指揮空戰行動的E-3機載預警和控制系統(AWACS)(圖1),但后來有了更廣泛的范圍。前空軍負責采購的助理部長威爾-羅珀指示,該計劃應減少對指揮中心和飛機的關注,而是創造數字技術,如安全云環境,在多個武器系統之間共享數據。羅珀博士表示,2018年國防戰略所設想的有爭議的環境迫使空軍重組ABMS項目。2021年5月,空軍副參謀長大衛-奧爾文將軍在DefenseOne的一篇文章中說:"ABMS究竟是什么?它是軟件嗎?硬件?基礎設施?策略?答案是都是"。換句話說,空軍將ABMS設想為一個采購項目,它既要采購東西,又要實施其他非開發性的工作,該部門認為這些工作同樣重要:指揮和控制空軍的新技術。

自ABMS成立以來,國會已經對下一代C2系統的發展表示了興趣。空軍表示,ABMS是一個非傳統的采購項目。因此,國會對空軍替換老舊系統的方法和試驗新興技術的方法提出了質疑。

ABMS的開發工作

迄今為止,空軍已經進行了五次活動,以展示其希望最終投入使用的新C2能力。2019年12月,空軍在其第一次ABMS "on-ramp"(空軍用來表示演示的術語)中,展示了從陸軍雷達和海軍驅逐艦向F-22和F-35戰斗機傳輸數據的能力。這次活動還展示了空軍的統一數據庫(UDL),這是一個結合天基和地基傳感器追蹤衛星的云環境。

2020年9月,ABMS進行了第二次"on-ramp"。這第二次上線演示了通過使用超高速武器作為防御手段,探測和擊敗一個飛向美國的模擬巡航導彈。此外,ABMS還展示了 "探測和擊敗破壞美國太空行動的手段"的能力。根據空軍的新聞稿,"70個工業團隊和65個政府團隊 "參加了這次活動。

空軍在2020年9月下旬舉行了第三次"on-ramp",以支持珍珠港-希卡姆聯合基地的 "勇敢之盾 "演習。在這次活動中,空軍展示了使用KC-46加油機通過將數據從較老的第四代戰斗機轉發到較新的第五代飛機,如F-22,來執行戰術C2。2021年5月,空軍表示,為KC-46采購通信吊艙將是ABMS項目的第一個能力發布。空軍說:"在戰斗中,無論如何,郵機將需要在作戰附近飛行,支持戰斗機,因此將它們作為指揮和控制系統,無論是作為主要的還是彈性的備份,都是有意義的。"

2021年2月在歐洲舉行了第四次"on-ramp"。根據新聞稿,空軍由于預算限制而減少了這次活動規模。這第四次將包括荷蘭、波蘭和英國在內的盟國聯系起來,進行聯合空中作戰。據美國駐歐洲空軍司令哈里根將軍說,這第四次活動測試了美國和盟國用F-15E飛機發射AGM-158聯合空對地對峙導彈(JASSM)執行遠程打擊任務的能力(見圖2),同時利用美國和盟國的F-35飛機執行空軍基地防御任務。

本預計2021年春季進行第五次"on-ramp"在太平洋地區,但由于預算限制,取消了這次活動。

GAO的報告建議

2019財年國防授權法案(NDAA)指示政府問責局(GAO)評估ABMS計劃。在2020年4月的一份報告中,GAO向空軍總設計師建議采取四項行動來提高項目績效。

1.制定一個計劃,在ABMS開發領域需要時獲得成熟技術。

2.制作一個定期更新的成本估算,反映ABMS的實際成本,每季度向國會匯報一次。

3.準備一份可購性分析,并定期更新。

4.正式確定并記錄參與ABMS的空軍辦公室的采購權力和決策責任。

空軍助理部長同意了所有的建議。前空軍參謀長David Goldfein將軍不同意這些建議,他指出GAO的分析沒有反映機密信息。美國政府問責局表示,它可以接觸到機密信息,這些額外的信息并不影響其分析和建議。

ABMS的管理結構

根據GAO關于ABMS的同一份報告,空軍最初確定由空軍總設計師(普雷斯頓-鄧拉普),來協調空軍每個項目執行辦公室的ABMS相關工作。GAO對這種管理結構可能導致ABMS缺乏決策權表示擔憂。然而,在2020年11月,羅珀博士選擇空軍快速能力辦公室作為ABMS項目執行辦公室。首席架構師辦公室繼續開發全軍的架構(即軟件和無線電如何能夠相互連接),以支持ABMS。

國會就AMBS采取的行動

國會已經對ABMS系統的發展表示了興趣。下面的清單總結了國會在前三個NDAA中的行動:

  • 2019財政年度NDAA(P.L. 115-232):

    • 第147節:限制E-8 JSTARS飛機退役的資金可用性
  • 2020年國防部(P.L. 116-92):

    • 第236節:與先進戰斗管理系統有關的文件
  • FY2021 NDA (P.L. 116-283) :

    • 第146節:移動目標指示器要求和先進戰斗管理系統能力的分析
    • 第221節:與先進戰斗管理系統有關的問責措施

2021財年國防撥款法案(P.L. 116-260 C分部)將ABMS的資金從要求的3.02億美元減少到1.585億美元,理由是 "不合理的增長和預先融資"。

在ABMS的整個發展過程中,國會對在確定合適的替代物之前退役舊的C2系統如JSTARS和AWACS表示關注。國會還指示空軍制定傳統的采購理由,如成本估算和需求文件,以確保國會和軍方都了解要采購的東西。這些行動反映了美國政府問責局的建議。

關于國會的潛在問題

  • 使用ABMS方法分解指揮和控制的風險是什么?

  • 空軍應如何平衡創新、實驗與采購成熟技術?

  • ABMS提供了哪些傳統指揮與控制系統無法提供的機會?

  • 利用6.8軟件和數字技術試點計劃預算活動代碼中的新預算授權靈活性,ABMS是否會受益?

付費5元查看完整內容

總結

美國防部(DOD)正在對其指揮軍事力量的方法進行現代化改造。國防部高級領導人已經表示,現有的指揮和控制架構不足以滿足2018年國防戰略(NDS)要求。全域聯合指揮與控制(JADC2)是國防部的概念,將所有軍種--空軍、陸軍、海軍陸戰隊、海軍和太空部隊的傳感器連接到一個網絡中。

DOD指出,用Uber共享服務來比喻其對JADC2的期望最終狀態。Uber結合了兩個不同的應用程序--一個是乘客,另一個是司機。使用各自的位置,Uber算法根據距離、旅行時間和乘客(以及其他變量)來確定最佳匹配。在JADC2的情況下,這種邏輯將找到攻擊特定目標的最佳武器平臺,或應對新出現威脅的最佳單位。為了使JADC2有效工作,DOD正在追求三種新的或新興的技術:自動化和人工智能、云環境和新的通信方法。

DOD的一些機構和組織參與了與JADC2相關的工作。下面的清單突出了與JADC2開發有關的部分組織和項目:

  • 國防部首席信息官:第五代(5G)信息通信技術。

  • 國防部長辦公室(研究與工程):全網絡化指揮、控制和通信(FNC3)。

  • 國防高級研究計劃局:馬賽克戰爭。

  • 空軍:高級戰斗管理系統(ABMS)。

  • 陸軍:項目融合(Project Convergence)。

  • 海軍:項目超配(Project Overmatch)

隨著國防部開發指揮和控制軍事力量的新方法,國會可能會考慮幾個潛在的問題:

  • 國會如何在驗證需求或成本估算之前考慮JADC2的相關活動?

  • 在沒有正式的計劃或預算申請的情況下,國防部為JADC2的預算是多少?

  • JADC2的支出重點是什么,是否有國防部可能沒有投資的舉措?

  • 國防部如何確保每個軍種和盟國的通信系統之間的互操作性?

  • 國防部應如何優先考慮其未來網絡中相互競爭的通信需求?

  • 人工智能將在未來的指揮和控制決策系統中發揮什么作用?

  • 為了滿足JADC2的要求,有哪些潛在的部隊結構變化是必要的?

  • 國防部應如何管理與JADC2相關的工作?

1 什么是JADC2

全域聯合指揮與控制(JADC2)是美國國防部(DOD)的概念,即把所有軍種--空軍、陸軍、海軍陸戰隊、海軍和太空部隊的傳感器連接成一個網絡。傳統上,每個軍種都開發了自己的戰術網絡,與其他軍種的網絡不兼容(例如,陸軍網絡無法與海軍或空軍網絡連接)。通過JADC2,國防部設想建立一個 "物聯網"網絡,將眾多傳感器與武器系統連接起來,利用人工智能算法幫助改善決策。

DOD官員認為,未來的沖突可能需要領導人在幾小時、幾分鐘或可能幾秒鐘內做出決定,而目前分析作戰環境和發布命令的過程需要數天時間。國防戰略(NDS)委員會報告的非保密概要指出,目前的C2系統與潛在的同行競爭對手相比已經"惡化"。國會可能對JADC2概念感興趣,因為它正被用來制定許多高調的采購計劃,以及確定美國軍隊對潛在對手的有效性和競爭力。

圖 1. JADC2 的概念愿景

JADC2設想為聯合部隊提供一個類似云的環境,以共享情報、監視和偵察數據,在許多通信網絡中傳輸,從而實現更快的決策(見圖1)。JADC2打算通過收集來自眾多傳感器的數據,利用人工智能算法處理數據以識別目標,然后推薦最佳武器--包括動能和非動能武器(如網絡或電子武器)--來打擊目標,從而幫助指揮官做出更好的決策。

DOD指出,用Uber共享服務作為類比來描述其對JADC2的期望最終狀態。使用各自的位置,Uber算法根據距離、旅行時間和乘客(以及其他變量)來確定最佳匹配。然后,該應用程序為司機提供指示,讓他們按照指示將乘客送到目的地。Uber依靠蜂窩和Wi-Fi網絡來傳輸數據,以匹配乘客并提供駕駛指示。

一些分析家對JADC2采取了更加懷疑的態度。他們對JADC2的技術成熟度和可負擔性提出了疑問,以及是否有可能在一個致命的、充滿電子戰的環境中部署一個能夠安全可靠地連接傳感器和射手并支持指揮和控制的網絡。分析人士還詢問誰將擁有跨領域的決策權,因為傳統上,指揮權是在每個領域內而不是從整體戰役的角度下放的。

什么是指揮與控制?C2的維度和人工智能的影響
人們可以通過五個問題來看待指揮和控制:誰、什么、何時、何地和如何。傳統上,國會通過兩個不同但相關的問題來關注指揮與控制:權力("誰")與技術("如何")。
國會傳統上關注的第一個問題反映了指揮官執行行動的權力。這一討論的重點是指揮系統,反映了負責組織、訓練和裝備美國部隊的軍種與有權在國外使用部隊的作戰司令部之間的差異。這個問題可以用一個問題來概括:"誰指揮部隊?"
第二個問題是使指揮官能夠做出這些決定并將其傳遞給戰場的技術方面。指揮、控制、通信(C3)、C3加計算機(C4)以及情報、監視和偵察(ISR)等術語進入了討論。指揮和控制的這一技術問題著眼于指揮官用于決策的數據(和收集方法)(即ISR是促成決策的數據),將數據轉化為信息的處理能力,以及使指揮官將其決策傳達給地理上分布的部隊系統。這種指揮和控制的技術方法可以概括為:"你如何指揮部隊?"
指揮和控制的其他動態回答了其他問題:哪些系統和單位被指揮(什么),時間方面(何時),以及地理方面(何處)。國會在歷史上對這些問題中的每一個都是在具體的,而不是一般的問題上表示了興趣。例如,國會沒有考慮一般用途的部隊,而是關注與核部隊和特種作戰相關的權力問題。與核和網絡戰的快速反應相關的指揮和控制問題,以及在有限的程度上與電磁頻譜戰相關的問題,這些都是及時性問題,引起國會關注的其他領域。
關于 "何時",國會已表示對與核和網絡戰的快速反應有關的指揮和控制感興趣,并在有限的程度上對電磁頻譜戰感興趣。然而,對 "何時"的最大敏感度似乎更側重于戰術(例如,何時讓飛機進入目標,何時開始對建筑物進行攻擊);這些決定往往被授權給指揮官。最后,地理因素對指揮美軍提出了獨特的挑戰;只要行政部門和國會繼續支持全球國家安全戰略,地理決策在很大程度上代表了戰術問題,往往被授權給各個指揮官。
圖2. 指揮與控制的維度和人工智能的影響
圖2描述了這些問題是如何通過引入人工智能(AI)來優化各方面的結果。隨著編隊復雜性的增加--特別是為全域聯合作戰設計的編隊,控制這些部隊有可能超越人類的認知能力,并使用算法來幫助管理這些部隊。美國軍方表示,它打算讓人類參與整個決策過程,但隨著美國軍隊將更多的人工智能技術引入其決策機構,各方面的區別開始變得模糊不清。例如,"誰"和 "如何"開始變得相似,特別是當計算機或算法向指揮官提出建議時,他們可能不了解信息或產生建議的過程。
人工智能還可以影響指揮和控制的其他方面,包括 "什么"、"什么時候 "和 "在哪里"。將 "什么 "和 "哪里 "這兩個要素結合起來,可以挑戰對手尋找和與美國部隊交戰的能力;這樣做也可以挑戰指揮官及其參謀部在沒有系統幫助管理復雜情況下保持對部隊的控制能力。從 "何時 "的角度來看,需要快速決策的行動,特別是電磁頻譜戰或網絡戰,可能超過人類的決策能力。這就提出了一個重要的問題,即指揮官能在多大程度上信任人工智能,以及人類作戰員需要理解人工智能系統為什么建議采取特定行動。

2 為什么要改變當前的 C2 結構?

DOD目前使用戰斗空間的不同部分來執行C2--主要是沿著確定的軍事領域:空中、陸地、海上、太空和網絡空間。這種結構的存在是因為傳統的威脅來自單一系統,如飛機和坦克編隊。作為回應,軍方開發了高度復雜(但昂貴)的傳感器來監視戰斗空間,向集中式指揮中心(如空中作戰中心或陸軍指揮所)提供信息。E-3高級預警和指揮系統(AWACS)和E-8聯合監視目標攻擊雷達系統(JSTARS)等系統經過優化,為這些中央前哨的指揮官提供態勢感知,然后他們可以在那里指揮軍事力量。

2018年國防戰略(NDS)、審查它的 NDS 委員會和其他來源闡述的未來作戰環境描述了潛在對手如何發展復雜的反介入/區域拒止 (A2/AD) 能力(見圖 3)。這些能力包括電子戰、網絡武器、遠程導彈和先進的防空系統。 美國競爭對手將 A2/AD 能力作為對抗美國傳統軍事優勢(例如投射力量的能力)的一種手段,并提高他們贏得快速、決定性交戰的能力。

圖 3. A2/AD 環境的可視化

美國防部高級領導人已經表示,在未來的作戰環境中,獲取信息將是至關重要的。此外,這些領導人還表示,為了挑戰潛在的同等對手,需要采取多領域的方法(美國部隊將使用地面、空中、海上、太空和網絡力量來挑戰對手的目標計算)。因此,全領域聯合作戰的概念為指揮官提供了獲取信息的機會,可以利用突襲進行同步和連續的行動,并在所有領域快速和持續地整合能力,從而獲得物質和心理優勢以及對作戰環境的影響和控制。

空中陸戰概念設想將空軍和陸軍的努力結合在一起,在20世紀80年代對抗蘇聯,自該概念提出以來,技術上的進步使美國防部能夠繼續發展全領域聯合作戰的概念。這些技術進步包括增加了攻擊目標的方法(包括電子和網絡手段),相對低成本的傳感器的擴散,以及將這些傳感器的數據轉化為信息的處理能力的提高。維持對所有領域行動的控制所面臨的挑戰是,美國的軍事C2機構并不是為做出這些類型的決定而組織的,26而且正在使用的技術的復雜性和速度可能超過人類的認知能力。

指揮與控制是如何演變的?
美軍傳統的指揮和控制概念源于德軍的 "任務型命令"(auftragstaktik)。認識到軍事行動中的混亂和 "戰爭迷霧 "是不可避免的,下級指揮官被委托半自主地行動以實現其指揮官的意圖(即任務的總體目標),而不是有預先規定的行動。情報來源和偵察的信息需要很長的時間,甚至可能需要幾天才能到達指揮官手中。為了保持對部隊的控制,指揮官們依靠無線電通訊和紙質信件。有限的信息量使得指揮官可以在兩個方面指揮部隊--使用單一的領域來應對對手的行動。
在冷戰的高峰期,蘇軍給軍事力量提出了一個新的問題:如何對抗一支數量上占優勢的坦克部隊。為了應對這一威脅,陸軍和空軍提出了一種新穎的方法,通過開發新技術來確定增援地點,將空中和陸地力量結合起來。這一概念被稱為 "空地戰"。這種三維方法試圖利用情報、監視和偵察方面的優勢,"深入觀察",將火力集中打擊增援部隊(即 "深入打擊")。為了支持這種利用深度打擊來防止增援部隊的設想,美軍需要改進指揮所,以提高指揮部隊的決策速度,同時仍然保持遵循指揮官意圖的傳統。這種需要導致了新系統的開發,如JSTARS和ATACMS。這些系統使指揮官能夠更快地了解戰斗空間,并提高對敵軍直接開火的反應時間。
在過去的20年里,中國和俄羅斯觀察了美國的戰爭方法,確定了挑戰美國優勢的不對稱方法。中國的軍事現代化尤其注重防止美國建立大量的戰斗力(限制后勤),增加高價值飛機(油輪、間諜飛機、指揮和控制飛機)的風險,并增加其海軍足跡(限制美國的海軍優勢)。為了應對這些新威脅,國防部最初提出了使用多域作戰的想法(后來過渡到全域作戰一詞)。國防部認為,使用一個或甚至兩個維度來攻擊對手是不夠的,因此挑戰對手的目標計算需要更復雜的編隊(額外維度)。國防部認為,不斷增加的復雜性,加上應對新興技術威脅的時間可能減少,需要新的方法來管理部隊。
圖4. 指揮和控制的復雜性的變化

3 JADC2-賦能技術

在國防部發展JADC2概念的過程中,有三類技術在這種指揮和控制軍事力量的方法中起著不可或缺的作用:自動化、云環境和通信。

3.1 自動化與人工智能

許多DOD高級領導人已經明確表示,JADC2是一個概念(或許是一個愿景),而不是任何具體的計劃。在2021年1月的一篇文章中,聯合人工智能中心主任Michael Groen中將說:"JADC2不是一個IT(信息技術)系統,它是一個作戰系統。從歷史上看,你會有一個大型的國防項目,你會花數年時間來完善需求,你會收集大包大包的錢,然后你會去找國防承包商,花更多的時間來建造、測試,然后在多年后最終投入使用"。在這篇文章中,Groen中將描述了人工智能(AI)的作用,以及延伸到數據和數據結構的作用,使這些算法能夠為指揮官提供信息。根據Dennis Crall中將(聯合參謀部指揮、控制、通信和計算機/網絡首席信息官[JS J6]主任)的說法,人工智能和機器學習對于實現JADC2至關重要。Dennis Crall說道:"JADC2是關于將所有這些自動化....。它是關于利用傳感器豐富的環境--查看數據標準等事情;確保我們可以將這些信息轉移到一個我們可以正確處理的區域; 帶來了云;帶來了人工智能、預測分析;然后用一個能夠處理這些的網絡來支撐所有領域和合作伙伴。"

3.2 云環境

DOD表示,擁有多分類的云環境對于實現JADC2是必要的。DOD設想,用戶能夠根據他們的需要和信息要求,在不同的分類下訪問信息。在2021年6月的新聞發布會上,克拉爾中將說,"戰術邊緣 "的云能力是用于數據存儲和處理,實現人工智能算法。作為一個例子,空軍討論了其高級戰斗管理系統(ABMS)項目對云環境的需求--空軍部對JADC2的貢獻,這將在下文討論。根據空軍的預算說明,ABSM將需要一套云系統、應用程序(即軟件)和網絡(包括商業和政府擁有的),這將 "了解環境并應用由人工智能和機器學習輔助的先進算法"。

3.3 通信

根據DOD的說法,開發JADC2將需要新的通信方法。DOD目前的通信網絡已經為中東地區的行動進行了優化。因此,DOD使用衛星作為與海外部隊通信的主要方法。這些系統面臨著延遲(時間延遲)問題,并且在設計上不能在有電子戰的情況下有效運行。這些舊的架構依賴于地球同步軌道上的衛星,這些衛星在地球上空大約22200英里(35800公里)處運行。新的應用,如人工智能,將有可能需要額外的數據速率,而目前的通信網絡可能無法支持--特別是當DOD增加傳感器的數量,以提供額外的數據來改進算法。自主系統的引入,如海軍的大型無人水面和海底航行器,以及陸軍對機器人飛行器越來越感興趣而產生的系統,可能需要安全的通信和短時延來維持對這些系統的控制。

4 目前開展的JADC2相關工作

聯合參謀部是負責制定全域聯合指揮與控制概念戰略的國防部組織。此外,還有一些正在進行的研究和努力與JADC2概念有關。每個軍事部門(陸軍、海軍、空軍)以及國防部機構,如國防高級研究計劃局(DARPA)和負責研究和工程的國防部副部長辦公室(OSD[R&E]),都在開發技術和概念。以下各節簡要介紹一些組織的工作。

4.1 聯合參謀部 J6:JADC2 戰略

國防部負責制定JADC2戰略的領導機構是聯合參謀部J6指揮、控制、通信和計算機/網絡局。JADC2戰略最初的設想是改善聯合部隊的互操作性(例如,確保無線電系統能夠相互通信),后來擴大了這一重點,制定了一種信息共享方法,通過為決策提供數據來實現聯合行動。除了制定戰略,J6還組織了一個JADC2跨職能小組,各軍種和國防部機構通過該小組協調他們的實驗和計劃。這與國防部數據戰略和國防部副部長創造數據優勢的努力相一致。該戰略確定了五條工作路線以實現JADC2框架:

1.數據組織

2.人力組織

3.技術組織

4.核指揮、控制和通信(NC3)

5.任務伙伴信息共享

在2021年6月4日的新聞發布會上,克拉爾中將表示國防部長奧斯汀已經批準了JADC2戰略。

4.2 OUSD研究與工程(R&E):完全網絡化的指揮、控制和通信(FNC3)

根據R&E辦公室的說法,"FNC3確定、啟動和協調指揮、控制和通信關鍵使能技術的研究、開發和降低風險活動。這些活動將包括整個國防企業不同但相互關聯的努力,由FNC3在OUSD(R&E)的工作人員監督和同步進行。" FNC3的主要負責人邁克爾-扎特曼博士描述了FNC3的整體愿景,包括三個層次--物理層、網絡層和應用層--它們為開發指揮、控制和通信系統提供了一種量身定做的方法,與商業部門的最佳實踐相一致。物理層代表無線電和發射器本身,而網絡層則通過開發國防部優化的新興商業軟件定義網絡技術(如網絡切片)來管理應用對物理層的訪問。所有這三層都旨在提高互操作性和彈性(即防止網絡被干擾或中斷的能力),并為每個應用提供適當的服務質量。

根據扎特曼博士的說法,FNC3是JADC2的中長期技術愿景,而每個部門(在以下章節中概述)都有專注于發展近期采購戰略的引人注目的努力。例如,空軍部的先進戰斗管理計劃旨在通過關注成熟技術在未來三年內部署。OUSD R&E利用其投資組合中不太成熟的技術,包括由DARPA、國防創新部門、戰略能力辦公室、各部門和其他部門開發的技術,為實施JADC2提供長期的技術手段。

4.3 DoD CIO:5G技術

國防部提出,5G無線技術的商業進展提供了傳輸更多數據(通常稱為數據吞吐量)和更低延遲的能力。國防部認為,它需要這些能力來處理來自眾多傳感器(如衛星、飛機、船只、地面雷達)的更多數據,并在 "邊緣"(與無線電接收器在同一地點)處理這些信息。5G技術的另一個方面可以實現新的指揮和控制概念,即動態頻譜共享。隨著電磁頻譜變得更加擁擠,聯邦政府已經開始允許多個用戶在同一頻段上運行(稱為頻譜共享)。國防部首席信息官認為,頻譜共享技術允許通信系統在有干擾的情況下傳輸和接收數據。2020年9月,國防部CIO向工業界發出了一個信息請求,即如何對待動態頻譜共享。2021年1月21日,已經公布了67份對信息請求的回應。

4.4 DARPA:馬賽克戰

馬賽克戰爭代表了一系列由DARPA贊助的項目,旨在利用人工智能將傳統上不被設計為互操作的系統和網絡相結合。從概念上講(見圖5),這些項目將能夠利用從衛星上收集的原始情報,并將這些數據轉化為傳遞給 "射手 "的目標信息--在這種情況下,網絡武器、電子干擾器、導彈、飛機或任何其他可能影響預期目標的武器。正如哈德遜研究所的分析家布萊恩-克拉克和丹-帕特所解釋的那樣,"馬賽克戰爭 "試圖將多種重疊的困境強加給敵軍,擾亂他們的行動,從而阻止他們及時到達目標。

圖5:DARPA的馬賽克戰愿景

DARPA的馬賽克計劃之一,稱為異質電子系統的技術集成工具鏈(STITCHES),已被用于空軍和陸軍的實驗。據DARPA稱,STITCHES是一種軟件,旨在通過自主創建允許低延遲和高吞吐量的軟件,快速整合任何領域的通信系統,而無需升級硬件或修改現有的系統軟件。根據空軍的一份新聞稿,該部門已在幾個高級戰斗管理系統的 "上線 "中測試了該技術,并已開始將該計劃從DARPA過渡到空軍部。

4.5 空軍部:高級戰斗管理系統(ABMS)

高級戰斗管理系統最初的設想是取代E-8聯合監視和目標攻擊雷達系統(JSTARS)。空軍在2019年將ABMS項目從開發飛機或雷達之類的東西過渡到 "數字網絡環境,連接所有領域和每個梯隊的作戰能力,以實現全球決策優勢。" 換句話說,空軍從建立一個支持指揮和決策的平臺(如E-8 JSTARS)轉向建立一個安全的、"類似云"的環境,利用人工智能和預測分析為指揮官提供近實時數據。根據空軍的說法,ABMS項目將沿著六條產品線開發能力:傳感器集成、數據、安全處理、連接、應用和效果集成。

空軍已經舉行了三次 "on-ramps"(空軍用來描述演示的術語),以展示其ABMS的方法。2019年12月舉行的第一次on-ramps,展示了該部門從F-22戰斗機使用的安全通信向陸軍和海軍系統傳輸數據的能力。第二次上線使陸軍榴彈炮能夠擊落一枚代用巡航導彈。此外,空軍向美國北方司令部提供了這種 "類似云 "的零信任平板電腦--一種不在設備上存儲敏感數據的安全功能,以協助其在2020年春季應對COVID大流行。

2020年11月,空軍部確定了首席架構師辦公室,負責評估架構上線和整合企業數字架構。同時,空軍確定空軍部快速能力辦公室為ABMS整合項目執行辦公室。快速能力辦公室的工作重點是快速向現場交付項目,它的參與可以被看作是將ABMS從實驗轉向系統開發。

4.6 陸軍部:項目融合(Project Convergence)

根據陸軍的說法,"項目融合是陸軍圍繞一系列連續的、結構化的演示和實驗而組織的新的學習活動",旨在應對JADC2所帶來的挑戰。

1.確保陸軍擁有合適的人員和人才;

2.將當前的陸軍現代化工作與陸軍未來司令部的跨職能團隊聯系起來,并與陸軍現代化的六個優先事項保持一致;

3.擁有合適的指揮和控制,以應對節奏越來越快的威脅;

4.利用人工智能分析和分類信息,并在陸軍網絡中傳輸;

5.在 "最嚴峻的地形 "中測試能力。

項目融合2020在三個軍事設施中使用了大約750名士兵、平民和承包商,最終在亞利桑那州的尤馬試驗場進行了兩次現場頂點演習。在這次演習中,陸軍展示了幾種技術,包括人工智能、自主性和機器人技術,以測試新的方法來指揮和控制地理上分散的部隊。陸軍計劃將空軍和海軍的系統作為2021年項目融合的一部分,并打算在2022年項目融合中納入外國軍隊。這其中有3370萬美元用于運營和維護,以及7310萬美元用于研究、開發、測試和評估,由陸軍撥款。

4.7 海軍部:項目超配(Project Overmatch)

項目超配是海軍為建立一個 "海軍作戰架構",將艦艇與陸軍和空軍資產聯系起來而做出的努力。2020年10月1日,海軍作戰部部長吉爾德伊上將責成一名二星上將領導海軍的"項目超配"工作。在他的備忘錄中,吉爾德伊上將指示 "項目超配"采取類似于海軍發展核動力和AEGIS系統的工程和開發方法。其主要目標是 "使海軍能夠在海上形成集群,從近處和遠處、每個軸線和每個領域提供同步的致命和非致命效果。具體來說,你[斯莫爾海軍司令]要開發網絡、基礎設施、數據架構工具和分析。" 在一個平行的努力中,吉爾德伊上將責成基爾比副上將(負責作戰要求和能力的海軍作戰部副部長)制定一項計劃,將無人系統,包括艦艇和飛機,納入海軍作戰架構。根據新聞聲明,海軍打算在2023年達到初始作戰能力(即有能力部署初始系統)。海軍在2022財政年度為 "項目超配 "申請了三個分類項目元素的資金。

在2021年6月舉行的2021年AFCEA西部會議上,吉爾德伊上將討論了項目超配目前的工作。在這次活動中,吉爾德伊表示,自2020年10月項目啟動以來,項目超配已經完成了三個螺旋式發展周期。吉爾德伊進一步解釋說:"我們實際上正在試驗一種方式,使我們基本上可以將任何網絡上的任何數據傳遞給作戰人員。這是一個軟件定義的通信系統,使我們能夠以一種前所未有的方式拆開我們所有的網絡"。根據新聞報道,吉爾德表示,他預計在2022年底或2023年初將 "項目超配"的測試規模擴大到一個航母打擊群。

5 國會面臨的潛在問題

以下各節討論了國會的潛在問題,包括需求和成本估算、互操作性挑戰、平衡通信能力、人工智能在決策中的角色,以及實施JADC2所需的潛在部隊結構變化。

5.1 需求和成本估算

美國防部已經為JADC2的相關工作申請了幾個財政年度的資金,特別是在概念的早期發展階段。國防部正在積極制定JADC2戰略,預計將在2021年春季發布。國會中的一些人對國防部沒有像傳統采購項目那樣提供成本估算或驗證需求表示關切。因此,各軍種委員會和撥款委員會已經減少了對這些工作,特別是ABMS和5G研究和開發的要求資金。2021財年國防授權法案(NDAA)要求國防部在2021年4月前為JADC2提出要求。

5.2 國防部對JADC2的潛在資助水平

國防部還沒有正式公布關于JADC2的支出預算數據,該項目在各軍種和國防機構的一些項目中都有資金。根據聯合參謀部J6(JS J6)的說法,JADC2不是一個記錄項目,JS J6也不打算過渡到一個記錄項目。因此,除非國會要求國防部提供JADC2資金的詳細概述,否則國防部可能不太可能這樣做。

一些分析家推測了與JADC2有關的所有項目的年度成本。一位分析家估計,國防部在2022財政年度為與JADC2直接相關的項目編列了大約12億美元的預算。Govini估計,自2017財政年度以來,國防部在JADC2上花費了大約225億美元;這平均每年大約為45億美元。Govini的估計包括其他聯邦機構的資金--如國家航空和航天局(NASA)--以及國防部可能認為與JADC2無關的技術,因此可能高估了JADC2獲得的資金總額。

5.3 JADC2支出優先級

根據JS J6,有五條與JADC2相關的工作線:

  • 1.數據組織

  • 2.人力組織

  • 3.技術組織

  • 4.核指揮、控制和通信(NC3)

  • 5.任務伙伴信息共享

以數據為中心的方法側重于國防部系統傳輸所需的數據類型和結構,創建一個共同的數據框架,為數據的發送和接收提供一個商定的標準。換句話說,數據的格式化、組織化和結構化的方式影響著數據從傳感器到決策者再到武器的高效和無縫傳輸。另一方面,網絡中心化和互操作性側重于通信標準,如無線電頻率、波形、通信加密等,以確保一個無線電能與另一個無線電通話。通過采用這種方法,JS J6專注于開發軟件應用,以改善指揮和控制。然而,該戰略可能缺少幾個方面,包括:

  • 通信系統的硬件和軟件的功能,

  • 網絡需要傳輸的數據量,

  • 對手的行動對網絡的影響,

  • 以及指揮和控制部隊的模塊化。

隨著國防部繼續改革其JADC2概念和要求,其他觀察家也注意到,在JADC2戰略中存在一些沒有被認定的領域,國防部應將其支出主要集中在研究和開發方面。一位觀察家認為,國防部應將其研發支出集中在改善網絡互操作性上。這種方法支持優先升級軍事通信系統,以便在整個聯合部隊中傳輸數據。它建議國防部在軟件和硬件方面投入更多資金,以提高所有類型的數據鏈路和網絡(例如,Link 16、多功能高級數據鏈路、態勢感知數據鏈路以及綜合海上網絡和事業服務)的互操作性。網絡互操作性方法的重點是,創建網絡是困難的;但是,利用軟件定義的網絡和通用電子設備(如類似的芯片架構)可以使每個軍種無縫共享信息。換句話說,這種方法更注重通信網絡的構建方式,而不是在這些網絡內發送數據的組織方式。軟件定義的無線電和網絡使無線電可以很容易地被編程,并因此更容易地相互通信。微電子(即物理硬件)最終定義了無線電的物理和軟件能力。

其他分析家認為,JADC2的支出應更多地集中在改變決策方式上。這一論點強調了通過利用人工智能(AI)實現決策過程自動化的必要性,正如國防高級研究計劃局(DARPA)的馬賽克戰爭概念所設想的。在這種方法中,優先利用人工智能系統的支出(如空軍的STiTCHES計劃),可以建立主要集中在需要傳輸的數據和數據結構的特設網絡。這一論點假設人工智能也可以分析情報、監視和偵察(ISR)數據,以確定人類可能錯過的趨勢,從而向軍事指揮官提出潛在的更好的建議。

其他觀察家認為,優先考慮如何使用和管理電磁波譜的決策對于支持JADC2至關重要。這些觀察家認為,像國防信息系統局的電磁戰管理計劃--旨在利用情報方法評估電磁波譜環境,然后自動決定如何使用頻譜來減輕對手的電子戰影響--對于實現全域指揮和控制是必要的。這些觀察家還認為,對手的電子戰效應將需要近乎即時地被緩解,因此需要一個強大的電磁環境部分(以及自動化),以便在對網絡的潛在攻擊中管理國防部網絡。

5.4 互操作性挑戰

由于國防部設想使用JADC2來同時指揮多個領域的部隊,因此連接不同類型部隊的需求也在增加。國防部擁有并運營著許多通信系統,每個系統都使用不同的無線電頻率、標準和數據鏈,這些系統往往不能相互 "交談",因此需要一個網關將一種無線電協議 "翻譯 "成另一種協議。盟友和合作伙伴的加入增加了互操作性的挑戰。前國防部副部長邁克爾-格里芬在2020年3月向眾議院軍事委員會情報、新興威脅和能力小組委員會作證時,指出這個問題是繼續為FNC3進行OSD R&E努力的理由。

使國防部能夠共享來自不同部門和單位的信息的挑戰可以通過三種互操作性的方法來解決:

  • 網關。通信網關(也許稱為 "翻譯器 "更為恰當)可以接收多種協議、安全級別等,并將這些信息轉播給部隊的其他部門。ABMS計劃已經開發了這種網關(見圖6),以實現通信。這種方法允許信息共享,有可能降低開發成本,因為網關可以是飛機/艦艇/地面系統的一個子系統,有可能能夠相對快速地投入使用。這種方法的挑戰是,這種網關可能沒有使用最先進的,因此也是受保護的波形來轉播給部隊。

圖 6:E-11 戰場機載通信節點 (BACN)

  • 新的通信設備。這種方法采用 "自上而下 "的方式(即由OSD或聯合參謀部確定解決方案,然后要求各軍種采用該方案)。使用與聯合戰術無線電系統(JTRS)開發類似的模式,這種方案將購買一個新的通信架構,重點是互操作性。例如,FNC3的努力似乎就是采用這種方法。盡管這種方法可以確保聯合部隊開發的通信系統可以無縫共享信息,而且可能是安全的,但它可能需要大量的投資,并可能遇到時間表的延誤。這種方法的另一個可能的缺點是,隨著系統的投入使用,它們可能對對手的技術不那么有效。

  • 開發軟件來創建網絡。第三種方法是使用軟件,使用戶能夠創建自定義網絡。DARPA的 "馬賽克戰爭 "和ABMS計劃的某些方面就是這種方法的例子。與其他互操作性解決方案相比,這種方法更加模塊化,使為特定行動定制的單位和系統能夠相互通信。這種方法的一個主要風險是技術上的不成熟,特別是用于創建這些網絡的軟件。另一個風險涉及到與不同系統共享的信息量和分類,這些系統經過認證,具有不同的保密級別(例如,可釋放的秘密、不可釋放的秘密、最高機密)。

國防部和國會可以選擇這些方法中的一種或多種。一種特定的方法可能提供短期的好處,而國防部則追求一種長期的方法來解決互操作性的挑戰。

5.5 平衡退化環境下的通信能力

國防部為滿足JADC2的要求而開發通信網絡的方法包括三種相互競爭的能力:

  • 數據吞吐量(即數據傳輸的速度)

  • 延遲(即接收信息/數據的時間延遲)

  • 彈性(在自然或故意中斷的情況下保持通信信號的能力)

軍事作戰新技術的興起,如人工智能、戰術數據鏈(如Link 16和多功能先進數據鏈[MADL])和對手的電子戰能力,為5G和FNC3等未來通信系統平衡這些能力帶來了明顯的挑戰。人工智能和信息戰可能需要大量的數據來實現預測分析,并讓指揮官對戰斗空間有一個準確的了解。與所有可用用戶共享數據的數據鏈并不一定需要高數據速率;然而,數據鏈確實需要低延遲,以確保傳感器能夠證明 "目標級數據",特別是對于像巡航導彈和飛機這樣快速移動的系統。最后,電子干擾器的擴散需要彈性(或抗干擾性能),以便在被主動干擾時保持通信。圖7說明了在開發新的波形時必須平衡這三個相互競爭的要求(無論該波形是為民用還是軍用而設計)。無線電信號能夠提供每一種能力;然而,優先考慮一種要求意味著其他兩種要求可能會受到影響,這可能會給決策者帶來兩難選擇,即在采購中優先考慮哪些能力。

圖7:平衡通信要求

隨著國防部對其通信系統的現代化改造,它可能會考慮技術特點和限制,以選擇在保護其網絡安全的同時推進任務目標的要求。例如,像5G這樣的技術可以提供高數據容量和低延遲,但目前還不清楚這些信號可能受到對手干擾的影響。另一方面,FNC3的設計似乎是為了提供具有高數據率的彈性;但是,由于它依賴于衛星,延遲將增加。

5.6 人工智能在決策中的角色

人工智能是實現JADC2的一個潛在的關鍵組成部分。隨著人工智能被引入軍事決策中,出現了幾個潛在的問題。首先,人工智能在決策中的作用應該達到什么程度?在使用致命武器時,人類的判斷力需要達到什么適當的水平?

第二,國防部如何確保用于人工智能算法協助決策的數據的安全性?盡管國防部把重點放在了數據結構上,但它沒有討論它計劃如何具體確保JADC2的數據有效性和安全性。錯誤的數據可能導致指揮官選擇損害任務目標的選項(如算法推薦可能浪費高價值彈藥的目標)。與此相關的是,國防部打算如何保護云環境中的這些數據,以防止對手操縱它們?這些安全計劃是否足以防止對手的操縱?

5.7 潛在的部隊結構調整

由于JADC2可能需要不同類型的部隊和武器系統,每個軍種都可能尋求改變其訓練、組織和裝備部隊的方式。例如,海軍陸戰隊在其部隊重新設計中宣布,它將取消它認為不符合國防戰略指導的部隊,并將資金重新投入到其他更適合未來作戰環境的項目中。

現役和預備役部隊的能力平衡是部隊結構調整的另一個方面。例如,陸軍在歷史上決定將后勤能力從現役部門轉移到預備役部門。因此,如果美國要開戰,陸軍大概需要啟動預備役部隊來實現行動。當國防部和各軍種準備迎接JADC2帶來的挑戰時,這些組織將如何選擇平衡現役和預備役部隊的能力和部隊結構?

5.8 對JADC2工作的管理

聯合參謀部J6是國防部JADC2工作的主要協調者,每個軍種和一些國防部機構都在進行各種活動。國會中的一些人過去曾表示有興趣建立國防部范圍內的項目辦公室(如F-35聯合項目辦公室)來集中管理大規模的工作。國防部的研究和開發工作將隨著時間的推移而增加,因此,管理這些工作可能會變得更具挑戰性。國會在未來可能會尋求確定或建立一個負責項目管理、網絡架構開發和財務管理的組織。

附錄-聯合互操作性的歷史實例:聯合戰術無線電系統

聯合戰術無線電系統(JTRS)是一個通信項目,旨在通過在所有軍種中部署無線電設備來提高通信的互操作性。該計劃于20世紀90年代中期開始,最終于2011年被前國防部負責采購、技術和后勤的副部長弗蘭克-肯德爾取消。在他的理由中,肯德爾副部長指出,"由于當時技術不成熟,移動特設網絡和可擴展性的技術挑戰沒有得到很好的理解......從JTRS GMR[地面移動無線電]開發計劃中產生的產品不太可能在經濟上滿足各軍種的要求。" 在15年的開發工作中,國防部花費了大約150億美元,在終止時還需要130億美元。

JTRS計劃旨在用可在大部分無線電頻譜上運行的基于軟件的無線電取代軍隊使用的25至30個系列的無線電系統--其中許多系統不能相互通信。根據設想,JTRS將使各軍種與選定的盟國一起,通過各級指揮部的無線語音、視頻和數據通信,包括直接獲取來自機載和戰場傳感器的近實時信息,以 "無縫 "方式運作。被描述為 "軟件定義的無線電",JTRS的功能更像一臺計算機,而不是傳統的無線電;例如,它可以通過添加軟件而不是重新設計硬件來升級和修改,以便與其他通信系統一起運行--這是一個更昂貴和費時的過程。國防部聲稱,"在許多情況下,一個具有多種波形的JTRS無線電臺可以取代許多單獨的無線電臺,簡化了維護工作",而且由于JTRS是 "軟件可編程的,它們也將提供更長的功能壽命",這兩個特點都提供了潛在的長期成本節約。JTRS計劃最初被分成五個 "集群",每個集群都有一個特定的服務 "領導"(見表A-1),并由一個聯合項目辦公室管理整個架構。

注:外形尺寸無線電臺基本上是士兵攜帶的小型化無線電臺,以及重量和功率受限的無線電臺。

正如下文所討論的,JTRS在開發過程中遇到了一些困難。這些問題可能與未來的JADC2開發有關。

尺寸和重量的限制和有限的范圍

根據政府問責局(GAO) 2005年的一份報告: 為了實現寬帶網絡波形的全部功能,包括傳輸范圍,Cluster One無線電需要大量的內存和處理能力,這增加了無線電的尺寸、重量和功耗。增加的尺寸和重量是努力確保無線電中的電子部件不會因額外的內存和處理所需的電力而過熱的結果。到目前為止,該計劃還未能開發出符合尺寸、重量和功率要求的無線電,而且目前預計的傳輸范圍只有三公里--遠遠低于寬帶網絡波形所要求的10公里范圍....。Cluster One無線電的尺寸、重量和峰值功率消耗超過直升機平臺要求的80%之多。

由于無法滿足這些基本的設計和性能標準,人們擔心Cluster One可能無法按計劃容納更多的波形(計劃中Cluster One有4到8個存儲波形),而且它可能過于笨重,無法裝入重量和尺寸都受到嚴格限制的未來戰斗系統(FCS)載人地面車輛(MGVs)以及陸軍的直升機機群。一些觀察家擔心,為了滿足這些物理要求,陸軍將大大 "削弱 "第一組的性能規格。然而,根據陸軍的說法,它在減少Cluster One的重量和尺寸以及增加其傳輸范圍方面取得了進展;然而,將所有需要的波形納入Cluster One證明是困難的。據報道,Cluster Five無線電臺也遇到了類似的尺寸、重量和功率方面的困難;這些困難更加明顯,因為有些Cluster Five版本的重量不超過1磅。

安全

JTRS的安全問題成為發展中的一個重要困難。據一位專家說,該計劃最大的問題之一是安全,"即加密,因為JTRS的加密是基于軟件的,因此容易受到黑客攻擊"。 計算機安全專家普遍認為,用于任何目的的軟件都是脆弱的,因為目前沒有一種計算機安全形式能提供絕對的安全或信息保證。據美國政府問責局稱,JTRS要求應用程序在多個安全級別上運行;為了滿足這一要求,開發人員不僅要考慮傳統的無線電安全措施,還要考慮計算機和網絡安全措施。此外,國家安全局(NSA)對JTRS與美國盟友的無線電系統接口的安全擔憂也帶來了發展上的挑戰。

與傳統無線電系統的互操作性

一些分析家表示擔心,使JTRS與傳統無線電 "向后兼容 "的目標在技術上可能是不可行的。據報道,早期的計劃試圖通過交叉頻段來同步不兼容的傳統無線電信號,這被證明過于復雜。目前陸軍的努力集中在使用寬帶網絡波形來連接傳統的無線電頻率。一份報告指出,雖然寬帶網絡波形可以接收來自傳統無線電的信號,但傳統無線電不能接收來自JTRS的信號。為了糾正這種情況,陸軍考慮使用19種不同的波形來促進JTRS向遺留系統的傳輸。在JTRS無線電中加入如此多的不同波形會大大增加內存和處理能力的要求,這反過來又會增加JTRS的尺寸、重量和功率要求。

作者:John R. Hoehn,軍事能力和計劃分析師

付費5元查看完整內容
北京阿比特科技有限公司