隨著軍隊使用人工智能/機器學習系統實現現代化,軍事情報部門的人員需要充分了解這些系統,并將其納入聯合情報進程(JIP)。為了指導部隊開發和整合這項技術,美國防部(DOD)公開發布了《美國防部通過人工智能倫理原則》,其中包括 "公平 "原則,以減少 "意外偏見"。雖然有多種技術上的最佳實踐可以減少意外偏見,但軍事情報界也可以從商業行業采用一些非技術上的最佳實踐。本定性、多案例研究和跨案例綜合報告探討了這些商業行業的非技術最佳實踐,以減少聯合執行項目中的意外偏見。
2015年8月27日,美國海軍研究生院(NPS)先進機器人系統工程實驗室同時試飛了50架自主無人機。這次演示證明,自主無人機群技術正在以令人生畏的速度發展,無人機的部署和控制現在已經可以大規模完成。隨著學術界、工業界和國防部門不斷將傳感器微型化并增強蜂群操作系統,從演示到戰術應用的過渡將很快實現。要有效地實現這一目標,就必須致力于確定蜂群傳感器的要求以及使用戰術、技術和程序。本論文使用基于智能體的模擬、尖端的實驗設計和并行計算來深入探討無人機群的使用,以支持海軍陸戰隊步兵連。該場景是一個基于真實事件的蓄意清除任務,其中步兵連在受限地形中與同級敵人作戰。對 30,000 次模擬任務所獲數據的分析表明,與目前連級可用的 ISR 無人機相比,無人機群平均可使火力支援小組瞄準并打擊兩倍數量的敵方戰斗人員。對于分級無人機群來說,這使美軍傷亡人數最多可減少 50%。對新出現的蜂群進行的數據分析和視覺研究還表明,蜂群的體積加上固有的傳感器重疊,最大程度地減少了對傳感器的需求。
圖 ES-1. 將現實世界轉化為模型。論文場景的初始啟動條件
在過去三十年里,美國軍隊作為世界上技術最先進的戰斗力量,享有無可撼動的霸主地位。在伊拉克和阿富汗沖突期間,美軍采用了以網絡為中心的戰爭,取得了毀滅性的效果和效率(Scharre,2014 年)。然而,經過十六年的持續作戰行動,地緣政治競爭對手和好戰的非國家行為體正在挑戰美軍在全球公域內保持 "全域準入 "的能力(特朗普,2017)。
隨著國際社會從單極模式向多極體系轉變,未來的作戰環境將更加復雜和混亂。2016 年海軍陸戰隊作戰概念(MOC)警告說,美國的對手正在利用技術擴散、部署混合部隊以及強大的反介入和區域拒止(A2/AD)能力,在各級戰爭中挑戰美軍。簡易爆炸裝置 (IED)、商用無人機系統和網絡工具不斷變得更加經濟實惠,并以驚人的速度得到改進,這使問題變得更加復雜。隨著美國的敵人越來越熟練地掌握這些技術,他們將尋求獲得對當地居民的影響力,并參與城市沖突,以削弱美國在騎兵機動和火力方面的優勢(美國海軍陸戰隊 [MOC],2016 年)。
為了為未來的作戰環境做好準備,并確保在整個軍事行動范圍內的準入,美國需要尋求新的創新方法來重新獲得戰術優勢(特朗普,2017 年)。盡管美國國防部(DoD)將需要許多技術來應對這些新興威脅,但自主蜂群技術正在快速成熟,并為進入軍事人員無法到達或過于危險的地區提供了可行的解決方案(Scharre,2014)。在過去十年中,機器人研究界做出了巨大努力,使自主蜂群技術從概念走向現實。
目前,美國海軍研究生院(NPS)正走在自主無人機群技術的前沿。2015 年 8 月 27 日,NPS 的先進機器人系統工程實驗室(ARSENL)創下了同時飛行 50 架商用現成(COTS)自主無人機的紀錄(Chung 等人,2016 年)。自這一開創性事件以來,其他國家實驗室在此技術的基礎上,部署了近兩倍于這一數字的無人機。因此,隨著 ARSENL 和其他同行項目繼續增強無人機硬件和蜂群操作系統,從實驗到應用的過渡可能會很快發生。毫無疑問,模擬和實驗將決定 21 世紀部隊如何在未來戰場上使用蜂群。
本論文使用基于智能體的模擬(ABS)、尖端的實驗設計(DOE)和并行計算來深入探討無人機群的使用,以支持海軍陸戰隊步兵連。通過執行 30,000 次模擬戰斗,論文對戰斗條件下的蜂群系統性能進行了量化。論文的主要問題集中在指揮與控制(C2)配置、系統運行閾值和蜂群規模如何影響單元的整體性能。總之,研究旨在讓決策者了解不同的控制策略如何影響蜂群性能和傳感器需求。
作者使用 ABS 建模環境 MANA-V 創建了一個逼真的戰場,并恰當地捕捉到了蜂群的復雜性和自主性。論文中的場景是作者在支持 "持久自由行動 "時經歷的實際任務設置。模擬逼真地描述了一個具有挑戰性的混合威脅,其目的是阻止美軍進入敵方據點。此外,無人機群是以 ARSENL C2 架構為模型的。本研究以 ARSENL 架構和作者的作戰經驗為基礎。
MANA-V 是一種基于智能體的時間步進隨機建模環境,旨在進行 "快速轉向 "的任務級分析(Lucas,2015 年)。對于決策者或首席分析師而言,MANA-V 可提供任務可視化、對不斷變化的戰斗的寶貴洞察力以及對傳感器使用的直覺(McIntosh, Galligan, Anderson, & Lauren, 2007)。作為一種分析工具,MANA-V 提供了一個直觀的界面來高效地構建場景,并具有數據耕作能力,使研究團隊能夠運行多個場景。
本論文的結論基于一個現實的模型、高效的實驗設計以及對三個實驗組的嚴格分析,這三個實驗組在 30,000 次模擬戰斗中得出了獨特的結果。論文研究結果表明,不同的無人機(UAV)控制策略對傳感器覆蓋范圍、間接火力使用和單元傷亡有深遠影響。六項主要發現包括
分層蜂群在減少傷亡方面具有最大的潛力,而且與新興蜂群相比,可以用更少的無人機來實現這一目標。在采用首選蜂群配置時,藍軍傷亡人數有可能減少 50%。
平均而言,兩種無人機群都能使 FiST 瞄準和攻擊的敵方目標數量是單個 ISR 無人機的 2 到 3 倍。
對新出現的無人機群進行的數據分析和視覺研究表明,無人機群的體積加上固有的傳感器重疊,最大程度地減少了對傳感器的需求。
分層蜂群的首選使用策略是由六架無人機組成兩個子蜂群。每個子群由兩架驗證無人機和四架尋的無人機組成。在假設條件下,需要 48 架無人機才能在 2.5 小時的戰斗中為連隊提供 ISR。
應急蜂群的首選部署策略建議部署一個由 15 架無人機組成的蜂群,其中包括 3 架驗證型無人機和 12 架搜索型無人機。在假設條件下,需要 60 架無人機才能在 2.5 小時的戰斗中為連隊提供 ISR。
ISR 規劃人員必須了解蜂群規模及其對戰斗服務支持的影響。雖然蜂群的首選使用配置僅相差 3 架無人機,但總體任務需求卻相差 12 架無人機。在開發蜂群投送/發射平臺時,這一基本概念非常重要。
人工智能(AI),即機器的智能行為,是一個已有幾十年歷史的概念,隨著計算能力的進步和理論應用的跟進,這一概念正迅速走向成熟。未來十年,人工智能有可能顯著提高整個美國防部(DoD)各組織的效率和殺傷力。作為美國防部中最小的軍種,海軍陸戰隊的定位是在戰爭的戰術和戰役層面,從人工智能即將帶來的成本節約和作戰能力提升中顯著受益。人工智能可使艦隊在許多領域受益,包括調度優化、目標選擇和圖像處理以及兵棋推演。從技術上講,這些人工智能的增強僅依賴于對現有理論和應用的合理擴展,不需要在未來十到十五年內實現新的重大技術突破。持續的國家人工智能政策制定和海軍陸戰隊高層領導的持續重視,對于在未來幾年內有效實施人工智能以應對全球對手至關重要。
人工智能是下一個競爭領域;第一個開發出人類水平人工智能的國家將產生類似于原子彈開發的影響。為了維護美國及其人民的安全,美國國防部資助了人工智能及其應用的發展研究。本研究使用強化學習和深度強化學習方法作為當前和未來AI智能體,并評估開發中的潛在問題。在兩個游戲和一次遠足中對智能體的表現進行了比較: 分別是貨物裝載、河內塔和背包問題。據觀察,深度強化學習智能體能處理更廣泛的問題,但表現不如專門的強化學習算法。
訓練一名步兵軍官在軍事行動中選擇適當的排隊,傳統上需要投入大量的訓練資產。步兵訓練將受益于在普遍可用的平臺上進一步發展高容量的訓練。2018年,創建了一個基于計算機的模擬排隊編隊決策任務(PFDT),并利用認知與績效目標訓練干預模型(CAPTTIM)來確定哪些參與者達到了最佳決策以及何時發生。本研究在該工作的基礎上,在兩個流行的平臺上完善和測試PFDT。PFDT包括32個場景,每個場景隨機呈現四次,總共128次試驗。在這些場景中,有五個因素被操縱,一個中小企業確認了最佳、可接受和差的決策反應。基礎學院和海軍研究生院的27名學生在三種平臺中的一種完成了PFDT:平板電腦、虛擬現實(VR)或帶編隊的VR(為參與者提供在虛擬背景上描繪編隊的能力)。CAPTTIM表明,在達到最佳決策所需的試驗數量上不存在平臺效應。此外,參與者的經驗水平并不影響專家或新手在對方之前達到最佳決策。因此,PFDT是一個可行的軍事訓練模擬器,無論所使用的技術平臺或步兵訓練的數量如何。
強化學習(RL)的成功,如《星際爭霸》和《DOTA 2》等視頻游戲達到了高于人類的性能水平,這就提出了關于該技術在軍事建設性模擬中的未來作用的問題。本研究的目的是使用卷積神經網絡(CNN)來開發人工智能(AI)Agent,能夠在具有多個單位和地形類型的簡單場景中學習最佳行為。這篇論文試圖納入一個可用于軍事建設性模擬領域的多Agent訓練方案。八個不同的場景,都有不同的復雜程度,被用來訓練能夠表現出多種類型戰斗行為的Agent。總的來說,結果表明,人工智能Agent可以學習在每個場景中實現最佳或接近最佳性能所需的強大戰術行為。研究結果還表明,對多Agent訓練有了更好的理解。最終,CNN與RL技術的結合被證明是一種高效可行的方法,可以在軍事建設性模擬中訓練智能Agent,其應用有可能在執行實戰演習和任務時節省人力資源。建議未來的工作應研究如何最好地將類似的深度RL方法納入現有的軍事記錄構建性模擬項目中。
正確預測對手在戰爭中的戰略或戰術行為的愿望與人類進行這些戰爭的能力一樣古老[1]。在中國古代,像魏黑和圍棋這樣的游戲最初被用作加強軍事和政治領導人的戰略思維能力的方法。后來,羅馬人利用沙盤在戰役或戰斗前討論自己和敵人的可能行動。然而,直到19世紀初,普魯士人用他們的兵棋推演(Kriegsspiel)才開始利用具有嚴格規則的游戲來預測軍事交戰的可能結果。雖然這些兵棋推演在接下來的幾十年里在世界各地的許多武裝部隊中越來越受歡迎,但進行必要計算的能力有限,總是限制了這些基于棋盤的兵棋推演所能達到的復雜程度。此外,棋盤游戲的物理限制限制了設計者簡化行為和游戲元素,而不是努力追求真實。然而,計算能力的提高和用戶友好的圖形界面使設計者在20世紀末能夠以更高的復雜性來模擬兵棋推演的規則和游戲中的組件數量。此外,計算機的使用允許實施基于計算機的對手,在基于硬編碼規則的人工智能軟件的基礎上成功地與人類玩家進行比賽。
今天,基于計算機的兵棋推演,也被稱為建設性模擬[2],已經成為整個國防部(DOD)的一個有用工具。它們使軍事領導人能夠進一步學習和發展他們在那些通常被認為成本太高或太危險而無法定期演練的領域的行動程序。領導人有能力在實際執行前針對多種紅色力量設計使用他們的部隊,使他們有機會在不承擔任何額外風險的情況下驗證他們的機動方案。在戰略層面上,大型單位的工作人員經常使用建設性的模擬作為訓練方法[3],領導人可以在模擬環境中進行投入,但他們不參與確定場景的結果[2]。
在基于計算機的兵棋推演中用來表現對抗行為的方法,需要由場景設計者通過腳本直接編碼,或者使用真人玩家進行所有紅軍的決策。這兩種方法都能提供足夠的分辨率來表現對抗性行為,但每種方法都有其缺點[4]。對于低級別的場景來說,直接對特定行為進行編碼可能是可行的,但隨著場景的擴大,單位的數量和可能的行動對于腳本的控制來說變得太有挑戰性,往往會導致不現實的行為[4]。對于大型場景,使用人類玩家作為紅色力量可能會提供更真實的結果,但額外的人力資源會造成后勤方面的壓力,而且整體的生產力也受限于單個玩家的知識和能力。
解決這個問題的一個可能的方法可能在于利用人工神經網絡。在計算機游戲領域,這種方法最近已被證明是相當成功的。例如,對于實時戰略游戲《星際爭霸II》,一個人工神經網絡被開發出來,打敗了99.8%經常參加在線比賽的玩家[5]。雖然在計算機游戲領域,人工神經網絡的利用最近取得了巨大的進展,但在軍事用途的兵棋推演領域,研究才剛剛開始。在最近的研究中,Boron[6]和Sun等人[7].已經表明,人工神經網絡適合解決簡單軍事兵棋推演場景中的挑戰。基于以前的工作,特別是Boron[6]的工作,本論文旨在提高所使用的軍事場景的復雜性。雖然Boron使用了簡單的多層感知器(MLP)神經網絡,但在處理己方和敵方單位的動態起始位置以及敵人的動態行為時,這種結構被證明是不合適的。此外,所使用的場景被限制在戰場上最多五個單位[6]。在本論文中,將建立一個支持卷積神經網絡(CNN)架構的訓練模擬,包括多個單位和地形類型以克服這些限制。此外,將在一個確定的場景中應用多智能體訓練,以測試這種方法是否可以成功地用于軍事建設性模擬領域。
無人駕駛地面車輛(UGVs)可用于軍事領域,以減輕士兵承擔的風險,以及為體力要求高、枯燥或危險的任務提供解決方案。雖然使用UGV有好處,但也有需求和限制。本論文探討了最終用戶--瑞典武裝部隊的一個輕步兵營--對于為城市地形中的軍事行動而設計的UGV在功能方面的要求。這是通過一個帶有焦點小組的探索性案例研究來完成的,來自第31游騎兵營的士兵和軍官使用兩種不同的UGV原型來完成任務。隨后是半結構化的小組討論,探討了需求、限制和要求。然后,通過主題分析方法對收集的數據進行分析。
主題分析的結果發現,焦點小組的要求有幾個重復出現的意見。這些要求被分為四類:(1)速度,(2)用例,(3)圖像生成的傳感器,以及(4)自主功能。總之,本論文在四個類別中共確定了13個需求。總而言之,這些要求意味著用于城市地形的軍事行動的UGV必須能夠跟上沖刺的士兵,提供視覺掩護,能夠與附近的物體互動,有幾個高質量的傳感器和強大的自主功能,使士兵能夠專注于控制UGV以外的其他事情。
訓練一名步兵軍官在軍事行動中選擇適當的排隊,傳統上需要投入大量的訓練資產。步兵訓練將受益于在普遍可用的平臺上進一步發展高容量的訓練。2018年,創建了一個基于計算機的模擬排編隊決策任務(PFDT),并利用認知與績效目標訓練干預模型(CAPTTIM)來確定哪些參與者達到了最佳決策以及何時發生。本研究在該工作的基礎上,在兩個流行的平臺上完善和測試PFDT。PFDT包括32個場景,每個場景隨機呈現四次,總共128次試驗。在這些場景中,有五個因素被操縱,一個中小企業確認了最佳、可接受和差的決策反應。基礎學院和海軍研究生院的27名學生在三種平臺中的一種完成了PFDT:平板電腦、虛擬現實(VR)或帶編隊的VR(為參與者提供在虛擬背景上描繪編隊的能力)。CAPTTIM表明,在達到最佳決策所需的試驗數量上不存在平臺效應。此外,參與者的經驗水平并不影響專家或新手在對方之前達到最佳決策。因此,PFDT是一個可行的軍事訓練模擬器,無論所使用的技術平臺或步兵訓練的數量如何。
一個持久的、精確的和適應性強的安全應用是有效的部隊保護條件(FPCON)的必要組成部分,因為美國的軍事設施已經成為恐怖主義和暴力行為的常見目標。目前的軍事安全應用需要一種更加自動化的方法,因為它們嚴重依賴有限的人力和有限的資源。目前的研究開發了一個由嵌入式硬件組成的離網部署的聯合微調網絡,并評估了嵌入式硬件系統和模型性能。聯合微調采用集中預訓練的模型,并在一個聯邦學習架構中對選定的模型層進行微調。聯合微調模型的CPU負載平均減少65.95%,電流平均減少56.18%。MobileNetV2模型在網絡上傳輸的全局模型參數減少了81.59%。集中預訓練的MNIST模型開始訓練時,比隨機初始化的模型的初始準確率提高了53.94%。集中預訓練的MobileNetV2模型在第0輪訓練時表現出90.75%的初始平均準確率,在75輪聯合訓練后,整體性能提高了3.14%。目前的研究結果表明,聯合微調可以提高系統性能和模型精度,同時提供更強的隱私性和安全性,以抵御聯邦學習攻擊。
許多國家都使用了像“三角洲” (Delta) 這樣的作戰管理系統(BMS),包括烏克蘭,使指揮部能夠共享態勢感知信息;本研究的重點是信息在作戰網絡中的分配。與自然系統類似,螞蟻和蜜蜂等自主代理遵循一套簡單的規則,BMS是一個由基地和電子作戰平臺組成的網絡,在國防條令的指導下,軍事資產作為網絡內的智能體。這種系統的可操作性的原理是基于多個子系統相互作用時每個子系統都是可靠的。然而,潛在相互作用的排列組合會引起不可預測的負反饋或正反饋循環,導致不可預測的和不想要的結果。突現行為的結果是出乎意料的,有時在情報和無線網絡等領域是不受歡迎的。理解突發行為對于理解復雜的工程系統是勢在必行的,并且要提出新的見解,采取切實可行的措施來改善復雜系統的設計和分析。本文介紹了BMS和網絡與用戶定義的系統集成的網絡士兵概念的例子。作者認為,烏克蘭和其他軍隊可以直接從利用元控制論、元元系統模型分析來控制突現。
圖2:作戰管理系統(BMS)的集中式指揮通信網絡
為了跟上美國防部(DOD)人工智能(Al)戰略的步伐,美國陸軍在2018年啟動了人工智能集成中心(Al2C)。他們的任務是--與美國各地的公司和大學的人工智能社區溝通,目的是通過人工智能的整合來改善和提高軍隊的能力。
這個頂點項目盡可能地分析了當前美陸軍部(DA)對人工智能的要求狀況,以及它們對人類系統集成(HSI)的包含。該小組審查了發布在獎勵管理系統(SAM)網站上的人工智能合同機會和適用的文件,包括績效工作聲明、工作聲明或目標聲明。第一步是確定這些合同機會中包含的要求是否符合人工智能的定義,即計算機系統有能力執行通常需要人類智慧的任務。如果需求符合人工智能的這一定義,那么分析工作就會繼續進行,并側重于納入HSI,以確保為人類(即操作員、士兵、用戶等)提供便利。研究小組還采訪了主題專家(SMEs),以深入了解軍隊開發和獲取人工智能需求的過程。
在2003年至2022年期間發布到SAM的機會中,只有16%(238個中的40個)在開發過程中足夠成熟,可以考慮進行評估。在這40個被認為足夠成熟的采購開發過程中,只有16個發布的信息包含了相關的文件,可以根據團隊既定的人工智能和HSI標準進行評估。從那里,只有6個帖子符合AL的定義,4個被寬泛地判斷為包括一些對HSI或人為因素的參考。該小組的綜合評估確定,陸軍的人工智能指導還處于起步階段,需要進一步發展和完善。評價還強調,盡管國防部和陸軍指導將HSI納入所有要求,但仍然缺乏對HSI的納入。
這個頂點項目建議,所提出的結果和結論應被用來進一步制定人工智能需求的采購指南,并特別注重納入HSI。我們還建議,未來的研究應納入機密需求以及由其他交易機構通過財團管理的需求。