MSG-189專家團隊(ST)活動的基本原理建立在評估如何結合和集成新興顛覆性技術的需要之上,這些技術正在改變我們工作和生活的方式,并且融入促進了M&S技術和相關仿真系統的發展。
作為北約STO NMSG研究目標的一部分,仿真系統的新架構和先進功能一直被研究和定義。僅舉幾個例子:MSaaS(建模和仿真服務)和MTDS(任務訓練分布式仿真)的定義及實施為新一代最先進的仿真系統鋪平了道路。
此外,近年來,北約STO小組和相關工作組一直在解決最先進技術的問題和演變:人工智能(AI)、機器學習(ML)、大量異質信息的管理和分析(大數據)、通過沉浸式設備(AR、VR、XR)實現真實世界和合成世界的互動、無線技術(5G)以及通過云計算和面向服務的架構提供服務的新方法。
因此,NMSG旨在研究這些研究領域之間的協同作用,以概述這些新興和顛覆性技術對下一代仿真系統的特點和潛在影響。
定義一個包含上述所有概念的仿真系統無疑具有挑戰性,因此,工作組只把注意力集中在某些方面進行探索:
必須強調的是,該框架所產生的參考架構的主要基礎是長期存在的、非常重要的NMSG活動,如MSaaS和MTDS。MSG-189 ST活動建立在這些參考文獻的基礎上,以尋找新的和創新的解決方案,可以加強對M&S這樣的關鍵技術的使用。一個 "安全 "的設計概念,密切關注基礎設施對網絡威脅的高彈性(設計安全)也是一個需要滿足的具體要求。
由此產生的MSG-189生態系統不僅可以作為一個培訓工具,而且首先可以作為一個有效的支持,用于確定最佳的CoA,然后在 "實際 "行動中實施,或在隨后的規劃階段和確定要執行的行動細節(作戰指令的管理)。
MSG-189 ST的最后一項建議是成立一個后續工作組(RTG),該工作組從該小組所做的工作中得到啟發,可以定義一定數量的用例,以驗證所做的選擇,并證明系統的參考架構和所列技術的有效性。
近年來,所謂的 "顛覆性技術 "發展迅速,如人工智能(AI)、機器學習(ML)、大量數據的管理和處理(數據科學和大數據分析-BD)以及沉浸式技術(VR / AR / MR / XR)。
北約STO內部的各個小組/團體已經研究了這些新技術提供的可能性;特別是,NMSG工作組對研究新的架構和仿真系統的服務非常感興趣,這些系統將用于軍事訓練和決策領域的未來應用。北約MSG-189專家小組(ST)已經接受了這一挑戰,并進行了一項研究,以確定這樣一個仿真框架。
首先,讓我們看一下要追求的目標,這些目標最初列在技術活動建議TAP[1]中,然后列在One Pager文件[2]中:
定義一個模擬系統,使所有上述概念以整體的方式存在,這個想法當然具有挑戰性,而且在許多方面,超出了專家組的目標(和可能性)。
因此,工作組的首要任務是以更精確的方式確定工作范圍,并指出工作組研究活動的領域。這方面最重要的成果是定義一個 "參考架構",在此基礎上建立MSG-189生態系統(后來經常被簡單地稱為系統)。這是一個抽象的架構形式,為未來的具體解決方案架構(項目架構)提供了一個模板解決方案。
必須強調的是,該框架的參考架構的主要基礎是長期存在且非常重要的NMSG活動,如MSaaS(建模與仿真服務)和MTDS(任務訓練分布式仿真)。MSG-189 ST活動將在這些參考文獻的基礎上,尋找新的和創新的解決方案,以加強對M&S這樣的關鍵技術的使用。
一個 "安全 "的設計概念,密切關注基礎設施對網絡威脅的高彈性(設計安全),也被指出是一個需要滿足的具體要求。出于這個原因,這些信息已經在這第一章中提出。
特別是,本章介紹了軍事訓練和決策的概念,強調了這種系統必須考慮到的網絡安全方面的重要性,然后定義了MSG-189 ST活動的利益量。對所指出的問題的深入研究以及將其納入參考架構將是以下各章的主題。
本章的第一部分致力于識別和描述與培訓有關的問題,旨在為所有在軍事組織中工作的專業人員提供必要和關鍵的活動,并支持指揮官、其工作人員和參與任務的人員的決策過程。
本章概述的另一個主題與網絡安全有關:將定義與安全有關架構的要求限定方面;所提供的信息必須是框架設計的基礎,并滲透到其所有功能中(設計安全)。
在本章的最后部分,描述了研究的興趣領域,定義了該領域的維度(行動、專業知識和生命周期),并對每個維度指出和描述了需要考慮的層次。
最后,我們定義了MSG-189 ST的研究活動將在其中進行的興趣范圍。
軍事訓練對不同的人是明確的但又非常不同的。在軍事單位指揮官的層面上,它意味著鍛煉戰場上的部隊或海上的水手,使他們作為一個綜合、協調的單位運作。在軍事人員管理者的層面上,它意味著對包括廚師、馴犬員、坦克炮塔技術員、雷達技術員和戰斗機飛行員在內的所有職業專業的個人進行準備和認證。在主要軍事系統的開發者和提供者層面,它意味著在模擬器或系統本身上進行演習。對所有相關人員來說,它意味著讓來自平民社會的個人準備好作為專業軍事人員執行任務。
軍事訓練與其他形式的訓練不同,它強調的是紀律、臨場準備和集體訓練[3]。
從中世紀的奎因時代開始,無疑在此之前,仿真在進行軍事訓練和評估個人、船員、團隊和單位執行軍事行動的準備情況方面一直很突出。今天,仿真對于參加野外演習的疲憊不堪的士兵來說非常熟悉,對于在我們的戰爭學院里操縱計算機生成的部隊(CGF)橫掃廣闊的電子平原的指揮官來說也是如此。它得到了各種設備的支持,從塑料模型到筆記本電腦,再到比它們所模擬的飛機更昂貴的全動飛機模擬器[3]。
模型、仿真器和仿真之間的一些粗略區分是有用的[3]:
模型提供了輸入和輸出的基本表示。它們是控制和決定模擬器和仿真對用戶反應的引擎。
仿真器是設備。它們旨在向學生表現自然界中可能遇到的其他設備或現象,并被用來產生對自然界的模擬。
仿真是仿真器及其基礎模型的產物。因此,仿真是一組模型和/或模擬器,代表一個系統或一個環境的運行或特征。
隨著技術的發展,只要技術的價值能夠證明比目前的方法有改進,如成本、安全或速度,軍隊也會隨之采用。它必須不斷地具有前瞻性、創新性和積極性,既要了解戰爭是如何演變的,又要調整訓練以應對這些挑戰。
什么是訓練?
訓練是任何組織的基本活動之一;特別是,它一直是所有時代的軍隊所開展的行動取得成功的決定性因素之一。
擁有訓練有素的軍事人員對于能夠在現代戰爭的復雜情況下開展行動至關重要,這些情況需要反應技能和分析能力,只有受過訓練的人才能具備這些能力。
訓練的類型數不勝數,從特定主題的個人理論訓練到涉及數千人和車輛的大型戰區演習,在時間和空間上復雜而銜接的行動。
因此,世界上所有的軍隊在訓練中投入巨大的資源并不是巧合。訓練技術和程序的演變必須不可避免地跟隨威脅的演變,同時也要跟隨新作戰概念的發展。軍事資源訓練水平的不斷更新產生了著名的格言:"邊訓練邊戰斗,邊戰斗邊訓練"。
美國軍方將訓練定義為 "為獲得和保持完成特定任務所需的知識、技能、能力和態度(KSAAs)而進行的教學和應用練習"[4]。
一般來說,軍事訓練分為兩大類:個人和集體。個人訓練正是旨在發展個人技能的訓練。集體訓練的目的是將受過訓練的個人整合成一個有凝聚力的有效團隊,不管這個團隊是四人的坦克車組還是5000人的航空母艦船員。
訓練的規模可以小到為一個四人小組上一小時的如何包扎傷口的課,大到包括來自各軍種的數萬名人員和單位的多周聯合演習。訓練的主要領域是:機構領域,包括各軍種的各種正規學校;行動領域,包括在部隊和艦艇上的訓練,無論是在原地、部署地還是航行中。
另一種類型的培訓是自我發展:它由個人進行,以解決他們在自己的學習中看到的差距,(從更廣泛的角度來看)可以被視為一種教育[4]。
仿真是培訓的基礎,構成了培訓的本質;以培訓為導向的仿真環境允許以安全、高效、經濟的方式培訓人員,并隨著時間的推移保持培訓水平,即使是發生概率極低的事件。因此,即使是模擬環境,也必須跟隨(有時是預測)技術和理論的演變,以最好地完成其任務。
決策的定義和描述有很多,但基本上它是一個認知過程,通過這個過程從一系列合理的、潛在的選項中做出一些選擇。當然,目標是要從現有的備選方案中挑選出 "最佳 "方案。
決策中典型的復雜因素是不確定性;也就是說,備選方案的許多方面以及每個預期方案的確切結果可能是未知的、不明確的或不可預測的[5]。
從歷史上看,一個單位的成功與工作人員執行軍事決策過程的能力直接相關。鑒于當今作戰環境的復雜性增加,以及大量的任務指揮系統和程序,與作戰有關的所有活動的整合和同步越來越困難[6]。
自19世紀末以來,軍事參謀程序一直在演變,試圖定義一個達成決策的共同過程。雖然理論成功地提供了一個指導決策過程的系統,但它幾乎沒有解決在評估和選擇潛在行動方案中固有的不確定性。使情況更加復雜的是,今天人們幾乎可以無限地獲得大量的信息,這些信息可能需要也可能不需要應用于特定的決策情況。因此,雖然看起來信息越多越好,但事實上,擁有太多的數據會增加認知負擔,并可能導致忽略其他與當前特定情況更相關的信息。軍事情報分析過程面臨的挑戰是通過向指揮官提供及時、相關、可靠的信息來加強軍事決策[5]。
在下文中,我們描述了關于決策過程的不同理論,并展示了關于這些理論如何在軍事領域應用的兩個觀點。
關于決策過程的理論
描述了可以支持的關于(軍事)決策的相關理論。
理論方法 [7]
人們可以把這個領域的許多模式分為兩大潮流和方法。
安全方面的問題應該從最初的設計階段就開始計劃和解決,因為一旦部署和實施,甚至剛剛開始,要解決安全問題(考慮所有的觀點和方面)就會困難得多。
此外,由于系統架構可能是基于分布式和分散的模式--面向服務的系統(即MSaaS),其執行將在分布式計算資源上提供,基于網絡/云中心環境--網絡安全方面必須得到仔細考慮。
在實施分布式模擬系統時,有許多問題需要考慮,包括但不限于網絡、端點安全、認證和訪問控制等主題。傳統的網絡安全要求和最佳實踐為確保數據的保密性、完整性和可用性而采取的措施提供了指導。僅列舉一些例子。
應該對訪問進行管理,以確保只有經過授權的客戶才能訪問或操作數據,管理權限應該最小化,管理賬戶應該只在需要時使用。
應定期檢查用于限制誰可以訪問服務器和保護傳輸信息的認證和加密技術,以確定必要的安全要求。
適當的安全管理實踐對于操作和維護一個安全的環境至關重要:安全實踐包括識別信息系統資產和制定、記錄和實施有助于確保系統資源的保密性、完整性和可用性的政策、標準、程序和指南。
為了確保系統和支持整個基礎設施的安全,以下做法是網絡安全 "按原樣 "實施的標準參考(例子):
總之,應通過配置、保護和分析日志文件和配置,經常備份關鍵信息,建立和遵循從破壞中恢復的程序,及時測試和應用補丁,并定期測試安全,來持續維護基礎設施的安全。
此外,由于日益增長的技術創新和可用的計算資源和算法,還將有更多的網絡安全方面需要考慮。
這個活動提案的精神恰恰在于提供一個環境,它是一個生態系統的一部分,跟隨用戶從他/她的職業生涯的開始到最大經驗的階段,而不需要不斷地 "學習"(新的和不同的)系統。這種學習的努力往往與IT工具的真正目標相反,它應該促進工作經驗。此外,如果你是一個有經驗的用戶,你仍然可以訪問較低層次的信息(例如,能夠刷新、修改、獲得特定資產的技術信息,等等)。
本報告分為:
人工智能(AI)應用于武器系統是過去10年研究的一個主要趨勢。這些舉措旨在提高武器的準確性,執行非主動的瞄準手段,幫助導航和制導與控制(例如,在全球定位系統被拒絕的情況下),并減少與傳統的基于物理學的方法相比的整體計算資源,以便在更小、更實惠的武器系統上實現智能瞄準。這項研究還包括將作戰人員的戰斗空間擴展到無人駕駛飛行器,并使用蜂群方法與有人和無人平臺進行合作。
我們首先概述了人工智能的描述和歷史,并概述了人工智能在武器系統中的原理、技術和應用。這包括對監督自主系統;制導、導航和控制;行為和路徑規劃;傳感器和信息融合;智能戰略和規劃;兵棋推演建模;以及認知電子戰的研究和計劃的回顧。
然后,對將人工智能應用于武器系統的系統和項目進行了調查。雖然重點是基于美國的系統和項目,但也包括一個關于俄羅斯和中國相關系統的小節。最后,我們對將人工智能用于武器系統的倫理考慮進行了簡要評論。
機器學習(ML)和人工智能研究的最新進展揭示了人工智能在實現創新、增加機器的效用以及增強人類能力和經驗方面的力量和潛力。人工智能技術的顛覆性和其影響的深度還沒有被廣大公眾完全掌握。考慮到新時代的新興技術威脅,展示關鍵和相關的人工智能研究和最先進的技術是很重要的,這些技術不僅為武器系統提供了比傳統武器系統更多的自主權,而且大大增加了它們的殺傷力和戰斗生存能力。最終,人工智能在開發改變游戲規則的技術方面帶來了巨大的戰略機遇,這將確保國家安全、繁榮和技術領先地位。
美國軍方在創造先進的常規武器技術方面取得了巨大的進步,這些技術支持了士兵在戰場上的任務并增強了他們的能力。這些常規武器技術大多是自動化系統,在計劃、執行和完成一項任務或使命時依靠一套預先編程的規則。然而,在中國和俄羅斯等國家新開發的武器的前沿陣地上,人工智能支持的戰爭和高超音速武器給美國武裝部隊帶來了新一代的質量挑戰。下一代戰斗的步伐要求為戰略決策進行時間緊迫和大量的戰斗信息處理,這使得美國的許多常規武器系統只能執行低風險的任務,并在核領域之外處于威懾力減弱的態勢。
必須承認,人是昂貴的訓練資產。在戰場上增加更多的人員并不是推進最先進的戰爭的優雅或廉價的解決方案。相反,用支持人工智能的智能硬件來增強人在回路中的系統,可以在戰區提供更多的眼睛和耳朵,并通過使人工智能系統執行一些簡單和常規的任務來釋放人類的決策。
此外,無人駕駛作戰飛機系統(UCAS)是一種成熟的具有成本效益的系統解決方案,用于執行情報、監視和偵察(ISR)任務和遠程空襲。然而,自動化能力仍然受到人類在環形操作、評估和接觸的限制。雖然在任何可預見的未來都沒有打算消除武器化人工智能系統中的人類元素,但人類的能力仍然構成這些系統協同潛力的上限。但是,一個由人工智能驅動的智能武器系統的新生態系統將迎來新的戰爭形式和戰略。
人工智能國家安全委員會在其2021年的報告中提出,美國國防部(DoD)的軍事企業在整合人工智能技術方面落后于商業部門,并敦促在2025年前為整個國防部廣泛整合人工智能奠定基礎[1]。
幾個世紀以來,哲學家們一直在考慮以某種形式人工復制人類智能的某個方面的概念。1869年,威廉-杰農創造了第一臺基于布爾邏輯實現邏輯計算的機器。該機器能夠比人類更快地計算布爾代數和維恩圖。隨著這種邏輯計算機器的發展,人們很自然地質疑機器是否可以通過邏輯推理來為人類解決問題并做出決定。圖1-1中的時間軸顯示了人工智能的歷史和演變,并在本節中進行了詳細說明[2]。
在理論計算機科學的一些最早的工作中,英國數學家阿蘭-圖靈(Alan Turing)思考了機器是否能像人類一樣智能地行為和解決問題的問題。他在他的圖靈測試中提出,如果一臺機器能模糊地模仿人類這樣的智能生物,那么這臺機器就是智能的。這一理論測試成為一種指導性的形式主義,在這種形式主義中,當前的機器被測試其模仿人類智能概念的能力或潛力。作為測試的見證,Loebner獎是一個圖靈測試競賽,其任務是根據圖靈提出的基本問題來評估機器智能研究的現狀。
1928年,約翰-馮-諾伊曼證明了Minimax算法的基本定理,該算法旨在提供一種在零和博弈過程中使最大可能損失最小的策略。
圖1-1. AI歷史年表
在第二次世界大戰的高峰期,阿蘭-圖靈和他的團隊開發了一種機器算法,可以破譯德國的英格瑪信息密碼。他的算法的成功,推動了將復雜任務委托給機器的進一步努力,是機器計算的基礎,也是ML發展的先導。
1943年,McCulloch和Pitts開創了神經網絡(NN)的最早概念--McCulloch-Pitts的形式網絡理論--這在1949年馮-紐曼在伊利諾伊大學的四次演講中得到了體現[3]。
大約在同一時間,約翰-麥卡錫,一位計算機科學家,在1955年創造了 "人工智能 "來指代機器智能;計算機科學家艾倫-紐維爾;以及赫伯特-A-西蒙,一位經濟學家和政治學家,開創了第一個旨在自動推理的真正程序(稱為邏輯理論家)。隨著這一突破性的努力,對智能機器的探索開始了,為人工智能作為計算機科學的一個新的學術研究領域鋪平了道路。
1957年,一位名叫弗蘭克-羅森布拉特博士的心理學家開發了一個名為 "感知器 "的簡化數學模型,描述了我們大腦中的神經元如何運作。這一成就被強調為 "Perceptron收斂定理"。
同年,理查德-貝爾曼開發了動態編程,用于解決一類最佳控制問題。他還介紹了離散隨機最優控制問題的馬爾科夫決策過程表述,這為現在所稱的 "強化學習 "奠定了重要基礎。
在這些發展之后,另一位名叫阿瑟-塞繆爾的人工智能先驅利用他早先在ML方面的開創性工作,成功地開發了第一個檢查者算法。他實現了現在被稱為 "Alpha-Beta修剪 "的早期版本,這是一種搜索樹方法,通過Minimax算法減少評估節點的數量。1959年,一位名叫威廉-貝爾森(William Belson)的統計學家開發了一種名為決策樹的非參數、監督學習方法的早期版本。
在20世紀60年代,人工智能研究的重點是解決數學和優化問題。1960年,羅納德-霍華德提出了馬爾科夫決策過程的策略迭代方法,建立了一些與強化學習有關的最早的工作。
到1968年,著名的路徑搜索算法A-star是由計算機科學家尼爾斯-尼爾森提出的。60年代末,機器人建模、控制和機器視覺方面取得了進展,導致在1972年開發了第一個名為WABOT-1的 "智能 "擬人機器人,并整合了肢體操縱、視覺和語音系統。
Harry Klopf的 "適應性系統的異質理論 "的復興對適應性系統的試錯范式的發展有很大影響。1977年,Ian Witten提出了最早的強化學習系統之一,使用了時間差法。理查德-薩頓和安德魯-巴托設計了一種強化學習算法,稱為演員批評法。
由于70年代中期到80年代末計算機的計算能力限制,人工智能研究在有大量數據處理要求的應用中發現了困難,如視覺學習或優化問題。同時,數學研究 "證明 "了(單層)感知器不能學習某些模式。此外,1973年發表的一份Lighthill報告對人工智能的潛力非常悲觀,這導致人工智能研究的資金被削減。結果,資金短缺導致人工智能的研究經歷了一個被稱為 "人工智能冬天 "的時期。
到了80年代中后期,繼1986年多層感知器的發展之后,在NNs方面也做出了重要的理論貢獻。這些貢獻是David Rumelhart在1986年開發的遞歸神經網絡(RNNs),John Denker等人在1987年開發的貝葉斯網絡,以及Yann LeCun在1989年開發的卷積神經網絡(CNNs)。
此外,Chris Watkins在1989年開發了另一種重要的強化學習方法,稱為 "Q-Learning"。1992年,在IBM的Thomas J. Watson研究中心,Gerald Tesauro通過自我強化學習為雙陸棋游戲訓練了TD Gammon程序。1997年,IBM的 "深藍 "計算機使用粗暴的、基于搜索的算法擊敗了國際象棋世界冠軍加里-卡斯帕羅夫,使其成為第一個在國際象棋中戰勝頂級職業選手的程序。
在90年代末和21世紀初,在ML中看到的大部分進展是由計算機處理、存儲和分布式計算方面的指數級進展所推動的。2007年,需要大量計算資源的保證最優玩法在跳棋中得到了解決。在過去的20年里,圖形處理單元用于通用計算的激增導致了今天人工智能應用的進一步進展,特別是在2012年和2014年,不同的NN拓撲結構,如殘差網絡和生成式對抗網絡的發展。
2015年,ImageNet競賽,一個為約400萬張圖像的ImageNet圖像集開發分類器的公開競賽,有一個冠軍,其錯誤率被認為低于一個人。2016年,DeepMind的AlphaGo程序在擊敗當時被認為是最優秀的圍棋選手李世石后,成為最佳AlphaGo選手。繼AlphaGo的學習能力之后,AlphaZero在2017年擴展了AlphaGo,成為國際象棋和Shogi的最佳棋手。
2019年,美國國防部高級研究計劃局(DARPA)推出了AlphaDogfight,這是基于人工智能的空戰算法在模擬的F-16狗斗中與經過頂級訓練的飛行員進行的一系列三輪競賽。第一輪和第二輪比賽中,人工智能程序相互競爭。第三輪將人工智能勝利者的飛行員提煉出來,與美國空軍武器學校的優秀畢業生進行競爭。蒼鷺系統的人工智能飛行員不僅在競爭激烈的人工智能空中戰斗人員中獲勝,而且在與訓練有素的人類F-16飛行員的較量中取得了令人難以置信的五次勝利。
OpenAI在2020年5月推出了一個名為GP3的 "自然語言處理 "模型,它生成的寫作內容與人類無異。其最新版本可以從簡單的描述性語言生成編程語言代碼[4]。人工智能的歷史繼續向前發展,特別是對國防部的武器系統應用。本報告的其余部分將調查與武器系統有關的當代人工智能技術和系統。
根據Barr和Feigenbaum的說法,人工智能被定義為 "計算機科學中與設計智能計算機系統有關的部分,即表現出我們與人類行為中的智能有關的特征的系統--理解語言、學習、推理、解決問題等等"[5]。
Stuart Russel和Peter Norvig在他們的《人工智能:一種現代方法》一書中對人工智能的最新定義是:"設計和建造能夠從環境中接收感知并采取影響環境的行動的智能體" [6]。
Pei Wang優雅地將智能定義為 "在知識和資源不足的情況下的適應"[7]。雖然該定義沒有說明適應的目的(如目標),但它揭示了為達到這種智能需要完成的工作。
如果要以人類為中心定義人工智能,即執行人類智能水平的任務,那么人工智能需要感知、推理、知識構建、推理、決策和計劃、學習、交流,以及有效移動和操縱環境的能力。
人工智能的科學目標是回答哪些關于知識表示、學習、規則系統、搜索等的想法可以解釋各種類型和水平的真實智能。工程目標是為不同的應用領域開發人工智能技術,以解決現實世界的問題。
在人工智能的科學基礎上,我們發現來自不同科學領域的可識別概念--哲學、邏輯/數學、計算、心理學和認知科學、生物學和神經科學以及進化。在尋求發現和更好地理解人工智能是什么或將是什么的過程中,來自這些不同知識領域的貢獻已經被證明是不可避免和不可或缺的了。許多研究人工智能的領域都在同時構建人類認知如何運作的模型,并在它們之間采用有用的概念。例如,NN,一個源于生物學的概念,試圖在簡化的人工神經元的基礎上建立人工系統,這個概念導致了一個簡單的抽象知識結構的表示,足以解決大型計算問題集。
人工智能大致分為三個主要層級--人工狹義智能(ANI)、人工通用智能(AGI)和人工超級智能(ASI)。圖1-2說明了這三個層級中的各種分組,本節將更多地討論這些分組。
ANI是對一個執行狹窄或單一任務的人工智能系統的描述。它可以包括各種方法來獲得結果,如傳統的ML(以圖像分類為例)或目標檢測(包括ML和基于規則的系統)。給定一組規則或約束,它的目標是提供一組代表狹義任務的輸出。ANI不會擴展或學習新的認知,也不會自我學習新的操作模式。數據挖掘、大多數專家系統和針對某一應用的預測功能(例如,垃圾郵件檢測和面部識別)都被認為是ANI的形式。ANI還包括 "有限記憶人工智能"--用于自動駕駛汽車的系統類型,使用過去的經驗(訓練),并學習做決定,隨著時間的推移而改進。
AGI是一種更強大的智能形式,因為它被更多類似人類智能的特征所增強,例如自主學習的能力和解釋情緒和語音語調的能力。這使得與AGI相關的智能與人類的智能水平相當。AGI的一些關鍵核心能力如下:
ASI是一種超越最聰明的人類頭腦的智能模型。實現ASI的方法仍在概念化中,但將是那些超越AGI并需要某種自我意識的系統。這些系統最好能代表所有人類的認知能力,甚至更多。
ML是機器從數據中學習的能力,目的是做出準確的預測。它大致分為四類學習,提供了豐富的專用和通用的技術家族。
在這種形式的學習中,訓練數據使用包含的輸入和標記的或預定的輸出數據。如果有缺失的輸入或輸出條目,它們會被預處理,以便將一個輸入正確地映射到其真正的對應輸出。通過從正確生成的訓練數據集中學習,系統學會了將不在原始數據集中的輸入與預測的輸出(標簽或值)聯系起來。這種類型的訓練解決的典型問題是回歸和分類[8]。
這種形式的學習中,系統直接從未標記的數據中發現有趣的或隱藏的結構[9]。無監督學習被用于聚類分析、降維或估計可能產生輸入數據的密度[8]。
當數據集包含有標記的和無標記的數據時,這種學習形式的系統利用無標記的數據來更好地捕捉潛在的數據分布,并獲得一個更好的預測,如果它只從標記的數據中訓練的話。這種學習形式適用于訓練數據集中的標注數據遠遠少于未標注數據的情況[8]。
在這種學習模式中,系統使用獎勵/懲罰機制進行訓練,這樣它所選擇和執行的行動,當行動可取時,會使系統得到獎勵,當行動不可取時,會受到懲罰。強化學習問題涉及學習如何做(如何將情況映射到行動上)以最大化數字獎勵信號[9]。
人工智能有可能應用于武器系統生態系統的許多方面。它被用來控制系統,從而實現自主性和提高性能,以在具有挑戰性的環境中選擇指導、導航和控制方面的問題。同樣,人工智能可用于解決任務和路徑規劃中的挑戰性問題,從而實現更高水平的復雜任務目標和操作要求。人工智能也被用于電子戰領域的支持、反制,甚至是反制措施。它還可能被用于來自不同系統層次和領域的信息融合,以泄露抽象的高價值戰場情報,并提供關鍵線索和快節奏的決策,從而在現代戰爭中創造寶貴的戰術優勢。
報告的這一部分將強調最先進的人工智能方法在適用于自主和武器系統的各種人工智能問題領域的使用。它是根據以下問題領域來組織的。
自主性
感知中的人工智能
制導、導航和控制中的人工智能
任務和路徑規劃
智能戰略
對手建模
認知型電子戰
第一章 引言
1.1問題陳述
1.2常規武器系統
1.3 AI簡史
1.4什么是AI?
1.4.1 ANI
1.4.2 AGI
1.4.3 ASI
1.5 ML
1.5.1監督學習
1.5.2無監督學習
1.5.3半監督學習
1.5.4強化學習
第二章 最先進的方法
2.1學習人工智能范例
2.1.1深度學習
2.1.2強化學習
2.2隨機優化和搜索算法
2.2.1隨機優化
2.2.2圖形搜索算法
2.3新興人工智能范例
2.3.1神經符號AI
2.3.2 NE
第三章 人工智能在武器系統中的應用
3.1自主性
3.1.1定義、級別和框架
3.1.2自主系統的功能組件
3.2感知中的人工智能
3.2.1圖像分割
3.2.2目標檢測、分類和場景理解
3.2.3傳感器融合
3.3制導、導航和控制中的人工智能
3.3.1 GN&C系統
3.3.2常規控制理論方法
3.3.3智能控制
3.3.4本地化和導航
3.3.5系統識別
3.4任務和路徑規劃
3.4.1GAs
3.4.2群體智能
3.5智能策略
3.6對手建模和兵棋推演
3.7認知電子戰
3.7.1電子支持措施
3.7.2 ECMs
3 .7.3 ECCMs
第四章 將人工智能應用于武器系統的系統和程序
4.1天線系統
4.1.1下一代空中優勢計劃
4.1.2 Shield AI Hivemind
4.1.3 Shield AI V-Bat
4.1.4 Kratos XQ-58 Valkyrie
4.1.5 MQ-20 Avenger UCAS
4.1.6自主彈藥
4.1.7 Dynetics X-61小精靈
4.2 海軍系統
4.3 陸軍系統
4.3.1 QinetiQ/Pratt Miller的遠征自主模塊化飛行器
4.3.2Textron系統公司的Ripsaw M5
4.3.3 Rheinmetall公司的Lynx KF41
4.4 群系統
4.4.1 DARPA的攻擊性蜂群戰術
4.4.2自主協同小直徑炸彈群
4.4.3 Perdix群
4.4.4 Mako UTAP22
4.4.5 Coyote UAS Block 3
4.4.6機器人代理命令和傳感群的控制架構
4.4.7激流勇進微型無人潛水器
4.5戰斗管理和智能指揮與控制
4.6 ISR和目標系統
4.6.1 SRC的HPEC Pod
4.6.2復仇女神
4.7導航
第五章 未來作戰中的AI
第六章 人工智能和外來威脅
6.1俄羅斯
6.2中國
第七章 倫理考量
第八章 總結
參考文獻
在美國國防部,人工智能(AI)/機器學習(ML)的整合目前是以現有項目的升級或新項目的收購形式進行的。怎么知道這些AI/ML支持的系統會按照預期的方式運行?為了做出這個判斷,與其他傳統的軟件開發/采購項目相比,AI/ML產品開發/采購需要一個獨特的評估過程。作為回應,美海軍軍械安全和保障活動(NOSSA)資助了以下研究,以調查獨特的政策、指導方針、工具和技術,以評估AI/ML關鍵功能中的安全問題。在這項工作中,開發了14項關鍵的嚴謹度(LOR)任務,并在五個階段中應用:(1)需求,(2)架構,(3)算法設計,(4)算法代碼,以及(5)測試和評估(T&E)。14項LOR任務涉及最佳實踐討論、定義、測量、論證文件和AI/ML系統特有的危險分析格式。這14項LOR任務還明確了為什么AI/ML軟件開發需要采購界的特別考慮。此外,這項研究有可能影響采購界如何定義需求、創建架構、產生AI/ML算法設計、開發AI/ML算法代碼以及執行T&E。在開發 "采購沙盒"的過程中,跨越五個發展階段的14項LOR任務的需求變得很明顯,該沙盒研究了部署AI/ML自主系統的路線規劃者,以及讓這些系統交付軟件包,重點是評估關鍵功能行為的安全性。該沙盒是使用國防部架構框架(DoDAF)和統一建模語言(UML)圖設計的,其中包含了各種AI/ML技術。當面臨這種程度的復雜性和/或不確定性時,14項LOR任務代表了一組有凝聚力的問題/考慮因素,為應對當前海軍AI/ML的采購問題提供了重點。這些指南還為涉及安全的組織,如NOSSA和適航性,以及包括項目經理和系統工程師在內的采購專業人員提供了一個分步驟的 "如何 "評估方法,以確保創造高質量的人工智能嵌入式產品。
該報告為包含人工智能功能的系統的采購和開發提供了詳細的指導方針。該準則允許用戶在作戰部署的挑戰中對人工智能功能的行為建立不同程度的信心。信心的程度決定了14個LOR任務中的哪一個在五個階段中被應用。每個LOR任務提供了問題和/或考慮因素,使開發人員能夠客觀地評估人工智能/ML功能的安全性和可靠性。當審查每個LOR任務時,LOR任務編號(和相關階段)后面的 "參考編號 "是指用于開發問題和/或考慮因素的文件中的相應標識(ID)。這四份文件的標題分別是:(1)操作視圖(OV),(2)系統視圖(SV),(3)數據集設計,和(4)算法設計。LOR任務 "參考ID "命名法的例子是Ops1、Sys1、Alg1和Dat1。在這些例子中,每個ID與四個文件中的一個有關,其中數字 "1 "表示文件中描述的第一個LOR任務。在每個文件中使用 "Ref ID "支持對研究的可追溯性,包括數學。
一系列因素(射程空間減少、空域限制、武器系統可用性、缺乏目標模擬能力、敵對能力監測)正在推動北約向分布式合成訓練過渡。為了幫助實現這一轉變,北約科技組織(STO)成立了MSG-165任務組,負責為聯合和聯盟空中行動通過分布式仿真(MTDS)執行任務訓練。
MTDS能力的發展并不局限于MSG-165的工作;事實上,它是北約的智能防御計劃之一,由美國贊助,因此在各個層面都有很好的知名度,但仍然未能取得必要的進展。雖然仍有一些挑戰,但該小組迄今為止所開展的工作已經為北約現有的其他合成訓練問題提供了解決方案。這些都體現在文件中,包括:
建立共同的空中訓練目標,幫助確定聯盟的訓練要求,幫助調整適當的訓練媒體。
制定參考架構原則,為聯合MTDS能力的使用提供基礎。
建立MTDS能力驗證演習,稱為 "斯巴達勇士20-9"(SW 20-9)。SW20-9是對以前“斯巴達勇士”方案的修改,是一個由美國空軍-非洲作戰中心(UAWC)協調的多邊參與機會,通過北約機密級別的聯合戰斗實驗室(CFBL)網絡為聯盟伙伴提供持續的連接,進行日常的、以聯盟為中心的、由單位領導的訓練。
制定MSG-165關于如何利用MTDS來支持北約空中作戰訓練的設想。在開發這個愿景時采用的方法顯示了更廣泛的效用,并有可能用于幫助其他部門確定他們自己的未來培訓愿景。
本文將強調在建立一個共同的北約聯合MTDS環境方面所取得的成就。
Arjan Lemmers是英國皇家海軍陸戰隊的高級項目經理。他是北約MSG-165任務組MTDS的聯合主席,在國際分布式任務訓練計劃方面有長期經驗。Arjan也是機載嵌入式訓練系統和LVC互操作性方面的專家。Arjan領導著這個領域的幾個研發項目,并且是幾個國際社區中這些主題的主要參與者。
Clark Swindell是美國空軍作戰中心(UAWC)的建模和仿真主管。他在通過聯合模擬提供分布式訓練方面有豐富的經驗,是NMSG-165的美國國家負責人。克拉克的經驗主要集中在大規模演習,使用聯合模擬,如JLVC,JLCCTC和BLCSE,這些都是使用分布式仿真和玩家的位置,以及整合LVC互操作性和合成環境。
Richard Hemmings是亨廷頓-英格爾斯工業公司(HII)的承包商,是美國空軍作戰中心(UAWC)的LVC集成和開發負責人。最初,他在UAWC作為操作主題專家(SME)和多國LVC演習的項目官員工作,后來他被調到 "未來計劃 "工作,負責整合和開發。作為專家加入北約MSG-165任務組,理查德幫助領導UAWC的工作,主持驗證演習。
北約和各國都需要進行聯合的集體訓練,以確保任務準備就緒。一系列的因素(射程空間的減少、空域的限制、武器系統的可用性、目標模擬能力的缺乏、敵對能力的監測)促使北約向分布式合成訓練過渡。為了幫助實現這一轉變,北約科技組織(STO)成立了MSG-165任務組,負責為聯合和聯盟空中行動通過分布式仿真(MTDS)執行任務訓練的增量實施。
本文將強調在建立一個共同的北約聯合MTDS環境方面取得的成就。它首先解釋了北約MTDS能力的背景,以及之前為實現這一能力所做的努力。然后,它提出了訓練目標,并描述了實現這一即將到來的重要訓練能力的步驟。隨后是MTDS原則的定義,為多個利益相關者的觀點提供要求和標準。這促成了MTDS參考架構,它提供了一個符合上述架構原則的通用和可重復使用的描述。在下一部分中,考慮了為聯盟集體訓練部署MTDS跨域安全解決方案時應考慮的安全問題。本文最后對斯巴達勇士20-9演習進行了展望,該演習被用作北約MTDS能力的驗證演習。
合成能力已經成為滿足北約軍事力量作戰訓練需求的一個重要工具。新的系統和平臺正變得越來越復雜,需要更多的準備時間來使用。技術能力的提高和成本的降低,再加上環境限制的增加和對實戰活動的敵對(電子)監控能力的提高,使得合成訓練的使用更具吸引力。因此,通過分布式仿真任務訓練(MTDS)實現的集體訓練(CT)對北約和成員國的準備工作變得越來越重要。許多成員國正朝著更多地使用先進的模擬進行任務訓練和采用國家MTDS能力的方向發展,但北約目前還沒有一個集體的MTDS能力來利用這些發展進行聯盟CT。
過去,北約在這一領域采取了一些舉措,從2000年開始進行了關于MTDS的SAS-013研究(NATO RTO SAS-013, 2004)。這項研究確定了參與國的空勤人員任務訓練的做法和局限性,并確定了先進的分布式仿真是否能加強北約飛行員和空勤人員的訓練。它提出了未來的方向,將促進北約空勤人員培訓和任務演練的分布式仿真能力的發展。這在2004年的培訓示范演習First WAVE中得到了推進,即 "虛擬環境中的第一個作戰人員聯盟"(NATO RTO SAS-034,(2007)。第一次波浪演習沒有遇到不可克服的技術障礙,并證實MTDS可以提供一個重要的新能力來滿足北約的任務培訓需求。MTDS工作組建議,北約和聯合國應認可MTDS的潛力,并共同努力將MTDS推進到作戰能力。第一波倡議的后續是北約SMART(2007年)、北約現場、虛擬、建設性(LVC)(2010年)項目,以及2011-2012年北約工業咨詢小組(NIAG)關于空中聯合任務訓練的分布式仿真研究小組(NIAG SG 162,2012)。這些研究為北約MTDS行動概念(CONOPS)的發展提供了越來越清晰的思路。然而,沒有一項研究提供了持久的MTDS能力,目的是支持作戰人員為未來行動實現任務準備。鑒于演習預算的減少,可用于實戰演習的資產的減少,以及現實模擬復雜威脅環境的難度的增加,北約缺少一種具有成本效益的手段來提高未來聯合作戰的集體行動準備能力。
北約建模與仿真小組(NMSG)的任務是 "開發和利用建模與仿真(M&S),使聯盟及其合作伙伴受益"。上述考慮是NMSG在2013年啟動MSG-128任務組 "通過分布式作戰逐步實施北約任務訓練"(NATO STO MSG-128, 2018)的動機。MSG-128研究已經驗證了連接異構作戰訓練模擬器的技術可行性,以便為多國空中任務演習提供真正的訓練價值。它已經起草了MTDS參考架構,為多國訓練演習提供了一個初步的基線,即使在促進MTDS演習就業方面仍有許多差距。多國MTDS演習的成熟將是一個漫長的過程。MSG-128小組建議,為達到這一成熟度,有以下幾個努力的軸心(Lemmers和Faye等人,2017):
在小型/中型演習的操作成熟度方面取得進展,為上述確定的差距提供技術解決方案。
繼續在作戰演習環境中驗證這些解決方案,并將這些解決方案整合到MTDS最佳實踐文件中。
將MTDS演習的可擴展性擴展到大型和聯合演習,包括空軍、海軍和陸軍之間的空域互操作性,以及包括聯合情報、監視和偵察(JISR)。這一行動將是LVC發展和MTDS在多國聯盟演習中使用的一個助推器。
MSG-128在2018年被后續任務組MSG-165 "通過分布式仿真為聯合和聯盟空中行動逐步實施任務訓練 "所接替,該任務組將持續到2021年初。其目標是為北約持久的MTDS環境建立基本要素,并通過初步的操作測試和評估來驗證這些要素。MTDS能力的發展并不局限于MSG-165的工作;事實上,它是北約的智能防御計劃之一,由美國贊助,因此在各個層面都有很好的可見度,但可悲的是仍然未能取得必要的進展。雖然仍有一些挑戰,但該小組迄今為止所開展的工作已經為北約現有的其他合成訓練問題提供了解決方案。這些都體現在文件中,包括
建立共同的空中訓練目標,幫助確定聯盟的訓練要求,幫助調整適當的訓練媒體。
制定參考架構原則,為聯合MTDS能力的使用提供基礎。
建立空中MTDS能力驗證演習,稱為 "斯巴達勇士20-9"(SW 20-9)。SW20-9是由美國空軍非洲作戰中心(UAWC)協調的一個多邊參與機會,為聯盟伙伴提供北約機密級別的聯合戰斗實驗室(CFBL)網絡的持續連接,以進行日常的、以聯盟為重點的、單位領導的訓練。
制定MSG-165關于如何利用MTDS來支持北約空中作戰訓練的設想。在開發這個愿景時采用的方法顯示了更廣泛的效用,并有可能用于幫助其他部門確定他們自己的未來培訓愿景。
為了提供最大的價值和效率,北約MTDS必須關注現有訓練安排中沒有涉及的領域。因此,它不尋求復制通過現有國家或北約活動提供的訓練,而是提供額外的聯盟合成訓練能力。北約有能力提供作戰航空部門指揮能力的合成集體訓練(CT)。然而,它還沒有能力對空中指揮部(ACC)以下的戰術能力進行綜合訓練。在合成提供 "從輪子到輪子 "的空中活動方面的這一差距,是北約MTDS提供訓練的主要重點。然而,為了實現端到端的合成訓練,任何未來的系統都應該能夠連接到現有的北約合成訓練能力,特別是支持(NATO STO MSG-165, 2019):
合成傳播和執行空軍司令部(ACC)訓練衍生的空中任務指令(ATO)、空域控制指令(ACO)和特別指令(SPINS)。
ACC執行階段的訓練,將合成訓練的任務與ACC戰術人員聯系起來,支持其動態訓練。
空中訓練的要求可以分成三個日益復雜和具有挑戰性的層次,如圖1所示,并在下文中描述:
第1級:個人能力,涵蓋人員的個人訓練和貨幣,安全地發揮作用。
第2級:戰術團隊訓練,訓練分隊的 "基石",為個人和隊員的作戰戰術和程序做準備。
第3級:戰術集體訓練,為復雜的空中行動提供訓練,需要多種空中能力和單位來完成一個行動任務。
在這三個級別中,1級和2級培訓將仍然是國家的責任。然而,3級戰術集體訓練是北約MTDS的關鍵多國要求;這源于許多國家難以實現這一級別的現實訓練所需的密度和能力范圍。盡管如此,在北約MTDS剩余能力允許的情況下,作為次要的優先事項,MTDS將用于2級訓練,作為提高這種訓練的真實性和復雜性的一種手段。
圖1:空中訓練的級別
為確保任何未來的MTDS能力能夠滿足必要的作戰訓練和演練要求,必須確定MTDS將提供的作戰訓練類型。因此,通過與MSG-165行動小組代表協商,制定了北約聯盟反恐目標(CCTO)(NATO STO MSG-165,2019)。這項工作提供了50個CCTVO。這些CCTVO被分組,以提供MTDS解決方案必須能夠支持的廣泛任務集,并幫助未來的培訓設計。以下任務集被確定。攻擊、進攻性反空、防御性反空、空中C2、空中機動性、空中情報監視和偵察、戰斗支援、空地一體化和空海一體化。
在第1級和第2級活動中的個人和構件訓練中,重點是確保機組人員能夠在駕駛艙內采取必要的行動來有效地打擊他們的平臺。然而,在第三級培訓中,雖然正確的機組人員行動仍然很重要,但概念上的重點卻發生了微妙的變化。第三級培訓必須提供培訓機會,以確保在通常大型和復雜的編隊中,控制人員和機組人員之間發生正確、及時的C2互動,如圖2所示。
圖2:將在CT環境中復制的操作互動
與1級和2級培訓相比,3級培訓的重點發生了微妙的變化,允許更加關注合成培訓的交付。因此,雖然大型實戰演習仍然是實現訓練真實性、建立信心和戰略信息的重要手段,但北約空中訓練的更大比例可以在合成環境中常規實施。這一假設已經在MSG-165行動小組中進行了討論和測試,主要的結論是,對于3級多國訓練,對于任務集,超過50%的訓練可以以合成方式進行。
北約MTDS能力旨在將國家或北約的模擬資產整合到一個分布式的合成集體訓練環境中,這些資產通過一個共同的模擬基礎設施連接。仿真資產一般通過網關或門戶連接到該基礎設施。合成訓練環境的一致性也是參與集體合成訓練和演習的模擬資產的互操作性的關鍵。含有合成環境數據的數據庫的制作可能是整個M&S成本的重要組成部分,這意味著應該促進重復使用。仿真資產提供者通常使用相同的高級流程來生成他們的環境數據產品,但詳細的數據生成流程因生產商或集成商的不同而略有不同。這些差異使數據重用變得復雜,并危及目標應用的最終互操作性。
為了實現MTDS的合成集體訓練環境,能夠快速響應新的訓練需求,需要為訓練環境的開發和工程制定共同的流程和技術協議。由于技術協議通常是在每次演習中制定的,因此仍然缺少一個具有相關工程流程和技術協議的共同認可的模擬基礎設施。這就是MTDS參考架構(RA)發揮作用的地方(van den Berg, Huiskamp, et al., 2019)。該參考架構以構件、互操作性標準和模式的形式概述了MTDS的要求,用于實現和執行由分布式仿真支持的合成集體訓練和演習,與應用領域(陸地、空中、海上)無關。MTDS RA的重點是合成集體訓練和演習,因此將包括具有MTDS特定功能和接口的構件和模式。由于RA是在北約范圍內開發的,它也將利用北約的模擬互操作性標準。
用于特定訓練或演習活動(如 "斯巴達勇士 "演習系列)的模擬環境架構被稱為解決方案架構。由于MTDS的RA為合成集體訓練環境提供了一個 "模板解決方案",因此解決方案架構中使用的許多元素的要求原則上應來自RA。但是,可能還需要進行一些改進,以滿足特定事件的要求。這可能包括選擇仿真協議和特定的中間件解決方案(DIS、HLA)、網關組件、跨域解決方案、數據記錄工具,以及代表合成物理環境(SPE)的協議和格式。參考數據交換模型是通過RA提供的,但解決方案架構仍然需要就這些參考數據交換模型中的哪些具體部分將在具體事件中使用達成協議。
通常情況下,各套原則形成一個層次結構,即架構原則將被企業原則所告知、闡述和約束。架構原則定義了使用和部署資源和資產的基本一般規則和準則。它們反映了企業各要素之間的某種程度的共識,并形成了做出未來決策的基礎。在MSG-165中,為MTDS定義了10個主要的架構原則。下面將討論這些原則。
1.支持北約行動的合成集體訓練和任務演練 MTDS工作的主要預期應用是在北約范圍內的合成集體訓練。應為單一服務和聯合行動開發一個共同的技術和程序解決方案。就技術要求而言,任務演練被認為與任務訓練密切相關。
2.啟用(混合的)現場、虛擬和建設性資產 MTDS應(在未來)支持(混合的)現場、虛擬和建設性的模擬玩家。聯合行動和聯合行動的集體訓練需要有許多模擬實體的復雜訓練場景。訓練對象通常會在實戰、虛擬和混合的LVC環境下進行訓練。解決方案應支持LVC的混合集成。
3.提供靈活性和發展能力 許多國家已經使用模擬系統進行訓練。然而,這些現有的系統在技術上往往是非常不同的。MTDS RA應定義一個框架,該框架在技術上是先進的,沒有限制性(例如,可擴展新的模擬資產),并且不會不必要地阻礙訓練(例如,帶寬,穩健性)。應定義門戶或網關,以允許在MTDS中整合遺留系統,并允許MTDS所需的靈活性。
4.使用開放標準 北約提倡使用開放標準,因為它促進了成本效益的互操作性。開放標準可以被所有各方自由使用。對私人方(如供應商)的使用沒有任何限制。
5.遵守北約政策和標準 MTDS應遵守北約關于M&S互操作性和標準的政策和協議。偏離這一原則需要說明理由,包括對合適的北約標準的評估和與替代解決方案的比較。
6.支持在北約保密級別或最高級別使用 MTDS應支持北約行動的合成訓練和任務演練。系統、理論和任務執行的保密方面需要得到保護。應就系統、網絡、場地和能夠接觸上述內容的人員的實施和認證達成協議。
7.在一次演習中支持多個安全域或飛地 應就屬于不同飛地的系統、網絡、場地和人員之間的信息交流的實施和認證達成協議,可能通過使用CDS解決方案。每個國家和北約之間的CDS解決方案的認證將由每個國家承擔。
8.提供有代表性的訓練環境 MTDS應提供一個有代表性的集體訓練環境,以支持演習中所有參與者的公平競爭(或公平戰斗)。仿真系統性能的差異不應導致某些參與者獲得不現實的(不)優勢。
9.解決多個利益相關者的觀點 MTDS使用RA來提供對特定MTDS解決方案設計的通用和可重復使用的描述。RA是以架構構件的形式來描述的,對這些構件的解決方案有要求和適用標準。為了實施MTDS,將涉及不同的利益相關者。這些構件應該為不同利益相關者的觀點提供指導。
10.通過聯網模擬器為北約和國家的集體培訓提供具有成本效益的培訓解決方案,不得對用戶以及各中心及其工作人員施加不可接受的限制,因為這些限制不值得花費時間,也不能被行動上的好處所抵消。
MTDS原則為多個利益相關者的觀點提供了要求和標準。MTDS RA提供了一個符合上述架構原則的通用和可重復使用的描述。它使用了架構積木(ABB)和架構模式(AP)的概念來定義應用和服務的框架,使國家訓練系統能夠被整合到一個分布式的合成集體訓練環境中。圖3提供了該框架中主要ABB的概述。
圖3:MTDS框架的應用和服務
圖3中的應用是面向用戶的能力,與稱為服務的后端能力互動。例如,圖中顯示--在解決方案層面--將有一個或幾個用于場景準備的應用程序;這些軟件組件與后端服務實現(如威脅生成服務)互動,向這些服務提供模擬場景數據。框架應用和服務的一個子集(門戶服務、面向消息的中間件服務、威脅和跟蹤生成服務以及合成自然環境(SNE)服務)在(van den Berg, Huiskamp, et al., 2019)中有更詳細的討論。
北約國家有必要在北約MTDS演習中整合和操作其國家或主權機密模擬資產,以實現其共同的空中集體訓練目標。同時,北約國家希望保護這些最敏感或最機密的資產、其基礎數據和信息,防止因加入這種北約MTDS演習而受到(網絡)安全威脅。在不同國家敏感度、信任度或安全分類級別的模擬資產之間實現安全連接和互操作性,對于成功實施北約MTDS能力和演習至關重要。
M&S跨域安全(CDS)服務旨在滿足這一要求,使北約國家能夠通過共同共享的北約MTDS模擬主干,對位于其國家安全領域的模擬資產進行安全互操作。在這種情況下,安全域被定義為在一致的安全政策下運行的模擬資產,并由一個組織、國家和/或安全認證機構(SAA)擁有。安全政策定義了關鍵要素,如安全分類、可釋放性、利益共同體和任何其他對模擬資產中包含和處理的實際軍事系統和理論的數據和信息的特殊處理注意事項。
在這里,M&S CDS被定義為一個由安全強化服務組成的系統,該服務是為減輕在不同安全領域運行的模擬資產之間傳輸模擬數據的特定安全風險而定制的。這樣的M&S CDS可以被看作是一種網關環境的形式。與普遍應用的M&S(網絡)網關不同,M&S CDS提供了廣泛的安全控制,以提供全面的模擬數據過濾和深度防御,具有更高的保障水平。M&S CDS服務是保護整個北約MTDS基礎設施及其組成的模擬資產免受所有形式的安全威脅所需的整個安全措施的一個專門部分。除其他外,這包括:模擬資產和設施的物理和網絡邊界保護裝置,模擬資產或設施與網絡連接的物理安全,模擬資產和監測之間的加密通信保護,人員安全許可和意識培訓。這些常見的安全措施對于MTDS演習的安全執行也應到位。
理論上,可以設想許多通用的應用拓撲結構,其中部署M&S CDS解決方案,以確保在多個安全域之間進行受控和安全的模擬數據交換。然而,在實踐中,這種拓撲結構的實施必須符合具體的使用案例和威脅環境所施加的跨域安全要求和限制。這意味著分布式仿真環境的跨域安全不僅僅是孤立地關注M&S CDS設備(如數據節點、防護裝置或信息交換網關)。只有當每個連接的安全域內的模擬資產和網段滿足某些可信的安全政策、實踐和要求,并且其相關的安全風險被充分理解和接受時,才能保證整個分布式仿真環境的適當安全水平(反之亦然)。因此,在北約MTDS用戶背景和威脅環境下,在為聯盟集體訓練部署M&S CDS解決方案時,應考慮以下安全因素。
1.最重要的是,每個北約國家需要保持對其國家擁有的模擬數據和信息的完全控制,以及在MTDS訓練演習之前、期間和之后如何共享這些數據和信息。這意味著每個國家將始終通過本國擁有的CDS設備將其機密模擬資產與北約MTDS模擬主干連接起來,這些設備受本國的SAA和安全政策的約束。
2.所有將參加北約MTDS演習的北約國家都使用私營軍事網絡北約聯盟戰斗實驗室網絡(CFBLNet)作為共同的網絡基礎設施,以連接他們的機密模擬資產和其他相關的培訓應用,直至北約機密級別。這意味著參與的北約國家有一個共同的協議,在每個國家對這些資產或應用的安全等級執行方面相互信任,在此基礎上,他們可以通過這個網絡連接、共享數據和信息。因此,目前,從這個北約CFBL網絡到較低信任安全域的級聯連接對任何北約國家來說都是非常不可取的,甚至是不可接受的。
3.北約MTDS將部署符合北約STANAG和標準的仿真互操作性中間件服務(如HLA、DIS和TENA),以便在一個統一的分布式仿真環境中對國家仿真資產進行互操作,用于集體任務訓練和演習。目前,這些中間件標準通過一個共同的共享數據空間和模擬信息交換數據模型來交換模擬數據,而這并不提供任何安全措施。這意味著,任何國家只要能進入北約CFBL網絡,并被允許用正確的加密密鑰加入特定的MTDS演習,也可以直接訪問參與模擬資產之間交換的所有模擬數據。因此,這個集體模擬數據集是MTDS演習中所有參與國(即安全領域)的 "共享秘密"。
4.M&S CDS部署拓撲結構過于復雜,將使每個國家安全領域內的機密模擬資產的安全保障和操作復雜化,并可能增加攻擊面、轉換數據流渠道的風險以及與較低信任環境的級聯連接。這意味著過于復雜的部署拓撲結構可能會在整個MTDS演習準備、執行和匯報階段給北約國家帶來額外的成本和準備時間。因此,CDS的部署拓撲結構應該在滿足國家安全和培訓要求的前提下,設計得盡可能的簡單。
圖4描述了在北約MTDS演習中部署M&S CDS的參考拓撲,該拓撲是根據前面提到的安全考慮因素確定的(Roza,等人,2020)。
圖4:北約MTDS CDS部署的參考拓撲結構
該參考拓撲結構反映了這樣一種典型情況:參與北約聯盟級分布式仿真環境的仿真資產由不同的國家擁有,因此屬于受不同SAA管轄的安全領域。為了確保每個國家完全控制其國家擁有的機密模擬數據,以及如何與其他國家共享這些數據,每個國家通常應使用自己的CDS設備。在這里,每個國家的CDS首先將自己的主權機密模擬數據集轉換并映射成可釋放的數據集,然后根據商定的集體模擬信息交換模式將其發布到集體共享的模擬數據集中。這種共享數據受到共同商定的安全措施的集體保護,如數據加密,以確保通過第三方網絡基礎設施進行保密信息交流,并對每個國家的參與模擬設施采取安全措施,以獲得加入北約MTDS聯盟級演習的權限。反之,國家擁有的CDS設備可以保護單個或聯合的國家機密模擬資產免受來自北約CFBL網絡的網絡攻擊,包括因訂閱共享數據空間的數據而導致的未經授權的模擬數據入侵。
從UAWC的演習選項中選擇,"斯巴達勇士 "活動是通過分布式仿真進行的多國、以空中為重點的訓練。這次演習將在北約的CFBL網絡上進行,在四天的時間里使用每個國家的模擬或仿真器通過DIS和HLA進行連接。UAWC模擬/環境生成器將提供整體的合成環境、安全語音、聊天功能和紅色部隊來填充該領域。
為了建立支持大規模演習所需的行動區域,UAWC雇用了其他模擬中心的專家,包括空戰訓練中心(英國皇家空軍瓦丁頓空軍基地)、北約預警系統ASCOT控制員(北約蓋倫基興航空站)和萊昂納多公司(意大利)。此外,計劃中的參與包括法國空軍(FAF)、意大利空軍(ItAF)、北約預警系統、英國皇家空軍(UK)、加拿大皇家空軍(RCAF)、荷蘭皇家空軍(RNLAF)、西班牙空軍(SpAF)、美國空軍(USAF)和美國陸軍(USA)。因此,它還將通過采用嵌入盟軍控制和報告中心(CRC)和北約預警機的美國陸軍防空炮火控制官(ADAFCO)來實現聯合和北約的互操作性訓練。為了繼續提供互操作性的機會,演習還將通過北約預警機E-3、建設性的E-8 JSTARS和皇家空軍RC-135 "鉚釘 "聯合模擬器支持情報監視偵察(ISR)的 "鐵三角"。這種ISR融合能力模擬了關鍵的現實世界ISR整合,以提高跨平臺和機構的決策技能。這項培訓還將在盟軍CRC和聯合戰術空中管制員(JTAC)之間執行美國空軍支援行動中心(ASOC)的連接。最后,為了支持這項工作,將有多架反空和攻擊飛機,包括建設性的和有人駕駛的模擬器,通過故意瞄準(DT)、打擊協調和偵察(SCAR)以及近距離空中支援(CAS)來支持協調打擊。
由于有機會進行驗證演習,目前建立的基礎設施和系統得到了利用。由此產生的系統和網絡提供了探索規定的RA和CDS配置的混合機會。因此,支持演習的數據被記錄下來,用于進一步的參考架構測試和比較,這使得演習規劃者能夠專注于實現MTDS CONEMP(NATO STO MSG-165, 2019)中概述的聯盟集體訓練目標(CCTO)。通過在整個演習責任區(AOR)創造3級訓練機會,集中精力實現盡可能多的CCTVO,演習策劃者能夠將50個CCTVO中的37個作為計劃目標(NATO STO MSG- 165,2019)。
參照上圖2,不同的任務和飛機類型之間的相互作用有助于建立3級訓練的復雜性。為了開始建立所需的部隊互動過程,規劃者希望建立一個能夠支持現有參與者所需復雜性的戰斗空間。隨著四(4)個指揮和控制(C2)元素的使用,結構化的通道被分配給每個C2元素。有了這些通道,就需要控制戰斗機的進攻/防御行動,以及確保空中加油保持所需的CAPs的支持要求。這種最初的集體行動將戰斗機及其加油機與控制它們的C2機構聯系起來,以滿足聯合空中作戰司令部(CAOC)在規劃文件中制定的規定的區域防空計劃(AADP)。這種看似簡單的互動現在發生在四(4)個不同的元素之間,可以想象是在四(4)個不同的地點。對于 "斯巴達勇士 "20-9,意大利空軍(ItAF)的歐洲戰斗機在作為C2機構的北約預警機控制的航道上與作為建設性實體的UAWC控制的加油機之間的互動現在將3個不同的單位聯系在一起,以實現一個相對良性的集體訓練目標,AAR.02--在同一地點進行空對空加油。同樣地,一個集體可以通過綜合空中行動(COMAO)完成一個更復雜的舉措,以實現進攻性反空(OCA)目標OCA.01(護航),OCA.02(戰斗空中掃蕩)和SEAD.01(壓制敵人防空)。為了建立這個集體目標,規劃人員利用C2機構在機會窗口期間將屬于COMAO包的飛機組織到他們的集結點,然后提供空中掩護(護送),假設達到CAOC的規劃文件規定的可接受的風險水平(ALR)。這個目標給C2機構帶來了決策,他們有能力從以前的打擊中辨別出ALR(防空設施是否被充分壓制?)、COMAO包的狀態、護航OCA組的狀態以建立空中控制,然后是打擊發生后的戰斗損傷評估(BDA)信息。這些集體行動現在占了多個地點的多個小組,處理融合的情報(敵方防空狀態),以及打擊前和打擊后的有效信息交流。
對于MTDS事件的規劃者來說,場景的復雜性不應掩蓋手頭任務的復雜性。在這種情況下,規劃文件根據ALR定義了限制,并建立了已知的時間事件來創建這些打擊窗口。這就創造了機會,或缺乏機會,基于提供給決策者的輸入--在這種情況下,接受培訓的C2機構。對于演習策劃者來說,所需的CCTVO成為驅動特定場景的焦點。通過創建這些決策點,在多個平臺上收集相關信息,所有這些平臺都在為已知的事件進行協調,從而實現了集體訓練點。在更大的事件中,實現這些功能的機會可能會在細節和機會的海洋中消失,以引起更大的力量反應。然而,正是通過保持任務的簡單性來控制信息的流程和流動,才可以在不影響訓練對象或創造支持環境的白軍元素的情況下常規地實現CCTO。
最后,為了改變行動區的任務,特定的任務集在整個行動區被輪換使用。這種輪換使不同的C2機構能夠在四個演習日的每一天改變他們的重點。當一些機構負責支持CAS時,其他機構則負責協調COMAO包、SCAR資產或動態目標事件。此外,戰斗的性質在四天的演習中也有所改變。通過不保持時間線(演習第1天=第100天,演習第2天=第101天,等等),計劃者可以用較小的每日投入進一步構建演習事件。在這個例子中,演習日以10天為單位向前移動。這樣,雙方的補給都可以完成,但更重要的是,戰爭的基調可以得到調整。對于SW20-9來說,10天的增量提供了創造紅方部隊推進日、藍方部隊推進日、停火(以及隨后重新陷入戰爭)日和僵局日的機會。這些都會在對事件的整體解釋中產生色調和變化,從可能的叛逃者到自相殘殺的擔憂,都需要加以考慮。這些變化為所有玩家提供了一系列的事件和任務集,以解釋和建立他們的行動方案,從而增加集體的訓練機會。
北約內部MTDS能力的發展并不限于MSG-165的工作。MSG-180工作組努力在海洋領域建立MTDS能力(名為LVC-T)(NATO STO MSG-169. 2019)。此外,這兩個小組的工作與MSG-164建模與仿真服務(MSaaS)有關(NATO STO MSG-164. 2018)。MTDS也是北約的智能防御倡議之一,由美國贊助,因此在各個層面都有很好的知名度,但遺憾的是仍然未能取得必要的進展。為了幫助這個問題,我們打算通過將海洋領域納入MTDS倡議,將智能防御的努力結合起來。雖然仍有一些挑戰,但迄今為止所開展的工作已經為其他現有的北約合成訓練問題提供了解決方案。這些問題包括:
分析未來的空中訓練需求,從而重新確認多國MTDS活動的好處。
建立共同的空中訓練目標,幫助確定聯盟的訓練要求,幫助調整適當的訓練媒體。
制定參考架構原則,為聯合MTDS能力的使用提供基礎。
制定MSG 165的愿景,即如何利用MTDS來支持北約空中業務培訓。在開發這個愿景時采用的方法顯示了更廣泛的效用,并有可能用于幫助其他部門確定他們自己的未來培訓愿景。
為了支持北約聯合MTDS的發展,我們提出了以下建議:
發展北約綜合演習要求,從北約贊助的年度MTDS演習開始。這將有助于提高整個北約對MTDS能力和好處的認識,并有助于為MTDS的培訓制定必要的優先次序。
正式確定聯盟對未來多國合成訓練的期望。我們相信,這將帶來巨大的好處,并提供必要的自上而下的方向和指導,以幫助推動MTDS能力的發展,這是一個初步要素。
本文介紹的工作是由以下北約國家和組織在MSG-165任務組中合作完成的。比利時、加拿大、法國、德國、意大利、荷蘭、挪威、西班牙、土耳其、英國、美國、歐洲航空集團(EAG)、北約工業咨詢集團(NIAG)和北約空中作戰卓越中心。所以這項工作的功勞應該歸功于這個MSG-165任務小組的所有參與者。本文的作者是MSG-165的聯合主席,并代表整個小組的作用。
軍事決策在不同的領域--陸地、海洋、空中、太空和網絡--以及不同的組織層面--戰略、作戰、戰術和技術上發揮著關鍵作用。建模和仿真被認為是支持軍事決策的一個重要工具,例如,生成和評估潛在的行動方案。為了成功地應用和接受這些技術,人們需要考慮到整個決策 "系統",包括決策過程和做出決策的指揮官或操作員。
人工智能技術可以以各種方式改善這個決策系統。例如,人工智能技術被用來從(大)數據流中提取觀察結果,自動建立(物理/人類/信息)地形模型,產生對未來事件和行動方案的預測,分析這些預測,向人類決策者解釋結果,并建立人類決策者的用戶模型。
對于所有這些應用,人工智能技術可以在不同的情況下被使用,并且已經開始被使用,因此有不同的要求。在本文中,我們概述了人工智能技術和模擬在決策"系統"中的不同作用,目的是在我們的社區中促進對人工智能的綜合看法,并為用于軍事決策的各種人工智能研發奠定基礎。
軍事決策有多種形式。它發生在不同的領域--陸地、海洋、空中、太空、網絡--以及不同的組織層次[7]。例如,在戰略層面上,決策是否以及何時在一個特定的作戰區域內開始一項軍事任務。在作戰層面上,聯合部隊指揮官決定為某項行動分配哪些軍事要素,并指定在具體行動中尋求的預期效果。在戰術層面上,例如,海上任務組的反空戰指揮官決定由哪艘護衛艦來應對來襲的威脅。最后,在技術層面上,要決定在什么范圍內使用什么武器來消滅對手。
建模和仿真被認為是支持這些現場決策過程的一個重要工具(例如,見[3]的清單)。它提供了一種理解復雜環境和評估潛在行動方案有效性的手段,而不必使用現場測試。因此,借助于建模和模擬可以更安全、更便宜、更快速,而且可以更容易地測試不同的操作方式。此外,對于戰場上的軍事行動來說,廣泛地試驗軍事行動應該如何進行,甚至可能在道德上不負責任。因為,在指揮官可以決定不繼續按照同樣的戰術行動之前,就已經產生了意想不到的效果。
現代建模和仿真經常得到人工智能(AI)技術的支持。例如,用于仿真單個節點、組織和社會行為模型(見一些背景資料[13][4]),以獲得對對手合理和可能行為的洞察力。在這種行為洞察力的基礎上,可以為許多決策層面的軍事行動設計提供智能分析和決策支持。此外,人工智能技術被用來構建這些模型,與這些模型互動,并迅速分析大量的模擬結果數據。這里的技術進步非常多,例如,使用機器學習來構建更真實的行為模型[11],改善人機協作[5],對大量的模擬數據進行理解[10]。然而,人工智能技術只有在對決策者有用的情況下才能也應該被用于軍事決策。這意味著,只有在決策質量提高或決策過程變得更容易的情況下,才應將人工智能技術(在建模和仿真中)整合起來。
成功應用和接受用于決策支持的模擬仿真--可能建立在人工智能技術之上--取決于與主要軍事決策過程的互動和不斷學習([1])。決策者和分析員應該知道如何提出正確的輸入問題,以便通過建模和仿真來回答。然后,這些問題應該通過建模和仿真研究轉化為正確的輸出答案。因此,在各種互補的人工智能技術的支持下,應該對軍事決策過程和軍事模擬之間的互動有一個廣泛、全面的看法,并服從不同的功能要求。在本文中,我們概述了由人工智能技術支持的軍事仿真在決策"系統"中的不同作用,目的是在我們的社區內促進對人工智能的綜合看法,并為軍事決策的各種人工智能研發奠定基礎。
如引言所述,決策發生在不同的領域和不同的組織層面。在這里,我們提出了一個決策系統的示意圖,以提供一個關于如何通過仿真來支持決策的一般見解。這一觀點(圖1)來自于對多個決策過程的分析,如聯合定位[5]、作戰計劃[7]、海上反空戰[1],并與著名的OODA環[8]相結合。該觀點中的元素解釋如下。
圖1:由建模和仿真支持的軍事決策周期的系統觀點。
觀察:OODA循環的第一步是觀察,從廣義上講,就是觀察現實世界中正在發展和出現的事件和情況。觀察包括,例如,來自傳感器的(原始)數據,包括我們自己的眼睛和耳朵,以及來自報告、報紙和社會媒體的符號數據。還收集了來自高層指揮和控制實體的指導意見。這些數據由分析員處理,對鏡頭中的個體進行命名,計算某些Twitter標簽的出現次數,驗證某個事件是否真的發生,等等。根據[9],這可以被稱為情境意識的第一級:對當前情況下的元素的感知。
世界模型:在OODA環的觀察步驟中,已經開始了構建世界模型的過程,無論是隱性的還是顯性的。符合軍事決策觀點的世界模型的另一個名稱是共同行動圖。所有相關的概念都在世界模型中得到體現,包括不確定因素和假設。請注意,世界模型可以被仿真,即個體、平臺、團體或社會的行為可以隨著時間的推移而被預測,即使是在用戶的頭腦中隱含完成。
定位:在OODA循環的第二步,分析者使用他的專業知識,對觀察結果進行推理,形成假設,例如對手的意圖。通過這樣做,實現了對真實世界的深入理解[12],這反映在世界模型中(仍然是顯性或隱性的)。在態勢感知方面,這被稱為第2級(對當前形勢的理解)和態勢感知能力第3級(對未來狀態的預測)。在任何時候,推理的結果可能是世界模型結構是不充分的,例如,現實世界的一個方面被認為是不相關的,但最后發現是相關的。因此,世界模型需要被更新。
決定:決策者,可能是與分析員相同的人,將根據對現實世界的理解,考慮如何采取行動的選項。世界模型的預測能力被用來演繹各種情景,讓人了解什么是理想的行動方案,什么不是,或者讓人了解空間和/或時間上的關鍵點,這樣就可以對這些關鍵點給予額外考慮。當然,如果世界模型是隱含的,這都是決策者的精神努力。此外,對于感興趣的現實世界系統的預測行為,可以得出的結論的精確性和/或確定性有很大不同:從精確的路線,到可能的戰略和理論的廣泛指示。
行動:在OODA-環的這一步,行動被執行。這些行動發生在真實世界中,然后一個新的OODA-環開始觀察是否需要重新考慮已經做出的決定。另一個行動可以是向 "較低層次"的決策過程下達命令,例如,讓下屬單位計劃和執行他們所得到的任務。這就是不同組織層次的決策過程的互動方式。還要注意的是,盡管每個組織層面的世界模型都與真實世界相聯系,但這些世界模型的結構(即被認為是相關的)可能是不同的。
從概念上講,在上述的決策過程中引入模擬(實際上首先是建模的巨大努力)是很直接的。在第一步和第二步中,建立了世界相關部分的模型,在以后的時間里,它被用來評估許多不同的情景,分析由此產生的結果,并根據其結論做出決定。正如后面將顯示的那樣,人工智能技術的作用與建模和模擬的使用有很大關系。
雖然從概念上來說,納入仿真模擬和人工智能技術是很簡單的,但為了給行動提供真正的附加值,它需要被嵌入到具體的決策過程中。而每個決策過程都是不同的,有不同的時間限制,不同的行動者,在不同的操作環境中。這將對開發使用的解決方案,包括人工智能技術,提出不同的功能要求。此外,根據具體的作戰決策環境,應用人工智能技術的附加值(或缺乏附加值)將是不同的。在下一節中,我們將對一個具體的案例進行進一步的探索,盡管肯定不是詳盡的努力,以允許對這種系統在這個過程中可能具有的不同角色進行更通用的識別。
本節提供了一個關于如何利用仿真和人工智能技術來支持作戰層面上的(蓄意)聯合目標定位決策的案例研究。對于每個想法,都有以下描述:被加強的行為者(決策者)和/或產品,人工智能如何提供支持,以及使用這種形式的支持的附加值是什么。請注意,這個案例研究的目的是為了更好地了解人工智能技術應用的廣度,因此,目標不是完全涵蓋所有的可能性,也不是過于詳細。這種類型的案例研究已經確保了可以得出初步的功能要求,人工智能技術和智能建模與仿真應該應用于此。
圖2顯示了北約盟國聯合出版物3.9中的聯合瞄準決策周期,其中強調了五個想法。
圖2--來自北約盟國聯合出版物3.9的聯合目標定位周期,JFC=聯合部隊指揮官,JTCB=聯合瞄準協調委員會,JTL=聯合瞄準清單,TNL=目標
想法1--基于AI的目標系統分析的所有來源分析。第一個想法是支持目標小組的成員在聯合目標定位周期的第二階段參與目標系統分析,進行目標開發。例如,假設從第一階段開始,就打算通過瞄準對手的石油生產來擾亂其資金能力。在第二階段,分析人員將研究石油生產的目標系統,以確定油井、煉油廠、管道、重要的道路,也許還有相關的關鍵人物,等等,基于他們擁有的所有來源(圖像、信號情報、人類情報,等等)。
人工智能技術可以協助人類分析員建立 "目標系統模型",即通過采用模式識別算法來處理大量的所有來源的信息,通過使用推理算法將信息碎片組合成一個結構化和連貫的整體。分析傳入信息的算法可能--經過增量的人工智能驅動的創新--也能夠識別尚未反映在目標系統模型中的新概念,然后可以自動添加到模型中。另一種可能性是創建一個 "虛擬分析師"(見圖3),通過不斷挑戰假設、假說和人類偏見來協助人類分析師,這需要額外的用戶建模和可解釋的AI技術。
圖3:人類和虛擬分析員,一起解釋數據,推理信息和知識,以建立一個目標系統模型。
這個想法的潛在附加值首先體現在完整性上,更多的目標可以呈現給人類分析員--它仍然可以為交叉檢查的目的做最后一步的目標審查。因為所有來源的情報都被整合到目標識別決策中,所以可以得出更具體的目標信息。識別算法經過訓練后,與基于人眼從數據中識別目標時相比,可以更快更及時地進行識別。最后,該算法可以明確地轉向識別不同類型的目標,這些目標可能并不都在人類分析員的經驗或觀察能力范圍內。
想法2--通過算法識別來自目標系統分析的優先目標。第二個想法是支持從一個給定的目標系統分析中識別優先目標。這有助于目標支持小組成員得出一個聯合的優先目標清單,該清單是在聯合目標定位周期的第二階段,即目標開發階段制定的。人工智能技術的支持始于將目標系統分析(如果還沒有的話)轉化為計算機可理解的形式,該形式由功能關系連接的實體組成,并由目標任務的目標支持。然后,在相關的時間范圍內計算直接或間接瞄準不同實體所產生的效用(例如,效果和效果的持續時間)。
然后,最終結果可以由人類分析員檢查,該分析員可能會重新引導算法的某些部分,以確保最終結果選擇的優先目標盡可能地滿足和平衡任務目標。另一種可能性是,分析表明,對目標系統的某些部分還沒有足夠的了解,無法做出某種決定,然后發出新的情報請求,以減少這種不確定性。
在這種情況下,使用人工智能技術的附加價值首先體現在通過完整地確定優先事項,包括最大限度地實現任務目標,同時最大限度地減少負面問題,從而更好更快地確定優先次序。這種全面的分析可能會導致原始的目標選擇,在這種情況下,會發現反直覺但非常有效的目標。目標優先級的可追溯性增加了,因為目標選擇問題的算法規范以及積極和消極的相關功能迫使決策者在激發他們的偏好時完全明確。
想法3--能力和優先目標的自動映射。與目標開發(第二階段)密切相關的是第三階段的能力分析。第三個想法是協助,仍然支持目標支持小組的成員,找到最適當的(致命和非致命)能力的最佳同步組合,可以應用于產生所需的物理和心理效果。使用模擬和人工智能技術來自動生成和播放高水平和低水平的行動方案,可以獲得對計劃的優勢、機會、弱點和威脅的深刻理解。當然,只有在與人類分析員和決策者密切合作的情況下,建立這樣的理解才是有用的,這就需要有人類意識的 "虛擬分析員 "技術。
想法4--計算機輔助的穩健和適應性部隊規劃和分配。在聯合定位的第四階段,能力分析的結果被整合到進一步的行動考慮中,推動聯合部隊指揮官對目標的最終批準。仿真和人工智能優化技術可用于尋找稀缺資源對目標或其他任務的最佳分配。什么被認為是 "最好的 "可以是不同的,例如,爭取最大的效果、安全、穩健、靈活,或這些和更多因素的任何組合。這可能會提供原始的規劃和分配方案,從人類分析者的角度來看,這些方案部分是反直覺的,但卻富有成效。智能優化算法可以幫助確定時間和/或空間上值得監測的關鍵點。而且,如果可以實時跟蹤進展,在事件或機會實際發生之前就可以立即生成重新分配方案,在時間緊迫的情況下減少決策時間。
想法5--自動評估軍事行動績效措施。在聯合定位的最后階段,收集和分析數據和信息,以確定計劃的行動在多大程度上得到執行(績效的衡量),以及達到預期的效果(效果的衡量)。因為這種類型的分析與其他階段的分析基本相似(即需要觀察和理解),所以在這里采用的模擬和人工智能技術可以被重復使用。例如,"目標系統模型"可以用來事先確定哪些措施或措施的組合最能說明性能和/或成功,也許還要考慮到其他因素,如效果的可測量性和延遲性。這些見解可用于指導例如戰斗損失評估工作。算法可以自動產生多種假設,當數據/信息可用時,"虛擬分析師"可以協助對這些假設和信息進行推理,幫助人類分析師以結構化的方式更好地解釋復雜的情況。
在本節中,我們將討論人工智能技術在軍事決策中可以發揮的作用,并將這些作用與前面介紹的軍事決策系統聯系起來。這些作用是由上面的案例研究綜合而成的。不同的作用是沿著兩個層次結構的,從上到下:在 "過程"層面,不同但連貫的步驟/階段被執行;在 "個體"層面,人類(或團隊)負責執行決策過程的特定步驟。
在整個決策過程的層面上,有多個步驟可以區分。在前面介紹的決策系統觀點中,這些步驟是觀察、定位、決定和行動。在聯合定位案例研究中,這些對應于六個階段,由不同的人在不同的時間執行。在這個層面上,我們為人工智能技術定義了四個功能角色,以支持決策過程。
感知:這個角色中的人工智能技術,主要以模式識別的形式,幫助處理大量的數據,如在圖像中尋找人,檢測數據流中的異常情況等。
態勢理解:這個角色的功能是實現對當前或假設的作戰環境的理解[12],從而描述所有相關實體、它們之間的關系以及不可觀察的屬性,如它們的野心和目標。例如,對關于最近敵對活動的現有信息進行推理,結合關于他們的理論的一般知識,可以用來產生關于他們最可能的意圖的假設。
計劃生成:在這個角色中,人工智能技術,例如搜索和優化,被用來生成旨在達到(或避免)某種目標情況的計劃、策略和行動方案。處理元標準,如計劃的穩健性或情況的實用性也是這個作用的一部分。顯然,在許多情況下,不確定性是行動環境所固有的,因此不能被忽視。盡管如此,對當前形勢的理解越好,預測能力就越強。
學習:扮演這一角色的人工智能技術被用來更新有關作戰環境的知識。例如,在某個時間點,人們可能會發現一個被認為是正確的關于敵人理論的假設不再有效了。為了能夠保持正確的理解,這種新知識應該反映在所有其他決策步驟中。
在單個節點層面上,決策過程的單一步驟被執行,通常由一個或一組人類分析員和/或決策者負責。無論這一步需要什么,人工智能技術都可以在不同的合作角色中被使用,以支持人類。
專家系統支持:在這個角色中,支持的形式就像一個經典的專家系統,以知識和優化結果的形式向人類決策者或分析員提供建議。重要的考慮因素是,例如,如何以人類能夠接受的方式向其提供建議。對可解釋人工智能的研究可能是一個方向。
虛擬團隊成員:在這個角色中,人工智能技術被用來在人類和支持系統之間創造一種更平等的互動關系,積極為一個共同的目標工作。例如,虛擬團隊成員可以通過提出問題使假設明確化或挑戰偏見來幫助做出決定的(認知)過程。人類-人工智能的研究可能是一個追求的方向。
自主決策:決策過程中的其他步驟的互動,專家系統和虛擬團隊成員支持的考慮同樣有效。例如,在其他決策中的人類需要能夠推斷出一個自主系統。
圖4顯示了在軍事決策系統視圖中繪制的人工智能的七個角色。當使用模擬和人工智能來支持決策過程時,應該始終考慮這些不同的角色是如何互動的,無論是在過程層面還是在個人層面。例如,在聯合目標定位的過程層面上,第二階段包括定位(目標系統分析)和決定(為達到預期效果而瞄準什么)。第三階段也包括定位(自身能力)和決定(如何實現預期效果)。這些階段共享相同的世界模型,在這個過程中引入人工智能支持將推動這些步驟的合并,這不是不可想象的。在個體層面上,例如再次考慮第2階段,分析員可以得到綜合態勢理解、規劃生成和學習技術的支持,以及虛擬團隊成員和專家系統支持技術的任何組合。
圖4:由建模和仿真支持的軍事決策周期的系統視圖,其中人工智能技術的功能(黃色)和協作(綠色)作用被描繪出來。
在本文的第一部分,我們介紹了軍事決策的系統觀點,主要基于OODA循環,其中我們介紹了世界模型,作為向整個決策周期提供建模和仿真支持的核心手段。接下來,從我們的聯合目標定位案例研究中,我們推斷出人工智能可以為軍事決策做出貢獻的七個功能性和協作性角色。這些角色對應于決策步驟,或者對應于如何向負責該過程步驟的人提供支持。最后,我們將這些人工智能角色整合到決策系統視圖中。
本文的目標是為我們社區內人工智能的綜合觀點做出貢獻,并為軍事決策的人工智能各種研發奠定基礎。在開發支持軍事決策的模擬和人工智能時,我們建議同時考慮過程層面和單個節點層面。在過程層面上,通過使用建模和仿真可以獲得好處。在單個節點層面上,為人類分析員和決策者提供實際支持,人工智能技術可以通過不同的角色組合對此作出貢獻。鑒于決策過程的各個步驟都是不同的,并且提出了不同的要求,履行這些不同角色的人工智能技術需要作為一個整體來開發。
我們相信,隨著對這一主題的更多研究,軍事決策的速度和質量都可以得到改善。然而,非常重要的是,要持續關注特定的未來人工智能應用的附加值,以及研究這些應用可能對,例如,負責該過程的人的所需技能,甚至該過程本身的影響。最后需要的是一個系統,它的存在是因為它可以建立,而不是有人幫助。對于這一點,應該更普遍地回答如何限定然后量化應用人工智能進行具體軍事決策應用的附加價值的問題。這樣的見解反過來又會成為關于人工智能用于軍事決策的集體技術路線圖的寶貴基礎。
[1] Bloemen, A., Kerbusch, P., van der Wiel, W., Coalition Force Engagement Coordination, TNO Report TNO-2013-R12117, 2015.
[2] Connable B, Perry W, Doll A, et al. Modeling, Simulation, and Operations Analysis in Afghanistan and Iraq. Santa Monica, CA: RAND, 2014.
[3] Davis P., Kulick J., Egner M. Implications of Modern Decision Science for Military Decision-Support Systems. Santa Monica, CA: RAND, 2005.
[4] Kunc, M., Malpass, J., White, L.(2016). Behavioral Operational Research, Theory, Methodology and Practice. Palgrave Macmillan, London.
[5] Langley, P., Meadows, B., Sridharan, M., Choi, D. (2017). Explainable Agency for Intelligent Autonomous Systems. Proceedings of the Twenty-Ninth AAAI Conference on Innovative Applications (IAAI-17).
[6] NATO Allied Joint Doctrine For Joint Targeting AJP 3.9(B), 2015.
[7] NATO Allied Command Operations. Comprehensive Operations Planning Directive Interim V2.0.
[8] “OODA loop.” Wikipedia, The Free Encyclopedia. 10 Mar. 2018.//en.wikipedia.org/wiki/OODA_loop
[9] “Situation Awareness.” Wikipedia, The Free Encyclopedia. 17 Mar. 2018.
[10] Smit, S., Veldhuis, G., Ferdinandus,G., et al. KaV Advanced Visual Analytics, TNO Report DHWELSS-, 2016.
[11] Toubman, A., Poppinga, G., Roessingh, J. (2015). Modeling CGF Behaviour with Machine Learning Techniques: Requirements and Future Directions. Proceedings of Interservice/Industry Training, Simulation, and Education Conference (I/ITSEC) 2015.
[12] “Understanding.” Wikipedia, The Free Encyclopedia. 18 Apr. 2018.
[13] Zacharias, G., MacMillan, J., van Hemel, S. (2008). Behavioral modeling and simulation: From individuals to societies. National Research Council, National Academies Press.
本文件是北約 IST-151 研究任務組 (RTG) 活動的最終報告,題為“軍事系統的網絡安全”。該 RTG 專注于研究軍事系統和平臺的網絡安全風險評估方法。 RTG 的目標如下:
? 協作評估軍事系統的網絡安全,并在 RTG 的北約成員國之間共享訪問權限;
? 在 RTG 的北約成員國之間共享風險評估方法和結果;
? 將 RTG 的北約成員國使用的評估方法整合到一個連貫的網絡安全風險評估方法中,以使北約國家受益。
軍事平臺比以往任何時候都更加計算機化、網絡化和受處理器驅動。他們大量使用數據總線,如 MIL-STD-1553A/B、CAN/MilCAN、RS-422/RS-485、AFDX 甚至普通以太網,以及戰術通信的舊標準,如 MIL-STD-188C 和 Link 16。此外,捕獲器、傳感器、執行器和許多嵌入式系統是擴展攻擊面的額外無人保護的潛在輸入。結果是增加了網絡攻擊的風險。然而,這些平臺的持續穩定運行對于軍事任務的成功和公共安全至關重要。
軍事系統和平臺是網絡攻擊的首選目標,不是因為它們像消費電子產品那樣普遍,而是因為它們潛在的戰略影響。一旦受到影響,就可以實現各種短期和長期影響,從拒絕能力到秘密降低其有效性或效率。因此,軍隊必須在各個層面解決網絡安全問題:戰略層面,同時獲取平臺和系統;作戰層面,同時規劃軍事任務和戰術。
北約國家擁有大量可能面臨網絡攻擊的軍事平臺和系統。因此,北約將受益于利用當前的流程和方法來設計更安全的系統并評估當前系統的網絡安全。
本報告介紹了針對軍事系統和平臺量身定制的網絡安全評估方法,該方法由 RTG 團隊成員合作開發,并建立在他們的經驗和專業知識之上。團隊成員已經使用的流程被共享、分析、集成和擴充,以產生本報告中描述的流程。本報告的目標受眾是愿意評估和減輕其軍事系統的網絡安全風險的決策者。
圖一:網絡安全評估過程的五個主要步驟。
第 2 節介紹了 RTG 團隊在其存在的三年中用于開發流程的方法。第 3 節列出了可以應用該過程的系統的一些特征。最后,第 4 節描述了評估流程,而第 5 節總結本報告。
軍事平臺比以往任何時候都更加計算機化、網絡化和受處理器驅動。這導致增加了網絡攻擊的風險。然而,這些平臺的持續穩定運行對于軍事任務和公共安全的成功至關重要。
絕對的網絡安全是不存在的。必須通過迭代風險評估持續管理網絡安全。傳統 IT 系統存在許多網絡安全風險管理框架和流程。然而,在軍事平臺和系統方面,情況遠非如此。本文檔介紹了針對軍事系統量身定制的網絡安全風險評估流程。該流程由北約 IST-151 研究任務組 (RTG) 活動的團隊成員開發,該活動名為“軍事系統的網絡安全”。該過程可以應用于傳統的 IT 和基于固件的嵌入式系統,這些系統在軍事平臺和系統中無處不在。
價值1750億美元的電子游戲生態系統龐大且不斷發展,為全球28億游戲玩家提供服務,包括與當前和未來軍事建模和仿真(M&S)直接相關的技術和工作方式。英國國防科學與技術實驗室(Dstl)的研究計劃委托進行了一項研究,分析游戲生態系統,以了解哪些新興或現有方法可以為軍事訓練和更廣泛的M&S提供顯著收益。重點是“建模和仿真即服務 (MSaaS)” ,以及為更復雜的多域操作培訓的成本效益可能出現“階梯式變化”。首先生成了游戲和軍事M&S功能的熱圖,以突出與軍事最相關的領域。通過與Dstl主題專家合作,確定了軍事M&S通過利用游戲行業內的技術和能力實現現代化的20個關鍵機會。它們是跨技術、人員和流程的速贏和長期機會的混合體。其中的關鍵是游戲引擎技術不斷增長的潛力;社區在游戲和游戲開發中的價值;以及廣泛的網絡訪問作為M&S發現、共享和創新的推動者的作用。
本報告描述了北約第一個多領域小組IST-173所取得的成果。與會者包括來自不同小組和團體的科學家,以及來自北約機構和軍事利益攸關方、學術界和工業界的科學家,這為AI和軍事決策大數據這一主題創造了第一個利益共同體。該團隊在實踐中證明了一種新的STO方法的可行性,即任務導向研究,以激發公開對話、自我形成的研究合作和跨小組活動。此外,該方法還有助于為人工智能和軍事決策大數據這兩個主要能力領域聯合開發北約首個科技路線圖,以應對北約在這些領域面臨的作戰挑戰。由于新的組織(軍事利益相關者積極參與的多領域團隊)和這種創新方法的應用,確定了一些經驗教訓,應該支持軍事決策AI和大數據的進一步操作。