通過一系列聯邦舉措和命令,美國政府一直在努力確保美國在人工智能領域的領導地位。這些廣泛的戰略文件對美國空軍等組織產生了影響。DAF-MIT AI加速器是DAF和MIT之間的一項倡議,旨在彌合AI研究人員與DAF任務需求之間的差距。由DAF-MIT AI加速器支持的幾個項目正在開發公共挑戰問題,解決眾多聯邦AI研究優先事項。這些挑戰通過使大型的、可用于人工智能的數據集公開,激勵開源解決方案,并創造雙重用途技術的需求信號,從而刺激進一步的研究。在這篇文章中,我們描述了這些正在發展的公共挑戰,以及它們的應用如何有助于科學進步。
2019年,美國聯邦政府通過第13859號行政命令概述了一項廣泛的戰略,以確保在人工智能領域的領導地位。[1]概述了這一戰略的核心,即實現美國人工智能領導地位所需的大量研究投資。這些研究推力的例子顯示在圖1的左邊(來自[1])。聯邦政府組織,如國防部和空軍部門,開發了自己的AI戰略,以實現13859號行政命令的廣泛目標。空軍部門的一項倡議是在麻省理工學院主辦的人工智能加速器(DAF-MIT AI加速器)的開發。加速器由來自麻省理工學院和空軍部門的多學科團隊組成,以開發能夠在空軍和太空部隊以及整個社會推進AI的基礎技術。為了推動相對較新的領域的創新,并充分參與更廣泛的AI社區,加速器正在開發一系列“挑戰”問題。這些“挑戰”包括開放數據集、基準、問題定義、指標、基線實現,并解決諸如天氣預測、數據中心優化和人機界面等科學問題。并行開發多個挑戰也支持了協同活動。例如,我們能夠開發可復制的管道來發布開源數據集,提供統一的計算平臺,并利用為一個挑戰創建的數據來應對其他挑戰。
在本文中,我們描述了通過DAF-MIT AI Accelerator開發的一些挑戰,重點是當前發布的數據集和代碼庫。此外,開發超過10個挑戰問題帶來了我們所描述的一些重要教訓。除了本文中描述的挑戰之外,該團隊還在開發其他即將發布的挑戰。例如,Autonomous Flight Arcade[2]是一套人類和人工智能都可以玩的環境,旨在訓練人工智能完成受真實航空場景啟發的復雜任務。
1. 風暴事件圖像(SEVIR)數據集
充分監測和預測地球天氣對環境智能和人類安全至關重要,特別是在這個前所未有的氣候變化時期。最近,人工智能通過利用用于[4]預測的大量地球系統數據集,顯示出了提高預測性能的潛力。像GOES這樣的平臺提供的地球同步衛星數據,或者NEXRAD提供的快速更新的雷達信息,對于了解當前的天氣狀況和播種預報至關重要。然而,這些數據集的規模和復雜性往往會成為AI研究的障礙,與計算機視覺和自然語言處理等其他AI子領域不同,社區沒有很多通用基準數據集來驗證和基準化新功能。
創建風暴事件圖像(SEVIR)數據集以解決此問題[5]。SEVIR將多種不同的天氣傳感模式(包括地球同步衛星圖像、閃電探測和雷達)組合成一個人工智能就緒數據集,用于研究氣象學中的幾個問題。SEVIR包含超過10萬個事件,每個事件由384公里x 384公里的圖像序列組成,時間跨度為4小時。SEVIR中的許多事件都是根據國家環境信息中心風暴事件數據庫選擇的。
2. 數據中心面臨的挑戰
隨著AI/ML工作負載在高性能計算(HPC)中心和商業云系統的計算工作負載中所占的份額越來越大,有必要更好地理解集群/數據中心的操作。數據中心挑戰[9]旨在促進人工智能方法的創新,分析大規模數據中心監控日志,以減少能源消耗,改進調度策略,優化資源使用,并識別策略違規。
3. MagNav 挑戰
利用地球磁場進行導航已經顯示出了替代其他導航系統的可行性。商業和政府機構通過收集和存儲磁場數據作為磁異常圖,對地球進行了不同程度的精確測量。這些異常地圖的變化使導航與傳統的慣性導航系統相結合。這種技術不依賴于任何外部通信,在任何時間和任何天氣都是全球可用的[12],而且也很難被干擾。
4. MultiEarth挑戰
地球與環境多模態學習挑戰賽(MultiEarth 2022)是首個旨在監測和分析亞馬遜雨林在任何時間和任何天氣條件下毀林情況的比賽。該挑戰的目標是為多模態信息處理提供一個共同的基準,并將地球和環境科學界以及多模態表示學習界聚集在一起,在定義明確且嚴格可比的條件下,比較各種多模態學習方法與森林砍伐估計的相對優點。MultiEarth 2022有三個子挑戰:1)矩陣完成,2)森林砍伐估計,3)圖像對圖像的轉換。我們的挑戰網站是//sites.google.com/view/rainforest-challenge。
5. 口語ObjectNet挑戰
近年來,多模態信息處理在圖像字幕和視頻檢索等問題上引起了極大的興趣和研究活動。存在各種各樣的數據集來支持這些領域的研究,這些數據集通常包括一個圖像或視頻剪輯庫,并搭配文本或語音字幕。不幸的是,許多這些數據集包含內在的偏見,這些模型在這些數據集上訓練然后學習,這反過來降低了它們在現實數據上的性能。例如,圖像字幕模型傾向于描述海灘上的人是快樂的,而圖像分類模型無法識別雪地背景外的狼。為了解決這些問題,我們創建了一個名為ObjectNet的大規模人群來源、偏差控制的對象分類數據集,它由全新圖像的語料庫組成,而不是依賴于那些已經以某種形式[19]上傳到互聯網上的圖像。接著,口語ObjectNet (SON)語料庫通過收集ObjectNet圖像的口語描述來擴展ObjectNet語料庫,并為語料庫創建一系列挑戰任務,如下所述。
6. 機動ID的挑戰
空軍繼續面臨飛行員短缺的問題,部分原因是缺乏加快本科飛行員培訓(UPT)過程所需的基礎設施和方法。“飛行員培訓下一步”(Pilot Training Next, PTN)是一個負責飛行員培訓教育的實驗項目,通過引入虛擬現實(VR)飛行模擬器[20],進入了開展這一課題的新階段。這些模擬器的優化需要在許多方面增加訓練和測試能力,包括機動識別和評分。AI挑戰賽可以用來收集AI社區的解決方案,并將它們整合到PTN課程中。機動識別挑戰是為了從彈道數據中識別機動,以提高飛行安全和飛行員訓練。
7. CogPilot挑戰
與現有的主觀、粗糙的評估方法相比,采用量化的績效測量和生理監測對飛行員的訓練提供了更為個性化和客觀的評估。CogPilot團隊試圖開發AI算法,利用多模態生理信號預測個體的認知狀態和操作性能,從而支持飛行員訓練的個性化優化。
8. 經驗教訓
開發一項挑戰不僅僅是收集和發布數據。例如,圖7描述了AI挑戰所需的其他組件。根據我們的經驗,開發一個引人注目的問題,執行昂貴的數據管理步驟[21,22],并提供基線實現和明確的成功指標,是吸引公眾參與的非常重要的步驟。
DAF-MIT AI加速器利用挑戰問題來公布數據,讓公眾參與,并推進機器學習科學。根據國家AI研究與發展戰略計劃,DAF-MIT AI加速器的使命是建立和建立一個持續的長期研究生態系統,以推動發現和洞察[1]。雖然重點是基礎研究,但公共挑戰加速了基礎和高級研究向可導致商業化和操作能力的應用研究方向的過渡。DAF-MIT人工智能加速器專注于兩用問題——對公眾很重要、與國防有關的問題——不太可能由投資支持的技術公司提供資金。在新的機器學習能力成熟并被證明有效之前,缺乏商業前景將導致行業[23]無法滿足關鍵需求。將魯棒性和數據增強等研究算法應用于實際問題,填補了這一關鍵空白,并加速了AI向商業化和運營集成的過渡。根據某些衡量標準,“目前使用的82%的算法源自聯邦資助的非營利組織和大學”[23]——這一衡量標準強調了開發公共挑戰問題的必要性。
我們從開發這些AI挑戰中學到了許多寶貴的經驗教訓:
開發平臺: 開發AI挑戰需要大量的計算資源(尤其是數據管理和基線算法開發)。作為一個例子,本文中列出的每一個挑戰都利用MIT SuperCloud[24]進行前期開發。開發平臺通常與部署不同,大多數項目都將其挑戰部署在公共或私有云平臺上。
數據/代碼發布: 大多數組織對開源代碼和/或數據集都有一個耗時的審閱過程。根據我們的經驗,從一開始就包括法律和合同代表對于簡化數據和代碼的初始和更新的持續發布過程至關重要。例如,概述的每個挑戰都與空軍法官倡導()密切互動,以確定任何可能延遲數據/代碼發布的法律問題。在由于數據敏感性而無法公開發布的情況下,例如在機動id挑戰中,我們開發了數據所有者可以為他們的項目定制的模板數據使用協議。
可復制流程: 根據我們的經驗,在開發挑戰過程中需要做出許多小決策。例如,對庫的依賴、支持的容器技術、具有較大上游影響的數據格式。為了提高再現性,精心挑選和選擇文檔是很重要的。
參與用戶社區: 本文中概述的每一個挑戰都有不同的科學社區。重要的是,通過研討會和技術交流,讓這個社區盡早參與到挑戰問題的發展中來。這確保了有趣的問題、相關的度量標準和準確反映領域最先進技術的基線實現。
美國國防部和空軍領導人認為,人工智能(AI)是一種改變游戲規則的技術,將幫助空軍情報、監視和偵察(ISR)體系克服大國沖突所需的情報分析速度和規模方面的長期挑戰。傳感網格概念(最近更名為傳感器集成)被作為未來框架引入,以整合人工智能和認知建模工具融入空軍ISR,但對于對手的威脅和道德方面的考慮卻很少討論,而這些考慮應該貫穿于系統的設計和功能模塊。為了讓空軍內部的人力和組織做好準備,以整合高度自動化的人工智能情報分析系統,領導人必須倡導以人為本的設計,從歷史上人機協作的成功和失敗中吸取教訓。領導人還必須采取積極主動的方法來培訓空軍的ISR勞動力,以便與革命性的但不完善的人工智能技術進行有效協作。
根據美國空軍作戰集成能力(AFWIC)傳感跨職能小組的說法,空軍情報、監視和偵察(ISR)的現狀是高度專業化、專有化,并且過于依賴人力密集的回傳(reach-back)過程。當規劃人員展望未來的大國沖突時,他們評估目前的硬件和分析過程將不足以建立對同行對手的決策優勢,情報工作在勝利所需的速度和規模方面落后。空軍A2的 "下一代ISR主導地位飛行計劃"對目前的ISR體系也提出了類似的批評,主張擺脫今天的 "工業時代的單一領域方法",以追求 "架構和基礎設施,以實現機器智能,包括自動化、人機合作,以及最終的人工智能。"雖然為空軍人員提供更快更智能的工具來制作和分享評估是空軍高級領導人的優先事項,但引入更高水平的自動化和機器主導的感知為情報界帶來了一系列新問題。考慮到這些工具可能遇到的篡改和故意提供錯誤信息的威脅,依靠算法走捷徑是否安全?追求由自動化武器系統促成的戰爭到底是否合乎道德?如果是這樣,情報界采用自動化工具以更快的速度產生關鍵的情報評估會帶來什么風險?
人工智能(AI)一詞被美國防部聯合人工智能中心定義為 "機器執行通常需要人類智慧的任務能力--例如,識別模式、從經驗中學習、得出結論、進行預測或采取行動。"參議員們希望AI能夠很快為人類分析師用來進行評估的軟件套件提供動力,并使物理系統在更多的自主應用中發揮作用。機器學習(ML)被國防部高級研究計劃局(DARPA)定義為人工智能中的一個領域,"將統計和概率方法應用于大型數據集",并可以將衍生模型應用于未來的數據樣本。利用ML好處的一個流行方法是通過深度神經網絡(DNN),它可以使用歷史數據被訓練成執行一系列的分類和預測任務。雖然在AFWIC或A2的出版物中沒有特別提及,但在模擬人類思維過程的應用中使用AI、ML和DNN是計算機科學和心理學的一個混合領域,稱為認知建模。在AFWIC對未來空軍ISR體系的設想中,AI、ML、DNNs和認知建模概念是向數字化、以網絡為中心的情報方法轉變的關鍵部分。
為了給空軍ISR體系的現代化舉措提供一個框架,AFWIC建立了傳感網的概念,定義為 "傳感器、平臺、人員、設備、內容和服務的組合,為決策者提供整體、準確、預測和及時的作戰環境特征。"該概念的設計者設想了一個具有預測分析、自主傳感和響應、融合多個數據源和邊緣處理的系統,所有這些都是通過利用AI、ML、DNN、數據分析和其他認知建模方法來實現的。盡管沒有公布傳感網格的首次亮相日期,但大多數討論表明,優化的系統簇至少還有十年。同時,美國防部領導層非常迫切地要趕上中國和俄羅斯在軍事人工智能應用方面的投資,鼓勵快速原型設計和實驗,以找到解決方案。人工智能在國防論壇上經常被認為是使以數據為中心的情報任務更快、加快戰術決策的答案,但如果所涉及的系統處于工程的初級階段,并且在國家安全領域仍未得到證實,這僅僅是猜想。
雖然AFWIC和空軍A2專注于人工智能傳感器和工具的研發投資,但很少討論使傳感網格安全和有效所需的人機合作動態。為了使傳感網格成為一個有效的系統,為空軍執行ISR和分析的方式帶來價值和進步,領導人應該在技術中倡導以人為本的設計,培訓和準備一線分析員與新系統有效的協作,并根據人工智能的優勢和劣勢調整組織做法。空軍領導人必須承認將更多的分析任務分配給人工智能工具所固有的對抗性威脅和道德問題,這些問題必須告知感知網格的藍圖。這并不是說正在進行的系統軟件開發應該停滯不前,而是說在情報和物資領導人之間必須同時進行對話,討論人類分析員的作用,因為這對減輕越來越多地依賴人工智能的弊端至關重要。空軍領導人還必須推行一項深思熟慮的計劃,將傳感網格組件整合到當前的傳感、識別、歸屬和共享(SIAS)活動中,使一線分析員為 "更高級別的推理和判斷"任務做好準備,同時承認機器應該增強人類任務,而不是完全取代人類。
接下來本文將提供與人工智能系統相關的脆弱性和道德問題的文獻回顧,以深入了解建設和應用傳感網格可能面臨的挑戰。它還將包括討論在完成和應用這個改變游戲規則的系統之前,情報和物資領導人應該考慮哪些因素。本文最后將就如何為空軍ISR戰斗空間準備傳感網格提出進一步的建議,為空軍人員在數字時代的行動提供必要的場景設置。
最近關于將人工智能應用于認知任務的相關弱點的研究大多強調了對抗性樣本的危險性,這些樣本修改了DNN的輸入,導致它們控制的系統以各種方式發生故障。對抗性輸入可以是物理的或非物理的,可以影響各種數據分類器分類媒體,包括圖像、音頻文件和文本。最常提到的物理欺騙樣本是一個實驗,工程師通過將停車標志調整成不同的角度來愚弄自動駕駛汽車上的光學傳感器,導致車輛錯過停車。物理欺騙在國防應用中不是一個新穎的計劃,但將邊緣處理和自動化納入像傳感網格這樣的系統可能排除了人類分析師第一手識別這些戰術。在非物理領域,訓練算法以類似于人腦的方式來識別模式是一項具有挑戰性的任務。計算機視覺(CV)算法對圖像的分類與人類分析人員非常不同,當只有幾個像素不合適時,很容易對物體進行錯誤分類。在不太直接的情況下,工程師無法解釋模型的錯誤,刺激了DARPA等組織對可解釋人工智能的倡議。 在最好的情況下,對抗性輸入被識別為異常值,并被具有強大訓練樣本的CV模型所忽略;在最壞的情況下,它們可能會破壞現實世界的輸入,并在人類分析師不知情的情況下從樣本中數字化地刪除物體或活動。如果對抗性輸入導致分析師錯過他們通常會在沒有協助的情況下捕捉到的重要活動,就會產生災難性的后果。
如果將AI、ML和DNN應用于情報數據集背后的目標是以更高的速度分析和傳播更多的信息,那么自然語言處理(NLP)也可能是感知網格架構的一部分。NLP模型今天被廣泛用于個人和商業用途,像Siri和亞馬遜Alexa這樣的工具使用語音提示來啟動其他應用程序。NLP模型也可用于大量文本或其他媒體的理解任務,使用衍生數據回答問題。這種技術在融合多種數據源的SIAS任務中可能非常有用,但也可能容易受到干擾。NLP中的對抗性輸入可以引入錯誤的句子或用文本文件中的反義詞替換關鍵詞,導致模型在沒有時間或能力進行人工審查的情況下錯誤描述數據集。
與任何分層模型的方案一樣,CV和NLP模型是否能像預測的那樣有效地協同工作還是個未知數,更不用說檢測像Deepfakes這樣在非保密領域進入DNN的偽造數據了。人類分析員離通常可以檢測錯誤信息的源數據流越遠,SIAS就越容易受到錯誤輸入的影響。盡管有這種擔憂,但空軍A2的指導意見表明,人們對分層模型利用非保密的公開信息(PAI)進行無縫傳感器提示寄予厚望,使ISR體系能夠更有效地找到相關目標。如果沒有一種強大的方法來檢測提示傳感器的PAI樣本中的偽造媒體,這個過程可能難以安全地實現。
技術的復雜性和自動化、人工智能系統對篡改的潛在脆弱性,引發了關于在軍事行動中應用這類技術是否符合道德的討論。雖然傳感網格的設計不是為了直接使用武器,但來自該系統的情報數據很可能為關于多個領域的關鍵決策提供信息。關于AI/ML的倫理學文獻通常對采用自主運作、人類干預窗口有限的系統持批評態度,其邏輯與反對地雷等傳統自動化武器的倫理學論點相似。雖然傳感網格及其前驅系統將具有比壓力板裝置高得多的認知行為屬性,但一些人認為,人類對黑盒系統的控制同樣很少,這些系統在向人類操作者提出選擇或結論之前,會執行層層的算法通信。
幸運的是,人工智能系統可能也能夠在人類容易出現道德失誤的情況下進行補償,因為機器不會經歷像恐懼或驚慌這樣的情緒,而這些情緒可能會引發危險的決定或違反LOAC。盡管利用人類與認知模型合作的這一潛在優勢是謹慎的,但美國防部的指導意見將速度作為人工智能最有用貢獻的具體價值,這引入了更多道德難題。對個人決策的測試表明,人類在復雜環境中的風險評估能力已經很差,而引入人工智能,使人類判斷的價值邊緣化,只會導致更快的、風險更高的結論。當人工智能帶來的錯誤評估或草率決定導致災難性錯誤時,問責也是美國防部領導人必須準備解決的混亂道德問題。
大多數文獻中隱含的減輕對手篡改和道德失誤威脅的解決方案,是在人類控制器和自主的人工智能系統之間進行最佳分工。不足為奇的是,對于這應該是什么樣子,以及它如何適用于像傳感網格這樣的系統,有許多觀點。一些人認為,在國際協議框架中沒有雇用自動武器系統的空間,并將其缺乏責任感與兒童兵相比較。其他人認為,如果像聯合目標定位這樣的程序以同樣的嚴格和參與規則進行,人工智能工具將不會導致不可接受的失控。雖然人們認為迫切需要通過購買現有的商業軟件向聯合情報界提供傳感網格的能力,但如果美國防部領導人希望減少前面討論的風險,工程師、需求所有者和分析師必須致力于仔細討論人工智能應用在ISR體系中最有幫助的地方以及它們有可能造成傷害的地方。
當涉及到投資建設由人工智能和認知建模應用驅動的未來ISR體系的項目時,美國防部和空軍除了需要快速投資并與大學和國家實驗室合作外,提供的指導有限。除了系統 "事故風險較低;對黑客和對手的欺騙行為更有彈性和表現出較少的意外行為"之外,對該部門在人工智能投資方面所期望的指導也是有限的。缺乏特殊性可能是人工智能在國防部戰略中首次出現的癥狀,但自滿和滿足于為投資而投資的情況并沒有遠遠超過這種情況。使用該技術的社區有責任決定與認知模型建立哪種類型的協作關系將提供最大的利益,但戰略指導似乎將責任交給了實驗室和行業合作伙伴,責成外部人士確定人工智能將解決的問題和解決方案。如果空軍ISR領導人在討論如何最好地將人類分析員與人工智能工具協作方面不發揮積極作用,他們將如何評估開發人員是否在提供資金的情況下取得足夠的進展?美國防部如何相信由非業務伙伴開發的解決方案能夠充分解決安全和道德問題?在什么時候,人工智能會從一個脆弱的研究項目過渡到改善SIAS的速度和準確性的可行解決方案?
討論人工智能及其在情報工作中的預期功能的一個更有成效的方法是,不要把它當作一個神奇的子彈,因為它的定義太不明確,根本無法研究。雖然將認知模型應用于情報過程可能是新的,但在戰爭中實現自動化的技術已經存在了幾十年。領導人必須考慮現代戰爭中已經存在的人機合作結構,以獲得設計和整合傳感網格的經驗。對于空軍ISR來說,分析當前和歷史上人類分析員、機載傳感器和戰區決策者的團隊合作是一項有益的工作。機載ISR傳感器的性能衡量通常通過傳感器輸出的響應性和準確性等因素來評估,但了解傳感器數據引發的分析和決策過程也很重要。例如,光譜成像傳感器可以被用作異常檢測器,突出不尋常的物體或活動,供人類分析員審查和報告。報告可以傳播給行動領導人,然后他根據情報做出決定,命令對異常活動的來源進行空襲。如果這一連串的事件在行動過程中習慣性地發生,那么傳感器和人類在循環中的互動可能會開始改變,而傳感器被潛意識地重新歸類為威脅探測器。在這種情況下,傳感器的性能規格并沒有改變,但隨著時間的推移,團隊關系中的人類開始對傳感器的輸出應用不同的價值,這可能是外部激勵因素的影響。雖然大多數分析家都知道,假設所有的異常情況都是威脅是不正確的,也是危險的,但人機協作關系演變為扭曲人類判斷的微妙方式是值得關注的。為了確保人機協作以道德方式進行,領導者必須反思協作結構如何在無意中抑制組織的價值觀。對新作戰技術的準確性和穩健性的要求是合理的,但了解技術煽動的組織行為和習慣對有效和道德地使用是最重要的。
除了在ISR體系內應用現有的人機合作經驗外,人工智能感應網格的設計也應以人為本。雖然在建立一個由人類分析員使用的系統時,這似乎是顯而易見的,但在復雜的系統工程項目中,人因工程和人機協作的考慮往往是一個低優先級的問題。這部分是由于傳統的組織障礙,將軟件工程師和人因專家放在不同的部門,尤其是后者專門研究認知心理學、神經科學和機器人學等學科,這些學科在一些項目中可能發揮有限的作用。未能在復雜系統中適當整合人的因素的后果是可怕的,這在波音公司的737 Max飛機上可以看到,該飛機在2018年和2019年發生了兩起致命事故。兩份事故報告都提到高度自動化的機動特性增強系統(MCAS)軟件是導致飛機失事的一個重要因素。 雖然MCAS被設計為使用傳感器輸入來協助飛行安全,但糟糕的人為因素考慮使得該系統在觸發自動程序后,飛行員很難覆蓋。雖然培訓用戶與新系統合作是入職的自然部分,但由于缺乏人為因素工程而導致的陡峭學習曲線是一種風險,可以通過對人類和機器行為進行建模來減輕,因為它們與手頭的任務相關。 在這種情況下,建模將幫助系統架構師確定在特定的團隊合作關系中造成誤解的溝通差距,也許可以提供關于機器如何在緊急情況發生前向人類操作員充分披露其局限性的洞察力。
當我們推測如何最好地促進人機互動,充分解決與人工智能和自動化相關的安全和倫理問題時,尋求視覺分析專家的咨詢可以提供有價值的設計見解。"視覺分析是一個科學領域,它試圖通過交互式可視化增加人機對話來提高自動化、高容量數據處理的透明度。 為分析師提供一個團隊結構,讓他們選擇如何可視化數據集,可以在自動化、機器輔助的數據精簡和人類判斷之間取得有利的平衡。在傳感網格的可視化分析的最佳應用中,分析師將以高度的信心理解數據集的重要性,這得益于調整基礎分析過程的能力。 理想情況下,可視化分析使用戶能夠通過向系統提出關于數據的假設和問題來利用他們的學科專長,使他們能夠通過對話得出結論。視覺分析中的一種被稱為語義互動的方法也可能是有幫助的,創建的模型可以將分析師與視覺數據的對話轉化為模型的調整,推斷和學習人類伙伴執行常規任務的原因,如突出、復制等。考慮到前面詳述的學科有多新,建立明確的測試和評估標準將是準備將這些和其他團隊技術納入SIAS任務的重要步驟。
美國空軍研究實驗室(AFRL)內的各局無疑面臨著許多挑戰,在這個概念正式確定之前,他們一直致力于建立傳感網格的組成部分。將人工智能整合到智能架構和軟件中的工程師和開發人員主要在羅馬實驗室AFRL信息局(AFRL/RI)工作,分為多個核心技術能力(CTC)團隊。特別是處理和開發(PEX)CTC將深入參與開發實現傳感網的DNN,其任務是"為空軍、國防部和情報界提供快速感知,以提高對形勢的認識和對抗的洞察力"。在PEX CTC中,項目按功能分為特征化、極端計算、理解和預測項目,涵蓋了從數據提取到高級感知的一系列步驟。人因工程方面的專業知識來自位于兩個州外的萊特-帕特森空軍基地的飛行員系統(RH),一個跨學科局。下一步,PEX CTC的項目可能會與AFRL的其他部門(如傳感器(RY)或航空航天系統(RQ))的開發項目相結合,將RI的SIAS部分與新的機載收集傳感器和車輛聯系起來。目前,RI的工程師使用來自實際聯合和國家情報來源的樣本數據流,逐步解決在大量非結構化數據中進行分類的計算挑戰。尋找解決方案以保持物理系統的尺寸、重量和功率要求可控,也是一個持續關注的問題,特別是在像Agile Condor這樣尋求在機載系統上提供高水平邊緣處理的項目。
正如前面的文獻調查所示,在DNN中建立穩健性和安全性,以防止ML中的對抗性干擾,是任何網絡開發者都關心的問題,RI內部的團隊也不例外。DNN已經在實驗室環境中以意想不到的方式學習或失敗,引入與人類感知相矛盾的對抗性輸入,可能會使開發有用工具的進展受挫。如果系統繼續隨著新數據集的發展而發展,那么可能很難確定技術成熟度的基準,在這種情況下,AFRL將維持責任轉移給空軍生命周期管理中心(AFLCMC)是合適的。雖然這一點與建立人工智能傳感網格組件的測試和評估標準的重要性有關,但它也應該引發關于復雜系統在開發和維持組織之間的移交是否適合這種技術的討論。理想的情況是,在DNN上擁有最多專業知識的團隊建立模型,并在其整個生命周期內維護它們。一個更有可能和更少破壞性的行動方案是建立具有可升級底盤和外形尺寸的傳感網組件,允許在可用時用替換設備進行簡化升級。考慮到國家實驗室、DARPA、麻省理工學院、卡內基梅隆大學和其他機構的大量人工智能研究投資,空軍領導人應該考慮如何在研究結果公布后,整合部門的投資回報,以改善感知網的設計和功能。
對于美國防部和空軍領導人來說,為未來傳感網的整合創造條件,還有其他獨特的倫理挑戰需要協調。如果 "傳感網格"及其組件能夠提供該概念所承諾的快速和強大的傳感功能,那么期望所有使用該系統的一線分析員都能理解其工作原理是否合理?在發生災難性錯誤的情況下,初級分析員是否需要了解該技術,以便對涉嫌疏忽的錯誤負責?"將邊緣處理納入傳感網設計也是一個有道德爭議的話題。雖然自動數據處理可以節省SIAS的時間,但分析師如何知道邊緣計算程序是否出現故障,或者他們是否被對手欺騙?從傳感器的邊緣去除人類的認知勞動可以更快地提供數據,但結果的準確性可能會有所不同。那些認識到這些問題,但卻因為要比中國或俄羅斯更快地投入技術的壓力而推遲解決的領導人,應該仔細思考這一立場背后的原因。雖然中國和俄羅斯的政府形式與美國根本不同,但事實是,這兩個國家都有等級制度,對國防事務中的錯誤和不精確性的責任也很重視。以類似于核計劃的方式,美國政府應該領導國際社會與競爭對手分享安全、設計良好的人工智能算法的傳統技術,確保沒有國家因為糟糕的態勢感知工具而引發誤解導致的沖突。最好的國際人工智能軍備控制可能來自于對人工智能研究結果的盡可能透明,并倡導負責任地使用該技術。
盡管完整形式的傳感網格還需要幾年時間才能實現,但最終系統的組成部分可能會在未來十年內逐步投入使用。在為下一代人機協作做好技術、人員和組織的準備方面,還有大量的工作要做。美國防部和空軍ISR領導人不應等到正式的系統首次亮相時才開始倡導在傳感網格技術中采用以人為本的設計,將人工智能的培訓目標納入對一線分析員的指導,并為組織接受該技術和與之合作做好準備。當涉及到設計和構建這個復雜的系統時,物資領導人在考慮采購商業的、現成的軟件以獲得更快的數據匯總解決方案時,應該謹慎行事。在沒有為傳感網格及其系統如何運作建立測試、評估和安全標準的情況下,過早地整合多用途商業軟件可能會給傳感網的人工智能互動帶來不確定性和風險。
此外,找到更快解決方案的愿望不應該先于對人的因素的考慮,因為這對安全和富有成效的人機合作至關重要。美國防部領導人還應該認真審視在整個傳感網中整合邊緣處理的計劃,將其作為一個安全和道德問題,并應仔細思考在哪些地方將人類感知與傳感器輸出分離才是真正合適的。雖然培訓人類分析員是ISR體系可以采取的最明顯的措施之一,以減輕來自外部干預和道德失誤的威脅,但物資領導人也必須考慮他們在采購精心設計的、以人為本的技術方面的作用,作為一個同樣重要的保障。
正如美國國防創新委員會的AI原則。雖然年輕的分析員在快速學習數字應用和程序方面表現出很強的能力,但初級人員也傾向于以令人驚訝的方式信任技術。因此,這些分析員必須繼續接受情報分析基礎知識的培訓,使他們善于識別傳感網格中的算法錯誤和遺漏。空軍領導人在2018年為促進AI和ML素養邁出了務實的第一步,啟動了一項試點計劃,以確定具有計算機語言經驗的空軍人員,希望在各種舉措中利用那些具有編碼專長的人。雖然這項措施將有助于區分具有較高數字熟練度的分析員,但教導勞動力如何運作計算機模型可能是一個更有用的技能組合,以準備在傳感網中進行人機合作。"為傳感網就業準備一線分析員的最壞方法是依靠及時培訓來彌補勞動力對技術知識的差距,從而為SIAS活動引入更大的錯誤率。
為了讓組織準備好接收和整合傳感網格,美國防部和空軍領導人必須首先解決人力需求。盡管像傳感網格這樣的系統被設計成模仿人類的認知勞動,但分析人員的勞動對于質量控制和任務管理仍然是至關重要的,更不用說作為識別DNN內潛在篡改或系統故障的保障。現在還不是為預期的技術進步做出任何急劇的力量結構調整的時候,而這種技術進步離投入使用還有好幾年的時間。此外,到目前為止,關于傳感網將如何整合來自聯合部隊的數據,或者是否允許作戰司令部像今天一樣擁有自己獨特的數據戰略和情報資源的討論很少。如果傳感網由于來自一個服務部門或地理作戰司令部的人為縫隙而無法為分析人員提供更多的情報來源,那么該系統是否真正做到了其設計者所宣傳的?這些問題必須在聯合參謀部層面加以解決和調和。最后,利用來自傳感網的情報的組織必須認識到,當他們與機器合作時,他們很容易受到偏見和捷徑的影響。了解外部壓力和交戰規則如何導致對機器輸出的質疑失敗,對于改善人機伙伴關系,真正使SIAS更加有效至關重要。
美國防部和空軍對人工智能在情報中的應用所進行的研究投資,對于確定部隊應如何準備與傳感網格進行人機合作是至關重要的。對領導人和一線分析人員進行培訓,讓他們了解在自動化、人工智能支持的SIAS中存在的道德難題和對手攻擊的可能性,這對保護組織不傳播錯誤信息至關重要。幸運的是,美國防部和空軍ISR領導人主張在傳感網格系統中采用以人為本的設計和培訓模式還為時不晚,因為AFRL的工程師們正在繼續努力為部隊提供一個安全、務實的解決方案。領導人必須認識到以速度換取精確性的組織傾向,并理解精心設計的系統分階段整合將是值得等待的。
小型無人駕駛飛機系統(sUAS)的指數式增長為美國防部帶來了新的風險。技術趨勢正極大地改變著小型無人機系統的合法應用,同時也使它們成為國家行為者、非國家行為者和犯罪分子手中日益強大的武器。如果被疏忽或魯莽的操作者控制,小型無人機系統也可能對美國防部在空中、陸地和海洋領域的行動構成危害。越來越多的 sUAS 將與美國防部飛機共享天空,此外美國對手可能在美國防部設施上空運行,在此環境下美國防部必須保護和保衛人員、設施和資產。
為了應對這一挑戰,美國防部最初強調部署和使用政府和商業建造的物資,以解決無人機系統帶來的直接風險;然而,這導致了許多非整合的、多余的解決方案。雖然最初的方法解決了近期的需求,但它也帶來了挑戰,使美國防部跟上不斷變化問題的能力變得復雜。為了應對這些挑戰,美國防部需要一個全局性的戰略來應對無人機系統的危害和威脅。
2019年11月,美國防部長指定陸軍部長(SECARMY)為國防部反小型無人機系統(C-sUAS,無人機1、2、3組)的執行機構(EA)。作為執行機構,SECARMY建立了C-sUAS聯合辦公室(JCO),該辦公室將領導、同步和指導C-sUAS活動,以促進整個部門的統一努力。
美國防部的C-sUAS戰略提供了一個框架,以解決國土、東道國和應急地點的sUAS從危險到威脅的全過程。國防部的利益相關者將合作實現三個戰略目標:(1)通過創新和合作加強聯合部隊,以保護國土、東道國和應急地點的國防部人員、資產和設施;(2)開發物資和非物資解決方案,以促進國防部任務的安全和可靠執行,并剝奪對手阻礙實現目標的能力;以及(3)建立和擴大美國與盟友和合作伙伴的關系,保護其在國內外的利益。
美國防部將通過重點關注三個方面的工作來實現這些目標:準備好部隊;保衛部隊;和建立團隊。為了準備好部隊,國防部將最大限度地提高現有的C-sUAS能力,并使用基于風險的方法來指導高效和快速地開發一套物質和非物質解決方案,以滿足新的需求。為了保衛部隊,國防部將協調以DOTMLPF-P考慮為基礎的聯合能力的交付,并同步發展作戰概念和理論。最后,作為全球首選的軍事伙伴,國防部將通過利用其現有的關系來建設團隊,建立新的伙伴關系,并擴大信息共享,以應對新的挑戰。
通過實施這一戰略,美國防部將成功地應對在美國本土、東道國和應急地點出現的無人機系統威脅所帶來的挑戰。在這些不同操作環境中的指揮官將擁有他們需要的解決方案,以保護國防部人員、設施、資產和任務免受當前和未來的無人機系統威脅。
為了應對《2018年國防戰略》所描述的 "更具殺傷力和破壞性的戰場,跨域結合,并以越來越快的速度和越來越快的抵達力進行",美國國防部(DoD)正在通過聯合全域指揮與控制(JADC2),追求提高能力,通過以數字化、分布式的方式更緊密地整合和聯合對抗敵手。為了實現這一概念,需要將傳感器、網絡、平臺、指揮官、作戰人員和武器系統無縫整合,以實現快速的信息收集、決策和力量投射。
美國空軍部(DAF)對JADC2的貢獻是先進作戰管理系統(ABMS),該系統試圖通過傳感器到投射的信息收集、處理、路由、決策和交戰來實現聯合作戰的現代化,以便更快地對敏捷的對手發揮能力。人們對ABMS給予了極大的關注,因為它被認為是一個不斷發展的 "系統體系"和 "空軍的一個根本性的新采用模式"。然而,重要的問題仍然存在,因為ABMS沒有遵循傳統的采用方法,而且DAF預測到2025財年,它將花費大約33億美元。因此,國會正在尋求對ABMS的成本和技術開發工作進一步澄清。
管理和預算辦公室和空軍部要求美國國家科學、工程和醫學研究院評估計劃中的ABMS架構、技術差距和管理。從2020年10月到2021年5月,空軍先進作戰管理系統委員會從大部分公開來源的新聞中進行了廣泛的文獻審查,并召開了12次非機密會議和1次為期多天的機密數據收集會議,以接受專家證詞并收集有關現有ABMS通信和系統集成架構、技術方法和管理結構規劃和能力的信息。盡管COVID-19大流行病阻礙了委員會對作戰和指揮與控制(C2)中心進行實地考察的能力,但委員會還是從許多介紹ABMS和JADC2的專家那里收集了寶貴的見解。委員會還在2020年10月至2021年4月期間每周舉行一次虛擬規劃會議,并在2021年5月下旬舉行一次面對面的會議,以審議和討論關鍵的調查結果和建議。撰寫工作于6月開始,并在2021年9月完成。
空軍先進作戰管理系統委員會感謝眾多知名專家和思想領袖的貢獻,包括來自美國海軍部、陸軍部和空軍部的代表,他們就各自的通信系統和他們對JADC2的態度發表了見解。在研究過程中咨詢的其他專家組織包括聯合參謀部、美國北方司令部、聯合人工智能中心、國家安全局、聯邦資助的研究和開發中心、大學附屬研究中心、商業行業和許多其他機構。
雖然ABMS仍然是一個正在發展的生態系統,但本報告總結了美國國家科學院關于ABMS的共識研究結果和建議,對ABMS是什么和可以是什么,以及在繼續發展的過程中如何改進提供了一個時間點的視角。這項研究由八個委員會成員進行,并得到了我們的研究主任Ellen Chou和她優秀的工作人員的大力協助,包括Evan Elwell和Ryan Murphy。
Philip S. Antón,主席,空軍高級戰斗管理系統委員會
概要
第1章 觀點
第2章 架構和數據
第3章 管理
第4章 挑戰與機遇
附錄
美國國防部(DoD)正在追求通過聯合全域指揮與控制(JADC2)來提高對敏捷對手進行更緊密集成和聯合作戰的能力。這個框架將無縫整合傳感器、網絡、平臺、指揮官、作戰人員和武器系統,以使得聯合部隊和多國家部隊實現快速信息收集、決策和投射。美國空軍部(DAF)對JADC2的貢獻是先進作戰管理系統(ABMS)。
目前對于ABMS存在諸多疑問,它到底是什么?它的結構是否恰當?這些都存在擔憂,因為它缺乏一套明確的、獨立的、指定的最低性能目標,一套固定的要求,一個擬議的能力交付時間表,以及針對這些目標缺乏體系性的分配預算和資源。雖然敏捷性、靈活性和適應性是有價值的目標,但如果沒有一個提供足夠細節、具體要求和衡量標準的計劃來同步這樣一個龐大而復雜的系統,要成功地大規模交付能力就會受到挑戰,也不太可能。
為了解決這些問題,美國空軍先進作戰管理系統委員會被要求審查以下內容:
1.評估規劃中的ABMS數據和通信架構,并比較該架構的預期性能特征,以支持實時火力控制和全域傳感器到投射的數據流、指揮和控制(C2)活動、基于人工智能(AI)的生活模式訓練、戰斗損傷評估以及其他相關的數據活動。
2.確定ABMS技術和規劃中的系統集成架構的任何技術差距和不足。
3.審查ABMS的管理,并建議如何改進規劃中的組織和執行計劃及流程,以更好地使美國空軍部和整個國防部快速實現JADC2行動。
在進行研究時,前空軍負責采購、技術和后勤的助理部長(SAF/AQ)將ABMS的主要責任辦公室(OPR)從DAF的首席架構師辦公室(DAF CAO)轉移到DAF的快速能力辦公室(RCO)。這一變化的結果是雙重的。首先,委員會最初負責審查的任務與ABMS的優先事項和RCO的職責并不完全一致。由于這個原因,委員會為完成所需的分析而要求的一些信息無法提供,委員會收到的一些信息后來被更新的信息所取代。第二,委員會收到的ABMS的情況基本上是過渡性的,因為該系統的技術設計和管理在DAF內部正經歷著重大變化。
作為一個處于早期定義階段不斷發展的系統,ABMS架構及其支持要素仍然是動態的。2020年10月至2021年3月提交給委員會的ABMS技術架構在很大程度上反映了ABMS在"on-ramp "大規模演習中產生的狀態,該演習由DAF CAO主導。早期的架構和方法正在由DAF RCO進行評估和修訂,因為它致力于在將要投入使用的能力版本中創建一套采購方案。因此,委員會的分析反映了該早期架構的方法、益處、挑戰和機遇,并構成了CAO、RCO、DAF和更廣泛的美國防部元素的見解和建議,供他們在追求更新的ABMS架構、其中的單個采購計劃以及更大的JADC2框架時考慮。在新任空軍部長的指導下,DAF RCO已經在為ABMS不斷發展的規劃和設計,解決了其中的一些問題,但其他問題(尤其是非技術性因素)需要進一步考慮。
本報告按主題分為四章:觀點、架構和數據、管理以及挑戰和機遇。第1章描述了為什么需要ABMS,以及它是如何從一個聯合監視和雷達系統的替換計劃發展到一個全方位的指揮和控制系統的。第2章研究了當前和規劃的架構,包括數據標準、軟件、安全、測試和建模。第3章概述了ABMS過去和現在的管理,并強調了人力整合、培訓、文化和其他考慮。第四章詳細介紹了互操作性和情報,并總結了委員會的建議。
從高層宏觀上評論,委員會的結論是,作為一個非傳統的采購項目,ABMS已經走上正軌,但它仍然是一項正在進行的工作。它的技術設計和架構仍處于起步和發展階段,因此委員會很難對其數據和通信架構進行全面評估,特別是當它們與JADC2框架有關時,該框架也正在開發和定義中。此外,委員會發現,性能特征的規模和范圍在很大程度上是有限的,因為它們在很大程度上與“on-ramp”演示有關,而不是與實際作戰活動有關,因為現實世界的物理約束可能會限制實際性能。
委員會認為,指派DAF RCO作為ABMS的領導機構是一個積極的步驟,將ABMS從演示和實驗轉向重點能力開發。委員會還支持空軍部長的呼吁關于建立性能指標以衡量改進和操作結果。
作為一個家族系統,ABMS很難被量化。委員會無法詳細說明和評估ABMS的確切成本,因為它涉及到一個項目組合--其中一些沒有被指定為ABMS的要素,但仍被列為更廣泛ABMS生態系統的一部分。國會決定將ABMS的總預算減少近一半,這顯然限制了ABMS在近期和中期所能完成的工作。但是,這種預算限制也可能迫使DAF領導人對ABMS的投資和能力做出必要的決策和優先考慮。
委員會發現,目前的ABMS以及更廣泛的JADC2管理結構是不夠的,缺乏適當的權力來執行所有領域的指揮和控制。由于缺乏一個國防部級別的執行機構來處理和解決JADC2框架所有參與者的技術、操作和指揮決策,導致每個軍種和國防部機構都在開發自己的C2系統,其獨特的要求、標準和技術規范對實現互操作性構成挑戰。
委員會認識到,在本分析過程中,ABMS的技術方法和管理結構都在不斷發展。因此,需要注意的是,下面總結的和本報告其余部分詳細介紹的一些建議是針對早期的ABMS方法的,而其他建議可能仍然與較新的、更集中的項目計劃有關。
2022年6月15日,英國國防部在倫敦科技周人工智能峰會上發布了《國防人工智能戰略》,旨在“雄心勃勃、安全和負責任地”使用人工智能的戰略和相關政策。本戰略支持創建新的國防人工智能中心(DAIC),以提供前沿技術樞紐,支撐英軍使用和創新相關技術。本戰略概述了以下內容:一是在國防中使用人工智能的新倫理原則;二是人工智能在國防部加強安全和現代化的地位和應用;三是考慮通過人工智能研究、開發和實驗,通過新概念和尖端技術徹底改變武裝技術能力,并有效、高效、可信地向戰場交付最新裝備。該戰略將將成為英國人工智能戰略的關鍵要素,并加強國防在政府層面通過科學和技術獲取戰略優勢的核心地位。
圖 英國國防部發布《國防人工智能戰略》
(本文根據原文編譯整理,僅供交流參考,觀點不代表本機構立場。)
英國國防部人工智能戰略的愿景是:以英國規模為標準,成為世界上最有效、最高效、最可信和最具影響的國防組織:
有效——提供戰場制勝能力和支持,以及英國與盟友關于人工智能生態系統合作的能力;
高效——通過創新使用技術交付能力,進行作戰并實現生產力效應;
可信——基于人工智能系統的安全性和可靠性受到公眾、盟友和人民的信任,根據英國核心價值觀合法合規地使用人工智能;
影響——積極參與合作和引領人工智能技術的全球發展和管理趨勢;
二**、背景和必要性******
英國國防部《綜合評估(2021)》強調指出,國家在人工智能領域的卓越表現是確保英國在2030年前成為“科技超級大國”的核心。英國國防部《國家人工智能戰略(2021年)》指出,人工智能在改寫整個行業的規則、推動經濟大幅增長和改變生活的所有領域方面具有巨大潛力。英國國防部《綜合作戰概念 (2020年) 》描述了無處不在的信息和快速的技術變革如何改變了戰爭的性質。在軍事作戰的各個領域,沖突正變得愈發復雜。新技術產生大量數據,解鎖新的威脅和漏洞,并通過如蜂群無人機、高速武器和先進網絡攻擊等下一代先進能力擴大潛在攻擊的規模。
人工智能技術以及其影響可能會極大地縮短決策時間,使人類理解負擔加重,而且這些在現代戰場中需要快速做出反應。正如《國防司令部文件(2021)》所指出的,“未來沖突的勝負可能取決于所采用人工智能解決方案的速度和效率”。因此信息作戰變得越來越重要。簡而言之,當代國防正在發生一場根本性的劇變,與人工智能相關的戰略競爭正在加劇,因此必須迅速、主動和全面應對。
本戰略闡述了英國將如何應對這一重大戰略挑戰,其應該引起英國國防部的重視,并參與部隊發展和國防轉型,英國國防部需要明確其機構與人工智能相關的要素并采取相應行動,以在后續執行和交付方面發揮關鍵作用。
三、發展途徑
**一是英國國防部需要轉變為“人工智能就緒”的組織。**具體措施是:1)推動文化、技能和政策變革,培訓領導人,提高人員技能,并加強國防人工智能和自主部門的組織能力;2)創建國防人工智能技能框架和新的人工智能職業發展和晉升路徑;3)將數據視為關鍵戰略資產進行管理和應用,建設新的數字主干網絡和國防人工智能中心。
**二是在速度和規模上采用和利用人工智能,以獲得防御優勢。**具體措施是:1)將人工智能視為能力戰略和部隊發展過程中戰略優勢的關鍵來源;2)短期路線采用成熟的數據科學、機器學習和先進的計算統計技術提升效果和生產力,長期路線進行尖端人工智能技術研發;3)采用多學科多技術將人類認知、創造力和責任與機器速度分析能力相結合以評估人工智能系統的脆弱性和威脅;4)與盟友和伙伴密切合作開發創新能力解決方案以應對共同的挑戰。
**三是推動和支持英國國防和安全人工智能生態系統。**具體措施是:1)通過英國工業和學術人工智能的雄厚基礎以及政府的支持建立信心并明確要求;2)視人工智能生態系統為戰略資產,消除行業壁壘,建立更具活力和一體化的伙伴關系;3)促進行業聯系建立新的國防和國家安全人工智能網絡,促進人才交流和共創,鼓勵業界投資國防相關的人工智能研發,并簡化國防數據和資產的獲取。4)促進中小企業,使監管方法現代化,支持業務增長并最大限度地利用國防人工智能相關知識產權促進相關技術商業化。
**四是塑造全球人工智能發展,以促進安全、穩定和民主價值觀。**具體措施是:1)按照英國的目標和價值觀塑造人工智能的發展,促進倫理方法,并影響符合民主價值觀的全球規范和標準;2)促進安全與穩定,確保英國的技術進步得到適當保護,同時探索建立信心和將軍事人工智能使用風險降至最低的機制;3)考慮可能出現的極端甚至事關生存的風險,并積極與盟友和合作伙伴接觸,制定未來的安全政策,尋求建立對話,以降低戰略錯誤、誤解和誤判的風險。
四、優先效果
通過采用人工智能技術實現本戰略目標,使英國武裝部隊實現現代化,并迅速從工業時代的聯合部隊過渡到敏捷信息時代的綜合部隊,國防部將受益于效率和生產率的提高,其期望的優先效果如下:
決策優勢:通過更充足、更分散的決策制定和基于威脅的機器快速響應,提高作戰節奏和靈活性。
效能:通過智能自主提高靈活性、效能和可用性。
解鎖新能力:通過開發新的作戰方式確保作戰優勢,增強軍事效果,保護人民免受傷害。
武裝部隊:減輕部隊負擔,并將人類決策集中在基于獨創性、背景思維和判斷力的高價值職能上。
五、戰略綜述總結****
**六、**結束語
人工智能必須成為未來必不可少的技術,其也促使著英國國防部改變對現代技術的看法,調整其技術方向和戰略需求,全面擁抱世界領先的人工智能解決方案和能力,推進其國防業務中觀念、文化、規劃和交付方面的持久變化,并將其作為國防戰略融入國防領域,以確保英國軍隊成為敏捷信息時代的綜合部隊。
編譯:船の心
END
世界軍事電子領域2021年度十大進展
美國陸軍現代化戰略將人工智能(AI)確定為陸軍優先研究領域(PRA)之一[1]。作為美國陸軍作戰能力發展司令部(DEVCOM)科技事業的一部分,DEVCOM-大西洋前沿部隊今年發起了兩項新的人工智能倡議,以促進與外國學術界和工業界在該優先研究領域的合作機會。第一個倡議,即人工智能重點國際虛擬交流系列(AI FIVES)[2],是一個虛擬研討會,為國際組織提供一個平臺,向美國國防部主題專家和利益相關者介紹他們的人工智能研發活動和能力,促進討論和合作。在AI FIVES下促成的演講涉及的主題包括對抗性機器學習;強大和有彈性的人工智能;來自小數據的預測分析;可解釋和可信賴的人工智能;網絡和安全;用于改善態勢感知和決策的人工智能;以及有人和無人的互動和團隊合作。第二項倡議,xTechGlobal - AI挑戰賽[3],是陸軍助理部長(采購、后勤和技術)遠征技術(xTech)獎競賽項目[4]向國際參與者的首次擴展。xTechGlobal-人工智能挑戰賽從歐洲、非洲和中東的非傳統/小型企業技術開發商那里尋求創新的相關技術,以解決強大的人工智能能力問題,從而在嚴重的資源限制下,如計算能力和需求點的帶寬,管理、整合、處理并從不同的數據源中獲取信息,以便快速決策。在一次成功的競賽之后,有機會繼續并擴大xTechGlobal競賽,使之成為由大西洋、美洲和印度洋-太平洋地區不同地域的DEVCOM前沿要素贊助的其他優先挑戰主題。本文將討論這些舉措的起因、結果以及對陸軍更廣泛的人工智能研究活動的貢獻。
美國陸軍作戰能力發展司令部(DEVCOM)是美國陸軍未來司令部的一個主要下屬司令部,是陸軍的科學和技術領導者[5]。DEVCOM由八個主要的下屬單位組成,包括 軍備中心;陸軍研究實驗室;航空和導彈中心;化學生物中心;指揮、控制、計算機、通信、網絡、情報、監視和偵察中心;數據和分析中心;地面車輛系統中心;和士兵中心。除了實驗室和七個中心外,DEVCOM還有三個國際前沿單位。DEVCOM-美洲、DEVCOM-大西洋和DEVCOM-印度太平洋。指揮部為陸軍的六個現代化優先項目提供基礎科學研究、技術開發、工程和分析支持,重點是提供支持多領域行動的能力。
大西洋發展司令部在英國、法國、德國和以色列的國際技術中心(ITCs)安排了科學家、工程師和軍官。國際技術中心的作用是發展與盟友和親密伙伴的關系;與外國政府、工業界和學術界進行技術搜索;通過學術界、工業界和政府的伙伴關系,與外國伙伴確定基礎和應用研究的機會,提供強有力的科學和技術支持[6]。DEVCOM-Atlantic還包括科學和技術的實地援助(FAST)顧問,他們作為作戰司令部的陸軍單位和研究實驗室之間的聯絡人,確定關鍵需求和實驗機會,以支持陸軍的任務。
從2020年開始,DEVCOM-Atlantic發起了兩項新的倡議,以促進其地理區域內以人工智能(AI)為中心的學術界和工業界的合作機會。第一項舉措,重點國際虛擬交流系列(FIVES)為國際組織提供了一個平臺,向美國國防部主題專家和利益相關者介紹他們的人工智能研發活動和能力,促進討論和合作。第二項舉措,xTechGlobal是陸軍助理部長(采購、后勤和技術)遠征技術(xTech)獎競賽項目[4]向國際參與者的試點擴展,其中包括一個人工智能問題聲明。
俄羅斯總統弗拉基米爾·普京宣布 2021 年為俄羅斯科技年,11 月被命名為人工智能 (AI) 月,這表明俄羅斯領導層對這一總括性術語的濃厚興趣。俄羅斯國防部門尤其被這些人工智能技術相關機遇所吸引。近年來,人工智能、機器人技術以及將自動化和自主性進一步整合到武器系統和軍事決策中,都被強調為俄羅斯武裝部隊現代化的優先事項。
2017 年,普京有句名言:“人工智能是未來,不僅是俄羅斯,也是全人類……誰成為這一領域的領導者,誰就成為世界的統治者”。引用這句話,分析人士經常將俄羅斯的發展歸因于、測試和使用武器化的 AI 來與當前領先的 AI 開發商:美國和中國在所謂的全球 AI 競賽或全球技術競賽中競爭的必要性。雖然認為競爭和追趕的需求是俄羅斯動機的一部分,但它對軍事人工智能的興趣不應僅僅歸因于對相對實力的追求。要了解俄羅斯圍繞人工智能、自治和自動化的辯論的深度和復雜性,需要審查有關其對俄羅斯軍隊的戰略影響、自治的好處和風險,以及更廣泛地說技術現代化和技術現代化的重要性的討論。俄羅斯在世界上的地位的創新。
本報告旨在概述面向國際受眾的不同概念和動機,這些概念和動機一直并正在指導俄羅斯政治和軍事領導人實現其追求武器化人工智能的雄心。首先,它概述了俄羅斯軍隊追求人工智能、自主和自動化背后的各種外部和內部因素。其次,它介紹了俄羅斯在這一領域的一些計劃、對其能力的了解以及加強這些計劃所面臨的挑戰。第三,它深入探討了俄羅斯關于自主,特別是自主武器系統的辯論,以及關于開發所謂的“殺手機器人”或自主戰斗機器人的倫理討論,這是一個經常使用的術語在俄語文學中。
該分析基于對開源材料的調查,包括媒體報道、新聞稿、官方聲明和演講、同行評議的文章和智囊團報告,以及俄羅斯軍事期刊上的出版物。作者希望將其作為正在進行的博士研究項目的第一步,以及對新興的關于俄羅斯如何看待武器化 AI 的英語文獻做出貢獻。
本報告分析了自主、自動化和人工智能的概念——這三個術語在俄羅斯和國外經常相互混淆。值得從探索這些概念開始。自動化是一種基于特定動作或規則序列將任務委派給機器的方式,從而使流程更具可預測性。自動化系統是“根據預編程腳本執行具有定義的進入/退出條件的任務”。自主性是一個更復雜的過程,廣義上的意思是“對機器進行編程以執行通常由人員執行的某些任務或功能人類”,但沒有詳細的規則,因此更難以預測。人工智能可以定義為“數字計算機或計算機控制的機器人執行通常與智能相關的任務的能力。” 人工智能及其子集,例如機器學習,以及其在計算機視覺、面部和聲音識別等方面的應用,可用于實現武器系統更高水平的自動化和自主性。自主武器系統通常被定義為“一旦啟動,無需人工操作員進一步干預即可選擇和攻擊目標的機器人武器系統。” 聯合國安理會 2021 年 3 月發布的一份報告表明,土耳其制造的 Kargu-2在利比亞內戰期間,游蕩彈藥系統被編程為以自主模式選擇和攻擊目標。這被世界各地的媒體描述為首次使用致命的“殺手機器人”。但是,尚不清楚該系統在攻擊時是否真正自主運行。
【在人工智能進步的幫助下,武器系統可以在自主范圍內進一步發展,承擔更多任務,并最終在戰場上取代人類】
圖1. 武器系統的自主性
同時,這些領域之間的能力并不總是相同的。在俄羅斯的案例中,自動化和無人機器人系統的開發比集成更現代的基于機器學習的系統更先進。俄羅斯軍事文獻中經常提到的“自動化”(автоматизация)過程——其他術語包括“機器人化”(роботизация)、“智能化”(интеллектуализация)或“數字化”(дигитализация)并不是一個新現象。 俄羅斯在自動化和遠程控制武器系統方面的能力相對優于其在人工智能總稱下整合機器學習和廣泛技術的其他子元素的能力。許多軍事決策者和分析人士的立場是,借助人工智能的進步,武器系統可以在自主范圍內進一步發展,承擔更多任務,并最終在戰場上取代人類。
美國軍方和情報界對開發和部署人工智能 (AI) 系統以支持情報分析表現出興趣,這既是利用新技術的機會,也是應對不斷激增的數據過剩的解決方案。然而,在國家安全背景下部署人工智能系統需要能夠衡量這些系統在其任務背景下的表現。
為了解決這個問題,作者首先介紹了人工智能系統在支持智能方面可以發揮的作用的分類法——即自動分析、收集支持、評估支持和信息優先級——并提供了對人工智能影響驅動因素的定性分析。每個類別的系統性能。
然后,作者挑選出信息優先系統,這些系統將情報分析師的注意力引導到有用的信息上,并允許他們忽略對他們無用的信息,以進行定量分析。作者開發了一個簡單的數學模型來捕捉此類系統的錯誤后果,表明它們的功效不僅取決于系統的屬性,還取決于系統的使用方式。通過這個練習,作者展示了人工智能系統的計算影響和用于預測它的指標如何用于描述系統的性能,以幫助決策者了解其對情報任務的實際價值。
報告指出,目前存在多種描述人工智能系統性能的標準方法,包括通常被稱為“精確度”、“召回率”和“準確率”等指標,但這些標準并未提及該系統對其所支持任務的影響。在準確率與情報任務成功之間沒有明確關聯的情況下,只能依據情報任務的完成水平對系統有效性作出臨時判斷。基于此,報告作者將人工智能系統在情報分析過程中可發揮的功能分為四大類,分別評估每項功能的錯誤輸出可能會對結果產生的影響,從而理解“人工智能系統性如何影響情報分析的有效性”。
按照情報周期的組織過程,報告將人工智能系統可在該過程中發揮的作用分為四大“系統功能模塊”,分別是提供評估支持、自動分析、優先信息和收集支持。報告為每個功能模塊設計了函數模型,以詳細推演其在情報過程中的作用。
通過對“從任務到系統”的追溯性推演評估,報告得出兩個一般性結論:首先,在部署人工智能系統前,制定與符合實際情況優先級的情報監測指標十分重要,這一工作應以評估系統部署的實際影響力為指導;其次,系統的有效性不僅取決于系統屬性,還取決于如何使用。
?美國國防部已經可以開始應用其現有的國際科技協議、全球科學網絡以及在多邊機構中的作用來促進數字國防合作。本報告將這些選項集合構建為軍事人工智能合作工具箱,可為調整政策、推進研究、開發和測試以及連接人員提供了有價值的途徑。
美國將人工智能 (AI) 的領導地位視為提升其在國際體系中的戰略地位和保持其未來軍事優勢的關鍵。美國的盟友和伙伴網絡是服務于這些目標的不對稱資產,正如旨在讓美國為當前戰略競爭時代做好準備的國家安全和國防政策所確認的那樣。
最值得注意的是,美國國防部 (DOD) 人工智能戰略中宣布的關鍵舉措和國家安全委員會關于人工智能的建議表明了國際參與對人工智能安全、安保、互操作性和與民主價值觀保持一致的重要性。
簡而言之,人們一致認為,加強聯盟和伙伴關系很重要,不僅因為美國在聯盟中行動,而且因為俄羅斯等經常單獨行動。由于技術加速如何推動軍事進步、刺激經濟增長和塑造21世紀的治理模式,人工智能和其他新興技術是與這些近乎同等競爭對手競爭的核心。如果不深化與盟友和伙伴的合作,美國既無法應對大國帶來的挑戰,也無法從塑造人工智能的民主軌跡中獲益。
在此背景下,本報告重點關注通過基于可互操作部隊和尖端技術的強大軍事關系,維護美國及其伙伴和盟國網絡相對于潛在對手的優勢的必要性。國防部已經擁有多種工具可用于深化與其盟國和國際安全伙伴的科技(S&T)合作。但為了充分利用它們在人工智能方面的潛力,該部門需要重新設想并更好地整合它們。
為此,此處的分析將現有的國防科技協議、軍事科技交流和多邊機構的要素構建為軍事人工智能合作工具箱。這項工作不僅僅是為人工智能能力開發集中資源,還包括政策調整;測試、評估、確認和驗證 (TEVV) 管道;研發(R&D)、人員交流;數據共享;和標準化。這里的目的不是提出新的協議,而是回答國防部如何利用其現有的科技合作機制來支持數字時代的軍事合作,確保相關資源和框架在尋求人工智能領導力和未來時不會被利用聯軍成功。
雖然應該承認挑戰,包括圍繞數據交換的敏感性和對技術政策的不同政策觀點,但隨著時間的推移,它們也可以成為合作以減輕這些障礙的動力。換言之,現有工具有助于在政治信任、凝聚力和互操作性方面獲得更多支持,從而使合作有助于應對數字威權主義和技術驅動的國際安全環境變化的共同挑戰。 主要發現是:
雖然軍事人工智能合作的某些方面可能需要新的投資、機制和協議,但這不應該排除現有工具可以用于新用途的多種方式。軍事人工智能合作工具箱之所以有吸引力,正是因為它可以在短期內啟動,滿足與盟友和伙伴盡早建立互操作性和推進人工智能的緊迫性。
近日,美國人工智能國家安全委員會發布最終報告(草案)。本報告共分為兩大部分:第一部分,“在人工智能時代保衛美國”(第1-8章)概述了美國必須做些什么來抵御來自國家和無政府組織的人工智能相關威脅,并建議美國政府如何負責任地使用人工智能技術來保護美國人民和利益。第二部分,“贏得技術競爭”(第9-16章)概述了人工智能在更廣泛的技術競爭中的作用,并建議政府必須采取行動促進人工智能創新,從多個方面提高國家競爭,保護美國的關鍵優勢。
這兩個部分共同代表了白宮領導下的戰略綱要,該戰略旨在調整國家的方向,以應對新興時代的機遇和挑戰。
美國人工智能國家安全委員會于2019年由國會特許成立,旨在探討人工智能對美國國家安全的影響。該報告中包括對白宮、聯邦機構、國會和其他實體的詳盡建議,涉及從勞動力、知識產權到倫理的各個主題,最終報告預計將影響未來幾年拜登政府和國會議員所采取的人工智能政策。
這兩個部分共同代表了白宮領導下的戰略綱要,該戰略旨在調整國家的方向,以應對新興時代的機遇和挑戰。