自 1994 年麻省理工學院數學家彼得-肖爾(Peter Shor)發現大數因式分解的量子算法以來,量子信息科學與技術一直處于科技前沿。量子理論的進步也推動了實際技術的應用。從加密、人工智能、傳感到通信,量子技術既可應用于民用社會,也可應用于軍事領域。因此,這種多用途的適用性有可能改變國際安全,因為科學發達的國家都在爭奪量子霸權。本研究探討了量子科學的應用以及這些應用如何對國際安全產生潛在影響。由于家資助和支持量子科學研究,研究方法的來源將包括學術期刊和在線資源以及政府報告。量子技術的實際應用,包括量子計算、量子傳感和量子通信,將構成本研究的主要范圍。
在量子計算取得進步的同時,量子比特也在不斷發展,這表明量子信息科學與技術正在迅速成為現實。量子研究的成功不僅展示了量子科學的可行性,還展示了如何通過產生更多的量子比特來實現量子至上(Kelly,2018)。隨著學術界、政府和跨國公司的科學家和研究人員不斷推進量子科學的發展,量子科學在技術領域的潛在應用也在不斷發展和擴大。
如何利用量子科學推進量子計算、通信或傳感?另一方面,量子科學是否也能破壞當今使用的標準加密?如果是這樣,國家或網絡犯罪分子是否會大膽而邪惡地在軍事或網絡空間部署量子技術來打擊目標和其他國家?像美國政府這樣資源充足的政府該如何確保自己在量子研究領域保持領先地位,并在全球工業和國防領域具有競爭力?本研究要解決的主要問題是量子科學與技術的新興應用,以及這些應用如何改變國家、網絡犯罪分子和平民的國際安全進程。
量子科學主要以理論為基礎。然而,對量子化應用和量子計算過程的預期導致了必須考慮的潛在問題。當今量子科學的核心是推進量子計算的能力。而量子計算則需要在穩定的環境中無差錯、無噪音地處理量子比特。由于量子比特很脆弱,因此不能在溫度波動等有噪音的環境中進行處理。由于 “需要接近絕對零度的極低工作溫度”(M?ller & Vuik,2017 年,第 254 頁),這種敏感性是一個常見的挑戰。雖然云計算有可能解決這一敏感性問題,但量子計算在理論上甚至能夠解密云計算。
因此,推動量子科學發展的根本問題之一是量子計算所需的量子比特數量。根據凱利(2018)的說法,“用 49 個量子比特就可以舒適地展示量子至上”。除非量子比特的數量繼續增加,以支持更強、更快的量子計算機,否則量子科學仍將是一種理論。從本質上講,量子比特的數量決定了量子科學能否在現階段的基礎上進一步發展。
第二個潛在問題是量子科學的預期和應用。具體來說,量子計算有可能破解加密,包括現代的 RSA 2048 位加密,只需 2 千萬量子比特,而不是之前評估的 10 億量子比特(Jee, Hao, Firth & Temple, 2019)。因此,隨著量子比特數量的大幅減少,解密 2048 位加密所需的時間也大幅減少。正如后文所述,解密時間的縮短和所需量子位的減少也會產生重大影響。
與量子計算相關的另一個問題是處理大量非結構化數據的能力。例如,金融服務業依賴于及時、快速分析大量非結構化數據的能力。量子驅動的算法可以執行此類分析,優化投資組合。但問題是,還沒有人 “設法擴展量子計算機使其發揮作用”,“與金融業相關的計算需要數百或數千量子比特才能解決”(Dietz et al.) 理論上可以處理非結構化數據,但發展仍然滯后。
推進和使用量子計算存在一些重大問題。如果今天的 2048 位加密能夠通過量子驅動的算法和計算被破解,那么今天的敏感和加密信息最終將被利用并向公眾披露。例如,政府的機密和敏感信息可能會因為加密被破解而提前泄露。國家現在就可以開展網絡行動,獲取盡可能多的加密數據,以便在未來量子計算準備就緒時進行解密。
因此,如前所述,量子計算機解密 2048 位加密的預期能力和貢獻產生了重大影響。在民用層面,如果量子計算在未來可以用于解密這些敏感數據,那么今天的個人身份信息(PII)、健康和醫療記錄或金融賬戶的加密數據將不再安全(Norris,2020 年)。在國家安全層面,一旦使用量子計算解密,有關軍事通信、戰略、移動或部署的加密信息將不再安全(Vermeer & Peet,2020)。如果這些數據和信息可以在未來解密,那么不法分子現在就可以試圖獲取這些數據和信息進行保管。一旦量子計算解密了 2048 位加密,行為者就可以利用他們已經獲取并存儲起來的數據。這種情況進一步提高了對這種可能結果進行評估和規劃的緊迫性。
隨著科學家和研究人員努力推動量子信息科學與技術的發展,科學界認識到量子科學取決于能夠產生的量子比特數量。量子比特的數量使量子計算能夠執行經典計算機通常無法執行的復雜算法。一旦生成了足夠的量子比特而沒有錯誤和噪聲,量子計算就能為包括量子通信、傳感和密碼學在內的技術提供動力。有了這種量子驅動的技術,國家就能進一步推進其政治、經濟和軍事議程,并提高其在世界上的地位。國家最終將有能力推進其產業,包括軍事、太空任務和健康計劃。那么,問題就變成了國家將如何應用量子驅動技術,以及在哪些行業應用。同樣,哪些國家正在通過政府項目和研究開展強有力的量子研究?因此,本項目旨在研究量子科技的實際應用和技術應用,以及政府對量子科技的興趣和計劃。在此過程中,還可以研究量子科技對國際安全的潛在影響。
如今,幾乎不可能有哪一門學科不受機器學習(ML)研究和應用的影響。有幾個因素推動了 ML 的快速和廣泛發展,包括設備產生的大量復雜數據、價格低廉但功能強大的處理單元和存儲介質的普及,以及人類生活對自適應、自動化、安全和大規模解決方案和服務的需求不斷增長。盡管具有廣泛的適用性,但在 ML 生態系統中仍存在重大障礙,例如基于 ML 的解決方案的設計和開發嚴重依賴專家知識,大量的 ML 資源需要組織技術來促進訪問、共享和分析,以及由于隱私和安全問題而無法獲取高質量數據。目前解決這些障礙的大多數方法都是集中式的,容易出現可擴展性問題,尤其是在處理地理分布資源時。此外,這種集中式解決方案的經常性、性能、安全性和隱私性在很大程度上取決于控制中心或組織的運作。
本論文提出了分布式和基于智能體的解決方案,用于組織數據集和學習模型等機器學習資源。它旨在通過簡單而靈活的查詢結構使這些資源的分析大眾化,使訓練、測試、模型選擇和超參數調整等常見的機器學習任務自動化,并在分布式數據集上建立以隱私為中心的機器學習模型。基于聯網的多智能體系統,所提出的方法將 ML 資源表示為自主和自立的實體。這種表示方法使資源易于移動、可擴展且不受地理位置的限制,從而減少了對集中控制和管理單元的需求。此外,由于所有機器學習和數據挖掘任務都在其資源附近進行,因此提供商可以獨立于系統的其他部分應用定制的規則。
論文對提出的模型進行了理論和實證分析。所提出的理論評估證明,所提出的基于多智能體的自動化機器學習任務分散模型在算法上是正確的,在計算上也是可行的。具體來說,如果用戶提出的機器學習查詢存在答案,模型將以多項式時間復雜度找到答案,并在早期階段報告潛在故障。另一方面,所提供的實驗結果驗證了模型的有效性和效率,并分析了它們在各種數據分布設置下的學習行為。
本文的材料分為五個主要章節。第 2 章概述了基于多智能體系統的分布式計算,以及處理大規模問題時經常采用的組織結構。然后,它概述了文獻中將分布式計算和基于智能體的技術整合到數據挖掘和機器學習研究中的各種策略。本章還回顧了邊緣計算領域廣泛使用的協作式機器學習模型方面的現有工作。本章還概述了社區內機器學習任務民主化和自動化的常用方法。第 3 章深入探討了設計和開發組織多智能體系統的復雜性,該系統旨在以分散和自主的方式自動執行模型訓練和測試任務。討論包括理論證明和經驗結果,以仔細檢查系統的性能。第4章提出了一種基于智能體的全自動協作機制,用于以分布式方式選擇機器學習算法,并同時調整其超參數。本章利用所提出的基于智能體的平臺,從形式上和經驗上深入研究了這些機制的有效性和效率。第5章介紹了全息學習(Holonic Learning,HoL),這是一個以協作和隱私為重點的學習框架,通過利用全息概念來訓練深度學習模型。本章展示了多個實驗設置,以驗證和檢查擬議模型的收斂性和性能。第 6 章總結了本論文的貢獻,并討論了理論和實證研究結果。此外,本章還討論了尚存在的挑戰,并為該領域未來的研究工作提出了建議。
在國防和國家安全領域部署物聯網(IoT)系統面臨著一些限制,而邊緣計算(Edge Computing)方法可以解決這些問題。邊緣計算和物聯網范例的結合帶來了潛在的好處,因為它們正視了傳統集中式云計算方法的局限性,傳統云計算方法易于擴展、支持實時應用或移動性,但其使用在網絡安全等方面存在一定風險。本章確定了國防和國家安全機構可以利用商用現貨(COTS)邊緣物聯網功能為作戰人員或急救人員提供更高的生存能力,同時降低成本并提高運行效率和有效性的場景。此外,它還介紹了戰術邊緣物聯網通信架構的總體設計,指出了廣泛采用該架構所面臨的挑戰,并為國防和國家安全領域實現經濟高效的邊緣物聯網提供了研究指南和一些建議。
關鍵詞 物聯網、戰場物聯網、國防和公共安全、戰術物聯網、邊緣計算、公共安全響應者、信任管理、戰術邊緣
本章其余部分的內容安排如下。第 1.2 節介紹本章將使用的基本概念。第 1.3 節回顧了當前商用現成 (COTS) 邊緣物聯網應用為戰術環境創造的機遇。第 1.4 節介紹了一些有前景的戰術邊緣物聯網應用場景。第 1.5 節概述了戰術邊緣物聯網通信架構的總體設計。第 1.6 節概述了阻礙戰術邊緣物聯網技術應用的挑戰,并提出了一些進一步研究的建議。最后,第 1.7 節是結論部分。
圖 1.2:國防和公共安全領域戰術邊緣物聯網的目標場景。
以網絡為中心的戰爭(NCW)模式 [73] 將戰場資產與總部連接起來。這種概念通過促進用戶之間安全、及時地交換信息而帶來好處。此外,NCW 范式結合了三個域:物理域,在事件和行動發生的地方生成數據;信息域,傳輸和存儲數據;認知域,處理和分析數據,以實現決策和任務規劃。NCW 的三個域與當今商業邊緣物聯網的基礎相對應。
在以網絡為中心的 C2 行動中,責任被下放到戰場邊緣[74],形成了所謂的戰場物聯網 (IoBT),可將戰場上所有有助于做出明智決策的事物匯集在一起。然而,這些動態需要能確保網絡效率的網絡范例。在 [74] 中,作者將以信息為中心的網絡(ICN)與軟件定義網絡(SDN)結合起來,以滿足這些要求。
本節分析了一些與邊緣服務最相關的戰術物聯網應用場景,如圖 1.2 所示。指揮、控制、通信、計算機、情報、監視和偵察(C4ISR)和火控系統的應用主導了國防和 PS 物聯網相關技術的采用,因為傳感器主要用于收集和通信數據,以改進 C2。雖然物聯網和邊緣計算技術以前曾用于與后勤和訓練有關的應用,但它們與其他系統的集成往往有限。
如前所述,邊緣物聯網功能可用于在戰場上提供卓越的態勢感知。指揮官可根據從無人機/無人駕駛傳感器和戰場報告中提取的 AI/ML 數據整合后得出的實時分析結果做出決策。地面傳感器和攝像機,以及人或無人設備、車輛或士兵都能為指揮官提供廣泛的信息。上述物聯網設備能夠掃描任務環境,然后將信息發送到前沿基地的邊緣計算服務器。這些信息的一部分可由指揮中心收集,并在那里與其他來源的信息進行處理和融合。
圖 1.3:戰術邊緣物聯網系統的通信架構
量子導航技術有望徹底改變軍事行動,尤其是在傳統導航系統難以發揮作用的情況下。隨著戰爭越來越依賴于隱形、自主系統以及在全球定位系統失效環境下的可靠導航,量子技術提供了無與倫比的精確性、自主性和安全性。在陸地、海上或空中的軍事環境中,這些系統有望克服全球導航衛星系統(GNSS)和慣性導航系統(INS)的局限性。量子慣性傳感器、重力儀、磁力計、定位系統和量子通信協議可用于加強軍事行動。
包括全球定位系統在內的全球導航衛星系統一直是現代軍事導航的基石。然而,對衛星信號的依賴使這些系統容易受到干擾、欺騙和物理攻擊。全球定位系統信號很容易受到對手的干擾,在某些環境下,如水下或信號干擾密集的爭議地區,其可靠性會急劇下降。現代沖突,如正在進行的俄羅斯-烏克蘭戰爭和以色列-哈馬斯戰爭,暴露了 GPS 固有的弱點,即信號干擾、欺騙和在有爭議的環境中失去服務,嚴重影響軍事效率。這種局限性迫使軍事戰略家和研究人員探索替代導航系統,而量子技術作為一種潛在的游戲規則改變者走在了前列。此外,全球導航衛星系統在水下無法使用,嚴重限制了其在潛艇或北極條件下的應用。
傳統的慣性導航系統雖然能夠獨立于全球導航衛星系統(GNSS)工作,但會出現 “漂移”--一種由不精確的加速度計和陀螺儀造成的累積誤差。這種誤差會隨著時間的推移而加劇,從而限制了慣性導航系統在不通過全球導航衛星系統重新校準的情況下執行長時間任務的有效性。然而,量子慣性導航系統(QINS)基于原子干涉測量法,可顯著提高精度并最大限度地減少隨時間的漂移。
量子加速度計和陀螺儀利用量子力學原理,將超冷原子(如銣或銫)作為高靈敏度的運動探測器。例如,第一臺使用銫原子的量子陀螺儀的偏置穩定性比最好的商用級光纖陀螺儀好 300 倍,其角度隨機漫步(噪音測量)的準確性也高出 1000 倍。 這意味著量子陀螺儀可以提供長達數月的高精度導航,而無需重新校準,因此非常適合軍用潛艇或在 GPS 信號屏蔽環境中自主運行的無人機。
目前,量子陀螺儀的角漂移率已達到 1e-6°/小時,明顯優于傳統系統,后者的漂移率為 0.001°至 1°/小時,導致 10 公里/小時的誤差。量子陀螺儀的這一精度水平降低了通常與 INS 漂移相關的導航誤差,使軍事資產能夠長時間保持航向,而無需進行地面固定。
量子定位系統(QPS)為全球導航衛星系統(GNSS)提供了一個改變游戲規則的替代方案。通過利用量子加速計、陀螺儀和重力儀,QPS 無需外部信號或衛星數據就能計算出精確的位置,從而使其具有防篡改性,不受干擾或欺騙。
QPS 依靠量子增強慣性傳感器,即使在長時間任務中,也能以精確的精度持續跟蹤飛行器的運動。與量子重力儀和磁力計集成后,這些系統提供的實時位置更新比目前任何基于衛星的系統都更加精確。這對于在全球定位系統禁區內作業的潛艇、飛機和無人機尤為有用。
QPS 技術可將定位精度保持在 1 厘米以內,而 GPS 的精度僅為 1-5 米。這種精度水平對于導彈部署或偵察等隱形行動至關重要,因為在這些行動中,即使是很小的偏差也會影響任務的成功。
圖 1:用于定位導航和定時的量子技術概覽
量子導航系統在各個軍事領域都有廣泛的應用。從提高空中和海上行動的精確度到提高地面部隊的應變能力,量子導航系統有望徹底改變現代戰爭。
圖 2: 英國皇家海軍 XV 帕特里克-布萊克特號艦載量子導航系統
波音公司成功地在飛機上測試了量子導航系統,這是一項關鍵的進步,可以實現無 GPS 的精確導航,尤其是在 GPS 被屏蔽的環境中。這對于戰斗機、無人機和運輸機等軍用飛機來說至關重要,因為在這些飛機上,GPS 經常受到干擾。量子導航在無人機戰爭中也大有可為,可確保在 GPS 受干擾的情況下仍能有效作戰。
圖 3:測試量子導航系統的波音機組人員
量子技術將量子物理學原理轉化為技術應用。總體而言,量子技術尚未達到成熟階段,但它對未來的軍事傳感、加密和通信以及國會監督、授權和撥款都會產生重大影響。
量子應用依賴于一些關鍵概念,包括疊加、量子比特(量子比特)和糾纏。疊加是指量子系統同時存在于兩種或兩種以上狀態的能力。量子比特是一種利用疊加原理編碼信息的計算單元。(經典計算機用比特編碼信息,比特可以代表 0 或 1 的二進制狀態,而量子計算機用量子比特編碼信息,每個量子比特可以同時代表 0、1 或 0 和 1 的組合。因此,每增加一個量子比特,量子計算機的功率就會呈指數級增長)。
美國國家科學院(NAS)將糾纏定義為一種特性,即 “一個系統中的兩個或多個量子對象可以內在地聯系在一起,這樣,對其中一個對象的測量決定了對另一個對象的可能測量結果,無論這兩個對象相距多遠”。糾纏是量子技術許多潛在軍事應用的基礎。然而,由于量子態的脆弱性,疊加和糾纏都難以維持,微小的移動、溫度變化或其他環境因素都可能破壞量子態。
美國國防部(DOD)的一個獨立科學顧問委員會--國防科學委員會(DSB)認為,量子技術的三種應用對國防部來說最有前景:量子傳感、量子計算機和量子通信。DSB 認為,量子雷達假設能夠識別物體(包括低可觀測性或隱形飛機)的性能特征(如雷達截面、速度),但 “不會為國防部提供升級能力”。
量子傳感在傳感器中使用量子物理學原理。據 DSB 稱,這是量子技術最成熟的軍事應用,目前 “已準備好用于任務”。量子傳感可以增強軍事能力。例如,它可以提供替代的定位、導航和定時選項,理論上可以讓軍隊在全球定位系統降級或全球定位系統失效的環境中繼續全力作戰。
此外,量子傳感器還可用于情報、監視和偵察(ISR)。成功開發和部署此類傳感器可顯著提高潛艇探測能力,進而降低海基核威懾力量的生存能力。量子傳感器還能使軍事人員探測地下結構或核材料,因為它們預計 “對環境干擾極為敏感”。量子傳感器的靈敏度同樣有可能使軍隊探測到電磁輻射,從而增強電子戰能力,并有可能協助定位隱蔽的敵方部隊。
美國國家科學院稱,“量子計算機是唯一已知的計算模式,可以比現在的計算機提供指數級的速度”。雖然量子計算機還處于相對早期的發展階段,但其進步--其中許多是由商業部門推動的--可能會對人工智能(AI)、加密和其他學科的未來產生影響。
例如,一些分析家認為,量子計算機可以促進機器學習(人工智能的一個子領域)的發展。這種進步可以促進模式識別和基于機器的目標識別的改進。這反過來又能促進開發更精確的致命自主武器系統,或無需人工控制或遠程操作就能選擇和攻擊目標的武器。人工智能支持的量子計算機有可能與量子傳感器配對使用,進一步增強軍事 ISR 應用。
此外,量子計算機有可能解密存儲在加密媒體上的機密信息或受控非機密信息,從而使對手獲得有關美國軍事或情報行動的敏感信息。一些分析家指出,要破解當前的加密方法,可能需要在量子計算方面取得重大進展。他們估計,要破解目前的加密方法,需要一臺擁有約 2000 萬量子比特的量子計算機;然而,目前最先進的量子計算機一般不超過 1088 個量子比特。
量子計算機的實際應用可能只有在錯誤率得到改善、新的量子算法、軟件工具和硬件得到開發之后才能實現。雖然正如 NAS 所指出的,“無法保證(這些技術挑戰)一定會被克服”,但一些分析家認為,能夠破解當前加密方法的初始量子計算機原型可在 2030 年至 2040 年的時間框架內開發出來。因此,美國國家科學院得出結論:"后量子加密技術的開發、標準化和部署對于最大限度地減少潛在的安全和隱私災難至關重要。(在部署后量子加密技術之前截獲的信息將不會受到保護)。
2022 年 5 月,拜登政府發布了《關于促進美國在量子計算領域的領導地位同時降低脆弱加密系統風險的國家安全備忘錄》(NSM-10),“在美國開始將脆弱的計算機系統遷移到抗量子加密技術的多年進程時,指導各單元采取具體行動”。NSM-10 指出,美國國家標準與技術研究院(NIST)院長和美國國家安全局(NSA)局長將制定抗量子加密技術標準。NIST 于 2024 年 8 月發布了這些標準的第一批。美國國家安全局表示,“預計到 2035 年,[國家安全系統]將根據 NSM-10 完成向[抗量子]算法的過渡”。
量子通信--不包括下文討論的量子密鑰分發([QKD])--正處于初級發展階段。量子通信理論上可以實現量子軍事傳感器、計算機和其他系統的安全聯網,從而提高單個量子系統或經典通信網絡的性能。此外,聯網還能增強此類系統在射程內的穩健性,從而擴大其部署的潛在環境(即在維持脆弱量子態通常所需的實驗室環境之外)。這將大大擴展量子通信的軍事用途。
量子密鑰分發是量子通信的一個子集,它利用量子物理學原理對信息進行加密,然后通過經典網絡發送。量子密鑰分配實現了在傳輸過程中無法被秘密截獲的安全通信。(不過,QKD 通信可以在目前長距離傳輸所需的中繼站被截獲)。據報道,中國正在大力投資 QKD,并于 2016 年完成了約 1250 英里的北京-上海量子網絡建設。美國DSB 還是得出結論:"QKD 的實施還不具備足夠的能力或安全性,無法部署到國防部任務中使用。
美國國會通過了許多與量子技術相關的條款。例如,《2019 財年國防授權法案》(NDAA)(P.L. 115-232)第 234 條(后經《2024 財年國防授權法案》(NDAA)(P.L. 118-31)第 219 條修訂)指示國防部長通過負責研究和工程的國防部副部長采取行動,與私營部門和其他政府機構協調執行一項量子技術研發計劃。
此外,《2020 財年國防授權法案》(P.L. 116-92)第 220 節要求國防部制定使用量子技術的道德準則,以及支持量子勞動力和降低與量子技術相關的網絡安全風險的計劃。此外,該法案還授權各軍事部門的部長建立量子信息科學(QIS)研究中心,這些中心可以 “與適當的公共和私營部門組織合作”,推進量子研究。迄今為止,海軍已指定海軍研究實驗室為其量子信息科學研究中心,空軍則指定空軍研究實驗室為空軍和太空部隊的量子信息科學研究中心。陸軍表示目前不打算建立 QIS 研究中心。
2021 財年 NDAA(P.L. 116-283)第 214 節指示各軍種編制并每年更新一份量子計算機在未來一到三年內可能解決的技術挑戰清單。該清單目前包括量子化學、優化和機器學習。第 214 節還指示各部門與中小型企業建立合作項目,為政府、行業和研究這些挑戰的學術研究人員提供量子計算能力。第 1722 節指示國防部對量子計算機帶來的風險進行評估。
最后,《2022 財年國家發展援助法》(P.L. 117-81)第 105 節指示總統通過國家科學技術委員會成立量子信息科學的經濟和安全影響小組委員會,而第 229 節則指示國防部長 “制定一系列活動,以加快兩用量子能力的開發和部署”。2024 財年《國防授權法案》第 220 節指示國防部為量子研究制定一項公私人才交流計劃;第 231 節授權國防部實施一項量子計算試點計劃。
隨著人工智能(AI)領域的飛速發展,這些技術的變革潛力對國家和國際安全產生了深遠的影響。因此,全世界的政策制定者和監管者越來越認識到,迫切需要超越國界和個人利益的共同理解,尤其是在人工智能應用于安全和國防領域的情況下。
然而,國家和非國家行為者之間在人工智能、安全和防衛方面缺乏既定的全球合作框架,這構成了一項重大挑戰。這種共同治理的缺失導致技術進步不協調和各自為政,給國際和平與安全、穩定和繁榮帶來嚴重后果。然而,各國與非國家行為者合作的愿望日益強烈。各國認識到,這種參與至少可以為治理方法和解決方案提供信息,并確保其制定、采納和實施都有據可依。此外,它還可以確保行業、民間社會組織、研究、技術和科學界以及學術界的認識和支持。
聯合國秘書長在其《和平新議程》中強調,必須 “確保工業界、學術界、民間社會和其他部門的利益攸關方參與”,“通過多邊進程,圍繞人工智能軍事應用的設計、開發和使用制定規范、規則和原則”。因此,迫切需要建立、促進和支持一個獨立、中立和可信賴的平臺,該平臺將促成多方利益攸關方對話,并為軍事領域負責任地開發、獲取、部署、整合和使用人工智能技術孵化治理途徑和解決方案。
大型語言模型(LLM)被譽為人工智能領域的重大突破。LLMs 處理和生成文本的能力通常與人類認知水平相當,因此對于包括國防在內的所有領域都具有巨大的應用潛力。與此同時,這項新技術在穩健性和可靠性方面也存在許多未決問題,任何希望利用 LLMs 的組織都面臨著巨大的技術挑戰。本報告旨在展示如何訓練 LLM,使其適應國防領域,并評估此類項目是否值得投入。為此,本文創建了一個基于國防領域瑞典語和英語文本的數據集,并用來訓練(微調)兩個最先進的LLM。然后對模型進行定性和定量評估。結果表明, 訓練后的LLM在與國防有關的文本任務中表現出更高的性能。本文詳細描述了訓練過程,可以為有興趣開展類似項目的讀者提供指導。訓練中的障礙主要與資源限制有關,如硬件、數據和時間,這些限制難以克服,但至少人們對它們有了相對充分的了解。對 LLM 的評估卻并非如此:模型具有令人驚訝的能力,但也可能以令人驚訝的方式失敗。報告對 LLM 的不同方面進行測試來評估其能力和失敗原因,但只能觸及表面。總之,大型語言模型已經發展到一個階段,國防利益相關者可以,也應該開始調整和測試該技術。本報告提供了對陷阱、解決方案和經驗教訓的見解,對此有所幫助。與此同時,建議對大型語言模型采取冷靜的態度,因為對此類模型的評估仍應被視為一個未決問題。
關鍵詞:人工智能、大型語言模型、微調、參數高效微調、低階自適應(LoRA)
人工智能(AI)是計算機科學的一個分支,其研究對象是開發能夠解決通常需要人類認知的問題的機器。其中一個挑戰就是處理人類語言,即讓計算機能夠理解文本輸入并做出有說服力的回應。對人類來說,這個簡單得令人難以置信的問題可能顯得微不足道,而且人們最初認為其很容易通過算法解決。20 世紀 50 年代,隨著科學家們開始認識到這項任務的復雜性,早期的機器翻譯嘗試很快就碰壁了。傳統上,計算語言學(CL)試圖通過研究支配人類語言的規則,并以適合計算機的方式將其形式化來解決這一問題。另一方面,自然語言處理(NLP)則采取了更加務實的方法,通常是統計方法,其重點是開發能夠實際執行某些語言任務的系統,即使范圍有限。實際上,幾十年來,這兩個領域之間的區別已經變得相當模糊,但在很長一段時間里,共同的目標仍然難以實現。
然而,近年來,深度學習(DL)的興起加速了人工智能領域許多挑戰難題的突破性進展,包括語言。硬件的增強和數字數據集的不斷擴大,使得在數百萬文本上訓練擁有數十億參數的深度神經網絡成為可能。深度神經網絡可以學習詞語在上下文中出現的概率,從而建立大型自然語言統計模型。大型語言模型(LLM)就能夠處理文本輸入,并生成新的文本,而這些文本似乎可以與人類的理解和書寫相媲美。OpenAI 的 ChatGPT 等功能強大的 LLM 引起了媒體和公眾的廣泛關注,既有贊譽也有擔憂,認為這是人工智能的重大突破,但其后果尚不清楚。然而,在撰寫本文時,LLMs 的應用仍處于探索階段,迄今為止主要以聊天機器人或辦公軟件中的文本助手的形式出現。此外,軍事應用的潛力仍然難以估計。LLM 可以服務于國防和情報的所有領域,例如,作為用戶界面的一部分、信息融合器、文檔輔助工具,以及通過建議和解釋行動方案的系統進行決策。
LLM 可以產生令人印象深刻的結果,但也可能以令人驚訝的方式失敗。人們對 LLM 的能力、局限性和可靠性還不甚了解,而且隨著開發的進展,LLM 也會迅速發生變化。采用 LLM 的另一個障礙是訓練和運行 LLM 所需的成本。最強大的 LLM 是在大型超級計算機上創建的,這對許多國家行為者來說也是遙不可及的。其中一些 LLM 只能以在線服務的形式訪問,在外國領土上的商業服務器上運行,因此當安全問題至關重要時,使用這些 LLM 是值得懷疑的。還有一些可以在本地獲得和運行,也有可能對其進行進一步訓練,使其適應特定任務(微調),但最初的創建仍依賴于少數擁有充足資源的組織。這也意味著,初始訓練語料庫的文本選擇超出了大多數 LLM 用戶的控制范圍,影響了文本在主題和質量方面的平衡,限制了所支持的語言,而且如果 LLM 原始創建者沒有確保其對所有訓練文本的使用都在知識產權范圍內,則有可能產生法律后果。
目前,有關 LLM 的情況既樂觀又不確定。一方面,LLM 可能即將徹底改變無數人類認知被認為是必要條件的過程,無論是在民用領域還是軍事領域。另一方面,LLM的可靠性尚不明確,各組織有可能被突破性技術的熱情所沖昏頭腦,將 LLM強加到它們(尚)不適合的應用中。 本報告介紹了如何謹慎地將 LLM 用于與國防相關的目的。詳細介紹了幾種現代 LLM 的訓練過程。然后對 LLM 的魯棒性和輸出質量進行了評估。國防領域涵蓋了廣泛而多樣的主題,而 LLM 在某一主題上的性能取決于是否準備了大量具有高質量和相關性文本的訓練語料庫。因此,由于資源有限,本報告縮小了訓練領域的范圍,將重點放在旨在為安全政策分析人員提供支持的 LLM 示例上。
本報告的重點是旨在為安全政策國防領域內的分析人員提供支持性LLM。LLM需要對文本進行總結,回答與安全政策相關的問題,并根據給定的關鍵短語列表編寫文本。類似的任務在其他領域也同樣適用,因此,僅限于安全政策領域并不意味著按照類似思路訓練的 LLM 可用于其他領域。此外,訓練和實施的基本原則也適用于其他主題和更廣泛的范圍。
本報告的目的是探討在國防背景下部署和運行 LLM 所面臨的技術挑戰,以訓練 LLM 為安全政策分析員提供支持為例進行說明,并評估有效性。具體方法如下:
1.針對國防領域的應用訓練(微調)LLM,包括準備訓練數據、選擇基礎模型、設置訓練環境和訓練過程;
2.評估經過訓練的 LLM 的性能,包括根據不同指標得出的輸出文本的質量、模型對提示變化和其他因素的敏感性,以及微調成本是否被基礎模型的顯著改進所抵消。
本報告的重點是 LLM 技術的核心問題,即模型本身、模型的訓練和模型的能力。因此,本報告將不對特定應用的實現進行研究,例如如何在 RAG 系統(檢索增強生成)中利用 LLM,即從數據庫中檢索外部知識并將其插入提示中,從而使 LLM 能夠解決需要當前信息的查詢問題。雖然這種方法和其他方法是使用 LLM有前途的方法,但它們確實增加了自己的研究問題。此外,任何使用 LLM的方法都得益于對模型的良好訓練和理解,因此超出這些核心基本問題的研究將不在本報告的討論范圍之內。
另一個僅涉及的問題是提示工程。LLM 對提問的措辭很敏感,如果重新表述提問,有時會提供更有用的響應。甚至有人觀察到,通過添加鼓勵性詞語(例如“你是一個聰明的模型,請認真思考下面的問題......”)可以提高性能。這推動了直觀優化提示的大量嘗試。
然而,添加任何直觀提示都會減少適合 LLM 有限輸入窗口的實際提問詞的數量。此外,提示工程的好處并不一致,這些方法有時實際上會降低性能。轉述和修改的組合空間實際上是無限的,而且越來越多的證據表明,最佳提示可能根本不直觀,因此不可能由人類提示工程師來制定。鑒于提示工程目前的不確定狀態,在撰寫本文時還無法提出任何可靠的建議,因此該主題主要歸于未來的工作。
本報告面向國防部門中希望在軍事或情報應用中調整和部署大型語言模型的人員。這既包括評估大型語言模型是否適合預期應用的決策者,也包括訓練和實施基于大型語言模型的解決方案的技術團隊。
一般來說,本報告的寫作水平應該是任何對人工智能和大型語言模型感興趣的讀者都能讀懂的。報告偶爾會深入探討一些細節,但喜歡跳讀的讀者應該不難理解報告的整體內容。如果讀者希望進一步了解使用深度神經網絡進行自然語言處理的理論背景,建議閱讀《使用深度神經網絡進行自然語言處理》(Natural Language Processing Using Deep Neural Networks)報告中的第 3 章。
第 2 章介紹了本報告的理論背景。介紹了大型語言模型這一技術最重要的概念和原理。此外,讀者還將了解本報告將使用的具體訓練優化方法,包括其背景。最后,本節介紹了如何評估處理和生成自然語言的系統這一長期挑戰。評估必須被視為一個開放性的研究問題,相關問題在大型語言模型時代仍然具有現實意義,并影響著本報告中的評估嘗試。
第 3 章介紹了第一個目標:創建國防領域大型語言模型。該章分步描述了選擇合適的基礎大型語言模型、準備合適的訓練數據和訓練模型的過程。因此,本章也可為希望開展類似項目的讀者提供指導。 第 4 章是第二個目標:使用各種定量和定性方法和指標對訓練好的大型語言模型進行評估。前面提到的這一領域的挑戰意味著本節只是對解決這一問題的廣泛嘗試的一個介紹,詳盡的大規模評估將留待今后的工作中進行。
第 5 章討論了評估結果,以及在國防背景下使用大型語言模型的更廣泛影響,包括見解和經驗教訓。 最后,第 6 章總結了評估結果,并對今后可能開展的工作進行了簡要展望。
近年來,人工智能(AI)和機器學習領域的進步為增強人類能力和提高各種自主系統的功能創造了前所未有的機遇,包括在國際安全領域。然而,在國防領域,訓練日益復雜的人工智能系統所需的高質量、高度多樣化和相關的真實世界數據集卻十分稀缺。因此,合成數據正逐漸成為開發和訓練人工智能系統的數據工具箱中必不可少的工具。合成數據的特點和潛在優勢,以及該技術在各個領域的成熟應用,使其成為圍繞在國際安全背景下使用人工智能的辯論的一個相關話題。
本入門指南簡要概述了合成數據,包括其特點、生成方式、增加的價值、風險以及在國防組織和軍事行動中的潛在用例。此外,本手冊還概述了現有的數據挑戰和限制,這些挑戰和限制促使合成數據成為開發日益復雜的人工智能系統的重要工具。
迄今為止,合成數據在國際安全領域的應用大多停留在實驗和探索階段。不過,合成數據的特點可對訓練人工智能系統產生有益影響。特別是,合成數據可以生成高度多樣化甚至新穎的數據集,對數據屬性進行精細控制,必要時自動注釋或標記數據,而且成本效益高。這本入門書探討了合成數據的主要特點如何使軍隊和國防組織受益,讓他們能夠在防御性和進攻性自主系統中集成能力更強、更可靠的人工智能系統。
雖然合成數據有利于訓練人工智能系統,并有助于緩解軍隊和國防組織面臨的一些數據問題,但它并不是靈丹妙藥,也伴隨著風險和挑戰。使用合成數據所帶來的好處將取決于各組織是否有能力駕馭這些風險,以便以負責任和安全的方式并按照法律要求和道德價值觀使用根據合成數據訓練的人工智能系統。
圖1所示。真實世界與合成數據
對于航空航天與國防(A&D)行業來說,數字孿生技術并不是一個新概念,但它的重要性卻與日俱增。簡單地說,數字孿生就是物理系統的虛擬復制品,它可以幫助優化物理系統的性能。由于數字孿生系統純粹存在于虛擬空間中,因此可以對其進行應力測試、評估和設計修改,而不會對安全造成影響,并且成本最優,這樣就可以在接觸物理資產本身之前完成所有實驗和重大決策。鑒于 A&D 面臨的眾多挑戰,包括供應鏈中斷、降低總擁有成本(TCO)的必要性、熟練勞動力短缺、勞動力老齡化、安全和法規要求、持續減少碳足跡以實現可持續增長的需要,在承諾采用物理解決方案之前以虛擬方式解決這些問題的能力使數字孿生成為推動行業實現其目標的寶貴工具。
數字孿生利用真實世界的運營數據進行模擬,預測可能出現的結果,這意味著所有結論都可以謹慎地應用到實體資產中。數字孿生利用人工智能(AI)、物聯網(IoT)等其他技術,以及增強現實(AR)、虛擬現實(VR)和混合現實(MR)等沉浸式技術,在數字世界和物理世界之間架起了一座橋梁。它們建立了一個閉環方法來協同數據、技術和業務流程。其結果可能是驚人的。
如今,大型航空原始設備制造商(OEM)正迫不及待地將數字孿生應用于其制造流程的各個環節。"我們的數字孿生使我們能夠為關鍵利益相關者,包括無人機和飛機飛行員、操作員、監管者以及UTM(無人機交通管理)服務提供商本身,對各種情況進行建模、仿真和縮放,"空客UTM仿真主管馬克斯-埃格羅夫-諾瓦解釋說。在國防工業中,數字孿生使兵力能夠在逼真但無后果的'戰爭游戲'結構中演繹一系列作戰場景和敵方反應,讓部隊在高風險的戰斗中做好更充分的準備。
不過,數字孿生的范圍并不局限于地面事務。美國航空航天公司洛克希德-馬丁(Lockheed Martin)正與軟件企業英偉達(NVIDIA)合作開發人工智能(AI)驅動的地球觀測數字孿生系統,以幫助模擬全球環境狀況的潛在發展,如極端天氣事件。
機場運營商也在利用這項技術。溫哥華機場管理局推出了溫哥華國際機場(YVR)的數字孿生。該平臺使機場的旅客體驗團隊能夠預測并緩解 2022 年旅游旺季安檢站的旅客擁堵情況。YVR 還開始使用數字孿生來模擬飛機起降和機場活動,從而減少溫室氣體(GHG)排放。
2022 年,我們啟動了一項研究,以評估數字孿生在各行各業(包括航空與發展)中的優勢,并說明該技術如何成為智能產業轉型的核心。我們的最新報告深入研究了 A&D 行業,探討了正在改變行業動態的數字孿生應用案例。在參與第二次調查的 150 家 A&D 組織中,80% 正在實施數字孿生計劃。
A&D 行業已經習慣了由供應鏈合作伙伴組成的復雜生態系統所固有的壓力,并面臨著苛刻的監管和認證挑戰。然而,大流行病造成了額外的嚴重破壞,對商業航空業的打擊最大。18 個月前,我們的數字孿生研究強調了該技術推動績效和可持續發展的能力。隨著航空和研發行業從大流行病的影響中恢復過來,我們希望了解其與數字孿生的四點關系:
我們的研究表明,人們對數字孿生在研發領域的潛力仍然充滿信心。制定了數字孿生長期路線圖的企業比例從十八個月前的 57% 上升到現在的 73%。這種對數字孿生部署的興趣是由上下兩方面驅動的。78%的企業認為,技術進步是數字孿生投資的首要驅動力,其次是運營效率,占 75%。除此以外,數字孿生還在兩個方面為可持續發展做出了貢獻:減少航空業的碳足跡,以及對綠色航空替代品(如電動電池和氫燃料)的設計進行虛擬驗證。數字孿生將物理世界和虛擬世界連接起來,提高了設計和運營效率。A&D 原始設備制造商、供應商、太空公司和航空公司都在有目的地投資數字孿生技術。總體而言,該行業計劃將其收入的 2.7% 投資于數字孿生計劃,比上一年猛增 40%。
通過將各種數字孿生技術相結合,航空與發展行業 可以改善其價值鏈的方方面面--從設計 從設計到生產再到運營;該技術還支持 生態系統內的協作,這是在新的商業環境中蓬勃發展的關鍵因素。在新的商業環境中蓬勃發展的關鍵因素。
研究還探討了工業元宇宙,它為數字孿生增添了一個新的層面。這為數字孿生增添了一個新的層面,意味著企業可以在更加逼真的環境中進行互動--"數字孿生 "的 "元宇宙"。孿生互聯網"。我們的 我們的研究發現,每三個組織中就有一個正在研究 或計劃在年內這樣做。身臨其境的培訓和真實測試是他們特別感興趣的領域。特別感興趣的領域。
雖然數字孿生應用廣泛,但企業要充分發揮其潛力,還需要一些先決條件。包括數字連續性、云、連接性和技術能力在內的支持性基礎設施是必要的基礎,可實現數字孿生與各種系統的無縫集成。然后,能夠從各種來源類型向孿生提供數據的數字線程,以及推動敏捷文化的項目管理也至關重要。飛機原始設備制造商還可以推動互操作性,并與供應商、同行、顧問和系統集成商合作,以發揮協同效應。一級供應商需要重點建設數據集成、模擬和項目管理等一系列能力,以便與飛機原始設備制造商和二級供應商無縫合作。國防組織需要加強網絡安全,同時發展人工智能和 ML 能力。通過專注于這些方面,所有行業參與者都能進入我們稱之為 "智能工業 "的轉型新時代。
人工智能在軍事領域的前景之一是其廣泛的適用性,這似乎可以保證其被采用。在軍事方面,人工智能的潛力存在于所有作戰領域(即陸地、海洋、空中、太空和網絡空間)和所有戰爭級別(即政治、戰略、戰役和戰術)。然而,盡管有潛力,需求和人工智能技術進步之間的銜接仍然不是最佳狀態,特別是在軍事應用的監督機器學習方面。訓練監督機器學習模型需要大量的最新數據,而這些數據往往是一個組織無法提供或難以產生的。應對這一挑戰的絕佳方式是通過協作設計數據管道的聯邦學習。這種機制的基礎是為所有用戶實施一個單一的通用模型,使用分布式數據進行訓練。此外,這種聯邦模式確保了每個實體所管理的敏感信息的隱私和保護。然而,這個過程對通用聯邦模型的有效性和通用性提出了嚴重的反對意見。通常情況下,每個機器學習算法在管理現有數據和揭示復雜關系的特點方面表現出敏感性,所以預測有一些嚴重的偏差。本文提出了一種整體的聯邦學習方法來解決上述問題。它是一個聯邦自動集成學習(FAMEL)框架。FAMEL,對于聯邦的每個用戶來說,自動創建最合適的算法,其最優的超參數適用于其擁有的現有數據。每個聯邦用戶的最優模型被用來創建一個集成學習模型。因此,每個用戶都有一個最新的、高度準確的模型,而不會在聯邦中暴露個人數據。實驗證明,這種集成模型具有更好的可預測性和穩定性。它的整體行為平滑了噪音,同時減少了因抽樣不足而導致的錯誤選擇風險。
關鍵詞:聯邦學習;元學習;集成學習;軍事行動;網絡防御
隨著步伐的加快,人工智能(AI)正在成為現代戰爭的重要組成部分,因為它為大規模基礎設施的完全自動化和眾多防御或網絡防御系統的優化提供了新的機會[1]。人工智能在軍事領域[2]的前景之一,似乎保證了它的采用,即它的廣泛適用性。在軍事方面,人工智能的潛力存在于所有作戰領域(即陸地、海洋、空中、太空和網絡空間)和所有級別的戰爭(即政治、戰略、戰役和戰術)[3]。但與此同時,隨著參與連續互聯和不間斷信息交換服務的互聯系統數量的實時擴大,其復雜性仍在成倍增長[4]。從概括的角度來看,可以說人工智能將對以下任務產生重大影響:
1.太快的任務,反應時間為幾秒鐘或更少,在高復雜度(數據、背景、任務類型)下執行。
2.操作時間超過人類耐力的任務,或意味著長期的高操作(人員)成本。
3.涉及巨大的復雜性的任務,需要靈活地適應環境和目標的變化。
4.具有挑戰性的行動環境,意味著對作戰人員的嚴重風險。
支持上述任務的實時監測事件的應用程序正在接收一個持續的、無限的、相互聯系的觀察流。這些數據表現出高度的可變性,因為它們的特征隨著時間的推移而發生巨大的、意想不到的變化,改變了它們典型的、預期的行為。在典型情況下,最新的數據是最重要的,因為老化是基于它們的時間。
利用數據的軍事人工智能系統可以將軍事指揮官和操作員的知識和經驗轉化為最佳的有效和及時的決策[3,4]。然而,缺乏與使用復雜的機器學習架構相關的詳細知識和專業知識會影響智能模型的性能,阻止對一些關鍵的超參數進行定期調整,并最終降低算法的可靠性和這些系統應有的概括性。這些缺點正在阻礙國防的利益相關者,在指揮鏈的各個層級,信任并有效和系統地使用機器學習系統。在這種情況下,鑒于傳統決策系統無法適應不斷變化的環境,采用智能解決方案勢在必行。
此外,加強國防領域對機器學習系統不信任的一個普遍困難是,采用單一數據倉庫對智能模型進行整體訓練的前景[1],由于需要建立一個潛在的單點故障和對手的潛在戰略/主要目標[6],這可能造成嚴重的技術挑戰和隱私[5]、邏輯和物理安全等嚴重問題。相應地,可以使更完整的智能分類器泛化的數據交換也給敏感數據的安全和隱私帶來了風險,而軍事指揮官和操作人員并不希望冒這個風險[7]。
為了克服上述雙重挑戰,這項工作提出了FAMEL。它是一個整體系統,可以自動選擇和使用最合適的算法超參數,以最佳方式解決所考慮的問題,將其作為一個尋找算法解決方案的模型,其中通過輸入和輸出數據之間的映射來解決。擬議的框架使用元學習來識別過去積累的類似知識,以加快這一過程[8]。這些知識使用啟發式技術進行組合,實現一個單一的、不斷更新的智能框架。數據保持在操作者的本地環境中,只有模型的參數通過安全流程進行交換,從而使潛在的對手更難干預系統[9,10]。
在提議的FAMEL框架中,每個用戶在水平聯邦學習方法中使用一個自動元學習系統(水平聯邦學習在所有設備上使用具有相同特征空間的數據集。垂直聯邦學習使用不同特征空間的不同數據集來共同訓練一個全局模型)。以完全自動化的方式選擇具有最佳超參數的最合適的算法,該算法可以最佳地解決給定的問題。該實施基于實體的可用數據,不需要在遠程存儲庫中處置或與第三方共享[11]。
整個過程在圖1中描述。
圖1.FAMEL框架。
具體來說就是:
步驟1--微調最佳局部模型。微調過程將有助于提高每個機器學習模型的準確性,通過整合現有數據集的數據并將其作為初始化點,使訓練過程具有時間和資源效率。
步驟2--將本地模型上傳至聯邦服務器。
步驟3--由聯邦服務器對模型進行組合。這種集成方法使用多種學習算法,以獲得比單獨使用任何一種組成的學習算法都要好的預測性能。
步驟4--將集成模型分配給本地設備。
從這個過程中產生的最佳模型(贏家算法)被輸送到一個聯邦服務器,在那里通過啟發式機制創建一個集成學習模型。這個集成模型基本上包含了本地最佳模型所代表的知識,如前所述,這些知識來自用戶持有的本地數據[12]。因此,總的來說,集成模型提供了高概括性、更好的預測性和穩定性。它的一般行為平滑了噪音,同時降低了在處理本地數據的場景中由于建模或偏見而做出錯誤選擇的總體危險[13,14]。
將機器學習應用于現實世界的問題仍然特別具有挑戰性[44]。這是因為需要訓練有素的工程師和擁有豐富經驗和信息的軍事專家來協調各自算法的眾多參數,將它們與具體問題關聯起來,并使用目前可用的數據集。這是一項漫長的、費力的、昂貴的工作。然而,算法的超參數特征和理想參數的設計選擇可以被看作是優化問題,因為機器學習可以被認為是一個搜索問題,它試圖接近輸入和輸出數據之間的一個未知的潛在映射函數。
利用上述觀點,在目前的工作中,提出了FAMEL,擴展了制定自動機器學習的一般框架的想法,該框架具有有效的通用優化,在聯邦層面上運作。它使用自動機器學習在每個聯邦用戶持有的數據中找到最佳的本地模型,然后,進行廣泛的元學習,創建一個集成模型,正如實驗所顯示的那樣,它可以泛化,提供高度可靠的結果。這樣,聯邦機構就有了一個專門的、高度概括的模型,其訓練不需要接觸他們所擁有的數據的聯合體。在這方面,FAMEL可以應用于一些軍事應用,在這些應用中,持續學習和環境適應對支持的行動至關重要,而且由于安全原因,信息交流可能很難或不可能。例如,在實時優化有關任務和情況的信息共享方面就是這種情況。在部署了物聯網傳感器網格的擁擠環境中,FAMEL的應用將具有特別的意義,需要滿足許多安全限制。同樣,它也可以應用于網絡空間行動,在雜亂的信息環境和復雜的物理場景中實時發現和識別潛在的敵對活動,包括對抗負面的數字影響[45,46]。必須指出的是,在不減少目前所描述的要點的情況下,所提出的技術可以擴展到更廣泛的科學領域。它是一種通用的技術,可以發展和產生一種開放性的整體聯邦學習方法。
盡管總的來說,聯邦學習技術的方法論、集成模型以及最近的元學習方法已經強烈地占據了研究界,并提出了相關的工作,提升了相關的研究領域,但這是第一次在國際文獻中提出這樣一個綜合框架。本文提供的方法是一種先進的學習形式。計算過程并不局限于解決一個問題,而是通過一種富有成效的方法來搜索解決方案的空間,并以元啟發式的方式選擇最優的解決方案[47,48]。
另一方面,聯邦學習模型應該對合作訓練數據集應用平均聚合方法。這引起了人們對這種普遍方法的有效性的嚴重關注,因此也引起了人們對一般聯邦架構的有效性的關注。一般來說,它將單個用戶的獨特需求扁平化,而不考慮要管理的本地事件。如何創建解決上述局限性的個性化智能模型,是目前一個突出的研究問題。例如,研究[49]是基于每個用戶必須以聯邦的形式解決的需求和事件。解釋是可解釋系統的各種特征,在指定的插圖的情況下,這些特征有助于得出結論,并在局部和全局層面提供模型的功能。建議只對那些變化程度被認為對其功能的演變相當重要的特征進行再訓練。
可以擴大擬議框架研究領域的基本課題涉及元集成學習過程,特別是如何解決創建樹和它們的深度的問題,從而使這個過程自動完全簡化。還應確定一個自動程序,以最佳的分離方式修剪每棵樹,以避免負收益。最后,探索將優化修剪的樹的版本添加到模型中的程序,以最大限度地提高框架效率、準確性和速度。
(完整內容請閱讀原文)
人工智能的空間是巨大的,復雜的,并不斷發展的。隨著計算能力的進步和越來越大的數據集,人工智能算法正在被探索和開發,以用于各種各樣的應用空間,人工智能算法有各種各樣的潛在用戶和相關風險。人工智能界正在追求可解釋性,作為可信人工智能系統的許多理想特征之一。通過與人工智能界的合作,美國國家標準與技術研究院(NIST)已經確定了其他的技術特征來培養人工智能的信任。除了可解釋性(explainability)和可詮釋性(interpretability)之外,為支持系統的可信賴性(trustworthiness)而提出的其他人工智能系統特征包括準確性、隱私性、可靠性、穩健性、安全性、保障性(彈性)、減少有害偏見、透明度、公平性和問責制。可解釋性和其他人工智能系統特征在人工智能生命周期的各個階段相互作用。雖然所有這些都是極其重要的,但這項工作只關注可解釋的人工智能系統的原則。
在本文中,我們介紹了四項原則,我們認為這些原則構成了可解釋人工智能系統的基本屬性。這些可解釋人工智能的原則是通過NIST的公共研討會和公眾評論期與更大的人工智能社區接觸后得出的。我們認識到,并非所有的人工智能系統都需要解釋。然而,對于那些打算或要求可解釋的人工智能系統,我們建議這些系統遵守以下四個原則:
解釋性:一個系統為產出和/或過程提供或包含附帶的證據或理由。
有意義:一個系統所提供的解釋對目標消費者來說是可以理解的。
解釋準確性:解釋正確地反映產生輸出的原因或準確地反映系統的過程。
知識局限性:系統僅在其設計條件下以及對其輸出達到足夠置信度時才能運行。
在這項工作中,我們認識到基于過程和基于結果的解釋的重要性,以及解釋目的和風格的重要性。例如,人工智能開發者和設計者的解釋需求可能與政策制定者和終端用戶的解釋需求截然不同。因此,為什么要求解釋以及如何提供解釋可能會因人工智能用戶的不同而不同。考慮到人工智能系統與信息的人類接收者的互動,這四項原則受到很大影響。給定情況的要求、手頭的任務和消費者都會影響被認為適合該情況的解釋的類型。這些情況可以包括,但不限于,監管機構和法律要求,人工智能系統的質量控制,以及客戶關系。我們的可解釋人工智能系統的四項原則旨在捕捉一系列廣泛的動機、理由和觀點。這些原則允許定義解釋所要考慮的背景因素,并為衡量解釋質量鋪平道路。
我們設想,鑒于人工智能領域的復雜性,這些原則將隨著時間的推移從更多的細化和社區投入中受益。我們充分認識到,除了可解釋性之外,還有許多其他社會技術因素影響著人工智能的可信度。這項關于可解釋人工智能系統原則的工作是NIST人工智能組合的一部分,該組合圍繞可信賴的人工智能數據、標準、評估、驗證和核實--所有這些都是人工智能測量所必需的。NIST是一個計量機構,因此,定義可解釋人工智能系統的初始原則是未來測量和評估活動的路線圖。該機構的人工智能目標和活動是根據其法定任務、白宮的指示以及美國工業界、其他聯邦機構和全球人工智能研究界的需求來確定優先次序的。目前的工作只是這個更大空間中的一步,我們認為這項工作將隨著時間的推移繼續發展和進步,就像更大的人工智能領域。