亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

自主系統的復雜性與部署范圍正日益提升,從先進工業機器人到智能城市基礎設施,這迫切需要軟件工程范式的根本性轉變。這些系統不僅要求高度適應性,還需具備嚴格的安全性與透明決策能力。本文提出一種統一的軟件智能框架,通過無縫集成神經程序合成(NPS)、量子安全運維(QSD)與可解釋人工智能(XAI)來滿足這些多維需求。該框架借助NPS實現AI驅動的代碼生成,通過QSD強化軟件生命周期以應對新興量子威脅,并利用XAI確保關鍵自主操作中可解釋且可信的決策過程。我們對各領域最新進展進行全面文獻綜述,詳細分析其各自挑戰與協同潛力。所提出的架構將這些組件統一為從規范到代碼生成、安全部署及運行時適應的連續管道。通過一個假設的智慧城市基礎設施場景,闡明了該融合框架的實際應用與優勢,展示其快速代碼適配能力、后量子安全性以及對自主行為提供人類可理解解釋的特性。我們進一步討論此類集成固有的技術挑戰,包括穩健的評估策略,以及在敏感環境中部署AI生成、量子安全系統所涉及的深遠倫理、運營與安全影響。本研究為發展適應性、穩健性及可信賴自主系統所必需的新興多學科領域奠定基礎。

自主系統在各大關鍵領域(從制造業先進機器人到智能城市基礎設施)日益增長的復雜性與廣泛部署,迫切需要軟件工程范式的深刻演進。這些系統必須在動態且不可預測的環境中以前所未有的適應性、安全性與可信度水平運行。傳統軟件開發方法難以跟上運營需求的快速演變及新興威脅的步伐,尤其在人類干預有限或響應時間至關重要的場景中。當前自主系統發展的挑戰源于三個核心領域:對實時軟件適配的需求、量子計算對經典密碼學構成的存在性威脅,以及AI驅動決策中透明性與人類信任的必要性。程序員常常難以為所有可預見場景快速編寫和更新代碼,而神經程序合成(NPS)旨在通過AI自動生成或修復代碼來解決該問題。同時,量子計算機的出現可能破解廣泛使用的公鑰密碼系統,從而危及從開發到部署的軟件生命周期各階段。這需要集成量子安全運維(QSD)以構建彈性安全管道。最后,隨著AI組件日益控制自主系統中的關鍵決策,許多模型固有的“黑箱”特性削弱了人類信任。可解釋人工智能(XAI)通過生成人類操作者可理解且可審計的推理模型,旨在彌合這一差距,確保信任與問責。本文認為NPS、QSD與XAI并非孤立學科,而是相互依存的支柱,當緊密集成時,可構成下一代自主系統的協同框架。例如,NPS生成的AI代碼應能通過XAI技術進行驗證與調試,再通過QSD管道安全部署。同樣,量子安全管道可保證XAI生成的模型及其解釋不被強大對手篡改。這些領域的融合有望提升自主平臺的敏捷性、安全性與可信度。

本文的貢獻是多方面的:

? 對神經程序合成、量子安全運維與可解釋人工智能的最新學術與行業研究進行廣泛回顧,聚焦其各自進展、挑戰及融合潛力。

? 提出一種新穎的軟件智能框架架構,將這三個關鍵組件統一為用于自主系統開發與運營的連續智能管道。

? 詳細闡述該融合框架內的模塊、工作流與交互,通過一個涉及自主資源管理的假設智慧城市場景說明其實際應用。

? 分析實施此類集成框架固有的技術挑戰,包括正確性、可擴展性、安全開銷、可解釋性與復雜性權衡、人機交互及集成復雜性等問題。

? 概述必要的嚴格評估策略與性能指標,以評估所提出框架的有效性、可信度及倫理合規性。

? 討論在敏感環境中部署AI生成、量子安全系統所涉及的更廣泛倫理、運營與安全影響。本工作為開發適應性、穩健性及可信賴自主系統所必需的新興多學科領域奠定基礎。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

自動化與人工智能領域的能力持續拓展,正推動人機交互模式創新——軍事領域尤需如此。為充分釋放技術紅利,亟需研究哪些任務可由自動化系統輔助乃至完全替代。在遠程偵察場景中,我們構想操作員通過自動化輔助同時完成平臺運動控制與目標觀測分類的雙重職能。為此構建實驗環境:遠程操作員借助含自動語音識別(ASR)系統與視線追蹤器的多模態界面操控無人地面車輛,同時通過屏幕光標選定標記目標并利用ASR進行語音分類。基于此原型系統,我們與領域專家展開交互模式研討。

自動化與人工智能正日益深度賦能人類作業。例如汽車產業中車道保持輔助系統已成為主流技術,為特定場景下的半自動駕駛奠定基礎;AI聊天機器人則快速進化至可實現人機自然對話。將這些能力遷移至軍事領域,將深刻變革現有作戰職能配置。傳統遠程偵察場景通常需至少配備平臺操作員與分析員:以RQ-4全球鷹無人機為例,其任務需多人協同完成平臺運動控制、光電系統操作及圖像判讀分類;而德軍"烏鴉"小型履帶式地面偵察平臺雖可由單人操控,卻缺乏目標標記與屏幕交互功能。人工智能的引入有望將平臺操控與目標分類職能融合為單一角色,即便不合并職能也能顯著降低操作員認知負荷,延長高效作業時間并減少失誤率。

因此本研究旨在開發新型交互方法:既支持操作員同步執行多任務,又大幅減輕其工作負荷以提升效能。通過整合視線、語音及觸覺等多模態輸入,探索在輸入控制指令時同步處理視覺數據的方案,力求建立高效精準的自然交互范式。但需在兩大關鍵要素間尋求平衡:既要保障充分信息供給以維持態勢感知,又要避免信息過載與交互選項冗余引發的認知超載[1]。

軍事應用場景對操作員提出嚴苛要求:結果需具備極高精度與魯棒性,作業環境常伴隨高噪聲、高壓強等高負荷狀態。這為技術賦能創造機遇——通過智能化支持減輕人員負擔。軍事用例的明確邊界利于定制化技術服務開發,但需注意:操作員的惡劣作業環境往往同樣制約技術性能。例如噪聲干擾、麥克風狀態波動及應激性語音變異等,均使作為智能用戶界面(UI)組件的自動語音識別(ASR)面臨嚴峻挑戰。為確保ASR魯棒性,模型需針對具體用例、使用環境乃至特定使用者進行定制化訓練,這意味著需構建按需生成定制化解決方案的體系而非通用模型[2]。

本研究致力于開發多模態"無感化"[3-5]智能用戶界面,通過有效支持操作員提升任務執行效能。現提出針對機器人平臺遠程操控與目標分類場景的具體實施方案。全文結構如下:第二、三章詳述語音-視線-觸覺交互模式的整合路徑及首版原型系統實現;第四章簡述基于領域專家的初步原型評估;第五章闡明軍事應用啟示,并提出后續研究與實踐轉化建議。

付費5元查看完整內容

態勢感知(SA)是通過感知、理解與預測環境要素的連續過程,構成復雜系統的重要組件。環境信息接收具有持續性與多模態特性,人工智能技術通過將SA目標拆解為數據融合、表征、分類及預測等任務,提供更高效穩健的支撐。本文系統綜述應用于各類環境與場景中構建、增強及評估SA的AI與多模態方法,重點聚焦感知完整性與持續性提升。研究表明人工智能與多模態方法的融合顯著增強了復雜系統的感知與理解能力,但在未來態勢預測與多模態信息有效融合方面仍存研究缺口。本文總結AI與多模態技術實現SA的應用案例與實踐經驗,并提出未來展望與挑戰,包括更全面的預測能力、更強的可解釋性及更先進的視覺信息處理技術。

圖1所示。基于人工智能和多模態技術的態勢感知系統概述。

付費5元查看完整內容

當今社會的技術發展要求對計算機及通信網絡實施有效防護,并實現網絡攻擊的快速精準檢測。本文探討如何應用機器學習(ML)算法強化網絡安全防護措施,重點聚焦勒索軟件檢測領域。據此,提出系列ML專屬方法——包括分類算法(隨機森林、支持向量機)、異常檢測(K均值聚類、自編碼器)與神經網絡(卷積神經網絡、循環神經網絡),并解析如何優化運用這些技術甄別各類應用的異常活動。同時,本文亦探究支撐ML模型的基礎設施所面臨的安全風險。

當前影響人類的威脅可分為五大領域:陸域、水域、空域、天域及網絡空間。但極端主義、輿論極化乃至虛假信息亦可能引發嚴峻社會問題。各領域均構成現代國家及組織實施防御與戰略安全布局的獨立維度。前四類威脅與網絡威脅的核心差異在于:前者受自然法則約束,而后者根植于人為因素。然而這些領域深度互嵌且頻繁交疊,例如網絡攻擊可干擾海空通信并影響導航系統,而衛星在涉及無人機導引或空中監視的地面行動中亦發揮關鍵作用。

在此具有虛擬屬性的新現實中,新型網絡威脅持續涌現,亟需縝密管控與追蹤。技術迭代速度加劇了基礎設施所有者(IT部門)與負責網絡安全防護、控制流程的安全團隊之間的割裂。根據曼迪昂特(Mandiant)最新安全效能報告:

? 53%的網絡攻擊未被上報
? 68%的勒索攻擊未被上報
? 91%的攻擊未觸發任何警報
? 1.23億高科技安全解決方案覆蓋9億用戶及11個行業

日益增多的實體正遭受多維度網絡攻擊,而網絡安全的核心使命正是保護信息資產并防范未授權訪問。

在此背景下,人工智能(AI)與量子計算技術通過增強實時數據分析處理能力,成為虛擬環境安全轉型的支柱。AI發展引發用戶群體分化:依賴AI實現流程自動化者,與通過保障數據質量及精確性優化模型者。這種動態要求采取雙軌策略——既要提升AI應用效能,亦須強化倫理矯正與監控機制。下文各章節將分別探討:

  1. 人工智能理論基礎,闡釋核心算法及其應用場景
  2. AI在勒索軟件檢測中的實踐,著重解析威脅識別的特征甄別與方法論
  3. 基于AI的網絡安全解決方案集成流程圖解
  4. 機器學習算法基礎設施的安全問題,含訓練數據篡改風險

付費5元查看完整內容

隨著基于大語言模型的商用產品取得顯著進展,人工智能(AI)議題在公共討論中持續升溫。隨著AI能力的發展,人們對其經濟與安全影響的擔憂日益加劇。本報告通過實證預測算法進步的方向、速度與指標,為政策制定提供參考。作者闡釋了AI算法改進的可能路徑,并探討各路徑進展的潛在影響。通過研究數值分析、運籌學與計算機科學領域的算法,界定了新算法引入的實證機制及改進定義方式。

作者指出推動AI系統近期發展的兩大關鍵驅動力:允許廣泛改進的新型合成數據生成方法,以及具備更高數據效率的替代架構。若無此類改進,小型模型可能主導市場。若僅實現單一路徑突破,小型模型或成主流,但大型模型仍有存在價值。若雙路徑均獲進展,大型模型可能提供更具實用價值的能力。

主要發現

算法改進存在兩條潛在高影響力路徑:

  1. 通過生成合成數據或修剪現有數據,構建更適配AI訓練的數據集以改進算法。
  2. 開發數據效率更高的算法(相比Transformer模型計算成本更低或單次迭代效率更優)。

這些路徑可能催生三種AI發展情景:

  • 若數據限制成為瓶頸:當額外數據不可獲取導致模型無法有效擴展時,小型專用AI系統可能主導市場。
  • 若算法擴展失敗:當通過合成生成獲取額外數據但新算法無法有效提取性能增益時,大型模型研發或持續,但小型系統仍占主流。
  • 若算法持續進步:當數據充裕且算法能高效利用時,更大規模模型將在近期AI研究中占據重要地位。

付費5元查看完整內容

配備先進傳感器的無人平臺的集成有望提高對態勢的感知能力,緩解軍事行動中的 “戰爭迷霧”。然而,管理這些平臺涌入的大量數據給指揮與控制(C2)系統帶來了巨大挑戰。本研究提出了一種新穎的多智能體學習框架來應對這一挑戰。該方法可實現智能體與人類之間自主、安全的通信,進而實時形成可解釋的 “共同作戰圖景”(COP)。每個智能體將其感知和行動編碼為緊湊向量,然后通過傳輸、接收和解碼形成包含戰場上所有智能體(友方和敵方)當前狀態的 COP。利用深度強化學習(DRL),聯合訓練 COP 模型和智能體的行動選擇策略。本文展示了在全球定位系統失效和通信中斷等惡劣條件下的復原能力。在 Starcraft-2 模擬環境中進行了實驗驗證,以評估 COP 的精度和策略的魯棒性。報告顯示,COP 誤差小于 5%,策略可抵御各種對抗條件。總之,本文貢獻包括自主 COP 形成方法、通過分布式預測提高復原力以及聯合訓練 COP 模型和多智能體 RL 策略。這項研究推動了自適應和彈性 C2 的發展,促進了對異構無人平臺的有效控制。

圖 1:(左)虎爪情景中的狀態示例。(右圖)每個智能體的感知(本地觀察)和它們之間的通信聯系。

配備先進傳感器的無人平臺的集成為減輕 “戰爭迷霧 ”和提高態勢感知能力帶來了希望。然而,管理和傳播來自此類平臺的大量數據對中央指揮與控制(C2)節點的信息處理能力構成了巨大挑戰,特別是考慮到隨著平臺數量的增加,數據量也會呈指數級增長。目前的人工處理方法不適合未來涉及無人平臺群的 C2 場景。在本研究中,我們提出了一個利用多智能體學習方法來克服這一障礙的框架。

我們考慮的框架是,智能體以自主方式相互通信(以及與人類通信),并以數據驅動的方式訓練這種通信功能。在每個時間步驟中,每個智能體都可以發送/接收一個實值信息向量。該向量是智能體感知或視場(FoV)的學習編碼。這些向量不易被對手解讀,因此可以實現安全的信息傳輸。

在接收方,必須對信息進行解碼,以恢復發送方的感知和行動。此外,還應將信息整合(隨時間匯總)到 “共同行動圖像”(COP)中。與編碼器一樣,解碼器也是以數據驅動的方式學習的。在本文中,我們將 COP 的定義簡化為戰場上每個友方和敵方智能體的當前狀態(位置、健康狀況、護盾、武器等)。我們認為,COP 對決策智能體至關重要。

近年來,以數據驅動方式進行端到端訓練的人工智能/人工智能方法大有可為。在數據驅動型自主 COP 的背景下,一個優勢是無需對傳感器和執行器中的噪聲、對手的動態等做出建模假設。通過充分的訓練,我們的數據驅動方法將產生高度精確的 COP。

不過,ML 模型可能對訓練數據或訓練場景的偏差很敏感。這與陸軍 C2 場景中通常假設的 DDIL(拒絕、中斷、間歇和有限影響)環境形成了鮮明對比。我們的實驗強調評估對霧增加、全球定位系統失效和通信中斷(如干擾)的適應能力。

我們使用深度神經網絡(DNN)的深度學習實現了編碼器和解碼器的數據驅動端到端訓練。將 DNN 應用于 COP 形成的一個挑戰是通信中缺乏人類可解釋性。人類可解釋性對于人類操作員有效控制蜂群至關重要。例如,通過解釋通信,操作員可以理解蜂群用于(自主)決策的特征。我們的方法具有人機互換性,這意味著人類操作員可以解碼傳入的信息,并將他們的感知編碼,與蜂群進行交流。由此產生的 COP 使人類能夠指揮蜂群。

在實踐中,COP 被大量用于任務執行,例如,確保協調運動。我們假設,將 COP 納入自主決策智能體將產生彈性多智能體策略(例如,對敵方變化的彈性)。我們在實驗中將有 COP 和沒有 COP 的多智能體策略學習與多種最先進的方法進行了比較,并驗證了這一假設。

接下來,我們總結一下我們的方法。我們首先描述了我們的深度學習方案,其中每個智能體將其感知和行動編碼成緊湊向量并進行傳輸。各智能體共享底層嵌入向量空間,以實現對態勢的共同理解。每個智能體都要訓練一個編碼器-解碼器,以生成本地 COP。本地 COP 應與智能體的感知一致,并能預測行動區域內所有單位的狀態(包括位置)。

利用深度強化學習(DRL)技術,在一系列不同的模擬場景、初始部隊配置和對手行動中,對 COP 和智能體策略進行端到端聯合訓練。訓練的輸出是一個編碼器-解碼器神經網絡(NN)和一個跨智能體共享的策略 NN。可通過多種方式對訓練進行配置:最小化帶寬、最大化對干擾(如信道噪聲、數據包丟失、GPS 干擾等)的恢復能力。該方法可用于協調信息收集任務。

實驗在星際爭霸-2(SC2)多代理環境中進行。在 SC2 中模擬的多個藍方與紅方的場景中,我們通過經驗觀察到了該方法的有效性。具體來說,我們在具有挑戰性和現實性的 TigerClaw 情景(圖 1)中測試和評估了我們的方法,該情景由發展司令部陸軍研究實驗室(ARL)和陸軍主題專家(SMEs)在美國佐治亞州摩爾堡的上尉職業課程中開發。

對 COP 的準確性和幻覺進行評估,以揭示有趣的訓練動態。在整個模擬過程中,我們的方法生成的 COP 高度準確,誤差小于 5%(與地面實況相比)。為了測試策略的魯棒性,我們將我們的方法與多種最先進的多智能體 RL 方法和基線進行了比較。結果表明,我們的方法所制定的策略能夠抵御視覺范圍減弱、通信能力減弱、GPS 被拒絕以及場景變化的影響。

總之,這項研究通過數據驅動的 COP 形成,實現了人在環內的異構自主平臺的指揮和控制,并推進了自適應和彈性 C2 領域的發展。其貢獻如下:

  • 實時自主形成可解釋的共同行動圖像(COP)的方法,包括預測整個行動區域的敵方位置。
  • 由于利用智能體間的通信進行分布式 COP 預測,因此展示了對可視范圍和 GPS 拒絕的更強的應變能力。
  • 通過聯合訓練 COP 模型和多智能體 RL 策略,提高整體任務成功率。

圖 3:從學習到的交流中預測 COP 的框架概覽。在決策過程中確定并使用 COP。我們使用 QMIX作為 COP 集成的 MARL 方法示例。

付費5元查看完整內容

本文探討了如何在軍隊中開發和訓練強大的自主網絡防御(ACD)智能體。本文提出了一種架構,將多智能體強化學習(MARL)、大型語言模型(LLM)和基于規則的系統組成的混合人工智能模型集成到分布在網絡設備上的藍色和紅色智能體團隊中。其主要目標是實現監控、檢測和緩解等關鍵網絡安全任務的自動化,從而增強網絡安全專業人員保護關鍵軍事基礎設施的能力。該架構設計用于在以分段云和軟件定義控制器為特征的現代網絡環境中運行,從而促進 ACD 智能體和其他網絡安全工具的部署。智能體團隊在自動網絡操作 (ACO) gym中進行了評估,該gym模擬了北約受保護的核心網絡,可對自主智能體進行可重復的培訓和測試。本文最后探討了在訓練 ACD 智能體理過程中遇到的主要挑戰,尤其關注訓練階段的數據安全性和人工智能模型的穩健性。

圖 1:四個網絡位置(A-D)容納五個藍色智能體(1-5)的情景。

本文探討了為自主網絡防御(ACD)智能體訓練混合人工智能(AI)模型時所面臨的挑戰和機遇,尤其是在戰術邊緣環境中。這些挑戰源于此類環境所特有的獨特、不可預測和資源受限的設置。北約研究任務組 IST-162 和 IST-196 的工作重點是 “軍事系統的網絡監控和檢測”[1]、[2] 和 “虛擬化網絡中的網絡安全”。虛擬化網絡中的網絡安全"[3] 至 [5],本研究旨在利用混合人工智能框架推進 ACD 智能體的設計和功能,以確保整個聯盟網絡的穩健網絡安全。多智能體強化(MARL)、大型語言模型(LLM)和基于規則的系統的采用構成了我們 ACD 架構的核心,增強了智能體在戰術邊緣環境中普遍存在的斷開、間歇、有限(DIL)帶寬條件下有效執行自主網絡防御任務的能力。這些條件要求系統具有彈性,能在網絡和資源嚴重變化的情況下保持高性能水平,這對傳統的網絡安全系統來說是一個重大挑戰。例如,將深度強化學習(DRL)與生成式人工智能相結合,有利于開發能夠進行復雜決策和自適應學習的智能體,提高其在動態網絡環境中應對復雜網絡威脅的能力[3]。此外,本文還討論了如何將 ACD 智能體集成到模擬的北約啟發的受保護核心網絡環境中,并在此環境中針對一系列網絡威脅對其進行評估。智能體利用人工智能技術的戰略組合,自動執行監控、檢測和緩解等關鍵防御行動,支持對關鍵軍事和民用網絡基礎設施的持續保護。

本文的貢獻如下: 第一,在一個集成了 MARL、LLM 和基于規則的系統的代理層次結構中使用代理智能體范例的方法論,以增強自主網絡防御能力。第二,討論在戰術邊緣環境中為 ACD 智能體訓練混合人工智能模型的挑戰和機遇。第三,定義一套評估指標,用于衡量 ACD 代理在數據和訓練保護方面的性能。本文的組織結構如下: 第二節回顧了相關文獻并解釋了研究原理。第三節詳細介紹了使 ACD 智能體適應戰術邊緣環境的方法。第四節介紹了我們的實證評估結果。最后,第 V 節總結了本研究的意義并概述了未來的研究方向。

付費5元查看完整內容

在當代威脅環境中,威脅可能在意想不到的時間從意想不到的角度出現。準確辨別戰術意圖的能力對于有效決策至關重要。傳統的威脅識別策略可能不再適用。本文將探討如何利用算法識別威脅的戰術意圖。為此,在模擬實驗中比較了人類和算法在識別敵對智能體戰術意圖方面的功效。在實驗中,70 名人類參與者和一個算法在一個海軍指揮和控制場景中扮演數據分析師的角色。在該場景中,敵方智能體控制一艘艦艇將攔截多艘友軍艦艇中的一艘。數據分析師的任務是及時識別敵方智能體可能攻擊的目標。我們對識別的正確性和及時性進行了研究。人類參與者的識別準確率為 77%,平均反應時間為 7 秒。算法的準確率達到了 87%,同時受限于人類的反應時間。當人類參與者識別正確時,算法有 89% 的時間表示同意。相反,當人的反應不正確時,算法有 91% 的時間不同意,這表明決策支持系統有機會在這種情況下影響人的決策。這項研究有助于加深我們對復雜作戰環境中的態勢感知和決策支持的理解。

付費5元查看完整內容

在數字化和戰略競爭日趨激烈的現代,成功與否取決于一個組織是否有能力比競爭對手更好、更快地利用數據和技術。人工智能(AI)技術的飛速發展正在徹底改變公共和私營機構保持領先的方式,影響著傳統的、由人類驅動的分析流程的各個層面。本報告探討了在情報周期中應用人工智能工具的機會,以增強人類分析師的能力,同時減少其局限性,從而推動更加無縫的情報流程

人類分析師擅長批判性思維和直覺判斷。他們解讀細微信息、理解復雜環境并根據不完整數據集做出明智決策的能力無與倫比。然而,數據超載、認知偏差、需要資源密集型培訓以及有限的時間和精力等限制因素卻阻礙了他們的工作效率。相反,人工智能技術擅長數據處理、客觀性和日常任務自動化。它們能以前所未有的速度分析海量數據、識別模式并執行重復性任務,而不會造成身心疲憊。

因此,人類和機器能力的互補優勢表明,分析流程將發生轉變,分析師-機器團隊將自適應地持續合作,以近乎實時的洞察力應對復雜的威脅。這種新模式將需要敏捷的協作框架、能夠有效使用人工智能工具并解讀人工智能生成的洞察力的熟練分析師、可靠而全面的培訓數據和流程,以及強大的監督機制。

付費5元查看完整內容

本文介紹了一個案例研究,說明為汽車減震器開發可靠、穩健、準確的數字孿生系統所面臨的挑戰。具體來說,該數字孿生系統的作用是估計儲氣室中當前的氣體壓力,并將其與預期壓力進行比較。研究定量證明,傳感器和算法的設計選擇對系統的準確性有重大影響,而這種影響與數字孿生系統的硬件成本不成正比。經評估的傳感器套件成本很高,總成本從 297 澳元到 4292 澳元不等,成本相差 14 倍。研究表明,使用龐大而昂貴的傳感器套件并不一定會相應地提高系統的精確度。數字孿生結構中使用的算法和傳感器對系統精度有顯著影響,RMSE 從 3.83 Bar 到 0.85 Bar 不等,精度相差四倍。數字孿生方法在精確度方面有顯著優勢,僅使用最精確傳感器的方法的有效誤差值為 2.27,而全數字孿生方法的有效誤差值為 0.84。成本最低的系統最大限度地利用了貝葉斯方法和物理建模,產生的估計值僅次于最精確的系統,均方根誤差為 1.4 Bar,是最精確系統的 165%,這對任務仍然有效,但成本僅為后者的 7%。這表明,通過利用混合架構中的算法開發,可以顯著提高性能,并大大減少數據集的大小和神經網絡組件的訓練時間。

圖 1:測功機測試裝置和儀器圖 注:圖片中的減震器并非測試設備。

付費5元查看完整內容

本項目的目標是提高具有智能體間通信基礎設施的多智能體分布式任務協調的效率。在這個項目的第一階段,我們探索了基于共識的捆綁算法(CBBA)在預算約束下的分布式任務分配的改進。CBBA技術的局限性在于,環境必須被所有的智能體預先知道,任務必須被明確定義,并有已知的成本和獎勵。這種技術顯然不適合在未知環境中的合作任務,在這種環境中,智能體必須一起探索和即興行動。在這個項目的第二階段,我們研究了在未知環境中執行任務的合作技術,其中智能體只有部分觀察。該研究使用多智能體捕食者和獵物游戲作為平臺。目標是讓智能體聯合定位并捕獲獵物。智能體對環境和獵物的逃逸算法沒有事先了解。他們相互交流,以獲得超出他們自己本地觀察范圍的環境信息。基于他們對環境的局部理解,智能體選擇自己的行動,包括在哪里移動以及是否與其他智能體溝通,以使團隊獎勵最大化。強化學習被應用于優化智能體的政策,以便用最少的步驟完成游戲。

第二階段研究的主要貢獻是信仰圖譜輔助的多智能體系統(BAMS)。信念圖代表了智能體在融合了傳入的信息后所保持的環境的隱藏狀態。通過將信仰圖譜與強化學習框架相結合,并向信仰圖譜提供反饋,我們加速了訓練并提高了系統可以獲得的獎勵。在不同復雜程度的環境中,使用合作的捕食者和獵物游戲對BAMS的性能進行了評估。與現有的具有信息傳遞能力的多智能體模型相比,BAMS具有以下優點。

1)訓練收斂速度快68%,使用BAMS模型訓練的智能體完成游戲的步驟少27.5%。

2)它具有強大的性能。在應用模式中,智能體的數量不必與訓練環境相同。

3)智能體之間的信息是加密的。BAMS中的信息是智能體對環境信念的學習表示的向量。它們不僅包含關于智能體和環境的當前狀態的信息,而且還包含未來的狀態。每個數字都與智能體或環境的任何物理屬性沒有對應關系。除非有經過訓練的BAMS模型,否則不可能解碼這些信息。

4)智能體在訓練中達成默契。從實驗結果來看,使用BAMS訓練的智能體似乎不需要明確的交流就能理解對方的意圖。

  1. 解碼后的信念圖為智能體的決定提供了一個粗略的解釋。信念圖解碼器與BAMS中的策略網絡一起訓練。通過比較信仰地圖和實際地圖,系統收到額外的反饋渠道,從而監督訓練過程。在執行過程中,信仰圖譜提供了一種解釋智能體隱藏狀態的方法,這可以進一步用來解釋智能體的行為。

付費5元查看完整內容
北京阿比特科技有限公司