亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

多智能體多團隊系統常見于目標分層的環境中。例如,在戰區范圍內的戰斗場景中,從將軍到士兵都需要多層次的指揮和控制,以正確執行目標。在游戲環境中也可以看到類似的結構,智能體以團隊的形式合作,與其他團隊競爭。同一團隊中的不同智能體必須在保持各自 “個性 ”的同時,相互配合、相互協調,以實現團隊的共同目標。本研究開發了基于策略的多智能體多團隊系統,其中策略被設定為團隊層面的一種工具,用于以一種有凝聚力的方式協調團隊中的多個智能體。本研究提供了戰略和基于戰略的多智能體多團隊系統的正式規范。開發了一個名為 SiMAMT(基于策略的多智能體多團隊系統)的框架。介紹了該框架的不同組成部分,包括策略模擬、策略推理、策略評估和策略選擇。此外,還開發了一種圖匹配近似算法,以支持有效和高效的策略推斷。還給出了一些例子和實驗結果,以說明所提出的框架,包括其每個復合要素及其整體功效。

這項研究為多智能體多團隊系統領域做出了多項貢獻:戰略和基于戰略的系統的規范,以及在真實世界、交互時間場景中實施這些系統的框架;這種復雜而錯綜復雜的交互的穩健模擬空間;允許在這些系統中在交互時間內進行戰略推斷的近似算法;驗證各種子元素的實驗結果,以及顯示所提框架功效的全面集成實驗。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

智能自主系統(IAS)是系統簇(SoS)的一部分,可與其他智能體互動,在復雜環境中完成任務。然而,基于其有限的認知過程,IAS 集成的 SoS 增加了額外的復雜性,特別是共享態勢感知(SSA),使團隊能夠對新任務做出響應。在軍事指揮與控制等復雜任務環境中,IAS 缺乏 SSA 會對團隊效率產生不利影響。SSA 的補充方法,即 “態勢理論”,有助于理解 SoS 的 SSA 與效率之間的關系。本研究闡明了態勢理論的概念性討論,以研究當人類與智能體協同工作時,SoS 的共享態勢感知的發展。為了使討論具有基礎,所回顧的研究在 SoS 的背景下擴展了態勢理論,并由此產生了三大猜想,這些猜想對未來 SoS 的設計和開發大有裨益。

圖 實現共享感知

機器學習算法和人工智能(AI)的進步正在使許多自動化系統變得更加自主(Chiou 和 Lee,2016 年)。這些技術進步的轉變之一是自適應智能自主系統(IAS)的發展,作為團隊成員,它們可以與其他智能體(即人類或機器)進行互動,以完成共同的目標。在指揮與控制(C2)任務環境中的人機團隊(HMT)背景下,IAS 是 “自主與無人系統和人工智能的融合”(海軍部 IAS 戰略,2021 年)。IAS 使組織能夠自動執行以前需要人類監督、能力和支持的各種單項任務。此外,伴隨著傳感器、艦載處理和人工智能編程復雜性的進步,IAS 的應用范圍也在不斷擴大。基于這些原因,我們將系統簇(SoS)定義為人類和 IAS(即 HMT)的結合體,在與環境交互的同時為實現共同目標而運行。由人類、機器和連接它們的輔助 C2 系統組成的 SoS 概念與 Maier(1998 年)對 SoS 和通用協作系統的分類區分是一致的。由此帶來的 IAS 發展標志著認知過程和性能的有效性和效率的提高,同時減少了人類操作員的腦力和體力工作量(Matthews 等人,2021 年)。

在 C2 行動中引入作為團隊成員的 IAS,為有人類操作的行動引入了新的層面。然而,這些新的 HMT 編隊也在 SoS 層面引入了不確定性。例如,IAS 和隨附的網絡化決策支持系統可能會引入大量動態環境因素(如人機通信),或向作為更大 SoS 一部分的人類展示異常行為,從而造成認知超載。此外,人類操作員對 IAS 的行為或輸出缺乏了解,同樣會產生子系統的不確定性(Canan 等人,2017 年)。這種算法引起的不確定性可能會降低、減緩或阻礙決策過程,從而導致人類團隊成員面臨更高的風險,進而影響任務的執行。目前,HMT 領域的人工智能研究探討了系統(即團隊)層面,特別是 SoS 層面的團隊認知過程和性能,包括交互(Klien 等人,2004 年)、信任(Bindewald 等人,2018 年)和決策(Kase 等人,2022 年)。然而,在人類-智能輔助系統團隊的背景下,還需要進行更多的深入研究,特別是在團隊態勢感知(TSA)的角度上進行研究,以便對這些系統進行適當的工程設計。

一般來說,TSA 被定義為“......每個團隊成員都有一套自己關注的特定 SA 要素,這是由每個成員在團隊中的職責決定的”(Endsley,1995 年,第 38-39 頁)。后來,Gorman 等人(2012 年)擴展了 Endsley 的 TSA 觀點,大力強調團隊溝通和協調的時空方面(即在正確的時間、正確的地點向正確的團隊成員發送信息)。然而,在發送信息之前,還必須在 TSA 概念內考慮最初的決策過程,尤其是在復雜領域。為了填補這一空白,本研究旨在通過專門闡述 TSA 的 SoS 層面,了解團隊層面認知過程的動態變化,包括溝通、協調和決策。此外,TSA 與共享情境意識(SSA)有更廣泛的聯系。研究人員在 HMT 研究中交替使用 SSA 和 TSA(Ososky 等人,2012 年;Schaefer 等人,2017 年;Wildman 等人,2014 年)。因此,我們在本文的其余部分使用 SSA。

為了更好地理解這一現象,本研究首先對 IAS 進行了定義。接下來,我們研究態勢感知和心理模型。然后,我們引入態勢理論,探討 IAS 如何與現實領域視角(RDP)相匹配,從而更好地理解 IAS 和人類之間的 SSA。最后,通過開發一種擴展的態勢理論方法,在 SoS 層面上理解人類與 IAS 之間的 SSA,我們概述了開發和設計人類與 IAS 之間的 SSA 所面臨的重大挑戰。在最后的分析中,我們證明了智能體系統缺乏必要的多樣性、反事實推理能力和算法反饋環路,因此無法與人類智能體產生 SSA。我們對這些 SoS 工程挑戰進行了討論和總結。

付費5元查看完整內容

現有的決策計算模型往往局限于特定的實驗設置。造成這種限制的主要原因是無法捕捉決策者對情況的不確定性。本文提出了一個計算框架,用于研究神經科學和心理學中不確定情況下的決策制定。框架主要側重于決策者對世界狀況的概率評估,即他們的 “信念”。具體來說,它基于部分可觀測馬爾可夫決策過程(POMDPs),結合貝葉斯推理和獎勵最大化來選擇行動。利用感知決策和社會決策方面的各種實驗數據,證明了基于信念的決策框架的可行性。框架解釋了感知決策實驗中決策者的實際表現與他們對實際表現的信念(即決策信心)之間的關系。它還說明了為什么在許多情況下這種評估會偏離現實。這種偏差通常被解釋為次優決策的證據,或選擇和信心的不同過程。我們的框架對這些解釋提出了挑戰,它表明,一個優化收益的規范貝葉斯決策者也會產生同樣的偏差。此外,在定量預測人類在社會決策任務中的行為方面,方法優于現有模型,并提供了對潛在過程的洞察。結果表明,在涉及大型群體的決策任務中,人類采用貝葉斯推理來模擬 “群體心理”,并對他人的決策做出預測。最后,將方法擴展到關于他人的多個推理層次(心智理論層次),并將服從作為群體決策的一種策略聯系起來。這個擴展框架可以解釋人類在各種集體群體決策任務中的行為,為大型群體中的合作與協調提供了新的理論。

圖 1.1: 基于信念的決策框架。智能體通過行動、觀察和獎勵與世界互動。智能體無法完全觀測到世界的狀態,只能根據觀測結果和智能體的內部世界模型,以概率方式表示世界的狀態。智能體的目標是根據當前狀態的概率分布來制定策略,即所謂的信念

付費5元查看完整內容

美國國防部(DOD)的規劃規劃目前致力于將國家戰略目標轉化為兵力結構。用于采購的聯合能力集成與開發系統(JCIDS)需求生成過程是兵力結構的主要驅動因素,其核心是減少組織間的冗余、實現基于能力的采購,以及在聯合層面評估需求和解決方案。JCIDS 流程是提高組織層級的一個范例,在此層級上決定需求和由此產生的資源請求。當前的采購環境帶來了新的財政和政治限制(如預算削減、持續決議),而任務要求卻隨著行動需求的增加而提高。資源和需求的不確定性是由預算波動和不斷變化的業務需求驅動的。技術更新、資產資本化和資產重新分配之間的權衡已成為采購決策過程中的主要驅動因素,以平衡制約因素、需求和不確定性。我們需要新的方法來確保國防部的各利益相關方能夠最大限度地成功完成任務,同時在當前的限制條件下應對不確定性,而不需要另一個層面的綜合協調。針對其他利益相關方的決策和未來的不確定性,制定技術投資、系統開發和系統分配戰略 "劇本 "的新方法將有助于各利益相關方更好地分配資源。 軍事力量結構可定義為一個公認的系統簇(SoS)。目前已有大量工作涉及 SoS 工程流程、SoS 性能評估和 SoS 系統評估。然而,很少有方法能在協助國防利益相關者進行戰略規劃所需的層面上全面解決 SoS 規劃和演化問題。當前的方法無法解決多個利益相關者決策的影響、每個利益相關者的多重目標、決策結果的不確定性以及戰略決策的時間因素。

作者在回顧當前最新技術并綜合其他領域現有方法的基礎上,開發了一種三步方法來解決上述不足,從而為單個利益相關者制作游戲手冊提供參考。

這項工作假定了一個被視為真相模型的博弈框架,它代表了利益相關者的決策以及隨著時間推移而產生的結果。第一步是從復雜的博弈框架中創建一個計算上合理的元模型。使用蒙特卡洛技術對真相模型進行采樣,生成 s、a、r、s 樣本圖元。這些圖元用于訓練元模型 MDP。元模型會產生一個較低維度的狀態空間,該空間由元模型狀態、基于特定行動的轉換概率和隨機利益相關者獎勵組成。

第二步是利用現在可計算管理的決策空間,提取利益相關者的有用信息。MDP 元模型用于評估基于風險的策略、狀態重要性和行動重要性。在均值-方差組合理論的基礎上,開發了一種適用于利益相關者效用的新算法,并與強化學習(RL)策略迭代法相結合,利用 MDP 元模型構建基于風險的策略。在每個狀態前后都會對利益相關者指標進行熵測量,以衡量狀態的重要性。通過比較平均結果和結果方差,來衡量每個元模型狀態-行動對的給定行動的單個利益相關者指標之間的機會成本。

最后一步是生成信息,為利益相關者的具體行動手冊提供信息。基于風險的策略可用于在每個狀態下開發風險容忍度敏感性配置文件(RTSP)。狀態 RTSP 可以確定與風險和回報相關的帕累托效率行動和低效行動。狀態 RTSP 還能識別最差、低風險和高風險行動。此外,還可以對決策空間進行分析,以確定類似 RTSP 之間的一致趨勢,以及作為狀態值函數的 RTSP 分叉。使用熵和機會成本指標可識別重要的狀態和行動。

該方法的輸出結果是推導出的基于行動和狀態的風險信息,并提供給利益相關者,以支持制定基于風險的行動手冊。

制定該方法的部分目的是為了測試現有和新穎結構的適用性。在審查現有方法、綜合新方法和制定總體方法的過程中,提出了三個假設。假設 1 認為,使用基于風險的新型策略算法,可以確定帕累托效率行動。假設 2 斷言,可以應用狀態空間縮減技術來創建縮減的 MDP 元模型,以減少計算時間,同時保持可用的基于風險的策略輸出。假設 3 斷言,基于風險的策略度量可用于獲得超越當前最先進的信息,即最優策略方法所代表的信息。

實驗 1 使用一組日益復雜的 MDP 檢驗了假設 1,并證明了基于風險的策略算法識別帕累托有效和無效行動的能力。實驗 2 通過改變狀態壓縮率來檢驗假設 2,結果表明計算時間縮短,基于風險的策略也更加相似。實驗 3 利用不太復雜的情景和單一的完全復雜情景對假設 3 進行了檢驗。演示了該方法的全部能力,并與最優策略方法進行了比較。與最優政策方法的結果相比,這套方法所提供的信息更加細致入微。

對每個假設的成功評估表明,該方法可為軍事防御規劃人員(單一 SoS 利益相關者)提供信息,以制定基于風險的行動手冊,從而在具有多個合作和非合作利益相關者、預算限制和不斷擴大的作戰需求的不確定環境中協助長期決策。這將允許在利益相關者層面進行穩健的規劃,而無需額外的合并和審查。

付費5元查看完整內容

軍事行動需要具備對復雜的大城市環境進行態勢了解的能力。這通常是在情報、監視和偵察(ISR)任務中制定的。這些任務類型發生在戰斗的不同階段,包括戰斗行動和穩定與支持行動(SASO)。自主移動機器人小組可在已知的動態城市環境中執行巡邏和偵察任務,為士兵提供支持。

本文旨在開發一個名為 "風險地圖 "的概率框架。自主機器人將使用 "風險地圖 "規劃其行動,"風險地圖 "顯示了一個與戰術相關的位置,在該位置的暴露或環境可能使攻擊造成最大傷害(例如,可能的簡易爆炸裝置或狙擊手位置)。

“風險地圖”以決策過程為基礎,針對適應性對手事件分配機器人巡邏。這些技術將利用時間演化來防止對手不可避免地適應這些策略,因為這可能會使這些策略的效果大打折扣。

使用多機器人協調方法進行分散、信息量大且自適應的采樣應用不會出現單點故障。它允許隨時預測,任何機器人在任何時間點都能獲得環境的合理模型。此外,它還能將所需的通信量保持在最低水平。此外,適當的地理信息系統(GIS)技術為軍事指揮官提供了快速整合數據集、評估條件、規劃戰略和評估選項的手段。

圖:UGV和無人機之間的交互作用,進行源搜索和目視目標識別。

未來,人類將與人工智能系統密切合作。智能系統將成為團隊成員,并將起到擴展單個單元的覆蓋范圍和能力的作用,從而實現前所未有的能力。

自主機器人的智能探索和強大的協作監控將成為城市行動的關鍵,使其能夠預防未來的脆弱性和威脅風險。本論文探討了環境的先驗知識和類似場景中的行動歷史如何預測和預防未來的攻擊。在這篇論文中,我們提出了一個概率框架,在這個框架中,可以將一套領域專家規則與空間和語義知識結合起來,使自主智能體能夠收集信息。然后,自主智能體可以利用這個不斷演化的框架,針對不斷變化的信息環境規劃最佳行動,從而以最佳方式完成任務。我們的方法擴展了[Pit+08; ZST15]中描述的技術,用于本論文中介紹的 MAST/ARL 導航模塊所使用的基于信息的探索框架。Pita 等人創建了系統架構: ARMOR。該系統提供的月歷滿足了洛杉磯國際機場官員對檢查站和警犬在洛杉磯國際機場部署的所有關鍵要求。

多機器人團隊為部隊提供支持的一大挑戰是了解環境是如何動態變化的,以便為車隊選擇最明顯或最便捷路線的區域提供安全保障。為了應對這一挑戰,利用有關特定地點的地理信息系統數據和活動日志很有意義。實現這一目標的一種方法是使用基于信息的地圖(風險地圖),該地圖由一組模塊化組件組成,在評估風險的先驗概率時,這些組件代表了敵方戰略知識。此外,風險地圖還有一個時間組件,可逐漸回到先前的地圖狀態,代表戰爭迷霧。

我們考慮的現實場景是,由不同能力的機器人組成的團隊探索未知環境,每個機器人獲取并計算自己的地圖,并與團隊其他成員交換這些信息,同時考慮到通信限制,即機器人只能在特定距離內通信,信息量的交換受帶寬限制。此外,每個機器人都能從探索任務切換到尋找任務源,并能在需要時提供或請求援助。

論點陳述

利用自適應信息采樣的多機器人探索和導航協調策略,使機器人平臺能夠在未知環境中自主執行情報、監視和偵察(ISR)任務,從而防止未來的脆弱性和威脅風險。

貢獻

  • 完整的分布式多機器人 SLAM 解決方案,可執行基于特征、基于目標以及基于姿態的圖形 SLAM,并具有概率數據關聯和閉環功能。
  • 一種分布式算法,可根據相對姿態測量結果估算多個合作機器人或移動設備的 3D 軌跡。
  • 提供高低威脅級別信息的系統框架,該信息將用作運動編隊和巡邏的行動計劃。
  • 異構多機器人自適應信息采樣的新型協調策略,具有分散性和魯棒性。

本論文的所有貢獻都通過使用模擬和真實數據的實驗結果得到了驗證。

圖:模擬地圖,用于在舞臺模擬器內的各類環境中測試協調策略。機器人在其初始起始區域顯示為一排紅點,該區域代表一個突破口。導航關鍵點用紅色 "X "標記表示。

付費5元查看完整內容

基于模型的決策支持系統(MDSS)在航空、應急管理、軍事指揮與控制、醫療保健、核行動、情報分析和海上行動等許多后果嚴重的專業領域都非常突出。MDSS 通常使用任務和操作員的簡化模型,對決策情況進行結構化處理,并向操作員提供對決策任務有用的信息提示。模型是一種簡化,可能會被錯誤定義,并存在誤差。采用和使用這些錯誤的模型會導致用戶的決策貧乏。本文把決策者的這種貧乏狀態稱為 "模型盲"。我們進行了兩個系列實驗,以研究模型盲對人類決策和績效的不利影響,以及如何通過可解釋人工智能(XAI)干預來減輕這些影響。本論文還報告了模擬結果,通過展示模型盲區和模型盲區緩解技術對性能的影響來激發實驗。實驗將模擬路線推薦系統作為具有真實數據生成模型(不可觀測世界模型)的 MDSS 來實施。在實驗 1 中,生成推薦路線的真實模型以及額外的非推薦路線和相關屬性信息被錯誤地指定為不同級別,從而對 MDSS 用戶造成了模型盲區。在實驗 2 中,同樣的路線推薦系統采用了緩解技術,以克服模型失當對決策質量的影響。總體而言,這兩項實驗的結果幾乎都不支持由于模型盲區而導致的性能下降,因為模型盲區是由錯誤的系統造成的。實驗 1 和實驗 2 中捕捉到的行為對參與者所處的不同誤設統計環境的敏感性極低。有確鑿證據表明,在不同條件下,推薦的替代方案以及參與者對這些方案的依賴或偏離都會產生影響。XAI 干預為了解參與者如何調整決策以考慮系統中的偏差以及如何偏離模型推薦的備選方案提供了寶貴的見解。參與者的決策策略表明,他們能夠從反饋或解釋中理解模型的局限性,并相應地調整策略以考慮模型中的錯誤規范。這些結果為評估決策策略在模型盲區匯合模型中的作用提供了有力支持。這些結果有助于確定在 MDSS 的開發、實施和使用階段仔細評估模型盲區的必要性。

圖 3. 為實驗開發的路線推薦系統中使用的模型

付費5元查看完整內容

近年來,多智能體系統在工業、軍事、家庭和研究領域得到了廣泛應用,因而備受青睞。兩個常見的目標是讓智能體達到物理上的分離(編隊),或讓它們的狀態/輸出結合起來等于一個指定的目標(協作)。許多多智能體系統會反復重復執行任務,而一個共同的要求就是以盡可能高的精度實現預期目標。迭代學習控制(ILC)是一種眾所周知的方法,它能讓重復執行相同任務的系統利用之前嘗試收集到的數據提高性能。ILC 已成功應用于協同控制和編隊控制問題,但遺憾的是,現有的設計有很大的局限性。首先,算法分別處理每個問題,無法將協作目標和編隊目標結合起來。其次,現有的編隊控制方法只能處理有限類別的系統和/或通信結構,而且不是基于模型的。因此,它們只能實現緩慢的漸進收斂。已經開發出一種基于模型的控制器來解決協作問題,但它只能用于簡單的(相對零度)動力學,對模型的不確定性沒有魯棒性。第三,對現有方案對模型不確定性的魯棒性分析很少,也沒有明確的機制使設計者能夠在魯棒性與性能之間進行權衡。

本論文開發了一個功能強大的新 ILC 框架來解決這些局限性。它適用于一般的線性智能體動力學,并能解決常見的通信架構形式。該框架同時結合了跟蹤和編隊控制,使設計者有能力從一整類更新中進行選擇,而不是采用單一的指定算法。其主要優點是更新結構是分散的,從而簡化了設計,擴大了潛在應用領域的范圍。收斂特性和魯棒性能特性被推導出來,并被用于開發一種全面的設計程序,以透明的方式平衡實際的權衡。

然后,將控制結構實驗性地應用于康復工程,其中每個智能體對應一塊電刺激肌肉,總體目標是輔助運動。實驗和模擬結果證實了對人類運動的精確輔助,并說明了分散控制在大幅降低硬件和通信開銷方面的效用。

付費5元查看完整內容

長期目標

在決策或推理網絡中進行適當的推理,需要指揮官(融合中心)對每個下屬的輸入賦予相對權重。最近的工作解決了在復雜網絡中估計智能體行為的問題,其中社會網絡是一個突出的例子。這些工作在各種指揮和控制領域具有相當大的實際意義。然而,這些工作可能受限于理想化假設:指揮官(融合中心)擁有所有下屬歷史全部信息,并且可以假設這些歷史信息之間具有條件統計獨立性。在擬議的項目中,我們打算探索更普遍的情況:依賴性傳感器、(可能的)依賴性的未知結構、缺失的數據和下屬身份被掩蓋/摻雜/完全缺失。對于這樣的動態融合推理問題,我們建議在一些方向上擴展成果:探索數據源之間的依賴性(物理接近或 "群體思維"),在推理任務和量化不一定匹配的情況下,采用有用的通信策略,甚至在每個測量源的身份未知的情況下,采用無標簽的方式--這是數據關聯問題的一種形式。

我們還認識到,對動態情況的推斷是關鍵目標所在。考慮到一個涉及測量和物理 "目標 "的傳統框架,這是一個熟悉的跟蹤問題。但是,來自目標跟蹤和多傳感器數據關聯的技術能否應用于提取非物理狀態(物理狀態如雷達觀察到的飛機)?一個例子可能是恐怖主義威脅或作戰計劃--這些都是通過情報報告和遙測等測量手段從多個來源觀察到的,甚至可能被認為包含了新聞或金融交易等民用來源。這些都不是標準數據,這里所關注的動態系統也不是通常的運動學系統。盡管如此,我們注意到與傳統的目標追蹤有很多共同點(因此也有機會應用成熟的和新興的工具):可能有多個 "目標",有雜波,有可以通過統計學建模的行為。對于這種動態系統的融合推理,我們的目標是提取不尋常的動態模式,這些模式正在演變,值得密切關注。我們特別建議通過將雜波建模為類似活動的豐富集合,并將現代多傳感器數據關聯技術應用于這項任務,來提取特征(身份)信息。

目標

研究的重點是在具有融合觀測的動態系統中進行可靠推理。

方法

1.決策人身份不明。在作戰情況下,融合中心(指揮官)很可能從下屬那里收到無序的傳感器報告:他們的身份可能是混合的,甚至完全沒有。這種情況在 "大數據 "應用中可能是一個問題,在這種情況下,數據血統可能會丟失或由于存儲的原因被丟棄。前一種情況對任務1提出了一個有趣的轉折:身份信息有很強的先驗性,但必須推斷出身份錯誤的位置;建議使用EM算法。然而,這可能會使所有的身份信息都丟。在這種情況下,提出了類型的方法來完成對局部(無標簽)信念水平和正在進行的最佳決策的聯合推斷。

2.動態系統融合推理的操作點。在以前的支持下,我們已經探索了動態事件的提取:我們已經開發了一個合理的隱馬爾科夫模型,學會了提取(身份)特征,有一個多伯努利過濾器啟發的提取方法 - 甚至提供了一些理論分析。作為擬議工作的一部分,將以兩種方式進行擴展。首先,打算將測量結果作為一個融合的數據流,這些數據來自必須被估計的未知可信度的來源。第二,每個這樣的信息源必須被假定為雜亂無章的 "環境 "事件(如一個家庭去度假的財務和旅行足跡),這些事件雖然是良性的,可能也不復雜,但卻是動態的,在某種意義上與所尋求的威脅類似。這些必須被建模(從數據中)和抑制(由多目標追蹤器)。

3.數據融合中的身份不確定性。當數據要從多個來源融合時,當這些數據指的是多個真相對象時,一個關鍵的問題是要確定一個傳感器的哪些數據與另一個傳感器的哪些數據相匹配:"數據關聯 "問題。實際上,這種融合的手段--甚至關聯過程的好方法--都是相當知名的。缺少的是對所做關聯的質量的理解。我們試圖提供這一點,并且我們打算探索傳感器偏差和定位的影響。

4.具有極端通信約束的傳感器網絡。考慮由位置未知、位置受漂移和擴散影響的傳感器網絡進行推理--一個泊松場。此外,假設在這樣的網絡中,傳感器雖然知道自己的身份和其他相關的數據,但為了保護帶寬,選擇不向融合中心傳輸這些數據。可以做什么?又會失去什么?我們研究這些問題,以及評估身份與觀察的作用(在信息論意義上)。也就是說,假設對兩個帶寬相等的網絡進行比較;一個有n個傳感器,只傳輸觀察;另一個有n/2個傳感器,同時傳輸數據和身份。哪一個更合適,什么時候更合適?

5.追蹤COVID-19的流行病狀況。誠然,流行病學并不在擬議研究的直接范圍內,但考慮到所代表的技能以及在目前的健康緊急情況下對這些技能的迫切需要,投機取巧似乎是合理的。通過美國和意大利研究人員組成的聯合小組,我們已經證明,我們可以從當局提供的每日--可能是不確定的--公開信息中可靠地估計和預測感染的演變,例如,每日感染者和康復者的數量。當應用于意大利倫巴第地區和美國的真實數據時,所提出的方法能夠估計感染和恢復參數,并能很準確地跟蹤和預測流行病學曲線。我們目前正在將我們的方法擴展到數據分割、變化檢測(如感染人數的增加/減少)和區域聚類。

付費5元查看完整內容

許多國家都使用了像“三角洲” (Delta) 這樣的作戰管理系統(BMS),包括烏克蘭,使指揮部能夠共享態勢感知信息;本研究的重點是信息在作戰網絡中的分配。與自然系統類似,螞蟻和蜜蜂等自主代理遵循一套簡單的規則,BMS是一個由基地和電子作戰平臺組成的網絡,在國防條令的指導下,軍事資產作為網絡內的智能體。這種系統的可操作性的原理是基于多個子系統相互作用時每個子系統都是可靠的。然而,潛在相互作用的排列組合會引起不可預測的負反饋或正反饋循環,導致不可預測的和不想要的結果。突現行為的結果是出乎意料的,有時在情報和無線網絡等領域是不受歡迎的。理解突發行為對于理解復雜的工程系統是勢在必行的,并且要提出新的見解,采取切實可行的措施來改善復雜系統的設計和分析。本文介紹了BMS和網絡與用戶定義的系統集成的網絡士兵概念的例子。作者認為,烏克蘭和其他軍隊可以直接從利用元控制論、元元系統模型分析來控制突現。

圖2:作戰管理系統(BMS)的集中式指揮通信網絡

付費5元查看完整內容

最近,深度強化學習(RL)方法已被成功應用于多智能體場景。通常情況下,分布式決策的觀測向量是由一個智能體收集的關于其他智能體(局部)信息的串聯來表示。然而,串聯法在具有大量同質智能體的集群系統中的擴展性很差,因為它沒有利用這些系統固有的基本特性:(i)集群中的智能體是可以互換的;(ii)集群中智能體的確切數量是不相關的。因此,我們提出了一種新的基于分布式均值嵌入的深度多智能體RL狀態表示,我們將智能體視為樣本,并使用經驗的均值嵌入作為分布式策略的輸入。我們使用直方圖、徑向基函數和端到端訓練的神經網絡來定義均值嵌入的不同特征空間。我們對集群文獻中的兩個著名問題--交會和追趕逃避--在全局和局部可觀察的設置中評估了該表示。對于本地設置,我們進一步引入了簡單的通信協議。在所有的方法中,使用神經網絡特征的平均嵌入表示能夠在相鄰的智能體之間進行最豐富的信息交流,促進復雜的集體策略的開發。

付費5元查看完整內容

這項工作得到了美國陸軍行為與社會科學研究所 (W911NF19-2-0173) 的支持。

團隊流程:

  • 各個組織都在依靠團隊來完成越來越復雜的任務。
  • 因此,為了更好地了解成功的團隊,大量的研究都集中在團隊流程上。
  • 協調被認為是一個可以影響重要團隊結果的團隊流程。
    • 顯性協調
    • 隱性協調
  • 在軍隊中,協調對于任務的成功非常重要。

付費5元查看完整內容
北京阿比特科技有限公司