亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

隨著工作邊界的擴展與未來形態的演進,人類與機器將共享更具協作性的工作空間,實現成員間的自由協同。在此背景下,需明確信息在團隊成員間的流通機制,以確保人機信息交互的高效性與準確性。共享態勢感知(SSA)——即個體獲取并解析非自身信息源信息的程度——為構建上述信息交換的設計準則提供了有效框架。本研究提出增強/虛擬現實(AR/VR)環境下共享態勢感知的初步設計原則,旨在幫助設計者:(1)基于基礎原則構建高效界面;(2)通過系統性文獻綜述開發的測量工具評估候選界面設計效能。研究目標通過以下專項實驗達成:1) 論證AR支持任務中SSA的重要性;2) 闡述支撐SSA所需的設計指南與測量工具;3) 采用SSA衍生的AR界面開展用戶研究,驗證文獻提煉準則的有效性。

本文通過互補性章節深入解析SSA構成要素及相關設計準則,探討SSA與AR/VR系統信號檢測的關聯性,以及用戶與界面SSA測量對目標成果的促進作用。最終章節整合各章研究成果,系統回應本論文的核心研究問題與目標。

第二章論述初始用戶研究,通過合作搜索任務分析人類績效,初步識別SSA信息在同類任務中的效用價值。非SSA導向的界面設計缺陷分析為SSA初步準則的提煉提供了啟示。本章同時介紹一種輔助測量工具,該工具雖作為人類SSA間接度量指標開發,亦可作為AR/VR頭顯設備的通用可用性評估或生物力學測量工具。

第三章開發AR/VR頭戴式顯示器(HWD)角急動度測量指標,使設計者能基于特定AR界面評估用戶運動質量。該指標既可識別界面用戶需求特征,也可作為AR/VR普適化進程中疲勞度與損傷風險的量化依據。延續此研究脈絡,第四章聚焦AR/VR HWD力與扭矩復合測量方法的開發與驗證。結合角急動度指標,該測量體系通過提供用戶工作負荷、疲勞度等客觀基準數據,深化AR/VR HWD運動數據分析,同時具備安全監控與其他數據測量功能。基于此類數據,機器成員可深度認知用戶的疲勞度、損傷傾向等影響即時能力的要素,進而優化人機協作效能。

第五章系統梳理SSA文獻體系,初步構建基于SSA原則的界面評級工具。該工具類似于SAGAT型評估體系,可供開發者量化用戶SSA水平,檢驗界面設計對SSA的增強效果。后續研究中,本調查工具將用于驗證本章開發的界面準則對用戶SSA的提升作用。

最終章節通過實證研究完善SSA原則體系并驗證測量指標。本研究采用VR界面,整合前期實驗數據與第五章文獻綜述成果,系統驗證已確立的原則與測量方法。研究成果不僅支持SSA增強型團隊協作的預防性設計,還可實現設計方案的實時與回溯評估,推動界面迭代優化。相較于第二章初始研究,本測試平臺顯著增強交互性,通過提升搜索任務復雜度迫使用戶深度依賴系統組件,從而在主動強化SSA的同時驗證其有效性(詳見章節詳述)。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

國防部門正為其工作體系推行數字化工程實踐,同時更廣泛的系統工程界致力于實現此類實踐的現代化與標準化。從傳統文檔模式向純數字化模式的轉型,需要提升對項目或產品全生命周期的數字化管理能力。然而技術發展必須通過迭代流程優化工具設計,聚焦多元用戶群體的可用性需求。現有工具技術雖多,卻常忽略工程師為同行設計工具時的可用性評估。在開發數字化工程任務解決方案時融入可用性考量,既能簡化工具操作又可擴大用戶群體。

本研究評估了12名參與者使用Stitch的表現。該定制化網絡工具支持創建系統工程建模語言第二版(SysMLv2)模型并與虛擬智能體交互。采用混合研究方法結合遙測數據與問卷調查,通過四組任務情景對組(學員與專業人員各半)構建測試框架:受試者根據源文檔構建SysMLv2模型并分析模型要素。該流程平衡傳統文件瀏覽模式與虛擬智能體輔助功能,并采用雙重視覺樣式設計。遙測數據與問卷反饋共同揭示工具可用性及虛擬智能體效能,結果表明不同群體內部及群體間存在顯著的性能與可用性差異。盡管Stitch展現出可用性且虛擬智能體有效支持建模,但參與者普遍期待增強建模輔助功能。

本文貢獻包括:1)基于用戶中心化設計方法論構建Stitch工具,通過案例研究論證虛擬智能體支持下SysMLv2建模的可行性;2)開發四組情景對組指導用戶系統學習SysMLv2建模;3)設計兩種定制模型樣式及可視化擴展機制輔助模型解讀;4)建立用戶通過虛擬智能體調取文檔的學習路徑;5)提出提升Stitch及其他數字工程工具可用性的發展建議。

系統工程(SE)向數字化工程(DE)的轉型需與新技術發展同步。硬件、軟件與基礎設施的深度融合已重塑社會各場域的工作模式。美國防部(DoD)特別是空軍部隊,正采用"引領、借力、觀察"策略吸納敏捷產品開發的商業技術[1]。在業界引領的背景下,國防部需借力哪些技術支持數字化轉型?精進技術并開發配套工具將優化項目全生命周期管理。明確DE工具需求的首要步驟是界定任務支持范疇,繼而通過工具評估定義用戶核心功能需求,最終擴展至更多應用場景。本研究聚焦SysMLv2與虛擬智能體建模場景,致力于構建任務界定與基礎功能需求的可用性基準。

政府機構在項目實施中接收的交付成果形式多樣,常包含多類型文件的數字資產。綜合產品組(IPT)成員需協作驗證這些資產,其專業知識互補形成綜合評估體系。信息關聯要求建立數字資產管理機制實現交付物文檔化與模型化。當前SE/DE領域商業建模工具可通過系統建模實現資產驗證,但復雜工具的設計門檻限制了新從業者及跨領域專家的使用。2018年美軍發布的《國防部數字化工程戰略》設定了推動轉型的多項目標[2],包括改進合同語言聚焦模型開發、制定標準及革新文化與人力體系。同年發布的《國防部云戰略》明確了向云計算轉型的實施路徑[3]。這些頂層設計與國際SE/DE界最新研究形成呼應[4][5],共同推動國防部采用系統性產品開發新技術。

由六個章節構成:第二章闡釋四大核心DE任務,結合可用性啟發原則,分析SysMLv1與SysMLv2語言構型要素,并綜述DE工具、大語言模型(LLM)與微服務技術,奠定研究理論基礎;第三章詳述Stitch設計過程,涵蓋SysMLv2參考架構應用、界面體驗開發、數據記錄、LLM集成及信息技術設計;第四章延續設計流程,闡明研究方法論、實驗設計與數據采集規程;第五章呈現可用性評估結果,深度解析各任務情景數據;第六章總結研究成果,論述應用價值并提出后續研究方向建議。

付費5元查看完整內容

本報告概述了美南加州大學信息科學研究所(USC ISI)"跨時空與跨模態學習事件模式構建體系(LESTAT)"團隊在DARPA"知識引導人工智能模式推理(KAIROS)"計劃中的研究成果。目標體系包含雙重維度:(1) 開發人機協同構建模式庫的流程——通過自然語言處理(NLP)技術增強人類背景知識;(2) 建立結構化模式知識庫。每個事件劇本包含復雜事件步驟的自然語言描述及維基數據本體鏈接。

事件通過雙重機制關聯:(a) 時序邏輯(如汽車價格協商發生在購買行為之前);(b) 共享參量(如購車者與價格談判者為同一主體)。知識庫質量外部評估由國家標準技術研究院(NIST)主導;伊利諾伊大學RESIN引擎實現基于流式輸入的預測推演。USC ISI研發的"機器輔助劇本構建者(MASC)"工具,可使非NLP專業人員完成劇本創作。鑒于純文本解析存在固有信息缺失,人工編寫需克服兩大障礙:操作步驟遺漏傾向及本體形式化映射挑戰。MASC通過四類智能建議輔助創作:(1) 事件本體類型標注;(2) 事件參量及角色定位;(3) 參量細粒度本體分類;(4) 潛在遺漏步驟補全建議。

USC ISI同時探索時序關系自動化構建,但實證表明人工審核不可或缺——主因在于復雜事件子環節往往存在非確定性序列邏輯。除支持基于時序關系的子事件架構外,MASC還引入層級化體系以實現復雜事件語義聚類。該工具突破性實現兩種創新路徑:在定義非時序關系的邏輯門結構中嵌入人類可解讀的命名標簽;創建可跨庫調用的命名子模式單元。核心成果包括:
? 開發人機智能交互平臺MASC——支持復雜事件結構的本體化模式創建、審核與管理
? 構建約200個復雜事件模式知識庫(含程序員與跨學科碩士生創作內容)
 ? 提交52項經專業聚焦的評估劇本庫,覆蓋恐怖活動、疫情爆發、化學品泄漏、暴亂事件及政變行動等五類復雜事件場景

付費5元查看完整內容

人工智能分布式部署中智能體系統的廣泛應用,對高效選擇影響智能體學習行為的參數、在復雜環境中實施機制設計,以及整合多元智能體能力實現目標結果提出了新挑戰。算法機制設計作為計算機科學、數學和經濟學的交叉領域,致力于開發引導理性智能體達成預期行為的算法,其應用涵蓋資源分配、成本分攤、定價與組合拍賣等場景。然而,傳統方法受限于計算約束與靜態假設,在充滿不確定性與動態變化的環境中效果不佳。

本論文通過融合強化學習(RL)與貝葉斯優化(BO),針對動態多智能體場景開發自適應機制以突破上述局限。我們提出多智能體強化學習(MARL)中機制設計的新框架,依托創新的BO方法高效探索潛力方案。MARL可捕捉隨機環境中多智能體動態交互的復雜性,通過求解底層馬爾可夫博弈以學習聯合策略。評估多MARL場景的計算復雜度問題通過以下方式解決:(I)擴展后繼特征至納什均衡策略的遷移學習;(II)采用BO框架限定評估預算,使問題可解。

所提機制設計框架的有效性在出租車平臺司機服務費設定、共享自然資源開發管理(社會福利最大化)、探索任務機器人集群硬件采購決策優化,以及激勵機制與招募策略設計(委托方目標最優化)等實際應用的基準研究中得到驗證。該方法在現實問題上展現的優越性,凸顯了BO與MARL融合優化復雜多智能體系統的潛力,為機制設計領域的未來研究奠定了堅實基礎。

付費5元查看完整內容

在高度受限與擁擠環境中協調機器人集群的復雜任務,常因機器人獲取精確環境狀態信息的能力受限而受阻——此類信息對引導群體達成目標至關重要。挑戰源于環境中固有的不確定性與不可預測性,影響智能體與環境的交互。然而,密集活性物質研究表明,協調行為可通過自組織原則涌現,即簡單的局部社交互動催生復雜全局構型與模式。本論文旨在利用密集活性物質的必然特征,實現無全局控制與顯式他機狀態信息下的機器人集群自發協同。具體而言,自適應堵塞控制技術通過非計劃接觸交互促成集群涌現性協調。該技術依賴機器人間的接觸與碰撞(基于位置噪聲估計與環境變化)。通過自主方向調整與個體任務參與度調節,可化解狹窄隧道中的持續性堵塞。進一步改進算法以應對個體故障對群體效能的負面影響:主動接觸響應(ACR)算法為堵塞控制機制注入容錯性,將故障機器人重定位至低干擾位態,確保隧道內交通流持續暢通與任務完成。

擁擠受限系統的這些特性同時應對多智能體強化學習(MARL)的基礎性挑戰。通過共享環境建立間接通信通道,智能體可估計并推理其他智能體活動的統計特征,從個體視角直接降低環境的非平穩性。數值仿真表明,利用局部物理交互與環境隱式通信可提升多智能體強化學習場景的收斂性與可擴展性。

最終構建數學模型闡釋并驗證自然集群在擁擠狹窄自生隧道中(無需全局控制或顯式通信)表現的自組織行為。該模型與生物實驗中觀測的多階段掘進速率相吻合,揭示接觸與局部交互對自然群體自調控行為的關鍵調控作用。

? 第二章介紹了生物與機器人集群中利用局部交互作為協調技術的背景與文獻綜述,涵蓋共識主動性(stigmergy)在多智能體強化學習場景中的應用,并綜述多智能體系統容錯技術。
? 第三章提出自適應協議方法,用于學習預防受限多機器人掘進任務中的擁堵問題,展示長期真實機器人實驗的實證結果。
? 第四章詳述主動接觸響應方法,增強第三章所述堵塞控制算法的容錯性,呈現真實機器人實驗結果并與基線算法對比。
? 第五章轉向深度強化學習在擁擠受限環境中的多智能體協調,探討通過虛擬信息素或共識主動性提升收斂性的方法論,并與既有基線算法進行比較。
? 第六章展示活體集群協調與適應技術的最新發現,構建螞蟻掘洞實驗的分析與仿真模型。
? 第七章總結全文,強調核心貢獻并展望未來研究方向。

付費5元查看完整內容

多機器人協調與協作是提升團隊能力、實現自主建造、農業及廣域未知環境長期作業等新任務的關鍵行為。本研究聚焦多機器人資源分配問題背景下的此類行為,即機器人需被分配至服務區域。我們特別關注適用于大規模機器人集群的容錯方法,引入一種基于圖建模的多機器人資源分配框架,該框架在表征區域間關系與獎勵模型方面具備前所未有的豐富性。首先解決多智能體覆蓋控制問題,通過圖神經網絡(GNN)實施基于圖的計算,利用學習型智能體間通信策略實現性能與可擴展性提升。隨后針對需顯式協調協作的復雜多任務場景,提出基于網絡流的規劃方法,可在數秒內生成大規模問題的高質量解。我們將此方法擴展至在線環境,實現任務失敗與意外觀測條件下的動態重規劃。實驗證明,這些建模方法與算法通過挖掘多機器人問題中的基礎圖結構,推動技術前沿的進步。

第一章
 本章將研究工作置于多機器人資源分配領域進行定位。首先提出多機器人資源分配問題的分類體系,沿任務表征抽象維度梳理問題建模與對應方法(1.3節)。隨后深入綜述推動本研究中覆蓋控制與任務分配工作的核心文獻(1.5與1.6節)。

第二章:基于圖神經網絡的多機器人覆蓋控制
 本章提出一種新型有限感知半徑多機器人覆蓋控制方法,相比傳統基線控制器,通過智能體間通信提升性能與魯棒性。我們在機器人通信網絡上部署圖神經網絡(GNN),訓練其預測中心化全知控制器的控制指令,從而獲得能通過智能體間通信應對覆蓋控制難題的控制器。實驗驗證該方法在性能、擴展性與泛化能力上的優勢。2.6節展示基于全球城市特征數據構建的覆蓋控制數據集,用于算法驗證。本研究首次將GNN學習控制器應用于多機器人覆蓋控制,展現該路徑的廣闊前景。

第三章:具備任務優先級關系的多機器人協調協作
 本章以新型建模框架與解法體系解決多機器人任務分配(MRTA)問題。提出"任務圖"建模框架:將任務抽象為圖節點,任務間優先級關系抽象為邊;構建包含任務關聯性能與編隊規模-任務效能關系的獎勵模型。該框架啟發基于網絡流優化的機器人任務分配解法,實驗表明其求解速度較現有方法提升數倍,且計算復雜度與機器人數量無關——可擴展至無限規模團隊。本研究對任務分配建模框架作出基礎性貢獻,實現求解速度的量級突破。

第四章:在線環境下的多機器人協調協作
 本章將任務圖模型與流解法擴展至在線環境,提升系統魯棒性與性能,并通過高精度仿真驗證。核心在于處理含不確定性的MRTA問題:任務可能隨機失敗或產生預期外獎勵。利用流解法的高速求解特性,建立迭代重規劃機制,依據已完成任務的獎勵觀測動態調整方案。實驗證明該方法在不確定性環境中顯著提升規劃性能,零誤差條件下亦因解空間擴展而優化。通過高精度城市多智能體仿真驗證離線/在線流解法,測量仿真物理現象衍生的任務獎勵。結果表明,本建模方法在復雜不確定任務中有效預測性能,且顯著優于文獻現有方法。在線機制增強系統魯棒性,使性能逼近最優,為任務分配領域后續研究提供極具潛力的框架。

付費5元查看完整內容

深度學習通過自動化關鍵任務并實現超越人類的準確度,已在多行業引發革命性變革。然而,這些優勢主要依賴部署于云端的巨型神經網絡,其能耗驚人。本論文提出兩類新型框架與算法,將深度學習模型部署邊界拓展至微型邊緣設備——此類設備通常在計算資源有限且環境噪聲復雜的場景下運行:

(1)高效邊緣AI新框架。開發了通過濾波器剪枝與高效網絡設計降低推理成本的方法。CUP框架提出層級濾波器聚類剪枝技術實現模型壓縮與加速;CMP-NAS框架構建視覺搜索系統,優化小型邊緣模型與大型服務器模型協同工作,在保持高精度前提下實現80倍計算成本削減。

(2)魯棒邊緣AI新方法。開發了在降低推理成本同時增強現實噪聲魯棒性的技術。REST框架擴展剪枝應用范圍,使網絡效率提升9倍、運行速度加快6倍,且具備對抗高斯噪聲與對抗樣本的魯棒性;HAR方法將多分支神經網絡的早期退出機制擴展至訓練階段,在類別不平衡最優精度,同時節省20%推理算力;IMB-NAS框架通過超網絡適配策略優化不平衡數據集的神經架構,相較從頭搜索節省5倍計算資源。

研究成果對工業界與社會產生重大影響:CMP-NAS技術支撐時尚與面部檢索服務的邊緣部署案例,在亞馬遜公司內部向數千名研發人員展示;REST技術通過手機實現居家睡眠監測功能,獲多家新聞媒體重點報道。

付費5元查看完整內容

當前集群無人系統(UxS)高度依賴人工操作支持。平臺有限的"智能"特性既制約其潛在價值又增加整體成本。亟需人工智能(AI)解決方案實現單人指揮大規模集群。受生物學啟發的牧群引導機制——通過少數牧羊犬控制大群綿羊——為此提供思路。通過設計扮演牧羊犬角色的AI代理,操作員可仿效牧民指揮生物牧羊犬的方式引導集群。具備情境感知能力的AI牧羊犬代理突破現有研究對集群同質性的限制假設,支持異質集群管理,并增強人機協作效能。 本研究提出本體論驅動的架構設計以增強集群控制代理的情境感知能力。該架構通過提升AI牧羊犬代理的情境認知,實現對異質化集群行為的特征提取與響應。配套方法與算法突破傳統研究局限,構建了新型集群行為引導框架。研究開發了系列量化指標與方法論,用于識別集群影響力源頭、區分異質代理行為特征,并設計AI算法實現行為模式識別。這些創新將推動新一代高自主性UxS構建更高效的人-集群協作系統(HSTs)。

群體代理同質性

傳統牧群引導研究普遍假設集群代理具有同質性,這構成顯著理論缺口[33]。現有集群控制代理設計主要基于三個同質假設:執行能力、感知能力及決策模型(包括行動決策與環境作用力向量生成)的一致性[14]。然而自然界普遍存在決策機制與能力異質的群體系統[34],機器人學界對此關注度持續提升[35]。隨著新型集群系統研究深入,生物啟發式方法必須考慮能力差異化的代理。但現有文獻中的控制代理普遍默認集群同質化,忽視代理機構與能力構成的差異性。本研究通過引入本體論指導分析指標選擇,開發可辨識集群代理機構的信息標記(第五章詳述),突破同質性假設桎梏。這些標記有助于解析代理間的社會層級結構,為認知能力增強的集群系統構建類人化組織架構奠定基礎。

群體控制代理態勢感知

通過有效提取與識別集群代理特征,可構建控制代理的態勢感知框架。傳統同質集群控制代理依賴特定情境要素(如集群質心空間分布[14]或連接性指標[36])制定控制策略。本研究創新性開發集群標記系統,通過識別代理隱含屬性推斷行為模式。這些標記聚焦影響控制策略選擇的關鍵要素:集群響應模式、影響力分布及其表現形式。通過賦予代理集群情境辨識與推理能力,控制代理可動態優化策略選擇。

群體控制代理情境感知

集群情境識別能力使控制代理可實施最優響應策略。本研究突破傳統系統在異質/同質集群場景下的自適應局限,集成行為調制模塊實現策略參數化配置與任務導向行為規劃。實驗證明,該架構顯著提升控制代理在異常場景下的魯棒性。以經典牧群引導模型為例,當集群圍繞目標點循環移動時,傳統系統需人工介入識別,而本研究通過整合目標距離與行為歷史數據至識別預測算法,實現自主異常檢測與應對。該方法為未來自主系統應對對抗場景等復雜態勢提供技術路徑。

付費5元查看完整內容

隨著人工智能(AI)的出現,基于個人經驗和判斷進行行動和思考的自主概念為未來的自主決策鋪平了道路。這種未來可以解決相互依存的多計算系統這一復雜領域的問題,而這些系統面臨的主要挑戰是,它們之間的相互作用會產生不可預測且往往不穩定的結果。為相互依存計算系統設想和設計人工智能驅動的自主性至關重要,它涵蓋了從物聯網(IoT)到網絡安全等各種用例。這可以通過克隆人類決策過程來實現,克隆過程要求人類在決定如何行動之前,先感知未知的隨機環境,執行行動,最后評估感知到的反饋。每個人都會根據自己的行為特征和推理,主觀地評估反饋是否令人滿意。上述步驟的重復迭代構成了人類的學習過程。因此,其核心思想是將人類的認知注入到相互依存的計算系統中,使其轉變為人工智能決策體,模仿人類的理性行為屬性,自主優化其主觀標準。

無人駕駛飛行器(UAV)或多接入邊緣計算服務器(MEC)等相互依賴的計算系統的快速發展帶來了海量數據和嚴格的服務質量(QoS)要求。當這些系統以自主方式行動時,它們會表現出競爭行為,因為每個系統都想自私地優化自己的主觀標準。這就引入了非合作環境中交互決策的概念,即每個系統的反饋都取決于其他系統可能相互沖突的行動。因此,本文利用博弈論來有效捕捉非合作環境中相互依賴的計算系統之間的戰略互動,并證明存在解決方案,即穩定的均衡點。均衡點被認為是穩定的解決方案,因為每個系統都沒有單方面改變自身行動的戰略動機。為了以分布式方式確定這些均衡點,我們采用了強化學習(RL)技術,該技術可使相互依存的自主計算系統在隨機環境中利用自身行動和經驗的反饋,通過試錯進行智能學習。此外,傳統的強化學習方法還加入了獎勵重塑技術,通過契約理論考慮自主互聯計算系統之間類似勞動經濟學的安排,并通過貝葉斯信念模型考慮它們的行為特征。同時利用博弈論和強化學習與獎勵重塑技術,是向自感知人工智能(SAAI)邁出的一步。本文證明,它極有可能成為構建基于人工智能的自主決策相互依賴計算系統的主要組成部分,并能有效地應用于各種應用領域。

圖 1.1: 總體決策框架

本文貢獻點

本文首先分析了所使用的數學工具的理論基礎。此外,除了傳統的單智能體環境,還引入了多個非集中式低復雜度框架,根據人工智能原理將相互依存的多智能體計算系統轉化為自主決策者。在多智能體應用環境中,提出了以第 1.1 節所述 IDU 約束為特征的非合作博弈,并應對了由此帶來的挑戰。具體來說,博弈論與強化學習的融合帶來了新穎的低復雜度分布式學習框架。此外,通過注入人類認知屬性,傳統的 RL 框架得到了豐富,從而使決策過程更加有效。證明了納什均衡點的存在,并表明基于人工智能的自主相互依存計算系統能夠接近這些均衡點,而無需集中式閉合解決方案。通過建模和仿真,在各種實際應用案例中對所提出的框架進行了評估。本論文的主要貢獻如下。

1.引入了新穎的低復雜度分布式決策框架,將傳統的資源有限、相互依賴的計算系統轉變為自主、智能的計算系統。我們研究了兩種情況: (a) 完整信息情景,即計算系統可以交換所有必要信息,并以分布式方式收斂到均衡點;以及 (b) 不完整信息情景,即利用強化學習讓智能相互依賴計算系統以自主方式接近均衡點。對這兩種情況下的運行性能進行了實證評估。

2.在處理非合作博弈的應用領域,通過證明博弈是潛在的或子/超模的方式,用數學方法證明納什均衡點的存在。如果環境是完全可觀察的,則采用傳統的閉式求解方法,如最佳響應動力學,反之,則采用各種強化學習算法,從經驗上接近納什均衡點。

3.通過利用契約理論和貝葉斯信念,將人類認知和行為特征分別納入決策框架。此外,當在信息不對稱的環境中運用契約理論時,提供了優化問題的閉式激勵解的完整證明,這反過來又從一個非凸問題正式轉化為一個凸問題。通過適當地將這些人類意識屬性納入獎勵重塑的強化學習框架,計算系統可以自主優化其主觀目標并做出有效決策。這是向增強型自我意識人工智能邁出的一步。

4.除了多智能體設置,還將強化學習應用于單智能體問題,例如離線深度強化學習,表明基于 RL 的決策智能體比許多替代策略(例如基于機器學習(ML)的方法)能帶來更好的結果。

5.通過在廣泛的應用領域進行大規模模擬,對所提出的決策方法進行了實證評估,突出了這些方法的主要操作特點。此外,還引用了與其他方法的詳細比較評估,強調了所引入框架的優越性。

圖 3.7:移動邊緣計算中的人工智能無人機數據卸載框架

付費5元查看完整內容

異構多智能體系統為解決農業、軍事、裝配和倉庫自動化等不同領域的復雜問題提供了可能,否則單個智能體是無法解決這些問題的。要有效部署異構多機器人團隊,研究必須解決不同抽象程度的四個問題:任務規劃(是什么)、運動規劃(如何)、任務分配(誰)和調度(何時)。這些問題高度相互依存,先前的工作已經證明,利用這些問題的單個解決方案之間的協同作用的系統可以提高多機器人協調的效率和效益。

本文研究了在多智能體組隊應用中使用基于特質的模型來表示單個智能體,以及如何利用基于特質的建模來實現更穩健、更高效的多智能體聯盟組建解決方案。具體來說,我們研究了如何在聯盟組建算法中使用這些技術來回答任務分配、調度、運動規劃和任務規劃這四個問題。

我們的研究表明,利用基于機器人和任務特質建模的算法可以在異構多機器人團隊中實現高效的協調,并且在時間進度、分配質量和計算效率方面優于現有方法。本論文的貢獻如下:

  • 創建一個建模框架,使現代任務分配算法能夠推理動態特征。通過使用基于轉換的建模框架,我們創建了對以往基于特質的建模技術的擴展,以更好地推理智能體的特質如何隨時間變化。

  • 為異構多機器人系統開發基于時間擴展特質的任務分配和路徑規劃統一框架。我們引入了一種基于搜索的方法,用于基于特質的時間擴展任務分配和運動規劃,命名為增量任務分配圖搜索(ITAGS)。

  • 整合任務規劃、任務分配、調度和運動規劃的新型多機器人協調問題的形式化和解決方案。我們形式化了一類新的多機器人協調問題,該問題融合了這些問題中的每一個,并提出了一種解決方案(圖形遞歸同步任務分配、規劃和調度(GRSTAPS))。

  • 為 ITAGS 的動態變體創建框架,該變體能夠進行基于特征的任務分配修復: 我們對 ITAGS 進行了擴展,使用基于特質的動態時間擴展任務分配算法,如果智能體的特質或任務要求在執行過程中發生變化,該算法可以修復任務分配。

  • 創建一個主動學習框架,用于學習多智能體任務分配問題的特質要求: 由于理解一個聯盟的特質與該聯盟在特定任務中的表現之間的關系可能具有挑戰性,因此我們提出了一種主動學習框架來學習任務與特質之間的關系。此外,我們還提供了一種新的時間擴展任務分配算法,該算法能夠優化學習到的質量模型。

圖 2.1: 顯示各種多機器人協調問題交叉點的維恩圖。

付費5元查看完整內容

現有的決策計算模型往往局限于特定的實驗設置。造成這種限制的主要原因是無法捕捉決策者對情況的不確定性。本文提出了一個計算框架,用于研究神經科學和心理學中不確定情況下的決策制定。框架主要側重于決策者對世界狀況的概率評估,即他們的 “信念”。具體來說,它基于部分可觀測馬爾可夫決策過程(POMDPs),結合貝葉斯推理和獎勵最大化來選擇行動。利用感知決策和社會決策方面的各種實驗數據,證明了基于信念的決策框架的可行性。框架解釋了感知決策實驗中決策者的實際表現與他們對實際表現的信念(即決策信心)之間的關系。它還說明了為什么在許多情況下這種評估會偏離現實。這種偏差通常被解釋為次優決策的證據,或選擇和信心的不同過程。我們的框架對這些解釋提出了挑戰,它表明,一個優化收益的規范貝葉斯決策者也會產生同樣的偏差。此外,在定量預測人類在社會決策任務中的行為方面,方法優于現有模型,并提供了對潛在過程的洞察。結果表明,在涉及大型群體的決策任務中,人類采用貝葉斯推理來模擬 “群體心理”,并對他人的決策做出預測。最后,將方法擴展到關于他人的多個推理層次(心智理論層次),并將服從作為群體決策的一種策略聯系起來。這個擴展框架可以解釋人類在各種集體群體決策任務中的行為,為大型群體中的合作與協調提供了新的理論。

圖 1.1: 基于信念的決策框架。智能體通過行動、觀察和獎勵與世界互動。智能體無法完全觀測到世界的狀態,只能根據觀測結果和智能體的內部世界模型,以概率方式表示世界的狀態。智能體的目標是根據當前狀態的概率分布來制定策略,即所謂的信念

付費5元查看完整內容
北京阿比特科技有限公司