亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

摘要

多智能體影響圖 (MAID) 是一種流行的圖形模型形式,對于某些類別的博弈,與傳統的擴展形式博弈 (EFG) 表示相比,它已被證明具有關鍵的復雜性和可解釋性優勢。在本文中,我們擴展了先前關于 MAID 的工作,通過引入 MAID 子博弈的概念,以及子博弈完美和顫抖手完美均衡進行改進。然后,我們證明了 MAID 和 EFG 之間的幾個等價結果。最后,我們描述了一個用于推理 MAID 和計算它們的均衡的開源實現。

引言

多智能體影響圖 (MAID) 是非合作博弈的緊湊且富有表現力的圖形表示。由 Koller 和 Milch(以下稱為 K&M)[14, 19] 介紹,與經典的廣泛形式博弈 (EFG) 表示相比,它們提供了三個關鍵優勢。首先,MAID 可以比 EFG 更簡潔地描述許多博弈,尤其是那些信息不完整的博弈。其次,MAID 對變量之間的條件獨立性進行編碼。這意味著大型 MAID 通常可以分解為幾個較小的 MAID,從而可能會以指數級速度加速尋找納什均衡 [14]。第三,MAID 通常可以明確表示在 EFG 中模糊的博弈結構方面。雖然可以將任何 EFG 轉換為最多相同大小的 MAID(第 3.3.2 節),但確實 EFG 有時更適合建模非對稱決策問題。話雖如此,每個模型都有其弱點,特定表示的有用程度取決于其優勢。我們進一步開發了 MAID 的理論和實踐工具,以使研究人員和從業人員都能充分發揮他們的優勢。

以前關于 MAID 的工作集中在納什均衡作為核心解決方案概念 [20]。雖然這可以說是非合作博弈論中最重要的解決方案概念,但如果有許多納什均衡,我們通常希望刪除一些不太“理性”的。已經提出了對納什均衡的許多改進[17],其中最重要的兩個是子博弈完美納什均衡[26]和顫抖手完美均衡[27]。第一個排除“不可信”的威脅,第二個要求每個玩家在其他玩家犯小錯誤時仍然在做出最佳反應。在實際方面,雖然有很多軟件用于普通或擴展形式的博弈,但沒有這樣的實現來推理表示為 MAID 的博弈,盡管它們具有計算優勢。

貢獻

在本文中,我們做出以下貢獻。首先,我們通過引入 MAID 子博弈的概念(第 3.1 節)來擴展 MAID 的適用性,并在此概念的基礎上引入子博弈完美和顫抖手完美平衡改進(第 3.2 節)。其次,我們證明了 MAID 和 EFG 之間的幾個等價結果,證明了在將 EFG 表示為 MAID 時保留了上述關鍵博弈論概念,從而進一步證明了使用該模型的合理性。這些證明是建設性的,并且基于 EFG 和 MAID 之間的轉換程序,其全部細節包含在附錄 A.1 和 A.2 中。第三,我們報告了我們的開源代碼庫,用于計算我們在 MAID 中的平衡改進(第 4 節)。

付費5元查看完整內容

相關內容

博弈論(Game theory)有時也稱為對策論,或者賽局理論,應用數學的一個分支,目前在生物學、經濟學、國際關系、計算機科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。主要研究公式化了的激勵結構(游戲或者博弈)間的相互作用。是研究具有斗爭或競爭性質現象的數學理論和方法。也是運籌學的一個重要學科。

摘要

我們為網絡上的多智能體影響博弈提供了一種多項式時間的、可擴展的均衡計算算法,將 Bindel、Kleinberg 和 Oren (2015) 的工作從單智能體擴展到多智能體場景。在影響力博弈中,智能體具有有限的宣傳預算來影響某些網絡中節點對其初始傾向,但節點的最終決策取決于網絡上 DeGroot 意見動態的靜止狀態。在多智能體系統中,智能體應該如何花費他們的預算來傳播網絡,以最大限度地利用它們來預測其他宣傳智能體和網絡動態?我們證明了這個博弈的納什均衡是純粹的并且(在弱假設下)是唯一的,并且可以在多項式時間內計算;我們通過使用鏡像下降計算隨機圖上的兩個智能體案例的均衡來測試我們的模型。

圖 1:頂部圖顯示均衡時預算的百分比變化(來自統一策略);節點按它們在鄰接矩陣的第二個特征向量中的分量排序,反映了圖結構。底部圖說明了均衡計算算法的收斂速度。紅色和藍色節點用點突出顯示。從左到右:1000 個節點和度參數為 3 的 Barabasi-Albert 圖,10000 個節點和度參數為 3 的 Barabasi-Albert 圖,以及 1000 個節點,初始度為 3,重連概率為 0.2 的 WattsStrogatz 圖。

付費5元查看完整內容

我們設計并實現了一個Python庫,以一種高效、可擴展和簡單的方式,幫助非專業人士使用所有這些強大的工具,并將其整合到數據科學家、實踐者和應用研究人員的工作流程中。這個庫中實現的算法在設計時考慮到了可用性和GPU效率,它們可以添加到任何PyTorch模型中,只需要額外的一行代碼。我們展示了這些工具在時間序列分析設置的流形優化應用上的有效性。在這種情況下,使用正交和幺正優化來約束和正則化循環模型,避免消失和爆炸梯度問題。為GeoTorch設計的算法允許我們在該系列模型的標準測試中實現最先進的結果。我們使用比較幾何中的工具來給出優化問題中感興趣的量的邊界。特別地,我們建立在(Kaul 1976)的工作之上,給出黎曼指數二階導數的范數的明確界限。

付費5元查看完整內容

摘 要
 人工智能體在我們的世界中的流行提高了確保它們能夠處理環境的顯著屬性的需求,以便計劃或學習如何解決特定任務。

第一個重要方面是現實世界的問題不限于一個智能體,并且通常涉及在同一環境中行動的多個智能體。此類設置已被證明難以解決,其中一些示例包括交通系統、電網或倉庫管理。此外,盡管許多問題域固有地涉及多個目標,但這些多智能體系統實現中的大多數旨在優化智能體相對于單個目標的行為。通過對決策問題采取多目標視角,可以管理復雜的權衡;例如,供應鏈管理涉及一個復雜的協調過程,用于優化供應鏈所有組件之間的信息和物質流。

在這項工作中,我們關注這些突出的方面,并討論當涉及多個智能體時,如何將人工智能體的決策和學習過程形式化,并且在該過程中需要考慮多個目標。為了分析這些問題,我們采用了基于效用的觀點,主張在相互競爭的目標之間做出妥協,應該基于這些妥協對用戶的效用,換句話說,它應該取決于結果的可取性。

我們對多目標多智能體決策 (MOMADM) 領域的分析表明,迄今為止該領域已經相當分散。因此,對于如何識別和處理這些設置還沒有統一的看法。作為第一個貢獻,我們開發了一種新的分類法來對 MOMADM 設置進行分類。這使我們能夠提供該領域的結構化視圖,清楚地描述當前多目標多智能體決策方法的最新技術,并確定未來研究的有希望的方向。

在多目標多智能體系統的學習過程中,智能體接收一個值列表,每個分量代表不同目標的性能。在自利智能體人的情況下(即,每個人都可能對目標有不同的偏好),在相互沖突的利益之間尋找權衡變得非常簡單。作為第二個貢獻,我們繼續分析和研究不同多目標優化標準下的博弈論均衡,并提供有關在這些場景中獲得此類解決方案的存在和條件的理論結果。我們還表明,在某些多目標多智能體設置中,納什均衡可能不存在。

當決策過程中的每個參與者都有不同的效用時,智能體了解其他人的行為就變得至關重要。作為最后的貢獻,我們首次研究了對手建模對多目標多智能體交互的影響。我們提供了新穎的學習算法,以及將對手行為建模和學習與對手學習意識相結合的擴展(即,在預測一個人對對手學習步驟的影響的同時進行學習)。實證結果表明,對手的學習意識和建模可以極大地改變學習動態。當存在納什均衡時,對手建模可以為實現它的智能體帶來顯著的好處。當沒有納什均衡時,對手學習意識和建模允許智能體仍然收斂到有意義的解決方案。

提 綱
1 引言
 1.1 多智能體與多目標 1.2 激勵示例 1.3 研究目標和貢獻 1.3.1 貢獻 1.4 論文結構

2 多目標多智能體系統
 2.1 強化學習 2.1.1 基于價值的方法 2.1.2 策略梯度和演員評論家 2.2 多智能體決策理論 2.2.1 標準形式博弈與均衡 2.3 單智能體多目標決策 2.3.1 工具函數 2.3.2 多目標優化標準 2.3.3 應用案例場景 2.4 多智能體多目標決策 2.4.1 多目標隨機博弈 2.4.2 特殊案例模型 2.4.3 多目標標準博弈 2.4.4 MONFG優化標準 2.5 總結

3 構建多目標多智能體決策域
 3.1 執行階段 3.1.1 團隊獎勵 3.1.2 個體獎勵 3.2 解決方案概念 3.2.1 策略 3.2.2 覆蓋集合 3.2.3 均衡 3.2.4 ε近似納什均衡 3.2.5 聯盟形式與穩定概念 3.2.6 社會福利與機制設計 3.2.7 其他解決方案的概念 3.3 總結

4 多目標多智能體場景均衡
 4.1 MONFG計算均衡 4.1.1 定義 4.1.2 理論分析 4.1.3 用于SER分析的附加博弈 4.2 實驗 4.2.1 Game 1 - The (Im)balancing Act Game 4.2.2 Game 2 - The (Im)balancing Act Game without action M 4.2.3 Game 3 - A 3-action MONFG with pure NE 4.3 總結

5 多目標多智能體場景中的對手建模
 5.1 背景 5.1.1 對手建模 5.2 MONFG中的對手建模 5.2.1 對手學習意識和建模使用高斯過程 5.2.2 MONFG評價器 5.2.3 MONFG策略梯度方法 5.3 實驗設置與結果 5.3.1 完整信息設置 - MO-LOLA vs. MO-LOLA 5.3.2 無信息設置 5.4 總結

6 結論
6.1 討論 6.2 未來研究方向
 6.2.1 優化標準和解決方案概念 6.2.2 ESR計劃、強化學習與SER博弈論 6.2.3 對手建模和建模對手效用 6.2.4 互動研究方法 6.2.5 深度多目標多智能體決策 6.2.6 更廣泛的適用性

付費5元查看完整內容

最近在提升推理領域的進展,它利用了關系概率模型固有的結構。

統計關系人工智能(StaRAI)研究了不確定性條件下的推理與個體推理和關系推理的集成。使用的表示通常被稱為關系概率模型。提升推理是關于如何利用關系概率模型中固有的結構,無論是通過它們的表達方式,還是通過從觀察中提取結構。這本書涵蓋了提升推理領域最近的重大進展,提供了一個統一的介紹,這是一個非常活躍的領域。

在提供了有關概率圖模型、關系概率模型和學習這些模型的必要背景之后,本書轉向提升推理,首先涵蓋精確推理,然后是近似推理。此外,這本書考慮了可提升性的理論和在關系領域的行動,這允許在關系領域的學習和推理的聯系。

付費5元查看完整內容

這本書的目的是提供一個從零開始全面的貝葉斯優化介紹,并細致闡述所有關鍵的想法。目標受眾是機器學習、統計和相關領域的研究生和研究人員。然而,我也希望來自其他領域的從業者和研究人員能在這里找到一些用處。

//bayesoptbook.com/

本書分為三個主要部分,包括:

  • 高斯過程建模的理論與實踐,
  • Bayesian方法用于序列決策
  • 實現切實有效的優化策略。

還包括一些其他的主題:

  • 理論收斂結果的概述,
  • 一項關于引人注目的擴展的調研,
  • 貝葉斯優化的全面歷史
  • 應用的帶注釋的參考書目。

目錄內容: Introduction Gaussian Processes Modeling with Gaussian Processes Model Assessment, Selection, and Averaging Decision Theory for Optimization Utility Functions for Optimization Common Bayesian Optimization Policies Computing Policies with Gaussian Processes Implementation Theoretical Analysis Extensions and Related Settings A Brief History of Bayesian Optimization

引言概述

在機器學習的背景下,貝葉斯優化是一個古老的想法。盡管貝葉斯優化的歷史已經很長,但在過去的十年里,它經歷了一段復興和快速發展的時期。這種復興的主要驅動力是計算方面的進步,這使得貝葉斯建模和推理的工具越來越復雜。

這本書的目的是提供一個從零開始的全面的貝葉斯優化介紹,并細致闡述所有的關鍵思想。這種自下而上的方法允許我們在貝葉斯優化算法中確定統一的主題,這些主題可能在以往的調研文獻時丟失。

這本書分為三個主要部分。第2-4章涵蓋了高斯過程建模的理論和實踐方面。這類模型是貝葉斯優化文獻中最受歡迎的,其中包含的材料對接下來的幾章至關重要。

第5-7章介紹了序列決策理論及其在優化中的應用。雖然這個理論需要一個目標函數的模型和我們對它的觀察,介紹是不可知的模型的選擇,可以獨立地閱讀前幾章的高斯過程。這些內容是在第8-10章中介紹的,討論了使用高斯過程模型的貝葉斯優化的細節。第8-9章討論了計算和實現的細節,第10章討論了貝葉斯優化算法的理論性能界限,其中大多數結果密切依賴于目標函數的高斯過程模型或相關的重新生成核希爾伯特空間。

一些應用的細微差別需要修改基本序列優化方案(這是前幾章的重點),第11章介紹了對這一基本設置的幾個值得注意的擴展。每一個都是通過貝葉斯決策理論的統一視角系統地呈現出來的,以說明一個人在面對新情況時應該如何處理。最后,第12章提供了一個簡單和獨立的貝葉斯歷史介紹。

付費5元查看完整內容

在過去的幾十年里,組合優化和圖論——作為組合學的整個領域——經歷了特別快速的發展。這一事實有多種原因;一個是,例如,應用組合論證已經變得越來越普遍。然而,數學之外的兩個發展可能更為重要:首先,組合優化的許多問題直接產生于工程和管理的日常實踐:確定交通或通信網絡中最短或最可靠的路徑,最大或相容的流量,或最短的線路;規劃交通網絡的連接;協調項目;解決供需問題。第二,隨著越來越高效的計算機系統的發展,那些屬于運籌學的任務的實際實例已經可以得到。此外,組合優化問題對復雜性理論也很重要,復雜性理論是數學和理論計算機科學的交叉領域,涉及算法分析。組合優化是數學中令人著迷的一部分,它的魅力——至少對我來說——很大程度上來自于它的跨學科性和實用性。本書主要介紹了可以用圖論方法表述和處理的組合優化部分;既不考慮線性規劃理論,也不考慮多面體組合理論。

//www.springer.com/gp/book/9783642322778

付費5元查看完整內容

貝葉斯范式有潛力解決深度神經網絡的核心問題,如校準差和數據效率低。唉,將貝葉斯推理擴展到大權重空間通常需要限制性的近似。在這項工作中,我們證明,為了獲得準確的預測后驗,對模型權重的一個小子集進行推理是足夠的。其他權重保留為點估計值。這個子網絡推理框架使我們能夠在這些子集上使用表達性的,否則難以處理的后驗近似。特別地,我們將子網絡線性化拉普拉斯作為一種簡單的、可擴展的貝葉斯深度學習方法來實現:我們首先獲得所有權重的MAP估計,然后使用線性化拉普拉斯近似來推斷子網絡上的全協方差高斯后程。我們提出了一種子網絡選擇策略,旨在最大限度地保持模型的預測不確定性。

付費5元查看完整內容

【導讀】牛津大學的博士生Oana-Maria Camburu撰寫了畢業論文《解釋神經網絡 (Explaining Deep Neural Networks)》,系統性介紹了深度神經網絡可解釋性方面的工作,值得關注。

作者介紹:

Oana-Maria Camburu,來自羅馬尼亞,目前是牛津大學的博士生,主修機器學習、人工智能等方向。

Explaining Deep Neural Networks

深度神經網絡在計算機視覺、自然語言處理和語音識別等不同領域取得了革命性的成功,因此越來越受歡迎。然而,這些模型的決策過程通常是無法向用戶解釋的。在各種領域,如醫療保健、金融或法律,了解人工智能系統所做決策背后的原因至關重要。因此,最近研究了幾個解釋神經模型的方向。

在這篇論文中,我研究了解釋深層神經網絡的兩個主要方向。第一個方向由基于特征的事后解釋方法組成,也就是說,這些方法旨在解釋一個已經訓練過的固定模型(事后解釋),并提供輸入特征方面的解釋,例如文本標記和圖像的超級像素(基于特征的)。第二個方向由生成自然語言解釋的自解釋神經模型組成,也就是說,模型有一個內置模塊,為模型的預測生成解釋。在這些方面的貢獻如下:

  • 首先,我揭示了僅使用輸入特征來解釋即使是微不足道的模型也存在一定的困難。我表明,盡管有明顯的隱含假設,即解釋方法應該尋找一種特定的基于真實值特征的解釋,但對于預測通常有不止一種這樣的解釋。我還展示了兩類流行的解釋方法,它們針對的是不同類型的事實基礎解釋,但沒有明確地提及它。此外,我還指出,有時這兩種解釋都不足以提供一個實例上決策過程的完整視圖。

  • 其次,我還介紹了一個框架,用于自動驗證基于特征的事后解釋方法對模型的決策過程的準確性。這個框架依賴于一種特定類型的模型的使用,這種模型有望提供對其決策過程的洞察。我分析了這種方法的潛在局限性,并介紹了減輕這些局限性的方法。引入的驗證框架是通用的,可以在不同的任務和域上實例化,以提供現成的完整性測試,這些測試可用于測試基于特性的后特殊解釋方法。我在一個情緒分析任務上實例化了這個框架,并提供了完備性測試s1,在此基礎上我展示了三種流行的解釋方法的性能。

  • 第三,為了探索為預測生成自然語言解釋的自解釋神經模型的發展方向,我在有影響力的斯坦福自然語言推斷(SNLI)數據集之上收集了一個巨大的數據集,數據集約為570K人類編寫的自然語言解釋。我把這個解釋擴充數據集稱為e-SNLI。我做了一系列的實驗來研究神經模型在測試時產生正確的自然語言解釋的能力,以及在訓練時提供自然語言解釋的好處。

  • 第四,我指出,目前那些為自己的預測生成自然語言解釋的自解釋模型,可能會產生不一致的解釋,比如“圖像中有一只狗。”以及“同一幅圖片中沒有狗”。不一致的解釋要么表明解釋沒有忠實地描述模型的決策過程,要么表明模型學習了一個有缺陷的決策過程。我將介紹一個簡單而有效的對抗性框架,用于在生成不一致的自然語言解釋時檢查模型的完整性。此外,作為框架的一部分,我解決了使用精確目標序列的對抗性攻擊的問題,這是一個以前在序列到序列攻擊中沒有解決的場景,它對于自然語言處理中的其他任務很有用。我將這個框架應用到e-SNLI上的一個最新的神經模型上,并表明這個模型會產生大量的不一致性。

這項工作為獲得更穩健的神經模型以及對預測的可靠解釋鋪平了道路。

地址: //arxiv.org/abs/2010.01496

付費5元查看完整內容

題目: Unsupervised Multi-Class Domain Adaptation: Theory, Algorithms, and Practice

摘要:

本文研究了無監督多類域自適應理論,這是最近一些算法的基礎,這些算法的學習目標僅僅是由經驗驅動的。多類得分不一致(MCSD)分歧是通過聚合多類分類中的絕對裕度違規來表示的;所提出的MCSD能夠充分表征任何一對多類得分假設之間的關系。通過使用MCSD作為域距離的度量,我們為多類UDA開發了一個新的域適配邊界以及它的依賴于數據的(可能是近似正確的)邊界,這自然地提出了對抗性的學習目標來對齊源域和目標域的條件特征分布。因此,一個多類領域對抗學習網絡(McDalNets)的算法框架被開發出來,它通過學習目標的不同實例與最近流行的一些方法相一致或相似,從而(部分地)強調了它們的實際有效性。在多類UDA理論的基礎上,提出了一種新的域對稱網絡(SymmNets)算法。Symmnet提供了簡單的擴展,這些擴展在封閉集、部分集或開放集UDA的問題設置下都可以很好地工作。我們進行了仔細的實證研究,把不同的算法的McDalNets和我們的新推出的SymmNets相比較。實驗結果驗證了理論分析的正確性和有效性。

付費5元查看完整內容

本書簡介:

這本書介紹了數據類型(簡單和結構化)和算法與圖形和文本的解釋。在下一節中,您將介紹簡單和復雜的標準算法及其流程圖:所有內容都與解釋和表集成在一起,以提供算法的逐步發展。

主要的算法有:循環中三個或n個數字的和、十進制到二進制的轉換、最大和最小搜索、線性/順序搜索、二進制搜索、冒泡排序、選擇排序、兩個排序數組的合并、從文件中讀取字符、堆棧管理、階乘和斐波那契序列。

C語言算法介紹的最后一部分是C語言的介紹和代碼的實現,這部分是與所研究的算法相關的。這本書充滿了屏幕截圖和說明代碼意義的插圖。

你會學到什么

  • 在C語言中實現算法
  • 處理變量、常量、基本類型和結構化類型
  • 使用數組、堆棧、隊列、圖、樹、散列表、記錄和文件
  • 探索算法的設計
  • 解決搜索問題,包括二分查找、排序和冒泡/選擇排序
  • 用階乘函數和斐波那契數列編制遞歸算法

這本書是給誰看的

初級入門:對于任何第一次學習計算機科學和信息系統的人來說,它都是一個起點。

目錄:

付費5元查看完整內容
北京阿比特科技有限公司