第21屆智能體及多智能體系統國際會議(International Joint Conference on Autonomous Agents and Multi-Agent Systems, AAMAS-2020)近日在線舉行。智能體及多智能體系統國際會議(AAMAS) 是多智能體系統領域最具影響力的會議之一,由非營利組織IFAAMAS主辦。來自佐治亞理工大學Matthew Gombolay和Zheyuan Wang共同講述了圖神經網絡解決多機器人協調問題的能力,非常值得關注!
機器人隊越來越多地部署在生產設施和倉庫等環境中,以節省成本和提高生產率。為了有效地協調多機器人隊,快速、高質量的調度算法必須滿足動態任務規范、部件和機器人可用性在時間和空間上的約束。傳統的解決方案包括精確的方法,這對于大規模問題是棘手的,或者特定應用的啟發式,這需要專業的領域知識。迫切需要的是一種新的自動化方法,它可以自動學習輕量級的、特定于應用的協調策略,而不需要手工設計的特征。 本教程介紹了圖神經網絡,并展示了圖神經網絡解決多機器人協調問題的能力。本文綜述了近年來各種圖神經網絡的框架,重點討論了它們在多智能體系統建模中的應用。我們將介紹多機器人協調(MRC)問題,并回顧解決MRC問題最相關的方法。我們將討論圖神經網絡在MRC問題中的幾個成功應用,并以Python示例代碼的形式提供實踐教程。通過本教程,我們旨在提供使用圖神經網絡建模多機器人系統的經驗,從算法開發到代碼實現,從而為在更廣泛的多智能體研究中設計基于圖的學習算法打開未來的機會。
//core-robotics.gatech.edu/2022/01/18/aamas2022_tutorial_gnn_robot/
第一部分將討論以下內容: (a) 圖神經網絡是如何工作的——我們將全面概述以往文獻中提出的各種圖神經網絡,包括同質圖和異質圖以及注意力機制; (b) 如何用圖神經網絡為團隊協調問題建模——我們將討論哪些應用可以用圖神經網絡建模,重點是MRC問題;(c)如何為團隊協調問題優化圖神經網絡的參數-我們將討論哪些學習方法可以用于訓練基于圖神經網絡的求解器。我們以最常見的挑戰和開放問題來結束本部分。
第二部分將提供一個實際操作教程,介紹如何使用圖神經網絡來解決協調問題,并在Python Jupyter筆記本中編寫示例。特別地,我們將研究ScheduleNet架構[6],這是一個基于異構圖神經網絡的求解器,用于在時間和空間約束下解決MRC問題。Jupyter將工作通過模型實現,訓練和評估的ScheduleNet模型在合成數據集。
**講者介紹: **
Matthew Gombolay博士是佐治亞理工學院交互計算專業的助理教授。他于2011年獲得約翰霍普金斯大學(the Johns Hopkins University)機械工程學士學位,2013年獲得麻省理工學院(MIT)航空航天學碩士學位,2017年獲得麻省理工學院(MIT)自主系統博士學位。Gombolay的研究興趣涵蓋機器人、人工智能/ML、人機交互和運行學。在答辯論文和加入喬治亞理工學院之間,Gombolay博士曾在麻省理工學院林肯實驗室(MIT Lincoln Laboratory)擔任技術人員,并將他的研究工作轉化到美國海軍,為他贏得了R&D 100獎。他的發表記錄包括美國航空航天學會的最佳論文獎,美國控制會議的最佳學生論文決賽,以及機器人學習會議的最佳論文決賽。2018年,Gombolay博士被選為DARPA Riser ,獲得了國家消防研討會的早期職業獎第一名,并因提高太空科學自主性而獲得了NASA的早期職業獎學金。
Zheyuan Wang,佐治亞理工學院電氣與計算機工程學院博士研究生。他在上海交通大學(Shanghai Jiao Tong University)獲得電氣工程學士學位和碩士學位。他還獲得了佐治亞理工學院ECE的碩士學位。他目前是由Matthew Gombolay教授領導的認知優化和關系(CORE)機器人實驗室的研究生研究助理。他目前的研究方向是基于圖的策略學習,利用圖神經網絡進行表示學習和強化學習進行決策,應用于人-機器人團隊協作、多智能體強化學習和隨機資源優化。
內容概覽
參考文獻:
Ernesto Nunes, Marie Manner, Hakim Mitiche, and Maria Gini. 2017. A taxonomy for task allocation problems with temporal and ordering constraints. Robotics and Autonomous Systems 90 (2017), 55–70. 1. Petar Veli?kovi?, Guillem Cucurull, Arantxa Casanova, Adriana Romero, Pietro Liò, and Yoshua Bengio. 2018. Graph attention networks. International Conference on Learning Representations (2018). 1. Xiao Wang, Houye Ji, Chuan Shi, Bai Wang, Yanfang Ye, Peng Cui, and Philip S Yu. 2019. Heterogeneous graph attention network. The World Wide Web Conference (2019), 2022–2032. 1. Jie Zhou, Ganqu Cui, Shengding Hu, Zhengyan Zhang, Cheng Yang, Zhiyuan Liu, Lifeng Wang, Changcheng Li, and Maosong Sun. 2020. Graph neural networks: A review of methods and applications. AI Open 1 (2020), 57-81. 1. Zheyuan Wang and Matthew Gombolay. 2020. Learning scheduling policies for multi-robot coordination with graph attention networks. IEEE Robotics and Automation Letters 5, 3 (2020), 4509–4516. 1. Zheyuan Wang, Chen Liu, and Matthew Gombolay. 2021. Heterogeneous graph attention networks for scalable multi-robot scheduling with temporospatial constraints. Autonomous Robots (2021), 1–20.
智能體隊通常必須以一種分布式的方式協調他們的決策,以實現個體和共享的目標。示例包括面向服務的計算、傳感器網絡問題和智能設備協調家庭問題。這類問題可以形式化并以不同的方式求解,但一般來說,多智能體協調過程是非易的,NP -難求解的。
在本多智能體分布式約束優化教程中,我們將討論在多智能體系統(MAS)文獻中提出的處理協調問題的兩種基本方法,一種基于分布式約束優化問題(DCOPs),另一種基于聯盟形成(CF)。
在第一部分中,我們將介紹關于DCOP的核心概念和模型的可訪問的和結構化的概述。我們還將闡述解決DCOP的最優和次優方法。
在第二部分,我們將討論用于MAS建模的核心概念,即特征函數博弈(CFGs),以及在無約束和有約束的CFGs中,哪些最優和近似的方法可以形成聯盟。我們將通過在第一部分和第二部分之間建立一個有趣的聯系來結束這一部分,展示如何使用約束優化問題(cop)來解決CF問題。
最后,我們將邀請與會者對來自實際應用的一些示例問題進行建模,并討論相關的解決方法。本文將概述python庫pyDCOP中的一些代碼和可執行示例。本教程將以最常見的挑戰和開放問題結束。
//www.gauthier-picard.info/dcop-tutorial/#outline-short-description
一、教程說明:
在共享環境中導航智能體團隊是許多現有和新興應用領域的一個重要問題。示例包括倉庫物流、郵件分揀、自主交叉口管理和無人機群的協調。在每種情況下,從業者都必須解決一個具有挑戰性的組合問題,即多智能體路徑查找 (MAPF)。關于這個主題的研究經常出現在人工智能的文獻和旗艦會議的會議記錄中,例如 AAAI。這些工作也引起了鄰近領域的研究人員的興趣,例如機器人和離散優化。
在本教程中,我們建議概述 MAPF 的核心問題并總結這個快速發展的研究領域的最新進展。我們的目標是提供一個涵蓋理論基礎和實際算法的整體視角:用于規劃、執行和處理實踐中常見的各種運營問題。我們的目標受眾是任何對規劃和協調多智能體感興趣的人。本教程將特別有益于對 MAPF 及其許多應用程序感興趣的人。
二、教程大綱: 1、MAPF 概述(slides)
2、規劃 ( slides-part-1 , slides-part-2 )
3、執行(slides)
4、可擴展性(slides-part-1,slides-part-2)
5、總結和機會(slides)
有各種各樣的NLP問題可以用圖結構最好地表達。基于圖的深度學習技術(即圖神經網絡(GNNs))在建模非歐氏數據(如圖)方面的巨大優勢,為解決具有挑戰性的圖類NLP問題打開了一扇新的大門,并取得了巨大的成功。盡管取得了成功,但在圖上的深度學習(DLG4NLP)仍然面臨許多挑戰(如自動圖的構造、復雜圖的圖表示學習、復雜數據結構之間的映射學習)。
本教程將介紹深度學習技術在自然語言處理中的應用,包括自然語言處理的自動圖構造、自然語言處理的圖表示學習、自然語言處理的基于GNN的高級模型(如graph2seq和graph2tree),以及GNN在各種自然語言處理任務中的應用(如機器翻譯、圖像處理和圖像處理)。自然語言生成、信息提取和語義解析)。此外,還將包括實踐演示會議,以幫助聽眾獲得應用GNNs解決具有挑戰性的NLP問題的實際經驗——使用我們最近開發的開源庫Graph4NLP,這是第一個為研究人員和實踐者提供的用于各種NLP任務的輕松使用GNNs的庫。
要實現人工智能的夢想,就需要學會做出正確決策的自主系統。強化學習是這樣做的一個強大范式,它與大量的任務相關,包括機器人、游戲、消費者建模和醫療保健。本課程將提供強化學習領域的充實介紹,學生將學習強化學習的核心挑戰和方法,包括推廣和探索。通過講課、書面作業和編碼作業的結合,學生將學習RL的關鍵思想和技術。作業將包括強化學習的基礎知識以及深度強化學習——一個結合了深度學習技術和強化學習的極具前景的新領域。
學生能夠學習到:
內容目錄:
1 Introduction to Reinforcement Learning
2 Tabular MDP planning
3 Tabular RL policy evaluation
4 Q-learning
5 RL with function approximation
6 Policy search
7 Fast Learning
8 Batch Reinforcement Learning
本教程將是關于無監督學習和強化學習的交叉。隨著自然語言處理中基于語言模型的預訓練和計算機視覺中的對比學習的出現,無監督學習(UL)在過去幾年中真正得到了發展。在這些領域中,無監督預訓練的一些主要優勢是在下游有監督學習任務中出現的數據效率。在如何將這些技術應用于強化學習和機器人方面,社區中有很多人感興趣。考慮到問題的連續決策性質,RL和機器人技術比被動地從互聯網上的圖像和文本中學習面臨更大的挑戰,它可能不會那么簡單。本教程將涵蓋如何在強化學習中應用和使用無監督學習的基本模塊,希望人們可以帶回最新的最先進的技術和實踐的知識,以及在這個具有挑戰性和有趣的交叉領域的廣泛的未來可能性和研究方向。
圖表示學習
近年來,圖神經網絡(GNNs)在結構化數據建模方面取得了巨大的成功。然而,大多數GNN是為同構網絡設計的,即所有節點或邊具有相同的特征空間和表示分布。這使得它們無法代表真實世界中不斷演化的異構圖,如知識圖譜、物聯網圖、領英經濟圖、開放學術圖和Facebook實體圖。在這次演講中,我將介紹圖神經網絡架構,它可以建模十億年規模的異構圖形與動態。重點將是我們如何設計圖注意力和相對時間編碼機制,以捕獲真實圖異構和動態性質。接下來,我將進一步討論為一般的圖挖掘任務預先訓練這類GNN的策略。最后,為了處理web規模的數據,我將介紹一種異構的小型批處理圖采樣算法,該算法帶有一個歸納的時間戳分配方法,用于高效和可擴展的訓練。大量的實驗顯示了在實踐中對網絡規模圖進行預訓練的GNNs的前景。
//ericdongyx.github.io/papers/slides-Graph-Rep-Learning-GNN-PreTraining-at-CCF-BAAI-2020.pdf
圖神經網絡教程 Graph Convolutional Networks Graph Sampling Methods Application and PyTorch Implementation
本教程對基于模型的強化學習(MBRL)領域進行了廣泛的概述,特別強調了深度方法。MBRL方法利用環境模型來進行決策——而不是將環境視為一個黑箱——并且提供了超越無模型RL的獨特機會和挑戰。我們將討論學習過渡和獎勵模式的方法,如何有效地使用這些模式來做出更好的決策,以及規劃和學習之間的關系。我們還強調了在典型的RL設置之外利用世界模型的方式,以及在設計未來的MBRL系統時,從人類認知中可以得到什么啟示。
//sites.google.com/view/mbrl-tutorial
近年來,強化學習領域取得了令人印象深刻的成果,但主要集中在無模型方法上。然而,社區認識到純無模型方法的局限性,從高樣本復雜性、需要對不安全的結果進行抽樣,到穩定性和再現性問題。相比之下,盡管基于模型的方法在機器人、工程、認知和神經科學等領域具有很大的影響力,但在機器學習社區中,這些方法的開發還不夠充分(但發展迅速)。它們提供了一系列獨特的優勢和挑戰,以及互補的數學工具。本教程的目的是使基于模型的方法更被機器學習社區所認可和接受。鑒于最近基于模型的規劃的成功應用,如AlphaGo,我們認為對這一主題的全面理解是非常及時的需求。在教程結束時,觀眾應該獲得:
【導讀】國際萬維網大會(The Web Conference,簡稱WWW會議)是由國際萬維網會議委員會發起主辦的國際頂級學術會議,創辦于1994年,每年舉辦一屆,是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。由于疫情影響,這次會議在線上舉行,本屆會議共收到了1129篇長文投稿,錄用217篇長文,錄用率為19.2%。小編推薦一份圖深度學習-圖神經網絡教程,預覽版可以查看。
從圖數據和關系數據中學習在許多應用中起著重要的作用,包括社交網絡分析、市場營銷、電子商務、信息檢索、知識建模、醫學和生物科學、工程等。在過去的幾年里,圖神經網絡(GNNs)已經成為一種很有前途的新型監督學習框架,能夠將深度表示學習的能力引入到圖和關系數據中。越來越多的研究表明,GNNs在鏈路預測、欺詐檢測、目標配體結合活性預測、知識圖譜補全和產品推薦等方面的性能達到了最新水平。
本教程的目標有兩個。首先,它將概述GNN背后的理論,討論GNN非常適合的問題類型,并介紹一些最廣泛使用的GNN模型體系結構和設計用來解決的問題/應用程序。其次,它將引入深度圖庫(Deep Graph Library, DGL),這是一種新的軟件框架,簡化了高效的基于GNN的訓練和推理程序的開發。為了使事情更具體,本教程將提供使用DGL的實踐會話。這個實踐部分將涵蓋基本的圖形應用程序(例如,節點分類和鏈接預測),以及更高級的主題,包括在大型圖和分布式設置中訓練GNN。此外,它還將提供使用GNNs和DGL進行實際應用(如推薦和欺詐檢測)的實踐教程。
第1節:圖神經網絡概述。本節描述了圖神經網絡是如何運作的,它們的基本理論,以及它們相對于其他圖學習方法的優勢。此外,它還描述了圖形上的各種學習問題,并展示了如何使用GNNs來解決這些問題。
第2節:深度圖庫(DGL)概述。本節描述DGL提供的不同的抽象和api,這些抽象和api旨在簡化GNN模型的實現,并解釋DGL如何與MXNet、Pytorch和TensorFlow進行接口。然后介紹DGL的消息傳遞API,該API可用于開發任意復雜的GNNs和它提供的預定義GNN nn模塊。
第3節:基本圖任務的GNN模型。本節演示如何使用GNNs解決四個關鍵的圖數據學習任務:節點分類、鏈接預測、圖數據分類和網絡嵌入前訓練。它將展示如何使用DGL的nn模塊實現一個流行的GNN模型GraphSage,并展示如何在不同類型的下游任務中使用由GraphSage計算出的節點嵌入。此外,本文還將演示使用DGL的消息傳遞接口實現定制的GNN模型。
第4節:大型圖的GNN訓練。本節使用第3節中描述的一些模型來演示DGL中的微型批處理訓練、多GPU訓練和分布式訓練。它首先描述了mini-batch訓練的概念如何應用于GNN,以及如何通過使用各種抽樣技術來加速mini-batch計算。接下來將舉例說明一種稱為鄰接抽樣的抽樣技術,如何使用木星筆記本在DGL中實現。然后將該筆記本擴展為多GPU訓練和分布式訓練。
第5節:實際應用的GNN模型。本節使用前面幾節中描述的技術,展示如何使用GNNs開發用于推薦和欺詐檢測的可伸縮解決方案。在推薦方面,本文提出了一種基于最近鄰的項目推薦方法,該方法通過采用端到端的學習方法,利用GNN模型學習項目嵌入。對于欺詐檢測,它擴展了上一節中的節點分類模型,以處理異構圖,并解決了標記樣本很少的情況。