深度強化學習將深度學習的感知能力和強化學習的決策能力相結合,可以直接根據輸入的圖像進行控制,是一種更接近人類思維方式的人工智能方法,深度學習具有較強的感知能力,但是缺乏一定的決策能力;而強化學習具有決策能力,對感知問題束手無策。因此,將兩者結合起來,優勢互補,為復雜系統的感知決策問題提供了解決思路。本次課程包括DQN,REINFORCE,QAC,AAC。
github鏈接://github.com/xbresson/CE7454_2019/tree/master/codes/labs_lecture15
Deep Reinforcement Learning via Policy Optimization
DeepMind 與 UCL 合作推出了一門深度學習與強化學習進階課程,以在線視頻形式呈現。課件包括18個課程的16個PPT共開放,每節課都長達 1 小時 40 分鐘,內容從深度學習框架 TensoFlow 的介紹到構建游戲智能體,可謂全面。
該課程最初在倫敦大學學院(UCL)進行,為方便在線觀看進行了錄像。多位 DeepMind 的研究人員、UCL 教師參與了課程的設計。
課程由兩部分組成,一是包含深度神經網絡的機器學習,二是利用強化學習進行預測和控制,兩個部分相互穿插。在探討深度學習的過程中,這兩條線交匯在一起,其中的深度神經網絡被訓練為強化學習背景下的函數逼近器。
課程中的深度學習部分首先介紹了神經網絡及使用 TensorFlow 的監督學習,接下來探討了卷積神經網絡、循環神經網絡、端到端及基于能量的學習、優化方法、無監督學習、注意力及記憶。涉及的應用領域包括目標識別和自然語言處理。
視頻課程地址://www.youtube.com/playlist?list=PLqYmG7hTraZDNJre23vqCGIVpfZ_K2RZs
PPT下載鏈接: 提取碼: 8s86
課程介紹: 最近,圖神經網絡 (GNN) 在各個領域越來越受到歡迎,包括社交網絡、知識圖譜、推薦系統,甚至生命科學。GNN 在對圖形中節點間的依賴關系進行建模方面能力強大,使得圖分析相關的研究領域取得了突破性進展。本次課程對比傳統的卷積神經網絡以及圖譜圖卷積與空間圖卷積,從理論知識入手,并結合相關論文進行詳細講解。
主講人: Xavier Bresson,人工智能/深度學習方面的頂級研究員,培訓師和顧問。在“圖深度學習”上的NeurIPS'17和CVPR'17(2019年頂級人工智能會議排名)上的演講者,在劍橋,加州大學洛杉磯分校,布朗,清華,龐加萊,海德堡等地進行了30多次國際演講。
課程大綱: