嘉賓:Pieter Abbeel ,加州大學伯克利分校機器人學習實驗室主任,人工智能實驗室聯合主任、covariant.ai 和 Gradescope 聯合創始人
在這次演講中,我將分享我對如何為機器人實現大型預訓練神經網絡的想法,就像GPT-x/BERT等預訓練模型在NLP中被標準使用的方式一樣。我列出了我們如何在無監督表征學習、無監督(無獎勵)強化學習(RL)預訓練、人在循環中的RL和少樣本模仿學習等方面取得實質性的研究進展。
來自伯克利Pieter Abbeel教授講述的深度強化學習課程6講,講述內容包括,MDP basics, value & policy iteration, max-ent, DQN, policy gradient, TRPO, PPO, DDPG, SAC, model-based RL.
視頻地址: //www.youtube.com/playlist?list=PLwRJQ4m4UJjNymuBM9RdmB3Z9N5-0IlY0
來自DeepMind的Aida Nematzadeh在CVPR2021上講述多模態預訓練的教程。
近日,深度學習課程 CS182 已發布所有視頻課程(截至目前),課程講師是來自加州大學伯克利分校電氣工程與計算機科學系的助理教授 Sergey Levine 。
Youtube 地址:
此外,該課程目前也可以在 B 站觀看。
B 站地址:
CS 182 是一門深度學習入門課程,涵蓋了深度學習的諸多內容,適用于高級本科生及研究生。 目前,這門課程在 Youtube 和 B 站上已有 44 節視頻內容:
報告主題: Better Model-based RL through Meta RL
報告簡介: Meta RL(Meta Reinforcement Learning)是Meta Learning應用到Reinforcement Learning的一個研究方向,核心的想法就是希望AI在學習大量的RL任務中獲取足夠的先驗知識Prior Knowledge然后在面對新的RL任務時能夠 學的更快,學的更好,能夠自適應新環境,本教程主要從強化學習的基礎,基于模型的元強化學習,以及如何加快元強化學習訓練速度三方面展開。
嘉賓介紹: Pieter Abbeel是加州大學伯克利分校電子工程和計算機科學教授,伯克利機器人學習實驗室主任和伯克利AI研究實驗室聯合主任。
報告簡介: 深度強化學習與元學習是當前研究熱點。加州大學UC Berkeley Pieter Abbeel教授最新在卡內基梅隆大學CMU中做了演講關于深度強化學習在機器人的應用,《Deep Learning to learn》,是了解深度學習在機器人應用研究進展的很好報告。
嘉賓介紹: Pieter Abbeel,加州大學伯克利分校教授、機器人學習實驗室主任,伯克利人工智能研究(BAIR)實驗室聯合主任。Pieter Abbeel是機器人和強化學習領域的大牛。Pieter Abbeel 2008年從斯坦福大學獲得博士學位,師從百度前首席科學家 Andrew Ng(吳恩達),畢業后在UC Berkeley任教。Pieter Abbeel還是兩家AI公司的創始人,Gradescope和covariant.ai。Gradescope開發為家庭作業、課題研究、試卷等打分的AI系統;covariant.ai開發機器人自動化的AI系統,在制造/倉儲/電子商務/物流等領域應用。 Pieter Abbeel 的研究重點特別集中于如何讓機器人向人類學習(學徒學習),如何讓機器人通過自己的試錯過程學習(強化學習),以及如何通過從learning-to-learn(元學習)過程中加快技能獲取。他開發的機器人已經學會了先進的直升機特技飛行、打結、基本裝配、疊衣服、移動、以及基于視覺的機器人操作。
下載鏈接: 鏈接://pan.baidu.com/s/1aFOE18rk-icczXBYJERWow 提取碼:8ixa
本課程將涵蓋深度學習中不需要標注數據的兩個領域:深度生成模型和自監督學習。生成模型的最新進展使得對自然圖像、音頻波形和文本語料庫等高維原始數據進行真實建模成為可能。自監督學習的進步已經開始縮小監督表示學習和非監督表示學習之間的差距,本課程將涵蓋這些主題的理論基礎以及它們的新應用。