又黄又爽又色的视频免费-国产AV一区二区三区蜜桃

簡介： 強大的機器學習技術在數據豐富的領域成為可能。然而，數據稀缺的領域對這類方法具有挑戰性，因為高容量函數逼近器非常依賴大型數據集進行泛化。這可能對從監督醫學圖像處理到增強學習等領域構成重大挑戰，在這些領域中，真實世界的數據收集(例如機器人)構成了重大的后勤挑戰。元學習或小樣本學習為這一問題提供了一個潛在的解決方案:通過學習跨許多以前任務的數據學習，小樣本元學習算法可以發現任務之間的結構，從而使新任務的快速學習成為可能。

本教程的目的是提供一個統一的元學習視角:向讀者講授現代方法，描述圍繞這些技術的概念和理論原則，介紹這些方法以前在哪里被應用，并討論該領域內的基本開放問題和挑戰。我們希望本教程對其他領域的機器學習研究人員有用，同時也為元學習研究人員提供了一個新的視角。總而言之，我們的目標是讓觀眾能夠將元學習應用到他們自己的應用中，并開發新的元學習算法和理論分析，以應對當前的挑戰和現有工作的局限性。

視頻地址：

Part1 //www.facebook.com/icml.imls/videos/4006/

Part2

主講人介紹：

Chelsea Finn是Google Brain的研究科學家，也是加州大學伯克利分校的博士后。在2019年9月，她將加入斯坦福大學的計算機科學系擔任助理教授。 Finn的研究興趣在于使機器人和其他代理能夠通過學習和交互來發展廣泛的智能行為的能力。為此，芬恩開發了深度學習算法，用于同時學習機器人操縱技能中的視覺感知和控制，用于非線性獎勵函數的可伸縮獲取的逆強化方法以及可以在兩個視覺系統中實現快速，少拍適應的元學習算法感知和深度強化學習。 Finn在麻省理工學院獲得EECS的學士學位，并在加州大學伯克利分校獲得CS的博士學位。她的研究得到了NSF研究生獎學金，Facebook獎學金C.V.的認可。她獲得了Ramamoorthy杰出研究獎和《麻省理工學院技術評論35分35獎》，她的工作已被《紐約時報》，《連線》和彭博社等多家媒體報道。

Sergey Levine于2009年獲得斯坦福大學計算機科學學士學位和碩士學位，并獲得博士學位。 2014年獲得斯坦福大學計算機科學博士學位。他于2016年秋天加入加州大學伯克利分校電氣工程與計算機科學系。他的工作重點是決策和控制的機器學習，重點是深度學習和強化學習。他的工作應用包括自動駕駛機器人和車輛，以及計算機視覺和圖形。他的研究包括開發將感知和控制相結合的深度神經網絡策略的端到端訓練算法，用于逆向強化學習的可擴展算法，深度強化學習算法等。在許多受歡迎的媒體中，包括紐約時報，BBC，麻省理工學院技術評論和彭博社，他的作品都得到了報道。

付費5元查看完整內容

知識薈萃

精品入門和進階教程、論文和代碼整理等

查看相關VIP內容、論文、資訊等

深度無監督學習 · 半監督學習 ·

2020 年 4 月 11 日

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

【導讀】OpenAI顧問、伯克利加州分校人工智能實驗室主任、機器人學習實驗室主任攜其博士生，為大家貢獻一門長達4個月的深度無監督學習課程，該課程是深度無監督學習的優秀課程，涵蓋了許多當前的最新水平，尤其是該課程使用了最新的模型更新研究生級課程。最新一講是深度半監督學習，146頁ppt，值得跟隨

付費5元查看完整內容

深度學習 · 深度強化學習 · Tianhe Yu · 加州大學伯克利分校 (UC Berkeley) ·

2020 年 1 月 23 日

[付費5元查看完整內容]【斯坦福大學】Gradient Surgery for Multi-Task Learning

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

題目： Gradient Surgery for Multi-Task Learning

摘要： 雖然深度學習和深度強化學習（RL）系統在圖像分類、游戲和機器人控制等領域取得了令人印象深刻的成果，但數據效率仍然是一個重大挑戰。多任務學習是一種很有前途的跨任務共享結構的學習方法。然而，多任務設置帶來了許多優化挑戰，與獨立學習任務相比，很難實現大的效率提升。與單任務學習相比，多任務學習之所以具有如此大的挑戰性，其原因還不完全清楚。在這項工作中，我們確定了多任務優化環境中導致有害梯度干擾的三個條件，并開發了一種簡單而通用的方法來避免任務梯度之間的這種干擾。我們提出一種梯度手術的形式，將一個任務的梯度投影到任何其他具有沖突梯度的任務的梯度的法平面上。在一系列具有挑戰性的多任務監督和多任務RL問題上，該方法在效率和性能上都有顯著提高。此外，它與模型無關，可以與先前提出的多任務體系結構相結合以提高性能。

作者簡介： Tianhe Yu，加州大學伯克利分校研究助理。官方主頁：//tianheyu927.github.io/等

付費5元查看完整內容

Google · 機器學習 · 元強化學習 · 多任務 · 元學習 ·

2019 年 11 月 21 日

[付費5元查看完整內容]【元學習 | 論文】CoRL19，元世界:多任務和元強化學習的基準和評估，伯克利分校，Google

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

論文題目： Meta-World: A Benchmark and Evaluation for Multi-Task and Meta Reinforcement Learning

摘要： 元強化學習算法可以利用以前的經驗來學習如何學習，從而使機器人更快地獲得新技能。然而，目前關于元強化學習的研究大多集中在任務分布非常狹窄的情況下。例如，一個常用的元強化學習基準對一個模擬機器人使用不同的運行速度作為不同的任務。當策略在如此狹窄的任務分布上進行元訓練時，它們不可能泛化到更快速地獲取全新的任務。因此，如果這些方法的目的是更快地獲取全新的行為，那么我們必須在任務分布上對它們進行評估，這些任務分布足夠廣泛，從而能夠對新行為進行泛化。在本文中，我們提出了一種元強化學習和多任務學習的開源模擬基準，由50個不同的機器人操作任務組成。我們的目標是使開發算法成為可能，從而加速獲取全新的、未完成的任務。我們評估了6種最先進的元強化學習和多任務學習算法。令人驚訝的是，雖然每個任務及其變體(例如，具有不同的對象位置)都可以成功地學習，但這些算法很難同時學習多個任務，即使只有10個不同的訓練任務。我們的分析和開源環境為未來多任務學習和元學習的研究鋪平了道路，這些研究可以使有意義的概括成為可能，從而釋放這些方法的全部潛力。

論文作者： Tianhe Yu, Deirdre Quillen, Zhanpeng He, Ryan Julian, Karol Hausman, Chelsea Finn, Sergey Levine

付費5元查看完整內容

認知偏差 · 魯棒性 · 智能體 · 機器學習 · Silvia Chiappa ·

2019 年 6 月 10 日

[付費5元查看完整內容]【ICML2019 tutorial】安全機器學習（Safe Machine Learning），Silvia Chiappa，Jan Leike

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

題目： Safe Machine Learning

簡介：

隨著我們將ML應用到越來越多的現實任務中，我們正在走向一個ML將在未來社會中扮演越來越重要角色。因此，解決安全問題正成為一個日益緊迫的問題。一般來說，我們可以將當前的安全研究分為三個領域:規范、健壯性和保證。規范關注于調查和開發技術，以減輕由于目標僅僅是期望的替代者而可能出現的系統不期望的行為。這種情況可能會發生，例如，當對包含歷史偏差的數據集進行訓練時，或者在真實環境中嘗試度量增強學習智能體的進度時魯棒性處理在推斷新數據和響應敵對輸入時處理系統故障。

Assurance涉及到開發方法，使我們能夠理解本質上不透明和黑箱的系統，并在操作期間控制它們。本教程將概述這三個領域，特別關注規范，更具體地說，關注增強學習智能體的公平性和一致性。其目的是激發從事不同安全領域的研究人員之間的討論。

邀請嘉賓：

Silvia Chiappa是DeepMind機器學習方面的研究科學家。她擁有數學文憑和機器學習博士學位。在加入DeepMind之前，Silvia Chiappa曾在馬克斯-普朗克智能系統研究所的經驗推理部門、微軟劍橋研究院的機器智能與感知小組以及劍橋大學的統計實驗室工作。她的研究興趣是基于貝葉斯和因果推理，圖形模型，變分推理，時間序列模型，ML公平性和偏差。

Jan Leike是DeepMind的高級研究科學家，他在那里研究智能體對齊問題。他擁有澳大利亞國立大學的計算機科學博士學位，在那里他致力于理論強化學習。在加入DeepMind之前，他是牛津大學的博士后研究員。Jan的研究興趣是人工智能安全、強化學習和技術人工智能治理。

付費5元查看完整內容

人工智能 · 元學習 · 神經網絡 · 深度強化學習 · Chelsea Finn ·

2019 年 6 月 10 日

[付費5元查看完整內容]【ICML2019 Tutorials】元學習：從小樣本學習到快速強化學習(Meta-Learning: from Few-Shot Learning to Rapid Reinforcement Learning)，Google Brain的研究科學家| Chelsea Finn，加州大學伯克利分校| Sergey Levine

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

主題： Meta-Learning: from Few-Shot Learning to Rapid Reinforcement Learning

摘要： 近年來，在數據豐富的領域，諸如深度神經網絡等高容量模型已經使機器學習技術變得非常強大。然而，數據稀缺的領域已被證明具有挑戰性的這種方法，因為高容量函數逼近嚴重依賴于大數據集的泛化。這可能對從有監督的醫學圖像處理到強化學習等領域構成重大挑戰，在這些領域，真實世界的數據收集（如機器人）構成重大的后勤挑戰。元學習或少鏡頭學習為這個問題提供了一個潛在的解決方案：通過學習從許多以前的任務中跨數據學習，很少鏡頭元學習算法能夠發現任務之間的結構，從而實現新任務的快速學習。本教程的目的是為元學習提供一個統一的視角：向觀眾講授現代方法，描述圍繞這些技術的概念和理論原則，介紹這些方法以前的應用領域，并討論了該地區存在的基本問題和挑戰。我們希望本教程對那些在其他領域有專長的機器學習研究人員都有用，同時也為元學習研究人員提供了一個新的視角。總而言之，我們的目標是為受眾成員提供將元學習應用到他們自己的應用中的能力，并開發新的元學習算法和理論分析，這些驅動是由現有工作的挑戰和局限所驅動的。我們將提供一個統一的視角，說明各種元學習算法如何能夠從小數據集中學習，概述元學習能夠而且不容易應用的應用，并討論這一子領域的突出挑戰和前沿。

邀請嘉賓： Chelsea Finn是Google Brain的研究科學家，也是加州大學伯克利分校的博士后學者。2019年9月，她將以助理教授的身份加入斯坦福大學計算機科學系。芬恩的研究興趣在于通過學習和互動，使機器人和其他智能體發展出廣泛的智能行為。為此，芬恩開發了深度學習算法，用于同時學習機器人操作技能中的視覺感知和控制，用于可伸縮獲取非線性回報函數的逆強化方法，以及能夠快速實現的元學習算法，在視覺感知和深度強化學習中，很少有鏡頭適應。芬恩在麻省理工學院獲得了EECS學士學位，在加州大學伯克利分校獲得了CS博士學位。她的研究成果已通過NSF研究生獎學金、Facebook獎學金、C.V.Ramamoorthy杰出研究獎和麻省理工35歲以下技術評論獎獲得認可，她的研究成果已被包括《紐約時報》、《連線》和彭博社在內的多家媒體報道。

Sergey Levine 2009年獲得斯坦福大學計算機科學學士和碩士學位，2014年獲得斯坦福大學計算機科學博士學位。他于2016年秋季加入加州大學伯克利分校電氣工程與計算機科學系。他的工作重點是決策和控制的機器學習，重點是深度學習和強化學習算法。他的工作包括自主機器人和車輛，以及計算機視覺和圖形。他的研究工作包括開發將感知和控制相結合的深度神經網絡策略的端到端訓練算法、反向強化學習的可擴展算法、深度強化學習算法等。

付費5元查看完整內容