亚洲黄色网站不卡免费,一级A婬片试看28分钟

報告主題： 模仿學習前沿進展

報告摘要： 時空跟蹤和傳感數據的不斷發展，現在使得在廣泛的領域中對細粒度的行為進行分析和建模成為可能。例如，現在正在收集每場NBA籃球比賽的跟蹤數據，其中包括球員，裁判和以25 Hz跟蹤的球，以及帶有注釋的比賽事件，如傳球，射門和犯規。其他設置包括實驗動物，公共場所的人員，設置諸如手術室，演員講話和表演的演員，虛擬環境中的數字化身，自然現象（如空氣動力學）以及其他計算系統的行為等專業人員。在本演講中，我將描述正在進行的研究，這些研究正在開發結構化模仿學習方法，以開發細粒度行為的預測模型。模仿學習是機器學習的一個分支，它處理模仿模仿的動態行為的學習。結構化模仿學習涉及施加嚴格的數學領域知識，這些知識可以（有時被證明）可以加速學習，并且還可以帶來附帶利益（例如Lyapunov穩定性或政策行為的可解釋性）。我將提供基本問題設置的高級概述，以及對實驗動物，專業運動，語音動畫和昂貴的計算神諭進行建模的特定項目。

嘉賓介紹： Yisong Yue，博士，是加州理工學院計算與數學科學系的助理教授。他以前是迪斯尼研究院的研究科學家。在此之前，他是卡耐基梅隆大學機器學習系和iLab的博士后研究員。 Yisong的研究興趣主要在于統計機器學習的理論和應用。他對開發用于交互式機器學習和結構化機器學習的新穎方法特別感興趣。過去，他的研究已應用于信息檢索，推薦系統，文本分類，從豐富的用戶界面中學習，分析隱式人類反饋，臨床治療，輔導系統，數據驅動的動畫，行為分析，運動分析，實驗設計科學，優化學習，機器人技術政策學習以及自適應計劃和分配問題。

付費5元查看完整內容

相關內容

模仿學習

關注 322

模仿學習是學習嘗試模仿專家行為從而獲取最佳性能的一系列任務。目前主流方法包括監督式模仿學習、隨機混合迭代學習和數據聚合模擬學習等方法。模仿學習（Imitation Learning）背后的原理是是通過隱含地給學習器關于這個世界的先驗信息，比如執行、學習人類行為。在模仿學習任務中，智能體（agent）為了學習到策略從而盡可能像人類專家那樣執行一種行為，它會尋找一種最佳的方式來使用由該專家示范的訓練集（輸入-輸出對）。當智能體學習人類行為時，雖然我們也需要使用模仿學習，但實時的行為模擬成本會非常高。與之相反，吳恩達提出的學徒學習（Apprenticeship learning）執行的是存粹的貪婪/利用（exploitative）策略，并使用強化學習方法遍歷所有的（狀態和行為）軌跡（trajectories）來學習近優化策略。它需要極難的計略（maneuvers），而且幾乎不可能從未觀察到的狀態還原。模仿學習能夠處理這些未探索到的狀態，所以可為自動駕駛這樣的許多任務提供更可靠的通用框架。

統計學習理論 · MLSS2020 ·

2020 年 6 月 30 日

[付費5元查看完整內容]【硬核課】統計學習理論，321頁ppt

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

【導讀】機器學習暑期學校(MLSS)系列開始于2002年，致力于傳播統計機器學習和推理的現代方法。今年因新冠疫情在線舉行，從6月28號到7月10號講述了眾多機器學習主題。本文推薦來自米蘭大學Nicoló Cesa-Bianchi教授講述《統計學習理論》，非常干貨，包括：

統計學習的簡介
從統計學習到序列決策
專家意見和多武裝強盜的預測
在線凸優化
上下文老虎機算法

付費5元查看完整內容

深度學習 · 無監督學習 · 表示學習 · Google DeepMind ·

2020 年 6 月 29 日

[付費5元查看完整內容]【DeepMind深度學習課程】無監督表示學習前沿進展，129頁ppt，Unsupervised Representation Learning

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

無監督學習是機器學習的三個主要分支之一（以及監督學習和強化學習）。它也可以說是最不發達的分支。它的目標是通過發現和利用其隱藏結構來找到對輸入數據的簡約描述。據推測，與監督學習相比，這更讓人聯想到大腦的學習方式。此外，假設通過無監督學習發現的表示形式可以緩解深度監督和強化學習中的許多已知問題。但是，由于缺乏明確的ground-truth目標來優化，無監督學習的發展進展緩慢。在本次演講中，DeepMind研究科學家Irina Higgins和DeepMind研究工程師Mihaela Rosca概述了無監督表示學習的歷史作用以及開發和評估此類算法的困難。然后，他們將采取多學科的方法來思考什么可以做一個好的表示方法，以及為什么要這樣做，然后再對無監督的表示學習的當前最新方法進行廣泛的概述。

付費5元查看完整內容

加州大學伯克利分校 (UC Berkeley) · 機器學習 · 蛋白質工程 ·

2020 年 5 月 9 日

[付費5元查看完整內容]【伯克利】機器學習蛋白質工程，Machine learning for protein engineering，83頁ppt

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

主題： Machine learning for protein engineering

摘要： 機器學習指導的蛋白質工程是一種新的范例，可以優化復雜的蛋白質功能。機器學習方法使用數據來預測蛋白質功能，而無需詳細的基礎物理或生物學途徑模型。

付費5元查看完整內容

元學習 ·

2020 年 5 月 8 日

[付費5元查看完整內容]元學習(meta learning) 最新進展綜述論文

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

本文綜述了元學習在圖像分類、自然語言處理和機器人技術等領域的應用。與深度學習不同，元學習使用較少的樣本數據集，并考慮進一步改進模型泛化以獲得更高的預測精度。我們將元學習模型歸納為三類: 黑箱適應模型、基于相似度的方法模型和元學習過程模型。最近的應用集中在將元學習與貝葉斯深度學習和強化學習相結合，以提供可行的集成問題解決方案。介紹了元學習方法的性能比較，并討論了今后的研究方向。

付費5元查看完整內容

機器學習 · 深度學習 · 元強化學習 · 強化學習 · 元學習 ·

2019 年 11 月 12 日

[付費5元查看完整內容]【ICML 2019 | 元學習教程】伯克利Chelsea Finn、Sergey Levine主講，附111PDF

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

簡介： 強大的機器學習技術在數據豐富的領域成為可能。然而，數據稀缺的領域對這類方法具有挑戰性，因為高容量函數逼近器非常依賴大型數據集進行泛化。這可能對從監督醫學圖像處理到增強學習等領域構成重大挑戰，在這些領域中，真實世界的數據收集(例如機器人)構成了重大的后勤挑戰。元學習或小樣本學習為這一問題提供了一個潛在的解決方案:通過學習跨許多以前任務的數據學習，小樣本元學習算法可以發現任務之間的結構，從而使新任務的快速學習成為可能。

本教程的目的是提供一個統一的元學習視角:向讀者講授現代方法，描述圍繞這些技術的概念和理論原則，介紹這些方法以前在哪里被應用，并討論該領域內的基本開放問題和挑戰。我們希望本教程對其他領域的機器學習研究人員有用，同時也為元學習研究人員提供了一個新的視角。總而言之，我們的目標是讓觀眾能夠將元學習應用到他們自己的應用中，并開發新的元學習算法和理論分析，以應對當前的挑戰和現有工作的局限性。

視頻地址：

Part1 //www.facebook.com/icml.imls/videos/4006/

Part2

主講人介紹：

Chelsea Finn是Google Brain的研究科學家，也是加州大學伯克利分校的博士后。在2019年9月，她將加入斯坦福大學的計算機科學系擔任助理教授。 Finn的研究興趣在于使機器人和其他代理能夠通過學習和交互來發展廣泛的智能行為的能力。為此，芬恩開發了深度學習算法，用于同時學習機器人操縱技能中的視覺感知和控制，用于非線性獎勵函數的可伸縮獲取的逆強化方法以及可以在兩個視覺系統中實現快速，少拍適應的元學習算法感知和深度強化學習。 Finn在麻省理工學院獲得EECS的學士學位，并在加州大學伯克利分校獲得CS的博士學位。她的研究得到了NSF研究生獎學金，Facebook獎學金C.V.的認可。她獲得了Ramamoorthy杰出研究獎和《麻省理工學院技術評論35分35獎》，她的工作已被《紐約時報》，《連線》和彭博社等多家媒體報道。

Sergey Levine于2009年獲得斯坦福大學計算機科學學士學位和碩士學位，并獲得博士學位。 2014年獲得斯坦福大學計算機科學博士學位。他于2016年秋天加入加州大學伯克利分校電氣工程與計算機科學系。他的工作重點是決策和控制的機器學習，重點是深度學習和強化學習。他的工作應用包括自動駕駛機器人和車輛，以及計算機視覺和圖形。他的研究包括開發將感知和控制相結合的深度神經網絡策略的端到端訓練算法，用于逆向強化學習的可擴展算法，深度強化學習算法等。在許多受歡迎的媒體中，包括紐約時報，BBC，麻省理工學院技術評論和彭博社，他的作品都得到了報道。

付費5元查看完整內容

強化學習 · 深度學習 · 加州大學 (University of California) · 人形機器人 ·

2019 年 10 月 12 日

[付費5元查看完整內容]【Pieter Abbeel 報告@CMU】元學習與深度強化學習機器人應用，Deep Learning to Learn，84頁ppt

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

編寫機器人程序仍然是出了名的困難。讓機器人具備學習的能力，就可以繞過那些通常需要耗費大量時間來完成特定任務的編程工作。這個演講將描述最近在深度強化學習(機器人通過自己的嘗試和錯誤學習)、學徒學習(機器人通過觀察人學習)和元學習(機器人學習學習)方面的進展。這項工作使機器人在操作、移動和飛行方面有了新的能力，這些領域的進步都是基于相同的方法。

//www.youtube.com/watch?v=WGza-jN4CZs

付費5元查看完整內容

人工智能 · 強化學習 · 微軟研究院 · 卡內基梅隆大學 (Carnegie Mellon University) · Geoff Gordon ·

2019 年 10 月 3 日

[付費5元查看完整內容]【強化學習研討會|Microsoft Research】政策改進學習（Learning for policy improvement），卡內基梅隆大學教授| Geoff Gordon

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

主題： Learning for policy improvement

摘要： 強化學習在經驗易獲得的領域取得了許多成功，如電子游戲或棋盤游戲。這類區域的RL算法通常基于梯度下降：它們以較小的學習率進行許多噪聲更新。相反，我們研究每次更新花費更多計算的算法，試圖減少噪聲并進行更大的更新；當經驗比計算時間更昂貴時，這樣的算法是合適的。特別地，我們看幾種基于近似策略迭代的方法。

作者簡介： Geoff Gordon博士是微軟研究蒙特勒實驗室的研究主任，也是卡內基梅隆大學機器學習系的教授。他還擔任過機械學習系的臨時系主任和教育副系主任。戈登博士的研究集中在能夠進行長期思考的人工智能系統上，比如提前推理以解決問題、計劃一系列行動或從觀察中推斷出看不見的特性。特別是，他著眼于如何將機器學習與這些長期思考任務結合起來。1991年，戈登博士在康奈爾大學獲得計算機科學學士學位，1999年在卡內基梅隆大學獲得計算機科學博士學位。他的研究興趣包括人工智能、統計機器學習、教育數據、博弈論、多機器人系統，以及概率、對抗和一般和領域的規劃。他之前的任命包括斯坦福大學計算機科學系的客座教授和圣地亞哥燃燒玻璃技術的首席科學家。

付費5元查看完整內容

文本 · 圖像識別 · 數據集 · 標記（Label） · 機器學習 ·

2019 年 6 月 10 日

[付費5元查看完整內容]【ICML2019 tutorial】主動學習:從理論到實踐（Active Learning: From Theory to Practice），Robert Nowak，Steve Hanneke

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

題目： Active Learning: From Theory to Practice

簡介：

近年來，機器學習領域取得了相當大的進步，但主要是在定義明確的領域中使用了大量帶有人類標記的訓練數據。機器可以識別圖像中的物體并翻譯文本，但它們必須接受比人一生所能看到的更多的圖像和文本的訓練。生成必要的訓練數據集需要大量的人力工作。Active ML旨在解決這個問題，它設計了一種學習算法，能夠自動、自適應地選擇最具信息性的數據進行標記，這樣就不會浪費人類的時間來標記不相關、冗余或瑣碎的例子。本教程將概述應用程序，并介紹主動機器學習的基本理論和算法。它將特別關注可證明的健全的主動學習算法，并量化學習所需的標記訓練數據的減少。

邀請嘉賓：

Robert Nowak是威斯康星大學麥迪遜分校的諾斯布施工程教授，他的研究重點是信號處理、機器學習、優化和統計。

Steve Hanneke是芝加哥豐田技術研究所的研究助理教授。他的研究探索了機器學習理論:設計新的學習算法，能夠從更少的樣本中學習，理解交互式機器學習的好處和能力，開發遷移學習和終身學習的新視角，并在學習理論的基礎上重新審視基本的概率假設。Steve于2005年在UIUC獲得了計算機科學學士學位，2009年在卡內基梅隆大學獲得了機器學習博士學位，并完成了一篇關于主動學習理論基礎的論文。

付費5元查看完整內容