国产白浆一区二区无码视频在线,在线观看成年视频2020最新

本文為大家帶來了一份斯坦福大學的最新課程CS234——強化學習，主講人是斯坦福大學Emma Brunskill，她是斯坦福大學計算機科學助理教授，任職斯坦福大學人類影響力實驗室、斯坦福人工智能實驗室以及統計機器學習小組，主要研究強化學習。要實現人工智能的夢想和影響，需要能夠學會做出正確決策的自主系統。強化學習是這樣做的一個強有力的范例，它與大量的任務相關，包括機器人、游戲、消費者建模和醫療保健。本課程通過講課、書面作業和編碼作業的結合，學生將精通強化學習的關鍵思想和技術。

1.課程介紹(Description)

要實現人工智能的夢想和影響，需要能夠學會做出正確決策的自主系統。強化學習是這樣做的一個強有力的范例，它與大量的任務相關，包括機器人、游戲、消費者建模和醫療保健。本課程將為強化學習領域提供扎實的介紹，學生將學習包括通用化和探索在內的核心挑戰和方法。通過講課、書面作業和編碼作業的結合，學生將精通強化學習的關鍵思想和技術。作業將包括強化學習和深度強化學習的基礎，這是一個極有前途的新領域，將深度學習技術與強化學習相結合。此外，學生將通過期末專題來增進對強化學習領域的理解。

課程地址：

//web.stanford.edu/class/cs234/schedule.html

2.預備知識(Prerequisites)

1）熟練Python

所有的課程都將使用Python(使用numpy和Tensorflow，也可以使用Keras)。這里有一個針對那些不太熟悉Python的人的教程。如果你有很多使用不同語言(如C/ c++ / Matlab/ Javascript)的編程經驗，可能會很好。

2）大學微積分，線性代數(如 MATH 51, CME 100)

你應該能夠熟練地進行(多變量)求導，理解矩陣/向量符號和運算。

3）基本概率及統計(例如CS 109 或同等課程)

你應該了解基本的概率，高斯分布，均值，標準差等。

4）機器學習基礎

我們將闡述成本函數，求導數，用梯度下降法進行優化。CS 221或CS 229均可涵蓋此背景。使用一些凸優化知識，一些優化技巧將更加直觀。

3.主講：Emma Brunskill

Emma Brunskill是斯坦福大學計算機科學助理教授，任職斯坦福大學人類影響力實驗室、斯坦福人工智能實驗室以及統計機器學習小組。

主要研究強化學習系統，以幫助人們更好地生活。并處理一些關鍵技術。最近的研究重點包括：1）有效強化學習的基礎。一個關鍵的挑戰是要了解代理商如何平衡勘探與開發之間的局限性。2）如果要進行順序決策，該怎么辦。利用巨大數量的數據來改善在醫療保健，教育，維護和許多其他應用程序中做出的決策，這是一個巨大的機會。這樣做需要假設/反事實推理，以便在做出不同決定時對潛在結果進行推理。3）人在回路系統。人工智能具有極大地擴大人類智能和效率的潛力。我們正在開發一個系統，用其他眾包商（CHI 2016）生產的（機器）固化材料對眾包商進行訓練，并確定何時擴展系統規格以包括新內容（AAAI 2017）或傳感器。我們也有興趣研究確保機器學習系統在人類用戶的意圖方面表現良好（Arxiv 2017），也被稱為安全和公平的機器學習。

個人主頁：

4.課程安排

01: 強化學習導論(Introduction to Reinforcement Learning)

02: 表格MDP規劃(Tabular MDP planning)

03: 表格RL政策評估(Tabular RL policy evaluation)

04: Q-learning

05: 帶函數逼近的強化學習(RL with function approximation)

06: 帶函數逼近的強化學習(RL with function approximation)

07: 帶函數逼近的強化學習(RL with function approximation)

08: 從馬爾可夫決策過程到強化學習(Policy search)

09: 從馬爾可夫決策過程到強化學習(Policy search)

10: 課堂中期(In-class Midterm)

11: 模仿學習/探索(Imitation learning/Exploration)

12: 探索/開發(Exploration/Exploitation)

13: 探索/開發(Exploration/Exploitation)

14: 批處理強化學習(Batch Reinforcement Learning)

15: 嘉賓講座:Craig Boutilier(Guest Lecture: Craig Boutilier)

16: 課堂測驗(In-class Quiz)

17: 蒙特卡洛樹搜索算法(Monte Carlo Tree Search)

18: 墻報展示(Poster presentations)

付費5元查看完整內容

游客

閱讀: 0 點贊: 0

小貼士

登錄享主題訂閱及個性化推薦

相關主題

北京阿比特科技有限公司

注冊地址：北京市海淀區羊坊店路18號2幢3層301-191

_{^{<dd id='xbwyp'><tbody id='xbwyp'><td id='xbwyp'><optgroup id='xbwyp'><strong id='xbwyp'></strong></optgroup><address id='xbwyp'><ul id='xbwyp'></ul></address><big id='xbwyp'></big></td><table id='xbwyp'></table></tbody><pre id='xbwyp'></pre></dd><span id='xbwyp'><b id='xbwyp'></b></span>}}


<dfn id='xbwyp'><optgroup id='xbwyp'></optgroup></dfn><tfoot id='xbwyp'><bdo id='xbwyp'><div id='xbwyp'></div><i id='xbwyp'><dt id='xbwyp'></dt></i></bdo></tfoot>

_{<fieldset id='xbwyp'></fieldset>}

亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

課程目錄

相關內容

知識薈萃

更多