題目:Applied Reinforcement Learning with Python With OpenAI Gym, Tensorflow, and Keras
深入研究強化學習算法,并通過Python將它們應用到不同的用例中。這本書涵蓋了重要的主題,如策略梯度和Q學習,并利用框架,如Tensorflow, Keras,和OpenAI Gym。
Python中的應用增強學習向您介紹了強化學習(RL)算法背后的理論和用于實現它們的代碼。您將在指導下了解OpenAI Gym的特性,從使用標準庫到創建自己的環境,然后了解如何構建強化學習問題,以便研究、開發和部署基于rl的解決方案。
你將學習:
這本書是給誰看的: 數據科學家、機器學習工程師和軟件工程師熟悉機器學習和深度學習的概念。
地址:
//www.springerprofessional.de/en/applied-reinforcement-learning-with-python/17098944
目錄:
第1章 強化學習導論
在過去的一年里,深度學習技術的不斷擴散和發展給各個行業帶來了革命性的變化。毫無疑問,這個領域最令人興奮的部分之一是強化學習(RL)。這本身往往是許多通用人工智能應用程序的基礎,例如學習玩視頻游戲或下棋的軟件。強化學習的好處是,假設可以將問題建模為包含操作、環境和代理的框架,那么代理就可以熟悉大量的任務。假設,解決問題的范圍可以從簡單的游戲,更復雜的3d游戲,自動駕駛汽車教學如何挑選和減少乘客在各種不同的地方以及教一個機械手臂如何把握對象和地點在廚房柜臺上。
第二章 強化學習算法
讀者應該知道,我們將利用各種深度學習和強化學習的方法在這本書。然而,由于我們的重點將轉移到討論實現和這些算法如何在生產環境中工作,我們必須花一些時間來更詳細地介紹算法本身。因此,本章的重點將是引導讀者通過幾個強化學習算法的例子,通常應用和展示他們在使用Open AI gym 不同的問題。
第三章 強化學習算法:Q學習及其變體
隨著策略梯度和Actor-Critic模型的初步討論的結束,我們現在可以討論讀者可能會發現有用的替代深度學習算法。具體來說,我們將討論Q學習、深度Q學習以及深度確定性策略梯度。一旦我們了解了這些,我們就可以開始處理更抽象的問題,更具體的領域,這將教會用戶如何處理不同任務的強化學習。
第四章 通過強化學習做市場
除了在許多書中發現的強化學習中的一些標準問題之外,最好看看那些答案既不客觀也不完全解決的領域。在金融領域,尤其是強化學習領域,最好的例子之一就是做市。我們將討論學科本身,提出一些不基于機器學習的基線方法,然后測試幾種基于強化學習的方法。
第五章 自定義OpenAI強化學習環境
在我們的最后一章,我們將專注于Open AI Gym,但更重要的是嘗試理解我們如何創建我們自己的自定義環境,這樣我們可以處理更多的典型用例。本章的大部分內容將集中在我對開放人工智能的編程實踐的建議,以及我如何編寫這個軟件的建議。最后,在我們完成創建環境之后,我們將繼續集中精力解決問題。對于這個例子,我們將集中精力嘗試創建和解決一個新的視頻游戲。
人類從反饋中學習得最好——我們被鼓勵采取導致積極結果的行動,而被具有消極后果的決定所阻礙。這種強化過程可以應用到計算機程序中,使它們能夠解決經典編程所不能解決的更復雜的問題。深度強化學習實戰教你基本概念和術語的深度強化學習,以及實踐技能和技術,你將需要把它落實到你自己的項目。
對這項技術
深度強化學習是一種機器學習的形式,人工智能智能體從自己的原始感官輸入中學習最優行為。系統感知環境,解釋其過去決策的結果,并使用這些信息優化其行為以獲得最大的長期回報。眾所周知,深度強化學習對AlphaGo的成功做出了貢獻,但這并不是它所能做的全部!更令人興奮的應用程序等待被發現。讓我們開始吧。
關于這本書
深度強化學習實戰中教你如何編程的代理人,學習和改善的直接反饋,從他們的環境。您將使用流行的PyTorch深度學習框架構建網絡,以探索從深度Q-Networks到策略梯度方法再到進化算法的強化學習算法。在你進行的過程中,你會將你所知道的應用到實際操作項目中,比如控制模擬機器人、自動化股票市場交易,甚至構建一個可以下圍棋的機器人。
里面有什么
強化學習是機器學習的一個熱門領域,從基礎開始: 發現代理和環境如何演變,然后獲得它們之間如何相互關聯的清晰聯系。然后你將學習與強化學習相關的理論,并了解建立強化學習過程的概念。
這本書討論了對強化學習很重要的算法實現,包括馬爾可夫決策過程和半馬爾可夫決策過程。下一節將向您展示如何在查看Open AI Gym之前開始使用Open AI。然后您將學習Python中關于增強學習方面的群體智能。
本書的最后一部分從TensorFlow環境開始,并給出了如何將強化學習應用于TensorFlow的概述。還有Keras,一個可以用于強化學習的框架。最后,您將深入研究谷歌的深層思想,并看到可以使用強化學習的場景。
你將學習
這本書是給誰看的
數據科學家、機器學習和深度學習專業人員、希望適應和學習強化學習的開發人員。
簡介: Google一直是引入突破性技術和產品的先驅。在效率和規模方面,TensorFlow也不例外,因此,編寫本書只是向讀者介紹TensorFlow核心團隊所做的這些重要更改。本書著重于機器學習方面的TensorFlow的不同應用,并更深入地探討了方法的最新變化。對于那些想要用TensorFlow進行機器學習的人來說,這本書是一個很好的參考點。本書分為三個部分。第一篇:使用TensorFlow 2.0進行數據處理。第二部分:使用TensorFlow 2.0構建機器學習和深度學習模型。它還包括使用TensorFlow 2.0的神經語言編程(NLP)。第三部分介紹了如何在環境中保存和部署TensorFlow 2.0模型。這本書對數據分析人員和數據工程師也很有用,因為它涵蓋了使用TensorFlow 2.0處理大數據的步驟。想要過渡到數據科學和機器學習領域的讀者也會發現,本書提供了實用的入門指南,以后可能會出現更復雜的方面。書中提供的案例研究和示例使您很容易理解和理解相關的基本概念。本書的優勢在于其簡單性以及將機器學習應用于有意義的數據集。
目錄:
MIT新書《強化學習與最優控制》,REINFORCEMENT LEARNING AND OPTIMAL CONTROL //web.mit.edu/dimitrib/www/Slides_Lecture13_RLOC.pdf