本書介紹使用Python, PyTorch和TensorFlow來進行深度強化學習實戰
//www.barnesandnoble.com/w/practical-deep-reinforcement-learning-with-python-ivan-gridin/1141794632
關鍵特性:
接觸著名的RL技術,包括蒙特卡洛、深度Q -學習、策略梯度和角色關鍵。 使用TensorFlow和PyTorch進行強化學習項目的實踐經驗。 一切都是簡潔的,最新的,并以簡化的數學直觀解釋。
描述
強化學習是人工智能的一個迷人分支,它在幾個方面不同于標準的機器學習。在不可預測的環境中適應和學習是這個項目的一部分。強化學習在現實世界中有許多應用,包括醫療、賭博、人類模仿活動和機器人。
這本書介紹讀者強化學習從實用主義的觀點。這本書確實涉及數學,但它不試圖使讀者負擔過重,誰是強化學習領域的初學者。
這本書在許多實際學習中給讀者帶來了許多創新的方法,包括蒙特卡洛、深度Q -學習、策略梯度和角色關鍵方法。在你詳細了解這些技術的同時,本書還提供了使用TensorFlow和PyTorch強大功能的這些方法和技術的真實實現。這本書涵蓋了一些誘人的項目,展示了強化學習的力量,更不用說一切都是簡潔的,最新的,直觀的解釋。
讀完這本書,讀者將對現代強化學習及其應用有一個全面、直觀的了解,這將極大地幫助他們深入研究強化學習這個有趣的領域。
你會學到什么
熟悉強化學習和深度強化學習的基礎知識。 使用Python和Gym框架對外部環境進行建模。 應用經典Q學習、蒙特卡洛、策略梯度和湯普森抽樣技術。 探索TensorFlow和PyTorch來實踐深度強化學習的基礎知識。 使用特定的技術為特定的問題設計一個智能體。
這本書是給誰的
這本書是為機器學習工程師,深度學習狂熱者,AI軟件開發人員,數據科學家,和其他渴望學習并將強化學習應用于正在進行的項目的數據專業人員編寫的。機器學習的專業知識是沒有必要的;但是,要求熟練掌握Python。
這本書是為任何想學習如何開發機器學習系統的人準備的。我們將從理論和實踐兩方面涵蓋關于機器學習算法的最重要概念,并將使用Python編程語言中的Scikit-learn庫實現許多機器學習算法。在第一章中,您將學習機器學習最重要的概念,在下一章中,您將主要學習分類。在最后一章中,你將學習如何訓練你的模型。我假定你已經了解了編程的基礎知識。
歡迎學習Python的基礎知識。不僅僅是高級語法和編寫干凈代碼的熟練技巧的集合,您將學習如何通過使用命令行和其他專業工具(如代碼格式化器、類型檢查器、linters和版本控制)來提高您的Python編程技能。
Sweigart帶您通過設置開發環境、命名變量和提高可讀性的最佳實踐,然后處理文檔、組織和性能度量,以及面向對象設計和編程面試中常用的Big-O算法分析。你所學的技能將會提高你編程的能力——不僅僅是用Python,而是用任何語言。
//nostarch.com/beyond-basic-stuff-python
你將學習:
在Jupyter Notebook環境中使用Python和TensorFlow 2.0創建、執行、修改和共享機器學習應用程序。這本書打破了編程機器學習應用程序的任何障礙,通過使用Jupyter Notebook而不是文本編輯器或常規IDE。
您將從學習如何使用Jupyter筆記本來改進使用Python編程的方式開始。在獲得一個良好的基礎與Python工作在木星的筆記本,你將深入什么是TensorFlow,它如何幫助機器學習愛好者,以及如何解決它提出的挑戰。在此過程中,使用Jupyter筆記本創建的示例程序允許您應用本書前面的概念。
那些剛接觸機器學習的人可以通過這些簡單的程序來學習基本技能。本書末尾的術語表提供了常見的機器學習和Python關鍵字和定義,使學習更加容易。
你將學到什么
程序在Python和TensorFlow 解決機器學習的基本障礙 在Jupyter Notebook環境中發展
這本書是給誰的
理想的機器學習和深度學習愛好者誰對Python編程感興趣使用Tensorflow 2.0在Jupyter 筆記本應用程序。了解一些機器學習概念和Python編程(使用Python version 3)的基本知識會很有幫助。
題目:Applied Reinforcement Learning with Python With OpenAI Gym, Tensorflow, and Keras
深入研究強化學習算法,并通過Python將它們應用到不同的用例中。這本書涵蓋了重要的主題,如策略梯度和Q學習,并利用框架,如Tensorflow, Keras,和OpenAI Gym。
Python中的應用增強學習向您介紹了強化學習(RL)算法背后的理論和用于實現它們的代碼。您將在指導下了解OpenAI Gym的特性,從使用標準庫到創建自己的環境,然后了解如何構建強化學習問題,以便研究、開發和部署基于rl的解決方案。
你將學習:
這本書是給誰看的: 數據科學家、機器學習工程師和軟件工程師熟悉機器學習和深度學習的概念。
地址:
//www.springerprofessional.de/en/applied-reinforcement-learning-with-python/17098944
目錄:
第1章 強化學習導論
在過去的一年里,深度學習技術的不斷擴散和發展給各個行業帶來了革命性的變化。毫無疑問,這個領域最令人興奮的部分之一是強化學習(RL)。這本身往往是許多通用人工智能應用程序的基礎,例如學習玩視頻游戲或下棋的軟件。強化學習的好處是,假設可以將問題建模為包含操作、環境和代理的框架,那么代理就可以熟悉大量的任務。假設,解決問題的范圍可以從簡單的游戲,更復雜的3d游戲,自動駕駛汽車教學如何挑選和減少乘客在各種不同的地方以及教一個機械手臂如何把握對象和地點在廚房柜臺上。
第二章 強化學習算法
讀者應該知道,我們將利用各種深度學習和強化學習的方法在這本書。然而,由于我們的重點將轉移到討論實現和這些算法如何在生產環境中工作,我們必須花一些時間來更詳細地介紹算法本身。因此,本章的重點將是引導讀者通過幾個強化學習算法的例子,通常應用和展示他們在使用Open AI gym 不同的問題。
第三章 強化學習算法:Q學習及其變體
隨著策略梯度和Actor-Critic模型的初步討論的結束,我們現在可以討論讀者可能會發現有用的替代深度學習算法。具體來說,我們將討論Q學習、深度Q學習以及深度確定性策略梯度。一旦我們了解了這些,我們就可以開始處理更抽象的問題,更具體的領域,這將教會用戶如何處理不同任務的強化學習。
第四章 通過強化學習做市場
除了在許多書中發現的強化學習中的一些標準問題之外,最好看看那些答案既不客觀也不完全解決的領域。在金融領域,尤其是強化學習領域,最好的例子之一就是做市。我們將討論學科本身,提出一些不基于機器學習的基線方法,然后測試幾種基于強化學習的方法。
第五章 自定義OpenAI強化學習環境
在我們的最后一章,我們將專注于Open AI Gym,但更重要的是嘗試理解我們如何創建我們自己的自定義環境,這樣我們可以處理更多的典型用例。本章的大部分內容將集中在我對開放人工智能的編程實踐的建議,以及我如何編寫這個軟件的建議。最后,在我們完成創建環境之后,我們將繼續集中精力解決問題。對于這個例子,我們將集中精力嘗試創建和解決一個新的視頻游戲。