題目: Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2nd Edition
書籍簡介: 通過最近的一系列突破,深度學習促進了整個機器學習領域的發展。現在,即使對這項技術一無所知的程序員也可以使用簡單、高效的工具來實現能夠從數據中學習的程序。這本實用的書告訴你怎么做。通過使用具體的例子、最小理論和兩個可用于生產的Python框架Scikit Learn和TensorFlow的作者Aurélien Géron幫助您直觀地理解用于構建智能系統的概念和工具。您將學習一系列技術,從簡單的線性回歸開始,然后進入深層神經網絡。每一章的練習都有助于你應用你所學的知識。
探索機器學習領域,特別是神經網絡
使用Scikit Learn端到端跟蹤示例機器學習項目
探索幾種訓練模型,包括支持向量機、決策樹、隨機森林和集成方法
利用TensorFlow庫建立和訓練神經網絡
深入研究神經網絡結構,包括卷積網絡、遞歸網絡和深度強化學習
學習深度神經網絡的訓練和縮放技術
作者簡介: Aurélien Géron,Kiwisoft的機器學習顧問,也是暢銷書《與Scikit-Learn、Keras和TensorFlow一起進行機器學習》的作者。此前,他曾領導YouTube的視頻分類團隊,是Wifirst的創始人和首席技術官,并在多個領域擔任顧問:金融(摩根大樓和法國興業銀行)、國防(加拿大國防部)和醫療(輸血)。他還出版了一些技術書籍(關于c++、WiFi和互聯網架構),他是巴黎多芬大學的講師。
【導讀】自2015年11月TensorFlow第一個開源版本發布以來,它便迅速躋身于最激動人心的機器學習庫的行列,并在科研、產品和教育等領域正在得到日益廣泛的應用。這個庫也在不斷地得到改進、充實和優化。今天給大家推薦一本偏實戰的教程《Hands-On Machine Learning with Scikit-Learn and TensorFlow, 2nd Edition》第二版,使用最新TensorFlow 2的官方高級API,幫助你直觀地理解構建智能系統的概念和工具。從業者將學習一系列可以在工作中快速使用的技術。第1部分使用Scikit-Learn來介紹基本的機器學習任務,例如簡單的線性回歸。第2部分已經過重大更新,采用Keras和TensorFlow 2.0引導讀者通過使用深度神經網絡的更先進的機器學習方法。通過每章的練習來幫助你應用所學知識,你只需要編程經驗即可開始使用。
Hands-On Machine Learning with Scikit-Learn and TensorFlow, 2nd Edition
▌本書簡介
通過近年來一系列的突破,深度學習推動了整個機器學習領域的發展。現在,即使對這種技術幾乎一無所知的程序員也可以使用簡單、高效的工具來實現能夠從數據中學習的程序。這本暢銷書的最新版本使用了具體的例子、最少理論和可復現的Python框架,幫助您直觀地理解用于構建人工智能系統的概念和工具。
您將學習一系列可以快速使用的技術。每一章都有練習來幫助你應用所學,你所需要的只是編程經驗。所有代碼都已更新為TensorFlow 2和最新版本的Scikit-Learn和其他庫。
▌相關代碼
//github.com/ageron/handson-ml2
參考鏈接:
書名: Hands-On Machine Learning with Scikit-Learn and TensorFlow
主要內容:
這本書分為兩個部分。
第一部分,機器學習的基礎知識,涵蓋以下主題:
第二部分,神經網絡和深度學習,包括以下主題:
第一部分主要基于 scikit-learn ,而第二部分則使用 TensorFlow 。 注意:不要太急于深入學習到核心知識:深度學習無疑是機器學習中最令人興奮的領域之 一,但是你應該首先掌握基礎知識。而且,大多數問題可以用較簡單的技術很好地解決(而 不需要深度學習),比如隨機森林和集成方法(我們會在第一部分進行討論)。如果你擁有 足夠的數據,計算能力和耐心,深度學習是最適合復雜的問題的,如圖像識別,語音識別或 自然語言處理。
機器學習(ML)是一組用于發現數據關系的編程技術。使用ML算法,您可以對數據進行聚類和分類,以執行建議或欺詐檢測之類的任務,并對銷售趨勢、風險分析和其他預測進行預測。機器學習曾經是學術數據科學家的領域,現在已經成為主流的業務流程,而像易于學習的R編程語言這樣的工具將高質量的數據分析交到任何程序員的手中。《使用R、tidyverse和mlr的機器學習》將教會您廣泛使用的ML技術,以及如何使用R編程語言及其強大的工具生態系統將它們應用于您自己的數據集。這本書會讓你開始!
對這項技術
機器學習技術準確而有效地識別數據中的模式和關系,并使用這些模型對新數據進行預測。ML技術甚至可以在相對較小的數據集上工作,使這些技能成為幾乎所有數據分析任務的強大盟友。R語言的設計考慮了數學和統計的應用。小型數據集是它的最佳選擇,它的現代數據科學工具(包括流行的tidyverse包)使R成為ML的自然選擇。
關于這本書
《使用R、tidyverse和mlr的機器學習》將教會您如何使用強大的R編程語言從數據中獲得有價值的見解。作者兼R專家Hefin Ioan Rhys以其引人入勝的、非正式的風格為ML基礎知識打下了堅實的基礎,并向您介紹了tidyverse,這是一套專門為實用數據科學設計的強大的R工具。有了這些基礎知識,您將更深入地研究常用的機器學習技術,包括分類、預測、約簡和聚類算法,并將每種技術應用于實際數據,從而對有趣的問題進行預測。
使用tidyverse包,您將轉換、清理和繪制您的數據,并在工作中使用數據科學最佳實踐。為了簡化您的學習過程,您還將使用R的mlr包,這是一個非常靈活的接口,用于各種核心算法,允許您以最少的編碼執行復雜的ML任務。您將探索一些基本概念,如過擬合、欠擬合、驗證模型性能,以及如何為您的任務選擇最佳模型。富有啟發性的圖片提供了清晰的解釋,鞏固了你的新知識。
無論您是在處理業務問題、處理研究數據,還是僅僅是一個有數據頭腦的開發人員,您都可以通過本實用教程立即構建自己的ML管道!
里面有什么
掌握通過機器學習和深度學習識別和解決復雜問題的基本技能。使用真實世界的例子,利用流行的Python機器學習生態系統,這本書是你學習機器學習的藝術和科學成為一個成功的實踐者的完美伴侶。本書中使用的概念、技術、工具、框架和方法將教會您如何成功地思考、設計、構建和執行機器學習系統和項目。
使用Python進行的實際機器學習遵循結構化和全面的三層方法,其中包含了實踐示例和代碼。
第1部分側重于理解機器學習的概念和工具。這包括機器學習基礎,對算法、技術、概念和應用程序的廣泛概述,然后介紹整個Python機器學習生態系統。還包括有用的機器學習工具、庫和框架的簡要指南。
第2部分詳細介紹了標準的機器學習流程,重點介紹了數據處理分析、特征工程和建模。您將學習如何處理、總結和可視化各種形式的數據。特性工程和選擇方法將詳細介紹真實數據集,然后是模型構建、調優、解釋和部署。
第3部分探討了多個真實世界的案例研究,涵蓋了零售、交通、電影、音樂、營銷、計算機視覺和金融等不同領域和行業。對于每個案例研究,您將學習各種機器學習技術和方法的應用。動手的例子將幫助您熟悉最先進的機器學習工具和技術,并了解什么算法最適合任何問題。
實用的機器學習與Python將授權您開始解決您自己的問題與機器學習今天!
你將學習:
這本書是給誰看的 IT專業人士、分析師、開發人員、數據科學家、工程師、研究生
目錄:
Part I: Understanding Machine Learning
Chapter 12: Deep Learning for Computer Vision
簡介:
自從2012年以來,最近的技術史上最重大的事件也許就是神經網絡爆炸了。標記數據集的增長,計算能力的提高以及算法的創新齊頭并進。從那時起,深度神經網絡使以前無法實現的任務得以實現,并提高了任務的準確性,使它們超出了學術研究范圍,并進入了語音識別,圖像標記,生成模型和推薦系統等領域的實際應用。在這種背景下,Google Brain的團隊開始開發TensorFlow.js。該項目開始時,許多人認為“ JavaScript深度學習”是一種新穎事物,對于某些用例來說并不能當真。盡管Python已經有了一些完善的,功能強大的深度學習框架,但JavaScript機器學習的前景仍然是零散的和不完整的。在當時可用的少數JavaScript庫中,大多數僅支持以其他語言(通常是Python)進行預訓練的部署模型。
這本書不僅是作為如何在TensorFlow.js中編寫代碼的秘訣,而且還是以JavaScript和Web開發人員的母語為基礎的機器學習基礎入門課程。深度學習領域是一個快速發展的領域。我們相信,無需正式的數學處理就可以對機器學習有深入的了解,而這種了解將使您能夠在技術的未來發展中保持最新。有了這本書,您就成為成為成長中的JavaScript機器學習從業人員社區的第一步,他們已經在JavaScript和深度學習之間的交匯處帶來了許多有影響力的應用程序。我們衷心希望本書能激發您在這一領域的創造力和獨創性。
目錄:
內容簡介:
本書分為四個部分。第一部分僅由第一章組成,向您介紹了人工智能,機器學習和深度學習的概況,以及在JavaScript中實踐深度學習為何有意義。第二部分是對深度學習中最基礎和最常遇到的概念的簡要介紹。本書的第三部分系統地為希望建立對更前沿技術的理解的用戶,提供了深度學習的高級主題,重點是ML系統的特定挑戰領域以及與之配合使用的TensorFlow.js工具。
主題: Mastering Machine Learning with Python in Six Steps
簡介: 分六個步驟探索高級Python 3主題的基本原理,所有這些步驟都是為了讓您成為一個有價值的實踐者而設計的。這個更新版本的方法是基于“六度分離”理論,它指出每個人和所有事物都是最大的六步,并將每一個主題呈現為兩個部分:理論概念和使用適當的Python 3包的實際實現。您將從Python3編程語言的基礎知識、機器學習歷史、演化和系統開發框架開始。本文還介紹了探索性分析、特征降維、回歸、時間序列預測等關鍵數據挖掘/分析概念及其在Scikit學習中的有效實現。您還將學習常用的模型診斷和調優技術。其中包括類創建的最佳概率截止點、方差、偏差、bagging、boosting、集成投票、網格搜索、隨機搜索、貝葉斯優化以及物聯網數據的降噪技術。最后,您將回顧高級文本挖掘技術、推薦系統、神經網絡、深度學習、強化學習技術及其實現。本書中提供的所有代碼都將以iPython筆記本的形式提供,使您能夠嘗試這些示例并將它們擴展到您的優勢。
作者簡介: Swamynathan Manohar 是一名數據科學從業者和一名狂熱的程序員,在數據倉庫、商業智能(BI)、分析工具開發、即席分析、預測建模、數據科學產品開發、咨詢等各種數據科學相關領域擁有超過14年的經驗,制定策略并執行分析計劃。
本書的作者是Aurélien Géron,一名機器學習顧問。作為一名前Google職員,在2013至2016年間,他領導了YouTube視頻分類團隊。在2002至2012年間,他身為法國主要的無線ISP Wifirst的創始人和CTO,在2001年他還是Polyconseil的創始人和CTO。本書通過具體的例子、很少的理論以及兩款成熟的Python框架:Scikit-Learn和TensorFlow,作者Aurélien Géron會幫助你掌握構建智能系統所需要的概念和工具。你將會學習到各種技術,從簡單的線性回歸及發展到深度神經網絡。