目錄
第一章 為什么機器學習至關重要。 本章描繪了人工智能和機器學習的發展全貌——從過去到現在,再到未來。
第二章 監督學習(一)。 本章通過例題介紹了線性回歸、損失函數、過擬合和梯度下降。
第三章 監督學習(二)。 本章介紹了兩種分類方法:邏輯回歸和SVM。
第四章 監督學習(三)。 本章介紹了非參數方法:k近鄰估計、決策樹、隨機森林。以及交叉驗證、超參數調整和集成模型的相關知識。
第五章 無監督學習。 本章介紹了聚類:K-means、層次聚類;降維:主成分分析(PCA)、奇異值分解(SVD)。
第六章 神經網絡與深度學習。 本章介紹了深度學習的工作原理、應用領域和實現方法,并回顧了神經網絡是如何從人類大腦中汲取靈感的。此外,本章還涉及卷積神經網絡(CNN)、遞歸神經網絡(DNN)以及神經網絡應用案例等內容。
第七章 強化學習。 本章介紹了強化學習的Exploration和Exploitation(探索-利用),包括馬爾可夫決策過程、Q-learning、策略學習和深度強化學習。
附錄: 最佳機器學習資源。 一份用于學習機器學習的資源清單。
前言
Machine Learning for Humans是國外機器學習愛好者之間流傳甚廣的一本電子書,它最先是Medium上的連載文章,后因文章質量出眾、閱讀價值高,作者在建議下把文章整理成電子書,供讀者免費閱讀。本書的作者Vishal Maini是耶魯大學的文學學士,目前已入職DeepMind;另一名作者Samer Sabri同樣畢業于耶魯大學,目前正在加州大學圣迭戈分校的計算機學院攻讀碩士學位。
哪些人應該讀一讀?
希望快速跟上機器學習發展潮流的開發者;
希望掌握機器學習入門知識并參與技術開發的普通讀者;
所有對機器學習感興趣的讀者。
本書向所有人免費開放閱讀。書中雖然會涉及概率論、統計學、程序設計、線性代數和微積分等基礎知識,但沒有數學基礎的讀者也能從中獲得啟發。
本書旨在幫助讀者在2—3個小時內迅速掌握機器學習高級概念,如果您想得到更多關于線上課程、重要書籍、相關項目等方面的內容,請參考附錄中的建議。
強化學習技術是人工智能從感知智能向決策智能發展的關鍵技術之一;是基于控制論、心理學、生理學、認知科學、電腦科學等多學科交叉的新興機器學習技術。
本書是學習和研究強化學習技術的重要參考書籍,作者是日本人工智能領域知名學者、東京大學杉山將教授。
全書將統計學習和強化學習結合,從模型無關策略迭代、模型無關策略搜索、模型相關強化學習三個技術路線角度,對強化學習函數估計中的基函數設計、樣本重用以及策略搜索、模型估計等做了深入淺出的介紹。本書適合于從事人工智能和機器學習研究和應用的專家學者、技術人員、研究生閱讀。
本書特色:
從現代機器學習的角度介紹了統計強化學習的基本概念和實用算法,為該領域提供了最新介紹。
涵蓋了各種類型的強化學習方法,包括基于模型和無模型的方法、策略迭代和策略搜索方法。
涵蓋了最近在數據挖掘和機器學習領域引入的方法,以便在強化學習和數據挖掘/機器學習研究人員之間提供系統橋梁。
呈現了最新的結果,包括強化學習的維數降低和風險敏感強化學習;介紹了許多示例來幫助讀者理解強化學習技術的直觀性和實用性。
「本書提供許多絕佳的機器學習實用案例。有別于工具書或理論證明,本書著重于實際問題處理,因此具備程式設計背景及對機器學習有興趣的讀者們均可輕松入門。」
如果你是平時喜歡上網搜集各種資料的程式設計師,想尋找并學習資料分析的方法與工具,本書將會是您了解機器學習最好的起點。在Machine Learning領域中,包含各種分析問題的工具與方法,可以讓我們很方便地架構出一套自動分析資料系統,使電腦可以自動分析。不過這些方法的背后,通常都蘊含著艱澀、難懂的數學理論,因而提高了學習門檻。有鑒于此,本書作者Drew Conway和John Myles準備了許多實用案例。在本書中,他們將以生動活潑的方式,使用案例導向方式,透過生活實例,帶領我們一起學習這些Machine Learning工具和統計工具的實際應用。經由這些過程學習機器學習領域的核心與價值,而非傳統數學導向的介紹方式。
本書采用實例導向、問題導向的介紹方式,在每一個章節中,透過實際問題,介紹機器學習典型問題與解決方法。其中包含:分類問題、預測問題、最佳化問題、推薦系統建置問題...等,在書中都會一一介紹。本書所有程式均以R語言撰寫,于每個章節中將學到:如何以R語言分析資料,并撰寫簡易機器學習演算法。《機器學習駭客秘笈》本書,是專為機器學習領域的初學者所寫的,無論是商業、政府機關或學術界...等都適用。
chapter 01使用R語言 chapter 02資料探索 chapter 03文本分類:垃圾郵件判斷 chapter 04項目排序:優先收件匣 chapter 05回歸分析:預測網頁瀏覽人次 chapter 06正則化:文本回歸 chapter 07最佳化:破解密碼 chapter 08 PCA:建立股價指數 chapter 09 MDS:視覺化呈現美國參議員相似度 chapter 10 kNN:推薦系統 chapter 11分析社群關系圖 chapter 12模型比較
雖然機器學習的專業知識并不意味著你可以創建自己的圖靈測試證明機器人(就像電影《機械總動員》中那樣),但它是人工智能的一種形式,是快速大規模識別機會和解決問題的最令人興奮的技術手段之一。任何掌握了機器學習原理的人都將掌握我們科技未來的很大一部分,并在職業領域開辟令人難以置信的新方向,包括欺詐檢測、優化搜索結果、服務實時廣告、信用評分、建立精確而復雜的定價模型等等。
與大多數機器學習書籍不同的是,完全更新的第二版《傻瓜機器學習》并不假設你有多年使用編程語言(如Python)的經驗,但讓你入門,涵蓋了入門的材料,將幫助你建立和運行你需要執行實際任務的構建模型。它揭示了推動機器學習的潛在的——迷人的——數學原理,同時也表明,你不需要是一個數學天才,就可以構建有趣的新工具,并將它們應用到你的工作和學習中。
從這些令人興奮的課程中學習,讓自己沉浸在深度學習、強化學習、機器學習、計算機視覺和NLP中!!
本文介紹了一階優化方法及其在機器學習中的應用。這不是一門關于機器學習的課程(特別是它不涉及建模和統計方面的考慮),它側重于使用和分析可以擴展到具有大量參數的大型數據集和模型的廉價方法。這些方法都是圍繞“梯度下降”的概念而變化的,因此梯度的計算起著主要的作用。本課程包括最優化問題的基本理論性質(特別是凸分析和一階微分學)、梯度下降法、隨機梯度法、自動微分、淺層和深層網絡。
掌握通過機器學習和深度學習識別和解決復雜問題的基本技能。使用真實世界的例子,利用流行的Python機器學習生態系統,這本書是你學習機器學習的藝術和科學成為一個成功的實踐者的完美伴侶。本書中使用的概念、技術、工具、框架和方法將教會您如何成功地思考、設計、構建和執行機器學習系統和項目。
使用Python進行的實際機器學習遵循結構化和全面的三層方法,其中包含了實踐示例和代碼。
第1部分側重于理解機器學習的概念和工具。這包括機器學習基礎,對算法、技術、概念和應用程序的廣泛概述,然后介紹整個Python機器學習生態系統。還包括有用的機器學習工具、庫和框架的簡要指南。
第2部分詳細介紹了標準的機器學習流程,重點介紹了數據處理分析、特征工程和建模。您將學習如何處理、總結和可視化各種形式的數據。特性工程和選擇方法將詳細介紹真實數據集,然后是模型構建、調優、解釋和部署。
第3部分探討了多個真實世界的案例研究,涵蓋了零售、交通、電影、音樂、營銷、計算機視覺和金融等不同領域和行業。對于每個案例研究,您將學習各種機器學習技術和方法的應用。動手的例子將幫助您熟悉最先進的機器學習工具和技術,并了解什么算法最適合任何問題。
實用的機器學習與Python將授權您開始解決您自己的問題與機器學習今天!
你將學習:
這本書是給誰看的 IT專業人士、分析師、開發人員、數據科學家、工程師、研究生
目錄:
Part I: Understanding Machine Learning
Chapter 12: Deep Learning for Computer Vision
在六個步驟中學習高級Python 3主題的基礎知識,所有這些都是為了讓您成為一個有價值的實踐者而設計的。這個更新版本的方法基于“六度分離”理論,該理論指出每個人和每件事都是最多六步之遙,并將每個主題分為兩部分: 理論概念和使用適當的Python 3包的實際實現。
您將從Python 3編程語言基礎、機器學習歷史、發展和系統開發框架開始。本文還介紹了一些關鍵的數據挖掘/分析概念,如探索性分析、特征降維、回歸、時間序列預測及其在Scikit-learn中的有效實現。您還將學習常用的模型診斷和調優技術。其中包括最優的類創建概率截止點、方差、偏差、裝袋、提升、集成投票、網格搜索、隨機搜索、貝葉斯優化和物聯網數據降噪技術。
最后,您將回顧先進的文本挖掘技術,推薦系統,神經網絡,深度學習,強化學習技術及其實現。本書中提供的所有代碼都將以iPython筆記本的形式提供,使您能夠嘗試這些示例并將其擴展到您的優勢。
你將學習
這本書是給誰看的
Python開發人員、數據工程師和機器學習工程師希望將他們的知識或職業擴展到機器學習領域。
書籍介紹: 機器學習是一門人工智能的科學,該領域的主要研究對象是人工智能,特別是如何在經驗學習中改善具體算法的性能。機器學習是人工智能及模式識別領域的共同研究熱點,其理論和方法已被廣泛應用于解決工程應用和科學領域的復雜問題。本書從機器學習的基礎入手,分別講述了分類、排序、降維、回歸等機器學習任務,是入門機器學習的一本好書。
作者: Mehryar Mohri,是紐約大學庫蘭特數學科學研究所的計算機科學教授,也是Google Research的研究顧問。
大綱介紹:
作者主頁://cs.nyu.edu/~mohri/
近幾年來,隨著機器學習的普及,機器學習系統的公平性問題引起了實際的道德、社會等問題。圖書《公平性與機器學習—局限與機遇》以公平性為核心問題來看待機器學習,提供了對當前機器學習實踐以及為實現公平而提出的技術修復方案的批判性思考。
社會、道德和機器學習自身等角度,介紹了目前機器學習中的公平性問題,如由于數據導致的偏置(bias)等問題。
圖書《Fairness and Machine Learning - Limitations and Opportunities》(《公平性與機器學習—局限與機遇》)以公平性為核心問題來看待機器學習,強調機器學習在道德方面的挑戰。作者希望該書盡可能地被廣泛閱讀,但在寫作時依然堅持著技術的嚴謹性。該書并沒有提供包羅萬象的對公平性完整的正式定義,也沒有提出一個快速解決社會對自動決策擔憂的修復方案。
解決機器學習公平性問題需要認真理解機器學習工具的局限性。該書提供了對當前機器學習實踐以及為實現公平而提出的技術修復方案的批判性思考。雖然這些問題都沒有簡單的答案,作者希望這本書能夠幫助讀者更深層次地理解如何構建負責任的機器學習系統。
由Marc Peter Deisenroth,A Aldo Faisal和Cheng Soon Ong撰寫的《機器學習數學基礎》“Mathematics for Machine Learning” 最新版417頁pdf版本已經放出,作者表示撰寫這本書旨在激勵人們學習數學概念。這本書并不打算涵蓋前沿的機器學習技術,因為已經有很多書這樣做了。相反,作者的目標是通過該書提供閱讀其他書籍所需的數學基礎。這本書分為兩部分:數學基礎知識和使用數學基礎知識進行機器學習算法示例。值得初學者收藏和學習!