在六個步驟中學習高級Python 3主題的基礎知識,所有這些都是為了讓您成為一個有價值的實踐者而設計的。這個更新版本的方法基于“六度分離”理論,該理論指出每個人和每件事都是最多六步之遙,并將每個主題分為兩部分: 理論概念和使用適當的Python 3包的實際實現。
您將從Python 3編程語言基礎、機器學習歷史、發展和系統開發框架開始。本文還介紹了一些關鍵的數據挖掘/分析概念,如探索性分析、特征降維、回歸、時間序列預測及其在Scikit-learn中的有效實現。您還將學習常用的模型診斷和調優技術。其中包括最優的類創建概率截止點、方差、偏差、裝袋、提升、集成投票、網格搜索、隨機搜索、貝葉斯優化和物聯網數據降噪技術。
最后,您將回顧先進的文本挖掘技術,推薦系統,神經網絡,深度學習,強化學習技術及其實現。本書中提供的所有代碼都將以iPython筆記本的形式提供,使您能夠嘗試這些示例并將其擴展到您的優勢。
你將學習
這本書是給誰看的
Python開發人員、數據工程師和機器學習工程師希望將他們的知識或職業擴展到機器學習領域。
機器學習方法以有限的資源快速地從大量的數據中提取價值。它們是在廣泛的工業應用中建立起來的工具,包括搜索引擎、DNA測序、股票市場分析和機器人移動,它們的使用正在迅速蔓延。了解這些方法的人可以選擇有回報的工作。這個動手實踐書冊為計算機科學學生打開這些機會。它是專為具有有限的線性代數和微積分背景的大四本科生和碩士生設計的。它在圖模型的框架內開發了從基本推理到高級技術的所有內容。學生們學到的不僅僅是一系列的技巧,他們還會發展分析和解決問題的技巧,這些技巧使他們能夠適應真實的世界。許多例子和練習,以計算機為基礎和理論,包括在每一章。為學生和教師的資源,包括一個MATLAB工具箱,可在網上獲得。
本文介紹了一階優化方法及其在機器學習中的應用。這不是一門關于機器學習的課程(特別是它不涉及建模和統計方面的考慮),它側重于使用和分析可以擴展到具有大量參數的大型數據集和模型的廉價方法。這些方法都是圍繞“梯度下降”的概念而變化的,因此梯度的計算起著主要的作用。本課程包括最優化問題的基本理論性質(特別是凸分析和一階微分學)、梯度下降法、隨機梯度法、自動微分、淺層和深層網絡。
Python是一種多范式編程語言,已經成為數據科學家進行數據分析、可視化和機器學習的首選語言。有沒有想過如何成為有效處理數據分析問題的專家,解決這些問題,并從數據中提取所有可用信息?好了,別再找了,這就是你要的書!
通過這個全面的指南,您將探索數據,并以一種有意義的方式展示統計分析的結果和結論。您將能夠快速準確地執行實際操作的排序、縮減和后續分析,并充分理解數據分析方法如何支持業務決策。
您將首先了解Python中可用的數據分析工具,然后探索用于識別數據模式的統計模型。漸漸地,您將使用Python、panda和SciPy回顧統計推斷。在此之后,我們將集中于使用計算工具執行回歸,您將了解如何用算法的方式識別數據中的集群。最后,我們將深入探討使用貝葉斯方法量化因果關系的高級技術,您將發現如何使用Python的工具進行監督機器學習。
你會學到什么
獲得高級數據分析概念的廣泛基礎,并發現數據庫中的最新革命,如Neo4j、Elasticsearch和MongoDB。這本書討論了如何實現ETL技術,包括主題爬行,這是應用在諸如高頻算法交易和面向目標的對話系統等領域。您還將看到機器學習概念的示例,如半監督學習、深度學習和NLP。使用Python的高級數據分析還包括時間序列和主成分分析等重要的傳統數據分析技術。
讀完這本書,你將對分析項目的每個技術方面都有了經驗。您將了解使用Python代碼的概念,并提供在您自己的項目中使用的示例。
你會學到什么
這本書是給誰看的
對數據分析領域感興趣的數據科學家和軟件開發人員。
本書通過提供真實的案例研究和示例,為使用Python庫進行機器學習提供了堅實的基礎。它涵蓋了諸如機器學習基礎、Python入門、描述性分析和預測分析等主題。包括高級機器學習概念,如決策樹學習、隨機森林、增強、推薦系統和文本分析。這本書在理論理解和實際應用之間采取了一種平衡的方法。所有的主題都包括真實世界的例子,并提供如何探索、構建、評估和優化機器學習模型的逐步方法。
機器學習(ML)是一組用于發現數據關系的編程技術。使用ML算法,您可以對數據進行聚類和分類,以執行建議或欺詐檢測之類的任務,并對銷售趨勢、風險分析和其他預測進行預測。機器學習曾經是學術數據科學家的領域,現在已經成為主流的業務流程,而像易于學習的R編程語言這樣的工具將高質量的數據分析交到任何程序員的手中。《使用R、tidyverse和mlr的機器學習》將教會您廣泛使用的ML技術,以及如何使用R編程語言及其強大的工具生態系統將它們應用于您自己的數據集。這本書會讓你開始!
對這項技術
機器學習技術準確而有效地識別數據中的模式和關系,并使用這些模型對新數據進行預測。ML技術甚至可以在相對較小的數據集上工作,使這些技能成為幾乎所有數據分析任務的強大盟友。R語言的設計考慮了數學和統計的應用。小型數據集是它的最佳選擇,它的現代數據科學工具(包括流行的tidyverse包)使R成為ML的自然選擇。
關于這本書
《使用R、tidyverse和mlr的機器學習》將教會您如何使用強大的R編程語言從數據中獲得有價值的見解。作者兼R專家Hefin Ioan Rhys以其引人入勝的、非正式的風格為ML基礎知識打下了堅實的基礎,并向您介紹了tidyverse,這是一套專門為實用數據科學設計的強大的R工具。有了這些基礎知識,您將更深入地研究常用的機器學習技術,包括分類、預測、約簡和聚類算法,并將每種技術應用于實際數據,從而對有趣的問題進行預測。
使用tidyverse包,您將轉換、清理和繪制您的數據,并在工作中使用數據科學最佳實踐。為了簡化您的學習過程,您還將使用R的mlr包,這是一個非常靈活的接口,用于各種核心算法,允許您以最少的編碼執行復雜的ML任務。您將探索一些基本概念,如過擬合、欠擬合、驗證模型性能,以及如何為您的任務選擇最佳模型。富有啟發性的圖片提供了清晰的解釋,鞏固了你的新知識。
無論您是在處理業務問題、處理研究數據,還是僅僅是一個有數據頭腦的開發人員,您都可以通過本實用教程立即構建自己的ML管道!
里面有什么
掌握通過機器學習和深度學習識別和解決復雜問題的基本技能。使用真實世界的例子,利用流行的Python機器學習生態系統,這本書是你學習機器學習的藝術和科學成為一個成功的實踐者的完美伴侶。本書中使用的概念、技術、工具、框架和方法將教會您如何成功地思考、設計、構建和執行機器學習系統和項目。
使用Python進行的實際機器學習遵循結構化和全面的三層方法,其中包含了實踐示例和代碼。
第1部分側重于理解機器學習的概念和工具。這包括機器學習基礎,對算法、技術、概念和應用程序的廣泛概述,然后介紹整個Python機器學習生態系統。還包括有用的機器學習工具、庫和框架的簡要指南。
第2部分詳細介紹了標準的機器學習流程,重點介紹了數據處理分析、特征工程和建模。您將學習如何處理、總結和可視化各種形式的數據。特性工程和選擇方法將詳細介紹真實數據集,然后是模型構建、調優、解釋和部署。
第3部分探討了多個真實世界的案例研究,涵蓋了零售、交通、電影、音樂、營銷、計算機視覺和金融等不同領域和行業。對于每個案例研究,您將學習各種機器學習技術和方法的應用。動手的例子將幫助您熟悉最先進的機器學習工具和技術,并了解什么算法最適合任何問題。
實用的機器學習與Python將授權您開始解決您自己的問題與機器學習今天!
你將學習:
這本書是給誰看的 IT專業人士、分析師、開發人員、數據科學家、工程師、研究生
目錄:
Part I: Understanding Machine Learning
Chapter 12: Deep Learning for Computer Vision
這本書在對算法工作原理的高層次理解和對優化模型的具體細節的了解之間找到一個平衡點。這本書將給你的信心和技能時,開發所有主要的機器學習模型。在這本Pro機器學習算法中,您將首先在Excel中開發算法,以便在用Python/R實現模型之前,實際了解可以在模型中調優的所有細節。
你將涵蓋所有主要的算法:監督和非監督學習,其中包括線性/邏輯回歸;k - means聚類;主成分分析;推薦系統;決策樹;隨機森林;“GBM”;和神經網絡。您還將通過CNNs、RNNs和word2vec等文本挖掘工具了解最新的深度學習。你不僅要學習算法,還要學習特征工程的概念來最大化模型的性能。您將看到該理論與案例研究,如情緒分類,欺詐檢測,推薦系統,和圖像識別,以便您得到最佳的理論和實踐為工業中使用的絕大多數機器學習算法。在學習算法的同時,您還將接觸到在所有主要云服務提供商上運行的機器學習模型。
你會學到什么?
這本書是給誰看的
希望轉換到數據科學角色的業務分析師/ IT專業人員。想要鞏固機器學習知識的數據科學家。
主題: Mastering Machine Learning with Python in Six Steps
簡介: 分六個步驟探索高級Python 3主題的基本原理,所有這些步驟都是為了讓您成為一個有價值的實踐者而設計的。這個更新版本的方法是基于“六度分離”理論,它指出每個人和所有事物都是最大的六步,并將每一個主題呈現為兩個部分:理論概念和使用適當的Python 3包的實際實現。您將從Python3編程語言的基礎知識、機器學習歷史、演化和系統開發框架開始。本文還介紹了探索性分析、特征降維、回歸、時間序列預測等關鍵數據挖掘/分析概念及其在Scikit學習中的有效實現。您還將學習常用的模型診斷和調優技術。其中包括類創建的最佳概率截止點、方差、偏差、bagging、boosting、集成投票、網格搜索、隨機搜索、貝葉斯優化以及物聯網數據的降噪技術。最后,您將回顧高級文本挖掘技術、推薦系統、神經網絡、深度學習、強化學習技術及其實現。本書中提供的所有代碼都將以iPython筆記本的形式提供,使您能夠嘗試這些示例并將它們擴展到您的優勢。
作者簡介: Swamynathan Manohar 是一名數據科學從業者和一名狂熱的程序員,在數據倉庫、商業智能(BI)、分析工具開發、即席分析、預測建模、數據科學產品開發、咨詢等各種數據科學相關領域擁有超過14年的經驗,制定策略并執行分析計劃。
題目: Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2nd Edition
書籍簡介: 通過最近的一系列突破,深度學習促進了整個機器學習領域的發展。現在,即使對這項技術一無所知的程序員也可以使用簡單、高效的工具來實現能夠從數據中學習的程序。這本實用的書告訴你怎么做。通過使用具體的例子、最小理論和兩個可用于生產的Python框架Scikit Learn和TensorFlow的作者Aurélien Géron幫助您直觀地理解用于構建智能系統的概念和工具。您將學習一系列技術,從簡單的線性回歸開始,然后進入深層神經網絡。每一章的練習都有助于你應用你所學的知識。
探索機器學習領域,特別是神經網絡
使用Scikit Learn端到端跟蹤示例機器學習項目
探索幾種訓練模型,包括支持向量機、決策樹、隨機森林和集成方法
利用TensorFlow庫建立和訓練神經網絡
深入研究神經網絡結構,包括卷積網絡、遞歸網絡和深度強化學習
學習深度神經網絡的訓練和縮放技術
作者簡介: Aurélien Géron,Kiwisoft的機器學習顧問,也是暢銷書《與Scikit-Learn、Keras和TensorFlow一起進行機器學習》的作者。此前,他曾領導YouTube的視頻分類團隊,是Wifirst的創始人和首席技術官,并在多個領域擔任顧問:金融(摩根大樓和法國興業銀行)、國防(加拿大國防部)和醫療(輸血)。他還出版了一些技術書籍(關于c++、WiFi和互聯網架構),他是巴黎多芬大學的講師。