利用機器和深度學習模型,使用PySpark在實時數據上構建應用程序。這本書對于那些想要學習使用這種語言來執行探索性數據分析和解決一系列商業挑戰的人來說是完美的。
您將從回顧PySpark的基礎知識開始,例如Spark的核心架構,并了解如何使用PySpark進行大數據處理,如數據攝取、清理和轉換技術。接下來,使用PySpark構建用于分析流數據的工作流,并比較各種流平臺。
然后,您將看到如何使用帶PySpark的氣流調度不同的Spark作業,并通過本書檢查調優機和深度學習模型進行實時預測。本書最后討論了圖幀以及在PySpark中使用圖算法執行網絡分析。書中提供的所有代碼都可以在Github的Python腳本中找到。
下一步,我們將學習深度學習,這種機器學習方法將在瞬間改變我們周圍的世界。在這本實用的書中,您將加快使用Facebook的開源PyTorch框架的關鍵思想,并獲得您需要創建自己的神經網絡的最新技能。
Ian Pointer向您展示了如何在基于云的環境中設置PyTorch,然后帶領您完成神經架構的創建,以方便對圖像、聲音、文本的操作,并深入了解每個元素。他還涵蓋了將遷移學習應用到圖像、調試模型和生產中的PyTorch的關鍵概念。
學習如何將深度學習模型部署到生產中 探索幾家領先公司的PyTorch用例 學習如何將轉移學習應用到圖像 使用在維基百科上訓練的模型應用尖端的NLP技術 使用PyTorch的torchaudio庫對基于卷積模型的音頻數據進行分類 使用TensorBoard和Flame圖調試PyTorch模型 將生產中的PyTorch應用部署在Docker容器和運行在谷歌云上的Kubernetes集群中
如果你對機器學習很好奇,但不知道從哪里開始,這就是你一直在等待的書。它專注于被稱為深度學習的機器學習子領域,解釋了核心概念,并為您提供了開始構建自己的模型所需的基礎。而不是簡單地概述使用現有工具包的教程,實用深度學習教你為什么使用深度學習,并將激勵你進一步探索。
你所需要的是對計算機編程和高中數學的基本熟悉——這本書將涵蓋其余的內容。在介紹Python之后,您將瀏覽關鍵主題,如如何構建良好的訓練數據集,使用scikit-learn和Keras庫,并評估您的模型的性能。
您還將了解:
如何使用經典的機器學習模型,如k-最近鄰,隨機森林,和支持向量機 神經網絡是如何工作的,又是如何訓練的 如何使用卷積神經網絡 如何從零開始開發一個成功的深度學習模型 您將在此過程中進行實驗,構建最終的案例研究,其中包含您所學到的所有內容。 您將使用的所有代碼都可以在這里獲得: //github.com/rkneusel9/PracticalDeepLearningPython/
這是對這個動態的,不斷擴大的領域的完美介紹,實用深度學習將給你的技能和信心潛入自己的機器學習項目。
學習使用Python分析數據和預測結果的更簡單和更有效的方法
Python機器學習教程展示了通過關注兩個核心機器學習算法家族來成功分析數據,本書能夠提供工作機制的完整描述,以及使用特定的、可破解的代碼來說明機制的示例。算法用簡單的術語解釋,沒有復雜的數學,并使用Python應用,指導算法選擇,數據準備,并在實踐中使用訓練過的模型。您將學習一套核心的Python編程技術,各種構建預測模型的方法,以及如何測量每個模型的性能,以確保使用正確的模型。關于線性回歸和集成方法的章節深入研究了每種算法,你可以使用書中的示例代碼來開發你自己的數據分析解決方案。
機器學習算法是數據分析和可視化的核心。在過去,這些方法需要深厚的數學和統計學背景,通常需要結合專門的R編程語言。這本書演示了機器學習可以如何實現使用更廣泛的使用和可訪問的Python編程語言。
使用線性和集成算法族預測結果
建立可以解決一系列簡單和復雜問題的預測模型
使用Python應用核心機器學習算法
直接使用示例代碼構建自定義解決方案
機器學習不需要復雜和高度專業化。Python使用了更簡單、有效和經過良好測試的方法,使這項技術更容易為更廣泛的受眾所接受。Python中的機器學習將向您展示如何做到這一點,而不需要廣泛的數學或統計背景。
通過使用Python開發用例,全面了解監督學習算法您將學習監督學習概念、Python代碼、數據集、最佳實踐、常見問題和缺陷的解決方案,以及實現結構化、文本和圖像數據集算法的實踐知識。
你將從介紹機器學習開始,強調監督學習、半監督學習和非監督學習之間的區別。在接下來的章節中,你將學習回歸和分類問題,它們背后的數學,像線性回歸、邏輯回歸、決策樹、KNN、樸素貝葉斯等算法,以及像隨機森林、支持向量機、梯度增強和神經網絡等高級算法。提供了所有算法的Python實現。最后,您將得到一個端到端模型開發流程,包括模型的部署和維護。在閱讀了Python的監督學習之后,你將會對監督學習和它的實際實現有一個廣泛的理解,并且能夠以一種創新的方式運行代碼和擴展它。
你將學習:
這本書是給誰的
機器學習(ML)是一組用于發現數據關系的編程技術。使用ML算法,您可以對數據進行聚類和分類,以執行建議或欺詐檢測之類的任務,并對銷售趨勢、風險分析和其他預測進行預測。機器學習曾經是學術數據科學家的領域,現在已經成為主流的業務流程,而像易于學習的R編程語言這樣的工具將高質量的數據分析交到任何程序員的手中。《使用R、tidyverse和mlr的機器學習》將教會您廣泛使用的ML技術,以及如何使用R編程語言及其強大的工具生態系統將它們應用于您自己的數據集。這本書會讓你開始!
對這項技術
機器學習技術準確而有效地識別數據中的模式和關系,并使用這些模型對新數據進行預測。ML技術甚至可以在相對較小的數據集上工作,使這些技能成為幾乎所有數據分析任務的強大盟友。R語言的設計考慮了數學和統計的應用。小型數據集是它的最佳選擇,它的現代數據科學工具(包括流行的tidyverse包)使R成為ML的自然選擇。
關于這本書
《使用R、tidyverse和mlr的機器學習》將教會您如何使用強大的R編程語言從數據中獲得有價值的見解。作者兼R專家Hefin Ioan Rhys以其引人入勝的、非正式的風格為ML基礎知識打下了堅實的基礎,并向您介紹了tidyverse,這是一套專門為實用數據科學設計的強大的R工具。有了這些基礎知識,您將更深入地研究常用的機器學習技術,包括分類、預測、約簡和聚類算法,并將每種技術應用于實際數據,從而對有趣的問題進行預測。
使用tidyverse包,您將轉換、清理和繪制您的數據,并在工作中使用數據科學最佳實踐。為了簡化您的學習過程,您還將使用R的mlr包,這是一個非常靈活的接口,用于各種核心算法,允許您以最少的編碼執行復雜的ML任務。您將探索一些基本概念,如過擬合、欠擬合、驗證模型性能,以及如何為您的任務選擇最佳模型。富有啟發性的圖片提供了清晰的解釋,鞏固了你的新知識。
無論您是在處理業務問題、處理研究數據,還是僅僅是一個有數據頭腦的開發人員,您都可以通過本實用教程立即構建自己的ML管道!
里面有什么
掌握通過機器學習和深度學習識別和解決復雜問題的基本技能。使用真實世界的例子,利用流行的Python機器學習生態系統,這本書是你學習機器學習的藝術和科學成為一個成功的實踐者的完美伴侶。本書中使用的概念、技術、工具、框架和方法將教會您如何成功地思考、設計、構建和執行機器學習系統和項目。
使用Python進行的實際機器學習遵循結構化和全面的三層方法,其中包含了實踐示例和代碼。
第1部分側重于理解機器學習的概念和工具。這包括機器學習基礎,對算法、技術、概念和應用程序的廣泛概述,然后介紹整個Python機器學習生態系統。還包括有用的機器學習工具、庫和框架的簡要指南。
第2部分詳細介紹了標準的機器學習流程,重點介紹了數據處理分析、特征工程和建模。您將學習如何處理、總結和可視化各種形式的數據。特性工程和選擇方法將詳細介紹真實數據集,然后是模型構建、調優、解釋和部署。
第3部分探討了多個真實世界的案例研究,涵蓋了零售、交通、電影、音樂、營銷、計算機視覺和金融等不同領域和行業。對于每個案例研究,您將學習各種機器學習技術和方法的應用。動手的例子將幫助您熟悉最先進的機器學習工具和技術,并了解什么算法最適合任何問題。
實用的機器學習與Python將授權您開始解決您自己的問題與機器學習今天!
你將學習:
這本書是給誰看的 IT專業人士、分析師、開發人員、數據科學家、工程師、研究生
目錄:
Part I: Understanding Machine Learning
Chapter 12: Deep Learning for Computer Vision
主題: Pytorch與Keras;Beginning Anomaly Detection Using Python-Based Deep Learning
摘要: 利用這本簡單易懂的初學者指南,了解如何將深度學習應用于異常檢測任務。本書使用Python中的Keras和PyTorch,重點介紹如何將各種深度學習模型應用于半監督和非監督異常檢測任務。這本書首先解釋了異常檢測是什么,它的用途和重要性。在介紹了使用Python中的Scikit Learn進行異常檢測的統計和傳統機器學習方法之后,本書隨后介紹了深度學習,詳細介紹了如何在Keras和Pythorch中建立和訓練深度學習模型,然后將重點轉移到以下深度學習模型的應用到異常檢測:各種類型的自動編碼器、受限的Boltzmann機器、RNN和LSTM,以及時間卷積網絡。這本書探索無監督和半監督異常檢測以及基于時間序列的異常檢測的基礎知識。在這本書的最后,你將有一個全面的了解異常檢測的基本任務,以及各種方法來接近異常檢測,從傳統的方法到深入學習。此外,還向您介紹了Scikit Learn,并能夠在Keras和PyTorch中創建深度學習模型。
作者簡介: Sridhar Alla是Bluewhale的聯合創始人和首席技術官,該公司幫助大大小小的組織構建人工智能驅動的大數據解決方案和分析。他是一位出版書籍的作家,并熱衷于在眾多階層、Hadoop世界、Spark Summit和其他會議上發表演講。他還向美國專利局申請了幾項大規模計算和分布式系統的專利。他在Spark、Flink、Hadoop、AWS、Azure、Tensorflow、Cassandra等多個技術領域擁有豐富的實踐經驗。
Suman KalyanAdari是佛羅里達大學計算機科學學士學位的本科生。他從大一開始就在網絡安全領域進行深入的學習研究,并于2019年6月在美國俄勒岡州波特蘭舉行的關于可靠和安全機器學習的IEEE可靠系統和網絡研討會上發表演講。
簡介: Google一直是引入突破性技術和產品的先驅。在效率和規模方面,TensorFlow也不例外,因此,編寫本書只是向讀者介紹TensorFlow核心團隊所做的這些重要更改。本書著重于機器學習方面的TensorFlow的不同應用,并更深入地探討了方法的最新變化。對于那些想要用TensorFlow進行機器學習的人來說,這本書是一個很好的參考點。本書分為三個部分。第一篇:使用TensorFlow 2.0進行數據處理。第二部分:使用TensorFlow 2.0構建機器學習和深度學習模型。它還包括使用TensorFlow 2.0的神經語言編程(NLP)。第三部分介紹了如何在環境中保存和部署TensorFlow 2.0模型。這本書對數據分析人員和數據工程師也很有用,因為它涵蓋了使用TensorFlow 2.0處理大數據的步驟。想要過渡到數據科學和機器學習領域的讀者也會發現,本書提供了實用的入門指南,以后可能會出現更復雜的方面。書中提供的案例研究和示例使您很容易理解和理解相關的基本概念。本書的優勢在于其簡單性以及將機器學習應用于有意義的數據集。
目錄: