這本書提供 訪問Spark平臺的真實文檔和示例,以構建大型企業級機器學習應用程序。
在過去的十年里,機器學習取得了一系列驚人的進步。這些突破正在影響我們的日常生活,并對每個行業產生影響。下一代機器學習Spark提供了Spark和Spark MLlib的介紹,并在標準Spark MLlib庫之外,向更強大的第三方機器學習算法和庫邁進。在這本書的結尾,你將能夠通過許多實際的例子和有洞察力的解釋將你的知識應用到現實世界的用例中
這本書是給誰的
數據科學家和機器學習工程師,他們希望將自己的知識提升到一個新的水平,使用Spark和更強大的下一代算法和庫,而不是標準Spark MLlib庫中提供的;同時也是有抱負的數據科學家和工程師的入門書,他們需要機器學習的入門知識,Spark,SparkMLlib。
通過技術例子從業務角度發現深度學習的潛在應用、挑戰和機會。這些應用包括圖像識別、分割和注釋、視頻處理和注釋、語音識別、智能個人助理、自動翻譯和自動車輛。
面向開發者的深度學習業務應用介紹涵蓋了一些常見的DL算法,比如基于內容的推薦算法和自然語言處理。您將探索一些示例,例如使用全卷積神經網絡(FCNN)和剩余神經網絡(ResNets)進行視頻預測。您還將看到DL用于控制機器人的應用程序,使用蒙特卡羅樹搜索(用于在圍棋游戲中擊敗人類)探索DeepQ學習算法,以及為財務風險評估建模。這里還將提到一組被稱為生成對抗神經網絡(GANs)的強大算法,它可用于圖像著色、圖像補全和樣式轉換。
讀完這本書,你將對深度神經網絡這一令人興奮的領域有一個概述,并對深度學習的大部分主要應用有一個理解。這本書包含了一些代碼示例、技巧和如何使用Keras框架訓練深度學習模型的見解。
你將學到什么
這本書是給誰的
關于大數據技術的信息很多,但將這些技術拼接到端到端企業數據平臺是一項艱巨的任務,沒有得到廣泛的討論。通過這本實用的書,您將學習如何在本地和云中構建大數據基礎設施,并成功地構建一個現代數據平臺。
本書非常適合企業架構師、IT經理、應用程序架構師和數據工程師,它向您展示了如何克服Hadoop項目期間出現的許多挑戰。在深入了解以下內容之前,您將在一個徹底的技術入門中探索Hadoop和大數據領域中可用的大量工具:
-平臺: 了解部署、操作、安全性、高可用性和災難恢復的各個方面,以及將平臺與企業IT的其他部分集成在一起所需了解的所有內容
有興趣的數據科學專業人士可以通過本書學習Scikit-Learn圖書館以及機器學習的基本知識。本書結合了Anaconda Python發行版和流行的Scikit-Learn庫,演示了廣泛的有監督和無監督機器學習算法。通過用Python編寫的清晰示例,您可以在家里自己的機器上試用和試驗機器學習的原理。
所有的應用數學和編程技能需要掌握的內容,在這本書中涵蓋。不需要深入的面向對象編程知識,因為工作和完整的例子被提供和解釋。必要時,編碼示例是深入和復雜的。它們也簡潔、準確、完整,補充了介紹的機器學習概念。使用示例有助于建立必要的技能,以理解和應用復雜的機器學習算法。
對于那些在機器學習方面追求職業生涯的人來說,Scikit-Learn機器學習應用手冊是一個很好的起點。學習這本書的學生將學習基本知識,這是勝任工作的先決條件。讀者將接觸到專門為數據科學專業人員設計的蟒蛇分布,并將在流行的Scikit-Learn庫中構建技能,該庫是Python世界中許多機器學習應用程序的基礎。
你將學習
這本書是給誰的
機器學習已經成為許多商業應用和研究項目中不可或缺的一部分,但這一領域并不僅限于擁有廣泛研究團隊的大公司。如果您使用Python,即使是初學者,這本書也會教你構建自己的機器學習解決方案的實用方法。今天,有了所有可用的數據,機器學習應用程序只受限于你的想象力。
您將學習使用Python和scikit-learn庫創建成功的機器學習應用程序所需的步驟。兩位作者安德烈亞斯?穆勒(Andreas Muller)和薩拉?圭多(Sarah Guido)關注的是使用機器學習算法的實踐層面,而不是背后的數學。熟悉NumPy和matplotlib庫將有助于您從本書獲得更多信息。
通過這本書,你會學到 :
本書通過提供真實的案例研究和示例,為使用Python庫進行機器學習提供了堅實的基礎。它涵蓋了諸如機器學習基礎、Python入門、描述性分析和預測分析等主題。包括高級機器學習概念,如決策樹學習、隨機森林、增強、推薦系統和文本分析。這本書在理論理解和實際應用之間采取了一種平衡的方法。所有的主題都包括真實世界的例子,并提供如何探索、構建、評估和優化機器學習模型的逐步方法。
掌握通過機器學習和深度學習識別和解決復雜問題的基本技能。使用真實世界的例子,利用流行的Python機器學習生態系統,這本書是你學習機器學習的藝術和科學成為一個成功的實踐者的完美伴侶。本書中使用的概念、技術、工具、框架和方法將教會您如何成功地思考、設計、構建和執行機器學習系統和項目。
使用Python進行的實際機器學習遵循結構化和全面的三層方法,其中包含了實踐示例和代碼。
第1部分側重于理解機器學習的概念和工具。這包括機器學習基礎,對算法、技術、概念和應用程序的廣泛概述,然后介紹整個Python機器學習生態系統。還包括有用的機器學習工具、庫和框架的簡要指南。
第2部分詳細介紹了標準的機器學習流程,重點介紹了數據處理分析、特征工程和建模。您將學習如何處理、總結和可視化各種形式的數據。特性工程和選擇方法將詳細介紹真實數據集,然后是模型構建、調優、解釋和部署。
第3部分探討了多個真實世界的案例研究,涵蓋了零售、交通、電影、音樂、營銷、計算機視覺和金融等不同領域和行業。對于每個案例研究,您將學習各種機器學習技術和方法的應用。動手的例子將幫助您熟悉最先進的機器學習工具和技術,并了解什么算法最適合任何問題。
實用的機器學習與Python將授權您開始解決您自己的問題與機器學習今天!
你將學習:
這本書是給誰看的 IT專業人士、分析師、開發人員、數據科學家、工程師、研究生
目錄:
Part I: Understanding Machine Learning
Chapter 12: Deep Learning for Computer Vision
這本書在對算法工作原理的高層次理解和對優化模型的具體細節的了解之間找到一個平衡點。這本書將給你的信心和技能時,開發所有主要的機器學習模型。在這本Pro機器學習算法中,您將首先在Excel中開發算法,以便在用Python/R實現模型之前,實際了解可以在模型中調優的所有細節。
你將涵蓋所有主要的算法:監督和非監督學習,其中包括線性/邏輯回歸;k - means聚類;主成分分析;推薦系統;決策樹;隨機森林;“GBM”;和神經網絡。您還將通過CNNs、RNNs和word2vec等文本挖掘工具了解最新的深度學習。你不僅要學習算法,還要學習特征工程的概念來最大化模型的性能。您將看到該理論與案例研究,如情緒分類,欺詐檢測,推薦系統,和圖像識別,以便您得到最佳的理論和實踐為工業中使用的絕大多數機器學習算法。在學習算法的同時,您還將接觸到在所有主要云服務提供商上運行的機器學習模型。
你會學到什么?
這本書是給誰看的
希望轉換到數據科學角色的業務分析師/ IT專業人員。想要鞏固機器學習知識的數據科學家。
//www.manning.com/books/deep-learning-with-javascript
深度學習已經改變了計算機視覺、圖像處理和自然語言應用領域。多虧了TensorFlow.js,現在JavaScript開發人員可以無需依賴Python或R就能構建深度學習應用程序。使用JavaScript的深度學習向開發人員展示了如何將DL技術引入web。本書由TensorFlow庫的主要作者編寫,為在瀏覽器或Node上使用JavaScript進行深度學習的應用程序提供了有趣的用例和深入的指導。
關于技術
在瀏覽器或基于Node的后端中運行深度學習應用程序,為智能web應用程序開辟了令人興奮的可能性。使用TensorFlow.js庫,您可以用JavaScript構建和訓練深度學習模型。TensorFlow.js具有無與倫比的可擴展性,模塊化和響應能力,其可移植性確實令人眼前一亮。它的模型可以在JavaScript運行的任何地方運行,從而將ML推向應用程序堆棧的更上層。
關于這本書
在Deep Learning with JavaScript這本書中,您將學習使用TensorFlow.js來構建直接在瀏覽器中運行的深度學習模型。這本快節奏的書由Google工程師撰寫,是實用的,引人入勝且易于閱讀。通過以文本分析,語音處理,圖像識別和自學習游戲AI為特色的各種示例,您將掌握深度學習的所有基礎知識并探索高級概念,例如對現有模型進行再訓練以進行遷移學習和圖像生成。
書里面有什么
在瀏覽器中的圖像和語言處理
用客戶端數據調優ML模型
通過生成式深度學習創建文本和圖像
源代碼示例以進行測試和修改