如今,企業創建的機器學習(ML)模型中,有一半以上都沒有投入生產。主要是面臨技術上的操作挑戰和障礙,還有組織上的。不管怎樣,最基本的是,不在生產中的模型不能提供業務影響。
這本書介紹了MLOps的關鍵概念,幫助數據科學家和應用工程師不僅可以操作ML模型來驅動真正的業務變化,而且還可以隨著時間的推移維護和改進這些模型。通過基于世界各地眾多MLOps應用的經驗教訓,九位機器學習專家對模型生命周期的五個步驟——構建、預生產、部署、監控和治理——提供了深刻見解,揭示了如何將穩健的MLOps過程貫穿始終。
//www.oreilly.com/library/view/introducing-mlops/9781492083283/
這本書幫助你:
通過減少整個ML管道和工作流程的沖突,實現數據科學價值 通過再訓練、定期調整和完全重構來改進ML模型,以確保長期的準確性 設計MLOps的生命周期,使組織風險最小化,模型是公正的、公平的和可解釋的 為管道部署和更復雜、不那么標準化的外部業務系統操作ML模型
機器學習已經成為近年來最流行的話題之一。我們今天看到的機器學習的應用只是冰山一角。機器學習革命才剛剛開始。它正在成為所有現代電子設備不可分割的一部分。在自動化領域的應用,如汽車、安全和監視、增強現實、智能家居、零售自動化和醫療保健,還不多。機器人技術也正在崛起,主宰自動化世界。機器學習在機器人領域的未來應用仍未被普通讀者發現。因此,我們正在努力編寫這本關于機器學習在機器人技術上的未來應用的編輯書籍,其中幾個應用已經包含在單獨的章節中。這本書的內容是技術性的。它試圖覆蓋機器學習的所有可能的應用領域。這本書將提供未來的愿景在未探索的領域的應用機器人使用機器學習。本書中提出的觀點得到了原始研究結果的支持。本章在這里提供了所有必要的理論和數學計算的深入研究。對于外行人和開發人員來說,它將是完美的,因為它將結合高級材料和介紹性材料,形成一個論點,說明機器學習在未來可以實現什么。它將詳細介紹未來的應用領域及其方法。因此,本書將極大地有利于學術界、研究人員和行業項目管理者開發他們的新項目,從而造福人類。
使用Scikit-Multiflow框架設計、開發和驗證帶有流數據的機器學習模型。這本書是一個快速入門指南,為數據科學家和機器學習工程師尋求實現機器學習模型流數據與Python產生實時見解。
本書首先介紹流數據、與它相關的各種挑戰、它的一些實際業務應用程序和各種窗口技術。然后,您將研究增量學習算法和在線學習算法,以及使用流數據進行模型評估的概念,并將介紹Python中的Scikit-Multiflow框架。接下來回顧了各種變化檢測/概念漂移檢測算法,以及使用Scikit-Multiflow實現各種數據集。
本書還介紹了流數據的各種有監督和無監督算法,以及它們使用Python在各種數據集上的實現。本書最后簡要介紹了其他可用于流媒體數據的開源工具,如Spark、MOA(大規模在線分析)、Kafka等。
你會學習到: 理解流數據的機器學習概念 回顧增量學習和在線學習 開發檢測概念漂移的模型 探索流數據上下文中的分類、回歸和集成學習技術 應用最佳實踐來調試和驗證流數據上下文中的機器學習模型 介紹其他處理流數據的開源框架。
這個更新的第二版提供了機器學習算法和架構設計的指導。它提供了醫療保健領域智能系統的真實應用,并涵蓋了管理大數據的挑戰。
這本書已經更新了在海量數據,機器學習和人工智能倫理的最新研究。它涵蓋了管理海量數據復雜性的新主題,并提供了復雜機器學習模型的例子。來自全球醫療服務提供商的實證研究展示了大數據和人工智能在對抗慢性和新疾病(包括COVID-19)方面的應用。探討了數字醫療、分析和人工智能在人口健康管理中的未來。您將學習如何創建機器學習模型,評估其性能,并在您的組織內運作其結果。來自主要醫療服務提供商的研究覆蓋了全球數字服務的規模。通過案例研究和最佳實踐,包括物聯網,提出了評估人工智能機器學習應用的有效性、適用性和效率的技術。
您將了解機器學習如何用于開發健康智能,其目的是改善患者健康、人口健康,并促進顯著的護理支付方成本節約。
//link.springer.com/book/10.1007/978-1-4842-6537-6#about
你會: 了解關鍵機器學習算法及其在醫療保健中的使用和實現 實現機器學習系統,如語音識別和增強深度學習/人工智能 管理海量數據的復雜性 熟悉人工智能和醫療保健最佳實踐、反饋循環和智能代理
深入機器學習模型的超參數調優,關注什么是超參數以及它們是如何工作的。這本書討論了超參數調優的不同技術,從基礎到高級方法。
這是一個循序漸進的超參數優化指南,從什么是超參數以及它們如何影響機器學習模型的不同方面開始。然后通過一些基本的(蠻力的)超參數優化算法。進一步,作者提出了時間和內存約束的問題,使用分布式優化方法。接下來,您將討論超參數搜索的貝葉斯優化,它從以前的歷史中學習。
這本書討論了不同的框架,如Hyperopt和Optuna,它們實現了基于順序模型的全局優化(SMBO)算法。在這些討論中,您將關注不同的方面,比如搜索空間的創建和這些庫的分布式優化。
機器學習中的超參數優化創建了對這些算法如何工作的理解,以及如何在現實生活中的數據科學問題中使用它們。最后一章總結了超參數優化在自動機器學習中的作用,并以創建自己的AutoML腳本的教程結束。
超參數優化是一項繁瑣的任務,所以請坐下來,讓這些算法來完成您的工作。
//link.springer.com/book/10.1007/978-1-4842-6579-6#about
你會:
了解超參數的變化如何影響模型的性能。
將不同的超參數調優算法應用于數據科學問題
使用貝葉斯優化方法創建高效的機器學習和深度學習模型
使用一組機器來分配超參數優化
利用超參數優化方法實現自動機器學習
學習使用Python分析數據和預測結果的更簡單和更有效的方法
Python機器學習教程展示了通過關注兩個核心機器學習算法家族來成功分析數據,本書能夠提供工作機制的完整描述,以及使用特定的、可破解的代碼來說明機制的示例。算法用簡單的術語解釋,沒有復雜的數學,并使用Python應用,指導算法選擇,數據準備,并在實踐中使用訓練過的模型。您將學習一套核心的Python編程技術,各種構建預測模型的方法,以及如何測量每個模型的性能,以確保使用正確的模型。關于線性回歸和集成方法的章節深入研究了每種算法,你可以使用書中的示例代碼來開發你自己的數據分析解決方案。
機器學習算法是數據分析和可視化的核心。在過去,這些方法需要深厚的數學和統計學背景,通常需要結合專門的R編程語言。這本書演示了機器學習可以如何實現使用更廣泛的使用和可訪問的Python編程語言。
使用線性和集成算法族預測結果
建立可以解決一系列簡單和復雜問題的預測模型
使用Python應用核心機器學習算法
直接使用示例代碼構建自定義解決方案
機器學習不需要復雜和高度專業化。Python使用了更簡單、有效和經過良好測試的方法,使這項技術更容易為更廣泛的受眾所接受。Python中的機器學習將向您展示如何做到這一點,而不需要廣泛的數學或統計背景。
學習設計、構建和部署由機器學習(ML)支持的應用程序所必需的技能。通過這本親力親為的書,您將構建一個示例ML驅動的應用程序,從最初的想法到部署的產品。數據科學家、軟件工程師和產品經理—包括有經驗的實踐者和新手—將逐步學習構建真實的ML應用程序所涉及的工具、最佳實踐和挑戰。
作者Emmanuel Ameisen是一位經驗豐富的數據科學家,他領導了一個人工智能教育項目,通過代碼片段、插圖、截圖和對行業領袖的采訪展示了實用的ML概念。第1部分將告訴您如何計劃ML應用程序并度量成功。第2部分解釋了如何構建一個工作的ML模型。第三部分演示了改進模型的方法,直到它滿足您最初的設想。第4部分介紹部署和監控策略。
這本書會對你有所幫助:
深入機器學習模型的超參數調整,關注什么是超參數以及它們是如何工作的。這本書討論了不同的超參數調優技術,從基礎到高級方法。
這是一個關于超參數優化的分步指南,從什么是超參數以及它們如何影響機器學習模型的不同方面開始。然后介紹一些基本的超參數優化算法。此外,作者利用分布式優化方法解決了時間和內存約束的問題。接下來您將討論超參數搜索的貝葉斯優化,它從以前的歷史中吸取了教訓。
這本書討論了不同的框架,如Hyperopt和Optuna,它實現了基于順序模型的全局優化(SMBO)算法。在這些討論中,您將關注不同的方面,比如搜索空間的創建和這些庫的分布式優化。
機器學習中的超參數優化有助于理解這些算法是如何工作的,以及如何在現實數據科學問題中使用它們。最后一章總結了超參數優化在自動機器學習中的作用,并以一個創建自己的自動腳本的教程結束。
超參數優化是一項冗長乏味的任務,所以請坐下來,讓這些算法來完成您的工作。你將學到什么
這本書是給誰的
在構建機器學習模型時選擇正確的超參數是數據科學從業者面臨的最大問題之一。這本書是超參數優化(HPO)的指南。它從超參數的最基本定義開始,并帶您使用高級HPO技術構建您自己的AutoML腳本。這本書是打算為學生和數據科學專業人員。這本書由五章組成。
這本書的目的是讓讀者以一種直觀和實用的方式來理解HPO的概念,每個部分都提供了代碼實現。我希望你能喜歡。
這本書是關于運用機器和深度學習來解決石油和天然氣行業的一些挑戰。這本書開篇簡要討論石油和天然氣勘探和生產生命周期中不同階段的數據流工業操作。這導致了對一些有趣問題的調查,這些問題很適合應用機器和深度學習方法。最初的章節提供了Python編程語言的基礎知識,該語言用于實現算法;接下來是監督和非監督機器學習概念的概述。作者提供了使用開源數據集的行業示例以及對算法的實際解釋,但沒有深入研究所使用算法的理論方面。石油和天然氣行業中的機器學習涵蓋了包括地球物理(地震解釋)、地質建模、油藏工程和生產工程在內的各種行業主題。
在本書中,重點在于提供一種實用的方法,提供用于實現機器的逐步解釋和代碼示例,以及用于解決油氣行業現實問題的深度學習算法。
你將學到什么
這本書是給誰的
探索多年來用戶研究如何受到一系列學科的影響,如人機交互、可用性、人類學、認知心理學、人體工程學等。本書旨在為用戶研究社區做出貢獻,涵蓋的主題將幫助用戶體驗專業人士、學生和利益相關者更好地理解什么是用戶研究。
通過這本書,你將獲得一套實用的技能,范圍從如何進行研究,以建立一個案例,以獲得所需的預算和資源。它將為你提供一個如何組織你的研究,如何計劃它,以及如何在整個項目中管理利益相關者的期望的清晰的說明。您將看到如何將用戶研究融入到您的組織中,并在不同的產品開發階段(發現、Alpha、Beta直到上線)將其結合起來,以及如何發展一個用戶研究團隊。
《實用用戶研究》回顧了用于用戶研究的方法論,著眼于如何招募參與者,如何收集和分析數據,最后關注如何解釋和展示你的發現。跨文化研究、可及性和輔助數字研究也將在本書中討論。最后一章給你10個項目概要,你將能夠應用你的新技能集,并將你所學到的付諸實踐。
你將學習:
這本書是給誰的:
關于大數據技術的信息很多,但將這些技術拼接到端到端企業數據平臺是一項艱巨的任務,沒有得到廣泛的討論。通過這本實用的書,您將學習如何在本地和云中構建大數據基礎設施,并成功地構建一個現代數據平臺。
本書非常適合企業架構師、IT經理、應用程序架構師和數據工程師,它向您展示了如何克服Hadoop項目期間出現的許多挑戰。在深入了解以下內容之前,您將在一個徹底的技術入門中探索Hadoop和大數據領域中可用的大量工具:
-平臺: 了解部署、操作、安全性、高可用性和災難恢復的各個方面,以及將平臺與企業IT的其他部分集成在一起所需了解的所有內容