將你的模型投入生產是機器學習的基本挑戰。MLOps提供了一組經過驗證的原則,旨在以可靠和自動化的方式解決這個問題。這本精深的指南將帶您了解什么是MLOps(以及它與DevOps的區別),并向您展示如何將其付諸實踐,以操作您的機器學習模型。
當前和有抱負的機器學習工程師——或者任何熟悉數據科學和Python的人——將在MLOps工具和方法(以及AutoML和監視和日志)中建立一個基礎,然后學習如何在AWS、微軟Azure和谷歌云中實現它們。你的機器學習系統運行得越快,你就能越快地專注于你試圖解決的業務問題。這本書給了你一個良好的開端。
//www.oreilly.com/library/view/practical-mlops/9781098103002/
您將發現如何: 將DevOps最佳實踐應用到機器學習中 建立并維護生產機器學習系統 監控、儀器、負荷測試和操作機器學習系統 為給定的機器學習任務選擇正確的MLOps工具 在各種平臺和設備上運行機器學習模型,包括手機和專用硬件
我們設計了這本書,讓你可以把每一章作為一個獨立的部分來閱讀,這樣可以給你立即的幫助。在每一章的結尾都有討論問題,旨在激發批判性思維和技術練習,以提高你對材料的理解。這些討論問題和練習也非常適合在數據科學、計算機科學或MBA課程的課堂上使用,也適合有動機的學習者。最后一章包含了幾個案例研究,有助于作為MLOps專家構建工作組合。這本書共分為12章,我們將在接下來的章節中進一步細分。在本書的最后,有一個附錄,其中收集了一些有價值的實現MLOps的資源。
前幾章涵蓋了DevOps和MLOps的理論和實踐。所涉及的項目之一是如何建立持續集成和持續交付。另一個關鍵的話題是改善,也就是在所有方面持續改進的想法。關于云計算有三章,涵蓋了AWS、Azure和GCP。Alfredo是微軟開發人員的擁護者,他是Azure平臺上MLOps的理想知識來源。同樣地,Noah花了數年時間讓學生接受云計算方面的培訓,并與谷歌、AWS和Azure的教育部門合作。這些章節是熟悉基于云的MLOps的好方法。其他章節涵蓋MLOps的關鍵技術領域,包括AutoML,包含‐ers,邊緣計算和模型可移植性。這些主題包含了許多具有積極吸引力的前沿新興技術。最后,在最后一章中,Noah講述了他在一家社交媒體初創公司的真實案例研究,以及他們在做MLOps時面臨的挑戰。
本書從根本上重新思考了概率論和統計學第一課的微積分。我們提供廣度優先的方法,其中概率論和統計的要點可以在一個學期教授。通過模擬、數據爭論、可視化和統計程序,統計編程語言R在全文中扮演著核心角色。在示例和練習中使用了來自各種來源的數據集,包括許多來自最近的開放源代碼科學文章的數據集。通過模擬給出了重要事實的證明,也有一些正式的數學證明。
這本書是學習數據科學,統計,工程,計算機科學,數學,科學,商業的學生的一個優秀的選擇,或任何學生想要在模擬實踐課程的基礎上。
這本書假設有一個學期的微積分的數學背景,并且在第三章中有一些無窮級數。在第3章和第4章中,積分和無窮級數被用于表示法和說明,但在其他章節中微積分的使用很少。由于強調通過模擬來理解結果(以及對偏離假設的穩健性),本書的大部分內容(如果不是全部的話)無需微積分也能理解。提供了許多結果的證明,并通過模擬為更多的理由,但本文不打算支持一個基于證明的課程。我們鼓勵讀者遵循證明,但通常只有在首先理解結果和為什么它是重要的之后,才想要理解一個證明。
這本書通過探索計算機科學理論和機器學習雙方可以相互傳授的內容,將理論和機器學習聯系起來。它強調了對靈活、易于操作的模型的需求,這些模型更好地捕捉使機器學習變得容易的東西,而不是讓機器學習變得困難的東西。
理論計算機科學家將被介紹到機器學習的重要模型和該領域的主要問題。機器學習研究人員將以一種可訪問的格式介紹前沿研究,并熟悉現代算法工具包,包括矩法、張量分解和凸規劃松弛。
超越最壞情況分析的處理方法是建立對實踐中使用的方法的嚴格理解,并促進發現令人興奮的、解決長期存在的重要問題的新方法。
在這本書中,我們將涵蓋以下主題:
(a)非負矩陣分解
(b)主題建模
(c)張量分解
(d)稀疏恢復
(e)稀疏編碼
(f)學習混合模型
(g)矩陣補全
//link.springer.com/book/10.1007/978-3-319-55444-0
這本引人入勝的和清晰的書面教科書/參考提供了一個必要的介紹,迅速興起的跨學科領域的數據科學。它側重于成為一名優秀的數據科學家的基本原則,以及建立收集、分析和解釋數據的系統所需的關鍵技能。
《數據科學設計手冊》是一個實用的見解來源,它突出了分析數據中真正重要的東西,并提供了對如何使用這些核心概念的直觀理解。這本書沒有強調任何特定的編程語言或數據分析工具套件,而是著重于重要設計原則的高層討論。
《數據科學概論》是一門易于閱讀的課程,理想情況下,它能滿足本科生和早期研究生的需求。它揭示了這門學科如何處于統計學、計算機科學和機器學習的交叉點,具有自己獨特的分量和特點。這些和相關領域的從業者會發現這本書非常適合自學。
這本書是為任何想學習如何開發機器學習系統的人準備的。我們將從理論和實踐兩方面涵蓋關于機器學習算法的最重要概念,并將使用Python編程語言中的Scikit-learn庫實現許多機器學習算法。在第一章中,您將學習機器學習最重要的概念,在下一章中,您將主要學習分類。在最后一章中,你將學習如何訓練你的模型。我假定你已經了解了編程的基礎知識。
通過使用Python開發用例,全面了解監督學習算法您將學習監督學習概念、Python代碼、數據集、最佳實踐、常見問題和缺陷的解決方案,以及實現結構化、文本和圖像數據集算法的實踐知識。
你將從介紹機器學習開始,強調監督學習、半監督學習和非監督學習之間的區別。在接下來的章節中,你將學習回歸和分類問題,它們背后的數學,像線性回歸、邏輯回歸、決策樹、KNN、樸素貝葉斯等算法,以及像隨機森林、支持向量機、梯度增強和神經網絡等高級算法。提供了所有算法的Python實現。最后,您將得到一個端到端模型開發流程,包括模型的部署和維護。在閱讀了Python的監督學習之后,你將會對監督學習和它的實際實現有一個廣泛的理解,并且能夠以一種創新的方式運行代碼和擴展它。
你將學習:
這本書是給誰的
如果您是用Python編程的新手,并且正在尋找可靠的介紹,那么這本書就是為您準備的。由計算機科學教師開發,在“為絕對初學者”系列叢書通過簡單的游戲創造教授編程的原則。您將獲得實際的Python編程應用程序所需的技能,并將了解如何在真實場景中使用這些技能。在整個章節中,你會發現一些代碼示例來說明所提出的概念。在每一章的結尾,你會發現一個完整的游戲,展示了這一章的關鍵思想,一章的總結,以及一系列的挑戰來測試你的新知識。當你讀完這本書的時候,你將非常精通Python,并且能夠將你所學到的基本編程原理應用到你要處理的下一種編程語言。
在線推薦系統幫助用戶找到電影、工作、餐館——甚至愛情!這是一種將統計數據、人口統計數據和查詢條件相結合以獲得令他們滿意的結果的藝術。學習建立一個推薦系統的正確方法:它可以使你的應用成功或失敗!
對這項技術
推薦系統無處不在,幫助你找到從電影到工作,從餐館到醫院,甚至是愛情的一切。利用行為和人口統計數據,這些系統可以預測用戶在特定時間最感興趣的內容,從而得到高質量、有序、個性化的建議。推薦系統實際上是保持網站內容最新、有用和有趣的必要手段。
關于這本書
實用推薦系統解釋如何推薦系統的工作,并顯示如何創建和應用它們為您的網站。在介紹了基礎知識之后,您將看到如何收集用戶數據并生成個性化的推薦。您將學習如何使用最流行的推薦算法,并在Amazon和Netflix等網站上看到它們的實例。最后,這本書涵蓋了規模問題和其他問題,你會遇到的網站成長。
里面有什么
本書通過提供真實的案例研究和示例,為使用Python庫進行機器學習提供了堅實的基礎。它涵蓋了諸如機器學習基礎、Python入門、描述性分析和預測分析等主題。包括高級機器學習概念,如決策樹學習、隨機森林、增強、推薦系統和文本分析。這本書在理論理解和實際應用之間采取了一種平衡的方法。所有的主題都包括真實世界的例子,并提供如何探索、構建、評估和優化機器學習模型的逐步方法。