圖書簡介
本書的主題元學習,作為機器學習研究中增長最快的領域之一,研究了通過調整機器學習和數據挖掘過程來獲得有效模型和解決方案的方法。這種適應能力通常利用來自過去其他任務的經驗信息,并且適應過程可能涉及機器學習方法。作為與元學習相關的領域和當前的熱門話題,自動化機器學習(AutoML)關注的是機器學習過程的自動化。元學習和AutoML可以幫助AI學習控制不同學習方法的應用并更快地獲取新的解決方案,而無需用戶進行不必要的干預。
本書全面而透徹地介紹了元學習和 AutoML的幾乎所有方面,涵蓋了基本概念和架構、評估、數據集、超參數優化、集成和工作流,以及如何使用這些知識來選擇、組合、調整和配置算法和模型,以更快更好地解決數據挖掘和數據科學問題。因此,它可以幫助開發人員開發可以通過經驗改進自己的系統。
本書是2009年第一版的重大更新,共18章,內容幾乎是上一版的兩倍。這使作者能夠更深入地涵蓋最相關的主題,并結合各自領域最近研究的概述。這本書適用于對機器學習、數據挖掘、數據科學和人工智能領域感興趣的研究人員和研究生。
章節瀏覽
機器學習和優化技術正在徹底改變我們的世界。就實際影響而言,其他類型的信息技術近年來發展得沒有那么快。這本書的目的是介紹優化和機器學習領域的一些創新技術,并演示如何在工程領域應用它們。
優化和機器學習展示了依賴于機器學習和優化的算法的選擇、配置和工程方面的現代進展。本書的第一部分致力于優化發揮主要作用的應用程序,第二部分描述和實現了幾個主要基于機器學習技術的應用程序。在這些章節中討論的方法與它們的競爭對手進行了比較,并說明了它們在其選擇的應用領域中的有效性。
自動化機器學習(AutoML)的目標是讓每個人都能使用機器學習(ML),包括醫生、土木工程師、材料科學家、小企業主,以及統計學家和計算機科學家。這一長期愿景與微軟office的愿景非常相似——讓普通用戶能夠輕松地創建文檔和準備報告——以及智能手機中的攝像頭,方便隨時隨地拍攝照片。盡管ML社區為實現這一目標付出了大量的研發努力,但通過與領域專家和數據科學家的合作,我們認為人們對揭示AutoML背后的魔力有著很高的需求,包括基本概念、算法和工具。
《自動機器學習實戰(Automated Machine Learning in Action)》揭示了如何自動化設計和調整機器學習系統的繁瑣元素。它是用簡單易懂的方式編寫的,并且充滿了將AutoML技術應用到管道的每個階段的實踐示例。AutoML甚至可以由機器學習新手來實現!如果你是ML的新手,你會欣賞這本書如何讓你了解機器學習的基礎知識。有經驗的實踐者會喜歡學習AutoKeras和KerasTuner這樣的自動化工具如何創建管道,自動為您的任務選擇最佳方法,或者使用用戶定義的超參數調優任何定制的搜索空間,這消除了手動調優的負擔。
在Automated Machine Learning In Action中,您將學習如何:
許多統計和機器學習的方法正在被定義。這些方法用于從系統的感知數據創建模型,幫助科學家生成或改進當前的模型。機器學習在科學領域得到了廣泛的研究,特別是在生物信息學、經濟學、社會科學、生態學和氣候科學等領域,但從數據中學習需要在復雜的情況下進行更多的研究。要為機器學習算法提供有意義的知識,就必須采用能夠捕獲結構和過程屬性的高級知識表示方法。它對理解困難的科學問題有重大影響。
這本《知識表示和機器學習的預測和分析》展示了各種知識表示和機器學習方法和體系結構,將在研究領域活躍。這些方法被回顧與現實生活的例子,從廣泛的研究主題。本書的網站提供了許多在機器學習知識表示中實現的技術和算法的理解。
特點:
檢查所需知識表示的表示充分性 掌握知識表示的推理充分性,以便從原始信息中產生新的知識 運用自動方法獲取新知識,提高推理和獲取效率 使用最新的技術,涵蓋知識表示和機器學習方面的主要挑戰、關注和突破 描述知識表示的思想和相關技術,以及它們的應用,以幫助人類變得更好、更智能 這本書作為研究人員和實踐者誰是在信息技術和計算機科學領域的知識表示和機器學習的基本和先進的概念的研究人員和實踐者的參考書。如今,開發自適應的、文件的、可擴展的和可靠的應用,以及為日常問題設計解決方案已經變得非常重要。這本書將有助于行業人士,也將幫助初學者和高級用戶學習最新的東西,其中包括基本和先進的概念。
元學習(Metalearning)或者叫做“學會學習”(Learning to learn),它希望模型獲取一種“學會學習”的能力,使其可以在獲取已有“知識”的基礎上快速學習新的任務,它的意圖在于通過少量的訓練實例設計能夠快速學習新技能或適應新環境的模型。
作者寄語
“本書的第一版出版于2009年,在過去的十幾年中,元學習的飛速發展,取得了巨大的進步。于是我們決定出版本書的第二版。在新的版本中,我們添加了AutoML的相關知識,并且深入探討了AutoML與Metalearning的關系;同時,由于自動化工作流程設計仍在初期發育的階段,我們也把相關研究和信息增加到了本書的第二版中。”
圖書簡介
本書的主題元學習,作為機器學習研究中增長最快的領域之一,研究了通過調整機器學習和數據挖掘過程來獲得有效模型和解決方案的方法。這種適應能力通常利用來自過去其他任務的經驗信息,并且適應過程可能涉及機器學習方法。作為與元學習相關的領域和當前的熱門話題,自動化機器學習(AutoML)關注的是機器學習過程的自動化。元學習和AutoML可以幫助AI學習控制不同學習方法的應用并更快地獲取新的解決方案,而無需用戶進行不必要的干預。
本書全面而透徹地介紹了元學習和 AutoML的幾乎所有方面,涵蓋了基本概念和架構、評估、數據集、超參數優化、集成和工作流,以及如何使用這些知識來選擇、組合、調整和配置算法和模型,以更快更好地解決數據挖掘和數據科學問題。因此,它可以幫助開發人員開發可以通過經驗改進自己的系統。
本書是2009年第一版的重大更新,共18章,內容幾乎是上一版的兩倍。這使作者能夠更深入地涵蓋最相關的主題,并結合各自領域最近研究的概述。這本書適用于對機器學習、數據挖掘、數據科學和人工智能領域感興趣的研究人員和研究生。
隨著推薦任務的日益多樣化和推薦模型的日益復雜,開發出一套能夠很好地適應新的推薦任務的推薦系統變得越來越具有挑戰性。在本教程中,我們將重點討論自動機器學習(AutoML)技術如何有益于推薦系統的設計和使用。具體地說,我們將從一個完整的范圍開始描述什么是可以自動推薦系統。然后,我們將在此范圍內對特征工程、超參數優化/神經結構搜索和算法選擇三個重要的主題進行詳細闡述。將介紹、總結和討論這些主題下的核心問題和最近的工作。
題目: An Overview of Privacy in Machine Learning
序言: 在過去幾年中,谷歌、微軟和亞馬遜等供應商已經開始為客戶提供軟件接口,使他們能夠輕松地將機器學習任務嵌入到他們的應用程序中。總的來說,機構現在可以使用機器學習作為服務(MLaaS)引擎來外包復雜的任務,例如訓練分類器、執行預測、聚類等等。他們還可以讓其他人根據他們的數據查詢模型。當然,這種方法也可以在其他情況下使用(并且經常提倡使用),包括政府協作、公民科學項目和企業對企業的伙伴關系。然而,如果惡意用戶能夠恢復用于訓練這些模型的數據,那么由此導致的信息泄漏將會產生嚴重的問題。同樣,如果模型的內部參數被認為是專有信息,那么對模型的訪問不應該允許對手了解這些參數。在本文中,我們對這一領域的隱私挑戰進行了回顧,系統回顧了相關的研究文獻,并探討了可能的對策。具體地說,我們提供了大量關于機器學習和隱私相關概念的背景信息。然后,我們討論了可能的對抗模型和設置,涵蓋了與隱私和/或敏感信息泄漏有關的廣泛攻擊,并回顧了最近試圖防御此類攻擊的結果。最后,我們總結出一系列需要更多工作的開放問題,包括需要更好的評估、更有針對性的防御,以及研究與政策和數據保護工作的關系。
掌握通過機器學習和深度學習識別和解決復雜問題的基本技能。使用真實世界的例子,利用流行的Python機器學習生態系統,這本書是你學習機器學習的藝術和科學成為一個成功的實踐者的完美伴侶。本書中使用的概念、技術、工具、框架和方法將教會您如何成功地思考、設計、構建和執行機器學習系統和項目。
使用Python進行的實際機器學習遵循結構化和全面的三層方法,其中包含了實踐示例和代碼。
第1部分側重于理解機器學習的概念和工具。這包括機器學習基礎,對算法、技術、概念和應用程序的廣泛概述,然后介紹整個Python機器學習生態系統。還包括有用的機器學習工具、庫和框架的簡要指南。
第2部分詳細介紹了標準的機器學習流程,重點介紹了數據處理分析、特征工程和建模。您將學習如何處理、總結和可視化各種形式的數據。特性工程和選擇方法將詳細介紹真實數據集,然后是模型構建、調優、解釋和部署。
第3部分探討了多個真實世界的案例研究,涵蓋了零售、交通、電影、音樂、營銷、計算機視覺和金融等不同領域和行業。對于每個案例研究,您將學習各種機器學習技術和方法的應用。動手的例子將幫助您熟悉最先進的機器學習工具和技術,并了解什么算法最適合任何問題。
實用的機器學習與Python將授權您開始解決您自己的問題與機器學習今天!
你將學習:
這本書是給誰看的 IT專業人士、分析師、開發人員、數據科學家、工程師、研究生
目錄:
Part I: Understanding Machine Learning
Chapter 12: Deep Learning for Computer Vision
在六個步驟中學習高級Python 3主題的基礎知識,所有這些都是為了讓您成為一個有價值的實踐者而設計的。這個更新版本的方法基于“六度分離”理論,該理論指出每個人和每件事都是最多六步之遙,并將每個主題分為兩部分: 理論概念和使用適當的Python 3包的實際實現。
您將從Python 3編程語言基礎、機器學習歷史、發展和系統開發框架開始。本文還介紹了一些關鍵的數據挖掘/分析概念,如探索性分析、特征降維、回歸、時間序列預測及其在Scikit-learn中的有效實現。您還將學習常用的模型診斷和調優技術。其中包括最優的類創建概率截止點、方差、偏差、裝袋、提升、集成投票、網格搜索、隨機搜索、貝葉斯優化和物聯網數據降噪技術。
最后,您將回顧先進的文本挖掘技術,推薦系統,神經網絡,深度學習,強化學習技術及其實現。本書中提供的所有代碼都將以iPython筆記本的形式提供,使您能夠嘗試這些示例并將其擴展到您的優勢。
你將學習
這本書是給誰看的
Python開發人員、數據工程師和機器學習工程師希望將他們的知識或職業擴展到機器學習領域。
題目: Machine Learning Advanced Techniques and Emerging Applications
簡介:
跨不同的工業部門、業務單位和科研社區生成、存儲和通信的數據量正在迅速擴大。移動通信和分布式/并行計算技術的最新發展使跨不同部分的生成數據的實時收集和處理成為可能。一方面,移動通信行業所支持的物聯網(IoT)連接了能夠收集異構數據的各種類型的傳感器。另一方面,計算能力的最新進展,例如圖形處理單元(gpu)中的并行處理和云計算集群上的分布式處理,使處理大量數據成為可能。有必要從大量數據(所謂的大數據)中發現重要的模式并推斷出趨勢,以增強數據驅動的決策過程。機器學習中已經開發了工具和技術,以結構化和自動化的方式從可用數據中得出有洞察力的結論。機器學習算法基于多個領域開發的概念和工具,包括統計、人工智能、信息論、認知科學和控制理論。機器學習的最新進展在不同的科學領域有廣泛的應用。這本書涵蓋了機器學習技術在智能城市、自動化工業和新興企業的廣泛應用領域的最新進展。
章節:
作者簡介:
Hamed Farhadi是瑞典斯德哥爾摩愛立信研究所的研究員。2014年在瑞典斯德哥爾摩KTH皇家理工學院獲得博士學位。2016年,他是美國馬薩諸塞州劍橋市哈佛大學的博士后研究員,2015年,他是瑞典哥德堡查爾默斯理工大學的博士后研究員。他的研究興趣主要集中在統計信號處理和機器學習等廣泛的應用領域,包括無線醫療系統、微型機器人手術、臨床數據分析和無線信息網絡。他曾獲得多項學術獎項,包括ICASSP 2014最佳學生論文獎。Farhadi博士是2015年IEEE醫學信息與通信技術國際研討會(ISMICT)的聯合主席。