機器學習的核心是有效地識別數據中的模式和關系。許多任務,例如查找詞匯之間的關聯以便您能夠做出準確的搜索建議,或者在社交網絡中定位具有相似興趣的個人,很自然地以圖Graph的形式表達出來。圖驅動機器學習教你如何使用基于圖形的算法和數據組織策略來開發高級的機器學習應用程序。
對這項技術
對于任何涉及到大型數據集中的模式匹配的任務,基于圖的機器學習都是一個非常強大的工具。應用程序包括安全問題,如識別欺詐或檢測網絡入侵,應用程序領域,如社交網絡或自然語言處理,以及更好的用戶體驗,通過準確的推薦和智能搜索。通過將數據組織和分析為圖形,您的應用程序可以更流暢地使用以圖形為中心的算法(如最近鄰算法或頁面排名算法),在這些算法中,快速識別和利用相關關系非常重要。現代圖形數據存儲(如Neo4j或Amazon Neptune)是支持圖形機器學習的現成工具。
關于這本書
圖驅動機器學習向您介紹圖技術概念,強調圖在機器學習和大數據平臺中的作用。您將深入了解各種技術,包括數據源建模、算法設計、鏈接分析、分類和集群。在掌握核心概念之后,您將探索三個端到端項目,它們將演示體系結構、最佳設計實踐、優化方法和常見缺陷。作者亞歷山德羅·內格羅在構建基于圖形的機器學習系統方面的豐富經驗在每一章中都有所體現,你可以從他與真實客戶合作的實例和具體場景中學習!
里面有什么
人類從反饋中學習得最好——我們被鼓勵采取導致積極結果的行動,而被具有消極后果的決定所阻礙。這種強化過程可以應用到計算機程序中,使它們能夠解決經典編程所不能解決的更復雜的問題。深度強化學習實戰教你基本概念和術語的深度強化學習,以及實踐技能和技術,你將需要把它落實到你自己的項目。
對這項技術
深度強化學習是一種機器學習的形式,人工智能智能體從自己的原始感官輸入中學習最優行為。系統感知環境,解釋其過去決策的結果,并使用這些信息優化其行為以獲得最大的長期回報。眾所周知,深度強化學習對AlphaGo的成功做出了貢獻,但這并不是它所能做的全部!更令人興奮的應用程序等待被發現。讓我們開始吧。
關于這本書
深度強化學習實戰中教你如何編程的代理人,學習和改善的直接反饋,從他們的環境。您將使用流行的PyTorch深度學習框架構建網絡,以探索從深度Q-Networks到策略梯度方法再到進化算法的強化學習算法。在你進行的過程中,你會將你所知道的應用到實際操作項目中,比如控制模擬機器人、自動化股票市場交易,甚至構建一個可以下圍棋的機器人。
里面有什么
掌握通過機器學習和深度學習識別和解決復雜問題的基本技能。使用真實世界的例子,利用流行的Python機器學習生態系統,這本書是你學習機器學習的藝術和科學成為一個成功的實踐者的完美伴侶。本書中使用的概念、技術、工具、框架和方法將教會您如何成功地思考、設計、構建和執行機器學習系統和項目。
使用Python進行的實際機器學習遵循結構化和全面的三層方法,其中包含了實踐示例和代碼。
第1部分側重于理解機器學習的概念和工具。這包括機器學習基礎,對算法、技術、概念和應用程序的廣泛概述,然后介紹整個Python機器學習生態系統。還包括有用的機器學習工具、庫和框架的簡要指南。
第2部分詳細介紹了標準的機器學習流程,重點介紹了數據處理分析、特征工程和建模。您將學習如何處理、總結和可視化各種形式的數據。特性工程和選擇方法將詳細介紹真實數據集,然后是模型構建、調優、解釋和部署。
第3部分探討了多個真實世界的案例研究,涵蓋了零售、交通、電影、音樂、營銷、計算機視覺和金融等不同領域和行業。對于每個案例研究,您將學習各種機器學習技術和方法的應用。動手的例子將幫助您熟悉最先進的機器學習工具和技術,并了解什么算法最適合任何問題。
實用的機器學習與Python將授權您開始解決您自己的問題與機器學習今天!
你將學習:
這本書是給誰看的 IT專業人士、分析師、開發人員、數據科學家、工程師、研究生
目錄:
Part I: Understanding Machine Learning
Chapter 12: Deep Learning for Computer Vision
在六個步驟中學習高級Python 3主題的基礎知識,所有這些都是為了讓您成為一個有價值的實踐者而設計的。這個更新版本的方法基于“六度分離”理論,該理論指出每個人和每件事都是最多六步之遙,并將每個主題分為兩部分: 理論概念和使用適當的Python 3包的實際實現。
您將從Python 3編程語言基礎、機器學習歷史、發展和系統開發框架開始。本文還介紹了一些關鍵的數據挖掘/分析概念,如探索性分析、特征降維、回歸、時間序列預測及其在Scikit-learn中的有效實現。您還將學習常用的模型診斷和調優技術。其中包括最優的類創建概率截止點、方差、偏差、裝袋、提升、集成投票、網格搜索、隨機搜索、貝葉斯優化和物聯網數據降噪技術。
最后,您將回顧先進的文本挖掘技術,推薦系統,神經網絡,深度學習,強化學習技術及其實現。本書中提供的所有代碼都將以iPython筆記本的形式提供,使您能夠嘗試這些示例并將其擴展到您的優勢。
你將學習
這本書是給誰看的
Python開發人員、數據工程師和機器學習工程師希望將他們的知識或職業擴展到機器學習領域。
書名: Deep Learning for Search
簡介:
深度學習搜索是一本實用的書,關于如何使用(深度)神經網絡來幫助建立有效的搜索引擎。這本書研究了一個搜索引擎的幾個組成部分,提供了關于它們如何工作的見解以及如何在每個環境中使用神經網絡的指導。重點介紹了基于實例的實用搜索和深度學習技術,其中大部分都有代碼。同時,在適當的地方提供相關研究論文的參考資料,以鼓勵閱讀更多的書籍,加深對特定主題的知識。
讀完這本書,將對搜索引擎的主要挑戰有所理解,它們是如何被普遍解決的以及深度學習可以做些什么來幫助。并且將對幾種不同的深度學習技術以及它們在搜索環境中的適用范圍有一個理解,將很好地了解Lucene和Deeplearning4j庫。
這本書主要分為3個部分:
第1部分介紹了搜索、機器學習和深度學習的基本概念。第一章介紹了應用深度學習技術來搜索問題的原理,涉及了信息檢索中最常見的方法。第2章給出了如何使用神經網絡模型從數據中生成同義詞來提高搜索引擎效率的第一個例子。
第2部分討論了可以通過深度神經網絡更好地解決的常見搜索引擎任務。第3章介紹了使用遞歸神經網絡來生成用戶輸入的查詢。第四章在深度神經網絡的幫助下,在用戶輸入查詢時提供更好的建議。第5章重點介紹了排序模型:尤其是如何使用詞嵌入提供更相關的搜索結果。第6章討論了文檔嵌入在排序函數和內容重新編碼上下文中的使用。
第3部分將介紹更復雜的場景,如深度學習機器翻譯和圖像搜索。第7章通過基于神經網絡的方法為你的搜索引擎提供多語言能力來指導你。第8章討論了基于內容的圖像集合的搜索,并使用了深度學習模型。第9章討論了與生產相關的主題,如微調深度學習模型和處理不斷輸入的數據流。
作者簡介:
Tommaso Teofili是一名軟件工程師,他對開源機器學習充滿熱情。作為Apache軟件基金會的成員,他為許多開放源碼項目做出了貢獻,從信息檢索到自然語言處理和機器翻譯等主題。他目前在Adobe工作,開發搜索和索引基礎結構組件,并研究自然語言處理、信息檢索和深度學習等領域。他曾在各種會議上發表過搜索和機器學習方面的演講,包括BerlinBuzzwords、計算科學國際會議、ApacheCon、EclipseCon等。
主題: Agile Machine Learning
摘要: 凝聚人才,打造一支偉大的應用型機器學習團隊,是一項不小的壯舉。由于開發人員和數據科學家都在各自領域貢獻了專業知識,單靠通信就可能是一個挑戰。敏捷機器學習教你如何通過敏捷過程交付優秀的數據產品,并通過例子學習如何在生產環境中組織和管理一個快速發展的團隊,該團隊面臨著大規模解決新數據問題的挑戰。作者的方法模擬了敏捷宣言中描述的開創性的工程原理。這本書提供了進一步的上下文,并將最初的原則與交付數據產品的系統的需求進行了對比。
作者簡介: Eric Carter,Eric Carter曾在微軟的Bing和Cortana團隊擔任合作伙伴團隊工程經理。在這些角色中,他致力于圍繞產品和評論、業務列表、電子郵件和日歷的搜索功能。他目前在微軟白板產品組上工作。
簡介: 圖是表示知識的有效方法。它們可以在一個統一的結構中表示不同類型的知識。生物科學和金融等領域已經開始積累大量的知識圖,但是它們缺乏從中提取見解的機器學習工具。
David Mack概述了自己相關想法并調查了最流行的方法。在此過程中,他指出了積極研究的領域,并共享在線資源和參考書目以供進一步研究。
作者介紹: David Mack是Octavian.ai的創始人和機器學習工程師,致力于探索圖機器學習的新方法。在此之前,他與他人共同創立了SketchDeck,這是一家由Y Combinator支持的初創公司,提供設計即服務。他擁有牛津大學的數學碩士學位和計算機科學的基礎,并擁有劍橋大學的計算機科學學士學位。
內容介紹: 本次報告涵蓋內容:為什么將圖應用在機器學習上;圖機器學習的不同方法。現存的圖機器學習往往會忽略數據中的上下文信息,使用圖可以獲取更多的潛在信息。圖的構建方法為節點分類、邊的預測,圖的分類以及邊的分類。兩個主要方法是使用機器學習算法將圖轉換為table,另一種方法是將圖轉換為網絡。在報告中作者詳細介紹了這兩種方法。
課程名稱: CS224W: Machine Learning with Graphs
課程簡介:
網絡是對復雜的社會、技術和生物系統建模的基本工具。結合在線社交網絡的出現和生物科學中大規模數據的可用性,本課程重點分析提供了幾個計算、算法和建模挑戰的大規模網絡。學生將學習機器學習技術和數據挖掘工具,通過研究其潛在的網絡結構和相互聯系,揭示對社會、技術和自然世界的洞察。
在本課程中,我們將介紹圖機器學習技術,包括以下主題:
課程部分大綱:
講師介紹:
Jurij Leskovec是斯坦福大學計算機科學副教授,研究側重于分析和建模大型社區和信息網絡,作為跨社區、技術和自然世界現象的研究。他側重于網絡結構的統計建模、網絡演化、信息傳播、網絡影響和病毒。他所研究的問題是由大規模數據、網絡和其他在線媒體引發的,同樣從事文本挖掘和機器學習的應用。個人官網:
下載索引:鏈接: