題目: Machine Learning Advanced Techniques and Emerging Applications
簡介:
跨不同的工業部門、業務單位和科研社區生成、存儲和通信的數據量正在迅速擴大。移動通信和分布式/并行計算技術的最新發展使跨不同部分的生成數據的實時收集和處理成為可能。一方面,移動通信行業所支持的物聯網(IoT)連接了能夠收集異構數據的各種類型的傳感器。另一方面,計算能力的最新進展,例如圖形處理單元(gpu)中的并行處理和云計算集群上的分布式處理,使處理大量數據成為可能。有必要從大量數據(所謂的大數據)中發現重要的模式并推斷出趨勢,以增強數據驅動的決策過程。機器學習中已經開發了工具和技術,以結構化和自動化的方式從可用數據中得出有洞察力的結論。機器學習算法基于多個領域開發的概念和工具,包括統計、人工智能、信息論、認知科學和控制理論。機器學習的最新進展在不同的科學領域有廣泛的應用。這本書涵蓋了機器學習技術在智能城市、自動化工業和新興企業的廣泛應用領域的最新進展。
章節:
作者簡介:
Hamed Farhadi是瑞典斯德哥爾摩愛立信研究所的研究員。2014年在瑞典斯德哥爾摩KTH皇家理工學院獲得博士學位。2016年,他是美國馬薩諸塞州劍橋市哈佛大學的博士后研究員,2015年,他是瑞典哥德堡查爾默斯理工大學的博士后研究員。他的研究興趣主要集中在統計信號處理和機器學習等廣泛的應用領域,包括無線醫療系統、微型機器人手術、臨床數據分析和無線信息網絡。他曾獲得多項學術獎項,包括ICASSP 2014最佳學生論文獎。Farhadi博士是2015年IEEE醫學信息與通信技術國際研討會(ISMICT)的聯合主席。
掌握通過機器學習和深度學習識別和解決復雜問題的基本技能。使用真實世界的例子,利用流行的Python機器學習生態系統,這本書是你學習機器學習的藝術和科學成為一個成功的實踐者的完美伴侶。本書中使用的概念、技術、工具、框架和方法將教會您如何成功地思考、設計、構建和執行機器學習系統和項目。
使用Python進行的實際機器學習遵循結構化和全面的三層方法,其中包含了實踐示例和代碼。
第1部分側重于理解機器學習的概念和工具。這包括機器學習基礎,對算法、技術、概念和應用程序的廣泛概述,然后介紹整個Python機器學習生態系統。還包括有用的機器學習工具、庫和框架的簡要指南。
第2部分詳細介紹了標準的機器學習流程,重點介紹了數據處理分析、特征工程和建模。您將學習如何處理、總結和可視化各種形式的數據。特性工程和選擇方法將詳細介紹真實數據集,然后是模型構建、調優、解釋和部署。
第3部分探討了多個真實世界的案例研究,涵蓋了零售、交通、電影、音樂、營銷、計算機視覺和金融等不同領域和行業。對于每個案例研究,您將學習各種機器學習技術和方法的應用。動手的例子將幫助您熟悉最先進的機器學習工具和技術,并了解什么算法最適合任何問題。
實用的機器學習與Python將授權您開始解決您自己的問題與機器學習今天!
你將學習:
這本書是給誰看的 IT專業人士、分析師、開發人員、數據科學家、工程師、研究生
目錄:
Part I: Understanding Machine Learning
Chapter 12: Deep Learning for Computer Vision
簡介: 物聯網(IoT)被廣泛認為是未來Internet的關鍵組成部分,因此近年來引起了極大的興趣。物聯網由數十億個智能且可通信的“事物”組成,這些事物進一步通過物聯網虛擬世界擴展了邊界世界。這種無處不在的智能事物每天都會產生大量數據,因此迫切需要對各種智能移動設備進行快速數據分析。幸運的是,深度學習領域的最新突破使我們能夠以優雅的方式解決問題。可以導出深度模型來處理大量傳感器數據,并快速有效地了解智能設備上各種IoT應用程序的基礎功能。在本文中,我們調查了有關將深度學習用于各種物聯網應用的文獻。我們旨在就如何從多種角度應用深度學習工具以在四個代表性領域(包括智能醫療保健,智能家居,智能交通和智能產業)中增強物聯網應用程序的功能提供見解。主要目標是將深度學習和物聯網這兩個學科無縫地融合在一起,從而在物聯網應用中產生了各種各樣的新設計,例如健康監測,疾病分析,室內定位,智能控制,家用機器人技術,交通預測,交通監視,自動駕駛和制造檢查。我們還將討論一系列問題,挑戰和未來的研究方向,這些問題將利用深度學習來為物聯網應用程序提供支持,這可能會激發并激發這一有前途的領域的進一步發展。
題目: Representation Learning on Graphs: Methods and Applications
摘要:
圖機器學習是一項重要且普遍存在的任務,其應用范圍從藥物設計到社交網絡中的友情推薦。這個領域的主要挑戰是找到一種表示或編碼圖形結構的方法,以便機器學習模型能夠輕松地利用它。傳統上,機器學習方法依賴于用戶定義的啟發法來提取對圖的結構信息進行編碼的特征(例如,度統計或內核函數)。然而,近年來,使用基于深度學習和非線性降維的技術,自動學習將圖結構編碼為低維嵌入的方法激增。在這里,我們提供了一個概念上的回顧,在這一領域的關鍵進展,圖表示學習,包括基于矩陣分解的方法,隨機漫步的算法和圖神經網絡。我們回顧了嵌入單個節點的方法以及嵌入整個(子)圖的方法。在此過程中,我們開發了一個統一的框架來描述這些最近的方法,并強調了一些重要的應用程序和未來工作的方向。
作者簡介:
William L. Hamilton是麥吉爾大學計算機科學的助理教授,也是加拿大魁北克Mila AI研究所的CIFAR AI主席。William L. Hamilton開發的機器學習模型可以對這個復雜的、相互聯系的世界進行推理。研究興趣集中在機器學習、網絡科學和自然語言處理的交叉領域,目前的重點是快速發展的圖表示學習和圖神經網絡。
Rex Ying是斯坦福大學計算機科學二年級的博士生,研究主要集中在開發應用于圖形結構數據的機器學習算法。曾致力于開發可擴展到網絡規模數據集的廣義圖卷積網絡,應用于推薦系統、異常檢測和生物學。
講座題目
Recent Progress in Zeroth Order Optimization and Its Applications to Adversarial Robustness in Data Mining and Machine Learning
講座簡介
當梯度的顯式表達式很難或不可能獲得時,零階(ZO)優化越來越被用來解決大數據和機器學習問題。它通過有效梯度估計近似全梯度實現無梯度優化。最近的一些重要應用包括:a)產生對深度神經網絡的預測規避、黑箱對抗攻擊;b)計算能力有限的在線網絡管理;c)黑箱/復雜系統的參數推斷;d)根據損失函數部分反饋的bandit優化她的對手所揭示的價值觀。 本教程旨在全面介紹ZO優化方法在理論和應用方面的最新進展。在理論方面,我們將討論ZO算法的收斂速度和迭代復雜性分析,并與它們的一階對應進行比較。在應用方面,我們將重點介紹ZO優化在研究深層神經網絡魯棒性方面的一個很有吸引力的應用-從黑箱機器學習模型生成對抗性示例的實用有效的對抗性攻擊。我們還將總結有關ZO優化、大數據挑戰和一些開放式數據挖掘和機器學習問題的潛在研究方向。
講座嘉賓
Pin-Yu Chen 是麻省理工學院-IBM人工智能實驗室,IBM Thomas J.Watson研究中心,可信人工智能小組和PI的研究人員。最近的研究重點是對抗性機器學習和神經網絡的魯棒性,更廣泛地說,使機器學習值得信賴。我的研究興趣還包括圖形學習、網絡數據分析及其在數據挖掘、機器學習、信號處理和網絡安全中的應用。
題目: Reinforcement Learning:Theory and Algorithms
簡介:
強化學習是近幾年研究的熱點,特別是伴隨DeepMind AlphaGo的出現名聲大噪。強化學習(RL)是一種機器學習范式,在這種范式中,agent從經驗中學習完成順序決策任務,RL在機器人、控制、對話系統、醫療等領域有廣泛的應用。《強化學習:理論與算法》這本書講述了強化學習最新進展,包括MDP、樣本復雜度、策略探索、PG、值函數等關鍵議題,是了解強化學習的材料。
章節:
作者簡介:
Alekh Agarwal目前是微軟人工智能研究中心的研究員,領導強化學習研究小組。之前,在加州大學伯克利分校獲得計算機科學博士學位后,與彼得·巴特利特(Peter Bartlett)和馬丁·溫賴特(Martin Wainwright)一起在紐約微軟研究院(Microsoft Research)度過了六年美好的時光。
姜楠,UIUC助理教授,機器學習研究員。核心研究領域是強化學習(RL),關注于RL的樣本效率,并利用統計學習理論中的思想來分析和開發RL算法。
沙姆·卡卡德(Sham M. Kakade)是華盛頓研究基金會(Washington Research Foundation)數據科學主席,同時在華盛頓大學(University of Washington)艾倫學院(Allen School)和統計學系任職。他致力于機器學習的理論基礎,專注于設計(和實現)統計和計算效率的算法。
題目: Geographic Information Systems and Science
簡介:
地理信息科學(GISc)已經確立了自己作為一個協作的信息處理方案并且越來越受歡迎。然而,這種跨學科和/或跨學科系統仍然有些被誤解。本書討論了一些GISc領域的學生、研究人員和普通用戶。章節集中在GIS的重要方面,牢記GIS的處理能力以及得到每個解決方案所涉及的數學和公式。這本書有一個導言和八個主要章節,分為五個部分。第一部分是比較普遍的關注GISc及其與GIS和地理的關系,第二部分是關于位置分析和建模,第三部分是遙感數據分析,第四部分是大數據和增強現實,最后,第五部分是查看志愿理信息。
章節:
作者簡介:
Jorge Rocha,地理學家,1970年出生于里斯本。他持有地理信息系統碩士學位(2003年)和區域管理碩士學位(2013年),并持有地理信息科學博士學位(2012年)。目前,他是地理和空間規劃研究所的助理教授,也是里斯本大學地理研究中心的建模、城市和區域規劃以及環境危害和風險評估和管理研究小組的成員。他的專長領域是地理模擬和地理計算,包括人工神經網絡、圖論、細胞自動機和多智能體系統。Jorge的工作非常多樣化,主要集中在城市形態、遙感、流行病學、健康地理、智慧城市和大數據(地理營銷和旅游)等領域。
Patricia Abrantes是波爾圖大學地理學系的助理教授,她在地理信息系統與空間規劃課程中講授空間分析和統計。她是地理和空間規劃研究中心的研究員。2007年,她在里斯本諾娃大學和巴黎第四大學(索邦)完成地理博士學位,專攻空間規劃。從那以后,她先后在法國農業研究所、波爾多第三大學和里斯本大學地理和空間規劃研究所工作。她的研究興趣包括土地利用與城市農業、農業生態系統服務、空間分析、地理信息系統(GIS)和使用模擬和場景構建的參與式GIS。
書籍介紹: 機器學習是一門人工智能的科學,該領域的主要研究對象是人工智能,特別是如何在經驗學習中改善具體算法的性能。機器學習是人工智能及模式識別領域的共同研究熱點,其理論和方法已被廣泛應用于解決工程應用和科學領域的復雜問題。本書從機器學習的基礎入手,分別講述了分類、排序、降維、回歸等機器學習任務,是入門機器學習的一本好書。
作者: Mehryar Mohri,是紐約大學庫蘭特數學科學研究所的計算機科學教授,也是Google Research的研究顧問。
大綱介紹:
作者主頁://cs.nyu.edu/~mohri/
主題:Deep Learning for Graphs: Models and Applications
摘要:圖提供了多種類型的數據的通用表示,而深度學習在表示學習方面顯示了巨大的能力。因此,用圖連接深度學習提供了機會,使各種現實世界問題的通用解決方案成為可能。然而,傳統的深度學習技術對常規網格數據(如圖像和序列)具有破壞性,因此不能直接應用于圖結構數據。因此,將這兩個領域結合起來面臨著巨大的挑戰。在本教程中,我將全面概述圖深度學習的最新進展,包括模型和應用。特別地,我將介紹一些基本概念,回顧最先進算法,并舉例說明各種重要的應用。最后,我將通過討論開放問題和挑戰來總結本教程。
嘉賓簡介:唐繼良(Jiang Tang)自2016年秋季@起擔任密歇根州立大學計算機科學與工程系的助理教授。在此之前,他是Yahoo Research的研究科學家,并于2015年從亞利桑那州立大學獲得博士學位。他的研究興趣包括社交計算,數據挖掘和機器學習及其在教育中的應用。他曾獲得2019年NSF職業獎,2015年KDD最佳論文亞軍和6項最佳論文獎,包括WSDM2018和KDD2016。他是會議組織者(例如KDD,WSDM和SDM)和期刊編輯(例如TKDD)。他的研究成果發表在高排名的期刊和頂級會議論文集上,獲得了數千篇引文(Google學術搜索)和廣泛的媒體報道。
主題: Introduction to Machine Learning
課程簡介: 機器學習是指通過經驗自動提高性能的計算機程序(例如,學習識別人臉、推薦音樂和電影以及驅動自主機器人的程序)。本課程從不同的角度介紹機器學習的理論和實用算法。主題包括貝葉斯網絡、決策樹學習、支持向量機、統計學習方法、無監督學習和強化學習。本課程涵蓋理論概念,例如歸納偏差、PAC學習框架、貝葉斯學習方法、基于邊際的學習和Occam的剃刀。編程作業包括各種學習算法的實際操作實驗。這門課程的目的是讓一個研究生在方法論,技術,數學和算法方面有一個徹底的基礎,目前需要的人誰做的機器學習的研究。
邀請嘉賓: Hal Daumé III,紐約市微軟研究院的研究員,是機器學習小組的一員;他也是馬里蘭大學的副教授。他主要從事自然語言處理和機器學習。
Matt Gormley,卡內基梅隆大學計算機科學學院機器學習部(ML)助教。
Roni Rosenfeld,卡內基梅隆大學計算機學院機器學習系教授兼主任,個人主頁://www.cs.cmu.edu/~roni/。等