主題: 《COMS W4995 Applied Machine Learning Spring 2020》
課程描述: 這門課提供了機器學習和數據科學的實踐方法。本課程討論機器學習方法如SVMs、隨機森林、梯度提升和神經網絡在真實世界數據集上的應用,包括數據準備、模型選擇和評估。這個類補充了COMS W4721,因為它完全依賴于scikit-learn和tensor flow中所有實現的可用開源實現。除了應用模型外,我們還將討論與產生離子化機器學習模型相關的軟件開發工具和實踐。
主講人簡介: Andreas C. Müller,哥倫比亞大學數據科學研究所的副研究員,也是O'Reilly《用Python進行機器學習簡介》一書的作者。他是scikit學習機學習庫的核心開發人員之一,我已經合作維護了幾年。他曾在紐約大學數據科學中心從事開源和開放科學研究,并在亞馬遜擔任機器學習科學家。個人主頁://amueller.github.io/
本文介紹了一階優化方法及其在機器學習中的應用。這不是一門關于機器學習的課程(特別是它不涉及建模和統計方面的考慮),它側重于使用和分析可以擴展到具有大量參數的大型數據集和模型的廉價方法。這些方法都是圍繞“梯度下降”的概念而變化的,因此梯度的計算起著主要的作用。本課程包括最優化問題的基本理論性質(特別是凸分析和一階微分學)、梯度下降法、隨機梯度法、自動微分、淺層和深層網絡。
本文介紹了一階優化方法及其在機器學習中的應用。這不是一門關于機器學習的課程(特別是它不涉及建模和統計方面的考慮),它側重于使用和分析可以擴展到具有大量參數的大型數據集和模型的廉價方法。這些方法都是圍繞“梯度下降”的概念而變化的,因此梯度的計算起著主要的作用。本課程包括最優化問題的基本理論性質(特別是凸分析和一階微分學)、梯度下降法、隨機梯度法、自動微分、淺層和深層網絡。
掌握通過機器學習和深度學習識別和解決復雜問題的基本技能。使用真實世界的例子,利用流行的Python機器學習生態系統,這本書是你學習機器學習的藝術和科學成為一個成功的實踐者的完美伴侶。本書中使用的概念、技術、工具、框架和方法將教會您如何成功地思考、設計、構建和執行機器學習系統和項目。
使用Python進行的實際機器學習遵循結構化和全面的三層方法,其中包含了實踐示例和代碼。
第1部分側重于理解機器學習的概念和工具。這包括機器學習基礎,對算法、技術、概念和應用程序的廣泛概述,然后介紹整個Python機器學習生態系統。還包括有用的機器學習工具、庫和框架的簡要指南。
第2部分詳細介紹了標準的機器學習流程,重點介紹了數據處理分析、特征工程和建模。您將學習如何處理、總結和可視化各種形式的數據。特性工程和選擇方法將詳細介紹真實數據集,然后是模型構建、調優、解釋和部署。
第3部分探討了多個真實世界的案例研究,涵蓋了零售、交通、電影、音樂、營銷、計算機視覺和金融等不同領域和行業。對于每個案例研究,您將學習各種機器學習技術和方法的應用。動手的例子將幫助您熟悉最先進的機器學習工具和技術,并了解什么算法最適合任何問題。
實用的機器學習與Python將授權您開始解決您自己的問題與機器學習今天!
你將學習:
這本書是給誰看的 IT專業人士、分析師、開發人員、數據科學家、工程師、研究生
目錄:
Part I: Understanding Machine Learning
Chapter 12: Deep Learning for Computer Vision
簡介:
在這本書中,從機器學習基礎開始,然后繼續學習神經網絡,深度學習,然后是卷積神經網絡。在基礎和應用的混合,在MATLAB深度學習這本書中使用MATLAB作為基礎編程語言和工具進行案例研究。
有了這本書,你將能夠解決當今現實世界中的一些大數據、智能機器人和其它復雜的數據問題。您將看到,對于現代智能數據分析和使用來說,深度學習是機器學習中多么復雜和智能的一個方面。
你將學習
作者:
Phil Kim博士是一位經驗豐富的MATLAB程序員。他還研究來自人工智能的大型數據集的算法以及機器學習。他曾在韓國航空航天研究所擔任高級研究員。在那里,他的主要任務是開發無人駕駛飛行器的自主飛行算法和機載軟件。在攻讀博士期間,他開發了一個名為“Clickey”的屏幕鍵盤程序。
課程名稱: Deep Learning
課程簡介:
深度機器學習的最新發展使視覺識別、語音和文本理解或自主智能體系統取得了前所未有的巨大進步。在此背景下,本課程將深入探討深度學習架構的細節,重點是學習這些任務的端到端模型。學生將學習實施、訓練和調試自己的神經網絡,并對該領域的前沿研究有詳細的了解。該課程還將介紹推理方法的最新創新,包括微分推理、對抗性訓練和貝葉斯深度學習。
課程大綱:
講師介紹:
Gilles Louppe是比利時列日大學人工智能和深度學習的副教授。他曾是紐約大學物理系和數據科學中心的博士后助理,與歐洲核子研究中心的阿特拉斯實驗關系密切。他的研究處于機器學習、人工智能和物理科學的交叉點上,他目前的研究興趣包括使用和設計新的機器學習算法,以新的和變革性的方式處理來自基礎科學的數據驅動的問題。個人官網:
下載索引:鏈接:
題目: Machine learning and the physical sciences
摘要:
機器學習(ML)包含廣泛的算法和建模工具,用于大量的數據處理任務,這些任務近年來已經進入大多數科學學科。本文有選擇地回顧了機器學習與物理科學接口的最新研究進展。這包括由物理洞察力驅動的ML的概念發展,機器學習技術在物理中的幾個領域的應用以及這兩個領域之間的交叉。在介紹了機器學習方法和原理的基本概念之后,舉例說明了如何用統計物理來理解ML中的方法,然后介紹了ML方法在粒子物理和宇宙學、量子多體物理、量子計算、化學和材料物理中的應用。此外,還強調了針對加速ML的新型計算體系結構的研究和開發。每個部分都描述了最近的成功以及特定領域的方法和挑戰。
作者簡介:
Giuseppe Carleo于2018年加入了位于美國計算量子物理中心的Flatiron研究所。2007年,他在羅馬大學獲得物理學學士學位;2011年,他在意大利國際高等研究學院獲得凝聚態理論博士學位。他在法國光學研究所和瑞士蘇黎世聯邦理工學院獲得博士后。他也是蘇黎世聯邦理工學院計算量子物理學的講師。Carleo的主要研究方向是發展先進的數值算法來研究強相互作用量子系統的挑戰性問題。他的研究應用范圍包括凝聚態物質、超冷原子和量子計算。他對量子蒙特卡羅方法的發展做出了貢獻,包括平衡和動態特性,包括時變蒙特卡羅和神經網絡量子態。在CCQ,他正在開發和推廣基于人工智能的新技術來解決量子問題。他是開源項目NetKet的創始人和開發負責人。
本課程涵蓋了機器學習和統計建模方面的廣泛主題。 雖然將涵蓋數學方法和理論方面,但主要目標是為學生提供解決實際中發現的數據科學問題所需的工具和原理。 本課程還可以作為基礎,以提供更多專業課程和進一步的獨立學習。 本課程是數據科學中心數據科學碩士學位課程核心課程的一部分。 此類旨在作為DS-GA-1001數據科學概論的延續,其中涵蓋了一些重要的基礎數據科學主題,而這些主題可能未在此DS-GA類中明確涵蓋。
主題: Introduction to Machine Learning
課程簡介: 機器學習是指通過經驗自動提高性能的計算機程序(例如,學習識別人臉、推薦音樂和電影以及驅動自主機器人的程序)。本課程從不同的角度介紹機器學習的理論和實用算法。主題包括貝葉斯網絡、決策樹學習、支持向量機、統計學習方法、無監督學習和強化學習。本課程涵蓋理論概念,例如歸納偏差、PAC學習框架、貝葉斯學習方法、基于邊際的學習和Occam的剃刀。編程作業包括各種學習算法的實際操作實驗。這門課程的目的是讓一個研究生在方法論,技術,數學和算法方面有一個徹底的基礎,目前需要的人誰做的機器學習的研究。
邀請嘉賓: Hal Daumé III,紐約市微軟研究院的研究員,是機器學習小組的一員;他也是馬里蘭大學的副教授。他主要從事自然語言處理和機器學習。
Matt Gormley,卡內基梅隆大學計算機科學學院機器學習部(ML)助教。
Roni Rosenfeld,卡內基梅隆大學計算機學院機器學習系教授兼主任,個人主頁://www.cs.cmu.edu/~roni/。等