本課程涵蓋了機器學習和統計建模方面的廣泛主題。 雖然將涵蓋數學方法和理論方面,但主要目標是為學生提供解決實際中發現的數據科學問題所需的工具和原理。 本課程還可以作為基礎,以提供更多專業課程和進一步的獨立學習。 本課程是數據科學中心數據科學碩士學位課程核心課程的一部分。 此類旨在作為DS-GA-1001數據科學概論的延續,其中涵蓋了一些重要的基礎數據科學主題,而這些主題可能未在此DS-GA類中明確涵蓋。
本文介紹了一階優化方法及其在機器學習中的應用。這不是一門關于機器學習的課程(特別是它不涉及建模和統計方面的考慮),它側重于使用和分析可以擴展到具有大量參數的大型數據集和模型的廉價方法。這些方法都是圍繞“梯度下降”的概念而變化的,因此梯度的計算起著主要的作用。本課程包括最優化問題的基本理論性質(特別是凸分析和一階微分學)、梯度下降法、隨機梯度法、自動微分、淺層和深層網絡。
統計學習理論是一個新興的研究領域,它是概率論、統計學、計算機科學和最優化的交叉領域,研究基于訓練數據進行預測的計算機算法的性能。以下主題將包括:統計決策理論基礎;集中不平等;監督學習和非監督學習;經驗風險最小化;complexity-regularized估計;學習算法的泛化界VC維與復雜性;極大極小下界;在線學習和優化。利用一般理論,我們將討論統計學習理論在信號處理、信息論和自適應控制方面的一些應用。
本文介紹了一階優化方法及其在機器學習中的應用。這不是一門關于機器學習的課程(特別是它不涉及建模和統計方面的考慮),它側重于使用和分析可以擴展到具有大量參數的大型數據集和模型的廉價方法。這些方法都是圍繞“梯度下降”的概念而變化的,因此梯度的計算起著主要的作用。本課程包括最優化問題的基本理論性質(特別是凸分析和一階微分學)、梯度下降法、隨機梯度法、自動微分、淺層和深層網絡。
課程介紹:
經濟學、人工智能和優化是一門跨學科課程,將涵蓋經濟學、運籌學和計算機科學交叉的選定主題。在本課程中,一個反復出現的主題是如何通過人工智能和優化方法大規模地使用經濟解決方案。
課程目錄:
主題: 《COMS W4995 Applied Machine Learning Spring 2020》
課程描述: 這門課提供了機器學習和數據科學的實踐方法。本課程討論機器學習方法如SVMs、隨機森林、梯度提升和神經網絡在真實世界數據集上的應用,包括數據準備、模型選擇和評估。這個類補充了COMS W4721,因為它完全依賴于scikit-learn和tensor flow中所有實現的可用開源實現。除了應用模型外,我們還將討論與產生離子化機器學習模型相關的軟件開發工具和實踐。
主講人簡介: Andreas C. Müller,哥倫比亞大學數據科學研究所的副研究員,也是O'Reilly《用Python進行機器學習簡介》一書的作者。他是scikit學習機學習庫的核心開發人員之一,我已經合作維護了幾年。他曾在紐約大學數據科學中心從事開源和開放科學研究,并在亞馬遜擔任機器學習科學家。個人主頁://amueller.github.io/
課程名稱: CS224W: Machine Learning with Graphs
課程簡介:
網絡是對復雜的社會、技術和生物系統建模的基本工具。結合在線社交網絡的出現和生物科學中大規模數據的可用性,本課程重點分析提供了幾個計算、算法和建模挑戰的大規模網絡。學生將學習機器學習技術和數據挖掘工具,通過研究其潛在的網絡結構和相互聯系,揭示對社會、技術和自然世界的洞察。
在本課程中,我們將介紹圖機器學習技術,包括以下主題:
課程部分大綱:
講師介紹:
Jurij Leskovec是斯坦福大學計算機科學副教授,研究側重于分析和建模大型社區和信息網絡,作為跨社區、技術和自然世界現象的研究。他側重于網絡結構的統計建模、網絡演化、信息傳播、網絡影響和病毒。他所研究的問題是由大規模數據、網絡和其他在線媒體引發的,同樣從事文本挖掘和機器學習的應用。個人官網:
下載索引:鏈接:
由Marc Peter Deisenroth,A Aldo Faisal和Cheng Soon Ong撰寫的《機器學習數學基礎》“Mathematics for Machine Learning” 最新版417頁pdf版本已經放出,作者表示撰寫這本書旨在激勵人們學習數學概念。這本書并不打算涵蓋前沿的機器學習技術,因為已經有很多書這樣做了。相反,作者的目標是通過該書提供閱讀其他書籍所需的數學基礎。這本書分為兩部分:數學基礎知識和使用數學基礎知識進行機器學習算法示例。值得初學者收藏和學習!
主題: Introduction to Machine Learning
課程簡介: 機器學習是指通過經驗自動提高性能的計算機程序(例如,學習識別人臉、推薦音樂和電影以及驅動自主機器人的程序)。本課程從不同的角度介紹機器學習的理論和實用算法。主題包括貝葉斯網絡、決策樹學習、支持向量機、統計學習方法、無監督學習和強化學習。本課程涵蓋理論概念,例如歸納偏差、PAC學習框架、貝葉斯學習方法、基于邊際的學習和Occam的剃刀。編程作業包括各種學習算法的實際操作實驗。這門課程的目的是讓一個研究生在方法論,技術,數學和算法方面有一個徹底的基礎,目前需要的人誰做的機器學習的研究。
邀請嘉賓: Hal Daumé III,紐約市微軟研究院的研究員,是機器學習小組的一員;他也是馬里蘭大學的副教授。他主要從事自然語言處理和機器學習。
Matt Gormley,卡內基梅隆大學計算機科學學院機器學習部(ML)助教。
Roni Rosenfeld,卡內基梅隆大學計算機學院機器學習系教授兼主任,個人主頁://www.cs.cmu.edu/~roni/。等