標準機器學習方法簡介。允許您找到適合您的應用程序的問題/方法。為更深入的學習提供必要的詞匯和工具。促進ML的良好實踐、解釋和重現性。
機器學習是指通過經驗自動提高性能的計算機程序(例如,學習識別人臉、推薦音樂和電影,以及駕駛自動機器人的程序)。本課程從不同的角度涵蓋了機器學習的理論和實際算法。我們涵蓋的主題如貝葉斯網絡,決策樹學習,支持向量機,統計學習方法,無監督學習和強化學習。本課程涵蓋了歸納偏差、PAC學習框架、貝葉斯學習方法、基于邊際的學習和奧卡姆剃刀等理論概念。編程作業包括各種學習算法的動手實驗。本課程旨在為研究生提供機器學習研究人員目前所需要的方法學、技術、數學和算法的全面基礎知識。
通過學習這門課程,能夠獲取:
實現和分析現有的學習算法,包括學習良好的分類、回歸、結構化預測、聚類和表示學習方法 將實際機器學習的多個方面整合到一個系統中:數據預處理、學習、正則化和模型選擇 描述用于學習的模型和算法的形式屬性,并解釋這些結果的實際含義 比較和對比不同的學習模式(有監督的,無監督的,等等) 設計實驗來評估和比較現實問題中不同的機器學習技術 運用概率、統計學、微積分、線性代數和最優化來開發新的預測模型或學習方法 給出ML技術的描述,分析它以確定(1)形式主義的表達能力;(2)算法隱含的歸納偏差;(3)搜索空間的大小和復雜度;(5)關于終止、收斂、正確性、準確性或泛化能力的任何保證(或缺乏保證)。
課程地址:
在人工智能、統計學、計算機系統、計算機視覺、自然語言處理和計算生物學等許多領域中,許多問題都可以被視為從局部信息中尋找一致的全局結論。概率圖模型框架為這一范圍廣泛的問題提供了一個統一的視圖,能夠在具有大量屬性和巨大數據集的問題中進行有效的推理、決策和學習。這門研究生水平的課程將為您在復雜問題中運用圖模型中解決核心研究主題提供堅實的基礎。本課程將涵蓋三個方面: 核心表示,包括貝葉斯網絡和馬爾科夫網絡,以及動態貝葉斯網絡;概率推理算法,包括精確和近似; 以及圖模型的參數和結構的學習方法。進入這門課程的學生應該預先具備概率、統計學和算法的工作知識,盡管這門課程的設計是為了讓有較強數學背景的學生趕上并充分參與。希望通過本課程的學習,學生能夠獲得足夠的實際應用的多變量概率建模和推理的工作知識,能夠用通用模型在自己的領域內制定和解決廣泛的問題。并且可以自己進入更專業的技術文獻。
提起李宏毅老師,熟悉機器學習的讀者朋友一定不會陌生。很多人選擇的機器學習入門學習材料都是李宏毅老師的臺大公開課視頻。今年李宏毅老師開設一門新的機器學習機器學習課程,涵蓋最新熱門主題,非常值得關注!
李宏毅老師的機器學習視頻是機器學習領域經典的中文視頻之一,也被稱為中文世界中最好的機器學習視頻。李老師以幽默風趣的上課風格讓很多晦澀難懂的機器學習理論變得輕松易懂,他將理論知識與有趣的例子結合在課堂上展現,并且對深奧的理論知識逐步推導,保證學習者能夠學習到問題的精髓所在。比如老師會經常用寶可夢來結合很多機器學習算法。對于想入門機器學習又想看中文講解的人來說絕對是非常推薦的。
//speech.ee.ntu.edu.tw/~hylee/ml/2021-spring.html
目錄內容: 引言 深度學習 自注意力 機器學習理論 Transformer 生成式模型 自監督學習 可解釋AI,對抗攻擊 域自適應,強化學習 量子機器學習 終身壓縮 元學習
學習使用Python分析數據和預測結果的更簡單和更有效的方法
Python機器學習教程展示了通過關注兩個核心機器學習算法家族來成功分析數據,本書能夠提供工作機制的完整描述,以及使用特定的、可破解的代碼來說明機制的示例。算法用簡單的術語解釋,沒有復雜的數學,并使用Python應用,指導算法選擇,數據準備,并在實踐中使用訓練過的模型。您將學習一套核心的Python編程技術,各種構建預測模型的方法,以及如何測量每個模型的性能,以確保使用正確的模型。關于線性回歸和集成方法的章節深入研究了每種算法,你可以使用書中的示例代碼來開發你自己的數據分析解決方案。
機器學習算法是數據分析和可視化的核心。在過去,這些方法需要深厚的數學和統計學背景,通常需要結合專門的R編程語言。這本書演示了機器學習可以如何實現使用更廣泛的使用和可訪問的Python編程語言。
使用線性和集成算法族預測結果
建立可以解決一系列簡單和復雜問題的預測模型
使用Python應用核心機器學習算法
直接使用示例代碼構建自定義解決方案
機器學習不需要復雜和高度專業化。Python使用了更簡單、有效和經過良好測試的方法,使這項技術更容易為更廣泛的受眾所接受。Python中的機器學習將向您展示如何做到這一點,而不需要廣泛的數學或統計背景。
深度學習的研究在許多機器學習任務上產生了最先進的結果。大多數的進步都是由直覺和通過試驗和錯誤進行的大規模探索推動的。因此,目前理論落后于實踐。ML社區并不完全理解為什么最好的方法是有效的。來自UIUC Matus Telgarsky教授撰寫了關于深度學習理論筆記,值得關注。
地址: //mjt.cs.illinois.edu/dlt/
這些筆記的哲學。兩個關鍵的觀點決定了到目前為止所包含的內容。 我的目標是對文獻中出現的東西提供簡化的證明,理想情況下,把困難的東西簡化成適合一節課的東西。 我主要關注通過標準(通常是ReLU)前饋網絡實現IID數據的二進制分類的低測試誤差的經典觀點。
內容組織:
近似 (從第1節開始): 給定一個分類問題,存在一個深度網絡,在分布上實現低誤差。
優化 (從第9節開始): 對于一個分類問題,給定一個有限的訓練集,存在尋找低訓練誤差和低復雜度的預測器的算法。
泛化 (從第16節開始): 對于低復雜度的網絡,訓練和測試誤差之間的差距很小。
本課程涵蓋了機器學習和數據挖掘的一系列選定主題,重點是部署真實系統的好方法和實踐。大部分章節是關于常用的監督學習技術,和較小程度上非監督方法。這包括線性回歸和邏輯回歸的基本算法、決策樹、支持向量機、聚類、神經網絡,以及特征選擇和降維、誤差估計和經驗驗證的關鍵技術。
//www.siamak.page/teachings/comp551f20/comp551f20/
Part 1.機器學習簡史 a short tour of ML Part 2. 線性模型、概率解釋與梯度優化,linear models, their probabilistic interpretation and gradient optimization Part 3. 神經網絡與深度學習,Neural networks and deep learning
//www.math.arizona.edu/~hzhang/math574.html
隨著信息技術的飛速發展,在各個領域產生了大量的科學和商業數據。例如,人類基因組數據庫項目已經收集了千兆字節的人類遺傳密碼數據。萬維網提供了另一個例子,它擁有由數百萬人使用的文本和多媒體信息組成的數十億Web頁面。
本課程涵蓋了現代數據科學技術,包括基本的統計學習理論及其應用。將介紹各種數據挖掘方法、算法和軟件工具,重點在概念和計算方面。將涵蓋生物信息學、基因組學、文本挖掘、社交網絡等方面的應用。
本課程著重于現代機器學習的統計分析、方法論和理論。它是為學生誰想要實踐先進的機器學習工具和算法,也了解理論原理和統計性質的算法。主題包括回歸、分類、聚類、降維和高維分析。
課程內容:
數學基礎:矩陣、向量、Lp范數、范數的幾何、對稱性、正確定性、特征分解。無約束最優化,graident下降法,凸函數,拉格朗日乘子,線性最小二乘法。概率空間,隨機變量,聯合分布,多維高斯。
線性分類器:線性判別分析,分離超平面,多類分類,貝葉斯決策規則,貝葉斯決策規則幾何,線性回歸,邏輯回歸,感知機算法,支持向量機,非線性變換。
魯棒性:對抗性攻擊、定向攻擊和非定向攻擊、最小距離攻擊、最大允許攻擊、基于規則的攻擊。通過納微擾。支持向量機的魯棒性。
學習理論:偏差和方差,訓練和測試,泛化,PAC框架,Hoeffding不等式,VC維。
參考書籍:
講者: Stanley Chan 教授 //engineering.purdue.edu/ChanGroup/stanleychan.html
課程目標: 您將能夠應用基本的線性代數、概率和優化工具來解決機器學習問題
?你將了解一般監督學習方法的原理,并能評論它們的優缺點。 ?你會知道處理數據不確定性的方法。 ?您將能夠使用學習理論的概念運行基本的診斷。 ?您將獲得機器學習算法編程的實際經驗。
臺大教授李宏毅的機器學習課程廣受歡迎與好評。李老師的授課風格風趣幽默,通俗易懂,其課程內容中不僅有機器學習、深度學習的基礎知識,也會介紹 ML 領域里的各種最新技術。最新的機器學習課程,李老師講述了終身學習與可解釋ML、異常檢測、對抗攻擊,值得觀看學習。
課程資料鏈接:
//speech.ee.ntu.edu.tw/~tlkagk/courses_ML19.html
課程視頻(Bilibili):
YouTube 鏈接: