機器學習是學習數據和經驗的算法的研究。它被廣泛應用于各種應用領域,從醫學到廣告,從軍事到行人。任何需要理解數據的領域都是機器學習的潛在的消費者。《A Course in Machine Learning》屬于入門級資料,它涵蓋了現代機器學習的大多數主要方面(監督學習,無監督學習,大間隔方法,概率建模,學習理論等)。它的重點是具有嚴格基礎的廣泛應用。
機器學習是一個廣闊而迷人的領域。即使在今天,機器學習技術仍然在你的生活中占據了相當大的一部分,而且常常是在你不知情的情況下。在某種程度上,任何看似合理的人工智能方法都必須包括學習,如果不是為了別的原因,而是因為如果一個系統不能學習,那么它就很難被稱為智能系統。機器學習本身也很吸引人,因為它提出了關于學習和成功完成任務的意義的哲學問題。
同時,機器學習也是一個非常廣泛的領域,試圖涵蓋所有領域對于教學來說將是一場災難。因為它發展得如此之快,以至于任何試圖報道最新發展的書籍在上線之前都會過時。因此,本書有兩個目標。首先,要通俗地介紹一個非常深的領域是什么。第二,為讀者提供必要的技能,以便在新技術發展過程中掌握新技術。
課程內容:
數學基礎:矩陣、向量、Lp范數、范數的幾何、對稱性、正確定性、特征分解。無約束最優化,graident下降法,凸函數,拉格朗日乘子,線性最小二乘法。概率空間,隨機變量,聯合分布,多維高斯。
線性分類器:線性判別分析,分離超平面,多類分類,貝葉斯決策規則,貝葉斯決策規則幾何,線性回歸,邏輯回歸,感知機算法,支持向量機,非線性變換。
魯棒性:對抗性攻擊、定向攻擊和非定向攻擊、最小距離攻擊、最大允許攻擊、基于規則的攻擊。通過納微擾。支持向量機的魯棒性。
學習理論:偏差和方差,訓練和測試,泛化,PAC框架,Hoeffding不等式,VC維。
參考書籍:
講者: Stanley Chan 教授 //engineering.purdue.edu/ChanGroup/stanleychan.html
課程目標: 您將能夠應用基本的線性代數、概率和優化工具來解決機器學習問題
?你將了解一般監督學習方法的原理,并能評論它們的優缺點。 ?你會知道處理數據不確定性的方法。 ?您將能夠使用學習理論的概念運行基本的診斷。 ?您將獲得機器學習算法編程的實際經驗。
本備忘單是機器學習手冊的濃縮版,包含了許多關于機器學習的經典方程和圖表,旨在幫助您快速回憶起機器學習中的知識和思想。
這個備忘單有兩個顯著的優點:
清晰的符號。數學公式使用了許多令人困惑的符號。例如,X可以是一個集合,一個隨機變量,或者一個矩陣。這是非常混亂的,使讀者很難理解數學公式的意義。本備忘單試圖規范符號的使用,所有符號都有明確的預先定義,請參見小節。
更少的思維跳躍。在許多機器學習的書籍中,作者省略了數學證明過程中的一些中間步驟,這可能會節省一些空間,但是會給讀者理解這個公式帶來困難,讀者會在中間迷失。
簡介: 機器學習是從數據和經驗中學習的算法研究。 它被廣泛應用于從醫學到廣告,從軍事到行人的各種應用領域。 CIML是一組入門資料,涵蓋了現代機器學習的大多數主要方面(監督學習,無監督學習,大幅度方法,概率建模,學習理論等)。 它的重點是具有嚴格主干的廣泛應用。 一個子集可以用于本科課程; 研究生課程可能涵蓋全部材料,然后再覆蓋一些。
作者介紹: Hal Daumé III,教授,他曾擔任Perotto教授職位,他現在Microsoft Research NYC的機器學習小組中。 研究方向是自然語言處理。
大綱介紹:
下載鏈接: //pan.baidu.com/s/1QwSGTioJxDCRvlkBqcJr_A
提取碼:fwbq
在過去的十年里,計算和信息技術突飛猛進。它帶來了醫學、生物學、金融和營銷等各個領域的大量數據。理解這些數據的挑戰導致了統計領域新工具的發展,并催生了數據挖掘、機器學習和生物信息學等新領域。許多這些工具有共同的基礎,但經常用不同的術語表示。這本書在一個共同的概念框架中描述了這些領域的重要思想。雖然方法是統計的,但重點是概念而不是數學。許多例子都給出了,與自由使用彩色圖形。它應該是統計學家和任何對科學或工業數據挖掘感興趣的人的寶貴資源。這本書的覆蓋面很廣,從監督學習(預測)到非監督學習。許多主題包括神經網絡、支持向量機、分類樹和增強——這是任何一本書中對這個主題的首次全面論述。這個主要的新版本的特點,許多主題不包括在原來的,包括圖形模型,隨機森林,集成方法,最小角度回歸和用于lasso的路徑算法、非負矩陣分解和譜聚類。還有一章是關于“寬”數據的方法(p大于n),包括多重測試和錯誤發現率。Trevor Hastie、Robert Tibshirani和Jerome Friedman是斯坦福大學的統計學教授。他們是這一領域的杰出研究人員:Hastie和Tibshirani開發了廣義可加性模型,并就此寫了一本很受歡迎的書。Hastie在S-PLUS中編寫了大量的統計建模軟件,并發明了主曲線和曲面。Tibshirani提出了Lasso,并且是非常成功的Bootstrap介紹的合著者。弗里德曼是許多數據挖掘工具的共同發明者,包括CART、MARS和投影追蹤。
【北京郵電大學】機器學習在材料科學中的應用綜述,Machine learning in materials science //onlinelibrary.wiley.com/doi/pdf/10.1002/inf2.12028