優化和機器學習的相互作用是現代計算科學最重要的發展之一。優化的公式和方法在設計從大量數據中提取基本知識的算法方面被證明是至關重要的。然而,機器學習并不僅僅是優化技術的消費者,而是一個快速發展的領域,它本身也在產生新的優化思想。這本書以一種對兩個領域的研究人員都可訪問的方式捕獲了優化和機器學習之間交互的藝術的狀態。
優化方法因其廣泛的適用性和吸引人的理論特性而在機器學習中占有重要地位。當今機器學習模型的復雜性、規模和多樣性日益增加,需要對現有假設進行重新評估。這本書開始了重新評估的過程。它描述了在諸如一階方法,隨機近似,凸松弛,內點方法,和近端方法等已建立的框架。它還專門關注一些新的主題,如正則化優化、魯棒優化、梯度和次梯度方法、分裂技術和二階方法。其中許多技術的靈感來自其他領域,包括運籌學、理論計算機科學和優化子領域。這本書將豐富機器學習社區和這些其他領域以及更廣泛的優化社區之間正在進行的交叉發展。
近年來,自然語言處理的研究方法取得了一些突破。這些突破來源于兩個新的建模框架以及在計算和詞匯資源的可用性的改進。在這個研討會小冊子中,我們將回顧這些框架,以一種可以被視為現代自然語言處理開端的方法論開始:詞嵌入。我們將進一步討論將嵌入式集成到端到端可訓練方法中,即卷積神經網絡和遞歸神經網絡。這本小冊子的第二章將討論基于注意力的模型的影響,因為它們是最近大多數最先進的架構的基礎。因此,我們也將在本章中花很大一部分時間討論遷移學習方法在現代自然語言處理中的應用。最后一章將會是一個關于自然語言生成的說明性用例,用于評估最先進的模型的訓練前資源和基準任務/數據集。
//compstat-lmu.github.io/seminar_nlp_ss20/
在過去的幾十年里,人工智能技術的重要性和應用不斷得到關注。在當今時代,它已經與構成人類塑造環境的大部分環境密不可分。因此,商業、研究和開發、信息服務、工程、社會服務和醫學等無數部門已經不可逆轉地受到人工智能能力的影響。人工智能有三個主要領域組成了這項技術:語音識別、計算機視覺和自然語言處理(見Yeung (2020))。在這本書中,我們將仔細研究自然語言處理(NLP)的現代方法。
這本小冊子詳細介紹了用于自然語言處理的現代方法,如深度學習和遷移學習。此外,本研究亦會研究可用于訓練自然語言處理任務的資源,并會展示一個將自然語言處理應用于自然語言生成的用例。
為了分析和理解人類語言,自然語言處理程序需要從單詞和句子中提取信息。由于神經網絡和其他機器學習算法需要數字輸入來進行訓練,因此應用了使用密集向量表示單詞的詞嵌入。這些通常是通過有多個隱藏層的神經網絡學習的,深度神經網絡。為了解決容易的任務,可以應用簡單的結構神經網絡。為了克服這些簡單結構的局限性,采用了遞歸和卷積神經網絡。因此,遞歸神經網絡用于學習不需要預先定義最佳固定維數的序列的模型,卷積神經網絡用于句子分類。第二章簡要介紹了NLP中的深度學習。第三章將介紹現代自然語言處理的基礎和應用。在第四章和第五章中,將解釋和討論遞歸神經網絡和卷積神經網絡及其在自然語言處理中的應用。
遷移學習是每個任務或領域的學習模型的替代選擇。在這里,可以使用相關任務或領域的現有標記數據來訓練模型,并將其應用到感興趣的任務或領域。這種方法的優點是不需要在目標域中進行長時間的訓練,并且可以節省訓練模型的時間,同時仍然可以(在很大程度上)獲得更好的性能。遷移學習中使用的一個概念是注意力,它使解碼器能夠注意到整個輸入序列,或自注意,它允許一個Transformer 模型處理所有輸入單詞,并建模一個句子中所有單詞之間的關系,這使得快速建模一個句子中的長期依賴性成為可能。遷移學習的概念將在小冊子的第6章簡要介紹。第七章將通過ELMo、ULMFiT和GPT模型來描述遷移學習和LSTMs。第八章將詳細闡述注意力和自注意力的概念。第九章將遷移學習與自注意力相結合,介紹了BERT模型、GTP2模型和XLNet模型。
為NLP建模,需要資源。為了找到任務的最佳模型,可以使用基準測試。為了在基準實驗中比較不同的模型,需要諸如精確匹配、Fscore、困惑度或雙語評估替補學習或準確性等指標。小冊子的第十章簡要介紹了自然語言處理的資源及其使用方法。第11章將解釋不同的指標,深入了解基準數據集SQuAD、CoQa、GLUE和SuperGLUE、AQuA-Rat、SNLI和LAMBADA,以及可以找到資源的預訓練模型和數據庫,如“帶代碼的論文”和“大壞的NLP數據庫”。
在小冊子的最后一章中,介紹了生成性NLP處理自然語言生成,從而在人類語言中生成可理解的文本。因此,不同的算法將被描述,聊天機器人和圖像字幕將被展示,以說明應用的可能性。
本文對自然語言處理中各種方法的介紹是接下來討論的基礎。小冊子的各個章節將介紹現代的NLP方法,并提供了一個更詳細的討論,以及各種示例的潛力和限制。
自然語言理解是人工智能的一個重要分支,主要研究如何利用電腦來理解和生成自然語言。本書重點介紹了自然語言理解所涉及的各個方面,包括語法分析、語義分析、概念分析、語料庫語言學、詞匯語義驅動、中間語言、WordNet、詞匯樹鄰接文法、鏈接文法、基于語段的機器翻譯方法、內識別與文本過濾、機器翻譯的評測等,既有對基礎知識的介紹,又有對新研究進展的綜述,同時還結合了作者(JamesPustejovsky,生成詞庫理論的創始人)多年的研究成果。本書內容全面、詳略得當,結合實例講解,使讀者更易理解。
編輯推薦
《面向機器學習的自然語言標注》內容全面、詳略得當,結合實例講解,使讀者更易理解。自然語言理解是人工智能的一個重要分支,主要研究如何利用計算機來理解和生成自然語言。
名人推薦
“語言標注是自然語言處理的一個關鍵部分,但是現有的計算語言學課程卻少有涉及。本書是難得的一本從實踐角度討論自然語言標注,并且以服務于機器學習算法為目的來考察標注規格與設計的專著。它必將成為本科生和研究生計算語言學課程的一個標準。” ——Nancy Ide瓦薩學院計算機科學系教授
作者簡介 James Pustejovsky教授是美國布蘭代斯(Brandeis University)大學計算機科學系和Volen國家綜合系統中心教授。先后在美國麻省理工學院和馬薩諸塞大學獲得學士學位和博士學位。 Pustejovsky教授主要從事自然語言的理論和計算研究。研究領域包括:計算語言學、詞匯語義學、知識表征、話語語義學、時間推理和抽取等。已經出版多部專著。
本課程關注控制理論和強化學習的理論介紹,側重于連續狀態空間以及物理世界和機器人技術的應用。我們強調計算效率的算法和可證明的界。特別關注RL中非隨機控制和遺憾最小化的新方法。我們將與該領域的經典方法論進行比較和對比。
本課程的練習和項目將需要用python編寫代碼。
這門課程對所有學生開放,但要求有很強的數學背景。
//sites.google.com/view/cos59x-cct/home
深度學習的先驅、圖靈獎獲得者Yann Lecun教授有一種非常簡潔明了地抓住問題癥結的氣質。2020年2月左右,他在巴巴多斯研討會上說,
“控制=梯度強化學習”。
強化學習和控制理論的關鍵區別在于它們所操作的空間。強化學習的范圍通常位于離散狀態空間(如圍棋、國際象棋),而控制理論通常處理涉及物理和連續空間(如機器人)的問題。物理學和結構環境的知識使我們能夠利用差分信息。
后者允許我們使用強大的數學優化和凸松弛技術來設計高效的算法。這是自適應非隨機控制理論的主題,也是本課程的主題。
這本書的主要目的是提出一個連貫的介紹圖論,適合作為一本教科書為高等本科和在數學和計算機科學研究生。它提供了一個系統的處理圖的理論,而不犧牲其直觀和審美的吸引力。大量使用的證明技術被描述和說明,并且提供了大量的練習——不同難度的練習——幫助讀者掌握這些技術并加強他們對材料的掌握。
Individual chapters: Preface Contents Chapter 1: Graphs and Subgraphs Chapter 2: Trees Chapter 3: Connectivity Chapter 4: Euler Tours and Hamilton Cycles Chapter 5: Matchings Chapter 6: Edge Colourings Chapter 7: Independent Sets and Cliques Chapter 8: Vertex Colourings Chapter 9: Planar Graphs Chapter 10: Directed Graphs Chapter 11: Networks Chapter 12: The Cycle Space and Bond Space Appendix 1: Hints to Starred Exercises Appendix II: Four Graphs and a Table of their Properties Appendix III: Some Interesting Graphs Appendix IV: Unsolved Problems Appendix V: Suggestions for Further Reading Glossary of Symbols Index
這是為未來的科學家和工程師準備的微積分介紹的第二卷。第二卷是第一卷的延續,包括第六到第十二章。第六章介紹了向量、向量運算、向量的微分與積分及其應用。第七章研究了以向量形式表示的曲線和曲面,并研究了與這些形式相關的向量運算。此外,還研究了用矢量表示法表示密度、表面積和體積元素的方法。方向導數是與其他向量運算及其屬性一起定義的,因為這些額外的向量使我們能夠找到具有多個變量的函數的最大值和最小值。第八章研究標量場和向量場以及涉及這些量的運算。詳細研究了高斯散度定理、斯托克斯定理和平面上的格林定理及其相關應用。第九章介紹了來自科學和工程選定領域的向量的應用。第十章介紹了矩陣演算和差分演算。第十一章介紹了概率論和統計學。第十章和第十一章之所以出現,是因為在當今社會,技術發展正趨向于一個數字化的世界,學生們應該接觸到一些運算性的微積分,這是為了理解這些技術所需要的。第十二章是作為一個后續想法,介紹那些對數學的一些更高級的領域感興趣的人。
如果你是微積分的初學者,那么一定要確保你有適當的代數和三角的背景材料。如果你有不明白的地方,不要害怕向你的老師提問。去圖書館找一些其他的微積分書,從不同的角度來介紹這門學科。在因特網上,人們可以找到許多微積分的幫助。在因特網上,人們還可以找到許多關于微積分應用的說明。這些額外的學習輔助將向你展示在不同的微積分科目上有多種方法,應該有助于你的分析和推理技能的發展。
//www.math.odu.edu/~jhh/Volume-2.PDF
當前關于機器學習方面的資料非常豐富:Andrew NG在Coursera上的機器學習教程、Bishop的《機器學習與模式識別》 和周志華老師的《機器學習》都是非常好的基礎教材;Goodfellow等人的《深度學習》是學習深度學習技術的首選資料;MIT、斯坦福等名校的公開課也非常有價值;一些主要會議的Tutorial、keynote也都可以在網上搜索到。然而,在對學生們進行培訓的過程中, 我深感這些資料專業性很強,但入門不易。一方面可能是由于語言障礙,另一個主要原因在于機器學習覆蓋 面廣,研究方向眾多,各種新方法層出不窮,初學者往往在各種復雜的名詞,無窮無盡的 算法面前產生畏難情緒,導致半途而廢。
本書的主體內容是基于該研討班形成的總結性資料。基于作者的研究背景,這本書很難說 是機器學習領域的專業著作,而是一本學習筆記,是從一個機器學習 技術使用者角度對機器學習知識的一次總結,并加入我們在本領域研究中的一些經驗和發現。與其說是一本教材,不如說是一本科普讀物, 用輕松活潑的語言和深入淺出的描述為初學者打開機器學習這扇充滿魔力的大門。打開大門以后,我們會發現這是個多么讓人激動人心的 領域,每天都有新的知識、新的思路、新的方法產生,每天都有令人振奮的成果。我們希望這本書 可以讓更多學生、工程師和相關領域的研究者對機器學習產生興趣,在這片異彩紛呈的海域上找到 屬于自己的那顆貝殼。
強烈推薦給所有初學機器學習的人,里面有: 書籍的pdf 課堂視頻 課堂slides 各種延伸閱讀 MIT等世界名校的slides 學生的學習筆記等
【導讀】《機器學習:貝葉斯和優化的視角》是雅典大學信息學和通信系的教授Sergios Theodoridis的經典著作,對所有主要的機器學習方法和新研究趨勢進行了深入探索,涵蓋概率和確定性方法以及貝葉斯推斷方法。非常值得學習。
Sergios Theodoridis教授是雅典大學信息學和通信系的教授,香港中文大學(深圳)客座教授。他的研究領域是信號處理和機器學習。他的研究興趣是自適應算法,分布式和稀疏性感知學習,機器學習和模式識別,生物醫學應用中的信號處理和學習以及音頻處理和檢索。
他的幾本著作與合著蜚聲海內外,包括《機器學習:貝葉斯和優化的視角》以及暢銷書籍《模式識別》。他是2017年EURASIP Athanasios Papoulis獎和2014年EURASIP Meritorious Service獎的獲得者。
機器學習:貝葉斯和優化方法
本書對所有主要的機器學習方法和新研究趨勢進行了深入探索,涵蓋概率和確定性方法以及貝葉斯推斷方法。其中,經典方法包括平均/小二乘濾波、卡爾曼濾波、隨機逼近和在線學習、貝葉斯分類、決策樹、邏輯回歸和提升方法等,新趨勢包括稀疏、凸分析與優化、在線分布式算法、RKH空間學習、貝葉斯推斷、圖模型與隱馬爾可夫模型、粒子濾波、深度學習、字典學習和潛變量建模等。全書構建了一套明晰的機器學習知識體系,各章內容相對獨立,物理推理、數學建模和算法實現精準且細致,并輔以應用實例和習題。本書適合該領域的科研人員和工程師閱讀,也適合學習模式識別、統計/自適應信號處理和深度學習等課程的學生參考。
本文采用了一種獨特的機器學習方法,它包含了對進行研究、開發產品、修補和玩耍所必需的所有基本概念的全新的、直觀的、但又嚴謹的描述。通過優先考慮幾何直觀,算法思維,和實際應用的學科,包括計算機視覺,自然語言處理,經濟學,神經科學,推薦系統,物理,和生物學,這篇文章為讀者提供了一個清晰的理解基礎材料以及實際工具需要解決現實世界的問題。通過深入的Python和基于MATLAB/ octave的計算練習,以及對前沿數值優化技術的完整處理,這是學生的基本資源,也是從事機器學習、計算機科學、電子工程、信號處理和數值優化的研究人員和實踐者的理想參考。其他資源包括補充討論主題、代碼演示和練習,可以在官方教材網站mlrefined.com上找到。