機器學習的科學進步是由評估模型相對質量的實證研究推動的。這種評估的目標是比較機器學習方法本身,而不是對訓練模型的特定優化實例進行單一測試集評估。由于深度學習模型的性能依賴于各種隨機性來源,僅報告單個最佳模型的性能評分的做法尤其不適用于深度學習。這樣的評估實踐提出了方法論上的問題:一個模型是否預測了它聲稱預測的東西(有效性),一個模型的表現在訓練過程的重復中是否一致(可靠性),以及兩個模型之間的表現差異是否由于機會(顯著性)。本教程的目標是通過具體的統計測試來回答這些問題。該教程是實踐性的,并配有教科書(Riezler和Hagmann, 2021年)和一個包含R和Python代碼的網頁。
在我們的社會中,多模態數據的日益流行導致了對機器的需求增加,以全面地理解這些數據。然而,渴望研究此類數據的數據科學家和機器學習工程師面臨著從現有教程中融合知識的挑戰,這些教程通常單獨處理每個模態。根據我們在新加坡政府對多模態城市問題反饋進行分類的經驗,我們進行了一個手工教程,以希望將機器學習應用于多模態數據。 2021年,作為新加坡政府國家人工智能戰略計劃的一部分,新加坡政府技術機構(GovTech)的數據科學和人工智能部門(DSAID)構建了一個反饋分析引擎[1],根據市政問題反饋,該引擎可以預測:
(1)用戶反饋的案例類型,以便從反饋中提取相關信息,以及 (2)能最有效地處理這個問題的機構。
該引擎由基于歷史數據的深度學習建立的分類模型組成,實現了良好的準確性,可以部署在OneService聊天機器人[2]中。創建這個引擎的最大挑戰之一是處理多模態反饋數據,這些數據包括: (1)文本:對問題的描述, (2)地理位置:問題發生的位置,以及 (3) 圖片:補充文字描述的圖片。
由于通過移動設備捕捉和傳輸圖像的便捷性,多模態數據,尤其是圖文并茂的數據在我們的社會中越來越普遍。除了社交媒體,這類數據在私營和公共部門也都在增長。企業和政府開發了更多、更好的應用程序,這些應用允許人們提交內容(例如,投訴、贊美、建議、技術支持請求、求助電話、產品評論),而不僅僅是文本形式,還附帶圖片,這樣接收者就可以更好地了解手頭的問題。隨著這類數據的增加,對機器整體理解文本和圖像以幫助人類做出決定的需求也在增加。這反過來又導致了對數據科學家和機器學習工程師的需求增加,他們知道如何構建可以做到這一點的模型。然而,大多數與此問題相關的現有教程分別處理文本和圖像,因為它們傳統上來自不同的領域。對于試圖解決此類問題的初級數據科學家(甚至一些中級數據科學家)和機器學習工程師來說,融合來自這些不同教程的知識是一個挑戰。我們希望通過本教程幫助他們克服這些挑戰。
在本教程中,我們教參與者如何使用Transformer[3]對包含文本和圖像的多模態數據進行分****類。它的目標受眾是對神經網絡有一定的了解,并且能夠輕松地編寫代碼。
(1) 文本分類:使用BERT[4]訓練文本分類模型 (2) 文本和圖像分類(v1):使用BERT和ResNet-50[5]訓練文本和圖像分類模型 (3) 文本與圖像分類(v2):使用Align before Fuse (ALBEF)[6]訓練文本與圖像分類模型
氣候變化是當今社會面臨的最大挑戰之一,需要全社會迅速采取行動。在本教程中,我們將介紹氣候變化,解決它意味著什么,以及機器學習如何發揮作用。從能源到農業到災害響應,我們將描述機器學習可以幫助的高影響問題,例如,通過提供決策相關信息、優化復雜系統和加速科學實驗。這些問題包含了方法創新和實際實施的激動人心的機會。我們還將介紹機器學習研究人員和從業者參與的途徑,以及負責任的開發和部署此類工作的關鍵考慮因素。雖然本教程將主要討論機器學習幫助應對氣候變化的機會,但值得注意的是,機器學習是一種通用技術,可以用于幫助和阻礙氣候行動的應用。此外,機器學習有自己的計算和硬件足跡。因此,我們將簡要介紹一個框架,以理解和情境化機器學習的整體氣候影響,并描述機器學習研究和實踐的相關考慮。通過本教程的課程,我們希望參與者能夠更深入地了解氣候變化和機器學習是如何相互交織的,以及他們如何能夠通過使用他們的技能來幫助解決氣候危機。
根據觀察數據估算反事實結果與許多應用(例如,個性化醫療)相關。然而,最先進的方法建立在簡單的長短期記憶(LSTM)網絡上,因此對復雜的、長期依賴關系的推斷產生了挑戰。在本文中,我們開發了一種新的因果Transformer ,用于隨著時間的推移估計反事實結果。我們的模型是專門設計的,以捕獲復雜的,長期的依賴性,時變混雜。為此,我們將三個Transformer子網絡與時變協變量、以前的處理和以前的結果的單獨輸入組合成一個中間交叉關注的聯合網絡。我們進一步為因果Transformer 開發了一個定制的端到端培訓程序。具體來說,我們提出了一種新的反事實領域混淆損失來解決混淆偏差:其目的是學習對抗性平衡表示,以便它們可以預測下一個結果,但不能預測當前的治療分配。我們基于合成的和真實的數據集評估我們的因果Transformer,在這些數據集中,它實現了優于當前基線的性能。據我們所知,這是第一個提出基于transformer的架構來從縱向數據估計反事實結果的工作。
在過去的十年里,人們對人工智能和機器學習的興趣有了相當大的增長。從最廣泛的意義上說,這些領域旨在“學習一些有用的東西”,了解生物體所處的環境。如何處理收集到的信息導致了算法的發展——如何處理高維數據和處理不確定性。在機器學習和相關領域的早期研究階段,類似的技術在相對孤立的研究社區中被發現。雖然不是所有的技術都有概率論的自然描述,但許多都有,它是圖模型的框架(圖和概率論的結合),使從統計物理、統計、機器學習和信息理論的想法的理解和轉移。在這種程度上,現在有理由期待機器學習研究人員熟悉統計建模技術的基礎知識。這本書集中在信息處理和機器學習的概率方面。當然,沒有人說這種方法是正確的,也沒有人說這是唯一有用的方法。事實上,有人可能會反駁說,這是沒有必要的,因為“生物有機體不使用概率論”。無論情況是否如此,不可否認的是,圖模型和概率框架幫助機器學習領域出現了新算法和模型的爆炸式增長。我們還應該清楚,貝葉斯觀點并不是描述機器學習和信息處理的唯一方法。貝葉斯和概率技術在需要考慮不確定性的領域中發揮了自己的作用。
//www0.cs.ucl.ac.uk/staff/d.barber/brml/
本書結構
本書第一部分的目的之一是鼓勵計算機科學專業的學生進入這一領域。許多現代學生面臨的一個特別困難是有限的正規微積分和線性代數訓練,這意味著連續和高維分布的細節可能會讓他們離開。在以概率作為推理系統的一種形式開始時,我們希望向讀者展示他們可能更熟悉的邏輯推理和動態規劃的想法如何在概率環境中有自然的相似之處。特別是,計算機科學的學生熟悉的概念,算法為核心。然而,在機器學習中更常見的做法是將模型視為核心,而如何實現則是次要的。從這個角度來看,理解如何將一個數學模型轉換成一段計算機代碼是核心。
第二部分介紹了理解連續分布所需的統計背景,以及如何從概率框架來看待學習。第三部分討論機器學習的主題。當然,當一些讀者看到他們最喜歡的統計話題被列在機器學習下面時,他們會感到驚訝。統計學和機器學習之間的一個不同觀點是,我們最終希望構建什么樣的系統(能夠完成“人類/生物信息處理任務的機器),而不是某些技術。因此,我認為這本書的這一部分對機器學習者來說是有用的。第四部分討論了明確考慮時間的動態模型。特別是卡爾曼濾波器被視為圖模型的一種形式,這有助于強調模型是什么,而不是像工程文獻中更傳統的那樣把它作為一個“過濾器”。第五部分簡要介紹了近似推理技術,包括隨機(蒙特卡羅)和確定性(變分)技術。
歸一化方法可以提高深度神經網絡(DNN)的訓練穩定性、優化效率和泛化能力,已成為目前最先進的DNN體系結構的基本組成部分。它們還成功地擴散到深度學習的各個領域,包括但不限于計算機視覺、自然語言處理和語音識別。然而,盡管歸一化技術發揮了豐富和越來越重要的作用,我們注意到沒有一個統一的視角來描述、比較和分析它們。此外,我們對這些方法成功的理論基礎仍然難以理解。
本教程涵蓋了標準化方法、分析和應用程序,并將解決以下問題: (1) DNN中不同規范化方法背后的主要動機是什么?我們如何提出一種分類法來理解各種方法之間的異同? (2) 如何縮小標準化技術的經驗成功與我們對它們的理論理解之間的差距? (3) 針對不同任務設計/裁剪標準化技術的最新進展是什么?它們背后的主要見解是什么?
本教程對基于模型的強化學習(MBRL)領域進行了廣泛的概述,特別強調了深度方法。MBRL方法利用環境模型來進行決策——而不是將環境視為一個黑箱——并且提供了超越無模型RL的獨特機會和挑戰。我們將討論學習過渡和獎勵模式的方法,如何有效地使用這些模式來做出更好的決策,以及規劃和學習之間的關系。我們還強調了在典型的RL設置之外利用世界模型的方式,以及在設計未來的MBRL系統時,從人類認知中可以得到什么啟示。
//sites.google.com/view/mbrl-tutorial
近年來,強化學習領域取得了令人印象深刻的成果,但主要集中在無模型方法上。然而,社區認識到純無模型方法的局限性,從高樣本復雜性、需要對不安全的結果進行抽樣,到穩定性和再現性問題。相比之下,盡管基于模型的方法在機器人、工程、認知和神經科學等領域具有很大的影響力,但在機器學習社區中,這些方法的開發還不夠充分(但發展迅速)。它們提供了一系列獨特的優勢和挑戰,以及互補的數學工具。本教程的目的是使基于模型的方法更被機器學習社區所認可和接受。鑒于最近基于模型的規劃的成功應用,如AlphaGo,我們認為對這一主題的全面理解是非常及時的需求。在教程結束時,觀眾應該獲得: