深度神經網絡在計算機視覺、自然語言處理和機器人技術等領域取得了卓越的成就。然而,這些模型在理解我們周圍世界的能力,以及概括和適應新任務或環境的能力方面仍然是蒼白的。這個問題的一個可能的解決方案是理解因果關系的模型,因為這樣的模型可以推斷因果變量之間的聯系和干預對它們的影響。然而,現有的因果算法通常不能擴展,也不能適用于高度非線性的設置,它們也假設因果變量是有意義的和給定的。最近,為了解決上述挑戰,人們對因果關系和深度學習的交集產生了越來越多的興趣和研究活動,它們使用深度學習來受益于因果算法,反之亦然。本教程旨在為兩種受眾介紹因果關系和深度學習的基本概念,提供近期工作的概述,以及目前在這兩個領域研究的協同作用、挑戰和機會。
因果關系的深度學習
建模功能的關系 學習圖上的分布 表征是學習特征的豐富組成 潛在的因果變量
深度學習的因果關系
為什么DL有因果關系 DL中因果學習的基準 DL中因果學習的目標和架構 利用因果關系的概念來幫助DL
講者:
Nan Rosemary Ke是Deepmind的一名研究科學家,她的研究興趣是建立模型,通過理解因果關系來概括變化的任務和環境。在加入Deepmind之前,她是Mila的博士生,由Yoshua Bengio和Chris Pal擔任導師。她還獲得了Facebook獎學金,并在2020年被評為機器學習領域的一顆后起之星。Rosemary的研究興趣結合了深度學習和因果關系的見解;她一直致力于建立能夠充分理解因果關系的模型,以推斷因果變量之間的聯系以及干預對它們的影響。她的研究成果已在各大會議(NeurIPS, ICML, ICLR)上發表。
Stefan Bauer是斯德哥爾摩KTH的助理教授和CIFAR Azrieli全球學者。通過使用和開發因果關系、深度學習和真實機器人系統的工具,他的研究聚焦于人工智能的長期目標,即設計能夠跨環境和任務推斷經驗的機器。他在蘇黎世聯邦理工學院獲得計算機科學博士學位,并因杰出博士論文被授予蘇黎世聯邦理工學院獎章。在此之前,他畢業于蘇黎世聯邦理工學院(ETH Zurich),獲得數學學士學位和理學碩士學位,以及倫敦大學(LSE)的經濟學和金融學學士學位。在學習期間,他獲得了瑞士和德國國家功績基金會的獎學金。2019年,他獲得了機器學習國際會議(ICML)的最佳論文獎,2020年,他是云端機器人挑戰real-robot-challenge.com的主要組織者。
參考文獻:
Michael Ahn et al. "Do as i can, not as i say: Grounding language in robotic affordances." arXiv preprint arXiv:2204.01691 (2022).
Kartik Ahuja, Jason Hartford, and Yoshua Bengio. "Properties from mechanisms: an equivariance perspective on identifiable representation learning." NeurIPS (2021).
Martin Arjovsky et al. "Invariant risk minimization." arXiv preprint arXiv:1907.02893 (2019).
Ossama Ahmed, Frederik Tr?uble, Anirudh Goyal, Alexander Neitz, Yoshua Bengio, Bernhard Sch?lkopf, Manuel Wüthrich, and Stefan Bauer. Causalworld: A robotic manipulation benchmark for causal structure and transfer learning, ICLR, 2021.
Sara Beery, Grant Van Horn, and Pietro Perona. "Recognition in terra incognita." ECCV. 2018.
Matthew Botvinick et al. Reinforcement learning, fast and slow. Trends in cognitive sciences 2019.
Robert Geirhos, et al. "Shortcut learning in deep neural networks." Nature Machine Intelligence (2020).
深度神經網絡在計算機視覺、自然語言處理和機器人技術等領域取得了卓越的成就。然而,這些模型在理解我們周圍世界的能力,以及泛化和適應新任務或環境的能力方面仍然是蒼白的。這個問題的一個可能的解決方案是理解因果關系的模型,這樣的模型可以推斷因果變量之間的聯系和干預對它們的影響。然而,現有的因果算法通常不能擴展,也不能適用于高度非線性的設置,它們也假設因果變量是有意義的和給定的。最近,為了解決上述挑戰,人們對因果關系和深度學習的交集產生了越來越多的興趣和研究活動,它們使用深度學習來受益于因果算法,反之亦然。本教程旨在為兩種受眾介紹因果關系和深度學習的基本概念,提供近期工作的概述,以及目前在這兩個領域研究的協同作用、挑戰和機會。
因果關系的深度學習
建模功能的關系 學習圖上的分布 表征是學習特征的豐富組成* 潛在的因果變量
深度學習的因果關系
*為什么DL有因果關系 *DL中因果學習的基準 *DL中因果學習的目標和架構 *利用因果關系的概念來幫助DL
講者: Yoshua Bengio加拿大蒙特利爾大學教授 2018年圖靈獎獲得者 蒙特利爾學習算法研究所(Mila)主管
1964年生,加拿大人。他是世界公認的人工智能領域頂尖專家之一,因其在深度學習方面的開創性工作而聞名,與杰弗里·辛頓、楊立昆一同獲得了2018年圖靈獎。他是蒙特利爾大學全職教授,也是Mila魁北克人工智能研究所的創始人和科學主任。他作為高級研究員共同指導CIFAR的“機器與大腦學習”項目,并擔任IVADO科學主任。他關注人工智能的社會影響和人工智能惠及所有人的目標,積極為《負責任地發展人工智能的蒙特利爾宣言》做出貢獻,他還是英國倫敦皇家學會和加拿大皇家學會會員。
Nan Rosemary Ke是Deepmind的一名研究科學家,她的研究興趣是建立模型,通過理解因果關系來概括變化的任務和環境。在加入Deepmind之前,她是Mila的博士生,由Yoshua Bengio和Chris Pal擔任導師。她還獲得了Facebook獎學金,并在2020年被評為機器學習領域的一顆后起之星。Rosemary的研究興趣結合了深度學習和因果關系的見解;她一直致力于建立能夠充分理解因果關系的模型,以推斷因果變量之間的聯系以及干預對它們的影響。她的研究成果已在各大會議(NeurIPS, ICML, ICLR)上發表。
氣候變化是當今社會面臨的最大挑戰之一,需要全社會迅速采取行動。在本教程中,我們將介紹氣候變化,解決它意味著什么,以及機器學習如何發揮作用。從能源到農業到災害響應,我們將描述機器學習可以幫助的高影響問題,例如,通過提供決策相關信息、優化復雜系統和加速科學實驗。這些問題包含了方法創新和實際實施的激動人心的機會。我們還將介紹機器學習研究人員和從業者參與的途徑,以及負責任的開發和部署此類工作的關鍵考慮因素。雖然本教程將主要討論機器學習幫助應對氣候變化的機會,但值得注意的是,機器學習是一種通用技術,可以用于幫助和阻礙氣候行動的應用。此外,機器學習有自己的計算和硬件足跡。因此,我們將簡要介紹一個框架,以理解和情境化機器學習的整體氣候影響,并描述機器學習研究和實踐的相關考慮。通過本教程的課程,我們希望參與者能夠更深入地了解氣候變化和機器學習是如何相互交織的,以及他們如何能夠通過使用他們的技能來幫助解決氣候危機。
【主要講師】
Karl Tuyls 教授是一名利物浦大學人工智能研究員和計算機科學教授,DeepMind(巴黎)的科學家。興趣主要集中在理解智能并利用這些知識在多智能體環境中構建人工智能。其研究圍繞著開發用于評估和訓練智能體的博弈論技術,以及開發動態博弈論作為在合作和競爭多智能體環境中學習的基礎。與此相關的是,還研究多機器人系統。
【教程slides】
卡內基梅隆大學張坤老師進行主旨報告,主要討論以下問題:
我們為何在意因果關系? 因果關系和因果思維有何用處? 如何從觀測數據中學習因果關系? 如何自動從數據中發現有因果意義的隱變量以及它們之間的因果關系? 如何自動的實現遷移學習?遷移學習一定需要因果表述么? 還有哪些機器學習任務會受益于因果思維?
……
張坤是卡內基梅隆大學哲學系副教授(并在機器學習系兼職)。他的研究領域是因果關系、機器學習以及通用人工智能。他在自動 因果發現領域提出了一系列模型和算法,并與合作者一起開創了從因果思維的角度來理解和解決復雜的機器學習問題的研究方向。他長期擔任一系 列機器學習和人工智能會議的領域主席、資深領域主席或程序委員會主 席,包括UAI、NeurlPS. ICML. CLeaR、IJCAI和AISTATS等會議。
Yoshua Bengio 說“因果關系對于機器學習的下一步進展非常重要“。” 深度學習包含了對靜態數據集的學習,這使得人工智能非常擅長與相關性和關聯相關的任務。然而,神經網絡不能解釋因果關系,也不能解釋為什么這些聯系和關聯存在。他們也不擅長涉及想象力、推理和計劃的任務。這反過來又限制了人工智能推廣其學習并將其技能轉移到其他相關環境的能力。 在本演講中,Yoshua Bengio將介紹因果表示學習。
高層語義變量空間中的稀疏因子圖 語義變量是因果的:代理,意圖,可控對象 局部因果干預引起的分布變化(語義空間) 高層次語義變量/思想與單詞/句子之間的簡單映射 跨實例共享“通用規則”(作為參數),需要變量和間接 含義(例如,由編碼器接地)是穩定和健壯的wrt變化在分發 信用分配只適用于短的因果鏈
//www.youtube.com/watch?v=rKZJ0TJWvTk&list=PLoazKTcS0Rzb6bb9L508cyJ1z-U9iWkA0
Model-Based Methods in Reinforcement Learning 本教程對基于模型的強化學習(MBRL)領域進行了廣泛的概述,特別強調了深度方法。MBRL方法利用環境模型來做決策——而不是將環境看作一個黑箱——并且提供了超越無模型RL的獨特機會和挑戰。我們將討論學習過渡和獎勵模式的方法,如何有效地使用這些模式來做出更好的決策,以及計劃和學習之間的關系。我們還強調了在典型的RL設置之外利用世界模型的方式,以及在設計未來的MBRL系統時,從人類認知中可以得到什么啟示。
本課程的教材是從機器學習的角度寫的,是為那些有必要先決條件并對學習因果關系基礎感興趣的人而開設的。我盡我最大的努力整合來自許多不同領域的見解,利用因果推理,如流行病學、經濟學、政治學、機器學習等。
有幾個主要的主題貫穿全課程。這些主題主要是對兩個不同類別的比較。當你閱讀的時候,很重要的一點是你要明白書的不同部分適合什么類別,不適合什么類別。
統計與因果。即使有無限多的數據,我們有時也無法計算一些因果量。相比之下,很多統計是關于在有限樣本中解決不確定性的。當給定無限數據時,沒有不確定性。然而,關聯,一個統計概念,不是因果關系。在因果推理方面還有更多的工作要做,即使在開始使用無限數據之后也是如此。這是激發因果推理的主要區別。我們在這一章已經做了這樣的區分,并將在整本書中繼續做這樣的區分。
識別與評估。因果效應的識別是因果推論所獨有的。這是一個有待解決的問題,即使我們有無限的數據。然而,因果推理也與傳統統計和機器學習共享估計。我們將主要從識別因果效應(在第2章中,4和6)之前估計因果效應(第7章)。例外是2.5節和節4.6.2,我們進行完整的例子估計給你的整個過程是什么樣子。
介入與觀察。如果我們能進行干預/實驗,因果效應的識別就相對容易了。這很簡單,因為我們可以采取我們想要衡量因果效應的行動,并簡單地衡量我們采取行動后的效果。觀測數據變得更加復雜,因為數據中幾乎總是引入混雜。
假設。將會有一個很大的焦點是我們用什么假設來得到我們得到的結果。每個假設都有自己的框來幫助人們注意到它。清晰的假設應該使我們很容易看到對給定的因果分析或因果模型的批評。他們希望,清晰地提出假設將導致對因果關系的更清晰的討論。
【導讀】機器學習暑期學校(MLSS)系列開始于2002年,致力于傳播統計機器學習和推理的現代方法。今年因新冠疫情在線舉行,從6月28號到7月10號講述了眾多機器學習主題。本文推薦來自德國人工智能教授 Bernhard Sch?lkopf教授講述《因果性》,177頁ppt系統性講述了機器學習中的因果性,非常干貨。
由Judea Pearl開創的圖因果推理起源于人工智能(AI)的研究,在很長一段時間內與機器學習領域幾乎沒有聯系。本文認為,機器學習和人工智能的硬開放問題本質上與因果關系有關,并解釋了該領域是如何開始理解它們的。
近年來,機器學習社區對因果關系的興趣顯著增加。我對因果關系的理解是由Judea Pearl和許多合作者和同事所啟發的,其中的大部分內容來自與Dominik Janzing和Jonas Peters合著的一本書(Peters et al., 2017)。我已經在各種場合談論過這個話題,其中一些正在進入機器學習的主流,特別是因果建模可以提升機器學習模型的魯棒性。因果性和機器學習的交叉的發展令人興奮。這篇報告不僅能夠對討論因果思維對AI的重要性有所幫助,而且還可以為機器學習的觀眾介紹一些圖或結構因果模型的相關概念。
盡管最近取得了諸多成功,但如果我們將機器學習的能力與動物的能力進行比較,我們會發現,在一些動物擅長的關鍵技能上,前者相當糟糕。這包括遷移到新問題,任何形式的泛化,不是從一個數據點到下一個從相同的分布(采樣),而是從一個問題到下一個——都被稱為泛化。這個缺點并不是太令人吃驚,因為機器學習經常忽略生物大量使用的信息: 世界干預、領域遷移、時間結構。最后,機器學習也不擅長思考,在康拉德洛倫茨的意義上,即,在想象的空間中行動。我認為,因果性關注建模和推理,可以對理解和解決這些問題做出實質性的貢獻,從而將該領域帶入下一個層次。
視頻: //www.youtube.com/watch?v=btmJtThWmhA&feature=youtu.be
目錄內容:
報告主題: From System 1 Deep Learning to System 2 Deep Learning
報告簡介: 早期,深度學習的進展主要集中在對靜態數據集的學習上,主要用于各類感知任務,這些任務大都依靠人類的直覺,可以在無意識的情況下完成,可稱為第一代系統需求。然而,最近幾年,隨著研究方向的轉變和一些新工具的出現諸如soft-attention和深度強化學習領域的進展,它們為深度學習架構和訓練框架的進一步發展,開啟了新的大門,這種深度架構和訓練框架有助于解決第二代系統需求(這種系統任務需要人類有意識的去完成),如在自然語言處理和其他應用當中的推理、規劃、因果關系捕獲和系統歸納等。從第一代系統的深度學習,擴展到第二代系統的任務之中,對于完成之前挖掘高層次抽象特征的目標是非常重要的,因為我們認為第二代系統需求,將會對表征學習提出更高的要求,以發掘出某種人類可以用語言進行巧妙處理的高級內容。我們認為,為了達到這個目標,soft-attention機制是關鍵因素,它每次都關注其中某幾個概念并進行計算,因為意識先驗及其相關的假設中,許多高層次的依賴關系可以被一個稀疏因子圖近似地捕捉到。最后,報告介紹了元學習,這種先驗意識和代理視角下的表征學習,會更加有助于以新穎的方式,支持強大的合成泛化形式。
嘉賓介紹: Yoshua Bengio是蒙特利爾大學計算機科學與運籌學系的教授,Mila和IVADO的科學總監和創始人,2018年圖靈獎獲得者,加拿大統計學習算法研究主席以及加拿大AI CIFAR主席。 他開創了深度學習的先河,并在2018年每天獲得全球所有計算機科學家中最多的引用。 他是加拿大勛章的官員,加拿大皇家學會的成員,并于2017年被授予基拉姆獎,瑪麗·維克多獎和年度無線電加拿大科學家,并且是NeurIPS顧問的成員, ICLR會議的董事會和聯合創始人,以及CIFAR“機器和大腦學習”計劃的程序總監。 他的目標是幫助發現通過學習產生智力的原理,并促進AI的發展以造福所有人。