題目: Learning Causality and Learning with Causality: A Road to Intelligence
摘要: 吸煙會引起癌癥嗎?通過分析兩個變量的觀測值,我們能否找到它們之間的因果關系?在我們的日常生活和科學中,人們經常試圖回答此類因果問題,目的是正確理解和操縱系統。在過去的幾十年中,為了回答這些問題,在機器學習,統計和哲學等領域取得了有趣的進步。此外,我們還經常關注如何在復雜的環境中進行機器學習。例如,我們如何在非平穩環境中做出最佳預測?有趣的是,最近發現因果信息可以促進理解和解決各種機器學習問題,包括遷移學習和半監督學習。這篇演講回顧了因果關系研究中的基本概念,并側重于如何從觀察數據中學習因果關系,以及因果關系為何以及如何幫助機器學習和其他任務。最后,我將討論為什么因果表達很重要以便實現通用人工智能。
報告人: 張坤 博士 美國卡內基梅隆大學,也是德國馬克斯·普朗克智能系統研究所的高級研究科學家。他的研究興趣在于機器學習和人工智能,尤其是因果發現,基于因果關系的學習和通用人工智能。他從因果關系的角度開發了用于自動發現因果關系的方法,從因果關系角度研究學習問題,尤其是轉移學習,概念學習和深度學習,并研究了因果關系和各種機器學習任務的哲學基礎。他曾擔任大型機器學習或人工智能會議的區域主席或高級程序委員會成員,包括NeurIPS,UAI,ICML,AISTATS,AAAI和IJCAI。他組織了各種學術活動,以促進因果關系的跨學科研究。
【導讀】機器學習暑期學校(MLSS)系列開始于2002年,致力于傳播統計機器學習和推理的現代方法。今年因新冠疫情在線舉行,從6月28號到7月10號講述了眾多機器學習主題。本文推薦來自德國人工智能教授 Bernhard Sch?lkopf教授講述《因果性》,177頁ppt系統性講述了機器學習中的因果性,非常干貨。
由Judea Pearl開創的圖因果推理起源于人工智能(AI)的研究,在很長一段時間內與機器學習領域幾乎沒有聯系。本文認為,機器學習和人工智能的硬開放問題本質上與因果關系有關,并解釋了該領域是如何開始理解它們的。
近年來,機器學習社區對因果關系的興趣顯著增加。我對因果關系的理解是由Judea Pearl和許多合作者和同事所啟發的,其中的大部分內容來自與Dominik Janzing和Jonas Peters合著的一本書(Peters et al., 2017)。我已經在各種場合談論過這個話題,其中一些正在進入機器學習的主流,特別是因果建模可以提升機器學習模型的魯棒性。因果性和機器學習的交叉的發展令人興奮。這篇報告不僅能夠對討論因果思維對AI的重要性有所幫助,而且還可以為機器學習的觀眾介紹一些圖或結構因果模型的相關概念。
盡管最近取得了諸多成功,但如果我們將機器學習的能力與動物的能力進行比較,我們會發現,在一些動物擅長的關鍵技能上,前者相當糟糕。這包括遷移到新問題,任何形式的泛化,不是從一個數據點到下一個從相同的分布(采樣),而是從一個問題到下一個——都被稱為泛化。這個缺點并不是太令人吃驚,因為機器學習經常忽略生物大量使用的信息: 世界干預、領域遷移、時間結構。最后,機器學習也不擅長思考,在康拉德洛倫茨的意義上,即,在想象的空間中行動。我認為,因果性關注建模和推理,可以對理解和解決這些問題做出實質性的貢獻,從而將該領域帶入下一個層次。
視頻: //www.youtube.com/watch?v=btmJtThWmhA&feature=youtu.be
目錄內容:
題目: Causal Relational Learning
摘要:
因果推理是自然科學和社會科學實證研究的核心,對科學發現和知情決策至關重要。因果推理的黃金標準是進行隨機對照試驗;不幸的是,由于倫理、法律或成本的限制,這些方法并不總是可行的。作為一種替代方法,從觀察數據中進行因果推斷的方法已經在統計研究和社會科學中得到發展。然而,現有的方法嚴重依賴于限制性的假設,例如由同質元素組成的研究總體,這些同質元素可以在一個單平表中表示,其中每一行都被稱為一個單元。相反,在許多實際環境中,研究領域自然地由具有復雜關系結構的異構元素組成,其中數據自然地表示為多個相關表。在本文中,從關系數據中提出了一個正式的因果推理框架。我們提出了一種稱為CaRL的聲明性語言,用于捕獲因果背景知識和假設,并使用簡單的Datalog類規則指定因果查詢。CaRL為在關系領域中推斷復雜干預的影響的因果關系和推理提供了基礎。我們對真實的關系數據進行了廣泛的實驗評估,以說明CaRL理論在社會科學和醫療保健領域的適用性。
主題: Causal Confusion in Imitation Learning
簡介: 行為克隆通過訓練判別模型來預測觀察到的專家行為,從而將策略學習轉換為監督學習,這樣的判別模型不是因果關系,因為訓練過程并不了解專家與環境之間相互作用的因果結構。我們認為,由于模仿學習中的分布變化,忽略因果關系尤其有害。特別是,這會導致違反直覺的“因果識別錯誤”現象:訪問更多信息可能會導致性能下降。我們調查了此問題的產生方式,并提出了一種解決方案,可通過有針對性的干預措施(環境互動或專家查詢)來解決,以確定正確的因果模型。
嘉賓介紹: Dinesh Jayaraman,賓夕法尼亞大學的新任助理教授,還是Facebook AI Research的客座研究員,致力于視覺和機器人技術的交叉問題,在此之前,曾是加州大學伯克利分校伯克利人工智能研究實驗室的博士后。
Pim de Haan,高通 AI的助理研究員,研究方向機器學習和數學幾何的交叉。
題目: Causal Inference and Stable Learning
簡介:
在一個常見的機器學習問題中,使用一個根據訓練數據集估計的模型,根據觀察到的特征來預測未來的結果值。當測試數據和訓練數據來自相同的分布時,許多學習算法被提出并證明是成功的。然而,對于給定的訓練數據分布,性能最好的模型通常利用特征之間微妙的統計關系,這使得它們在應用于測試數據時更容易出現預測錯誤,因為測試數據的分布與訓練數據的分布不同。對于學術研究和實際應用來說,如何建立穩定、可靠的學習模型是至關重要的。因果推理是一種強大的統計建模工具,用于解釋和穩定的學習。因果推理是指基于某一效應發生的條件,對某一因果關系做出結論的過程。在本教程中,我們將重點討論因果推理和穩定學習,旨在從觀察數據中探索因果知識,以提高機器學習算法的可解釋性和穩定性。首先,我們將介紹因果推理,并介紹一些最近的數據驅動的方法來估計因果效應的觀測數據,特別是在高維設置。摘要為了彌補因果推理與機器學習在穩定學習上的差距,我們首先給出了學習算法的穩定性和魯棒性的定義,然后介紹了一些最近出現的穩定學習算法,以提高預測的穩定性和可解釋性。最后,我們將討論穩定學習的應用和未來方向,并為穩定學習提供基準。
邀請嘉賓:
張潼,香港科技大學計算機科學與數學教授。此前,他是羅格斯大學(Rutgers university)教授,曾在IBM、雅虎(Yahoo)、百度和騰訊(Tencent)工作。張潼的研究興趣包括機器學習算法和理論、大數據統計方法及其應用。他是ASA和IMS的研究員,曾在主要機器學習期刊的編委會和頂級機器學習會議的項目委員會任職。張潼在康奈爾大學獲得數學和計算機科學學士學位,在斯坦福大學獲得計算機科學博士學位。
崔鵬,清華大學計算機系長聘副教授,博士生導師。2010年于清華大學計算機系獲得博士學位。研究興趣包括社會動力學建模、大規模網絡表征學習以及大數據驅動的因果推理和穩定預測。近5年在數據挖掘及人工智能領域高水平會議和期刊發表論文60余篇,曾5次獲得頂級國際會議或期刊論文獎,并先后兩次入選數據挖掘領域頂級國際會議KDD最佳論文專刊。目前擔任IEEE TKDE、ACM TOMM、ACM TIST、IEEE TBD等國際期刊編委。曾獲得國家自然科學二等獎、教育部自然科學一等獎、電子學會自然科學一等獎、CCF-IEEE CS青年科學家獎、ACM中國新星獎。入選中組部萬人計劃青年拔尖人才,并當選中國科協全國委員會委員。
報告主題:Learning Causality and Learning with Causality: A Road to Intelligence
報告摘要:
吸煙會引起癌癥嗎?通過分析兩個變量的觀測值,我們能否找到它們之間的因果關系?在我們的日常生活和科學中,人們經常試圖回答此類因果問題,目的是正確理解和操縱系統。在過去的幾十年中,為了回答這些問題,在機器學習,統計和哲學等領域取得了有趣的進步。此外,我們還經常關注如何在復雜的環境中進行機器學習。例如,我們如何在非平穩環境中做出最佳預測?有趣的是,最近發現因果信息可以促進理解和解決各種機器學習問題,包括遷移學習和半監督學習。這篇演講回顧了因果關系研究中的基本概念,并側重于如何從觀察數據中學習因果關系,以及因果關系為何以及如何幫助機器學習和其他任務。最后,我將討論為什么因果表達很重要以便實現通用人工智能。
邀請嘉賓:美國卡耐基梅隆大學張坤博士
嘉賓簡介
張坤博士是卡內基梅隆大學哲學系的助理教授和機器學習系的副教授,也是德國馬克斯·普朗克智能系統研究所的高級研究科學家。他的研究興趣在于機器學習和人工智能,尤其是因果發現,基于因果關系的學習和通用人工智能。他從因果關系的角度開發了用于自動發現因果關系的方法,從因果關系角度研究學習問題,尤其是轉移學習,概念學習和深度學習,并研究了因果關系和各種機器學習任務的哲學基礎。他曾擔任大型機器學習或人工智能會議的區域主席或高級程序委員會成員,包括NeurIPS,UAI,ICML,AISTATS,AAAI和IJCAI。他組織了各種學術活動,以促進因果關系的跨學科研究。
題目: A Meta-Transfer Objective for Learning to Disentangle Causal Mechanisms
簡介: 我們建議使用一種元學習目標,該目標可以在修改后的分布上最大程度地提高轉移速度,以學習如何模塊化獲取的知識。特別是,我們專注于如何根據因果關系將聯合分布分解為適當的條件。我們假設分布的變化是局部的(例如,由于對變量之一的干預而導致的)處于局部分布的假設,從而解釋了何時可以奏效。我們證明了在因果機制局部變化的這種假設下,正確的因果圖將傾向于僅具有其一些具有非零梯度的參數,即需要進行調整的參數(那些修正變量)。我們爭論并通過實驗觀察到,這將導致更快的適應,并使用此屬性來定義元學習替代評分,該評分除了圖形的連續參數化外,還將傾向于正確的因果圖。最后,受AI智能體的啟發(例如,機器人自動發現其環境),我們考慮將同一目標如何發現因果變量本身,作為觀察到的無因果意義的低級變量的轉換。在兩個變量情況下的實驗驗證了所提出的思想和理論結果。
作者介紹: Yoshua Bengio是蒙特利爾大學計算機科學與運籌學系的教授,Mila和IVADO的科學總監和創始人,2018年圖靈獎獲得者,加拿大統計學習算法研究主席以及加拿大AI CIFAR主席。 他開創了深度學習的先河,并在2018年每天獲得全球所有計算機科學家中最多的引用。 他是加拿大勛章的官員,加拿大皇家學會的成員,并于2017年被授予基拉姆獎,瑪麗·維克多獎和年度無線電加拿大科學家,并且是NeurIPS顧問的成員。 ICLR會議的董事會和聯合創始人,以及CIFAR“機器和大腦學習”計劃的程序總監。 他的目標是幫助發現通過學習產生智力的原理,并促進AI的發展以造福所有人。
題目: Never-Ending Learning
簡介:
今天的機器學習方法與人類終身學習能力之間存在著明顯的差異。人類學習許多不同的功能和技能,從多年來獲得的不同經驗,從一個階段的課程中,他們首先學習更容易的任務,然后更困難的任務,保留所學的知識和技能,在隨后的學習中使用,使它更容易或更有效。此外,人類會對自己不斷進化的技能進行自我反思,隨著時間的推移選擇新的學習任務,相互教導,學習新的表現形式,閱讀書籍,討論相互競爭的假設等等。本教程將重點討論如何設計具有類似功能的機器學習智能體,包括強化學習和其他智能體學習體系結構、遷移和多任務學習、表示學習、平攤學習、自然語言教學和演示學習、實驗學習等主題的研究。
邀請嘉賓:
Tom M. Mitchell是卡內基梅隆大學(Carnegie Mellon University)計算機科學學院(School of Computer Science)臨時院長。Mitchell從事機器學習工作多年,與Jaime Carbonell和Ryszard Michalski共同創辦了ICML會議。最近,他指導了一個名為“永無止境的語言學習”(NELL)的項目,該項目持續運作了8年多,為如何構建學習系統提供了一個案例研究。Mitchell是美國國家工程學院的成員,美國藝術與科學學院的成員以及人工智能發展協會(AAAI)的前會長和研究員。
Partha Talukdar是班加羅爾的印度科學研究所(IISc)計算和數據科學(CDS)系的一名教員。他還是企業知識圖譜公司KENOME的創始人,該公司的使命是幫助企業理解大數據。在此之前,Partha是卡內基梅隆大學機器學習系的博士后,與Tom Mitchell一起參與了NELL項目。Partha在賓夕法尼亞大學獲得CIS博士學位(2010),Partha對機器學習、自然語言處理和認知神經科學有廣泛的興趣,尤其對大規模學習和推理感興趣。Partha是IBM教員獎、谷歌重點研究獎和埃森哲開放創新獎的獲得者。他與人合著了一本由Morgan Claypool出版社出版的關于基于圖形的半監督學習的書。