【導讀】對因果推理發展的研究廣泛地集中于實現兩個目標: 理解因果推理的起源,以及檢驗因果推理如何隨著發展而變化。41頁因果推理發展綜述《The Development of Causal Reasoning》回顧了旨在實現這兩個目標的證據和理論。
41頁因果推理發展綜述《The Development of Causal Reasoning》回顧了因果推理發展相關的研究,綜述鏈接:
綜述摘要 對因果推理發展的研究廣泛地集中于實現兩個目標: 理解因果推理的起源,以及檢驗因果推理如何隨著發展而變化。本書回顧了旨在實現這兩個目標的證據和理論。在第一節中,它著重于探索世界上認識因果事件的可能先例的研究,回顧早期因果推理的三種不同機制的證據:物理啟動事件,行動者及其行動,以及共變信息。本書的第二部分考察了年齡稍大的孩子如何了解特定的因果關系的問題。它著重于統計證據的模式在引導學習因果結構方面的作用,表明即使是非常年幼的兒童也利用強烈的數據模式的歸納偏差來提供他們關于因果事件的推論,并討論兒童的自發游戲如何支持因果學習。
綜述內容 因果關系在人類認知中扮演著重要的角色,并且長期以來一直是許多發展研究人員感興趣的話題——因果推理被認為是生理、心理和生物世界早期學習的一個中心方面。此外,因果推理在早期社會發展的許多理論中都有涉及,包括心智和道德的概念和理論的發展。因果表征也是許多語言意義理論的中心,也是早期語言習得研究的一個感興趣的領域。最后,研究者研究了因果學習在解釋發展中的作用。
對因果推理發展的研究廣泛地集中于實現兩個目標: 理解因果推理的起源,以及因果推理是如何隨著發展而變化的。因此,該書回顧了旨在實現這兩個目標的證據和理論。在第一部分中,該書主要探討認識世界上因果事件的可能先例的研究。早期關于可能的因果關系的概念與更廣泛的認知事件因果關系的抽象框架有什么關系? 該書回顧了早期因果推理中三種不同機制的證據——物理啟動事件、主體及其行為和共變信息——并討論了如何將這些機制整合到開發中。本書的第二部分主要關注年齡稍大的孩子如何了解特定的因果關系。想當然地認為孩子們認識到一個事件涉及因果關系,那么孩子們是如何了解一個系統中因果關系的具體力量和性質的呢?本書關注統計證據模式在引導學習因果結構中的作用,并指出證據表明兒童將這些證據與他們發展中的歸納偏見結合在一起。
目錄:
深度神經網絡在擁有大量數據集和足夠的計算資源的情況下能夠取得巨大的成功。然而,他們快速學習新概念的能力相當有限。元學習是解決這一問題的一種方法,通過使網絡學會如何學習。令人興奮的深度元學習領域正在高速發展,但缺乏對當前技術的統一、深刻的概述。這項工作就是這樣。在為讀者提供理論基礎之后,我們研究和總結了主要的方法,這些方法被分為i)度量;ii)模型;和iii)基于優化的技術。此外,我們確定了主要的開放挑戰,如在異構基準上的性能評估,以及元學習計算成本的降低。
摘要:
近年來,深度學習技術在各種任務上取得了顯著的成功,包括游戲(Mnih et al., 2013; Silver et al., 2016),圖像識別(Krizhevsky et al., 2012; He et al., 2015)和機器翻譯(Wu et al., 2016)。盡管取得了這些進展,但仍有大量的挑戰有待解決,例如實現良好性能所需的大量數據和訓練。這些要求嚴重限制了深度神經網絡快速學習新概念的能力,這是人類智能的定義方面之一(Jankowski等人,2011;(Lake等,2017)。
元學習被認為是克服這一挑戰的一種策略(Naik and Mammone, 1992; Schmidhuber, 1987; Thrun, 1998)。其關鍵思想是元學習主體隨著時間的推移提高自己的學習能力,或者等價地說,學會學習。學習過程主要與任務(一組觀察)有關,并且發生在兩個不同的層次上:內部和外部。在內部層,一個新的任務被提出,代理試圖快速地從訓練觀察中學習相關的概念。這種快速的適應是通過在外部層次的早期任務中積累的知識來促進的。因此,內部層關注的是單個任務,而外部層關注的是多個任務。
從歷史上看,元學習這個術語的使用范圍很廣。從最廣泛的意義上說,它概括了所有利用之前的學習經驗以更快地學習新任務的系統(Vanschoren, 2018)。這個廣泛的概念包括更傳統的機器學習算法選擇和hyperparameter優化技術(Brazdil et al ., 2008)。然而,在這項工作中,我們專注于元學習領域的一個子集,該領域開發元學習程序來學習(深度)神經網絡的良好誘導偏差。1從今以后,我們使用術語深元學習指元學習的領域。
深度元學習領域正在快速發展,但它缺乏一個連貫、統一的概述,無法提供對關鍵技術的詳細洞察。Vanschoren(2018)對元學習技術進行了調查,其中元學習被廣泛使用,限制了對深度元學習技術的描述。此外,在調查發表后,深度元學習領域也出現了許多令人興奮的發展。Hospedales等人(2020)最近的一項調查采用了與我們相同的深度元學習概念,但目標是一個廣泛的概述,而忽略了各種技術的技術細節。
我們試圖通過提供當代深度元學習技術的詳細解釋來填補這一空白,使用統一的符號。此外,我們確定了當前的挑戰和未來工作的方向。更具體地說,我們覆蓋了監督和強化學習領域的現代技術,已經實現了最先進的性能,在該領域獲得了普及,并提出了新的想法。由于MAML (Finn et al., 2017)和相關技術對該領域的影響,我們給予了格外的關注。本研究可作為深度元學習領域的系統性介紹,并可作為該領域資深研究人員的參考資料。在整個過程中,我們將采用Vinyals(2017)所使用的分類法,該分類法確定了三種深度元學習方法:i)度量、ii)模型和iii)基于優化的元學習技術。
在本章中,我們將訪問圖神經網絡(GNNs)的一些理論基礎。GNNs最有趣的方面之一是,它們是根據不同的理論動機獨立開發的。一方面,基于圖信號處理理論開發了GNN,將歐氏卷積推廣到非歐氏圖域[Bruna et al., 2014]。然而,與此同時,神經信息傳遞方法(構成了大多數現代GNN的基礎)被類比提出,用于圖模型中的概率推理的信息傳遞算法[Dai等人,2016]。最后,基于GNN與weisfeler - lehman圖同構檢驗的聯系,許多研究對其進行了激發[Hamilton et al., 2017b]。
將三個不同的領域匯聚成一個單一的算法框架是值得注意的。也就是說,這三種理論動機中的每一種都有其自身的直覺和歷史,而人們所采用的視角可以對模型的發展產生實質性的影響。事實上,我們推遲對這些理論動機的描述直到引入GNN模型本身之后,這并非偶然。在這一章,我們的目標是介紹這些背后的關鍵思想不同理論的動機,這樣一個感興趣的讀者可以自由探索和組合這些直覺和動機,因為他們認為合適的。
有幾個主要的主題貫穿全書。這些主題主要是對兩個不同類別的比較。當你閱讀的時候,很重要的一點是你要明白書的不同部分適合什么類別,不適合什么類別。
統計與因果。即使有無限多的數據,我們有時也無法計算一些因果量。相比之下,很多統計是關于在有限樣本中解決不確定性的。當給定無限數據時,沒有不確定性。然而,關聯,一個統計概念,不是因果關系。在因果推理方面還有更多的工作要做,即使在開始使用無限數據之后也是如此。這是激發因果推理的主要區別。我們在這一章已經做了這樣的區分,并將在整本書中繼續做這樣的區分。
識別與評估。因果效應的識別是因果推論所獨有的。這是一個有待解決的問題,即使我們有無限的數據。然而,因果推理也與傳統統計和機器學習共享估計。我們將主要從識別因果效應(在第2章中,4和6)之前估計因果效應(第7章)。例外是2.5節和節4.6.2,我們進行完整的例子估計給你的整個過程是什么樣子。
介入與觀察。如果我們能進行干預/實驗,因果效應的識別就相對容易了。這很簡單,因為我們可以采取我們想要衡量因果效應的行動,并簡單地衡量我們采取行動后的效果。觀測數據變得更加復雜,因為數據中幾乎總是引入混雜。
假設。將會有一個很大的焦點是我們用什么假設來得到我們得到的結果。每個假設都有自己的框來幫助人們注意到它。清晰的假設應該使我們很容易看到對給定的因果分析或因果模型的批評。他們希望,清晰地提出假設將導致對因果關系的更清晰的討論。
摘要:這項工作考慮了這樣一個問題: 獲取大量數據的便利程度如何影響我們學習因果效應和關系的能力。在大數據時代,學習因果關系與傳統因果關系有哪些不同或相同之處?為了回答這個問題,這項綜述提供了一個在因果關系和機器學習之間聯系的全面和結構化的回顧。
//www.zhuanzhi.ai/paper/6ad7902913e98bd48540a5596b978edc
因果性是結果與引起結果的原因之間的一種一般性關系。它很難定義,而且我們通常只憑直覺知道原因和結果。因為下雨,街道是濕的。因為這個學生不學習,所以他考試考得很差。因為烤箱是熱的,奶酪在披薩上融化了。當用數據學習因果關系時,我們需要意識到統計關聯和因果之間的區別。例如,當天氣炎熱時,一家冰淇淋店的老板可能會注意到高昂的電費和較高的銷售額。因此,她會觀察到電費和銷售數字之間有很強的聯系,但電費并不是導致高銷售額的原因——讓商店的燈徹夜開著不會對銷售產生影響。在這種情況下,外部溫度是高電費和高銷售額的共同原因,我們說它是一個混亂的因果關系。
學習因果關系的能力被認為是人類水平智能的重要組成部分,可以作為AI的基礎(Pearl, 2018)。從歷史上看,學習因果關系已經在包括教育在內的許多高影響領域被研究過(LaLonde, 1986;Dehejia和Wahba, 1999年;Heckerman et al ., 2006;希爾,2011),醫學科學(馬尼和庫珀,2000;經濟學(Imbens, 2004)、流行病學(Hernan et al., 2000;Robins等人,2000年;、氣象學(Ebert-Uphoff和Deng, 2012)和環境衛生(Li et al., 2014)。受限于數據量,堅實的先驗因果知識是學習因果關系所必需的。研究人員對通過精心設計的實驗收集的數據進行研究,堅實的先驗因果知識至關重要(Heckerman et al., 2006)。以隨機對照試驗的原型為例(Cook et al., 2002),為了研究一種藥物的療效,患者將被隨機分配服用或不服用該藥物,這將保證平均而言,治療組和未治療組(對照組)在所有相關方面是等同的,排除任何其他因素的影響。然后,藥物對某些健康結果的影響——比如,偏頭痛的持續時間——可以通過比較兩組的平均結果來衡量。
這個綜述的目的是考慮在現在的大數據時代學習因果關系的新可能性和挑戰,這里指的是海量數據集的可用性。舉個例子,考慮到無法測量的混雜因素的可能性——可能會被減輕,因為可以測量更多的特征。因此,一方面,研究人員有可能在大數據的幫助下回答有趣的因果問題。例如,Yelp的正面評論是促使顧客去餐館,還是僅僅反映了受歡迎程度而沒有影響?這個因果問題可以通過Yelp維護的龐大數據庫中的數據來解決。另一方面,用大數據來回答因果問題,會帶來一些獨特的新問題。例如,盡管公共數據庫或通過web爬行收集的數據或應用程序編程接口(api)是空前巨大的,我們有很少的直覺對什么類型的偏差數據集可以遭受——數據更豐富,也更神秘,因此,負責任地更難模型。與此同時,大數據給其他學習任務(如預測)帶來的基本統計困難,使得因果調查更具挑戰性。也許這方面最顯著的例子是現代數據的高維性(Li et al., 2017a),比如文本數據(Imai et al., 2013)。
管理統計和數據科學的原理包括:數據可視化;描述性措施;概率;概率分布;數學期望;置信區間;和假設檢驗。方差分析;簡單線性回歸;多元線性回歸也包括在內。另外,本書還提供了列聯表、卡方檢驗、非參數方法和時間序列方法。
教材:
Perkovic對使用Python編程的介紹:作為應用程序開發的重點,第二版不僅僅是對編程的介紹。這是一本包羅萬象的計算機科學入門書,采用了“在正確的時間使用正確的工具”的教學方法,并側重于應用程序開發。該方法是實踐和問題導向的,與實踐問題和解決方案出現在整個文本。文本是命令式的,但并不回避在適當的時候盡早討論對象。關于用戶定義類和面向對象編程的討論將在后面的課文中出現,當學生有更多的背景知識和概念時,可以激發他們的學習動機。章節包括問題解決技術和經典算法的介紹,問題解決和編程以及將核心技能應用于應用程序開發的方法。本版本還包括在更廣泛的領域中提供的示例和實踐問題。另一章的案例研究是獨家威利E-Text,為學生提供實際應用的概念和工具,涵蓋在章節中。
模態是指事物發生或存在的方式,如文字、語言、聲音、圖形等。多模態學習是指學習多個模態中各個模態的信息,并且實現各個模態的信息的交流和轉換。多模態深度學習是指建立可以完成多模態學習任務的神經網絡模型。多模態學習的普遍性和深度學習的熱度賦予了多模態深度學習鮮活的生命力和發展潛力。旨在多模態深度學習的發展前期,總結當前的多模態深度學習,發現在不同的多模態組合和學習目標下,多模態深度學習實現過程中的共有問題,并對共有問題進行分類,敘述解決各類問題的方法。具體來說,從涉及自然語言、視覺、聽覺的多模態學習中考慮了語言翻譯、事件探測、信息描述、情緒識別、聲音識別和合成,以及多媒體檢索等方面研究,將多模態深度學習實現過程中的共有問題分為模態表示、模態傳譯、模態融合和模態對齊四類,并對各問題進行子分類和論述,同時列舉了為解決各問題產生的神經網絡模型。最后論述了實際多模態系統,多模態深度學習研究中常用的數據集和評判標準,并展望了多模態深度學習的發展趨勢。
本備忘單是機器學習手冊的濃縮版,包含了許多關于機器學習的經典方程和圖表,旨在幫助您快速回憶起機器學習中的知識和思想。
這個備忘單有兩個顯著的優點:
清晰的符號。數學公式使用了許多令人困惑的符號。例如,X可以是一個集合,一個隨機變量,或者一個矩陣。這是非常混亂的,使讀者很難理解數學公式的意義。本備忘單試圖規范符號的使用,所有符號都有明確的預先定義,請參見小節。
更少的思維跳躍。在許多機器學習的書籍中,作者省略了數學證明過程中的一些中間步驟,這可能會節省一些空間,但是會給讀者理解這個公式帶來困難,讀者會在中間迷失。
題目: Probabilistic Reasoning across the Causal Hierarchy?
摘要: 我們將關聯、干預和反事實的三層因果關系形式化為一系列概率邏輯語言,我們的語言具有嚴格的表達能力,第一種語言能夠表達定量概率推理,包括條件獨立和貝葉斯推理第二個是對因果關系的計算推理,第三個是對任意反事實查詢的完全表達式計算。我們給出了在結構因果模型和概率程序上完成的一系列相應的有限公理化,并證明了多項式的SAT可效度和有效性在多項式空間中是決定性的。
作者簡介: Thomas Icard,斯坦福人工智能實驗室附屬學院,哲學和計算機科學助理教授。個人主頁://web.stanford.edu/~icard/
前言: 目標:本課程旨在讓學生對人工智能的基本概念和實踐有一個堅實的(通常是有點理論性的)基礎。這門課程在第一學期主要涉及符號化的人工智能,有時也被稱為優秀的老式人工智能(GofAI),并在第二學期提供統計方法的基礎。事實上,一個完整的基于機器學習的AI應該有專業課程,并且需要比我們在這門課程中更多的數學基礎。
課程內容:
目標: 使學生對人工智能領域的基本概念和實踐有一個堅實的基礎。該課程將基于Russell/Norvig的書《人工智能》:現代方法[RN09]
Artificial Intelligence I(第一部分): 介紹人工智能作為一個研究領域,討論作為人工智能統一概念范式的理性代理,并涵蓋問題解決、搜索、約束傳播、邏輯、知識表示和規劃。
Artificial Intelligence II(第二部分): 更傾向于讓學生接觸基于統計的人工智能的基礎知識:我們從不確定性下的推理開始,用貝葉斯網絡建立基礎,并將其擴展到理性決策理論。在此基礎上,我們介紹了機器學習的基礎知識。