報告題目: Augmenting Human Intelligence: From Search Engines to Intelligent Task Assistants
報告摘要: 人類發明了很多工具來增強人類智能化生活,其中搜索引擎就是增強人類智能的一個工具。但是搜索只是完成任務的一種手段,如何將不完善的技術轉化為完善的產品?本篇報告給出答案。
嘉賓介紹: 翟成祥,美國伊利諾伊大學厄巴納-香檳分校計算機系教授,Willett Faculty Scholar,并在該校的生物信息研究所,信息科學學院,及統計系任兼職教授。于1990年、2002年分別獲得南京大學計算機博士學位和卡耐基梅隆大學語言和信息技術博士學位。
題目: Cooperative Reasoning on Knowledge Graph and Corpus: A Multi-agentReinforcement Learning Approach
摘要:
基于知識圖譜的推理因其可解釋性而備受關注。然而,以往的方法都存在知識圖譜不完整的問題,即知識圖譜中可能缺失的感興趣的環節或實體(顯式缺失)。而且,以前的大多數模型都假定目標和源實體之間的距離很短,這在真實的KG(如Freebase)上是不正確的(隱式丟失)。對KG的不完全性的敏感性和實體間的遠程鏈接捕獲能力限制了這些模型在大KG上的性能。在這篇論文中,我們提出了一個利用文本語料庫來彌補這些缺陷的模型,無論是顯性的還是隱性的缺失。我們將問答問題建模為知識圖譜推理智能體和信息抽取智能體之間的合作任務。每個智能體學習完成自己的任務的技能,在KG上跳躍或從語料庫中選擇知識,通過正確回答問題獲得最大的獎勵。推理智能體決定如何為給定的實體和關系找到一個等價的路徑。該提取智能體為遠程目標實體提供了捷徑,或為與來自該發送智能體的消息的顯式缺失鏈接提供了缺失關系。通過這種合作的獎勵設計,我們的模型可以在不引入過多不必要的噪聲的同時,有策略地增大不完全KG,從而增大搜索空間,降低性能。
作者簡介:
翟成祥,美國伊利諾伊大學香檳分校(UIUC)計算機系教授,Willett Faculty Scholar,并在該校的生物信息研究所,信息科學學院,及統計系任兼職教授。于1990年、2002年分別獲得南京大學計算機博士學位和卡耐基梅隆大學語言和信息技術博士學位。他的研究興趣是智能信息系統的一般領域,包括信息檢索、數據挖掘、自然語言處理、機器學習及其在生物醫學信息學和智能教育系統等領域的應用。
題目: Discovering Robustly Connected Subgraphs withSimple Descriptions
摘要:
我們研究了發現具有不完全描述的魯棒性連通子圖的問題。也就是說,我們的目標是發現這樣的節點集:對于這些節點集,誘導的子圖不僅很難分割成不連接的組件,而且對于這些節點集,只需對頂點屬性進行一個簡單的連接查詢,就可以將它們從整個圖中分離出來。由于許多子圖沒有這樣簡單的邏輯描述,所以首先挖掘魯棒性的子圖,然后在事后發現它們的描述會導致次優結果。相反,我們建議只對可描述子圖進行運算時間化。為了有效地做到這一點,我們提出了一個非冗余迭代深化方法,我們裝備了樂觀估計器,允許我們修剪搜索空間的大部分。通過大量的實證評價,我們證明我們的方法可以考慮大的真實世界圖,并且發現不僅是可解釋的而且是有意義的子圖。
邀請嘉賓:
Janis Kalofolias是Saarbrucken計算機科學研究生院的博士生,該學院由CISPA Helmholtz信息安全中心資助。此外,他還隸屬于馬克斯·普朗克信息學研究所的數據庫和信息系統部。他的研究興趣從用于子群發現的樂觀估計器、基于內核的圖間相似性度量方法到用于從復雜數據中獲得主觀上感興趣的結構的信息論方法。Janis Kalofolias2011年在希臘佩特雷大學獲得理學學士學位。2012年,他加入薩爾大學(Saarland University)攻讀計算機科學碩士學位,并在馬克斯·普朗克信息學研究所(Max Planck Institute for Informatics)擔任研究助理。2016年11月,他以博士生身份加入EDA集團。
Mario Boley是一名機器學習和數據挖掘研究員,他是位于Saarbrucken的Max Planck信息學研究所探索性數據分析小組的成員。2011年,他在德國波恩大學獲得了計算機科學的博士學位。Mario的研究目標一方面是對算法數據挖掘問題有一個合理的理論理解,另一方面是他的結果的實際適用性和實用性。因此,他不斷地將理論見解集成到健壯的、可重用的軟件中,并尋求跨學科合作。
題目: 自然語言與理解
摘要: 雖然自然語言一直在社會、經濟和國家安全等領域中扮演著重要角色,但是一直以來計算機的自然語言理解能力遠遜于人類。近幾年,隨著移動互聯網的不斷普及,以及云計算、大數據、GPU、深度學習等相關平臺和技術的快速發展,我們越來越感到自然語言處理方面的突破就在眼前。本報告將從自然語言理解層面探討如何提高自然語言處理能力。具體包括:自然語言本質特點、自然語言處理核心任務、篇章理解與知識圖譜。
個人簡介: 周國棟教授,1997年12月畢業于新加坡國立大學獲得博士學位;1998年1月至1999年3月在新加坡國立大學從事博士后研究;1999年4月-2006年8月在新加坡資訊通信研究院分別擔任副研究員、研究員和副主任研究員;2006年8月底加入蘇州大學擔任教授博導,組建自然語言處理實驗室。研究方向:自然語言理解、信息抽取、自然語言認知等。近5年來,發表國際著名SCI期刊論文20多篇和國際頂級會議ACL/EMNLP/COLING/IJCAI/AAAI論文80多篇,主持NSFC項目4個(包括重點項目2個)。據Google Scholar統計,論文引用超過7000次,曾擔任國際自然語言理解領域頂級SCI期刊Computational Linguistics編委,目前擔任ACM TALLIP副主編、《軟件學報》責任編委、CCF中文信息技術專委會副主任委員、蘇州大學學術委員會委員。
論文題目: Knowledge-based Conversational Search
摘要:
允許對數字存儲信息進行直觀和全面訪問的對話接口仍然是一個目標。在這篇論文中,分析了對話搜索系統的需求,并提出了一些具體的解決方案來自動化這些系統應該支持的基本組件和任務,從而為對話搜索系統的設計奠定了基礎。我們描述了幾個相互依賴的研究,這些研究分析了更高級的對話搜索系統的設計需求,該系統能夠支持復雜的類人對話交互,并提供對巨大知識庫的訪問。在前兩章的研究中,重點分析了信息搜索對話中常見的結構,從領域獨立的話語功能關系和領域特定的隱含語義關系兩方面分析了重復模式。結果顯示,問題回答是特定信息訪問的關鍵組成部分之一,但它不是會話搜索系統應該支持的對話交互的唯一類型。在第三章的研究中,提出了一種新穎的方法來解決復雜的問題。在最后的研究章節中,將注意力轉向了另一種交互模式,稱之為對話瀏覽,在這種模式中,會話系統與問題回答不同,在對話交互過程中起著更積極的作用。結果表明,由于詞匯量不匹配問題,該方法可以幫助用戶發現僅使用問題回答無法檢索的相關條目。
論文作者:
Svitlana Vakulenko是阿姆斯特丹大學博士,研究范圍是自然語言處理、對話系統、問答、對話搜索。
論文下載鏈接: //svakulenk0.github.io/pdfs/Conversational_Search_in_Structure__PhD_Thesis_Vakulenko_.pdf
ppt下載鏈接:
報告題目: AV+AI - Challenges and Opportunities
報告摘要:
AV與AI相遇會產生怎樣的效果不禁令人期待。人類駕駛汽車與無人駕駛相比,人類司機存在著缺陷,而且目前AV面臨著技術、安全問題、市場接受度和法律等問題,此次報告主要從以下方面講述了AV+AI的挑戰與機遇:
嘉賓介紹
詹景堯是伯克利DeepDrive副主任,在車輛和基礎設施安全、高速公路網絡運行、車輛自動化、先進駕駛輔助系統、專用短程通信(DSRC)和運輸的蜂窩通信以及交通監控與數據融合方面有很深的造詣。
題目: Multimodal Intelligence: Representation Learning, Information Fusion, and Applications
摘要: 自2010年以來,深度學習已經徹底改變了語音識別、圖像識別和自然語言處理,每一項都涉及到輸入信號中的單一模態。然而,人工智能中的許多應用都涉及到一種以上的模式。因此,研究跨多種模式的建模和學習這一更為困難和復雜的問題具有廣泛的興趣。本文對多模態智能的模型和學習方法進行了技術綜述。視覺與自然語言的結合已成為計算機視覺和自然語言處理研究領域的一個重要課題。本文從學習多模態表示、多模態信號在不同層次的融合以及多模態應用三個新的角度,對多模態深度學習的最新研究成果進行了綜合分析。在多模態表示學習中,我們回顧了嵌入的關鍵概念,它將多模態信號統一到同一向量空間中,從而實現跨模態信號處理。我們還回顧了為一般下游任務構造和學習的許多嵌入類型的特性。關于多模融合,本文著重介紹了用于集成特定任務的單模信號表示的特殊體系結構。在應用程序方面,涵蓋了當前文獻中廣泛關注的選定領域,包括標題生成、文本到圖像生成和可視化問題解答。我們相信,這項檢討有助于社區未來在新興多模態情報領域的研究。
作者簡介:
Zichao Yang (楊子超),他是芝加哥大學計算機科學系的博士生。他對機器學習、深度學習及其在計算機視覺、自然語言處理中的應用感興趣。在到CMU之前,他獲得了香港大學的碩士學位,上海交通大學的學士學位。他之前曾在谷歌DeepMind實習,與Chris Dyer和Phil Blunsom合作,MSR與He Xiaodong、Gao Jianfeng和Li Deng合作。 個人主頁://www.cs.cmu.edu/~zichaoy/
Xiaodong He(何曉東)是華盛頓大學西雅圖分校電氣工程系的副教授。他也是微軟研究中心的首席研究員,華盛頓州雷德蒙德。1996年獲清華大學(北京)學士學位,1999年獲中國科學院(北京)碩士學位,2003年獲密蘇里哥倫比亞大學博士學位。他的研究興趣在于人工智能領域,包括深度學習、語音、自然語言、計算機視覺、信息檢索和知識表示與管理。他撰寫/合著了100多篇論文和一本書,并在ACL、CVPR、SIGIR、WWW、CIKM、NIPS、ICLR、IEEE TASLP、Proc上發表。IEEE、IEEE SPM等場館。他和同事開發了MSR-NRC-SRI條目和MSR條目,分別在2008年NIST機器翻譯評估和2011年IWSLT評估(中英文)中獲得第一名,并開發了MSR圖像字幕系統,在2015年的MS COCO字幕挑戰賽中獲得一等獎。他曾在多家IEEE期刊擔任編輯職務,擔任NAACL-HLT 2015地區主席,并在主要演講和語言處理會議的組織委員會/項目委員會任職。他是IEEESLTC的當選成員,任期2015-2017年。他是IEEE高級成員,2016年IEEE西雅圖分部主席。 個人主頁:
Li Deng是一位經驗豐富的首席執行官,在高科技行業有著豐富的工作經驗。在人工智能、機器學習、數學建模、計算機科學、語音識別、自然語言處理、深度學習、神經網絡、大數據分析、財務和統計建模等方面具有較強的技術、執行管理和業務開發專業技能。等
報告主題:Learning Causality and Learning with Causality: A Road to Intelligence
報告摘要:
吸煙會引起癌癥嗎?通過分析兩個變量的觀測值,我們能否找到它們之間的因果關系?在我們的日常生活和科學中,人們經常試圖回答此類因果問題,目的是正確理解和操縱系統。在過去的幾十年中,為了回答這些問題,在機器學習,統計和哲學等領域取得了有趣的進步。此外,我們還經常關注如何在復雜的環境中進行機器學習。例如,我們如何在非平穩環境中做出最佳預測?有趣的是,最近發現因果信息可以促進理解和解決各種機器學習問題,包括遷移學習和半監督學習。這篇演講回顧了因果關系研究中的基本概念,并側重于如何從觀察數據中學習因果關系,以及因果關系為何以及如何幫助機器學習和其他任務。最后,我將討論為什么因果表達很重要以便實現通用人工智能。
邀請嘉賓:美國卡耐基梅隆大學張坤博士
嘉賓簡介
張坤博士是卡內基梅隆大學哲學系的助理教授和機器學習系的副教授,也是德國馬克斯·普朗克智能系統研究所的高級研究科學家。他的研究興趣在于機器學習和人工智能,尤其是因果發現,基于因果關系的學習和通用人工智能。他從因果關系的角度開發了用于自動發現因果關系的方法,從因果關系角度研究學習問題,尤其是轉移學習,概念學習和深度學習,并研究了因果關系和各種機器學習任務的哲學基礎。他曾擔任大型機器學習或人工智能會議的區域主席或高級程序委員會成員,包括NeurIPS,UAI,ICML,AISTATS,AAAI和IJCAI。他組織了各種學術活動,以促進因果關系的跨學科研究。
報告主題:Developing Advanced AI Technologies for People to Better Access Information
報告摘要:信息獲取是人類的基本需求我們設想,搜索、推薦、問答和對話的自然和流暢的結合將是未來獲取信息的主要范例在Bytedance人工智能實驗室,我們正朝著這個目標開發先進技術在這篇演講中,我將介紹我們最近在這個領域的一些工作,包括一個無偏的學習排名搜索算法,一個使用上下文bandit的會話推薦系統,以及一個用于對話的語言表示模型。
邀請嘉賓:李航,畢業于日本京都大學電氣電子工程系,日本東京大學獲得計算機科學博士學位。北京大學、南京大學兼職教授。華 曾任日本NEC公司中央研究所研究員,微軟亞洲研究院高級研究員與主任研究員、華為技術有限公司諾亞方舟實驗室主任。
主題: Neural Approaches to Conversational AI
摘要: 開發一個智能對話系統,不僅可以模擬人類對話,還可以回答從電影明星的最新消息到愛因斯坦的相對論等各種主題的問題,并完成旅行計劃等復雜任務,一直是人工智能最長的目標之一。這一目標直到最近才實現。隨著大量的會話數據可用于訓練,深度學習(DL)和強化學習(RL)的突破被應用到會話人工智能中,我們在學術界和工業界都看到了有希望的結果。在本教程中,我們首先簡要介紹與對話人工智能相關的DL和RL的最新進展。然后,我們詳細描述了為三種對話系統或機器人開發的最先進的神經方法。第一個是問答機器人。QA bot具有從各種數據源(包括Web文檔和預編譯的知識圖)中提取的豐富知識,可以為用戶查詢提供簡潔直接的答案。第二個是面向任務的對話系統,它可以幫助用戶完成從會議安排到假期計劃等任務。第三種是社交聊天聊天機器人,它能與人進行無縫、恰當的對話,經常扮演聊天伙伴和推薦者的角色。
邀請嘉賓: Michel Galley是微軟研究人工智能的高級研究員。他的研究興趣在自然語言處理和機器學習領域,特別關注會話人工智能、神經生成、統計機器翻譯和總結。他獲得了哥倫比亞大學的碩士和博士學位,并獲得了電子計算機科學學士學位。在加入微軟研究之前,他是斯坦福大學計算機系的研究助理。他還是南加州大學/國際科學院NLP小組和貝爾實驗室口語對話系統小組的定期訪問研究員。他與人合著了50多篇科學論文,其中許多出現在頂級的NLP、AI和ML會議上。其中兩份出版物是最佳論文決賽(NAACL 2010,EMNLP 2013)。他還擔任全國人民解放大會(ACL、NAACL、EMNLP)的地區主席,并在SIGIR和IJCAI擔任高級PC成員。
高劍鋒是微軟人工智能研究院的合作伙伴研究經理。他領導了人工智能系統的開發,用于機器閱讀理解(MRC)、問答(QA)、社交機器人、目標導向對話和商業應用。2014年至2017年,他擔任微軟研究院(Microsoft Research)深度學習技術中心(Deep Learning Technology Center)的合作研究經理,領導文本和圖像處理深度學習研究。從2006年到2014年,他是微軟研究中心(Microsoft Research)自然語言處理組的首席研究員,主要從事網絡搜索、查詢理解和重組、廣告預測和統計機器翻譯。從2005年到2006年,他是微軟自然交互服務部門的一名研究負責人,在那里他參與了ProjectX,這是一項為Windows開發自然用戶界面的工作。2000年至2005年,他在微軟亞洲研究院自然語言計算組擔任研究負責人,與同事們共同開發了微軟Office發布的首個中文語音識別系統,即市場上領先的中文/日文輸入法編輯器(IME),以及微軟Windows的自然語言平臺。