亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

主題: Ceres: Harvesting Knowledge from Semi-Structured web pages

摘要: 在本次主題演講中,Xin Luna Dong講述了知識圖譜的類型,講述了為什么需要半結構網頁,以及如何從半結構化網頁獲取知識。

嘉賓介紹: Xin Luna Dong,自2016年7月起擔任亞馬遜首席科學家,領導亞馬遜產品知識圖的構建工作,管理科學家團隊開展知識管理、數據清洗與集成、信息提取、圖形挖掘與嵌入、基于知識的搜索與推薦等方面的研究。

付費5元查看完整內容

相關內容

 是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。 人工智能是計算機科學的一個分支。

了解在線用戶可能關注的內容是內容推薦和搜索服務的關鍵。這些服務將受益于實體、概念、事件、主題和類別的高度結構化和web級本體。雖然現有的知識庫和分類法包含了大量的實體和類別,但我們認為它們未能以online population的語言風格發現適當粒度的概念、事件和主題。這些概念之間也不存在邏輯結構的本體。在本文中,我們提出GIANT,一種構建一個以用戶為中心的、網絡規模的、結構化的本體論的機制,該本體論包含了大量的自然語言短語,這些短語在不同的粒度上符合用戶的需要,這些短語是從大量的網絡文檔和搜索點擊圖中挖掘出來的。此外,還構造了各種類型的邊來維護本體中的層次結構。我們介紹了在GIANT中使用的基于圖神經網絡的技術,并與各種基線進行了比較,對提出的方法進行了評估。騰訊開發出了注意力本體,并將其應用到騰訊的各種應用中,涉及用戶超過10億。在騰訊QQ瀏覽器上進行的在線A/B測試表明,注意力本體可以顯著提高新聞推薦的點擊率。

付費5元查看完整內容

作者:Jiaming Shen, Zhihong Shen, Chenyan Xiong, Chi Wang, Kuansan Wang, Jiawei Han

摘要:本體結構(Taxonomies)由機器可解釋的語義組成,并為許多Web應用程序提供有價值的知識。例如,在線零售商(亞馬遜和eBay)使用本體結構進行產品推薦,而網絡搜索引擎(Google和Bing)利用本體結構來增強查詢理解。當前我們在人工或半自動地構建本體結構方面已經做出了巨大的努力。然而,隨著網絡內容數量的快速增長,現有的本體結構無法捕捉到新興的知識。因此,在許多應用程序中,十分需要對現有本體結構進行動態擴展。在本文中,我們研究了如何通過添加一組新的概念來擴展現有的本體結構。我們提出了一種新的自監督框架TaxoExpanTM,該框架從已有的本體結構中自動生成一組 ?query concept, anchor concept ? 對作為訓練數據。使用這樣的自監督數據,TaxoExpanTM學習一個模型來預測query concept是否是 anchor concept的直接下義詞。我們在TaxoExspan中提出了兩種創新技術:(1)位置增強型圖形神經網絡,它編碼現有本體結構中anchor concept的局部結構;2)噪聲魯棒性訓練目標,使學習的模型能夠對自監控數據中的標簽噪聲不敏感。在來自不同領域的三個大規模數據集上的廣泛實驗證明了TaxoExspan在分類系統擴展方面的有效性和高效性。

付費5元查看完整內容

講座題目

從海量文本中構建和挖掘異構信息網絡:Constructing and Mining Heterogeneous Information Networks from Massive Text

講座簡介

真實世界的數據主要以非結構化文本的形式存在。數據挖掘研究的一個重大挑戰是開發有效且可伸縮的方法,將非結構化文本轉換為結構化知識。根據我們的設想,將這些文本轉換成結構化的異構信息網絡是非常有益的,在這種網絡上,可以根據用戶的需要生成可操作的知識。在本教程中,我們將全面概述最近在這方面的研究和發展。首先,我們介紹了一系列有效的方法,從海量的、特定于領域的文本語料庫中構建異構信息網絡。然后討論了基于用戶需求挖掘文本豐富網絡的方法。具體來說,我們關注的是可伸縮的、有效的、弱監督的、與語言無關的方法,這些方法可以處理各種文本。在真實的數據集(包括新聞文章、科學出版物和產品評論)上,我們進一步展示了如何構建信息網絡,以及如何幫助進一步的探索性分析。

講座嘉賓

Jingbo Shang(尚景波),伊利諾伊大學香檳分校計算機科學系博士生。他的研究重點是用最少的人力從大量文本語料庫中挖掘和構建結構化知識。他的研究獲得了多項著名獎項的認可,包括Yelp數據集挑戰大獎(2015)、谷歌結構化數據和數據庫管理博士研究金(2017-2019)。尚先生在大型會議(SIGMOD'17、WWW'17、sigmdd'17和sigmdd'18)上提供教程方面有豐富的經驗。

付費5元查看完整內容

報告題目: Augmenting Human Intelligence: From Search Engines to Intelligent Task Assistants

報告摘要: 人類發明了很多工具來增強人類智能化生活,其中搜索引擎就是增強人類智能的一個工具。但是搜索只是完成任務的一種手段,如何將不完善的技術轉化為完善的產品?本篇報告給出答案。

嘉賓介紹: 翟成祥,美國伊利諾伊大學厄巴納-香檳分校計算機系教授,Willett Faculty Scholar,并在該校的生物信息研究所,信息科學學院,及統計系任兼職教授。于1990年、2002年分別獲得南京大學計算機博士學位和卡耐基梅隆大學語言和信息技術博士學位。

付費5元查看完整內容

主題: Storytelling from Structured Data and Knowledge Graphs : An NLG Perspective

摘要: 在本教程中,我們討論將結構化數據(如表格形式的數據)和知識庫(如知識圖譜)翻譯成自然語言論述的基礎、方法和系統開發方面。本教程涵蓋自然語言生成(NLG)的挑戰和方法,主要關注(結構化)數據到文本的范式。我們的與會者將能夠了解以下內容:(1)關于如何應用現代自然語言處理和自然語言處理技術來描述和總結非語言性質或具有某種結構的文本數據的基本觀點和趨勢,以及(2)一些有趣的開放式問題,這將為今后的研究做出重大貢獻。我們將概述各種方法,從數據表示技術到適用于數據的領域解決方案,再到文本問題設置。從傳統的基于規則/啟發式驅動、現代的數據驅動和超現代的深層神經風格體系結構出發,討論了各種解決方案,并簡要討論了評價和質量評估。 由于大規模的領域獨立標記(并行)數據很少用于數據到文本的問題,本教程的很大一部分將致力于無監督、可伸縮和領域適應性的方法。

邀請嘉賓:

Abhijit Mishra,目前是印度班加羅爾IBM Research的一員,擔任人工智能技術系的研究科學家。在加入IBM Research之前,他是孟買IIT計算機科學與工程系(CSE)的博士學者,在Pushpak Bhattacharyya教授的指導下工作。

Anirban Laha,他目前是亞倫·庫爾維爾教授建議的蒙特勒大學(MILA)一年級博士生。他的興趣在于機器學習/深度學習在自然語言處理中的應用。此前,他在IBM Research的自然語言生成(NLG)項目中工作了三年,并在頂級會議和期刊上發表過論文,如NeurIPS、ACL、NAACL-HLT和計算語言學。在IBM,他還為IBM項目辯論會做出了貢獻,該會最近在全球范圍內獲得了廣泛的新聞報道,因為一場現場機器與人類的辯論(更多新聞)。在加入IBM之前,他曾在微軟必應廣告公司(2013-2015)擔任應用科學家,在亞馬遜網站(2010-2011)擔任SDE。

付費5元查看完整內容

報告主題: On The Role of Knowledge Graphs in Explainable AI

嘉賓介紹: Freddy Lecue博士是加拿大蒙特利爾泰勒斯人工智能技術研究中心的首席人工智能科學家。他也是法國索菲亞安提波利斯溫姆斯的INRIA研究所的研究員。在加入泰雷茲新成立的人工智能研發實驗室之前,他曾于2016年至2018年在埃森哲愛爾蘭實驗室擔任人工智能研發主管。在加入埃森哲之前,他是一名研究科學家,2011年至2016年在IBM research擔任大規模推理系統的首席研究員,2008年至2011年在曼徹斯特大學(University of Manchester)擔任研究員,2005年至2008年在Orange Labs擔任研究工程師。

報告目錄:

  • 人工智能中的解釋
    • 動機
    • 定義
    • 評估(以及人類在可解釋性人工智能中的角色)
    • 人類作用
    • 不同AI領域的解釋性
  • 知識圖譜在可解釋性機器學習中的角色和作用
  • 利用知識圖譜在機器學習中的可解釋性人工智能工業應用
  • 結論
付費5元查看完整內容

特邀報告4:PaperRobot: Automated Scientific Knowledge Graph Construction and Paper Writing

Abstract: 這項工作的目標是通過設計一個論文機器人來加速科學發現和生產,它的主要任務如下。

第一個任務是閱讀現有的論文。科學家們現在發現很難跟的上大量的論文,例如,每年發表的生物醫學論文超過50萬篇,但科學家們平均每年只能閱讀264篇論文(5000篇論文中有1篇)。論文機器人基于實體和關系抽取,自動讀取已有的論文,構建背景知識圖譜(KGs)。從科學文獻中構建知識圖譜通常比在一般新聞領域更具挑戰性,因為它需要更廣泛地獲取特定領域的知識和更深入地理解復雜的上下文。為了更好地編碼上下文信息和外部背景知識,我們提出了一個新的知識庫驅動的樹狀結構長短時記憶網絡(Tree-LSTM)框架和一個LSTM模型。加入兩類新功能:(1)捕獲上下文的依賴結構(2)實體屬性(類型和類別描述)通過實體鏈接的外部本體。

第二個任務是自動創造新想法。Foster等人(2015)的研究表明,在生物醫學和化學領域的640萬篇論文中,60%以上是關于增量工作的。這激發了我們通過預測后臺KGs中的新鏈接來自動增量創建新想法,該方法基于結合KG結構和非結構化上下文文本的新實體表示。

最后,我們進入最后一個有趣任務是,寫一篇關于新想法的新論文。最后一步的目標是將新思想清晰地傳達給讀者,這是一件非常困難的事情;事實上,許多科學家都是糟糕的作家(Pinker, 2014)。論文機器人利用一種新穎的記憶-注意網絡結構,自動寫出一篇關于輸入標題和預測相關實體的新論文摘要,然后根據該摘要進一步寫出結論和未來的工作,最后預測未來后續論文的新標題。我們選擇生物醫學作為我們的目標-主要是因為有大量的可用論文。圖靈測試表明,論文機器人生成的輸出字符串有時會比人工編寫的字符串更受歡迎;大多數論文的摘要只需要很少的領域專家的編輯就可以變得信息豐富、條理清晰。

這項工作是基于與Kevin Knight(滴滴實驗室)和韓家煒(UIUC)的合作的。

Bio: Heng Ji,伊利諾伊大學香檳分校計算機科學系教授。她在清華大學獲得了計算語言學的學士和碩士學位,在紐約大學獲得了計算機科學的碩士和博士學位。她的研究興趣主要集中在自然語言處理,特別是信息提取和知識庫填充。2016年和2017年,她被世界經濟論壇選為“青年科學家”和全球未來計算未來理事會成員。2013年獲IEEE智能系統獎“AI’s 10 to Watch”獎,2009年獲NSF終身成就獎,谷歌、IBM、Bosch、騰訊學院獎,PACLIC2012年度最佳論文獎,ACL2019年度最佳演示獎提名,“SDM2013年度最佳論文”,“ICDM2013年度最佳論文”。她從2010年開始協調NIST TAC知識庫人口任務,并擔任NAACL-HLT2018和CCL2019項目委員會聯合主席。她是IEEE/ACM音頻、語音和語言處理事務的副主編。

付費5元查看完整內容

主題:From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction

摘要:從序列標記到關系抽取,再到知識推理,深度神經網絡模型在知識抽取任務中取得了最先進的性能。然而,這些渴求數據的模型嚴重依賴于人工標記的訓練數據,并且經常作為黑箱組件運行,減慢了下游應用程序的開發。在這次演講中,我將介紹我們最近在將結構化先驗知識應用到深度神經網絡模型中進行知識抽取方面的進展,這兩個模型都是在輸入數據級別(即,以及在模型架構級別(即,對模型進行編程)。特別地,我將討論如何在命名實體識別中合并域字典,以及如何在關系提取中建立語義規則,作為輸入級結構化先驗知識的示例。對于模型編程,我將提出一個基于圖神經網絡的框架,用于在涉及常識推理的自然語言推理中捕獲多關系結構化先驗知識作為模型架構的一部分。這些解決方案共同構成了從數據到使用結構化先驗知識進行模型編程的路線圖。

嘉賓簡介:任翔,美國南加州大學計算機科學系助理教授,獲美國南加州大學ISI聘任。他也是智能和知識發現(INK)研究實驗室的主任,ACM SIGKDD和數據挖掘(SIGKDD)的信息主任,以及USC機器學習中心的成員。之前,他是斯坦福大學的研究學者,并在伊利諾伊大學香檳分校獲得了計算機科學博士學位。Ren博士的研究重點是開發標簽高效的計算方法,從自然語言數據中提取機器可操作的知識(例如,組合、圖形結構表示),并對知識結構進行神經推理。他的研究導致一本書和50多個出版物,覆蓋著超過會議教程(KDD、WWW NAACL),并獲得了獎項包括谷歌AI教師獎,摩根大通AI研究獎,亞馬遜研究獎,ACM SIGKDD論文獎(2018),WWW最佳海報亞軍(2018),大衛·j·Kuck優秀論文獎(2017),谷歌博士獎學金(2016),和Yelp數據集挑戰獎(2015)。他是福布斯亞洲30位30歲以下富豪之一。

付費5元查看完整內容
北京阿比特科技有限公司