報告主題:開放語義解析
報告摘要:語義解析(Semantic Parsing)是將自然語言句子轉換為機器可識別的、可計算的語義表示的任務。語義解析是自然語言處理的核心任務之一,在智能問答、語音助手、智能機器人、代碼生成等任務上具有廣泛的應用。本報告將詳細介紹語義解析這項任務,首先介紹語義解析任務、數據集和工具,然后依次介紹基于文法的語義解析方法(CCG,DCS等)、基于語義圖構建的語義解析方法和新興的神經語義解析方法(Seq2Seq, Seq2Act, coarse-to-fine等),最后對語義解析的前沿方向和重要挑戰進行展望,包括上下文有關的語義解析(可用于對話),與周邊環境有交互的語義解析(如用于機器人執行指令)。
報告嘉賓:韓先培,博士,中國科學院軟件研究所中文信息處理實驗室/計算機科學國家重點實驗室研究員。主要研究方向為信息抽取、知識圖譜、語義解析以及智能問答系統。在ACL、SIGIR、AAAI、EMNLP等重要國際會議發表論文四十余篇。韓先培是中國中文信息學會理事,語言與知識計算專業委員會副主任,中國科學院青促會會員,入選中國科協青年人才托舉計劃,獲得中國中文信息學會漢王青年創新獎。 陳波,博士,中國科學院軟件研究所中文信息處理實驗室助理研究員,2018年獲得中國科學院大學博士學位,并獲得優秀畢業生。主要研究方向為語義解析(Semantic Parsing)和自然語言理解。在ACL、COLING、NAACL等自然語言處理國際頂級會議發表學術論文多篇。參與多項國家自然科學基金重點課題以及企業合作科研項目的研發。
**報告主題: 做失敗科研的10個方法
**報告摘要: 成功的科研都是相似的,失敗的科研各有各的失敗。成功科研方法讓你仰望星空,失敗科研方法讓你在仰望星空的時候避免掉入水坑。如果成功的科研是可以學習的,那么正例讓你發更多的好論文(Recall),但是我們也需要很多負例讓你用更少的投稿發出更多的好論文(Precision),少走彎路,我們的優化目標是尋找最優的F值。 本報告基于兩位講者在30年(求和得出)科研經歷中遇到過、看到過、聽到過的失敗科研方法,包括失敗科研的哲學、心態、理念、方法、技術和工具。我們試圖包含大量的信息,同時保持有趣。當然,在描述10(也可能不止)個失敗科研方法的最后,我們也給出失敗科研的反面—如何做出成功的科研。
**邀請嘉賓: 劉康 博士,現任中科院自動化所模式識別國家重點實驗室副研究員,西安電子科技大學客座教授。研究領域包括信息抽取、網絡挖掘、問答系統等,同時也涉及模式識別與機器學習方面的基礎研究。在自然語言處理、知識工程等領域國際重要會議和期刊發表論文90余篇(如TKDE、ACL、IJCAI、EMNLP、COLING、CIKM等),獲得KDD CUP 2011 Track2 全球亞軍,COLING 2014最佳論文獎,首屆“CCF-騰訊犀牛鳥基金卓越獎”、2015、2016 Google Focused Research Award。2014年獲得中國中文信息學會“錢偉長中文信息處理科學技術獎-漢王青年創新一等獎”、2018年獲得中國中文信息學會“錢偉長中文信息處理科學技術獎”一等獎(排名第二)等獎項,兼任中國中文信息學會青年工作委員會主任、語言與知識計算專業委員會秘書長等學術職務。韓先培 博士,中國科學院軟件研究所中文信息處理實驗室/計算機科學國家重點實驗室研究員。主要研究方向為信息抽取、知識圖譜、語義解析以及智能問答系統。在ACL、SIGIR、AAAI、EMNLP等重要國際會議發表論文四十余篇。韓先培是中國中文信息學會理事,語言與知識計算專業委員會副主任,中國科學院青促會會員。2016年入選中國科協青年人才托舉計劃,獲得中國中文信息學會漢王青年創新獎。
報告主題: 社會媒體處理前沿綜述
報告摘要: 隨著社會媒體類型的不斷增加,與傳統的社會媒體相比,現在社會媒體是大眾參與發布和傳播消息,以社會網絡為基礎,以互聯網用戶創造和傳播信息為主要形式的在線交互媒體。此次報告介紹了社會媒體以及處理研究的發展趨勢和方法論、社會媒體的主客觀信息,最后介紹了社會媒體處理技術發展趨勢。
邀請嘉賓: 丁效,博士,哈爾濱工業大學助理研究員。主要研究方向為人工智能、自然語言處理、社會計算和事理圖譜。2016年獲得哈爾濱工業大學博士學位,已在人工智能領域的頂級國際期刊和會議IJCAI、AAAI、EMNLP等發表相關論文20余篇。承擔國家自然科學基金青年項目等省部級以上項目四項,參與科技創新2030“新一代人工智能”重大項目、國家重大科技基礎設施建設項目、科技部973課題、國家自然科學基金重點項目等。榮獲全國青年人工智能創新創業大會三等獎、第五屆全國青年計算語言學研討會優秀論文獎等榮譽。擔任中國中文信息學會社會媒體處理專委會秘書、委員、智能金融工作組副組長,中國中文信息學會青年工作委員會委員。
報告主題:人工智能在人機對話系統中的技術現狀與挑戰
報告簡介:近年來,自動人機對話系統在學術界和工業界都獲得了相當大的關注度,隨著微軟小冰百度度秘等產品的發布,以及大量人工智能公司的建立,這些對話系統背后的技術在逐步積累,也逐步解密。隨著研究者的探索愈發深入,人們看到了一個對話系統逐漸從科幻電影中走進現實生活的可能。在講座中,我將回顧人機對話的發展歷程,以及隨著深度學習技術盛行之后,由數據驅動模型帶來的革命性改變。講座將從人機對話的已有應用出發,再分析現有對話系統的不足,展望下一代人機對話系統的挑戰。同時會分享我們組在人機對話研究所做的努力與探索,以及相應的代表性成果。
邀請嘉賓:嚴睿,北京大學助理教授,博士生導師,前百度公司資深研發,華中師范大學與中央財經大學客座教授與校外導師。主持研發多個開放領域對話系統和服務類對話系統,發表高水平研究論文80余篇,擔任多個學術會議(KDD, IJCAI, SIGIR, ACL, WWW, AAAI, CIKM, EMNLP等)的(高級)程序委員會委員及審稿人。
報告主題:任務型對話系統
報告簡介:對話系統一般可以分為兩種,即任務型對話系統(也稱作目標導向型對話系統)和閑聊對話系統。本講習班主要介紹任務型對話系統,其多用于垂直領域業務助理系統,如微軟小娜、百度度秘、阿里小蜜以及我們研發的對話技術平臺(DTP)等。這類系統具有明確需要完成的任務目標,如訂餐、訂票等。我們將首先介紹任務型對話系統的背景和定義,然后依次介紹其中的關鍵技術,包括自然語言理解(包括領域意圖的識別和語義槽的填充)、對話管理(包括對話狀態跟蹤和對話策略優化)以及自然語言生成;接著介紹任務型對話系統的評價方法和國內外相關技術評測任務;最后對任務型對話系統的技術和應用趨勢進行展望。
邀請嘉賓:車萬翔博士,哈爾濱工業大學計算機學院教授,博士生導師,斯坦福大學訪問學者,合作導師Christopher Manning教授。現任中國中文信息學會計算語言學專業委員會委員、青年工作委員會副主任;中國計算機學會高級會員、曾任YOCSEF哈爾濱主席(2016-2017年度)。在ACL、EMNLP、AAAI、IJCAI等國內外高水平期刊和會議上發表學術論文50余篇,其中AAAI 2013年的文章獲得了最佳論文提名獎,論文累計被引用2,100余次(Google Scholar數據),H-index值為26。出版教材 2 部,譯著 2 部。承擔國家自然科學基金、973等多項科研項目。負責研發的語言技術平臺(LTP)已被600余家單位共享,提供的在線“語言云”服務已有用戶1萬余人,并授權給百度、騰訊、華為等公司使用。2018年,獲CoNLL多語種句法分析國際評測第1名。2015-16年,連續兩年獲Google Focused Research Award(谷歌專注研究獎);2016年,獲黑龍江省科技進步一等獎(排名第2);2012年,獲黑龍江省技術發明獎二等獎(排名第2);2010年獲中國中文信息學會“錢偉長”中文信息處理科學技術獎一等獎(排名第2)、首屆漢王青年創新獎(個人)等多項獎勵。2017年,所主講的《高級語言程序設計(Python)》課程獲國家精品在線開放課程。
張偉男,哈爾濱工業大學計算機科學與技術學院副教授/博士。研究興趣包括人機對話及自然語言處理。在ACL、AAAI、IJCAI及IEEE TKDE等CCF A類國際會議及國際頂級期刊發表論文多篇,主導研發了人機對話系統“笨笨”。目前為中國中文信息學會(CIPS)信息檢索專委會委員、青年工作委員會委員,中國人工智能學會(CAAI)青年工作委員會委員。曾獲黑龍江省科技進步一等獎、中國人工智能學會最佳青年成果獎、中國人工智能學會“合創杯”第二屆全國青年創新創業大賽三等獎及首屆“百度獎學金”。
報告題目:問答系統
報告摘要:本次報告將覆蓋多種不同類型的問答系統和方法:首先,介紹基于表格的問答系統,包括面向表格的檢索、語義解析、問題生成以及如何從單輪問答擴展到多輪問答。然后,介紹基于知識圖譜的問答系統,并將重點放在對話式多輪問答,包括多輪語義解析框架以及如何融合檢索模型和元學習。接下來,介紹基于圖片的問答系統,并將重點放在如何將語義解析方法融合到圖片問答系統中。最后,介紹基于文本的問答系統。這里我們將圍繞預訓練模型進行說明。本次報告的最后,將和大家討論與問答相關的未來(可能)研究課題和方向。
邀請嘉賓: 唐都鈺,博士,微軟亞洲研究院自然語言計算組研究員。從事自動問答、語義理解等自然語言處理研究,多項研究成果已經轉化到微軟必應搜索中。
段楠,博士,微軟亞洲研究院自然語言計算組主管研究員,從事包括問答、對話、語義理解和搜索等在內的自然語言處理研究。《智能問答》(高教出版社)作者,其多項研究成果成功用于包括必應搜索、Cortana語音助手和微軟小冰等在內的微軟人工智能產品。
報告主題:基于深度學習的機器閱讀理解
報告摘要:機器閱讀理解(Machine Reading Comprehension)是讓機器閱讀并理解給定的文本并且能夠回答與文本相關的問題,是目前自然語言處理領域最受關注的任務之一,也是認知智能中的典型任務。在本報告中,我們將聚焦基于深度學習的機器閱讀理解,涵蓋了目前主流的機器閱讀理解任務,包括:填空型閱讀理解、篇章抽取型閱讀理解、選擇型閱讀理解、對話型閱讀理解、開放域閱讀理解等。我們將對每個任務具有代表性的數據集和經典模型進行詳細介紹,并同步介紹相關中文機器閱讀理解的研究發展。在報告的最后,我們將剖析近期機器閱讀理解領域的研究熱點,并且對未來的發展方向進行展望。
邀請嘉賓:崔一鳴,科大訊飛AI研究院資深級研究員,研究主管,哈爾濱工業大學社會計算與信息檢索研究中心在讀博士研究生,于哈爾濱工業大學計算機科學與技術專業獲得工學碩士和學士學位。長期從事閱讀理解、問答系統、機器翻譯等自然語言處理相關領域的研究工作。曾獲國際口語機器翻譯評測(IWSLT 2012、IWSLT 2014),NIST機器翻譯評測(NIST OpenMT 15)多項冠軍。2017年至今帶領團隊多次獲得國際權威機器閱讀理解評測冠軍,其中包括SQuAD 1.1、SQuAD 2.0挑戰賽冠軍,國際語義評測SemEval 2018閱讀理解任務冠軍,對話型閱讀理解挑戰賽CoQA、QuAC冠軍等。同時,在自然語言處理頂級及重要國際會議(ACL/AAAI/IJCAI/COLING/NAACL)上發表多篇學術論文,并擔任ACL系列會議及AAAI等國際會議程序委員會委員,擔任JCSL、TKDD等國際ESI期刊審稿人等學術職務。
報告題目:圖神經網絡在自然語言處理中的應用
報告摘要:自然語言處理中的很多結構,包括序列結構、樹狀結構、以及有環圖結構,可以歸納為普通的圖結構。對圖結構的神經網絡編碼,有助于自然語言處理任務中提取有用信息。近幾年來,圖神經網絡在自然語言處理中得到一系列研究。這個講座總結圖神經網絡的兩種基本模式,即卷積圖神經網絡和循環圖神經網絡,并且討論他們在自然語言處理中的應用。具體任務包括語義理解、信息抽取和問答等。
嘉賓介紹:張岳目前是西湖大學的副教授。他的研究興趣包括自然語言處理和計算金融。他一直致力于基礎句法分析,文本生成,自然語言生成,機器翻譯,信息抽取,情感分析和股票市場分析等工作。他獲得了IALP 2017和COLING 2018的最佳論文獎。張岳擔任Transactions of ACL編委,ACM TALLIP副主編和IEEE Transactions on Big Data副主編,以及COLING 2014/18,NAACL 2015/19,EMNLP 2015/17/19,ACL 2017/18/19的領域主席。張岳在NAACL2010,ACL 2014和EMNLP 2016/18做過講習班。
報告主題:fastNLP
報告摘要:fastNLP是一款輕量級的NLP處理套件。既可以使用它快速地完成一個序列標注 (NER、POS-Tagging等)、中文分詞、文本分類、Matching、指代消解、摘要等任務;也可以使用它構建許多復雜的網絡模型,進行科研。此次報告介紹了fastNLP,以及fastNLP的應用如文本分類,序列標注等。
嘉賓介紹:顏航,男,復旦大學自然語言處理組,復旦大學計算機科學技術學院副教授/博導,主持的科研項目包括國家自然科學基金面上項目、上海浦江人才計劃、教育部基金、華為基金、復旦大學“卓學人才計劃”等等。擔任視頻研究領域頂級期刊—IEEE電路系統視頻技術學報(IEEE Transactions on Circuits and Systems for Video Technology)Associate Editor;IEEE高級會員
報告主題:面向自然語言處理的深度學習基礎
報告摘要:深度學習是人工智能領域的前沿熱點,已在自然語言處理領域取得了令人矚目的成績,本篇報告從自然語言處理著手,以機器學習、網絡模型為基礎,并結合自然語言處理的實例,以及最新研究進展,全方面多層次地進行講解,為感興趣的學者、學生和工程師,提供了一個快速了解相關基礎知識、研究內容、發展趨勢的窗口。
嘉賓介紹:邱錫鵬,男,復旦大學計算機科學技術學院副教授,中國中文信息學會青年工作委員會委員,中國人工智能學會青年工作委員會常務委員,主要從事自然語言處理、深度學習等方向的研究,在 ACL、EMNLP、AAAI、IJCAI 等計算機學會 A/B 類期刊、會議上發表 50 余篇學術論文。開源自然語言處理工具 FudanNLP [GitHub] [Google Code] 項目開發者,FastNLP [GitHub] 項目負責人。 2015 年入選首屆中國科協人才托舉工程,2018 年獲中國中文信息學會 “錢偉長中文信息處理科學技術獎—漢王青年創新獎”