報告主題: 社會媒體處理前沿綜述
報告摘要: 隨著社會媒體類型的不斷增加,與傳統的社會媒體相比,現在社會媒體是大眾參與發布和傳播消息,以社會網絡為基礎,以互聯網用戶創造和傳播信息為主要形式的在線交互媒體。此次報告介紹了社會媒體以及處理研究的發展趨勢和方法論、社會媒體的主客觀信息,最后介紹了社會媒體處理技術發展趨勢。
邀請嘉賓: 丁效,博士,哈爾濱工業大學助理研究員。主要研究方向為人工智能、自然語言處理、社會計算和事理圖譜。2016年獲得哈爾濱工業大學博士學位,已在人工智能領域的頂級國際期刊和會議IJCAI、AAAI、EMNLP等發表相關論文20余篇。承擔國家自然科學基金青年項目等省部級以上項目四項,參與科技創新2030“新一代人工智能”重大項目、國家重大科技基礎設施建設項目、科技部973課題、國家自然科學基金重點項目等。榮獲全國青年人工智能創新創業大會三等獎、第五屆全國青年計算語言學研討會優秀論文獎等榮譽。擔任中國中文信息學會社會媒體處理專委會秘書、委員、智能金融工作組副組長,中國中文信息學會青年工作委員會委員。
報告主題: 事理圖譜的構建及應用
報告摘要:
知識圖譜在各個領域精耕細作,逐漸顯露價值,但是現有的知識庫普遍是以“概念及概念間的關系”為核心,較少記錄“事理邏輯”相關知識,事理邏輯(事件之間的演化規律與模式)是一種非常有價值的人類知識,挖掘這種知識對我們認識人類行為和社會發展變化規律非常有意義。因此本次報告介紹一種新型的知識圖譜形式:事理圖譜,它是一個事理邏輯知識庫,描述了事件之間的演化規律和模式。結構上事理圖譜是一個有向有環圖,節點代表事件,有向邊代表事件之間的順承、因果、條件和上下位等邏輯關系。本次報告重點介紹事理圖譜的定義、構建、推理及應用。
嘉賓簡介:
丁效,哈爾濱工業大學助理研究員。主要研究方向為人工智能、自然語言處理、社會計算和事理圖譜。2016年獲得哈爾濱工業大學博士學位,已在人工智能領域的頂級國際期刊和會議IJCAI、AAAI、EMNLP等發表相關論文20余篇。承擔國家自然科學基金青年項目等省部級以上項目四項,參與科技創新2030“新一代人工智能”重大項目、國家重大科技基礎設施建設項目、科技部973課題、國家自然科學基金重點項目等。榮獲全國青年人工智能創新創業大會三等獎、第五屆全國青年計算語言學研討會優秀論文獎等榮譽。擔任中國中文信息學會社會媒體處理專委會秘書、委員、智能金融工作組副組長,中國中文信息學會青年工作委員會委員。個人主頁:
報告主題: 機器翻譯前沿綜述
報告摘要: 機器翻譯利用計算機將一種自然語言(源語言)轉換為另一種自然語言(目標語言)的過程。它是計算語言學的一個分支,是人工智能的終極目標之一,具有重要的科學研究價值。同時,機器翻譯又具有重要的實用價值。隨著經濟全球化及互聯網的飛速發展,機器翻譯技術在促進政治、經濟、文化交流等方面起到越來越重要的作用。
邀請嘉賓: 馮洋,博士,中國科學院計算技術研究所“新百星人才引進計劃”入選者,副研究員、博士生導師,主要研究方向為機器翻譯和人機對話。在中科院計算所獲得博士學位后,先后在謝菲爾德大學和USC/ISI開展研究工作。在ACL、EMNLP、COLING、NAACL等自然語言處理主流學術會議上發表論文40余篇,獲得ACL 2019最佳長文獎,為國內迄今唯一獲獎。多次在NIST、IWSLT、CWMT等國內外權威機器翻譯評測中獲得第一名。擔任COLING 2018領域主席,并擔任CCL 2018、2019學生研討會主席、CCMT 2019研討會主席。
報告主題: 信息抽取前沿動態
報告摘要: 信息抽取是從自然語言文本中抽取指定類型的實體、關系、事件等事實信息,并形成結構化數據輸出的文本處理技術。本次報告從特征多元化、語料構建(半)自動化、任務聯合學習等方面分析了當前信息提取的任務難點,并提出解決方案。
邀請嘉賓: 陳玉博,博士,中科院自動化所模式識別國家重點實驗室助理研究員,研究方向為信息抽取、知識圖譜和自然語言處理。在ACL、EMNLP、COLING、CIKM、WWW、AAAI等國際重要會議和期刊發表學術論文20余篇,曾獲得NLP-NABD 2016最佳論文獎、CCKS 2017最佳論文獎。主持或參與國家自然科學基金青年基金項目、國家自然科學基金重點項目以及多項企業合作科研項目的研發,合作企業包括:華為、螞蟻金服、騰訊、云知聲等,同時也開發了事件抽取、關系抽取、實體識別和消歧等多項工具和軟件。目前為中國中文信息學會青年工作委員會委員、中國中文信息學會語言與知識計算專委會委員。2018年獲得中國中文信息學會“錢偉長中文信息處理科學技術獎”一等獎。
報告主題:網絡表示學習
報告摘要:數據特征的有效表示是機器學習任務中最為關鍵環節之一。網絡數據(如社交網絡、信息網絡等)作為普適而廣泛的數據呈現形式,對它的高效表示學習是近年來數據挖掘和機器學習領域的研究熱點之一。本報告將重點圍繞如下內容展開:(1)網絡表示學習的基本概念;(2)幾類新型網絡表示學習方法,包括:網絡Tag表示、域自適應表示、基于網絡劃分的表示以及內存自適應的表示方法等。
嘉賓簡介:宋國杰,北京大學信息科學技術學院副教授。研究方向包括:網絡大數據分析、機器學習&數據挖掘、社會網絡分析和智能交通系統。主持了包括國家高技術研究發展計劃(863計劃)、國家科技支撐計劃、國家自然科學基金等縱向課題10多項;主持了國際(內)科研機構合作課題、企業橫向合作課題等20余項。國家級精品課程主講教師,兩度獲得北京大學教學成果一等獎(2012、2009)。在包括國際頂級期刊TKDE、TPDS、TITS以及國際頂級會議KDD、IJCAI、AAAI等發表論文100余篇,是多個國際頂級會議(KDD、WWW、AAAI、IJCAI等)的程序委員。申請國家發明專利10項,軟件著作權3項。研究成果獲“2012年度中國公路學會科學技術獎一等獎”、“2012年度山西省科學技術獎二等獎”和“2013年度中國公路學會科學技術獎一等獎”。
題目:社交機器人的挑戰性問題
摘要:構建既有智商又有情商的社交機器人是人工智能領域最具挑戰性的任務之一。社交機器人是一類混合的對話系統,其不僅具有信息獲取、推薦、任務完成的智力能力,還具有情感交流、社會交往的情商能力,能夠同時滿足用戶的信息需求與社會連接需求。報告人將重點圍繞社交機器人中的語義理解、一致性、交互性等關鍵問題,對最新的學術前沿進行報告,并從知識、行為、情感、話題、人設、個性化等多個角度對社交機器人的前沿技術進行歸納和總結。
個人簡介:清華大學計算機系副教授,博士生導師,計算機系智能技術與系統實驗室副主任。研究興趣主要集中在人工智能、深度學習、強化學習,自然語言處理如對話系統、閱讀理解、情感與情緒智能等。獲得2019年MSRA合作研究獎,2018年“錢偉長中文信息處理科學技術獎漢王青年創新獎”,IJCAI-ECAI 2018杰出論文獎、CCL 2018最佳系統展示獎、NLPCC 2015最佳論文獎,2016、2017年兩次入選PaperWeekly評選的最值得讀10/15篇NLP論文之一;其關于情緒化聊天機器人的工作被MIT Technology Review、NVIDIA、英國衛報(The Guardian)、參考消息、新華社等媒體廣泛報道,故事生成的工作被TechXplore報道。已超過80篇CCF A/B類論文發表在ACL、IJCAI、AAAI、WWW、SIGIR、EMNLP、KDD、ACM TOIS等國際頂級或主流會議及期刊上。曾擔任AAAI 2019、IJCAI 2019、IJCAI 2018(杰出SPC)、IJCAI 2017的高級程序委員,擔任ACL 2016、EMNLP 2019/2014/2011,IJCNLP 2017領域主席,長期擔任ACM TOIS、TKDE、TACL、TASLP等頂級期刊的審稿人。獲得專利授權近10項,其中2項專利技術授權給企業應用。他的主頁地址://coai.cs.tsinghua.edu.cn/hml
報告主題:開放語義解析
報告摘要:語義解析(Semantic Parsing)是將自然語言句子轉換為機器可識別的、可計算的語義表示的任務。語義解析是自然語言處理的核心任務之一,在智能問答、語音助手、智能機器人、代碼生成等任務上具有廣泛的應用。本報告將詳細介紹語義解析這項任務,首先介紹語義解析任務、數據集和工具,然后依次介紹基于文法的語義解析方法(CCG,DCS等)、基于語義圖構建的語義解析方法和新興的神經語義解析方法(Seq2Seq, Seq2Act, coarse-to-fine等),最后對語義解析的前沿方向和重要挑戰進行展望,包括上下文有關的語義解析(可用于對話),與周邊環境有交互的語義解析(如用于機器人執行指令)。
報告嘉賓:韓先培,博士,中國科學院軟件研究所中文信息處理實驗室/計算機科學國家重點實驗室研究員。主要研究方向為信息抽取、知識圖譜、語義解析以及智能問答系統。在ACL、SIGIR、AAAI、EMNLP等重要國際會議發表論文四十余篇。韓先培是中國中文信息學會理事,語言與知識計算專業委員會副主任,中國科學院青促會會員,入選中國科協青年人才托舉計劃,獲得中國中文信息學會漢王青年創新獎。 陳波,博士,中國科學院軟件研究所中文信息處理實驗室助理研究員,2018年獲得中國科學院大學博士學位,并獲得優秀畢業生。主要研究方向為語義解析(Semantic Parsing)和自然語言理解。在ACL、COLING、NAACL等自然語言處理國際頂級會議發表學術論文多篇。參與多項國家自然科學基金重點課題以及企業合作科研項目的研發。
論壇嘉賓:楊成 北京郵電大學 助理教授
報告主題:圖神經網絡在自然語言處理領域的前沿應用
報告摘要:很多真實世界的應用場景需要處理包含著元素間豐富關系信息的圖形式的數據。在例如物理系統建模、化學分子功能預測等領域中,數據都擁有顯式的圖結構;而在另一些例如文本的非結構數據中,如何從數據中抽取推理并利用如句法樹等結構信息,也是相關領域中重要的研究方向。圖神經網絡可以通過節點間的信息傳遞(message passing)有效地捕捉結構信息。自該概念提出以來,圖神經網絡技術已經在自然語言處理、數據挖掘等多個領域得到了廣泛的應用。本報告將重點介紹圖神經網絡技術在自然語言處理領域的前沿應用。
嘉賓簡介:楊成,博士,北京郵電大學計算機學院助理教授,2019年7月畢業于清華大學計算機科學與技術系,從事自然語言處理與社會計算相關方向的研究,博士期間在國內外頂級期刊會議上發表多篇論文,Google Scholar累計獲得引用近500次,并擔任國內外頂級會議包括ACL、EMNLP、SMP等在內的程序委員會成員和期刊的審稿人。
論壇嘉賓:沈華偉 中國科學院計算技術研究所 研究員
報告主題:圖卷積神經網絡及其應用
報告摘要:卷積神經網絡在處理圖像、語音、文本等具有較好空間結構的數據時展現出了很好的優勢。然而,卷積神經網絡不能直接應用于圖(Graph)這類空間結構不規則的數據上。近年來,研究人員開始研究如何將卷積神經網絡遷移到圖數據上,涌現出ChevNet、MoNet、GraphSAGE、GCN、GAT等一系列方法,在基于圖的半監督分類和圖表示學習等任務中表現出很好的性能。報告首先梳理和回顧該方向的主要研究進展和發展趨勢,進而介紹報告人近期在圖卷積神經網絡方面的一些研究工作(ICLR’19; IJCAI’19)。
嘉賓簡介:沈華偉,博士,中國科學院計算技術研究所研究員,中國中文信息學會社會媒體處理專委會副主任。主要研究方向:社交網絡分析、網絡數據挖掘。先后獲得過CCF優博、中科院優博、首屆UCAS-Springer優博、中科院院長特別獎、入選首屆中科院青年創新促進會、中科院計算所“學術百星”。2013年在美國東北大學進行學術訪問。2015年被評為中國科學院優秀青年促進會會員。獲得國家科技進步二等獎、北京市科學技術二等獎、中國電子學會科學技術一等獎、中國中文信息學會錢偉長中文信息處理科學技術一等獎。出版個人專/譯著3部,在網絡社區發現、信息傳播預測、群體行為分析等方面取得了系列研究成果,發表論文100余篇。擔任PNAS、IEEE TKDE、ACM TKDD等10余個學術期刊審稿人和KDD、WWW、SIGIR、AAAI、IJCAI、CIKM、WSDM等20余個國際學術會議的程序委員會委員。