教程題目: Foundations and Trends for Personalized Recommendation
摘要:
個性化推薦在當前的信息消費環境中起著至關重要的作用。本教程主要包括兩個部分:基礎和趨勢。在第一部分中,我們將介紹個性化推薦系統的基本問題,包括用戶意圖和需求、挑戰性問題和最新技術。在第二部分,我們將重點關注相關領域的新趨勢話題,包括(但不限于):用戶滿意度與評價、可解釋推薦、基于知識圖譜和推理的推薦、跨域異構推薦、推薦系統中的公平性問題等。最后,將與與會者討論未來的發展方向。
嘉賓介紹
張敏博士是清華大學計算機科學與技術系的終身副教授,專門從事網絡搜索和推薦以及用戶建模。她是計算機系智能技術與系統實驗室副主任,清華-MSRA媒體與搜索實驗室執行主任。她還擔任ACM信息系統事務(TOIS)的副編輯,SIGIR 2019教程主席,SIGIR 2018短論文主席,WSDM 2017項目主席等。發表論文100余篇,被引用次3500余次,H指數32分。2016年獲北京市科技獎(一等獎),2018年獲全國高校計算機科學優秀教師獎等。她還擁有12項專利,并與國內外企業進行了大量的合作。
內容概要:
在復雜的實際應用中,圖是有用的數據結構,例如對物理系統進行建模,學習分子指紋,控制交通網絡以及在社交網絡中推薦朋友。但是,這些任務需要處理包含元素之間的豐富關系信息且無法通過傳統深度學習模型(例如卷積神經網絡(CNN)或遞歸神經網絡(RNN))妥善處理的非歐氏圖數據。圖中的節點通常包含有用的特征信息,這些信息在大多數無監督的表示學習方法(例如,網絡嵌入方法)中無法很好地解決。圖神經網絡(GNN)被提出來結合特征信息和圖結構,以通過特征傳播和聚集學習更好的圖表示。由于其令人信服的性能和高解釋性,GNN最近已成為一種廣泛應用的圖分析工具。
本書全面介紹了圖神經網絡的基本概念,模型和應用。首先介紹了vanilla GNN模型。然后介紹了vanilla模型的幾種變體,例如圖卷積網絡,圖遞歸網絡,圖注意力網絡,圖殘差網絡和一些通用框架。還包括不同圖類型的變體和高級訓練方法。對于GNN的應用,該書分為結構,非結構和其他場景,然后介紹了解決這些任務的幾種典型模型。最后,最后幾章提供了GNN的開放資源以及一些未來方向的展望。
本書組織如下。在第1章中進行了概述之后,在第2章中介紹了數學和圖論的一些基本知識。在第3章中介紹了神經網絡的基礎,然后在第4章中簡要介紹了香草GNN。四種類型的模型分別在第5、6、7和8章中介紹。在第9章和第10章中介紹了不同圖類型和高級訓練方法的其他變體。然后在第11章中提出了幾種通用的GNN框架。第12、13和14章介紹了GNN在結構場景,非結構場景和其他場景中的應用。最后,我們在第15章提供了一些開放資源,并在第16章總結了這本書。
作者:
劉知遠,清華大學計算機系自然語言處理實驗室, 副教授。2006年獲得清華大學計算機科學與技術系學士學位,2011年獲得博士學位。他的研究興趣是自然語言處理和社會計算。在IJCAI、AAAI、ACL、EMNLP等國際期刊和會議上發表論文60余篇。
//nlp.csai.tsinghua.edu.cn/~lzy/index_cn.html
周界是清華大學計算機科學與技術系碩士二年級學生。他于2016年獲得清華大學學士學位。他的研究興趣包括圖形神經網絡和自然語言處理。
圖書目錄:
** 簡介:**
推薦方法構造了預測模型,以估計用戶與項目交互的可能性。先前的模型在很大程度上遵循一般的監督學習范式-將每個交互視為一個單獨的數據實例,并基于“信息孤島”進行預測。但是,此類方法忽略了數據實例之間的關系,這可能導致性能欠佳,尤其是對于稀疏場景。此外,建立在單獨數據實例上的模型幾乎無法顯示出推薦背后的原因,從而使過程難以理解。
在本教程中,我們將從圖學習的角度重新審視推薦問題。可以將用于推薦的通用數據源組織成圖形,例如用戶-項目交互(二分圖),社交網絡,項目知識圖(異構圖)等。這種基于圖的組織將孤立的數據實例連接起來,從而為利用高階連通性帶來了好處,這些高階連通性對有意義的模式進行了編碼,以進行協作過濾,基于內容的過濾,社會影響力建模和知識感知推理。結合圖神經網絡(GNN)的最新成功,基于圖的模型已展現出成為下一代推薦系統技術的潛力。本教程對基于圖的學??習方法進行了回顧,以提出建議,特別關注GNN的最新發展和知識圖譜增強的建議。通過在本教程中介紹這個新興而有前途的領域,我們希望觀眾可以對空間有深入的了解和準確的見解,激發更多的想法和討論,并促進技術的發展。
目錄:
作者簡介:
王翔是新加坡國立大學(NUS)計算機學院的研究員。 他獲得了博士學位。 他于2019年獲得國大計算機科學博士學位。他的研究興趣包括推薦系統,信息檢索和數據挖掘。 在SIGIR,KDD,WWW和AAAI等頂級會議上,他擁有20多種出版物,包括TOIS和TKDE等期刊。 他曾擔任CCIS 2019的本地主席,包括SIGIR,CIKM和MM在內的頂級會議的PC成員以及TKDE和TOIS等著名期刊的定期審稿人。
講座題目
社會用戶興趣挖掘:方法與應用:Social User Interest Mining: Methods and Applications
講座簡介
社交網絡上豐富的用戶生成內容提供了建立模型的機會,這些模型能夠準確有效地提取、挖掘和預測用戶的興趣,希望能夠實現更有效的用戶參與、更好質量地提供適當的服務和更高的用戶滿意度。雖然傳統的建立用戶檔案的方法依賴于基于人工智能的偏好獲取技術,這些技術可能被用戶認為是侵入性的和不受歡迎的,但最近的進展集中在確定用戶興趣和偏好的非侵入性但準確的方法上。在本教程中,我們將介紹與有效挖掘用戶興趣相關的五個重要方面: 1)用于提取用戶興趣的信息源 2)文獻中提出的各類用戶興趣簡介 3)為挖掘用戶利益而采用或提議的技術 4)最新方法的可擴展性和資源需求 5)文獻中采用的評估方法,用于驗證挖掘的用戶興趣概要的適當性。我們還將介紹現有的挑戰、開放的研究問題和激動人心的工作機會。
講座嘉賓
Fattane Zarrinkalam博士是Ryerson大學系統、軟件和語義實驗室(LS3)的博士后研究員,她在那里從事與支持語義的社交網絡分析相關的項目。在博士研究期間,她專注于根據社交網絡(尤其是Twitter)上的個人和集體行為來識別社交媒體用戶的興趣。她在CIKM、ESWC和ECIR等場館發表了自己的作品。此外,她還在包括信息檢索、信息處理和管理在內的頂級期刊上發表期刊論文。此外,在她攻讀博士學位期間,她參與了兩項向美國專利局提出的專利申請。
圖(Graph)是一種重要的數據結構,它由節點V(或稱為頂點,即個體),與邊E(即個體之間的聯系)構成。圖數據的典型例子有網頁鏈接關系、社交網絡、商品推薦等。由于圖的巨大表現能力,在圖上的研究,近年來備受矚目。清華大學的唐杰老師,近日在自己的個人主頁上更新了關于圖表示學習方面的PPT,闡述了他在圖表示學習領域方面的工作進展。
作者簡介:
唐杰,清華大學計算機科學與技術系教授。2006年在清華大學計算機科學與技術系獲得博士學位。研究興趣包括人工智能、數據挖掘、社交網絡、機器學習和知識圖譜,重點是設計挖掘社交和知識網絡的新算法。發表學術論文200余篇,擁有專利20項。曾任CIKM ' 16的PC聯合主席,WSDM ' 15, KDD ' 18的副主席,ACM TKDD的代理主編,IEEE TKDE、IEEE TBD和ACM TIST的編輯。我是AMiner.org學術社交網絡分析與挖掘項目的負責人,該項目已經吸引了來自世界220個國家和地區的1000多萬個獨立IP訪問。
內容摘要: 個性化推薦在當前消費場景中起著至關重要的作用。本教程主要包括兩個部分:基礎和趨勢。在第一部分中,我們將介紹個性化推薦系統的基本問題,包括用戶意圖和需求,挑戰性問題和最新技術。在第二部分中,我們將重點關注相關領域中的新趨勢主題,包括(但不限于):用戶滿意度和評估方式,可解釋的推薦,基于知識圖譜和推論的推薦,跨域異構推薦以及公平性。最后,我們將討論未來的發展方向。
作者簡介: 張敏博士是清華大學計算機科學與技術系的終身教授,研究方向為Web搜索和推薦以及用戶建模。她是CS部門智能技術與系統實驗室的副主任,清華-MSRA媒體與搜索實驗室的執行主任。她還擔任過ACM TOIS副編輯。她已發表了100多篇論文,引用次數超過3500, H-index得分為32。她在2016年獲得了北京科學技術獎(一等獎),并在2018年獲得了中國大學計算機科學優秀教師獎。她還擁有12項專利。并且她與國際和國內企業進行了很多合作。
論文題目: Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation
論文摘要:
最近關于推薦的研究主要集中在探索最先進的神經網絡,以提高模型的表達能力,同時通常采用負抽樣(NS)策略來提高學習效率。盡管有效,現有方法中有兩個重要問題沒有得到充分考慮:1) NS波動劇烈,基于抽樣的方法在實際應用中難以獲得最優的排序性能;2)盡管異構反饋(如查看、單擊和購買)在許多在線系統中廣泛存在,但大多數現有方法僅利用一種主要類型的用戶反饋,如購買。在這項工作中,我們提出了一種新的非抽樣轉移學習解決方案,命名為高效異構協同過濾(EHCF),用于Top-N推薦。它不僅可以對細粒度的用戶-項目關系進行建模,而且可以從整個異構數據(包括所有未標記的數據)中高效地學習模型參數,并且具有較低的時間復雜度。對三個真實數據集的大量實驗表明,EHCF在傳統(單一行為)和異構場景中都顯著優于最先進的推薦方法。此外,EHCF在培訓效率方面有顯著的改進,使其更適用于真實世界的大型系統。我們的實現已經發布,以促進更有效的基于全數據的神經方法的進一步發展。
論文作者:
張敏博士是清華大學計算機科學與技術系的終身副教授,專門從事網絡搜索和推薦以及用戶建模。她是計算機系智能技術與系統實驗室副主任,清華-MSRA媒體與搜索實驗室執行主任。她還擔任ACM信息系統事務(TOIS)的副編輯,SIGIR 2019教程主席,SIGIR 2018短論文主席,WSDM 2017項目主席等。發表論文100余篇,被引用次3500余次,H指數32分。2016年獲北京市科技獎(一等獎),2018年獲全國高校計算機科學優秀教師獎等。她還擁有12項專利,并與國內外企業進行了大量的合作。
馬少平是清華大學智能技術與系統國家重點實驗室計算機科學與技術系教授,研究領域為智能信息處理, 信息檢索。主要研究興趣是智能信息處理,主要集中在信息檢索與Web信息挖掘等方面,尤其研究基于網絡用戶行為分析的語義挖掘,以改進搜索引擎的性能。
報告主題:開放語義解析
報告摘要:語義解析(Semantic Parsing)是將自然語言句子轉換為機器可識別的、可計算的語義表示的任務。語義解析是自然語言處理的核心任務之一,在智能問答、語音助手、智能機器人、代碼生成等任務上具有廣泛的應用。本報告將詳細介紹語義解析這項任務,首先介紹語義解析任務、數據集和工具,然后依次介紹基于文法的語義解析方法(CCG,DCS等)、基于語義圖構建的語義解析方法和新興的神經語義解析方法(Seq2Seq, Seq2Act, coarse-to-fine等),最后對語義解析的前沿方向和重要挑戰進行展望,包括上下文有關的語義解析(可用于對話),與周邊環境有交互的語義解析(如用于機器人執行指令)。
報告嘉賓:韓先培,博士,中國科學院軟件研究所中文信息處理實驗室/計算機科學國家重點實驗室研究員。主要研究方向為信息抽取、知識圖譜、語義解析以及智能問答系統。在ACL、SIGIR、AAAI、EMNLP等重要國際會議發表論文四十余篇。韓先培是中國中文信息學會理事,語言與知識計算專業委員會副主任,中國科學院青促會會員,入選中國科協青年人才托舉計劃,獲得中國中文信息學會漢王青年創新獎。 陳波,博士,中國科學院軟件研究所中文信息處理實驗室助理研究員,2018年獲得中國科學院大學博士學位,并獲得優秀畢業生。主要研究方向為語義解析(Semantic Parsing)和自然語言理解。在ACL、COLING、NAACL等自然語言處理國際頂級會議發表學術論文多篇。參與多項國家自然科學基金重點課題以及企業合作科研項目的研發。