本教程的目標是向RecSys社區介紹基于知識圖譜的可解釋推薦系統的開發和評估的最新進展。本文將首先介紹概念基礎,通過調查最新進展并描述知識圖譜如何被集成到推薦管道中的現實例子,也是為了提供解釋。本教程將繼續系統地介紹使用知識圖譜對推薦系統進行建模、集成、訓練和評估的算法解決方案,特別注意可解釋性的角度。實踐部分將為與會者提供基于知識圖譜的推薦系統的具體實現,利用開源工具和公共數據集;在這一部分,教程參與者將參與設計與建議配套的解釋,并闡明其影響。我們通過分析新出現的開放問題和未來的方向來結束本教程。
**介紹可解釋的推薦(20分鐘)**我們將首先提供可解釋推薦研究的歷史概述。事實上,盡管“可解釋推薦”這個術語是近年來才正式引入的,但其基本概念可以追溯到個性化推薦研究中最早的一些作品。我們將給出現實世界中解釋可以影響推薦的例子,考慮到音樂、教育和社交平臺等領域。解釋是向用戶顯示的一條信息,解釋為什么推薦某個特定的項目。在這一部分中,我們將重點關注推薦解釋的不同信息源(或顯示風格)。然后,我們對現有的可解釋推薦方法進行了分類,這可以幫助與會者了解可解釋推薦研究的最新進展。我們將提出受解釋影響的目標(效用、覆蓋面、多樣性、新穎性、可見性、曝光率),并提供相關工作。解釋還會對經濟、法律、社會、信任、技術和心理學等多個視角產生影響。
**基于知識圖譜的可解釋推薦模型(20分鐘)**我們將提供推薦管道的初步概述,以描述應如何在幾個階段實現解釋,即數據采集和存儲、數據準備、模型訓練、模型預測、模型評估和推薦交付。在本部分中,我們將深入研究現有的方法,這些方法使用KG來增強傳統模型,并在優化函數中嵌入正則化項,以隱式地編碼來自KG的用戶和產品之間的高階關系。然后,根據KG結構,詳細介紹了依賴預計算路徑(元組)建模用戶和產品之間高階關系的方法。最后,根據所考慮的方法,我們展示了如何從具有知識圖譜的推薦系統中產生不同類型的解釋。
**可解釋的推薦評估(20分鐘)**首先,我們將介紹最先進的評估策略,利用基于志愿者或付費實驗對象的用戶研究。雖然這是最有效的策略,但也是最耗時和昂貴的。然后我們將轉向另一種類型的評估,即在線評估,通過在線實驗來評估可解釋的推薦,調查不同的角度,如說服力、有效性、效率和解釋的滿意度。隨后,我們提出了離線評估推薦解釋的主要方法,如評估可由解釋模型解釋的推薦的百分比和直接評估解釋質量。在這一部分中,我們還將指出我們最近在定義解釋質量的離線評價指標方面所做的工作。我們將介紹現實世界平臺的例子,如LinkedIn和Spotify,以及根據所述建模策略處理解釋的方法。
**實踐中的推薦模型(35分鐘) **為了實際展示本教程第一部分中介紹的方法,我們首先介紹三個數據集,分別代表電影(MovieLens-1M (ML1M))、音樂(LASTFM - 1b (LASTFM))和電子商務(亞馬遜手機)領域。它們是公共的,在領域、廣泛性和稀疏性方面各不相同。 然后,我們加載并呈現了文獻中為三個考慮的數據集提供的KG,并展示了應該如何對這些信息進行預處理,以便在優化和推薦生成過程中啟用推薦模型,利用它們的內容。 在接下來的步驟中,我們創建并訓練了至少兩種最新的基于路徑的方法,它們支持文本解釋,例如PGPR和CAFE,它們依賴于RL代理,通過在KG中用戶和被推薦產品之間導航路徑來優化推薦。 展示了如何從預訓練的可解釋推薦系統開始創建top-n推薦,并測量傳統的有效性指標,如NDCG。
**解釋的創造和影響(30分鐘) **在第二部分中,我們首先展示了如何創建文本解釋,從預訓練的可解釋推薦系統開始,以伴隨用戶提供的top-n推薦。 然后,我們計算最先進的離線評價指標,以評估解釋的質量,如鏈接交互的近代性,共享實體的受歡迎程度,和解釋類型的多樣性。 最后,我們檢查和比較第一部分訓練的(至少兩個)模型提供的解釋,并分析解釋的影響和引起的權衡。
推薦系統在我們的日常生活中發揮著越來越重要的作用,尤其是在許多面向用戶的在線服務中,它在緩解信息過載方面發揮著重要的作用。推薦系統旨在識別一組最能匹配用戶顯性或隱性偏好的對象(即物品),通過利用用戶和物品的交互來提高匹配精度。隨著深度神經網絡(DNNs)在過去幾十年的快速發展,推薦技術取得了良好的性能。然而,我們在設計深度推薦系統(DRS)時面臨三個內在挑戰: 1) 現有的大多數DRS是基于手工組件開發的,這需要大量的機器學習和推薦系統的專家知識; 2) 人為誤差和偏見會導致次優,降低推薦有效性; 3) 在不同的推薦場景中,通常需要非平凡的時間和工程努力來設計特定于任務的組件。
在本教程中,我們將全面介紹高級自動機器學習(AutoML)技術在深度推薦系統中解決上述問題的最新進展。希望相關領域的學術研究者和行業從業者能夠對空間有深刻的理解和準確的洞察,激發更多的想法和討論,并在推薦中推動技術的發展
推薦系統在我們的日常生活中發揮著越來越重要的作用,特別是在許多以用戶為導向的在線服務中,推薦系統在緩解信息過載問題方面發揮著重要作用。推薦系統的目標是通過利用用戶和物品的交互來提高匹配的準確性,識別出一組最符合用戶顯性或隱性偏好的對象(即物品)。
隨著深度神經網絡(DNNs)在過去幾十年的快速發展,推薦技術已經取得了良好的性能。然而,現有的基于DNN的方法在實踐中存在一些缺陷。更具體地說,他們認為推薦過程是一個靜態的過程,并按照一個固定的貪心策略進行推薦; 現有的大多數基于DNN的推薦系統都是基于手工制作的超參數和深度神經網絡架構;它們將每個交互視為單獨的數據實例,而忽略了實例之間的關系。
在本教程中,我們將全面介紹深度推薦系統中解決上述問題的先進技術的最新進展,包括深度強化學習(DRL)、自動機器學習(AutoML)和圖神經網絡(GNN)。
通過這種方式,我們希望這三個領域的研究人員能夠對空間有更深刻的理解和準確的洞察,激發更多的想法和討論,促進推薦技術的發展。
本教程的目標讀者是對幫助機器理解自然語言文本(特別是文本中描述的真實事件)的人工智能技術感興趣的研究人員和實踐者。這些方法包括提取一個事件關于其主角、參與者和屬性的內部結構,以及關于多個事件的成員關系、時間和因果關系的外部結構。本教程將向讀者系統地介紹(i)事件的知識表示,(ii)自動提取、概念化和預測事件及其關系的各種方法,(iii)事件過程和屬性的歸納,以及(iv)大量受益于上述技術的NLU和常識理解任務。我們將概述這一領域中出現的研究問題,以此結束本教程。
//cogcomp.seas.upenn.edu/page/tutorial.202102/
人類語言總是涉及對現實世界事件的描述。因此,對事件的理解在自然語言理解中起著至關重要的作用。例如,敘事預測可以通過學習事件的因果關系來預測故事接下來會發生什么;機器理解文件可能包括理解影響股票市場的事件,描述自然現象或識別疾病表型。事實上,事件理解在諸如開放域問題回答、意圖預測、時間軸構建和文本摘要等任務中也廣泛地發現了它的重要用例。由于事件不只是簡單的、獨立的謂詞,對事件理解的前沿研究通常面臨兩個關鍵挑戰。一個挑戰是精確地歸納事件之間的關系,這些關系描述了事件的成員關系、共同參照、時間順序和因果關系。另一種是理解事件的內在結構和屬性,涉及其參與者、粒度、位置和時間。
在本教程中,我們將全面回顧文獻中以事件為中心的知識表示的現有范式,并關注它們對NLU任務的貢獻。除了介紹事件提取的部分標簽和無監督學習方法外,我們還將討論最近的約束學習和結構化推理方法,用于從文本中提取多方面的事件-事件關系。我們還將回顧最近用于事件預測任務的數據驅動方法,包括事件過程歸納和概念化,以及以事件為中心的語言模型如何有利于敘事預測。此外,我們將說明遠程監督的方法如何幫助解決對事件的時間和因果常識的理解,以及如何應用它們來構建大規模的可能性知識庫。與會者將了解該主題的最新趨勢和新出現的挑戰,獲得現成模型的代表性工具和學習資源,以及相關模型和技術如何有利于最終使用的NLU應用。
第14屆推薦系統頂級會議ACM RecSys在9月22日到26日在線舉行。來自意大利Polytechnic University of Turin做了關于對抗推薦系統的教程《Adversarial Learning for Recommendation: Applications for Security and Generative Tasks – Concept to Code》,186頁ppt,干貨內容,值得關注。
//recsys.acm.org/recsys20/tutorials/#content-tab-1-3-tab
對抗式機器學習(AML)是從識別計算機視覺任務中的漏洞(如圖像分類)開始,研究現代機器學習(ML)推薦系統中的安全問題的研究領域。
在本教程中,我們將全面概述AML技術在雙重分類中的應用:(i)用于攻擊/防御目的的AML,以及(ii)用于構建基于GAN的推薦模型的AML。此外,我們將把RS中的AML表示與兩個實際操作會話(分別針對前面的分類)集成在一起,以顯示AML應用程序的有效性,并在許多推薦任務中推進新的想法和進展。
本教程分為四個部分。首先,我們總結了目前最先進的推薦模型,包括深度學習模型,并定義了AML的基本原理。在此基礎上,我們提出了針對RSs的攻擊/防御策略的對抗性推薦框架和基于GAN實踐環節。最后,我們總結了這兩種應用的開放挑戰和可能的未來工作。
景點推薦系統可以幫助游客過濾大量的無關信息, 還能輔助商家發掘潛在的顧客. 然而, 現有 的基于傳統方法的推薦系統, 如基于內容的推薦或協同過濾系統, 雖推薦過程相對透明直觀, 但由于數 據稀疏性的存在, 推薦結果往往不夠準確; 基于深度學習的推薦方法, 雖在一定程度上提高了推薦結 果的精度, 但由于缺乏可解釋性和透明度, 難以滿足部分用戶理解推薦依據的愿望, 也阻礙了此類方法 的推廣應用. 為了解決當前方法所存在的局限, 本文引入基于知識圖譜的景點推薦框架, 將推薦過程 與知識圖譜嵌入相結合, 推斷用戶興趣在知識圖譜上的傳播路徑, 以此作為推薦依據. 此外, 本文通過 對真實旅游數據的多角度時空分析, 探究旅游活動的時空規律, 并將其應用于景點推薦框架中, 提出一 種面向旅游的基于知識圖譜的可解釋推薦方法 —— Geo-RippleNet, 并通過構建基于開放網絡資源的 旅游知識圖譜, 對 Geo-RippleNet 進行了全面的實驗驗證. 結果表明, 本文提出的基于知識圖譜的景點 推薦方法, 不僅可以最大限度地吸收知識圖譜豐富的語義信息, 從而實現可觀的性能提升, 還能充分 利用圖譜的關系知識, 推理興趣傳播路徑, 以增強推薦結果的可解釋性. 此外, 將旅游活動的時空規律 融入到上述推薦框架中, 能夠還原用戶出游和決策的時空過程, 進一步提高方法的性能表現.
推薦系統旨在為用戶推薦個性化的在線商品或信息, 其廣泛應用于眾多Web場景之中, 來處理海量信息數據所導致的信息過載問題, 以此提升用戶體驗. 鑒于推薦系統強大的實用性, 自20世紀90年代中期以來, 研究者針對其方法與應用兩方面, 進行了大量廣泛的研究. 近年來, 很多工作發現知識圖譜中所蘊含的豐富信息可以有效地解決推薦系統中存在的一系列關鍵問題, 例如數據稀疏、冷啟動、推薦多樣性等. 因此, 本文 針對基于知識圖譜的推薦系統這一領域進行了全面的綜述. 具體地, 首先簡單介紹推薦系統與知識圖譜中的一些基本概念. 隨后, 詳細介紹現有方法如何挖掘知識圖譜不同種類的信息并應用于推薦系統. 此外, 總結了相關的一系列推薦應用場景. 最后, 提出了對基于知識圖譜的推薦系統前景的看法, 并展望了該領域未來的研究方向.
知識圖譜封裝了實體和關系。知識圖譜的簡潔表示格式和圖的特性使得許多新的Web應用程序得以創建,并增強了現有的應用性能。然而,在一個知識圖譜中,描述一個實體的幾十個或幾百個事實可能會超出一個典型用戶界面的能力,并使用戶超載過多的信息。這激發了對實體摘要的富有成果的研究——為實體自動生成緊湊的摘要,以高效和有效地滿足用戶的信息需求。例如,在其搜索結果頁面右側,谷歌通過選擇和顯示用戶可能正在搜索的特定實體的一些事實,為其知識圖中的實體提供“最佳摘要”。
近年來,研究人員通過提出從純粹的排序和挖掘技術到機器和深度學習技術等各種方法,對這個問題做出了貢獻。技術水平不斷提高,同時也使社區和新來者很難跟上該領域最近和過去的貢獻。此外,盡管知識圖譜在學術界和產業界越來越流行,但迄今為止還沒有對該問題領域的最新趨勢和基本構件進行教育和討論。本教程的目的就是填補這一空白。
鏈接: //pan.baidu.com/s/1qSv16wZEAJWUcwx40ByvwQ 提取碼: g9bq
【導讀】新加坡國立大學的Xiang Wang、Tat-Seng Chua,以及來自中國科學技術大學的Xiangnan He在WSDM 2020會議上通過教程《Learning and Reasoning on Graph for Recommendation》介紹了基于圖學習和推理的推薦系統,涵蓋了基于隨機游走的推薦系統、基于網絡嵌入的推薦系統,基于圖神經網絡的推薦系統等內容。
Tutorial摘要:
推薦方法構建預測模型來估計用戶-項目交互的可能性。之前的模型在很大程度上遵循了一種通用的監督學習范式——將每個交互視為一個單獨的數據實例,并基于“信息孤島”進行預測。但是,這些方法忽略了數據實例之間的關系,這可能導致性能不佳,特別是在稀疏場景中。此外,建立在單獨數據實例上的模型很難展示推薦背后的原因,這使得推薦過程難以理解。
在本教程中,我們將從圖學習的角度重新討論推薦問題。用于推薦的公共數據源可以組織成圖,例如用戶-項目交互(二部圖)、社交網絡、項目知識圖(異構圖)等。這種基于圖的組織將孤立的數據實例連接起來,為開發高階連接帶來了好處,這些連接為協作過濾、基于內容的過濾、社會影響建模和知識感知推理編碼有意義的模式。隨著最近圖形神經網絡(GNNs)的成功,基于圖形的模型顯示了成為下一代推薦系統技術的潛力。本教程對基于圖的推薦學習方法進行了回顧,重點介紹了GNNs的最新發展和先進的推薦知識。通過在教程中介紹這一新興而有前景的領域,我們希望觀眾能夠對空間有更深刻的理解和準確的洞察,激發更多的想法和討論,促進技術的發展。
Tutorial大綱:
可解釋推薦嘗試開發模型,不僅生成高質量的推薦,而且生成直觀的解釋。解釋可以是事后的,也可以直接來自可解釋的模型(在某些上下文中也稱為可解釋的或透明的模型)。可解釋推薦嘗試解決為什么的問題:通過向用戶或系統設計者提供解釋,它幫助人們理解為什么算法推薦某些項目,而人既可以是用戶,也可以是系統設計者。可解釋推薦有助于提高推薦系統的透明度、說服力、有效性、可信度和滿意度。
在這次調查中,我們回顧了在2019年或之前可解釋的建議的工作。我們首先通過將推薦問題劃分為5W來強調可解釋推薦在推薦系統研究中的地位。什么,什么時候,誰,在哪里,為什么。然后,我們從三個角度對可解釋推薦進行了全面的調查:1)我們提供了可解釋推薦的研究時間軸,包括早期的用戶研究方法和最近的基于模型的方法。2)我們提供了一個二維分類法來對現有的可解釋推薦研究進行分類:一個維度是解釋的信息源(或顯示樣式),另一個維度是生成可解釋推薦的算法機制。3)我們總結了可解釋推薦如何應用于不同的推薦任務,如產品推薦、社交推薦和POI推薦。我們還專門用一節來討論更廣泛的IR和AI/ML研究中的解釋視角。最后,我們討論了未來可解釋推薦研究領域的發展方向。