亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

推薦系統是提供各種個性化服務的重要而強大的工具。傳統上,這些系統使用數據挖掘和機器學習技術,根據數據中的相關性進行推薦。然而,僅依賴相關性而不考慮潛在的因果機制可能會導致公平性、可解釋性、魯棒性、偏差、回聲室和可控性等諸多實際問題。**因此,相關領域的研究人員已經開始將因果關系融入推薦系統來解決這些問題。本文回顧了推薦系統中因果推理的現有文獻。**討論了推薦系統和因果推理的基本概念及其相互關系,綜述了針對推薦系統中不同問題的因果方法的現有工作。最后,討論了推薦因果推理領域存在的問題和未來的發展方向。 //www.zhuanzhi.ai/paper/89fc6bd003d6e90ddf7e792d390e6ee3

1. 引言

推薦系統被認為是緩解信息過載的最有效工具之一,已被廣泛部署在許多現實世界的系統中,如電子商務平臺(如亞馬遜、eBay)、社交網絡(如Facebook、Twitter)、視頻分享平臺(如Youtube、TikTok)和流媒體服務(如Netflix、Hulu)。一般來說,這些系統使用高級技術從歷史數據以及收集的用戶、物品和內容信息中了解用戶的偏好。近年來,這些技術的發展迅速。

**一般來說,推薦算法可以分為三大類:協同過濾、基于內容的推薦和混合方法[1,2,3]。協同過濾(CF)模型的核心思想是相似的用戶可能有相似的興趣,相似的物品可能被相似的用戶喜歡。**早期基于記憶的CF模型,如user-based CF[4,5]和item -based CF[6,7],將用戶-項目評分矩陣的行或列向量作為用戶和項目向量表示,并根據預定義的相似度函數如余弦相似度和皮爾遜相關系數計算用戶或項目之間的相似度進行推薦。為了從矩陣中提取潛在語義,研究人員后來探索了學習到的用戶和項目向量表示。這從潛在因子模型(Latent Factor model, LFM)開始,如在實踐中被廣泛采用的矩陣分解[8]、概率矩陣分解[9]和因子分解機[10]。在這些模型中,每個用戶和物品都被學習為一個潛在表示,以計算每個用戶-物品對的匹配得分,通常基于內積。深度學習和神經網絡的發展進一步擴展了CF模型。例如,[11,12,13,14]采用簡單的用戶和項目表示(例如,one-hot向量),并學習復雜的匹配函數。[15, 16, 17, 18, 19]學習復雜的用戶和物品表示,并采用簡單的匹配函數(例如內積)。用戶表示也可以直接從歷史交互中計算出來,例如在順序推薦中[20,21]。基于內容的推薦將利用關于用戶和物品的豐富信息,甚至上下文信息來增強推薦。為了從輔助信息中學習物品之間的相似性,基于內容推薦的表示方法已經從TF-IDF[22]這樣的簡單模型發展到DNN[23]、CNN[24]等基于深度學習的模型。混合方法結合了協同過濾和基于內容的方法,既利用了兩種方法的優點,又避免了它們的某些局限性[1,2,25]。

**傳統推薦算法的基礎是從數據中挖掘或學習相關模式。**例如,許多協同過濾模型旨在學習用戶-項目相關模式,一些基于內容的推薦模型旨在學習特征-特征相關模式。然而,現實世界中的應用是由潛在的因果機制驅動的,單純的關聯學習不考慮因果關系會導致一些實際問題。我們以經典的“啤酒和尿布”問題為例。單純的相關性學習可以學習到啤酒和尿布之間的強相關模式,從而為購買了尿布的顧客推薦啤酒,或者為購買了尿布的顧客推薦啤酒。然而,底層機制是年輕爸爸通常會同時購買啤酒和尿布,不考慮底層機制推薦啤酒或尿布會造成困惑,進一步傷害用戶滿意度。因此,從關聯學習向因果學習發展具有重要意義。

正式地,因果推理研究因果關系和結果之間的因果關系,其中原因負責結果。兩個著名和流行的框架是潛在結果框架(也稱為Neyman-Rubin潛在結果或Rubin因果模型)[26]和結構因果模型(SCM)[27,28]。這兩種因果框架都有助于因果推薦的發展。通過利用推薦系統中潛在的因果機制,因果推薦能夠處理不同的實際問題,包括可解釋性、公平性、魯棒性、提升和無偏性。

本綜述的貢獻。本綜述旨在對推薦的因果推理進行全面的回顧。首先介紹了推薦系統的基本知識,然后討論了推薦因果推理的現有工作。具體而言,在兩個維度上探索了推薦系統中的因果推理。第一維遵循因果推理的流程,包括因果推理中的概念、符號和技術,以及因果推理和推薦系統之間的聯系。第二個維度是推薦中的實際問題,包括問題介紹、因果方法和開放問題。更具體地說,推薦包括可解釋性、公平性、魯棒性、基于提升的無偏性。強調了推薦因果推理中仍有待解決的幾個開放問題。

**本次綜述的組織方式如下:第2節介紹推薦系統的初步研究。**從第3節到第7節,介紹了因果推理的基本知識以及與推薦系統的聯系。第8至12節分別介紹了現有的因果方法,包括可解釋推薦、推薦中的公平性、基于提升的推薦、魯棒推薦、無偏推薦。在第13節中,我們討論了推薦因果推理中的一些開放問題和未來方向。第14節總結了這項綜述。

面向可信推薦系統:從淺層模型到深度模型再到大型模型

推薦系統作為人類與人工智能之間的橋梁,處于以人為本的人工智能研究的前沿。然而,不恰當的使用或開發推薦技術可能會給人類和整個社會帶來負面影響,比如推薦機制的不透明導致的用戶不信任、推薦算法的不公平、推薦系統的用戶不可控性,以及大量使用用戶隱私數據進行個性化帶來的用戶隱私風險。在本次演講中,我們將沿著推薦算法從淺模型到深模型再到大模型的演進過程,討論如何構建可信的推薦系統,包括但不限于推薦系統研究在AI社區中作為代表性的主觀AI任務的獨特作用,主觀AI與可信計算的關系,以及可信計算不同視角下的典型推薦方法,例如因果和反事實推理、神經符號建模、自然語言解釋、聯邦學習、用戶可控推薦、回音室緩解、個性化快速學習等等。

付費5元查看完整內容

相關內容

推薦系統,是指根據用戶的習慣、偏好或興趣,從不斷到來的大規模信息中識別滿足用戶興趣的信息的過程。推薦推薦任務中的信息往往稱為物品(Item)。根據具體應用背景的不同,這些物品可以是新聞、電影、音樂、廣告、商品等各種對象。推薦系統利用電子商務網站向客戶提供商品信息和建議,幫助用戶決定應該購買什么產品,模擬銷售人員幫助客戶完成購買過程。個性化推薦是根據用戶的興趣特點和購買行為,向用戶推薦用戶感興趣的信息和商品。隨著電子商務規模的不斷擴大,商品個數和種類快速增長,顧客需要花費大量的時間才能找到自己想買的商品。這種瀏覽大量無關的信息和產品過程無疑會使淹沒在信息過載問題中的消費者不斷流失。為了解決這些問題,個性化推薦系統應運而生。個性化推薦系統是建立在海量數據挖掘基礎上的一種高級商務智能平臺,以幫助電子商務網站為其顧客購物提供完全個性化的決策支持和信息服務。

知識薈萃

精品入門和進階教程、論文和代碼整理等

更多

查看相關VIP內容、論文、資訊等

在信息過載的時代,推薦系統(RSs)已經成為在線服務平臺不可或缺的一部分。傳統的RSs通過觀察用戶的歷史活動、用戶畫像和交互項目內容之間的相關性來估計用戶的興趣并預測其未來的行為。然而,由于沒有考慮導致觀察到的用戶行為的內在因果原因,生成的推薦可能存在多種類型的偏差。此外,驅動用戶活動的因果動機通常糾纏在這些RSs中,無法保證推薦的可解釋性和泛化能力。為了解決這些缺點,近年來人們對用因果推理技術增強傳統RSs的興趣激增。本綜述提供了因果RSs的系統概述,幫助讀者全面了解這一有前途的領域。從傳統RSs的基本概念及其由于缺乏因果推理能力而產生的局限性開始。討論了如何引入不同的因果推理技術來解決這些挑戰,重點是去偏差、提高可解釋性和提高泛化能力。徹底分析了因果RSs的各種評估策略,特別是在利益的因果影響不可用的情況下,如何用有偏的數據可靠地估計它們的性能。最后,對未來因果關系研究的潛在方向進行了展望。

1. 引言

隨著web上的信息呈指數級增長,推薦系統(RSs)在現代在線服務中扮演著越來越重要的角色,因為它能夠根據用戶的個性化興趣自動地向他們提供商品**。

傳統RSs主要可以分為三類[9]:基于協同過濾的方法[10]、基于內容的方法[11]和混合方法[12]。基于協同過濾的RSs利用用戶過去的瀏覽、點擊、購買等行為來估計用戶的興趣并預測其未來的行為。另一方面,基于內容的方法通過匹配用戶興趣和項目內容來預測新的推薦。混合方法結合了兩者的優勢,綜合考慮了協同信息和用戶/項目特征信息,產生更準確的推薦。盡管近年來上述三類RSs都取得了巨大的成就,但這些方法的一個很大的局限性是,它們只能根據觀察到的用戶歷史行為和用戶/項目特征中的相關性來估計用戶興趣并預測未來的推薦,這不能保證因果關系[13,14]

例如,基于協同過濾的RS可能會發現某種類型的幾個電視劇傾向于從一組用戶中獲得高評分,并得出結論,我們應該不斷向這些用戶推薦相同類型的電視劇。但有一個重要的問題:高收視率是由于用戶確實喜歡該類型的電視劇,還是由于用戶接觸到的同一類型的電視劇有限(即曝光偏差),如果有機會,他們會更喜歡看新的節目?此外,基于內容的RS可以觀察到具有某些特征的微視頻與更多的點擊相關聯,并得出這些特征可能反映了當前用戶興趣的趨勢。但點擊量之所以如此之高,是因為這些微視頻往往具有聳人聽聞的標題,容易讓用戶上當受騙嗎?此外,如果這些微視頻的標題改為反映其真實內容的標題,用戶還會點擊它們嗎?上述問題在本質上是因果的,因為它們要么詢問干預的效果(例如,如果一個新的電視劇展示給用戶,評分將是什么),要么詢問反事實的結果(例如,如果微視頻的標題更改以忠實地反映內容,用戶還會點擊它嗎),而不僅僅是觀察數據中的關聯。Pearl[15]認為,這些問題位于因果關系階梯的第2級和第3級,即干預推理和反事實推理,而傳統的RSs不能回答這些問題,即僅用位于階梯第1級的關聯進行推理。為什么這些因果問題對RSs很重要?第一個原因是,如果不解決這些問題,很容易在推薦中產生偏差,而這種偏差會被很長一段時間忽視。如果上述基于協同過濾的RSs錯誤地揭示了用戶興趣的暴露偏差,則會通過不斷向用戶推薦相似的項目來放大該偏差;最終,推薦將失去偶然性,用戶的在線體驗可能會嚴重下降。同樣的,對于基于內容的微視頻RSs來說,如果不能區分用戶興趣引起的點擊和被標題黨欺騙的點擊,就會過度推薦標題聳人聽聞的微視頻,這對那些花費大量精力設計內容的優質微視頻上傳者是不公平的。此外,了解用戶活動的原因有助于提高推薦的可解釋性。考慮一個因果問題,用戶購買商品是出于質量還是價格低廉。尋求用戶行為背后的因果解釋可以幫助服務提供商根據用戶的個性化偏好增強RS算法。因果推斷能夠識別穩定不變的因果關系,并在此基礎上提出建議,同時丟棄不受歡迎或容易變化的其他相關性。以推薦餐廳為例。用戶選擇餐館可能是因為方便(例如,去附近的快餐店快速地吃點東西,但他們不一定喜歡,非穩定相關)或由于個人興趣(例如,出差很遠的地方去火鍋店,穩定的因果關系)。如果RS能恰當地解析出影響用戶之前光顧餐廳的意圖,即使不同餐廳的便利性水平可能因各種內部或外部原因(如用戶搬到新地方)而發生變化,系統仍能很好地適應新情況。從這個角度來看,因果RSs的泛化能力可以得到大幅提升。

本綜述對因果RS研究的最新進展進行了系統的概述。組織結構如圖1所示。在第2節中,我們從傳統RSs的基本概念及其相關推理的局限性開始。第3節回顧了機器學習和統計學中兩個重要的因果推理范式,并展示了它們與推薦任務的聯系。第4節深入討論了如何引入不同的因果推理技術來解決傳統RSs的局限性,重點是去偏倚、可解釋性的提高和泛化能力的提高。第5節總結了因果RSs的一般評估策略。最后,第6和第7節討論了因果性RSs的前瞻性開放問題和未來方向,并總結了本綜述。

2. 因果推薦系統

基于前幾節討論的RSs和因果推斷的初步知識,我們準備介紹最先進的因果RSs。重點關注了三個重要的主題,即偏差緩解、可解釋性提高和泛化能力的提高,以及它們的相互聯系,其中可以很好地解決由于相關推理而傳統RSs的各種限制。傳統RSs的關聯推理可以繼承用戶觀察行為中的多種類型偏差,并在未來的推薦[46]中放大這些偏差。這些偏差可能會導致各種后果,如離線評估與在線指標之間的差異、多樣性的喪失、推薦質量的降低、攻擊性的推薦等。因果推斷可以區分穩定的因果關系和可能對推薦產生負面影響的虛假關聯和偏差,從而提高推薦的魯棒性。在前幾節中,我們介紹了因果關系,以解決傳統RSs的各種類型的偏差和虛假相關性問題。在本節中,我們使用因果關系來解釋用戶決策過程。具體來說,我們討論了一個有趣的問題,旨在解開用戶的意圖,從而解釋他們過去的行為,即用戶購買一件物品是因為她符合當前的趨勢還是因為她真的喜歡它?這個問題的棘手之處在于:在現實中,我們只觀察到影響,即購買,這兩個原因都可以解釋。

在從潛在偏差和糾纏的觀察數據集中估計因果關系之后,RSs的泛化能力可以得到顯著增強,因為即使我們進行推薦的上下文(或環境)發生了變化(例如,項目流行度、用戶從眾性等),我們仍然可以根據穩定和不變的因果關系來進行推薦。同時丟棄或糾正其他瞬時的、易受變化影響的不良相關性[56,93]。在本節中,我們使用用于流行度偏差的PD算法和用于因果可解釋性的DICE算法作為兩個例子,來展示如何通過因果干預和解纏來提高RSs的泛化性。

參考文獻:

  1. Jiahui Liu, Peter Dolan, and Elin R?nby Pedersen. Personalized news recommendation based on click behavior. In Proceedings of the 15th International Conference on Intelligent User Interfaces, pages 31–40, 2010.

  2. Ioannis Paparrizos, B Barla Cambazoglu, and Aristides Gionis. Machine learned job recommendation. In Proceedings of the 5th ACM Conference on Recommender Systems, pages 325–328, 2011.

付費5元查看完整內容

協同過濾是一種被廣泛應用于推薦系統中的方法,其利用不同用戶之間(或不同物品之間)的相似性關系來過濾和抽 取用戶和物品的交互信息,從而進行用戶推薦.近年來,圖神經網絡因其出色的表示學習性能和良好的可擴展性逐漸成為推薦 領域中的一種新興的范式.文中從圖學習角度對近年來推薦領域的研究進行系統性的回顧與總結.首先,根據數據類型將推 薦場景分成兩類,包括基于交互信息的推薦系統(將用戶與物品交互數據作為關鍵數據源)和輔助信息增強的推薦系統(融入與 用戶和物品相關聯的社交信息和知識圖譜信息);其次,從隨機游走、圖表示學習和圖神經網絡方面入手,對不同推薦場景中的 方法、關鍵技術、主要難點和重要進展進行回顧與總結;最后,總結關于圖學習方法在推薦領域中面臨的挑戰和未來的主要研究 方向.

1 引言

隨著互聯網技術的高速發展以及移動終端的全面普及, 互聯網中的信息量呈指數級增長.互聯網給用戶提供海量資 源的同時,也給用戶帶來了信息過載的問題[1G2],即用戶很難 在眾多內容中快速、高效地篩選出自己感興趣或者對自己有 意義的內容.推薦系統通過主動向用戶推薦其感興趣內容,幫助用戶 過濾掉許多不感興趣或者不相關的內容,從而有效地緩解信 息過載的問題,使用戶能更加便捷地瀏覽感興趣的內容.因 此,推薦系統被廣泛地應用在許多企業的服務中,已逐漸成為 企業吸引用戶不可或缺的工具.針對不同的應用場景,推薦 系統也演變出不同的推薦任務,其中包括線上購物推薦(如 Amazon、天貓),社交媒體推薦(如微博、抖音)等,為 人 們 的生活帶來極大便利的同時,也極大地影響著其生活方式[1]. 傳統推薦 系 統 分 為 3 類[3]:基 于 內 容 的 推 薦 (ContentG BasedRecommendation,CB)[4]、基于協同過濾的推薦(CollaG borativeFilteringRecommendation,CF)[5]和 混 合 推 薦 (HyG bridRecommendation).基于內容的推薦算法根據用戶的歷 史交互記錄,構建與歷史交互的物品關聯性高的推薦物品集, 實現對目標用戶的推薦任務;基于協同過濾的推薦利用不同 用戶之間(不同物品之間)的相似性關系,對用戶與物品的交 互信息(點擊、購買、評分等交互行為)進行篩選過濾,為目標 用戶推薦感興趣的物品;混合推薦將不同推薦技術融入推薦 系統中,避免單一推薦技術的缺陷.傳統推薦系統中,相似性 度量方法包括歐氏距離、余弦相似度、皮爾遜相關系數等.常 用的模型方法包括矩陣分解(MatrixFactorization,MF)[6]、概 率矩 陣 分 解 (Probabilistic MatrixFactorization,PMF)[7]等. 傳統推薦系統簡單易操作,可以快速地對用戶與物品的交互 信息建模,但存在數據稀疏問題,無法處理關系復雜的推薦以 及缺乏可解釋性.

隨著機器學習的快速發展,經典的機器學習算法被廣泛 地應用到推薦領域中,如邏輯回歸(LogisticRegression,LR)、 梯度提升決策樹(GradientBoostingDecisionTree,GBDT)和 因子分解機(Factorization Machines,FM)等[8G10].基于機器 學習的推薦模型可以處理運算復雜的推薦,但基于機器學習 的推薦算法往往只能建模用戶的歷史交互數據中的低階特征 表示,缺乏對高階特征表示的建模能力. 隨著深度學習的興起,深度神經網絡被廣泛地應用到推 薦 領 域 中,如 深 度 神 經 網 絡 (Deep Neural Networks, DNN)[11G12]、卷積神經網絡(ConvolutionalNeuralNetworks, CNN)[13G15]、循 環 神 經 網 絡 (Recurrent Neural Network, RNN)[16]、注意力模型(Attention Model)[17]以及變分自編碼 器(VariationalAutoencoder,VAE)[18G19]等,并且都取得了不 錯的推薦效果.

推薦系統中的大部分數據本質上都可被視為圖結構數 據.例如,用戶對物品的交互行為(點擊、瀏覽、購買等),從圖 結構方面考慮,用戶一旦點擊或購買物品,就與這些物品相關 聯.但絕大多數深度學習任務都是針對1D,2D或3D 的歐氏 結構化數據(如聲音信號、圖像和視頻等)進行研究.推薦系 統中的非歐氏結構化數據(圖結構數據)的節點的鄰域并不一 致,部分節點的鄰居節點多,部分節點的鄰居節點少.非歐氏 結構化數據的復雜性使得傳統的深度學習無法有效地建模圖 結構數據[20].隨著圖學習(GraphLearning,GL)方法,特別 是圖學習中的圖神經網絡(GraphNeuralNetworks,GNN)的 提出,其在復雜關系提取和鏈路預測等許多圖任務中取得了 巨大成功[21G27],引起了學術界和工業界研究人員的關注.由 于推薦系統的大部分數據具有圖結構的特性,將圖學習方法 應用到推薦領域是一種很自然的做法.因此,圖學習方法已 逐漸成為推薦領域內一種被廣泛研究的新興推薦范式,即基 于圖學習的推薦系統[28G31].當用戶與物品的交互信息和用 戶與物品相關聯的輔助信息被構建成圖結構形式,再結合以 隨機游走、圖表示學習和圖神經網絡為主要代表的圖學習方 法,即可捕獲、學習和模擬用戶與物品之間高階的、復雜的關 系,更加有效地學習用戶的長期興趣偏好和物品的特征屬性, 以提升推薦系統的推薦性能[32G36].因此,對基于圖學習的推 薦方法進行系統性的總結與回顧,可以使研究者們更好地把 握這一新興領域的研究現狀和挑戰,促進圖學習方法在推薦 領域的發展.

由于圖學習技術在推薦領域中的廣泛運用,一部分研究 學者已經對基于圖結構數據的推薦系統進行了回顧和總結. Laknath [29]從全局排名方法、重啟隨機游走到吸收隨機游走3 個方面對不同推薦任務中的隨機游走方法進行了詳細的分析 與總結.Gao等[30]主要從推薦系統的冷啟動、可擴展性、個 性化以及動態性的推薦問題出發,對基于知識圖 譜(KnowG ledgeGraph,KG)推薦任務上的圖神經網絡方法進行了回顧 和總結.Guo等[28]將知識圖譜任務上的推薦方法劃分為嵌 入方法、路徑方法以及未統一定義方法,然后分別對各分類中 的推薦方法進行了詳細的分析與總結.Wu等[31]從圖神經網 絡角度對傳統推薦、社交推薦和知識圖譜推薦進行了總結. 然而,上述綜述工作存在不足之處,Laknath [29]和 Wu等[31]的 綜述工作僅對單一的推薦方法(前者是隨機游走方法,后者是 圖神經網絡方法)進行了回顧,Laknath [29]的綜述工作時間較 早,并沒有總結近幾年的相關推薦任務和方法.Gao等[30]和 Guo等[28]的綜述工作僅對單一的推薦場景(知識圖譜)進行 了總結.然而單一的推薦方法和推薦場景不能使研究學者快 速且全面地了解基于圖結構的推薦場景的研究現狀和挑戰. 針對上述工作的不足,本文首先總結了推薦任務中常用的數 據集和評價指標,以方便研究者快速開展對推薦系統的研究; 其次,根據運用的推薦數據類型將推薦運用場景分成兩組: 基于交互信息的推薦系統(僅利用用戶與物品的交互數據)和輔 助信息增強的推薦系統(融入與用戶和物品相關聯的社交信 息以及知識圖譜信息等信息).其中,輔助信息增強的推薦系 統主要從用戶社交信息和物品知識圖譜兩個方面對用戶和物 品相關聯的輔助信息進行詳細分析,從而對輔助信息增強的 推薦系統進行回顧與總結.針對不同的推薦運用場景,分別 對隨機游走、圖表示學習和圖神經網絡這3種圖學習方法進 行總結,分析了不同的圖學習方法在不同推薦場景下的難點 和研究現狀.最后,本文總結了圖學習方法在推薦領域的未 來研究方向,使研究者可以更加清晰地了解圖學習在推薦領 域中的挑戰和發展趨勢.基于圖學習的推薦方法的分類如 圖1所示.

2 推薦任務定義、評估指標和數據集

推薦系統用于推薦任務的關鍵數據為用戶與物品之間的交互數據,而為了更好地捕捉用戶的興趣偏好和物品的屬性 特征,推薦任務也常使用與用戶和物品相關的輔助信息,包括 用戶和物品的屬性信息、用戶之間的社交信息、物品之間的關 聯信息等,來增強用戶和物品的特征表示,如圖2所示.推薦 任務使用的大部分數據本質上都可被視為圖結構數據,用戶 交互信息可轉換為用戶與物品的交互二部圖[37],用戶和物品 表示為交互圖中的節點,用戶與物品之間的交互表示為交互 圖中的邊.將用戶和物品的屬性信息與用戶的交互圖相結 合,轉換為帶有屬性的交互圖,用戶和物品的屬性信息表示為 圖中的節點屬性.用戶之間社交關系,即用戶關注或分享鏈 接給某個用戶,可轉換為用戶信任關系圖.用戶與物品的屬 性信息也可以融入用戶與物品的交互圖中,組合成包含多個 實體和多重關系的異構圖,而在推薦任務中,常采用知識圖譜 的方式來表示多種實體之間的關系[29].基于圖學習的方法 在捕捉節點之間間接的、高階的、復雜的連接關系和整體圖拓 撲結構信息方面具有非常強大的建模能力[21],因此,將圖學 習方法應用到推薦領域是一種理所當然的做法.根據圖學習 方法中使用的用戶與物品的信息類型,本文將推薦系統主要 分為基于交互信息的推薦系統(模型只考慮用戶和物品的交 互關系)和輔助信息增強的推薦系統(利用社交關系和知識圖 譜等輔助信息增強用戶與物品的特征表示).

**3 基于交互信息的推薦系統 **

基于交互信息的推薦系統通常僅考慮用戶與物品之間的 交互關系來實現對用戶的興趣偏好建模,其基于這樣一個假 設,即用戶對物品的喜好不隨時間發生改變,從而為目標用戶 提供反映該用戶長期興趣的靜態物品推薦列表.基于交互信 息的推薦系統利用圖學習的方法,對用戶的交互二部圖以及 用戶與物品的節點屬性進行學習,以捕獲用戶和物品之間復 雜的、高階的和間接的交互關系,實現對用戶與物品鄰接矩陣 的補全,利用補全的鄰接矩陣來評估 O+ 中用戶u 對沒有交 互的物品i+ 感興趣的概率或者評分.基于圖學習的方法使 信息在用戶與物品交互圖上的節點之間廣泛傳播,以豐富交 互較少的用戶和物品的信息,能夠緩解數據稀疏性和冷啟動 問題.然而在交互圖上,用戶或物品之間可能不存在直接連 接,消息需要通過多跳鄰居節點進行傳播.因此,基于圖學習 方法在推薦領域如何高效地在用戶或物品之間傳播信息成為 一個重大挑戰.為充分發揮基于圖學習方法在用戶與物品交 互圖上的模型性能,本文將消息傳播問題主要概括為: (1)交互圖的采樣:交互二部圖是根據用戶和物品的交互 數據構建而成.但由于推薦任務中的物品數量巨大,考慮推 薦模型的訓練和計算效率,如何設計數據采樣方式才能有效 地捕捉用戶與物品之間的消息傳播,更好地提升推薦性能? (2)信息聚合:用戶與物品之間存在復雜、豐富和潛在的 交互關系,如何設計信息聚合方式才能有效地將復雜的、間接 和高階的信息聚合到目標節點,豐富用戶和物品的特征表示, 實現用戶與物品之間的消息傳播? (3)節點輸出:如何構建適用于下游推薦任務的節點表 示?

**4 融入社交信息的推薦系統 **

社交網絡的推薦系統主要考慮利用用戶社交網絡中的用 戶信任關系進一步挖掘用戶興趣偏好,緩解推薦任務中的數 據稀疏性問 題,從 而 有 效 地 為 目 標 用 戶 推 薦 其 感 興 趣 所 物 品[50,71G72].在真實的生活場景中,一個用戶的興趣愛好很可 能會受他所信任的朋友的興趣影響,即社交影響會在社交網 絡中傳播和擴散[51].社交關系可以構建成一個關于用戶之 間的同構圖,其中每個用戶代表圖中的一個節點,兩個用戶 之間存在信任關系會對應圖上的一條邊,即用戶信任關系圖 GU .在GU 中可能存在隱式社交關系,即用戶之間沒有顯式 的信任交互,但他們卻有潛在關系.在融入社交信息的推薦 系統中,利用社交網絡中信任的朋友的興趣特點,來分析目標 用戶的喜好,從而更加有效地利用信任朋友的偏好來為目標 用戶推薦其感興趣的物品,或者通過預測社交網絡中可能存 在的隱式社交連接,來向目標用戶推薦有共同興趣愛好的朋 友[73].由于社交圖也具有圖結構屬性,社交信息和用戶與物 品的交互信息可以自然而然地組合成由這兩部分信息構成的異構圖.一部分為用戶與物品的交互圖,另一部分為反映社 會關系的社交圖.此異構圖中包含兩種不同類型的信息(即 交互信息和社交信息). 融入社交信息的推薦系統主要考慮利用目標用戶所信任 的朋友的影響來幫助模型更好地理解用戶的興趣偏好,但是 對目標用戶的偏好建模,一方面需要考慮如何利用目標用戶 信任的朋友的偏好信息來分析目標用戶的喜好;另一方面需 要考慮不同的朋友對目標用戶產生的影響程度如何,這些問 題都值得深入研究.因此,如何適當地建模目標用戶信任的 朋友對目標用戶的影響是一個重大的問題.為充分利用社交 信息,改善圖學習推薦方法的推薦效果,本文將社交影響問題 主要概括為:

(1)朋友的影響:如何構建朋友的影響并將其融入推薦過 程中? 不同的朋友對目標用戶產生的影響程度不同,如何區 分朋友之間的影響力? 如何利用社交網絡中存在的隱式社交 關系?

(2)用戶偏好分析:如何從社交信息擴散角度和物品的交 互行為角度來分析用戶喜好? 如何將社交網絡中和物品交互 網絡中的興趣偏好特征融合,更加全面構建出用戶的喜好?

**5 融入知識圖譜的推薦系統 **

由于知識圖譜包含了物品之間豐富的語義信息和用戶與 物品、物品與物品之間的多重關系,若能夠充分捕捉物品之間 潛在的連接關系,對分析用戶真實的興趣偏好和物品的屬性 特征十分有益.因此,將知識圖譜融入推薦系統中,可以進一 步提升模型的推薦性能[22,64G68],還可以增加推薦物品的多樣 性和有效性.知識圖譜雖然包含了豐富的物品信息和用戶與 物品之間的多重復雜關系,但具有復雜的圖結構,其中包含了 多種類型的實體和關系,使充分挖掘知識圖譜的語義信息成 為一個挑戰[28].為充分利用知識圖譜中豐富的語義關系來 提升推薦性能,本文將知識圖譜應用在推薦任務上所面臨的 問題主要概括如下:

(1) 結構復雜性:鑒于知識圖譜具有復雜的圖結構,如何 簡化知識圖譜結構來實現消息的高效傳播和對知識圖譜信息 的充分挖掘?

(2)多關系傳播:如何捕獲實體與實體之間復雜、高階的 多重關系,并將其有效地融入推薦任務中?

(3)特征整合:如何從知識圖譜中復雜的實體和多種關系 中學習到用戶和物品的特征表示并進行有效地融合,從而更 加全面挖掘出用戶的喜好和物品的屬性?

**6 基于圖學習推薦的未來研究方向 **

圖學習方法不僅在圖分類、鏈路預測等圖結構任務上取 得了巨大成功[21G27,80G86],而且在推薦領域也具有出色的推薦 表現,但它仍然有許多問題和挑戰亟待解決.本節將對圖學 習方法在推薦領域中的未來研究方向進行分析與總結.

**6.1 基于圖學習的大規模圖推薦 **

在真實的應用場景中,推薦系統往往會面臨一個龐大的 用戶和商品群體,如淘寶、京東等網上購物平臺.數據的規模 是推薦系統無法避免的問題,它會導致系統在時間和空間方 面的計算資源花費極大.基于隨機游走和圖表示學習的推薦 方法在面對大規模的用戶和商品數據時,模型的處理效率低 下.而基于圖神經網絡的方法在大規模圖上的訓練成本較 高,不太適合大規模的圖結構數據.因此,需要研究更高效的 算法來加速對大規模推薦數據的處理,并不斷更新模型以產 生更加及時、有效的推薦.

6.2 多源多模態信息整合

輔助信息已被證明在改善數據稀疏性和冷啟動等推薦問 題上非常有效[29,71,87G90].在線上購物系統中,多源多模態的 信息包括商家對商品的描述、分類等信息,用戶對物品的點 擊、瀏覽、加入購物車、評分等信息以及商品的文本、圖像等信 息.現有的圖學習方法難以將多源多模態數據進行有效的融 入,導致對數據中豐富的信息利用不充分或數據對象之間的 關系表示不明顯,不能有效地捕捉到用戶更加真實的興趣偏 好和物品真實的屬性,使模型的推薦性能無法發揮到極致. 而現有圖學習推薦方法對節點的特征向量表示的方式比較單 一,通常只能對用戶歷史交互記錄進行有效的處理,難以將多 源多模態信息有效地融入用戶與物品的特征表示中,使模型 達到最佳的推薦效果.因此,如何有效地整合多源多模態數 據信息是圖學習推薦方法需要解決的一個重要問題.

6.3 基于圖學習的跨領域推薦

跨領域 推 薦[91G94]可 以 緩 解 推 薦 系 統 的 冷 啟 動 和 數 據 稀疏性問題,利用輔助域的信息為目標域進行推薦,能夠取得 不錯的推薦性能.例如用戶對電影交互以及用戶對書籍交互 可看作兩個領域,當用戶對電影交互信息存在稀疏性問題時, 可以利用用戶對書籍的交互信息來對電影的推薦任務提供幫 助.現有的圖學習方法往往只能對單一領域中的圖結構數據 進行學習,停留在單一的層面上,難以將訓練好的推薦模型從 一個領域中的圖結構數據遷移到另一個領域中的圖結構數據 上,不能實現在不同推薦模型之間進行有效的信息遷移.實際 上,推薦的數據和交互可以來自多個領域,包括各種來源、系統 和模式,它們之間是相互關聯的,可以相互協同來提升推薦效 果.因此,基于圖學習的跨領域推薦是一個值得研究的課題. 6.4 推薦方法的可解釋性研究 現有的圖學習推薦方法盡管取得了優異的推薦效果,但 推薦結果在科學解釋方面往往不能令用戶和工業界信服.盡 管推薦系統在可解釋方面取得了一些進展,但離真正理解用 戶選擇行為背后的原因和意圖還有漫長的路要走[95].然而, 因果推斷作為一種用于發現事物之間因果關系的重要技術, 尚未在推 薦 領 域 中 的 可 解 釋 性 方 面 得 到 廣 泛 的 研 究[96G97]. 因此,在基于圖學習的推薦方法中使用因果推斷技術來構建 可解釋的推薦系統是一個值得研究的方向.

**7 結束語 **

圖學習方法在推薦鄰域中的應用已經受到學術 界和工業界越來越多的關注.本文對基于圖學習推薦方法的 兩大應用場景進行了回顧與總結,即基于交互信息的推薦系 統和輔助信息增強的推薦系統.針對輔助信息增強的推薦系 統,本文主要從用戶社交信息和物品知識圖譜兩部分對關于 用戶和物品的輔助信息進行詳細分析與總結.本文還對各大 應用場景中的圖學習方法進行了分析與總結,指出了圖學習 推薦方法所面臨的難點及未來研究方向,對基于圖學習的推 薦系統的研究與發展具有一定的借鑒意義.

付費5元查看完整內容

【導讀】推薦系統是現在習以為常的應用,如何融入元學習方法來解決推薦系統的冷啟動或小數據場景是個有趣的問題。上海交大最新《推薦系統中的深度元學習》綜述,有40頁pdf涵蓋135篇文獻,全面地概述了當前基于深度元學習的推薦方法。針對推薦場景、元學習技術和元知識表示,提出了一種分類方法,為基于元學習的推薦方法提供了設計空間。值得關注!

作為信息過濾技術,基于深度神經網絡的推薦系統近年來取得了很大的成功。然而,由于從頭開始的模型訓練需要足夠的數據,基于深度學習的推薦方法仍然面臨數據不足和計算效率低下的瓶頸。元學習作為一種新興的學習模式,學習如何提高算法的學習效率和泛化能力,在解決數據稀疏問題方面顯示出了其優勢。最近,越來越多的基于深度元學習的推薦系統的研究出現了,以提高在可用數據有限的推薦場景下的性能,例如用戶冷啟動和項目冷啟動。因此,本研究及時全面地概述了當前基于深度元學習的推薦方法。針對推薦場景、元學習技術和元知識表示,提出了一種分類方法,為基于元學習的推薦方法提供了設計空間。對于每個推薦場景,我們進一步討論了現有方法如何應用元學習來提高推薦模型的泛化能力的技術細節。最后,我們指出了當前研究的局限性,并指出了未來研究的方向。

//www.zhuanzhi.ai/paper/6cff1ae05b9c005089acf0838b5fa0a6

近年來,推薦系統作為緩解信息過載的過濾系統被廣泛應用于電子商務、娛樂服務、新聞等各種網絡應用。推薦系統通過在大量的候選物品中提出個性化的建議,在改善用戶體驗和增加在線平臺吸引力方面取得了巨大的成功。隨著數據驅動的機器學習算法[3,90],特別是基于深度學習的方法[9,32,121]的發展,該領域的學術和行業研究在準確性、多樣性、可解釋性等方面極大地提高了推薦系統的性能。

由于表達表示學習能力能夠從足夠的數據中發現隱藏的依賴關系,基于深度學習的方法在當代推薦模型中被大量引入[26,121]。通過利用大量具有不同數據結構的訓練實例(例如,交互對[121]、序列[20]和圖形[26]),具有深度神經結構的推薦模型通常被設計用于有效捕獲非線性和非微不足道的用戶/物品關系。然而,傳統的基于深度學習的推薦模型通常是基于預定義的學習算法,用足夠的數據從頭開始訓練。例如,常規監督學習范式通常使用從所有用戶收集的交互來訓練一個統一的推薦模型,并基于學習到的特征表示對未看到的交互進行推薦。這種基于深度學習的方法通常需要大量的數據和計算。換句話說,基于深度學習的推薦系統的性能很大程度上依賴于大量訓練數據的可用性和足夠的計算量。在實際的推薦應用中,數據的收集主要來源于用戶在訪問網絡平臺過程中觀察到的用戶互動。存在可用用戶交互數據稀疏(如冷啟動推薦)和模型訓練計算受限(如在線推薦)的推薦場景。因此,數據不足和計算效率低下的問題成為基于深度學習的推薦模型的瓶頸。

最近,元學習提供了一種很有吸引力的學習范式,它針對數據和計算的不足,著重加強機器學習方法的泛化能力[36,98]。元學習的核心思想是從先前的多任務學習過程中獲得關于高效任務學習的先驗知識(即元知識)。元知識可以促進新任務的快速學習,在看不見的任務上具有良好的泛化性能。在這里,任務通常指屬于同一類或具有相同屬性的一組實例,涉及其上的單個學習過程。與提高深度學習模型的表征學習能力不同,元學習側重于學習更好的學習策略來替代固定的學習算法,被稱為學習到學習的概念。由于元學習技術在對看不見的任務進行快速適應方面具有巨大的潛力,它被廣泛應用于圖像識別[4,130]、圖像分割[60]、自然語言處理[48]、強化學習[75,103]等研究領域。

元學習的好處與推薦模型在實例有限和計算效率低下的情況下的推廣需求是一致的。早期基于元學習的推薦方法主要分為個性化推薦算法選擇[13,78],提取元數據集的特征,針對不同的數據集(或任務)選擇合適的推薦算法。通過運用提取元知識和生成任務特定模型的思想,這種元學習的定義更接近自動化機器學習的研究[39,115]。**隨后,深度元學習[38]或神經網絡元學習[36]出現,并逐漸成為推薦模型中典型討論的元學習技術的主流[47,69]。如[36,38]所介紹的,深度元學習旨在提取元知識,以實現深度神經網絡的快速學習,這對目前流行的深度學習范式帶來了增強。2017年以來,深度元學習在推薦系統研究界受到關注。**在訓練傳統的深度推薦模型時,首先應用先進的元學習技術來緩解數據不足(即冷啟動問題)。例如,最成功的基于優化的元學習框架MAML,以神經網絡參數初始化的形式學習元知識,首先在冷啟動推薦場景[47]中表現出極大的有效性。此外,在元學習模式下還研究了點擊率預測[69]、在線推薦[123]、順序推薦[125]等多種推薦場景,以提高在數據不足和計算效率低下的情況下的學習能力。

在本文中,我們對快速增長的基于深度元學習的推薦系統的研究進行了及時和全面的綜述。在我們的研究中,雖然已經有一些關于元學習或深度元學習的研究綜述了通用元學習方法及其應用的細節[36,38,98],但對推薦系統的最新進展仍然缺乏關注。此外,在其他應用領域也有一些關于元學習方法的綜述,如自然語言處理[48,117],多模態[61]和圖像分割[60]。然而,目前還沒有關于深度元學習在推薦系統中的研究。與他們相比,我們的綜述是填補這一空白的第一次嘗試,系統地回顧了元學習和推薦系統相結合的最新論文。在我們的綜述中,我們的目的是全面回顧基于深度元學習的推薦系統的文獻,這將有助于讀者和研究人員對這一主題的全面理解。為了仔細定位該領域的工作,我們提供了一個從三個角度的分類,包括推薦場景、元學習技術和元知識表示。此外,我們還根據推薦場景討論了相關的方法,并介紹了不同的作品如何利用元學習技術提取特定的元知識,包括參數初始化、參數調制、超參數優化等多種形式。我們希望我們的分類可以為開發新的基于深度元學習的推薦方法提供設計空間。此外,我們還總結了構建元學習任務的常見方法,這是構建元學習范式的必要條件。 本次綜述的結構安排如下。在第2節中,我們介紹了元學習技術的共同基礎和典型的推薦場景,其中元學習方法已被研究,以緩解數據不足和計算效率低下。在第3節中,我們將介紹由三個獨立軸組成的分類法。在第4節中,我們總結了文獻中使用的元學習推薦任務構建的不同方法。然后,我們在第5節詳細闡述了在不同推薦場景下使用元學習技術的現有方法的方法論細節。最后,我們在第6部分討論了該領域未來的研究方向,并在第7部分總結了這一綜述。

基于深度元學習的推薦系統分類

在本節中,我們建立了基于深度元學習的推薦系統的分類,并根據分類總結了現有方法的特點。通常,我們根據三個獨立的軸來定義分類,包括推薦場景、元學習技術和元知識表示。圖1顯示了分類法。之前[38,98]對一般元學習方法的分類更多關注2.1節介紹的三種元學習框架,但對元學習技術的實際應用關注有限。此外,[36]提出了一個新的分類法,涉及元表示、元優化器和元目標三個方面。他們提供了一個更全面的分類,可以引導新的元學習方法的發展。但是,它側重于整個元學習領域,不適合反映基于深度元學習的推薦系統的研究現狀和應用場景。

付費5元查看完整內容

摘要

推薦系統已經被廣泛應用于不同的現實生活場景,幫助我們找到有用的信息。近年來,基于強化學習(RL)的推薦系統已經成為一個新興的研究課題。由于其交互性和自主學習能力,它常常超過傳統的推薦模型,甚至是最基于深度學習的方法。然而,在推薦系統中應用RL還面臨著各種挑戰。為此,我們首先對五種典型推薦場景的RL方法進行了全面的概述、比較和總結,以下是三個主要的RL類別: 價值函數、策略搜索和演員-評論員(Actor-Critic)。然后,在現有文獻的基礎上,系統分析了面臨的挑戰和相應的解決方案。最后,通過對RL研究中存在的問題和局限性的討論,指出了該領域潛在的研究方向。

//arxiv.org/abs/2109.10665

引言

個性化推薦系統能夠提供符合用戶喜好的有趣信息,從而有助于緩解信息過載問題。在過去的二十年中,人們對推薦系統進行了廣泛的研究,開發了許多推薦方法。這些方法通常根據用戶的喜好、商品特征和用戶與商品的交互來進行個性化的推薦。一些推薦方法還利用其他附加信息,如用戶之間的社會關系(例如,社會推薦)、時間數據(例如,順序推薦)和位置感知信息(例如,POI(“興趣點”的縮寫)推薦。

推薦技術通常利用各種信息為用戶提供潛在的項目。在現實場景中,推薦系統根據用戶與商品的交互歷史進行商品推薦,然后接收用戶反饋進行進一步推薦。也就是說,推薦系統的目的是通過交互獲取用戶的偏好,并推薦用戶可能感興趣的項目。為此,早期的推薦研究主要集中在開發基于內容和基于協同過濾的方法[2],[3]。矩陣分解是傳統推薦方法中最具代表性的方法之一。近年來,由于深度學習的快速發展,各種神經推薦方法被開發出來[4]。然而,現有的推薦方法往往忽略了用戶與推薦模型之間的交互。它們不能有效地捕捉到用戶的及時反饋來更新推薦模型,往往導致推薦結果不理想。

一般來說,推薦任務可以建模為這樣一個交互過程——用戶被推薦一個商品,然后為推薦模型提供反饋(例如,跳過、點擊或購買)。在下一次交互中,推薦模型從用戶的顯式/隱式反饋中學習,并向用戶推薦一個新項目。從用戶的角度來看,高效的交互意味著幫助用戶盡快找到準確的商品。從模型的角度看,有必要在推薦的多輪中平衡新穎性、相關性和多樣性。交互式推薦方法已成功應用于現實世界的推薦任務中。然而,該方法經常遇到一些問題,如冷啟動[5]和數據稀疏[6],以及挑戰,如可解釋性[7]和安全性[8]。

作為一個機器學習領域,強化學習(RL)專注于智能代理如何與環境交互,提供了潛在的解決方案來模擬用戶和代理之間的交互。最近RL的成功推動了人工智能[9],[10]的研究。特別是,深度強化學習(DRL)[11]具有強大的表示學習和函數逼近特性,可以解決人工智能的挑戰。它已被應用于各個領域,如游戲[12],機器人[13],網絡[14]。近年來,應用RL解決推薦問題已成為推薦研究的一個新趨勢。具體來說,RL使推薦代理能夠不斷地與環境(例如,用戶和/或記錄的數據)交互,以學習最佳推薦策略。在實踐中,基于RL的推薦系統已經被應用到許多特定的場景中,如電子商務[18]、電子學習[19]、電影推薦[20]、音樂推薦[21]、新聞推薦[22]、工作技能推薦[23]、醫療保健[24]、能量優化[25]等。

為促進基于RL的推薦系統的研究,本文總結了現有的推薦問題的相關解決方案,系統分析了在推薦方法中應用RL所面臨的挑戰,并探討了未來潛在的研究方向。本文從理論研究的角度,回顧了已有的研究工作,包括環境構建、先驗知識、獎勵函數定義、學習偏差和任務構建。環境建設可以緩解勘探開發的取舍。先驗知識和獎勵定義是進行推薦決策的關鍵。此外,任務結構化可以很好地解決維度的詛咒。從應用的角度,我們還提供了基于RL的推薦系統的全面調研,分別遵循價值函數、策略搜索和演員評論。值得注意[26]的是還提供了對基于RL和drl的推薦算法的回顧,并在推薦列表、架構、可解釋性和評估方面提出了幾個研究方向。[27]主要從基于模型的方法和無模型的算法兩方面對基于drl的推薦系統進行了概述,并重點介紹了基于drl的推薦中一些有待解決的問題和新興的課題。與[26]和[27]不同的是,我們根據其他分類算法(即價值函數、策略搜索和角色-評論)概述了現有的(D)RL推薦方法,并分析了在推薦系統中應用(D)RL的挑戰。

本工作的主要貢獻如下:

  • 我們全面回顧了為五種典型推薦方案開發的RL方法。對于每個推薦場景,我們提供了有代表性的模型的詳細描述,總結了文獻中使用的具體RL算法,并進行了必要的比較。

  • 我們系統地分析了在推薦系統中應用RL所面臨的挑戰,包括環境構建、先驗知識、獎勵函數定義、學習偏差和任務構建。

  • 我們還討論了RL的開放問題,分析了該領域的實際挑戰,并提出了未來可能的研究和應用方向。

本文的其余部分結構如下。第2節介紹了RL的背景,定義了相關的概念,列出了常用的方法。第三節給出了基于rl的推薦方法的標準定義。第4節全面回顧了為推薦系統開發的RL算法。第五部分討論了在推薦系統中應用RL所面臨的挑戰和相應的解決方案。接下來,第6節討論了基于rl的推薦系統的各種限制和潛在的研究方向。最后,第7節總結了本研究。

付費5元查看完整內容
北京阿比特科技有限公司