序列推薦的目標是通過歷史交互來模擬用戶的動態行為。現有的方法依賴于明確的商品 ID 或者通用的文本特征進行序列模型的理解用戶喜好。然而,這些方法仍然難以處理冷啟動商品,或將知識遷移到新的數據集上。在這篇文章中,我們提出將用戶偏好和商品特征建模為可以泛化到新商品和數據集的語言表示。為此,我們提出了一個新穎的框架,名為 Recformer,該框架可以有效地學習用于序列推薦的語言表示**。具體來說,我們提出將一個項目視為一個由文本描述的項目鍵值屬性展開的“句子”(詞序列),這樣用戶的一個項目序列就變成了一個句子序列**。對于推薦,Recformer被訓練來理解“句子”序列并檢索下一個“句子”。為了編碼項目序列,我們設計了一個類似于Longformer的雙向Transformer模型,但在序列推薦中使用了不同的嵌入層。為了有效的表示學習,我們提出了新穎的預訓練和微調方法,這些方法結合了語言理解和推薦任務。因此,Recformer可以有效地根據語言表示推薦下一個項目。在六個數據集上進行的廣泛實驗表明了Recformer在序列推薦,特別是在資源少和冷啟動設置中的有效性。
//www.zhuanzhi.ai/paper/9ecf508f540f4b92f1a6bf26189acaa6
圖神經網絡(GNNs)已被證明是有前途的解決方案的協同過濾(CF)與用戶項交互圖建模。現有的基于GNN的推薦系統的關鍵思路是遞歸地執行沿用戶-項目交互邊緣傳遞的消息,以細化編碼的嵌入。盡管他們的有效性,但是,目前大多數的推薦模型依賴于足夠的和高質量的訓練數據,這樣學習的表示可以很好地捕捉準確的用戶偏好。在許多實際的推薦場景中,用戶行為數據往往是有噪聲的,并且呈現出偏態分布,這可能導致基于GNN的模型的表現性能欠佳。在本文中,我們提出了一種新的自監督超圖transformer 框架(SHT),它通過明確地探索全局協作關系來增強用戶表示。具體來說,我們首先賦予圖神經CF范式以超圖transformer 網絡來維持用戶和物品之間的全局協同效果。在提取全局上下文的基礎上,提出了一種跨視圖生成式自監督學習組件,用于用戶-物品交互圖上的數據增強,以增強推薦系統的魯棒性。大量實驗表明,SHT可以顯著提高各種最先進的基線性能。進一步的消融研究表明,我們的SHT推薦框架在緩解數據稀疏性和噪聲問題方面具有卓越的表達能力。源代碼和評估數據集可以在//github.com/akaxlh/SHT上找到。
學習動態用戶偏好已經成為許多在線平臺(如視頻分享網站、電子商務系統)進行序列推薦的一個越來越重要的組成部分。以前的工作已經做出了許多努力,基于各種架構,如循環神經網絡和自注意力機制,在用戶交互序列上建模物品-物品的轉換。最近出現的圖神經網絡也可以作為有用的骨干模型來捕獲序列推薦場景中的條目依賴關系。盡管它們很有效,但現有的方法一直專注于具有單一交互類型的商品序列表示,因此局限于捕捉用戶和商品之間的動態異構關系結構(例如,頁面視圖、添加到收藏、購買)。為了應對這一挑戰,我們設計了一個多行為超圖增強的Transformer框架(MBHT),以捕獲短期和長期的跨類型行為依賴關系。具體地說,一個多尺度的Transformer配備了低級別的自注意力,以便從細粒度和粗粒度級別聯合編碼行為感知的序列模式。此外,我們將全局多行為依賴關系納入超圖神經體系結構,以自定義的方式捕獲分層的長期項目相關性。實驗結果表明,在不同的設置下,我們的MBHT優于各種最先進的推薦解決方案。進一步的消融研究驗證了我們模型設計的有效性和新的MBHT框架的好處。我們的實現代碼發布在://github.com/yuh-yang/MBHT-KDD22。
論文概述:方面級情感分類(ALSC)旨在識別句子中特定方面詞的情感極性。ALSC是方面級情感分析中一個最實際的設定,因為它不需要昂貴的意見詞標注信息,但同時它也喪失了對于情感分類結果的可解釋性。為了解決這個問題,最近的工作通過微調預訓練Transformer編碼器來抽取以方面詞為中心的依存樹來定位意見詞。然而,這樣推導出來的意見詞只能提供一種直觀的線索,遠遠無法達到人類級別的可解釋性。除此之外,預訓練編碼器傾向于內化方面詞的內在屬性,會造成情感偏見問題,從而影響模型的性能。
在本文中,我們提出了一種span-based反情感偏見的方面詞表示學習框架(SARL)。首先,它首先利用方面詞的先驗情感進行對抗學習來消除方面詞嵌入表示中的情感偏見。隨后,它通過span-based依賴關系建模來將意見詞和與其對應的經過蒸餾學習得到的候選意見詞進行對齊,實現了無監督意見詞抽取,并為ALSC提供可解釋性。本文中提出的方法在5個數據集上實現了領先的性能,且具備無監督意見詞抽取的能力,能夠有效的解決方面級情感分類問題,并為分類結果提供可解釋性。
在許多數據科學應用中,如推薦系統、在線廣告、醫療等,對表格數據進行預測是一項重要的任務。表格數據被結構成行和列,每一行作為數據樣本,每一列作為特性屬性。表格數據的列和行都帶有可以提高模型預測性能的有用模式。然而,大多數現有模型關注的是跨列模式,而忽略了跨行模式,因為它們獨立處理單個樣本。在這項工作中,我們提出了一個通用的學習框架,名為檢索與交互機(RIM),它充分利用表格數據中的橫行和橫列模式。具體來說,RIM首先利用搜索引擎技術高效地檢索表中有用的行來輔助目標行標簽預測,然后利用特征交互網絡捕捉目標行與被檢索行之間的跨列模式,從而做出最終的標簽預測。我們對三個重要任務的11個數據集進行了廣泛的實驗,即CTR預測(分類)、top-n推薦(排名)和評分預測(回歸)。實驗結果表明,RIM在不同的基準上取得了顯著的改進,證明了RIM的優越性和有效性。
序列推薦的目的是利用用戶的歷史行為來預測他們的下一次互動。現有的工作還沒有解決序列推薦的兩個主要挑戰。首先,在豐富的歷史序列中,用戶行為往往是隱式的、有噪聲的偏好信號,不能充分反映用戶的實際偏好。此外,用戶的動態偏好往往會隨著時間的推移而迅速變化,因此很難在其歷史序列中捕獲用戶模式。在本研究中,我們提出一種稱為SURGE的圖神經網絡模型(即序列推薦圖神經網絡)來解決這兩個問題。具體來說,SURGE通過基于度量學習將松散的項目序列重構為緊密的項目興趣圖,將不同類型的長期用戶行為偏好集成到圖中的簇中。通過在興趣圖中形成密集的集群,這有助于明確區分用戶的核心興趣。然后,我們在構建的圖上執行集群感知和查詢感知的圖卷積傳播和圖池化。它從嘈雜的用戶行為序列中動態融合并提取用戶當前激活的核心興趣。我們在公共和專有的工業數據集上進行了廣泛的實驗。實驗結果表明,與現有方法相比,我們提出的方法有顯著的性能提高。對序列長度的進一步研究表明,該方法能夠有效地對較長的行為序列進行建模。
序列推薦作為一個新興的課題,由于其重要的現實意義而受到越來越多的關注。基于深度學習和注意力機制的模型在序列推薦中取得了良好的性能。近年來,基于變分自編碼器(VAE)的生成模型在協同過濾方面顯示出了獨特的優勢。特別是,序列貫VAE模型作為遞歸版本,可以有效地捕捉用戶序列中項目之間的時間依賴性,并進行序列推薦。然而,基于VAE的模型有一個共同的局限性,即獲得的近似后驗分布的表征能力有限,導致生成的樣本質量較低。對于生成序列來說尤其如此。為了解決上述問題,本文提出了一種基于對抗與對比的變分自編碼器(ACVAE)的序列推薦算法。具體來說,我們首先在對抗變分貝葉斯(AVB)框架下引入對抗訓練序列生成,從而使我們的模型產生高質量的潛在變量。然后,我們使用對比損失。潛在變量將能夠通過最大限度地減少對比損失來學習更個性化和突出的特征。此外,在對序列進行編碼時,我們使用一個遞歸和卷積結構來捕獲序列中的全局和局部關系。最后,我們在四個真實世界的數據集上進行了大量的實驗。實驗結果表明,我們提出的ACVAE模型優于其他先進的方法。
近年來,許多在線平臺(如亞馬遜和淘寶網)都取得了巨大成功。在線平臺上的用戶行為是動態變化的,且會隨著時間而發展。序列推薦的主要目標就是從用戶歷史行為中捕捉關鍵的信息,并基于此準確表征用戶興趣進而提供高質量的推薦[1,2,3]。已有研究人員基于深度學習提出很多序列推薦的模型,此外還有研究人員結合豐富的上下文信息(如商品屬性)一起進行用戶興趣建模,實驗表明,上下文信息對于提高推薦效果很重要。
盡管現有方法在一定程度上已被證明有效,但它們有兩個可能會影響推薦效果的缺陷。首先,他們主要依靠“下一個物品推薦”(Next Item Prediction)損失函數來學習整個模型。在使用上下文信息時,也仍然只使用這一個優化目標。已有研究表明,這種優化方法很容易受到數據稀疏性等問題的影響。此外,它們過分強調最終的推薦性能,而上下文數據和序列數據之間的關聯或融合卻沒有在數據表示中被很好地捕獲。多個領域的實驗結果表明[4,5,6],更有效的數據表示方法(例如,預先訓練的上下文信息嵌入)已成為改善現有模型或體系結構性能的關鍵因素。因此,有必要重新考慮學習范式并開發更有效的序列推薦系統。
為了解決上述問題,我們借鑒了自監督學習的思想來改進序列推薦的方法。自監督學習是一個新興的學習范式,旨在讓模型從原始數據的內在結構中學習。自監督學習的一般框架是首先從原始數據中構建新的監督信號,然后通過這些額外設計的優化目標來對模型進行預訓練。如之前討論的,有限的監督信號和低效的數據表示是現有的神經序列推薦方法的兩個主要問題。幸運的是,自監督學習似乎為解決這兩個問題提供了解決方案:它通過內在數據相關性來設計輔助訓練目標以提供豐富的自監督信號,并通過預訓練的方法增強數據表示。對于序列推薦,上下文信息以不同的形式存在,包括物品,屬性,子序列和序列。開發統一表征這種數據相關性的方法并不容易。對于這個問題,我們借鑒最近提出的互信息最大化(Mutual Information Maximization, MIM)方法,其已被證明可以有效捕獲原始輸入的不同視圖(或部分)之間的相關性。
基于以上,我們提出了一種基于自監督學習方法的序列推薦模型(Self-Supervised Learning Sequential Recommendation, S3-Rec)。基于自注意力機制的體系結構[3],我們首先使用設計的自監督訓練目標對模型進行預訓練,然后根據推薦任務對模型進行微調。此工作的主要新穎之處在預訓練階段,我們基于MIM的統一形式精心設計了四個自監督的優化目標,分別用于捕獲物品-屬性間,序列-物品間,序列-屬性間和序列-子序列間的相關性。因此,S3-Rec能夠以統一的方式來表征不同粒度級別或不同形式數據之間的相關性,并且也可以靈活地適應新的數據類型或關聯模式。通過這樣的預訓練方法,我們可以有效地融合各種上下文數據,并學習屬性感知的上下文化的數據表示。最后,將學習到的表示輸入推薦模型,并根據推薦任務對其進行優化。
為了驗證S3-Rec的有效性,我們在6個不同領域的真實數據集上進行了充分的實驗。實驗結果表明,S3-Rec超過了目前的SOTA,并且在訓練數據非常有限的情況表現得尤為明顯。另外S3-Rec還可以有效得適應其他類別的神經體系結構,例如GRU[1]和CNN[2]。我們的主要貢獻概括如下:(1)據我們所知,這是首次采用MIM進行自監督學習來改善序列推薦任務的工作;(2)我們提出了4個自監督優化目標來最大化不同形式或粒度的上下文信息的互信息;(3)在6個數據集上的充分實驗證明了我們方法的有效性。
在各種在線應用中,推薦系統在解決信息爆炸問題、增強用戶體驗方面顯示出了巨大的潛力。為了解決推薦系統中的數據稀疏性和冷啟動問題,研究人員提出了基于知識圖譜的推薦,利用有價值的外部知識作為輔助信息。然而,這些研究大多忽略了多模態知識圖譜(MMKGs)中數據類型的多樣性(如文本和圖像)。為了更好地利用多模態知識,提出了一種多模態知識圖譜注意力網絡(MKGAT)。具體地說,我們提出了一種多模態圖注意力技術,在MMKGs上進行信息傳播,然后使用所得到的聚合嵌入表示進行推薦。據我們所知,這是第一個將多模態知識圖譜引入推薦系統的工作。我們在來自不同領域的兩個真實數據集上進行了大量的實驗,實驗結果表明我們的模型MKGAT能夠成功地應用MMKGs來提高推薦系統的質量。
元學習的研究越來越受到學者們的重視,從最初在圖像領域的研究逐漸拓展到其他領域,目前推薦系統領域也出現了相關的研究問題,本文介紹了5篇基于元學習的推薦系統相關論文,包括用戶冷啟動推薦、項目冷啟動推薦等。
本文提出了一種新的推薦系統,解決了基于少量樣本物品來估計用戶偏好的冷啟動問題。為了確定用戶在冷啟動狀態下的偏好,現有的推薦系統,如Netflix,在啟動初向用戶提供物品選擇,我們稱這些物品為候選集。然后根據用戶選擇的物品做出推薦。以往的推薦研究有兩個局限性:(1) 只有少量物品交互行為的用戶推薦效果不佳,(2) 候選集合不足,無法識別用戶偏好。為了克服這兩個限制,我們提出了一種基于元學習的推薦系統MeLU。從元學習中,MeLU可以通過幾個例子快速地應用于新任務,通過幾個消費物品來估計新用戶的偏好。此外,我們提供了一個候選集合選擇策略,以確定自定義偏好估計的區分項目。我們用兩個基準數據集對MeLU進行了驗證,與兩個對比模型相比,該模型的平均絕對誤差至少降低了5.92%。我們還進行了用戶研究實驗來驗證選擇策略的有效性。
Meta-Learning for User Cold-Start Recommendation 冷啟動問題是對實際推薦系統的長期挑戰。大多數現有的推薦算法依賴于大量的觀測數據,對于很少交互的推薦場景來說是脆弱的。本文用少樣本學習和元學習來解決這些問題。我們的方法是基于這樣一種見解,即從幾個例子中有一個很好的泛化,依賴于一個通用的模型初始化和一個有效的策略來使這個模型適應新出現的任務。為了實現這一點,我們將場景指定的學習與模型無關的序列元學習結合起來,并將它們統一到一個集成的端到端框架中,即場景指定的序列元學習者(或s^2 Meta)。我們的元學習器通過聚合來自各種預測任務的上下文信息來生成一個通用的初始模型,同時通過利用學習到的知識來有效地適應特定的任務。在各種現實世界數據集上的實驗表明,我們提出的模型可以在在線推薦任務中獲得對冷啟動問題的最好效果。
Sequential Scenario-Specific Meta Learner for Online Recommendation
冷啟動問題是對實際推薦系統的長期挑戰。大多數現有的推薦算法依賴于大量的觀測數據,對于很少交互的推薦場景來說是脆弱的。本文用少樣本學習和元學習來解決這些問題。我們的方法是基于這樣一種見解,即從幾個例子中有一個很好的泛化,依賴于一個通用的模型初始化和一個有效的策略來使這個模型適應新出現的任務。為了實現這一點,我們將場景指定的學習與模型無關的序列元學習結合起來,并將它們統一到一個集成的端到端框架中,即場景指定的序列元學習者(或s^2 Meta)。我們的元學習器通過聚合來自各種預測任務的上下文信息來生成一個通用的初始模型,同時通過利用學習到的知識來有效地適應特定的任務。在各種現實世界數據集上的實驗表明,我們提出的模型可以在在線推薦任務中獲得對冷啟動問題的最好效果。
A Meta-Learning Perspective on Cold-Start Recommendations for Items 矩陣分解(M F)是最流行的項目(item)推薦技術之一,但目前存在嚴重的冷啟動問題。項目冷啟動問題在一些持續輸出項目的平臺中顯得特別尖銳(比如Tweet推薦)。在本文中,我們提出了一種元學習策略,以解決新項目不斷產生時的項目冷啟動問題。我們提出了兩種深度神經網絡體系結構,實現了我們的元學習策略。第一個體系結構學習線性分類器,其權重由項目歷史決定,而第二個體系結構學習一個神經網絡。我們評估了我們在Tweet推薦的現實問題上的效果,實驗證明了我們提出的算法大大超過了MF基線方法。
One-at-a-time: A Meta-Learning Recommender-System for Recommendation-Algorithm Selection on Micro Level
推薦算法的有效性通常用評價指標來評估,如均方根誤差、F1或點擊率CTR,在整個數據集上計算。最好的算法通常是基于這些總體度量來選擇的,然而,對于所有用戶、項目和上下文來說并沒有一個單獨的最佳算法。因此,基于總體評價結果選擇單一算法并不是最優的。在本文中,我們提出了一種基于元學習的推薦方法,其目的是為每個用戶-項目對選擇最佳算法。我們使用MovieLens 100K和1m數據集來評估我們的方法。我們的方法(RMSE,100K:0.973;1M:0.908)沒有優于單個的最佳算法SVD++(RMSE,100k:0.942;1M:0.887)。我們還探索了元學習者之間的區別,他們在每個實例(微級別),每個數據子集(中級)和每個數據集(全局級別)上進行操作。評估表明,與使用的總體最佳算法相比,一個假設完美的微級元學習器將提高RMSE 25.5%。