個性化搜索的關鍵是基于歷史行為構建用戶畫像。針對缺乏歷史數據的用戶,基于組的個性化模型被提出,這些方法在對結果重排時,將相似用戶的畫像考慮在內。然而,現有的尋找相似的用戶的方法大多簡單地基于搜索行為中詞匯或主題的相似性。本文提出了一種基于神經網絡的增強方法,在語義空間中突出相似用戶的作用。此外,我們認為,當用戶只包含有限的歷史行為時,基于行為的相似用戶仍然不足以幫助用戶理解新的查詢。為了解決這個問題,我們將朋友網絡引入個性化搜索中,以另一種方式確定用戶之間的親密度關系。由于朋友關系往往是基于相似的背景或興趣而形成的,所以在朋友網絡中自然隱藏著大量個性化的信息。在搜索行為和朋友關系的融合下,相似用戶在基于組的個性化搜索中更為可靠地得到了強化。具體來說,我們分別針對用戶的搜索行為和朋友關系將其劃分到多個朋友圈。這兩種朋友圈是互補的,從而構建一個更全面的群體畫像來實現搜索結果個性化。實驗結果表明,與現有個性化模型相比,本文提出的模型有了顯著的提升。
//playbigdata.ruc.edu.cn/dou/publication/2021_SIGIR_FriendGraph.pdf
近年來,人們致力于提高推薦系統的準確性和相關性。多樣性是衡量所推薦項目之間差異的一個關鍵因素,但很少受到仔細研究。與用戶滿意度直接相關的是,在生成候選條目后,多樣化通常被考慮在內。然而,這種多樣化和候選生成的解耦設計使得整個系統處于次優狀態。在本文中,我們的目標是利用圖卷積網絡(GCN)將多元化推至上游候選生成階段。盡管基于GCN的推薦算法在建模復雜的協同過濾效果以提高推薦的準確性方面表現出了巨大的能力,但在這些先進的工作中,多樣性變化是如何被忽略的。我們提出在GCN的基礎上執行重新平衡的鄰居發現、類別增強的負采樣和對抗學習。我們在真實世界的數據集上進行大量的實驗。實驗結果驗證了本文方法的有效性。進一步的消融研究驗證了我們提出的方法顯著緩解了準確性-多樣性的困境。
//fi.ee.tsinghua.edu.cn/public/publications/b344fd48-92b0-11eb-96bc-0242ac120003.pdf
在推薦系統中,當用戶-物品交互數據稀疏時,常用社會關系來提高推薦質量。大多數現有的社交推薦模型都是利用成對關系來挖掘潛在的用戶偏好。然而,現實生活中用戶之間的互動非常復雜,用戶關系可以是高階的。超圖提供了一種自然的方式來建模復雜的高階關系,而它在改善社會推薦方面的潛力還有待開發。在本文中,我們填補了這一空白,提出了一種利用高階用戶關系增強社交推薦的多通道超圖卷積網絡。技術上,網絡中的每個通道通過超圖卷積編碼一個描述常見高階用戶關系模式的超圖。通過聚合通過多種渠道學習到的嵌入,我們獲得了全面的用戶表示,從而產生推薦結果。然而,聚合操作也可能掩蓋不同類型高階連接信息的固有特征。為了彌補累積損失,我們創新性地將自監督學習融入到超圖卷積網絡的訓練中,以獲取具有層次互信息最大化的連通信息。在多個真實數據集上的實驗結果表明,該模型優于SOTA方法,消融研究驗證了多通道設置和自監督任務的有效性。我們的模型的實現可以通過//github.com/Coder-Yu/RecQ獲得。
隨著新聞文章的信息爆炸,個性化的新聞推薦因為能夠讓用戶快速找到自己感興趣的文章,已經越來越受到業界和學術界的關注。現有的新聞推薦方法主要包括基于用戶-新聞直接交互的協同過濾方法和基于用戶歷史閱讀內容特征的基于內容的方法。雖然這些方法取得了良好的性能,但由于大多數方法無法廣泛利用新聞推薦系統中的高階結構信息(例如U-D-T-D-U隱含相似的用戶傾向于閱讀相似的新聞文章信息),存在數據稀疏問題。在本文中,我們提出構建一個異質圖來明確地建模用戶、新聞和潛在主題之間的交互。附加的主題信息將有助于捕捉用戶的興趣,并緩解用戶-新聞交互的稀疏性問題。然后我們設計一個新穎的異質圖神經網絡學習用戶和新聞表示,通過在圖上傳播特征表示來編碼高階結構信息。通過異質圖完整的用戶點擊歷史學習到的用戶嵌入能夠捕獲用戶的長期興趣。此外,我們還設計了融合注意力的LSTM模型使用最近的閱讀歷史來建模用戶最近的短期興趣。
人們對開發個性化的任務導向對話系統(TDSs)越來越感興趣。以前關于個性化TDSs的工作通常假設大多數甚至所有用戶都可以使用完整的用戶檔案。這是不現實的,因為(1)不是每個人都愿意暴露他們的個人資料,出于隱私的考慮;(2)豐富的用戶簡介可能涉及大量的屬性(例如,性別、年齡、品味……)。在本文中,我們在不假設用戶檔案是完整的情況下研究個性化的TDSs。我們提出了一種合作記憶網絡(CoMemNN),該網絡具有一種新穎的機制,可以隨著對話進程逐步豐富用戶特征,同時在豐富的用戶特征基礎上改進響應選擇。CoMemNN由兩個核心模塊組成:用戶檔案文件豐富(UPE)和對話響應選擇(DRS)。前者通過利用來自鄰居用戶和當前對話的協作信息來豐富不完整的用戶檔案文件。后者使用豐富的檔案文件來更新當前用戶查詢,以便編碼更有用的信息,并根據這些信息選擇對用戶請求的個性化響應。我們在個性化的bAbI對話基準數據集上進行了大量的實驗。我們發現,CoMemNN能夠有效地豐富用戶檔案文件,與最先進的方法相比,響應選擇的準確性提高了3.06%。通過隨機丟棄用戶檔案文件中的屬性值,我們還測試了CoMemNN對用戶檔案文件不完整的魯棒性。即使在丟棄50%的屬性值時,CoMemNN也能夠在不丟棄用戶檔案文件的情況下匹配最佳性能基線的性能,顯示了CoMemNN的魯棒性。
//www.zhuanzhi.ai/paper/faae0f0909170af3a86309c373b23210
在商品推薦場景中,早先的方法通過建模序列交互的演化來刻畫用戶興趣。這些方法在建模復雜動態性方面具有局限性,忽視了長期行為習慣對短期興趣的影響;忽視了用戶和商品之間交互行為的類型,只考慮單一的、短期的交互行為。在本文中,我們將復雜異質的動態交互行為構建為時序異質交互圖(Temporal Heterogeneous Interaction Graph, 簡稱為THIG)進而同時學習用戶興趣和商品表示用于商品推薦。本文提出了一種時序異質圖上的表示學習方法,稱之為THIGE,充分建模交互行為的異質性,刻畫不同類型的興趣偏好,并融合長、短期興趣構建用戶、商品表示。最后,在3個真實數據集上驗證模型的有效性。
搜索結果多樣化的目標是使得檢索得到的結果能夠盡量覆蓋用戶提出問題的所有子話題。已有的多樣化排序方法通常基于貪心選擇(Greedy Selection)過程,獨立地將每一個候選文檔與已選中的文檔序列進行比較,選擇每一個排序位置的最佳文檔,生成最后的文檔排序。而相關研究證明由于各候選文檔的邊際信息收益并非彼此獨立,貪心選擇得到的各個局部最優解將難以導向全局最佳排序。本文介紹了一種基于自注意力網絡(Self-Attention Network)的方法,可以同步地衡量全體候選文檔間的關系,以及候選文檔對不同用戶意圖的覆蓋程度,有效地克服原有方法受限于貪心選擇過程的局限性,并在TRECWebTrack09-12數據集上獲得更好的性能。
//dl.acm.org/doi/abs/10.1145/3340531.3411914
會話搜索的任務主要是使用交互數據來提高用戶在會話級別上的下一個查詢的相關性。在本文中,我們將會話搜索作為一個個性化任務,在學習排序的框架下進行。個性化方法重新排列結果以匹配用戶模型。這種用戶模型通常是根據用戶的瀏覽行為隨著時間的推移而積累起來的。我們使用一套預先計算的、透明的基于社會科學文獻概念的用戶模型。交互數據用于將每個會話映射到這些用戶模型。然后根據這些模型和sessions的交互數據來估計新特性。從TREC會話軌跡的測試收集上進行的廣泛實驗顯示,在統計上比當前會話搜索算法有顯著的改進。
//www.zhuanzhi.ai/paper/3cd6afe65db82a0f6e0fa3a45d1fda73