位置偏差是信息檢索中處理隱式但有偏差的用戶反饋數據的關鍵問題。無偏排序方法通常依賴于因果關系模型,并通過反傾向加權消除用戶反饋的偏差。這些方法雖然實用,但仍存在兩個主要問題。首先,在推斷用戶單擊時,上下文信息(如已檢查的文檔)的影響常常被忽略。第二,只考慮了位置偏差,忽略了用戶瀏覽行為引起的其他問題。在本文中,我們提出了一個端到端的深度遞歸生存排序(DRSR),一個統一的框架來聯合建模用戶的各種行為,以 (i)考慮排序列表中豐富的上下文信息; (ii)解決隱藏在用戶行為背后的問題,即,在沒有任何點擊的查詢中挖掘觀察模式(非點擊查詢),對不能真實反映用戶瀏覽意圖的跟蹤日志進行建模(不可信觀察)。具體來說,我們采用遞歸神經網絡來建模上下文信息,并估計用戶在每個位置反饋的條件似然。然后,我們將生存分析技術與概率鏈式法則相結合,以數學方式恢復一個用戶的各種行為的無偏聯合概率。DRSR可以很容易地與點和成對的學習目標結合起來。對兩個大型工業數據集的大量實驗表明,我們的模型與最先進的技術相比,具有顯著的性能增益。
主題: Jointly Modeling Aspect and Sentiment with Dynamic Heterogeneous Graph Neural Networks
摘要: 基于目標的情感分析(TBSA)旨在檢測意見方面(方面提取)和針對他們的情感極性(情感檢測)。先前的管道和集成方法都無法精確地建模這兩個目標之間的固有聯系。在本文中,我們提出了一種新穎的動態異構圖,以顯式方式對兩個目標進行聯合建模。普通單詞和情感標簽都被視為異質圖中的節點,以便方面單詞可以與情感信息進行交互。該圖使用多種類型的依賴項進行初始化,并在實時預測期間進行動態修改。在基準數據集上進行的實驗表明,我們的模型優于最新模型。進一步的分析表明,在多意見方面和無意見方面的情況下,我們的模型在具有挑戰性的實例上均獲得了顯著的性能提升。
主題: Deep Learning on Knowledge Graph for Recommender System: A Survey
摘要: 最近的研究表明,知識圖譜(KG)在提供有價值的外部知識以改進推薦系統(RS)方面是有效的。知識圖譜能夠編碼連接兩個對象和一個或多個相關屬性的高階關系。借助于新興的GNN,可以從KG中提取對象特征和關系,這是成功推薦的一個重要因素。本文對基于GNN的知識感知深度推薦系統進行了綜述。具體來說,我們討論了最新的框架,重點是它們的核心組件,即圖嵌入模塊,以及它們如何解決實際的推薦問題,如可伸縮性、冷啟動等。我們進一步總結了常用的基準數據集、評估指標以及開源代碼。最后,我們對調查結果進行了總結,并提出了這一快速發展領域的潛在研究方向。
表情生動、引人入勝的表情包在網絡短信應用中越來越受歡迎,一些作品致力于通過將表情包的文本標簽與之前的話語進行匹配,自動選擇表情包響應。然而,由于數量龐大,要求所有貼紙都有文字標簽是不切實際的。因此,在本文中,我們建議在不使用任何外部標簽的情況下,根據多回合對話框上下文歷史向用戶推薦合適的標簽。這項任務面臨兩大挑戰。一是學習沒有對應文字標簽的貼紙的語義。另一個挑戰是使用多回合對話框上下文聯合建模候選標簽。為了解決這些挑戰,我們提出了一個貼紙響應選擇器(SRS)模型。具體來說,SRS首先使用一個基于卷積的貼紙圖像編碼器和一個基于自我注意力的多回合對話編碼器來獲取貼紙和話語的表示。接下來,我們提出了深度交互網絡,將標簽與對話歷史中的每個話語進行深度匹配。然后SRS通過融合網絡學習所有交互結果之間的短期和長期依賴關系,輸出最終的匹配分數。為了評估我們提出的方法,我們從最流行的在線聊天平臺之一收集了一個帶有貼圖的大型真實世界對話數據集。在該數據集上進行的大量實驗表明,我們的模型在所有常用指標上都達到了最先進的性能。實驗還驗證了SRS各組成部分的有效性。為了便于貼紙選擇領域的進一步研究,我們發布了340K多回合對話框和貼紙對數據集。
論文主要作者來自騰訊QQ看點團隊,團隊在2019-2020期間在相關AI頂會和期刊發表多篇推薦系統領域學術論文,包括會議論文WSDM2019[1],IJCAI2019[2],WWW2020[3]和TOIS與TKDE等期刊論文。
摘要:會話時序(session-basedrecommendation)推薦系統在最近幾年引起了學界廣泛的研究興趣。為了捕獲用戶點擊行為的時序依賴關系,現有的深度學習方法在優化時通常借助用兩種常用增強技術:數據提升或者自左向右的自回歸方式。由于這兩種方法目標在于建模用戶行為的時序特性,在構建預測函數時候,往往忽略了目標交互行為的未來信息。然而,我們認為目標交互行為的未來數據(在模型訓練階段是可以獲取到的)往往也包含了重要的用戶喜好信號,從而可以用來提升模型的推薦質量。
然而恰當的結合未來數據用于模型訓練并不簡單,因為這種方式違反了機器學習的基本原理很容易產生信息泄漏問題。為了解決這個問題,我們提出一種編碼器-解碼器推薦框架,命名為基于空缺填充的推薦器GRec,GRec在訓練編碼器和解碼器時采用填空機制。具體來講,編碼器采用部分完整的用戶會話序列(一部分交互反饋被特意摳除)作為輸入,解碼器專門預測這部分被扣除的交互點擊記錄,建立在不完整的編碼器表征上。考慮推薦模型的效率和準確率因素,本項工作我們采用卷積網絡配合稀疏卷積濾波器來展示GRec這一通用框架。通過在真實的推薦數據集上(包括較短的、中等的和較長的會話序列)做大量的實驗,我們展示了GRec顯著地超過了各種最新的時序推薦系統算法。大量的經驗研究證實了未來數據在GRec框架下十分有效。
題目
修正排序系統中的選擇偏差:Correcting for Selection Bias in Learning-to-rank Systems
類型
推薦系統偏差
關鍵字
推薦系統,學習排名,位置偏差,選擇偏差
簡介
現代推薦系統收集的點擊數據是一個重要的觀測數據來源,可用于訓練學習排名(LTR)系統。然而,這些數據受到許多偏差的影響,這些偏差可能導致LTR系統性能不佳。在這種系統中,最新的偏差校正方法主要集中在位置偏差上,即排名較高的結果(例如,上搜索引擎的結果)更容易被點擊,即使它們不是給出用戶查詢的最相關的結果。很少有人注意到對選擇偏差的糾正,這是因為被選中的文檔首先反映了用戶擁有的文檔。在這里,我們提出了一種新的基于赫克曼兩階段方法的新方法,并對LTR系統中的選擇和位置偏差進行了解釋。通過實例評價表明,與現有的無偏LTR算法相比,所提出的方法對噪聲具有更強的魯棒性和更好的精度,尤其是在沒有位置偏差的情況下。
作者
Zohreh Ovaisi,Ragib Ahsan,伊利諾伊大學芝加哥分校。
Yifan Zhang,中山大學
題目: FEEDBACK RECURRENT AUTOENCODER
摘要: 在這項工作中,我們提出了一種新的遞歸自編碼器架構,稱為反饋遞歸自編碼器(FRAE),用于時序數據的在線壓縮。FRAE的重流結構是為了有效地提取沿時間維的冗余,并允許對學習的數據進行緊湊的離散表示。我們證明了它在語音譜圖壓縮中的有效性。具體來說,我們證明了FRAE與一個強大的神經聲碼器相結合,可以在低的固定比特率下產生高質量的語音波形。我們進一步證明,通過增加一個潛在空間的學習先驗和使用熵編碼器,我們可以實現更低的可變比特率。
論文題目
Sequential Recommendation with Dual Side Neighbor-based Collaborative Relation Modeling
論文摘要
序貫推薦任務的目的是在給定用戶歷史行為的情況下,預測用戶對項目的偏好。用戶行為的有序性意味著行為史中蘊含著豐富的序列模式,揭示了用戶興趣的內在動力。提出了多種序貫推薦方法對動態用戶行為進行建模。然而,大多數模型只考慮用戶自身的行為和動態,而忽略了用戶和項目之間的協作關系,即用戶的相似偏好或項目的相似屬性。如果不建立協作關系模型,這些方法會因為缺乏推薦多樣性而導致性能下降。更糟糕的是,大多數現有的方法只考慮用戶側序列,而忽略項目側的時間動態。針對現有的序貫推薦模型存在的問題,我們提出了一種序貫協同推薦器(SCoRe),它利用跨鄰居關系模型有效地挖掘高階協同信息,同時利用用戶端和項目端的歷史序列更好地捕獲用戶和項目動態。在三個真實世界的大規模數據集上的實驗證明了該模型相對于強基線的優越性。
論文作者
秦嘉瑞,靳仁,方玉辰,張渭南,勇雨,來自上海交通大學,上海微軟亞洲研究院。
推薦系統能夠根據用戶的偏好生成推薦項目的列表,而最終用戶是這些傳統系統中唯一的利益相關者。但是,在幾個應用程序領域(例如電子商務、電影、音樂)可能有多個涉眾。通過平衡不同利益相關者的需求來提出建議是必要的。本教程的第一部分介紹了多涉眾推薦系統(MSRS)的幾個案例研究,并討論了MSRS中相應的方法和挑戰。MSRS中目前的工作之一是基于實用價值的多利益相關者推薦模型,該模型利用多標準評級來構建實用價值函數。但是,在任何領域或應用程序中可能并不總是提供多標準評級或首選項。評論挖掘通常用于從文本或評論中提取用戶偏好。它可能被用來推斷項目不同方面的用戶首選項。本教程的第二部分將介紹和討論神經審查挖掘的建議。電子商務平臺上的評論可以用來解決冷啟動問題并生成解釋。我們之前的教程介紹了對產品和主題模型/分布式表示的基于方面的情感分析,它們彌補了用戶評論和產品描述之間的詞匯差距。本教程第二部分的重點是介紹最近用于檢查文本挖掘的神經方法--包括用于增強產品推薦的實際代碼。每個部分將介紹各種機制(如注意力)和任務(如評論排名)視角下的主題,介紹前沿研究和使用真實數據集在Jupyter筆記上執行的程序的訓練。
Recommendation for Multi-Stakeholders
Through Neural Review Mining
主題: Building Useful Recommender Systems for Tourists
簡介: 推薦系統是信息搜索和過濾工具,應為要使用的項目提供建議。 最先進的推薦系統利用數據挖掘和信息檢索技術來預測商品在多大程度上適合用戶的需求和需求,但是通常它們最終會提出明顯而無趣的建議,尤其是在復雜領域(例如旅游業)。 在演講中,將介紹典推薦器系統的思想和技術。 我們將討論為游客建立有用的推薦系統所需的一些關鍵要素。 因此,我們將指出推薦系統研究的一些局限性和挑戰。 然后,我們將介紹一些新穎的技術,這些技術利用從觀察到的游客行為中收集的數據來生成更有用的個人和團體推薦。
嘉賓介紹: Francesco Ricci博士是Bozen-Bolzano自由大學(意大利)的正教授兼計算機科學學院院長。他與他人共同編輯了《推薦系統手冊》(Springer,2011年,2015年),并作為ACM推薦系統會議(2007年至2010年)指導委員會主席在社區中積極工作。他(2000年至2006年)曾是ITC-irst(意大利特倫托)的電子商務和旅游業研究實驗室(eCTRL)的高級研究員和技術總監。從1998年到2000年,他是Sodalia s.p.a.的研究和技術部門的系統架構師。