日韩在线精品小视频,亚洲高清日韩国产一区二区三区

【導讀】作為世界數據挖掘領域的最高級別的學術會議，ACM SIGKDD（國際數據挖掘與知識發現大會，簡稱 KDD）每年都會吸引全球領域眾多專業人士參與。今年的 KDD大會計劃將于 2020 年 8 月 23 日 ~27 日在美國美國加利福尼亞州圣地亞哥舉行（疫情影響，線上舉行）。KDD 2020官方發布接收論文，共有1279篇論文提交到Research Track，共216篇被接收，接收率16.8%。近期一些Paper放出來了，為此，專知小編提前為大家整理了五篇KDD 2020 推薦系統（RS）相關論文，供大家參考。——異構圖交互模型、組合嵌入、分解自監督、地理感知序列推薦、交互路徑推理。

KDD2020 Accepted Papers

CVPR2020SGNN、CVPR2020GNN_Part2、CVPR2020GNN_Part1、WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN、EMNLP2019GNN、ICCV2019GNN_Part2、ICCV2019GNN_Part1、NIPS2019GNN、IJCAI2019GNN_Part1、IJCAI2019GNN_Part2、KDD2019GNN、ACL2019GNN、CVPR2019GNN、

1、An Efficient Neighborhood-based Interaction Model for Recommendation on Heterogeneous Graph

作者：Jiarui Jin, Jiarui Qin, Yuchen Fang, Kounianhua Du, Weinan Zhang, Yong Yu, Zheng Zhang, Alexander J. Smola

摘要：近年來，基于異構信息網絡(HIN)的推薦系統大量涌現，因為HIN能夠刻畫復雜的圖形，并且包含豐富的語義。現有的方法雖然取得了性能上的提高，但同時在實用性方面，仍然面臨著以下問題。一方面，大多數現有的基于HIN的方法依賴于顯式路徑可達性來利用用戶和項目之間基于路徑的語義相關性，例如基于元路徑的相似性。但由于路徑連接稀疏或有噪聲，這些方法很難使用和集成，并且通常具有不同的長度。另一方面，其他基于圖的方法旨在通過在預測前將節點及其鄰域信息壓縮成單個嵌入來學習有效的異構網絡表示。這種弱耦合的建模方式忽略了節點之間豐富的交互，這帶來了先前概述的問題。針對上述問題，本文提出了一種端到端基于鄰域的交互推薦模型(NIRec)。具體地說，我們首先分析了學習交互在HINS中的重要性，然后提出了一種新的公式，通過元路徑引導的鄰域來捕捉每對節點之間的交互模式。然后，為了探索元路徑之間的復雜交互和處理大規模網絡上的學習復雜性，我們用卷積的方式表示交互，并使用快速傅立葉變換進行高效的學習。在四種不同類型的異構圖上的大量實驗表明，與現有技術相比，NIRec的性能有所提高。據我們所知，這是在基于HIN的推薦中提供有效的基于鄰域的交互模型的第一項工作。

網址： //arxiv.org/abs/2007.00216

2、Compositional Embeddings Using Complementary Partitions for Memory-Efficient Recommendation Systems

作者：Hao-Jun Michael Shi, Dheevatsa Mudigere, Maxim Naumov, Jiyan Yang

摘要：基于深度學習的推薦系統利用了成百上千個不同的分類特征，每個分類特征都有數百萬個從點擊到發布的不同類別。為了尊重分類數據中的自然多樣性，嵌入將每個類別映射到嵌入空間內的統一表示。由于每個分類特征可以承擔多達數千萬個不同的可能類別，因此嵌入表示在訓練和推理過程中都面臨著存儲瓶頸。我們提出了一種新的方法，通過利用類別集合的互補劃分（complementary partitions）在不需要明確定義的情況下來為每個類別產生唯一的嵌入向量，從而以端到端的方式減少嵌入大小。通過在每個互補分區上存儲多個較小的嵌入表，并結合每個表的嵌入，我們以較小的存儲開銷為每個類別定義了唯一的嵌入。該方法可以被解釋為使用特定的固定碼本（fixed codebook）來確保每個類別表示的唯一性。我們的實驗結果表明，相對于散列技巧，我們的方法在減少模型損失和準確性的同時減小了參數數量，并且有效地減少了嵌入表示的大小。

網址：

3、Disentangled Self-Supervision in Sequential Recommenders

作者：Jianxin Ma, Chang Zhou, Hongxia Yang, Peng Cui, Xin Wang, Wenwu Zhu

摘要：為了學習一個序列推薦器，現有的方法通常采用sequence-to-item(Seq2item)訓練策略，該策略以用戶的下一次行為為標簽，以用戶過去的行為為輸入來監督序列模型。然而，seq2item策略是目光短淺的，通常會產生單一的推薦列表。在本文中，我們著眼于更長遠的未來來研究挖掘額外信號以進行監督的問題。存在如下兩個挑戰：i)重構包含多個行為的未來序列比重構單個下一個行為要困難得多，這可能導致收斂困難；ii)所有未來行為的序列可能涉及多個意圖，并不是所有的意圖都可以從先前行為序列中預測出來。為了應對這些挑戰，我們提出了一種基于潛在自監督和解纏（disentanglement）的Seq2seq訓練策略。具體地說，我們在潛在空間中進行自監督，即作為一個整體重構未來序列的表示，而不是單獨重構未來序列中的項。我們還解開了任何給定行為序列背后的意圖，并僅使用涉及共同意圖的子序列對來構建seq2seq訓練樣本。真實世界基準和合成數據的結果表明，seq2seq訓練帶來了改進。

網址：

4、Geography-Aware Sequential Location Recommendation

作者：Defu Lian, Yongji Wu, Yong Ge, Xing Xie, Enhong Chen

摘要：序列位置推薦在移動性預測、路徑規劃、基于位置廣告等應用中發揮著重要作用。雖然從張量分解發展到基于RNN的神經網絡，但現有方法沒有有效利用地理信息，存在稀疏性問題。為此，我們提出了一種基于自注意力網絡的地理感知序列推薦器(GeoSAN)進行位置推薦。一方面，我們提出了一種新的基于重要性抽樣的損失函數進行優化，通過強調使用信息豐富的負樣本來解決稀疏性問題。另一方面，為了更好地利用地理信息，GeoSAN使用基于自注意力的地理編碼器來表示每個GPS點的分層網格。此外，我們還提出了地理感知的負采樣器來提高負樣本的信息量。我們使用三個真實的LBSN數據集對所提出的算法進行了評估，結果表明GeoSAN的性能比最新的序列位置推薦器高出34.9%。實驗結果進一步驗證了新的損失函數、地理編碼器和地理感知負采樣器的有效性。

網址：

5、Interactive Path Reasoning on Graph for Conversational Recommendation

作者：Wenqiang Lei, Gangyi Zhang, Xiangnan He, Yisong Miao, Xiang Wang, Liang Chen, Tat-Seng Chua

摘要：傳統的推薦系統從過去的交互歷史中估計用戶對項目的偏好，因此受到獲取細粒度和動態用戶偏好的限制。會話推薦系統(CRS)使系統能夠直接向用戶詢問他們對物品的偏好屬性，從而為這些限制帶來了革命性的變化。然而，現有的CRS方法并沒有充分利用這一優勢-它們只以相當隱含的方式使用屬性反饋，例如更新潛在用戶表示。在本文中，我們提出了轉換路徑推理(Conversational Path Reasoning, CPR)，這是一個通用的框架，它將會話推薦建模為圖上的交互式路徑推理問題。它通過跟隨用戶反饋遍歷屬性頂點，顯式地利用用戶偏好屬性。通過利用圖結構，CPR能夠刪除許多不相關的候選屬性，從而獲得更好的命中用戶偏好屬性的機會。為了演示CPR的工作原理，我們提出了一個簡單而有效的實例化，命名為SCPR(SimpleCPR)。我們對多輪會話推薦場景進行了實證研究，這是迄今為止最現實的CRS場景，它考慮了多輪詢問屬性和推薦項目。通過在Yelp和LastFM兩個數據集上的大量實驗，我們驗證了我們的SCPR的有效性，它的性能明顯優于最先進的CRS方法EAR和CRM。特別地，屬性越多，我們的方法就能獲得越多的優勢。

網址：

付費5元查看完整內容

相關內容

KDD 2020

關注 18

圖神經網絡 · IJCAI 2020 · 自然語言處理 ·

2020 年 8 月 18 日

[付費5元查看完整內容]近期必讀的五篇 IJCAI 2020【圖神經網絡 (GNN)+NLP 】相關論文

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

【導讀】IJCAI（國際人工智能聯合會議，International Joint Conferences on Artificial Intelligence）作為人工智能領域最頂級的國際學術會議之一，IJCAI 的舉辦自然備受矚目。第29屆國際人工智能聯合會議和第17屆環太平洋國際人工智能會議原定于2020年7月11日在日本橫濱召開，但由于疫情影響，將延期半年，至 2021年1月召開。近期，IJCAI 2020 論文集已經放出來。在 4717 份有效投稿中，最終僅有 592 篇被接收，接收率為 12.6%，這也是 IJCAI 史上最低的接收率。我們發現在今年的IJCAI 2020會議上圖神經網絡相關的論文非常多，今天小編專門整理最新6篇圖神經網絡（GNN）應用在自然語言處理上的相關論文——AMR-to-text生成、Path GCN、圖互注意力網絡、常識知識、有向超圖GCN

IJCAI 2020 Accepted Paper: //www.ijcai.org/Proceedings/2020/

IJCAI2020GNN_Part1、ICML2020GNN_Part1、KDD2020GNN_Part1、CVPR2020SGNN、CVPR2020GNN_Part2、CVPR2020GNN_Part1、WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、

1、Better AMR-To-Text Generation with Graph Structure Reconstruction 作者：Tianming Wang, Xiaojun Wan, Shaowei Yao

摘要：AMR-to-text 生成是一項艱巨的任務，它需要從基于圖的語義表示中生成文本。最近的研究將這一任務看作是圖到序列的學習問題，并使用各種圖神經網絡來建模圖結構。在本文中，我們提出了一種新的方法，在重構輸入圖結構的同時，從AMR圖中生成文本。我們的模型使用圖注意力機制來聚合信息以對輸入進行編碼。此外，通過優化兩個簡單而有效的輔助重構目標：鏈接預測目標(需要預測節點之間的語義關系)和距離預測目標(需要預測節點之間的距離)，能夠學習到更好的節點表示。在兩個基準數據集上的實驗結果表明，我們提出的模型在強基線上有很大的改善，并達到了新的技術水平。

網址：

2、Multi-hop Reading Comprehension across Documents with Path-based Graph Convolutional Network

作者：Zeyun Tang, Y ongliang Shen, Xinyin Ma, Wei Xu, Jiale Yu, Weiming Lu

摘要：跨多個文檔的多跳（Multi-hop ）閱讀理解近年來備受關注。在本文中，我們提出了一種新的方法來解決這個多跳閱讀理解問題。受人類推理過程的啟發，我們從支持文檔（supporting documents）中構造了一個基于路徑的推理圖。該推理圖結合了基于圖的方法和基于路徑的方法的思想，更適合于多跳推理。同時，我們提出了GATED-RGCN在基于路徑的推理圖上積累證據，GATED-RGCN包含了一種新的問題感知門控機制，以規范跨文檔傳播信息的有用性，并在推理過程中添加問題信息。我們在WikiHop數據集上對我們的方法進行了評估，與以前發布的方法相比，我們的方法達到了最先進的準確性。特別值得一提的是，我們的集成模型比人類的表現高出4.2%。

網址：

3、The Graph-based Mutual Attentive Network for Automatic Diagnosis

作者：Quan Yuan, Jun Chen, Chao Lu, Haifeng Huang 摘要：自動診斷一直存在缺乏可靠語料庫來訓練可信預測模型的問題。此外，以往的基于深度學習的診斷模型大多采用序列學習技術(CNN或RNN)，難以提取關鍵醫療實體之間的復雜結構信息（如圖結構）。本文提出基于真實醫院的高標準電子病歷文檔建立的診斷模型，以提高模型的準確性和可信度。同時，我們將圖卷積網絡引入到該模型中，緩解了稀疏特征的問題，便于提取用于診斷的結構信息。此外，我們還提出了mutual注意網絡來增強輸入的表示，以獲得更好的模型性能。我們在真實電子病歷文檔（ EMR documents）上進行實驗，結果表明與以往基于序列學習的診斷模型相比，該模型具有更高的準確性。我們提出的模型已被集成到中國數百家初級衛生保健機構的信息系統中，以協助醫生進行診斷。

網址：

4、TransOMCS: From Linguistic Graphs to Commonsense Knowledge

作者：Hongming Zhang, Daniel Khashabi, Yangqiu Song, Dan Roth

摘要：常識知識獲取是人工智能的關鍵問題。傳統獲取常識知識的方法通常需要昂貴的人工注釋并且費力，在大范圍內是不可行的。本文探索了一種從語言圖中挖掘常識知識的實用方法，目的是將從語言模式中獲得的廉價知識轉化為昂貴的常識知識。其結果是將大規模的選擇偏好知識資源ASER[Zhang et al., 2020]轉換為TransOMCS，其表示與ConceptNet[Liu and Singh，2004]相同，但比ConceptNet大兩個數量級。實驗結果表明，語言知識可以轉化為常識知識，并且該方法在數量、新穎性和質量方面都是有效的。

代碼：

網址：

5、Two-Phase Hypergraph Based Reasoning with Dynamic Relations for Multi-Hop KBQA

作者：Jiale Han, Bo Cheng, Xu Wang

摘要：多跳知識庫問答(KBQA)旨在通過跨多個三元組的推理來尋找事實問題的答案。值得注意的是，當人類執行多跳推理時，傾向于在不同的跳中集中于特定的關系，并精確定位由該關系連接的一組實體。與利用成對連接來模擬人類執行多跳推理不同，超圖卷積網絡(HGCN)可以通過利用超邊連接兩個以上的節點。然而，HGCN是針對無向圖的，沒有考慮信息傳遞的方向。為了適應具有方向性的知識圖，我們引入了有向HGCN(Directed-HGCN, DHGCN)。受人類逐跳推理的啟發，我們提出了一種基于DHGCN的可解釋KBQA模型，即基于動態關系的兩階段超圖推理，該模型顯式更新關系信息，動態關注不同跳點的不同關系。此外，該模型逐跳預測關系以生成中間關系路徑。我們在兩個廣泛使用的多跳KBQA數據集上進行了大量的實驗，以證明該模型的有效性。

網址：

付費5元查看完整內容

圖神經網絡 · KDD 2020 ·

2020 年 6 月 30 日

[付費5元查看完整內容]近期必讀的五篇KDD 2020【圖神經網絡 (GNN) 】相關論文_Part2

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

【導讀】作為世界數據挖掘領域的最高級別的學術會議，ACM SIGKDD（國際數據挖掘與知識發現大會，簡稱 KDD）每年都會吸引全球領域眾多專業人士參與。今年的 KDD大會計劃將于 2020 年 8 月 23 日 ~27 日在美國美國加利福尼亞州圣地亞哥舉行。上周，KDD 2020官方發布接收論文，共有1279篇論文提交到Research Track，共216篇被接收，接收率16.8%。近期KDD官網公布了接受論文列表，為此，上個月專知小編為大家整理了圖神經網絡相關的論文，這期小編繼續為大家奉上KDD 2020必讀的五篇圖神經網絡（GNN）相關論文-Part 2——多層次GCN、無監督預訓練GCN、圖Hash、GCN主題模型、采樣

KDD 2020 Accepted Paper: //www.kdd.org/kdd2020/accepted-papers

KDD2020GNN_Part1、CVPR2020SGNN、CVPR2020GNN_Part2、CVPR2020GNN_Part1、WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN、EMNLP2019GNN、ICCV2019GNN_Part2、ICCV2019GNN_Part1、NIPS2019GNN、IJCAI2019GNN_Part1、IJCAI2019GNN_Part2、KDD2019GNN、

1. Multi-level Graph Convolutional Networks for Cross-platform Anchor Link Prediction

作者：Hongxu Chen, Hongzhi Yin, Xiangguo Sun, Tong Chen, Bogdan Gabrys, Katarzyna Musial

摘要：跨平臺的賬號匹配在社交網絡分析中發揮著重要作用，并且有利于廣泛的應用。然而，現有的方法要么嚴重依賴于高質量的用戶生成內容(包括用戶興趣模型)，要么只關注網絡拓撲結構，存在數據不足的問題，這使得研究這個方向變得很困難。為了解決這一問題，我們提出了一種新的框架，該框架統一考慮了局部網絡結構和超圖結構上的多級圖卷積。該方法克服了現有工作中數據不足的問題，并且不一定依賴于用戶的人口統計信息。此外，為了使所提出的方法能夠處理大規模社交網絡，我們提出了一種兩階段的空間協調機制，在基于網絡分區的并行訓練和跨不同社交網絡的帳戶匹配中對齊嵌入空間。我們在兩個大規模的真實社交網絡上進行了廣泛的實驗。實驗結果表明，該方法的性能比現有的模型有較大幅度的提高。

網址：

2. GCC: Graph Contrastive Coding for Graph Neural Network Pre-Training

作者：Jiezhong Qiu, Qibin Chen, Yuxiao Dong, Jing Zhang, Hongxia Yang, Ming Ding, Kuansan Wang, Jie Tang

摘要：圖表示學習已經成為解決現實問題的一種強有力的技術。包括節點分類、相似性搜索、圖分類和鏈接預測在內的各種下游圖學習任務都受益于它的最新發展。然而，關于圖表示學習的現有技術集中于領域特定的問題，并為每個圖訓練專用模型，這通常不可轉移到領域之外的數據。受自然語言處理和計算機視覺在預訓練方面的最新進展的啟發，我們設計了圖對比編碼(Graph Contrastive Coding，GCC)一個無監督的圖表示學習框架來捕捉跨多個網絡的通用網絡拓撲屬性。我們將GCC的預訓練任務設計為網絡內部和網絡之間的子圖級別的實例判斷，并利用對比學習來增強模型學習內在的和可遷移的結構表征能力。我們在三個圖學習任務和十個圖數據集上進行了廣泛的實驗。結果表明，GCC在一組不同的數據集上進行預訓練，可以獲得與從頭開始的特定任務訓練的方法相媲美或更好的性能。這表明，預訓練和微調范式對圖表示學習具有巨大的潛力。

網址：

代碼鏈接：

3. GHashing: Semantic Graph Hashing for Approximate Similarity Search in Graph Databases

作者：Zongyue Qin, Yunsheng Bai, Yizhou Sun

摘要：圖相似搜索的目的是根據給定的鄰近度，即圖編輯距離(GED)，在圖形數據庫中找到與查詢最相似的圖。這是一個被廣泛研究但仍具有挑戰性的問題。大多數研究都是基于剪枝驗證框架，該框架首先對非看好的圖進行剪枝，然后在較小的候選集上進行驗證。現有的方法能夠管理具有數千或數萬個圖的數據庫，但由于其精確的剪枝策略，無法擴展到更大的數據庫。受到最近基于深度學習的語義哈希（semantic hashing）在圖像和文檔檢索中的成功應用的啟發，我們提出了一種新的基于圖神經網絡(GNN)的語義哈希，即GHash，用于近似剪枝。我們首先用真實的GED結果訓練GNN，以便它學習生成嵌入和哈希碼，以保持圖之間的GED。然后建立哈希索引以實現恒定時間內的圖查找。在回答一個查詢時，我們使用哈希碼和連續嵌入作為兩級剪枝來檢索最有希望的候選對象，并將這些候選對象發送到精確的求解器進行最終驗證。由于我們的圖哈希技術利用了近似剪枝策略，與現有方法相比，我們的方法在保持高召回率的同時，實現了顯著更快的查詢時間。實驗表明，該方法的平均速度是目前唯一適用于百萬級數據庫的基線算法的20倍，這表明GHash算法成功地為解決大規模圖形數據庫的圖搜索問題提供了新的方向。

網址：

4. Graph Structural-topic Neural Network

作者：Qingqing Long, Yilun Jin, Guojie Song, Yi Li, Wei Lin

摘要：圖卷積網絡(GCNS)通過有效地收集節點的局部特征，取得了巨大的成功。然而，GCNS通常更多地關注節點特征，而較少關注鄰域內的圖結構，特別是高階結構模式。然而，這種局部結構模式被顯示為許多領域中的節點屬性。此外，由于網絡很復雜，每個節點的鄰域由各種節點和結構模式的混合組成，不只是單個模式，所有這些模式上的分布都很重要。相應地，在本文中，我們提出了圖結構主題神經網絡，簡稱GraphSTONE，這是一種利用圖的主題模型的GCN模型，使得結構主題廣泛地從概率的角度捕捉指示性的圖結構，而不僅僅是幾個結構。具體地說，我們使用 anonymous walks和Graph Anchor LDA(一種LDA的變體，首先選擇重要的結構模式)在圖上建立主題模型，以降低復雜性并高效地生成結構主題。此外，我們設計了多視圖GCNS來統一節點特征和結構主題特征，并利用結構主題來指導聚合。我們通過定量和定性實驗對我們的模型進行了評估，我們的模型表現出良好的性能、高效率和清晰的可解釋性。

網址：

代碼鏈接：

5. Minimal Variance Sampling with Provable Guarantees for Fast Training of Graph Neural Networks

作者：Weilin Cong, Rana Forsati, Mahmut Kandemir, Mehrdad Mahdavi

摘要：抽樣方法(如節點抽樣、分層抽樣或子圖抽樣)已成為加速大規模圖神經網絡(GNNs)訓練不可缺少的策略。然而，現有的抽樣方法大多基于圖的結構信息，忽略了最優化的動態性，導致隨機梯度估計的方差較大。高方差問題在非常大的圖中可能非常明顯，它會導致收斂速度慢和泛化能力差。本文從理論上分析了抽樣方法的方差，指出由于經驗風險的復合結構，任何抽樣方法的方差都可以分解為前向階段的嵌入近似方差和后向階段的隨機梯度方差，這兩種方差都必須減小，才能獲得較快的收斂速度。我們提出了一種解耦的方差減小策略，利用(近似)梯度信息自適應地對方差最小的節點進行采樣，并顯式地減小了嵌入近似引入的方差。理論和實驗表明，與現有方法相比，該方法即使在小批量情況下也具有更快的收斂速度和更好的泛化能力。

網址：

付費5元查看完整內容

SIGIR2020 · 圖神經網絡 · 推薦系統 ·

2020 年 6 月 2 日

[付費5元查看完整內容]近期必讀的六篇SIGIR 2020【圖神經網絡 +推薦(GNN+RS) 】相關論文

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

【導讀】作為CCF推薦的A類國際學術會議，International ACM SIGIR Conference on Research and Development in Information Retrieval（國際計算機學會信息檢索大會，簡稱 SIGIR）在信息檢索領域享有很高的學術聲譽，每年都會吸引全球眾多專業人士參與。今年的 SIGIR 2020計劃將于 2020年7月25日~30日在中國西安舉行。本次大會共有555篇長文投稿，僅有147篇長文被錄用，錄用率約26%。專知小編提前為大家整理了六篇SIGIR 2020 基于圖神經網絡的推薦（GNN+RS）相關論文，這六篇論文分別出自中科大何向南老師和和昆士蘭大學陰紅志老師團隊，供大家參考——捆綁推薦、Disentangled GCF、服裝推薦、多行為推薦、全局屬性GNN

1. Bundle Recommendation with Graph Convolutional Networks

作者：Jianxin Chang, Chen Gao, Xiangnan He, Yong Li, Depeng Jin

摘要：捆綁推薦（Bundle recommendation ）旨在推薦一組商品供用戶整體消費。現有的解決方案通過共享模型參數或多任務學習的方式將用戶項目交互建模集成到捆綁推薦中，然而，這些方法不能顯式建模項目與捆綁包（bundles）之間的隸屬關系，不能探索用戶選擇捆綁包時的決策。在這項工作中，我們提出了一個用于捆綁推薦的圖神經網絡模型BGCN(Bundle Graph Convolutional Network)。BGCN將用戶-項目交互、用戶-捆綁包交互和捆綁包-項目從屬關系統一到一個異構圖中。以項目節點為橋梁，在用戶節點和捆綁包節點之間進行圖卷積傳播，使學習到的表示能夠捕捉到項目級的語義。通過基于hard-negative采樣器的訓練，可以進一步區分用戶對相似捆綁包的細粒度偏好。在兩個真實數據集上的實驗結果表明，BGCN的性能有很高的提升，其性能比最新的基線高出10.77%到23.18%。

網址： //arxiv.org/abs/2005.03475

2. Disentangled Graph Collaborative Filtering

作者：Xiang Wang, Hongye Jin, An Zhang, Xiangnan He, Tong Xu, Tat-Seng Chua

摘要：從交互數據中學習用戶和項目的信息表示對于協同過濾(CF)至關重要。當前的嵌入函數利用用戶-項目關系來豐富表示，從單個用戶-項目實例演變為整體交互圖。然而，這些方法在很大程度上以統一的方式對關系進行建模，而忽略了用戶采用這些項目的意圖的多樣性，這可能是為了打發時間，為了興趣，或者為其他人(如家庭)購物。這種統一的對用戶興趣建模的方法很容易導致次優表示，不能對不同的關系建模并在表示中分清用戶意圖。在這項工作中，我們特別關注用戶意圖細粒度上的用戶-項目關系。因此，我們設計了一種新的模型- Disentangled圖協同過濾(Disentangled Graph Collaborative Filtering ,DGCF)，來理清這些因素并產生disentangled的表示。具體地說，通過在每個用戶-項目交互意圖上的分布建模，我們迭代地細化意圖感知的交互圖和表示。同時，我們鼓勵不同的意圖獨立。這將生成disentangled的表示，有效地提取與每個意圖相關的信息。我們在三個基準數據集上進行了廣泛的實驗，DGCF與NGCF、DisenGCN和MacridV AE這幾個最先進的模型相比取得了顯著的改進。進一步的分析揭示了DGCF在分解用戶意圖和表示的可解釋性方面的優勢。

網址：

代碼鏈接：

3. GCN-Based User Representation Learning for Unifying Robust Recommendation and Fraudster Detection

作者：Shijie Zhang, Hongzhi Yin, Tong Chen, Quoc Viet Nguyen Hung, Zi Huang, Lizhen Cui

摘要：近年來，推薦系統已經成為所有電子商務平臺中不可缺少的功能。推薦系統的審查評級數據通常來自開放平臺，這可能會吸引一群惡意用戶故意插入虛假反饋，試圖使推薦系統偏向于他們。此類攻擊的存在可能會違反高質量數據始終可用的建模假設，而這些數據確實會影響用戶的興趣和偏好。因此，構建一個即使在攻擊下也能產生穩定推薦的健壯推薦系統具有重要的現實意義。本文提出了一種基于GCN的用戶表示學習框架GraphRf，該框架能夠統一地進行穩健的推薦和欺詐者檢測。在其端到端學習過程中，用戶在欺詐者檢測模塊中被識別為欺詐者的概率自動確定該用戶的評級數據在推薦模塊中的貢獻；而在推薦模塊中輸出的預測誤差作為欺詐者檢測模塊中的重要特征。因此，這兩個組成部分可以相互促進。經過大量的實驗，實驗結果表明我們的GraphRf在魯棒評級預測和欺詐者檢測這兩個任務中具有優勢。此外，所提出的GraphRf被驗證為對現有推薦系統上的各種攻擊具有更強的魯棒性。

網址：

4. Hierarchical Fashion Graph Network for Personalized Outfit Recommendation

作者：Xingchen Li, Xiang Wang, Xiangnan He, Long Chen, Jun Xiao, Tat-Seng Chua

摘要：服裝推薦越來越受到網購服務商和時尚界的關注。與向用戶推薦單個單品(例如，朋友或圖片)的其他場景(例如，社交網絡或內容共享)不同，服裝推薦預測用戶對一組匹配良好的時尚單品的偏好。因此，進行高質量的個性化服裝推薦應滿足兩個要求：1)時尚單品的良好兼容性；2)與用戶偏好的一致性。然而，目前的研究主要集中在其中一個需求上，只考慮了用戶-全套服裝（outfit）或全套服裝-項目的關系，從而容易導致次優表示，限制了性能。在這項工作中，我們統一了兩個任務，服裝兼容性建模和個性化服裝推薦。為此，我們開發了一個新的框架，層次時尚圖網絡(HFGN)，用于同時建模用戶、商品和成套服裝之間的關系。特別地，我們構建了一個基于用戶-全套服裝交互和全套服裝-項目映射的層次結構。然后，我們從最近的圖神經網絡中得到啟發，在這種層次圖上使用嵌入傳播，從而將項目信息聚合到一個服裝表示中，然后通過他/她的歷史服裝來提煉用戶的表示。此外，我們還對這兩個任務進行了聯合訓練，以優化這些表示。為了證明HFGN的有效性，我們在一個基準數據集上進行了廣泛的實驗，HFGN在NGNN和FHN等最先進的兼容性匹配模型基礎上取得了顯著的改進。

網址：

代碼鏈接：

5. Multi-behavior Recommendation with Graph Convolutional Networks

作者：Bowen Jin, Chen Gao, Xiangnan He, Depeng Jin, Yong Li

摘要：傳統的推薦模型通常只使用一種類型的用戶-項目交互，面臨著嚴重的數據稀疏或冷啟動問題。利用多種類型的用戶-項目交互(例如：點擊和收藏)的多行為推薦可以作為一種有效的解決方案。早期的多行為推薦研究未能捕捉到行為對目標行為的不同程度的影響。它們也忽略了多行為數據中隱含的行為語義。這兩個限制都使得數據不能被充分利用來提高對目標行為的推薦性能。在這項工作中，我們創新性地構造了一個統一的圖來表示多行為數據，并提出了一種新的模型--多行為圖卷積網絡(Multi-Behavior Graph Convolutional Network，MBGCN)。MBGCN通過用戶-項目傳播層學習行為強度，通過項目-項目傳播層捕獲行為語義，較好地解決了現有工作的局限性。在兩個真實數據集上的實驗結果驗證了該模型在挖掘多行為數據方面的有效性。我們的模型在兩個數據集上的性能分別比最優基線高25.02%和6.51%。對冷啟動用戶的進一步研究證實了該模型的實用性。

網址：

6. GAG: Global Atributed Graph Neural Network for Streaming Session-based Recommendation

作者：Ruihong Qiu, Hongzhi Yin, Zi Huang, Tong Chen

摘要：基于流會話的推薦(Streaming session-based recommendation，SSR)是一項具有挑戰性的任務，它要求推薦器系統在流媒體場景（streaming scenario）中進行基于會話的推薦(SR)。在電子商務和社交媒體的現實應用中，在一定時間內產生的一系列用戶-項目交互被分組為一個會話，這些會話以流的形式連續到達。最近的SR研究大多集中在靜態集合上，即首先獲取訓練數據，然后使用該集合來訓練基于會話的推薦器模型。他們需要對整個數據集進行幾個epoch的訓練，這在流式設置下是不可行的。此外，由于對用戶信息的忽視或簡單使用，它們很難很好地捕捉到用戶的長期興趣。雖然最近已經提出了一些流推薦策略，但它們是針對個人交互流而不是會話流而設計的。本文提出了一種求解SSR問題的帶有Wasserstein 庫的全局屬性圖(GAG)神經網絡模型。一方面，當新的會話到達時，基于當前會話及其關聯用戶構造具有全局屬性的會話圖。因此，GAG可以同時考慮全局屬性和當前會話，以了解會話和用戶的更全面的表示，從而在推薦中產生更好的性能。另一方面，為了適應流會話場景，提出了Wasserstein庫來幫助保存歷史數據的代表性草圖。在兩個真實數據集上進行了擴展實驗，驗證了GAG模型與最新方法相比的優越性。

網址：

付費5元查看完整內容

圖神經網絡 ·

2020 年 5 月 26 日

[付費5元查看完整內容]近期必讀的五篇數據挖掘頂會KDD 2020【圖神經網絡 (GNN) 】相關論文

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

【導讀】作為世界數據挖掘領域的最高級別的學術會議，ACM SIGKDD（國際數據挖掘與知識發現大會，簡稱 KDD）每年都會吸引全球領域眾多專業人士參與。今年的 KDD大會計劃將于 2020 年 8 月 23 日 ~27 日在美國美國加利福尼亞州圣地亞哥舉行。上周，KDD 2020官方發布接收論文，共有1279篇論文提交到Research Track，共216篇被接收，接收率16.8%。近期一些Paper放出來了，為此，專知小編提前為大家整理了五篇KDD 2020 圖神經網絡（GNN）相關論文，供大家參考。——圖結構學習、多元時間序列預測、負采樣、多任務多視角圖表示學習、多興趣推薦

1. Graph Structure Learning for Robust Graph Neural Networks

作者：Wei Jin, Yao Ma, Xiaorui Liu, Xianfeng Tang, Suhang Wang, Jiliang Tang

摘要：圖神經網絡(GNNs)是圖表示學習的有力工具。但是，最近的研究表明，GNN容易受到精心設計的擾動（稱為對抗攻擊）的攻擊。對抗性攻擊很容易欺騙GNN來預測下游任務。對于對抗攻擊的脆弱性使人們越來越關注在安全關鍵型應用中應用GNN。因此，開發穩健的算法來防御對抗攻擊具有重要意義。防御對抗攻擊的一個自然想法是清理受干擾的圖。很明顯，真實世界的圖共享一些內在屬性。例如，許多現實世界的圖都是低秩和稀疏的，兩個相鄰節點的特征往往是相似的。事實上，我們發現對抗攻擊很可能會違背這些圖的性質。因此，在本文中，我們利用這些特性來防御針對圖的對抗攻擊。特別是，我們提出了一個通用框架Pro-GNN，該框架可以從受這些特性指導的擾動圖中聯合學習結構圖和魯棒圖神經網絡模型。在真實圖上的大量實驗表明，即使在圖受到嚴重干擾的情況下，我們所提出的框架也比現有的防御方法獲得了顯著更好的性能。我們將Pro-GNN的實現發布到我們的DeepRobust存儲庫，以進行對抗性攻擊和防御。

網址： //arxiv.org/pdf/2005.10203.pdf

代碼鏈接：

2. Connecting the Dots: Multivariate Time Series Forecasting with Graph Neural Networks

作者：Zonghan Wu, Shirui Pan, Guodong Long, Jing Jiang, Xiaojun Chang, Chengqi Zhang

摘要：多變量時間序列的建模長期以來一直吸引著來自經濟、金融和交通等不同領域的研究人員的關注。多變量時間序列預測背后的一個基本假設是其變量之間相互依賴，但現有方法未能充分利用變量對之間的潛在空間相關性。同時，近些年來，圖神經網絡(GNNs)在處理關系依賴方面表現出了很高的能力。GNN需要定義良好的圖結構來進行信息傳播，這意味著它們不能直接應用于事先不知道依賴關系的多變量時間序列。本文提出了一種專門針對多變量時間序列數據設計的通用圖神經網絡框架。該方法通過圖學習模塊自動提取變量間的單向關系，可以方便地集成變量屬性等外部知識。在此基礎上，提出了一種新的max-hop傳播層和一個dilated inception層來捕捉時間序列中的時間和空間依賴關系。圖學習、圖卷積和時間卷積模塊在端到端框架中聯合學習。實驗結果表明，我們提出的模型在4個基準數據集中的3個數據上優于最新的基線方法，并且在提供額外結構信息的兩個交通數據集上，與其他方法具有同等的性能。

網址：

3. Understanding Negative Sampling in Graph Representation Learning

作者：Zhen Yang, Ming Ding, Chang Zhou, Hongxia Yang, Jingren Zhou, Jie Tang

摘要：在最近的幾年中，對圖表示學習進行了廣泛的研究。盡管它有可能為各種網絡生成連續的嵌入，但是在大型節點集中得到有效高質量的表示仍然具有挑戰性。采樣是實現該性能目標的關鍵點。現有技術通常側重于正向節點對的采樣，而對負向采樣的策略探索不夠。為了彌補這一差距，我們從目標和風險兩個角度系統地分析了負采樣的作用，從理論上論證了負采樣在確定優化目標和結果方差方面與正采樣同等重要。據我們所知，我們是第一個推導該理論并量化負采樣分布應與其正采樣分布成正相關但亞線性相關的方法。在該理論的指導下，我們提出了MCNS，用自對比度近似法近似正分布，并通過Metropolis-Hastings加速負采樣。我們在5個數據集上評估了我們的方法，這些數據集涵蓋了19個實驗設置，涵蓋了廣泛的下游圖學習任務，包括鏈接預測，節點分類和個性化推薦。這些相對全面的實驗結果證明了其穩健性和優越性。

網址：

4. M2GRL: A Multi-task Multi-view Graph Representation Learning Framework for Web-scale Recommender Systems

作者：Menghan Wang, Yujie Lin, Guli Lin, Keping Yang, Xiao-ming Wu

摘要：將圖表示學習與多視圖數據(邊信息)相結合進行推薦是工業上的一種趨勢。現有的大多數方法可以歸類為多視圖表示融合，它們首先構建一個圖，然后將多視圖數據集成到圖中每個節點的單個緊湊表示中。這些方法在工程和算法方面都引起了人們的關注：1)多視圖數據在工業中是豐富而且有用的，并且可能超過單個矢量的容量；2)由于多視圖數據往往來自不同的分布，可能會引入歸納偏置（inductive bias）。在本文中，我們使用一種多視圖表示對齊方法來解決這個問題。特別地，我們提出了一個多任務多視角圖表示學習框架(M2GRL)來學習web級推薦系統中的多視角圖節點表示。M2GRL為每個單視圖數據構造一個圖，從多個圖中學習多個單獨的表示，并執行對齊以建立模型的交叉視圖關系。M2GRL選擇了一種多任務學習范式來聯合學習視圖內表示和交叉視圖關系。此外，M2GRL在訓練過程中利用同方差不確定性自適應地調整任務的損失權重。我們在淘寶部署了M2GRL，并對570億個實例進行了訓練。根據離線指標和在線A/B測試，M2GRL的性能明顯優于其他最先進的算法。對淘寶多樣性推薦的進一步研究表明，利用M2GRL產生的多種表征是有效的，對于不同側重點的各種工業推薦任務來說，M2GRL是一個很有前途的方向。

網址：

5. Controllable Multi-Interest Framework for Recommendation

作者：Yukuo Cen, Jianwei Zhang, Xu Zou, Chang Zhou, Hongxia Yang, Jie Tang

摘要：近年來，由于深度學習的快速發展，神經網絡在電子商務推薦系統中得到了廣泛的應用。我們將推薦系統形式化為一個序列推薦問題，目的是預測可能與用戶交互的下一個項目。最近的研究通常從用戶的行為序列中給出一個整體的嵌入。然而，統一的用戶嵌入不能反映用戶在一段時間內的多個興趣。本文提出了一種新穎的可控多興趣序列推薦框架，稱為ComiRec。我們的多興趣模塊從用戶行為序列中捕獲多個興趣，可用于從大規模項目集中檢索候選項目。然后將這些項目送入聚合模塊以獲得總體推薦。聚合模塊利用一個可控因素來平衡推薦的準確性和多樣性。我們在兩個真實的數據集Amazon和Taobao進行序列推薦實驗。實驗結果表明，我們的框架相對于最新模型取得了重大改進。我們的框架也已成功部署在離線阿里巴巴分布式云平臺上。

網址：

代碼鏈接：

付費5元查看完整內容

WWW2020 ·

2020 年 4 月 21 日

[付費5元查看完整內容]近期必讀的5篇頂會WWW 2020【知識圖譜+圖神經網絡（KG+GNN）】相關論文

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

【導讀】國際萬維網大會（The Web Conference，簡稱WWW會議）是由國際萬維網會議委員會發起主辦的國際頂級學術會議，創辦于1994年，每年舉辦一屆，是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。本屆會議共收到了1129篇長文投稿，錄用217篇長文，錄用率為19.2%。這周會議已經召開，會議論文集已經公開，大家可以自己查看感興趣的論文，專知小編繼續整理WWW 2020 系列論文，這期小編為大家奉上的是WWW 2020五篇知識圖譜+圖神經網絡（KG+GNN）相關論文，供大家參考！——多關系實體對齊、問答推理、動態圖實體鏈接、序列實體鏈接、知識圖譜補全。

WWW 2020 會議論文集： //dl.acm.org/doi/proceedings/10.1145/3366423

WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN、EMNLP2019GNN、ICCV2019GNN_Part2、ICCV2019GNN_Part1、NIPS2019GNN、IJCAI2019GNN_Part1、IJCAI2019GNN_Part2、KDD2019GNN、ACL2019GNN、CVPR2019GNN、ICML2019GNN

Collective Multi-type Entity Alignment Between Knowledge Graphs

作者：Qi Zhu, Hao Wei, Bunyamin Sisman, Da Zheng, Christos Faloutsos, Xin Luna Dong and Jiawei Han

摘要：知識圖(如Freebase、Yago)是表示各類實體之間豐富真實信息的多關系圖。實體對齊是實現多源知識圖集成的關鍵步驟。它旨在識別涉及同一真實世界實體的不同知識圖中的實體。然而，現有的實體對齊系統忽略了不同知識圖的稀疏性，不能通過單一模型對多類型實體進行對齊。在本文中，我們提出了一種用于多類型實體對齊的聯合圖神經網絡（Collective Graph neural network），稱為CG-MuAlign。與以前的工作不同，CG-MuAlign聯合對齊多種類型的實體，共同利用鄰域信息并將其推廣到未標記的實體類型。具體地說，我們提出了一種新的集中聚集函數1)通過交叉圖和自注意力來緩解知識圖的不完全性，2）通過小批量訓練范例和有效的鄰域抽樣策略，有效地提高了可伸縮性。我們在具有數百萬個實體的真實知識圖上進行了實驗，觀察到了比現有方法更優越的性能。此外，我們的方法的運行時間比目前最先進的深度學習方法要少得多。

網址：

Complex Factoid Question Answering with a Free-Text Knowledge Graph

作者：Chen Zhao, Chenyan Xiong, Xin Qian and Jordan Boyd-Graber

摘要：我們介紹了Delft，一個事實問答系統，它將知識圖問答方法的細微和深度與更廣泛的free-文本結合在一起。Delft從Wikipedia構建了一個自由文本知識圖，以實體為節點和句子，其中實體同時出現做為邊。對于每個問題，Delft使用文本句子作為邊，找到將問題實體節點鏈接到候選對象的子圖，創建了密集且覆蓋率高的語義圖。一種新穎的圖神經網絡在free-文本圖上進行推理-通過沿邊句子的信息組合節點上的證據-以選擇最終答案。在三個問答數據集上的實驗表明，Delft能夠比基于機器閱讀的模型、基于BERT的答案排序和記憶網絡更好地回答實體豐富的問題。Delft的優勢既來自于其free-文本知識圖譜的高覆蓋率--是DBpedia關系的兩倍多--也來自于新穎的圖神經網絡，它基于豐富而嘈雜的free-文本證據進行推理。

網址：

Dynamic Graph Convolutional Networks for Entity Linking

作者：Junshuang Wu, Richong Zhang, Yongyi Mao, Hongyu Guo, Masoumeh Soflaei and Jinpeng Huai

摘要：實體鏈接將文檔中提及的命名實體映射到給定知識圖中的合適的實體，已被證明能夠從基于圖卷積網絡(GCN)對實體相關性建模中獲得顯著好處。然而，現有的GCN實體鏈接模型沒有考慮到，一組實體的結構化圖不僅依賴于給定文檔的上下文信息，而且在GCN的不同聚合層上自適應地變化，導致在捕捉實體之間的結構信息方面存在不足。在本文中，我們提出了一種動態的GCN體系結構來有效地應對這一挑戰。模型中的圖結構是在訓練過程中動態計算和修改的。通過聚合動態鏈接節點的知識，我們的GCN模型可以集中識別文檔和知識圖之間的實體映射，并有效地捕捉整個文檔中各個實體提及（ mentions）之間的主題一致性。在基準實體連接數據集上的實證研究證實了我們提出的策略的優越性能和動態圖結構的好處。

網址：

High Quality Candidate Generation and Sequential Graph Attention Network for Entity Linking

作者：Yichao Zhou, Shaunak Mishra, Manisha Verma, Narayan Bhamidipati and Wei Wang

摘要：實體鏈接(EL)是將文本中提及的內容映射到知識庫(KB)中相應實體的任務。這項任務通常包括候選生成(CG)和實體消歧(ED)兩個階段。目前基于神經網絡模型的EL系統取得了較好的性能，但仍然面臨著兩個挑戰：(1)以往的研究在評估模型時沒有考慮候選實體之間的差異。事實上，候選集的質量(特別是黃金召回)對EL結果有影響。因此，如何提候選的素質需要引起更多的關注。(Ii)為了利用提及實體之間的主題一致性，提出了許多聚集ED的圖和序列模型。然而，基于圖的模型對所有候選實體一視同仁，這可能會引入大量的噪聲信息。相反，序列模型只能觀察先前引用的實體，而忽略了當前提及的實體與其后續實體之間的相關性。針對第一個問題，我們提出了一種基于多策略的CG方法來生成高召回率的候選集。對于第二個問題，我們設計了一個序列圖注意力網絡(SeqGat)，它結合了圖和序列方法的優點。在我們的模型中，提及（ mentions）是按順序處理的。在當前提到的情況下，SeqGAT對其先前引用的實體和后續實體進行動態編碼，并為這些實體分配不同的重要性。這樣既充分利用了主題的一致性，又減少了噪聲干擾。我們在不同類型的數據集上進行了實驗，并在開放的評測平臺上與以前的EL系統進行了比較。比較結果表明，與現有的方法相比，我們的模型有了很大的改進。

網址：

Mining Implicit Entity Preference from User-Item Interaction Data for Knowledge Graph Completion via Adversarial Learning

作者：Gaole He, Junyi Li, Wayne Xin Zhao, Peiju Liu and Ji-Rong Wen

摘要：知識圖補全(KGC)任務旨在自動推斷知識圖(KG)中缺失的事實信息。在本文中，我們采取了一個新的視角，旨在利用豐富的用戶-項目交互數據(簡稱用戶交互數據)來改進KGC任務。我們的工作靈感來自于觀察到許多KG實體對應于應用系統中的在線項目。然而，這兩種數據源的固有特性有很大的不同，使用簡單的融合策略很可能會損害原有的性能。為了應對這一挑戰，我們提出了一種新的對抗性學習方法，通過利用用戶交互數據來執行KGC任務。我們的生成器是從用戶交互數據中分離出來的，用來提高鑒別器的性能。鑒別器將從用戶交互數據中學習到的有用信息作為輸入，并逐步增強評估能力，以識別生成器生成的假樣本。為了發現用戶的隱含實體偏好，設計了一種基于圖神經網絡的協同學習算法，并與鑒別器進行聯合優化。這種方法有效地緩解了KGC任務的數據異構性和語義復雜性問題。在三個真實世界數據集上的廣泛實驗已經證明了我們在KGC任務上的方法的有效性。

網址：

付費5元查看完整內容

WWW2020 · 推薦系統 ·

2020 年 4 月 14 日

[付費5元查看完整內容]近期必讀的6篇頂會WWW2020【推薦系統】相關論文-Part3

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

【導讀】國際萬維網大會（The Web Conference，簡稱WWW會議）是由國際萬維網會議委員會發起主辦的國際頂級學術會議，創辦于1994年，每年舉辦一屆，是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。由于疫情影響，會議在線上舉行。本屆會議共收到了1129篇長文投稿，錄用217篇長文，錄用率為19.2%。上周專知小編整理了WWW 2020 推薦系統相關論文-part2，這期小編繼續為大家奉上WWW 2020六篇推薦系統相關論文-part3 供參考——上下文感知推薦、雙邊公平推薦、MetaSelector、視覺主題推薦、社交影響力。 WWW2020RS_Part2、WWW2020RS_Part1

1. Eficient Non-Sampling Factorization Machines for Optimal Context-Aware Recommendation

作者：Chong Chen, Min Zhang, Weizhi Ma, Yiqun Liu, and Shaoping Ma

摘要：為了提供更準確的推薦，在對用戶項目交互進行建模之外考慮上下文特征已成為一個熱門話題。具有負采樣的因子分解機(FM)是一種流行的上下文感知推薦解決方案。然而，由于采樣可能丟失重要信息，并且在實際應用中通常會導致非最優性能，因此該算法的魯棒性不強。最近的一些努力通過使用深度學習框架建模高階特征交互增強了FM的性能。而他們要么只關注評分預測任務，要么通常采用負采樣策略來優化排名效果。由于采樣的巨大的波動，我們有理由認為這些基于采樣的FM方法對于上下文感知推薦仍然不是最佳的。在本文中，我們提出在不進行采樣的情況下學習FM，以有助于上下文感知推薦??的排名任務。盡管這種方法效率很高，但這種非采樣策略對模型的學習效率提出了很大的挑戰。因此，我們進一步設計了一種新的理想框架--有效非采樣樣因子分解機(ENSFM)。ENSFM不僅無縫連接了FM和矩陣分解(MF)之間的關系，而且通過新穎的記憶策略解決了具有挑戰性的效率問題。通過在三個真實的公共數據集上的大量實驗表明：1)我們提出的ENSFM的性能一致且顯著優于現有的上下文感知Top-K推薦方法，2)ENSFM在訓練效率上具有顯著的優勢，使其更適用于實際的大系統。此外，實驗結果表明，對于Top-K推薦任務，合適的學習方法比先進的神經網絡結構更為重要。

網址：

//www.thuir.cn/group/~mzhang/publications/TheWebConf2020-Chenchong.pdf

代碼鏈接：

2. FairRec: Two-Sided Fairness for Personalized Recommendations in Two-Sided Platforms

作者：Gourab K Patro, Arpita Biswas, Niloy Ganguly, Krishna P. Gummadi and Abhijnan Chakraborty

摘要：我們在雙邊在線平臺的背景下調查公平推薦（fair recommendation ）問題，該平臺由一邊的客戶和另一邊的生產商組成。這些平臺推薦服務的傳統方法側重于根據個人客戶的個性化偏好定制結果，以實現客戶滿意度的最大化。然而，我們的調查顯示，這種以客戶為中心的設計可能會導致生產商之間曝光量的不公平分配，這可能會對他們的利益造成不利影響。另一方面，以生產商為中心的設計可能會對客戶不公平。因此，我們考慮了客戶和生產商之間的公平問題。我們的方法將公平推薦問題映射為一個公平分配不可分割商品問題的新穎映射。我們提出的FairRec算法可確保至少為大多數生產商提供Maximin Share（MMS）的曝光量，并為每個客戶提供多達Envy-Free（EF1）的公平性。對多個真實世界數據集的廣泛評估顯示，FairRec在確保雙面公平性的同時，在總體推薦質量方面造成了邊際損失的有效性。

網址：

3. MetaSelector: Meta-Learning for Recommendation with User-Level Adaptive Model Selection

作者：Mi Luo, Fei Chen, Pengxiang Cheng, Zhenhua Dong, Xiuqiang He, Jiashi Feng and Zhenguo Li

摘要：推薦系統通常面對包含高度個性化用戶歷史數據的異構數據集，在這些數據集中，沒有哪個模型可以為每個用戶提供最佳建議。我們在公共和私有數據集上都觀察到了這種普遍存在的現象，并解決了模型選擇問題，以追求對每個用戶的推薦質量的優化。我們提出了一個元學習框架來促進推薦系統中用戶級的自適應模型選擇。在此框架中，我們將使用來自所有用戶的數據來訓練推薦者集合，然后通過元學習對模型選擇器進行訓練，以使用用戶特定的歷史數據為每個用戶選擇最佳的單個模型。我們在兩個公共數據集和一個真實的生產數據集上進行了廣泛的實驗，證明了我們的框架在AUC和LogLoss方面比單一的模型基線和樣本級模型選擇器都有改進。特別是，當這些改進部署在在線推薦系統中時，可能會帶來巨大的利潤收益。

網址：

4. Recommending Themes for Ad Creative Design via Visual-Linguistic Representations

作者：Yichao Zhou, Shaunak Mishra, Manisha Verma, Narayan Bhamidipati and Wei Wang

摘要：在線廣告行業中經常需要更新廣告創意，即用于吸引在線用戶進入品牌的圖像和文字。進行此類更新，是為了減少在線用戶中廣告疲勞的可能性，并將其他成功的廣告加入到相關產品類別中。對于創意策略師來說，給定一個品牌，為一個新的廣告想出主題是一個費時費力的過程。創意策略師來通常從過去廣告活動中使用的圖像和文字以及有關品牌的知識中汲取靈感。為了在過去的廣告活動中通過此類多模態信息自動推斷廣告主題，我們為廣告創意策略師提出了主題（關鍵詞）推薦系統。主題推薦器基于視覺問答（VQA）任務的聚合結果，該任務提取以下內容：（i）廣告圖像，（ii）與廣告關聯的文字以及廣告中品牌的Wikipedia頁面，（iii）有關廣告的問題。我們利用基于transformer的跨模態編碼器來為VQA任務訓練視覺語言表示。我們沿著分類和排序的思路研究了VQA任務的兩個公式；通過在公共數據集上的實驗，表明跨模態表示顯著地提高了分類準確率和排序精準-召回指標。與單獨的圖像和文本表示相比，跨模式表示顯示出更好的性能。此外，與僅使用文本或視覺信息相比，多模態信息的使用表現出顯著提升。

網址：

5. The Structure of Social Influence in Recommender Networks

作者：Pantelis P. Analytis, Daniel Barkoczi, Philipp Lorenz-Spreen and Stefan M. Herzog

摘要：人們在品味（taste）上影響他人意見的能力各不相同-既包括離線與在線推薦系統。這些驚人差異背后的機制是什么？使用加權k最近鄰算法（k-nn）表示一系列社會學習策略，我們利用網絡科學的方法展示了k-nn算法如何在六個現實世界的品味領域中引發社會影響力網絡。我們給出了三個新的結果，分別適用于離線建議獲取和在線推薦器設置。首先，有影響力的個人具有主流品味，與其他人的品味相似性分散度很高。其次，個人或算法咨詢的人越少(即k越低)，或者對其他更相似的人的意見給予的權重越大，具有實質性影響的人的群體就越小。第三，對部署k-nn算法后產生的影響網絡是分層組織的。我們的結果為通信和網絡科學中的經典實證發現提供了新的線索，有助于提高對線下和在線上的社會影響的理解。

網址：

6. Latent Linear Critiquing for Conversational Recommender Systems

作者：PKai Luo, Scott Sanner, Ga Wu, Hanze Li and Hojin Yang

摘要：批判（Critiquing）是一種用于會話推薦的方法，可根據用戶的偏好反饋迭代地調整建議。在該設置中，迭代地向用戶提供該項目的項目推薦和屬性描述；用戶可以接受該推薦，或者批判項目描述中的屬性以生成新的推薦。之前的批判方法主要基于顯式約束和基于實用程序的方法來修改推薦（評判的項目屬性）。在這篇文章中，我們回顧了基于潛在嵌入和主觀項目描述(即來自用戶評論的關鍵詞)的推薦方法時代的批判方法。主要兩個關鍵的研究問題：(1)如何將關鍵詞批判與用戶偏好嵌入一起嵌入以更新推薦，(2)如何調節多步驟批判性反饋的強度，其中批判性反饋不一定是獨立的，也不一定是同等重要的。為了解決(1)，我們構建了一個現有的最先進的線性嵌入推薦算法，以使基于評論的關鍵詞屬性與用戶偏好嵌入保持一致。為了解決(2)，我們利用嵌入和推薦預測的線性結構來建立一個基于線性規劃(LP)的優化問題，以確定納入批評反饋的最優權重。我們在兩個包含模擬用戶評論的推薦數據集上評估提出的框架。與對批判反饋進行平均的標準方法相比，實驗結果表明，我們的方法減少了找到滿意項目所需的交互次數，并提高了總體成功率。

網址：

付費5元查看完整內容

推薦系統 · WWW2020 ·

2020 年 4 月 7 日

[付費5元查看完整內容]近期必讀的5篇頂會WWW2020【推薦系統】相關論文-Part2

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

【導讀】國際萬維網大會（The Web Conference，簡稱WWW會議）是由國際萬維網會議委員會發起主辦的國際頂級學術會議，創辦于1994年，每年舉辦一屆，是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。本屆會議共收到了1129篇長文投稿，錄用217篇長文，錄用率為19.2%。近期，推薦相關也比較熱門，專知小編提前整理了WWW 2020 推薦系統比較有意思的的論文，供參考——序列推薦、可解釋Serendipity 推薦、推薦效率、 bandit推薦、Off-policy學習。 WWW2020RS_Part1

A Contextualized Temporal Attention Mechanism for Sequential Recommendation

作者：Jibang Wu, Renqin Cai, Hongning Wang

摘要：根據用戶的歷史連續行為預測用戶的偏好對于現代推薦系統來說是具有挑戰性的，也是至關重要的。現有的序列推薦算法在建模歷史事件對當前預測的影響時，大多側重于序列行為之間的過渡結構，而很大程度上忽略了時間和上下文信息。在這篇文章中，我們認為過去的事件對用戶當前行為的影響應該隨著時間的推移和不同的背景而變化。因此，我們提出了一種情境時間注意力機制（Contextualized Temporal Attention），該機制可以學習權衡歷史行為在行為以及行為發生的時間和方式上的影響。更具體地說，為了動態地校準來自自注意力機制的相對輸入的依賴關系，我們提出了多個參數化的核函數以學習各種時間動態，然后使用上下文信息來確定每個輸入要跟隨哪一個kernel（ reweighing kernels ）。在對兩個大型公開推薦數據集進行的實證評估中，我們的模型始終優于一系列最先進的序列推薦方法。

網址：

//arxiv.org/pdf/2002.00741.pdf

Directional and Explainable Serendipity Recommendation

作者：Xueqi Li, Wenjun Jiang, Weiguang Chen, Jie Wu, Guojun Wang, Kenli Li

摘要：近幾年來，Serendipity推薦越來越受到人們的關注，它致力于提供既能迎合用戶需求，又能開闊他們眼界的建議。然而，現有的方法通常使用標量而不是向量來度量用戶與項目的相關性，忽略了用戶的偏好方向，這增加了不相關推薦的風險。此外，合理的解釋增加了用戶的信任度和接受度，但目前沒有為Serendipity推薦提供解釋的工作。為了解決這些局限性，我們提出了一種有向的、可解釋的Serendipity推薦方法，稱為DESR。具體而言，首先采用基于高斯混合模型(GMM)的無監督方法提取用戶的長期偏好，然后利用膠囊（capsule ）網絡捕捉用戶的短期需求。然后，我們提出了將長期偏好與短期需求相結合的意外（serendipity）向量，并利用它生成有向的Serendipity推薦。最后，利用反向路徑選擇方案進行了解釋。在真實數據集上的大量實驗表明，與現有的基于意外（serendipity）發現的方法相比，DESR能夠有效地提高意外性和可解釋性，促進多樣性。

網址

LightRec: a Memory and Search-Efficient Recommender System

作者：Defu Lian, Haoyu Wang, Zheng Liu, Jianxun Lian, Enhong Chen, Xing Xie

摘要：近年來，深度推薦系統已經取得了顯著的進步。盡管具有出色的排名精度，但實際上運行效率和內存消耗在現實中卻是嚴重的瓶頸。為了克服這兩個瓶頸，我們提出了LightRec，這是一個輕量級的推薦系統，具有快速的在線推斷功能和經濟的內存消耗。LightRec的主干是總共B個codebooks，每個codebook均由W個潛在向量組成，稱為codewords。在這種結構的頂部，LightRec將有一個商品表示為B codewords的加法組合，這些B codewords是從每個codebook中選擇的最佳的。為了有效地從數據中學習codebooks，我們設計了一個端到端的學習工作流程，其中所提出的技術克服了固有差異性和多樣性方面的挑戰。另外，為了進一步提高表示質量，采用了幾種distillation策略，可以更好地保留用戶-商品的相關性得分和相對排名順序。我們對LightRec在四個真實數據集上進行了廣泛評估，得出了兩個經驗發現：1)與最先進的輕量級baseline相比，LightRec在召回性能方面取得了超過11%的相對改進；2)與傳統推薦算法相比，在top-k推薦算法中，LightRec的精度下降幅度可以忽略不計，但速度提高了27倍以上。

網址：

Hierarchical Adaptive Contextual Bandits for Resource Constraint based Recommendation

作者：Mengyue Yang, Qingyang Li, Zhiwei Qin, Jieping Ye

摘要：上下文多臂 bandit(MAB)在各種問題上實現了優異性能。然而，當涉及到推薦系統和在線廣告等現實場景時，必須考慮探索的資源消耗。在實踐中，通常存在與在環境中執行建議(ARM)相關聯的非零成本，因此，應該在固定的探索成本約束下學習策略。由于直接學習全局最優策略是一個NP難題，并且極大地使bandit算法的探索和開發之間的權衡復雜化，因此直接學習全局最優策略是一個很大的挑戰。現有的方法著重于通過采用貪婪策略來解決問題，該策略估計預期的收益和成本，并基于每個臂的預期收益/成本比使用貪婪的選擇，利用歷史觀察直到勘探資源耗盡為止。然而，現有的方法當沒有更多的資源時，學習過程就會終止，因此很難擴展到無限的時間范圍。本文提出了一種分層自適應上下文bandit方法(HATCH)來進行有預算約束的上下文bandit的策略學習。HATCH采用一種自適應的方法，根據剩余資源/時間和對不同用戶上下文之間報酬分配的估計來分配勘探資源。此外，我們利用充分的上下文特征信息來找到最好的個性化推薦。最后，為了證明提出的理論，我們進行了regret bound分析，并證明HATCH的regret bound低至O(√T)。實驗結果證明了該方法在合成數據集和實際應用中的有效性和效率。

網址：

Off-policy Learning in Two-stage Recommender Systems

作者：Jiaqi Ma, Zhe Zhao, Xinyang Yi, Ji Yang, Minmin Chen, Jiaxi Tang, Lichan Hong, Ed H. Chi

摘要：許多現實世界中的推薦系統需要高度可伸縮性：將數百萬個項目與數十億用戶進行匹配，并只具有毫秒級的延遲。可伸縮性的要求導致了廣泛使用的兩階段推薦系統，由第一階段高效的候選生成模型和第二階段更強大的排序模型組成。通常使用記錄的用戶反饋(例如，用戶點擊或停留時間)來構建用于推薦系統的候選生成和排名模型。雖然很容易收集大量這樣的數據，但因為反饋只能在以前系統推薦的項目上觀察到，因此這些數據在本質上是有偏見的。近年來，推薦系統研究領域對此類偏差的off-policy 修正引起了越來越多的關注。然而，現有的大多數工作要么假設推薦系統是一個單階段系統，要么只研究如何將離策略校正應用于系統的候選生成階段，而沒有顯式地考慮這兩個階段之間的相互作用。在這項工作中，我們提出了一種兩階段離策略（two-stage off-policy）策略梯度方法，并證明了在兩階段推薦系統中忽略這兩個階段之間的交互會導致次優策略。該方法在訓練候選生成模型時明確考慮了排序模型，有助于提高整個系統的性能。我們在具有大項目空間的真實數據集上進行了實驗，驗證了所提方法的有效性。

網址：

付費5元查看完整內容

WWW · 個性化推薦系統 ·

2020 年 2 月 25 日

[付費5元查看完整內容]近期必讀的6篇AI頂會WWW2020【推薦系統】相關論文

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

【導讀】國際萬維網大會（The Web Conference，簡稱WWW會議）是由國際萬維網會議委員會發起主辦的國際頂級學術會議，創辦于1994年，每年舉辦一屆，是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。本屆會議共收到了1129篇長文投稿，錄用217篇長文，錄用率為19.2%。上周專知小編提前整理了WWW 2020圖神經網絡(GNN)比較有意思的的論文，這期小編繼續為大家奉上WWW 2020推薦相關論文供參考！ WWW2020GNN

Correcting for Selection Bias in Learning-to-rank Systems

作者：Zohreh Ovaisi, Ragib Ahsan, Yifan Zhang, Kathryn Vasilaky and Elena Zheleva

摘要：現代推薦系統收集到的點擊數據是用來訓練學習排名(LTR)系統的觀察數據的重要來源。然而，這些點擊數據會受到許多偏差（bias）的影響，這些偏差可能會導致LTR系統的性能變差。在此類系統中，最近的偏差校正（bias correction）方法主要集中在位置偏差上，即雖然不是用戶查詢最相關的，但排名較高的結果（例如，頂級搜索引擎結果）更可能被點擊。由于所點擊的文檔反映了什么文檔首先向用戶展示，因此大部分方法對校正選擇偏差的關注較少。在本文中，我們提出了新的方法，這些方法可以適應Heckman的兩階段方法，并考慮LTR系統中的選擇偏差和位置偏差。我們的實驗評估表明，與現有的無偏LTR算法相比，我們提出的方法對噪聲的魯棒性更高，并且具有更好的準確性，尤其是在存在中度偏差到無位置偏差的情況下。

網址： //arxiv.org/abs/2001.11358

Efficient Neural Interaction Function Search for Collaborative Filtering

作者：Quanming Yao, Xiangning Chen, James T. Kwok, Yong Li and Cho-Jui Hsieh

摘要：在協同過濾(CF)中，交互函數(IFC)扮演著捕獲項目和用戶之間交互的重要角色。最流行的交互函數(IFC)是內積，它已經成功地應用于低階矩陣分解。然而，現實世界應用中的交互可能非常復雜。因此，可以提供更好性能的操作(例如：串聯和級聯)被提出。然而，現有的IFC仍然很難在不同的應用場景中保持一致的良好性能。受AutoML的啟發，本文提出在CF中尋找簡單神經交互函數(SIF)。通過對現有CF方法的研究和推廣，設計了一種具有表現力的SIF搜索空間，并將其表示為結構化的多層感知機。我們提出了一種one-shot搜索算法，可以同時更新體系結構和學習參數。實驗結果表明，所提出的方法比流行的AutoML方法效率更高，比最新的CF方法可以獲得更好的預測性能，并且可以針對不同的數據集和任務發現不同的IFC。

網址：

Influence Function based Data Poisoning Attacks to Top-N Recommender Systems

作者：Minghong Fang, Neil Zhenqiang Gong and Jia Liu

摘要：推薦系統是Web服務中吸引用戶的重要組成部分。流行的推薦系統使用大量眾包用戶-項目交互數據(例如評級得分)對用戶偏好和項目屬性進行建模；然后，將與用戶偏好最匹配的前N個項目推薦給用戶。在這項工作中，我們展示了攻擊者可以通過向虛假用戶注入精心制作的用戶-項目交互數據，對推薦系統發起數據中毒攻擊，從而按照攻擊者的意愿進行推薦。具體地說，攻擊者可以誘導推薦系統向盡可能多的普通用戶推薦目標項目。我們關注已經在行業中得到了廣泛的應用的基于矩陣分解的推薦系統。給定攻擊者可以注入的虛假用戶數量，我們將虛假用戶評分的制定過程描述為一個優化問題。但是，該優化問題是一個非凸整數規劃問題，求解起來很有挑戰性。為了解決這一挑戰，我們開發了幾種技術來近似解決優化問題。例如，我們利用影響函數（influence function）來選擇對推薦有影響力的普通用戶子集，并基于這些有影響力的用戶來解決我們制定的優化問題。實驗結果表明，我們的攻擊是有效的，并且優于現有的方法。

網址：

Learning Multi-granular Quantized Embeddings for Large-Vocab Categorical Features in Recommender Systems

作者：Wang-Cheng Kang,Derek Zhiyuan Cheng, Ting Chen, Xinyang Yi, Dong Lin, Lichan Hong and Ed H. Chi

摘要：推薦系統模型通常通過嵌入來表示像用戶、項目和分類特征這類的稀疏特征。標準方法是將每個唯一的特征值映射為嵌入向量。所產生的嵌入表的大小隨著詞匯表的大小線性增長。因此，大詞匯量不可避免地會導致巨大的嵌入表，從而產生兩個嚴重的問題：(I)使服務于資源緊張環境中的模型變得難以處理；（ii）造成過擬合的問題。在本文中，我們致力于學習用于推薦系統（recsys）中大型詞匯稀疏特征的高度簡潔的嵌入。首先，我們證明了新的可微積量化( Differentiable Product Quantization，DPQ)方法可以推廣到Recsys問題。此外，為了更好地處理Recsys中常見的冪律數據分布，我們提出了一種多粒度量化嵌入(MGQE)技術，該技術對不頻繁的項目學習更簡單的嵌入。我們嘗試以簡單的模型規模為提高推薦性能提供一個新的角度。在三個推薦任務和兩個數據集上的大量實驗表明，我們可以用原始模型規模的20%的模型獲得與原模型相當甚至更好的性能。

網址：

Beyond Clicks: Modeling Multi-Relational Item Graph for Session-Based Target Behavior Prediction

作者：Wen Wang, Wei Zhang, Shukai Liu, Bo Zhang, Leyu Lin and Hongyuan Zha

摘要：基于會話的目標行為預測旨在預測要與特定行為類型（例如，點擊）進行交互的下一個項目。雖然現有的基于會話的行為預測方法利用強大的表示學習方法來編碼項目在低維空間中的順序相關性，但是它們受到一些限制。首先，它們側重于只利用同一類型的用戶行為進行預測，而忽略了將其他行為數據作為輔助信息的潛力。當目標行為稀疏但很重要(例如，購買或共享物品)時，這一點尤為重要。其次，項目到項目的關系是在一個行為序列中單獨和局部建模的，缺乏一種規定的方法來更有效地全局編碼這些關系。為了克服這些局限性，我們提出了一種新的基于會話的目標行為預測的多關系圖神經網絡模型MGNN-SPred。具體地說，我們基于來自所有會話的所有行為序列(涉及目標行為類型和輔助行為類型)構建多關系項目圖(Multi-Relational Item Graph，MRIG)。在MRIG的基礎上，MGNN-SPred學習全局項目與項目之間的關系，進而獲得用戶偏好。即分別為當前目標行為序列和輔助行為序列。最后，MGNN-SPred利用門控機制自適應地融合用戶表示，以預測與目標行為交互的下一項目。在兩個真實數據集上的廣泛實驗證明了MGNN-SPred與最新的基于會話的預測方法相比的優越性，驗證了利用輔助行為和基于MRIG學習項目到項目關系的優點。

網址：

Towards Detection of Subjective Bias using Contextualized Word Embeddings

作者：Tanvi Dadu, Kartikey Pant and Radhika Mamidi

摘要：主觀偏見檢測（Subjective bias detection）對于宣傳檢測、內容推薦、情感分析和偏見消除等應用至關重要。這種偏見是在自然語言中通過煽動性的詞語和短語引入的，使人對事實產生懷疑，并預設事實。在這項工作中，我們在維基中立性語料庫(WNC)上使用基于BERT的模型進行了全面的主觀偏見檢測實驗。數據集為36萬個來自維基百科并刪除了各種偏見的標記實例組成。我們進一步提出了基于BERT的集成，其性能優于BERT_large之類的最新方法5.6 F1 score。