欧美成人性色XXⅩXXA片在线,H漫全彩纯肉无码

【導讀】CCF A類會議，國際萬維網大會WWW 2020（International World Wide Web Conference）于2020年4月20日至24日在中國臺灣舉行。碰到疫情，WWW采用在線舉行。剛剛最佳論文一系列獎項出爐了！來自俄亥俄州立大學的開放意圖抽取《 Open Intent Extraction from Natural Language Interactions》獲得最佳論文，北京郵電大學的移動App占位《Mobile App Squatting 》獲得最佳學生論文！

「最佳論文獎」(Best Paper Award)

自然語言交互的開放意圖提取 Open Intent Extraction from Natural Language Interactions

作者: Nikhita Vedula , Nedim Lipka , Pranav Maneriker , Srinivasan Parthasarathy Authors Info & Affiliations

摘要：準確地從用戶的書面或口頭語言中發現他們的意圖在自然語言理解和自動對話響應中扮演著重要的角色。大多數現有的研究將其建模為每個話語都有一個意圖標簽的分類任務，將用戶的話語從一組已知的類別中分組為一個單一的意圖類型。在此基礎上，我們定義并研究了公開意圖發現的新問題。它涉及到從文本話語中發現一個或多個通用的意圖類型，這些類型可能在訓練中沒有遇到。我們提出了一種新領域無關的方法OPINE，它將問題表述為開放世界環境下的一個序列標記任務。它在雙向LSTM上使用CRF來以一致的格式提取意圖，受意圖標簽標簽之間的約束。我們用了一個多頭自注意力機制來有效地學習遠處單詞之間的依賴關系。我們進一步使用對抗性訓練來提高性能，并在不同的領域強有力地適應我們的模型。最后，我們策劃并計劃發布一個開放的意圖注釋數據集，包含25K個跨越不同領域的真實話語。大量的實驗表明，我們的方法優于最先進的基線5-15%的F1得分點。我們還演示了OPINE在識別多個不同的域意圖方面的有效性，每個域的訓練示例有限(也可以為零)。

//dl.acm.org/doi/10.1145/3366423.3380268

「最佳學生論文獎」(Best Student Paper Award)

移動App占位 Mobile App Squatting

Authors: Yangyu Hu , Haoyu Wang , Ren He , Li Li , Gareth Tyson , Ignacio Castro , Yao Guo , Lei Wu , Guoai Xu

域名占用是攻擊者模仿流行域名注冊的一種對抗策略，已經被觀察了幾十年。然而，越來越多的證據表明，這種攻擊方式已經蔓延到其他領域。在這篇文章中，我們探討了占用攻擊在移動應用生態系統中的存在。在“App Squatting”中，攻擊者發布的帶有標識符(如App名稱或包名)的應用，與流行應用或知名互聯網品牌的應用混淆不清。本文首次對app占用進行了深入的測量研究，揭示了app占位的流行及其意義。我們首先確定了app squatters常用的11種變形方式，并提出了一種名為“AppCrazy”的app標識符自動生成工具。我們將AppCrazy應用到谷歌Play中最受歡迎的500個應用中，生成了224,322個變形關鍵字，然后我們將這些變形關鍵字用于測試流行市場上的app非法占位者。通過這個，我們確認了問題的規模，確定了10553個占用應用程序(平均每個合法應用程序超過20個占位程序)。我們的調查顯示，超過51%的非法占用應用程序是惡意的，其中一些非常受歡迎(高達1000萬次下載)。同時，我們也發現移動應用市場在識別和消除非法占用應用方面并不成功。我們的發現表明了識別和防止濫用app的緊迫性。為此，我們已經公開發布了所有識別出的占位應用程序，以及我們的工具AppCrazy。

付費5元查看完整內容

相關內容

WWW2020

關注 5

CVPR 2020 · 最佳論文 · 最佳學生論文 ·

2020 年 6 月 17 日

[付費5元查看完整內容]CVPR 2020 最佳論文與最佳學生論文！

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

最佳論文：Unsupervised Learning of Probably Symmetric Deformable 3D Objects from Images in the Wild

最佳論文提出了一種無需外部監督即可從原始單視圖圖像中學習3D變形對象的方法。該方法基于自動編碼器，該自動編碼器將每個輸入圖像分解為深度，反射率，視角和照明。為了在無監督的情況下解構這些組件，作者使用了以下事實：許多對象類別至少在原則上具有對稱結構。

作者通過光照的推理來利用底層對象的對稱性，即使外觀由于陰影而不對稱。接著通過預測對稱概率圖來建模可能（但不一定）對稱的對象，并與模型的其他組件聯合起來進行端到端的學習。實驗表明該方法可以從單視圖圖像中非常準確地恢復人臉，貓臉和汽車的3D形狀，而無需任何監督或預先設定的形狀模型。

最佳論文一作Shangzhe Wu，是來自牛津大學視覺幾何組的二年級學生，由 Andrea Vedaldi 教授指導獲得了 Facebook 研究所的全額獎學金。在 HKUST 讀本科期間，曾與Chi-Keung Tang教授和Yu-Wing Tai 教授合作研究圖像翻譯 / 生成，現在主要的研究方向為無監督 / 自監督的3D 理解。Shangzhe Wu曾于2017年11月 -2018年2月，在騰訊優圖實驗室做機器學習實習生。

最佳學生論文: BSP-Net: Generating Compact Meshes via Binary Space Partitioning BSP-Net：通過二叉空間分割生成緊湊網絡

這篇論文的角度十分新穎，從多邊形網格入手，基于計算機圖形學的經典空間數據結構Binary Space Partitioning（BSP）來設計了一個BSP-Net。這個網絡可通過凸分解來學習表示3D形狀，并且不受監督，因此訓練不需要進行凸形分解。BSP-Net的重建質量有很大的優勢，并且很容易能夠進行參數設置。

論文一作是來自Simon Fraser University的博士一年級學生Zhiqin Chen，師從張皓教授，從事計算機圖形學相關的研究，主要研究方向是幾何建模和機器學習。Chen于2017年從上海交通大學本科畢業，于2019年從Simon Fraser University碩士畢業。

付費5元查看完整內容

SIGIR2020 · 圖神經網絡 · 推薦系統 ·

2020 年 6 月 2 日

[付費5元查看完整內容]近期必讀的六篇SIGIR 2020【圖神經網絡 +推薦(GNN+RS) 】相關論文

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

【導讀】作為CCF推薦的A類國際學術會議，International ACM SIGIR Conference on Research and Development in Information Retrieval（國際計算機學會信息檢索大會，簡稱 SIGIR）在信息檢索領域享有很高的學術聲譽，每年都會吸引全球眾多專業人士參與。今年的 SIGIR 2020計劃將于 2020年7月25日~30日在中國西安舉行。本次大會共有555篇長文投稿，僅有147篇長文被錄用，錄用率約26%。專知小編提前為大家整理了六篇SIGIR 2020 基于圖神經網絡的推薦（GNN+RS）相關論文，這六篇論文分別出自中科大何向南老師和和昆士蘭大學陰紅志老師團隊，供大家參考——捆綁推薦、Disentangled GCF、服裝推薦、多行為推薦、全局屬性GNN

CVPR2020SGNN、CVPR2020GNN_Part2、CVPR2020GNN_Part1、WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN、EMNLP2019GNN、ICCV2019GNN_Part2、ICCV2019GNN_Part1、NIPS2019GNN、IJCAI2019GNN_Part1、IJCAI2019GNN_Part2、KDD2019GNN、ACL2019GNN、CVPR2019GNN

1. Bundle Recommendation with Graph Convolutional Networks

作者：Jianxin Chang, Chen Gao, Xiangnan He, Yong Li, Depeng Jin

摘要：捆綁推薦（Bundle recommendation ）旨在推薦一組商品供用戶整體消費。現有的解決方案通過共享模型參數或多任務學習的方式將用戶項目交互建模集成到捆綁推薦中，然而，這些方法不能顯式建模項目與捆綁包（bundles）之間的隸屬關系，不能探索用戶選擇捆綁包時的決策。在這項工作中，我們提出了一個用于捆綁推薦的圖神經網絡模型BGCN(Bundle Graph Convolutional Network)。BGCN將用戶-項目交互、用戶-捆綁包交互和捆綁包-項目從屬關系統一到一個異構圖中。以項目節點為橋梁，在用戶節點和捆綁包節點之間進行圖卷積傳播，使學習到的表示能夠捕捉到項目級的語義。通過基于hard-negative采樣器的訓練，可以進一步區分用戶對相似捆綁包的細粒度偏好。在兩個真實數據集上的實驗結果表明，BGCN的性能有很高的提升，其性能比最新的基線高出10.77%到23.18%。

網址： //arxiv.org/abs/2005.03475

2. Disentangled Graph Collaborative Filtering

作者：Xiang Wang, Hongye Jin, An Zhang, Xiangnan He, Tong Xu, Tat-Seng Chua

摘要：從交互數據中學習用戶和項目的信息表示對于協同過濾(CF)至關重要。當前的嵌入函數利用用戶-項目關系來豐富表示，從單個用戶-項目實例演變為整體交互圖。然而，這些方法在很大程度上以統一的方式對關系進行建模，而忽略了用戶采用這些項目的意圖的多樣性，這可能是為了打發時間，為了興趣，或者為其他人(如家庭)購物。這種統一的對用戶興趣建模的方法很容易導致次優表示，不能對不同的關系建模并在表示中分清用戶意圖。在這項工作中，我們特別關注用戶意圖細粒度上的用戶-項目關系。因此，我們設計了一種新的模型- Disentangled圖協同過濾(Disentangled Graph Collaborative Filtering ,DGCF)，來理清這些因素并產生disentangled的表示。具體地說，通過在每個用戶-項目交互意圖上的分布建模，我們迭代地細化意圖感知的交互圖和表示。同時，我們鼓勵不同的意圖獨立。這將生成disentangled的表示，有效地提取與每個意圖相關的信息。我們在三個基準數據集上進行了廣泛的實驗，DGCF與NGCF、DisenGCN和MacridV AE這幾個最先進的模型相比取得了顯著的改進。進一步的分析揭示了DGCF在分解用戶意圖和表示的可解釋性方面的優勢。

網址：

代碼鏈接：

3. GCN-Based User Representation Learning for Unifying Robust Recommendation and Fraudster Detection

作者：Shijie Zhang, Hongzhi Yin, Tong Chen, Quoc Viet Nguyen Hung, Zi Huang, Lizhen Cui

摘要：近年來，推薦系統已經成為所有電子商務平臺中不可缺少的功能。推薦系統的審查評級數據通常來自開放平臺，這可能會吸引一群惡意用戶故意插入虛假反饋，試圖使推薦系統偏向于他們。此類攻擊的存在可能會違反高質量數據始終可用的建模假設，而這些數據確實會影響用戶的興趣和偏好。因此，構建一個即使在攻擊下也能產生穩定推薦的健壯推薦系統具有重要的現實意義。本文提出了一種基于GCN的用戶表示學習框架GraphRf，該框架能夠統一地進行穩健的推薦和欺詐者檢測。在其端到端學習過程中，用戶在欺詐者檢測模塊中被識別為欺詐者的概率自動確定該用戶的評級數據在推薦模塊中的貢獻；而在推薦模塊中輸出的預測誤差作為欺詐者檢測模塊中的重要特征。因此，這兩個組成部分可以相互促進。經過大量的實驗，實驗結果表明我們的GraphRf在魯棒評級預測和欺詐者檢測這兩個任務中具有優勢。此外，所提出的GraphRf被驗證為對現有推薦系統上的各種攻擊具有更強的魯棒性。

網址：

4. Hierarchical Fashion Graph Network for Personalized Outfit Recommendation

作者：Xingchen Li, Xiang Wang, Xiangnan He, Long Chen, Jun Xiao, Tat-Seng Chua

摘要：服裝推薦越來越受到網購服務商和時尚界的關注。與向用戶推薦單個單品(例如，朋友或圖片)的其他場景(例如，社交網絡或內容共享)不同，服裝推薦預測用戶對一組匹配良好的時尚單品的偏好。因此，進行高質量的個性化服裝推薦應滿足兩個要求：1)時尚單品的良好兼容性；2)與用戶偏好的一致性。然而，目前的研究主要集中在其中一個需求上，只考慮了用戶-全套服裝（outfit）或全套服裝-項目的關系，從而容易導致次優表示，限制了性能。在這項工作中，我們統一了兩個任務，服裝兼容性建模和個性化服裝推薦。為此，我們開發了一個新的框架，層次時尚圖網絡(HFGN)，用于同時建模用戶、商品和成套服裝之間的關系。特別地，我們構建了一個基于用戶-全套服裝交互和全套服裝-項目映射的層次結構。然后，我們從最近的圖神經網絡中得到啟發，在這種層次圖上使用嵌入傳播，從而將項目信息聚合到一個服裝表示中，然后通過他/她的歷史服裝來提煉用戶的表示。此外，我們還對這兩個任務進行了聯合訓練，以優化這些表示。為了證明HFGN的有效性，我們在一個基準數據集上進行了廣泛的實驗，HFGN在NGNN和FHN等最先進的兼容性匹配模型基礎上取得了顯著的改進。

網址：

代碼鏈接：

5. Multi-behavior Recommendation with Graph Convolutional Networks

作者：Bowen Jin, Chen Gao, Xiangnan He, Depeng Jin, Yong Li

摘要：傳統的推薦模型通常只使用一種類型的用戶-項目交互，面臨著嚴重的數據稀疏或冷啟動問題。利用多種類型的用戶-項目交互(例如：點擊和收藏)的多行為推薦可以作為一種有效的解決方案。早期的多行為推薦研究未能捕捉到行為對目標行為的不同程度的影響。它們也忽略了多行為數據中隱含的行為語義。這兩個限制都使得數據不能被充分利用來提高對目標行為的推薦性能。在這項工作中，我們創新性地構造了一個統一的圖來表示多行為數據，并提出了一種新的模型--多行為圖卷積網絡(Multi-Behavior Graph Convolutional Network，MBGCN)。MBGCN通過用戶-項目傳播層學習行為強度，通過項目-項目傳播層捕獲行為語義，較好地解決了現有工作的局限性。在兩個真實數據集上的實驗結果驗證了該模型在挖掘多行為數據方面的有效性。我們的模型在兩個數據集上的性能分別比最優基線高25.02%和6.51%。對冷啟動用戶的進一步研究證實了該模型的實用性。

網址：

6. GAG: Global Atributed Graph Neural Network for Streaming Session-based Recommendation

作者：Ruihong Qiu, Hongzhi Yin, Zi Huang, Tong Chen

摘要：基于流會話的推薦(Streaming session-based recommendation，SSR)是一項具有挑戰性的任務，它要求推薦器系統在流媒體場景（streaming scenario）中進行基于會話的推薦(SR)。在電子商務和社交媒體的現實應用中，在一定時間內產生的一系列用戶-項目交互被分組為一個會話，這些會話以流的形式連續到達。最近的SR研究大多集中在靜態集合上，即首先獲取訓練數據，然后使用該集合來訓練基于會話的推薦器模型。他們需要對整個數據集進行幾個epoch的訓練，這在流式設置下是不可行的。此外，由于對用戶信息的忽視或簡單使用，它們很難很好地捕捉到用戶的長期興趣。雖然最近已經提出了一些流推薦策略，但它們是針對個人交互流而不是會話流而設計的。本文提出了一種求解SSR問題的帶有Wasserstein 庫的全局屬性圖(GAG)神經網絡模型。一方面，當新的會話到達時，基于當前會話及其關聯用戶構造具有全局屬性的會話圖。因此，GAG可以同時考慮全局屬性和當前會話，以了解會話和用戶的更全面的表示，從而在推薦中產生更好的性能。另一方面，為了適應流會話場景，提出了Wasserstein庫來幫助保存歷史數據的代表性草圖。在兩個真實數據集上進行了擴展實驗，驗證了GAG模型與最新方法相比的優越性。

網址：

付費5元查看完整內容

WWW2020 · 遷移學習 ·

2020 年 4 月 29 日

[付費5元查看完整內容]近期必讀的6篇頂會WWW 2020【遷移學習（Transfer Learning）】相關論文

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

【導讀】國際萬維網大會（The Web Conference，簡稱WWW會議）是由國際萬維網會議委員會發起主辦的國際頂級學術會議，創辦于1994年，每年舉辦一屆，是CCF-A類會議。WWW 2020已于2020年4月20日至4月24日在中國臺灣臺北舉行。會議論文集已經公開，大家可以自己查看感興趣的論文，專知小編繼續整理WWW 2020 系列論文，這期小編為大家奉上的是WWW 2020六篇遷移學習（Transfer Learning）相關論文，供大家參考！——主動域遷移、多任務域遷移、類別注意力遷移網絡、多模態域遷移、跨域推薦、跨域欺詐檢測。

WWW 2020 會議論文集： //dl.acm.org/doi/proceedings/10.1145/3366423

WWW2020KG+GNN、WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN、EMNLP2019GNN、ICCV2019GNN_Part2、ICCV2019GNN_Part1、NIPS2019GNN、IJCAI2019GNN_Part1、IJCAI2019GNN_Part2、KDD2019GNN、ACL2019GNN、CVPR2019GNN、ICML2019GNN

CCF-A類頂會WWW2020最佳論文出爐！OSU最佳論文，北郵斬獲最佳學生論文！

1. Active Domain Transfer on Network Embedding

作者：Lichen Jin, Yizhou Zhang, Guojie Song, Yilun Jin

摘要：最近的工作表明，端到端、監督(半監督)的網絡嵌入模型可以生成令人滿意的向量來表示網絡拓撲，甚至可以通過歸納學習（inductive learning）適用于未知（unseen）的圖。然而，歸納學習的訓練網絡和測試網絡之間的域不匹配，以及缺乏標記數據，會影響這種方法的結果。相應地能夠解決上述問題的遷移學習和主動學習（active learning）技術已經在常規獨立同分布數據上得到了很好的研究，而它們在網絡上的關注相對較少。因此，本文提出了一種網絡上的主動遷移學習方法，稱為主動遷移網絡嵌入(Active-Transfer Network Embedding，ATNE)。在ATNE中，我們從遷移和主動學習兩個角度綜合考慮各個節點對網絡的影響，從而在訓練過程中結合這兩個方面設計新穎有效的影響分值以方便節點的選擇。我們證明了ATNE是有效的，并且與實際使用的模型是解耦的。進一步的實驗表明，ATNE的性能優于最新的主動節點選擇方法，并且在不同的情況下表現出了通用性。

網址：

2. Anchored Model Transfer and Soft Instance Transfer for Cross-Task Cross-Domain Learning: A Study Through Aspect-Level Sentiment Classification

作者：Yaowei Zheng, Richong Zhang, Suyuchen Wang, Samuel Mensah, Yongyi Mao

摘要：監督學習在很大程度上依賴于容易獲得的標記數據來推斷有效的分類函數。然而，在有監督學習下提出的方法面臨領域內標注數據稀缺的問題，且通用性不夠強，不能適用于其他任務。通過允許跨域和跨任務共享知識，遷移學習已被證明是解決這些問題的一個有價值的選擇。通過允許跨域和跨任務共享知識，遷移學習已被證明是解決上述問題的一個有價值的選擇。本文提出了Anchored Model遷移(AMT)和Soft Instance遷移(SIT)兩種遷移學習方法，這兩種學習方法都是基于多任務學習，兼顧了模型遷移和實例遷移，可以結合到一個通用的框架中。我們證明了AMT和SIT對于aspect-level的情感分類的有效性，在基準數據集上我們的模型表現出比基線模型更有競爭力的表現。有趣的是，AMT + SIT的集成可在同一任務上實現最先進的性能。

網址：

Domain Adaptation with Category Attention Network for Deep Sentiment Analysis

作者：Dongbo Xi, Fuzhen Zhuang, Ganbin Zhou, Xiaohu Cheng, Fen Lin, Qing He

摘要：跨域情感分類等領域自適應任務旨在利用源域中已有的已標記數據和目標域中未標記或很少的標記數據，通過減少數據分布之間的偏移來提高目標域的性能。現有的跨領域情感分類方法需要區中心點（pivots）(即領域共享的情感詞)和非中心點(即領域特定的情感詞)，才能獲得良好的自適應性能。本文首先設計了一個類別注意網絡(CAN)，然后提出了一種將CAN和卷積神經網絡(CNN)相結合的CAN-CNN模型。該模型一方面將中心點和非中心點作為統一的類別屬性詞進行自動捕獲，提高領域自適應性能；另一方面，對遷移后的類別屬性詞進行可解釋性學習的嘗試。具體地說，該模型的優化目標有三個不同的組成部分：1)監督分類損失；2)類別特征權重的分布損失；3)領域不變性損失。最后，在三個輿情分析數據集上對所提出的模型進行了評估，結果表明CAN-CNN的性能優于其他各種基線方法。

網址：

4. Domain Adaptive Multi-Modality Neural Attention Network for Financial Forecasting

作者：Dawei Zhou, Lecheng Zheng, Yada Zhu, Jianbo Li, Jingrui He

摘要：金融時間序列分析在優化投資決策、對沖市場風險方面起著核心作用。這是一項具有挑戰性的任務，因為問題總是伴隨著雙層(即數據級和任務級)的異構性。例如，在股價預測中，一個成功的具有有限風險的投資組合通常由來自不同領域(如公用事業、信息技術、醫療保健等)的大量股票組成，每個領域的股票預測可以視為一個任務；在一個投資組合中，每個股票的特征是從多個模態(例如金融、天氣和新聞)收集的時間數據，這對應于數據層的異構性。此外，金融業遵循高度監管的過程，這就要求預測模型是可解釋的，輸出結果必須滿足合規性。因此，一個自然的研究問題就是如何建立一個模型，既能在解決此類多通道多任務學習問題時取得滿意的性能，又能為最終用戶提供全面的解釋。為了回答這個問題，本文提出了一個通用的時間序列預測框架Dandelion，它利用多模態的一致性，并使用深度神經網絡來探索多個任務的相關性。此外，為了保證框架的可解釋性，我們集成了一種新的三位一體的注意機制，允許最終用戶在三個維度(即任務、通道和時間)上調查變量重要性。廣泛的實證結果表明，Dandelion在過去15年中對來自4個不同領域的396只股票的金融市場預測取得了優異的表現。具體地說，兩個有趣的案例研究顯示了Dandelion在其盈利表現和輸出結果對最終用戶的可解釋性方面的成效。

網址：

5. Exploiting Aesthetic Preference in Deep Cross Networks for Cross-domain Recommendation

作者：Jian Liu, Pengpeng Zhao, Fuzhen Zhuang, Yanchi Liu, Victor S. Sheng, Jiajie Xu, Xiaofang Zhou, Hui Xiong

摘要：產品的視覺美學在購買外觀優先的產品(如服裝)的決策過程中起著重要的作用。用戶的審美偏好作為一種個性特征和基本要求，是與領域無關的，可以作為領域間知識遷移的橋梁。然而，現有的工作很少考慮產品圖像中的審美信息進行跨域推薦。為此，本文提出了一種新的深度審美跨域網絡(ACDN)，通過跨網絡共享表征個人審美偏好的參數來實現領域間的知識傳遞。具體地說，我們首先利用審美網絡來提取審美特征。然后，我們將這些特征集成到一個跨域網絡中，以傳遞用戶與領域無關的審美偏好。此外，還引入了網絡交叉連接，以實現跨域的雙重知識轉移。最后，在真實數據集上的實驗結果表明，我們提出的模型ACDN在推薦準確率方面優于基準方法。

網址：

6. Modeling Users’ Behavior Sequences with Hierarchical Explainable Network for Cross-domain Fraud Detection

作者：Yongchun Zhu, Dongbo Xi, Bowen Song, Fuzhen Zhuang, Shuai Chen, Xi Gu, Qing He

摘要：隨著電子商務行業的爆炸式增長，檢測現實應用中的網絡交易欺詐對電子商務平臺的發展變得越來越重要。用戶的連續行為歷史為區分欺詐支付和正常支付提供了有用的信息。最近，已經提出了一些方法來解決這一基于序列的欺詐檢測問題。然而，這些方法通常存在兩個問題：預測結果難以解釋和對行為內部信息的利用不足。針對上述兩個問題，本文提出了一種分層可解釋網絡(HEN)對用戶行為序列進行建模，不僅提高了欺詐檢測的性能，而且使推理過程具有可解釋性。同時，隨著電子商務業務擴展到新的領域，例如，新的國家或新的市場，在欺詐檢測系統中建模用戶行為的一個主要問題是數據收集的限制（例如，可用的數據/標簽非常少）。因此，在本文中，我們進一步提出了一個跨域欺詐檢測問題的遷移框架，該框架的目的是從現有領域(源域)遷移足夠成熟數據的知識，以提高在新領域(目標域)的性能。我們提出的方法是一個通用的遷移框架，它不僅可以應用于HEN，而且可以應用于嵌入&MLP范式中的各種現有模型。利用世界領先的跨境電商平臺的數據，我們在不同國家進行了廣泛的檢測盜卡交易詐騙的實驗，以展示HEN的優越性能。此外，基于90個遷移任務的實驗，證明了我們的遷移框架不僅可以用于HEN的跨域詐騙檢測任務，而且對現有的各種模型都具有通用性和可擴展性。此外，HEN和遷移框架形成了三個級別的注意力，極大地提高了檢測結果的可解釋性。

網址：

付費5元查看完整內容

WWW2020 ·

2020 年 4 月 21 日

[付費5元查看完整內容]近期必讀的5篇頂會WWW 2020【知識圖譜+圖神經網絡（KG+GNN）】相關論文

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

【導讀】國際萬維網大會（The Web Conference，簡稱WWW會議）是由國際萬維網會議委員會發起主辦的國際頂級學術會議，創辦于1994年，每年舉辦一屆，是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。本屆會議共收到了1129篇長文投稿，錄用217篇長文，錄用率為19.2%。這周會議已經召開，會議論文集已經公開，大家可以自己查看感興趣的論文，專知小編繼續整理WWW 2020 系列論文，這期小編為大家奉上的是WWW 2020五篇知識圖譜+圖神經網絡（KG+GNN）相關論文，供大家參考！——多關系實體對齊、問答推理、動態圖實體鏈接、序列實體鏈接、知識圖譜補全。

WWW 2020 會議論文集： //dl.acm.org/doi/proceedings/10.1145/3366423

WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN、EMNLP2019GNN、ICCV2019GNN_Part2、ICCV2019GNN_Part1、NIPS2019GNN、IJCAI2019GNN_Part1、IJCAI2019GNN_Part2、KDD2019GNN、ACL2019GNN、CVPR2019GNN、ICML2019GNN

Collective Multi-type Entity Alignment Between Knowledge Graphs

作者：Qi Zhu, Hao Wei, Bunyamin Sisman, Da Zheng, Christos Faloutsos, Xin Luna Dong and Jiawei Han

摘要：知識圖(如Freebase、Yago)是表示各類實體之間豐富真實信息的多關系圖。實體對齊是實現多源知識圖集成的關鍵步驟。它旨在識別涉及同一真實世界實體的不同知識圖中的實體。然而，現有的實體對齊系統忽略了不同知識圖的稀疏性，不能通過單一模型對多類型實體進行對齊。在本文中，我們提出了一種用于多類型實體對齊的聯合圖神經網絡（Collective Graph neural network），稱為CG-MuAlign。與以前的工作不同，CG-MuAlign聯合對齊多種類型的實體，共同利用鄰域信息并將其推廣到未標記的實體類型。具體地說，我們提出了一種新的集中聚集函數1)通過交叉圖和自注意力來緩解知識圖的不完全性，2）通過小批量訓練范例和有效的鄰域抽樣策略，有效地提高了可伸縮性。我們在具有數百萬個實體的真實知識圖上進行了實驗，觀察到了比現有方法更優越的性能。此外，我們的方法的運行時間比目前最先進的深度學習方法要少得多。

網址：

Complex Factoid Question Answering with a Free-Text Knowledge Graph

作者：Chen Zhao, Chenyan Xiong, Xin Qian and Jordan Boyd-Graber

摘要：我們介紹了Delft，一個事實問答系統，它將知識圖問答方法的細微和深度與更廣泛的free-文本結合在一起。Delft從Wikipedia構建了一個自由文本知識圖，以實體為節點和句子，其中實體同時出現做為邊。對于每個問題，Delft使用文本句子作為邊，找到將問題實體節點鏈接到候選對象的子圖，創建了密集且覆蓋率高的語義圖。一種新穎的圖神經網絡在free-文本圖上進行推理-通過沿邊句子的信息組合節點上的證據-以選擇最終答案。在三個問答數據集上的實驗表明，Delft能夠比基于機器閱讀的模型、基于BERT的答案排序和記憶網絡更好地回答實體豐富的問題。Delft的優勢既來自于其free-文本知識圖譜的高覆蓋率--是DBpedia關系的兩倍多--也來自于新穎的圖神經網絡，它基于豐富而嘈雜的free-文本證據進行推理。

網址：

Dynamic Graph Convolutional Networks for Entity Linking

作者：Junshuang Wu, Richong Zhang, Yongyi Mao, Hongyu Guo, Masoumeh Soflaei and Jinpeng Huai

摘要：實體鏈接將文檔中提及的命名實體映射到給定知識圖中的合適的實體，已被證明能夠從基于圖卷積網絡(GCN)對實體相關性建模中獲得顯著好處。然而，現有的GCN實體鏈接模型沒有考慮到，一組實體的結構化圖不僅依賴于給定文檔的上下文信息，而且在GCN的不同聚合層上自適應地變化，導致在捕捉實體之間的結構信息方面存在不足。在本文中，我們提出了一種動態的GCN體系結構來有效地應對這一挑戰。模型中的圖結構是在訓練過程中動態計算和修改的。通過聚合動態鏈接節點的知識，我們的GCN模型可以集中識別文檔和知識圖之間的實體映射，并有效地捕捉整個文檔中各個實體提及（ mentions）之間的主題一致性。在基準實體連接數據集上的實證研究證實了我們提出的策略的優越性能和動態圖結構的好處。

網址：

High Quality Candidate Generation and Sequential Graph Attention Network for Entity Linking

作者：Yichao Zhou, Shaunak Mishra, Manisha Verma, Narayan Bhamidipati and Wei Wang

摘要：實體鏈接(EL)是將文本中提及的內容映射到知識庫(KB)中相應實體的任務。這項任務通常包括候選生成(CG)和實體消歧(ED)兩個階段。目前基于神經網絡模型的EL系統取得了較好的性能，但仍然面臨著兩個挑戰：(1)以往的研究在評估模型時沒有考慮候選實體之間的差異。事實上，候選集的質量(特別是黃金召回)對EL結果有影響。因此，如何提候選的素質需要引起更多的關注。(Ii)為了利用提及實體之間的主題一致性，提出了許多聚集ED的圖和序列模型。然而，基于圖的模型對所有候選實體一視同仁，這可能會引入大量的噪聲信息。相反，序列模型只能觀察先前引用的實體，而忽略了當前提及的實體與其后續實體之間的相關性。針對第一個問題，我們提出了一種基于多策略的CG方法來生成高召回率的候選集。對于第二個問題，我們設計了一個序列圖注意力網絡(SeqGat)，它結合了圖和序列方法的優點。在我們的模型中，提及（ mentions）是按順序處理的。在當前提到的情況下，SeqGAT對其先前引用的實體和后續實體進行動態編碼，并為這些實體分配不同的重要性。這樣既充分利用了主題的一致性，又減少了噪聲干擾。我們在不同類型的數據集上進行了實驗，并在開放的評測平臺上與以前的EL系統進行了比較。比較結果表明，與現有的方法相比，我們的模型有了很大的改進。

網址：

Mining Implicit Entity Preference from User-Item Interaction Data for Knowledge Graph Completion via Adversarial Learning

作者：Gaole He, Junyi Li, Wayne Xin Zhao, Peiju Liu and Ji-Rong Wen

摘要：知識圖補全(KGC)任務旨在自動推斷知識圖(KG)中缺失的事實信息。在本文中，我們采取了一個新的視角，旨在利用豐富的用戶-項目交互數據(簡稱用戶交互數據)來改進KGC任務。我們的工作靈感來自于觀察到許多KG實體對應于應用系統中的在線項目。然而，這兩種數據源的固有特性有很大的不同，使用簡單的融合策略很可能會損害原有的性能。為了應對這一挑戰，我們提出了一種新的對抗性學習方法，通過利用用戶交互數據來執行KGC任務。我們的生成器是從用戶交互數據中分離出來的，用來提高鑒別器的性能。鑒別器將從用戶交互數據中學習到的有用信息作為輸入，并逐步增強評估能力，以識別生成器生成的假樣本。為了發現用戶的隱含實體偏好，設計了一種基于圖神經網絡的協同學習算法，并與鑒別器進行聯合優化。這種方法有效地緩解了KGC任務的數據異構性和語義復雜性問題。在三個真實世界數據集上的廣泛實驗已經證明了我們在KGC任務上的方法的有效性。

網址：

付費5元查看完整內容

WWW2020 · 推薦系統 ·

2020 年 4 月 14 日

[付費5元查看完整內容]近期必讀的6篇頂會WWW2020【推薦系統】相關論文-Part3

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

【導讀】國際萬維網大會（The Web Conference，簡稱WWW會議）是由國際萬維網會議委員會發起主辦的國際頂級學術會議，創辦于1994年，每年舉辦一屆，是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。由于疫情影響，會議在線上舉行。本屆會議共收到了1129篇長文投稿，錄用217篇長文，錄用率為19.2%。上周專知小編整理了WWW 2020 推薦系統相關論文-part2，這期小編繼續為大家奉上WWW 2020六篇推薦系統相關論文-part3 供參考——上下文感知推薦、雙邊公平推薦、MetaSelector、視覺主題推薦、社交影響力。 WWW2020RS_Part2、WWW2020RS_Part1

1. Eficient Non-Sampling Factorization Machines for Optimal Context-Aware Recommendation

作者：Chong Chen, Min Zhang, Weizhi Ma, Yiqun Liu, and Shaoping Ma

摘要：為了提供更準確的推薦，在對用戶項目交互進行建模之外考慮上下文特征已成為一個熱門話題。具有負采樣的因子分解機(FM)是一種流行的上下文感知推薦解決方案。然而，由于采樣可能丟失重要信息，并且在實際應用中通常會導致非最優性能，因此該算法的魯棒性不強。最近的一些努力通過使用深度學習框架建模高階特征交互增強了FM的性能。而他們要么只關注評分預測任務，要么通常采用負采樣策略來優化排名效果。由于采樣的巨大的波動，我們有理由認為這些基于采樣的FM方法對于上下文感知推薦仍然不是最佳的。在本文中，我們提出在不進行采樣的情況下學習FM，以有助于上下文感知推薦??的排名任務。盡管這種方法效率很高，但這種非采樣策略對模型的學習效率提出了很大的挑戰。因此，我們進一步設計了一種新的理想框架--有效非采樣樣因子分解機(ENSFM)。ENSFM不僅無縫連接了FM和矩陣分解(MF)之間的關系，而且通過新穎的記憶策略解決了具有挑戰性的效率問題。通過在三個真實的公共數據集上的大量實驗表明：1)我們提出的ENSFM的性能一致且顯著優于現有的上下文感知Top-K推薦方法，2)ENSFM在訓練效率上具有顯著的優勢，使其更適用于實際的大系統。此外，實驗結果表明，對于Top-K推薦任務，合適的學習方法比先進的神經網絡結構更為重要。

網址：

//www.thuir.cn/group/~mzhang/publications/TheWebConf2020-Chenchong.pdf

代碼鏈接：

2. FairRec: Two-Sided Fairness for Personalized Recommendations in Two-Sided Platforms

作者：Gourab K Patro, Arpita Biswas, Niloy Ganguly, Krishna P. Gummadi and Abhijnan Chakraborty

摘要：我們在雙邊在線平臺的背景下調查公平推薦（fair recommendation ）問題，該平臺由一邊的客戶和另一邊的生產商組成。這些平臺推薦服務的傳統方法側重于根據個人客戶的個性化偏好定制結果，以實現客戶滿意度的最大化。然而，我們的調查顯示，這種以客戶為中心的設計可能會導致生產商之間曝光量的不公平分配，這可能會對他們的利益造成不利影響。另一方面，以生產商為中心的設計可能會對客戶不公平。因此，我們考慮了客戶和生產商之間的公平問題。我們的方法將公平推薦問題映射為一個公平分配不可分割商品問題的新穎映射。我們提出的FairRec算法可確保至少為大多數生產商提供Maximin Share（MMS）的曝光量，并為每個客戶提供多達Envy-Free（EF1）的公平性。對多個真實世界數據集的廣泛評估顯示，FairRec在確保雙面公平性的同時，在總體推薦質量方面造成了邊際損失的有效性。

網址：

3. MetaSelector: Meta-Learning for Recommendation with User-Level Adaptive Model Selection

作者：Mi Luo, Fei Chen, Pengxiang Cheng, Zhenhua Dong, Xiuqiang He, Jiashi Feng and Zhenguo Li

摘要：推薦系統通常面對包含高度個性化用戶歷史數據的異構數據集，在這些數據集中，沒有哪個模型可以為每個用戶提供最佳建議。我們在公共和私有數據集上都觀察到了這種普遍存在的現象，并解決了模型選擇問題，以追求對每個用戶的推薦質量的優化。我們提出了一個元學習框架來促進推薦系統中用戶級的自適應模型選擇。在此框架中，我們將使用來自所有用戶的數據來訓練推薦者集合，然后通過元學習對模型選擇器進行訓練，以使用用戶特定的歷史數據為每個用戶選擇最佳的單個模型。我們在兩個公共數據集和一個真實的生產數據集上進行了廣泛的實驗，證明了我們的框架在AUC和LogLoss方面比單一的模型基線和樣本級模型選擇器都有改進。特別是，當這些改進部署在在線推薦系統中時，可能會帶來巨大的利潤收益。

網址：

4. Recommending Themes for Ad Creative Design via Visual-Linguistic Representations

作者：Yichao Zhou, Shaunak Mishra, Manisha Verma, Narayan Bhamidipati and Wei Wang

摘要：在線廣告行業中經常需要更新廣告創意，即用于吸引在線用戶進入品牌的圖像和文字。進行此類更新，是為了減少在線用戶中廣告疲勞的可能性，并將其他成功的廣告加入到相關產品類別中。對于創意策略師來說，給定一個品牌，為一個新的廣告想出主題是一個費時費力的過程。創意策略師來通常從過去廣告活動中使用的圖像和文字以及有關品牌的知識中汲取靈感。為了在過去的廣告活動中通過此類多模態信息自動推斷廣告主題，我們為廣告創意策略師提出了主題（關鍵詞）推薦系統。主題推薦器基于視覺問答（VQA）任務的聚合結果，該任務提取以下內容：（i）廣告圖像，（ii）與廣告關聯的文字以及廣告中品牌的Wikipedia頁面，（iii）有關廣告的問題。我們利用基于transformer的跨模態編碼器來為VQA任務訓練視覺語言表示。我們沿著分類和排序的思路研究了VQA任務的兩個公式；通過在公共數據集上的實驗，表明跨模態表示顯著地提高了分類準確率和排序精準-召回指標。與單獨的圖像和文本表示相比，跨模式表示顯示出更好的性能。此外，與僅使用文本或視覺信息相比，多模態信息的使用表現出顯著提升。

網址：

5. The Structure of Social Influence in Recommender Networks

作者：Pantelis P. Analytis, Daniel Barkoczi, Philipp Lorenz-Spreen and Stefan M. Herzog

摘要：人們在品味（taste）上影響他人意見的能力各不相同-既包括離線與在線推薦系統。這些驚人差異背后的機制是什么？使用加權k最近鄰算法（k-nn）表示一系列社會學習策略，我們利用網絡科學的方法展示了k-nn算法如何在六個現實世界的品味領域中引發社會影響力網絡。我們給出了三個新的結果，分別適用于離線建議獲取和在線推薦器設置。首先，有影響力的個人具有主流品味，與其他人的品味相似性分散度很高。其次，個人或算法咨詢的人越少(即k越低)，或者對其他更相似的人的意見給予的權重越大，具有實質性影響的人的群體就越小。第三，對部署k-nn算法后產生的影響網絡是分層組織的。我們的結果為通信和網絡科學中的經典實證發現提供了新的線索，有助于提高對線下和在線上的社會影響的理解。

網址：

6. Latent Linear Critiquing for Conversational Recommender Systems

作者：PKai Luo, Scott Sanner, Ga Wu, Hanze Li and Hojin Yang

摘要：批判（Critiquing）是一種用于會話推薦的方法，可根據用戶的偏好反饋迭代地調整建議。在該設置中，迭代地向用戶提供該項目的項目推薦和屬性描述；用戶可以接受該推薦，或者批判項目描述中的屬性以生成新的推薦。之前的批判方法主要基于顯式約束和基于實用程序的方法來修改推薦（評判的項目屬性）。在這篇文章中，我們回顧了基于潛在嵌入和主觀項目描述(即來自用戶評論的關鍵詞)的推薦方法時代的批判方法。主要兩個關鍵的研究問題：(1)如何將關鍵詞批判與用戶偏好嵌入一起嵌入以更新推薦，(2)如何調節多步驟批判性反饋的強度，其中批判性反饋不一定是獨立的，也不一定是同等重要的。為了解決(1)，我們構建了一個現有的最先進的線性嵌入推薦算法，以使基于評論的關鍵詞屬性與用戶偏好嵌入保持一致。為了解決(2)，我們利用嵌入和推薦預測的線性結構來建立一個基于線性規劃(LP)的優化問題，以確定納入批評反饋的最優權重。我們在兩個包含模擬用戶評論的推薦數據集上評估提出的框架。與對批判反饋進行平均的標準方法相比，實驗結果表明，我們的方法減少了找到滿意項目所需的交互次數，并提高了總體成功率。

網址：

付費5元查看完整內容

推薦系統 · WWW2020 ·

2020 年 4 月 7 日

[付費5元查看完整內容]近期必讀的5篇頂會WWW2020【推薦系統】相關論文-Part2

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

【導讀】國際萬維網大會（The Web Conference，簡稱WWW會議）是由國際萬維網會議委員會發起主辦的國際頂級學術會議，創辦于1994年，每年舉辦一屆，是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。本屆會議共收到了1129篇長文投稿，錄用217篇長文，錄用率為19.2%。近期，推薦相關也比較熱門，專知小編提前整理了WWW 2020 推薦系統比較有意思的的論文，供參考——序列推薦、可解釋Serendipity 推薦、推薦效率、 bandit推薦、Off-policy學習。 WWW2020RS_Part1

A Contextualized Temporal Attention Mechanism for Sequential Recommendation

作者：Jibang Wu, Renqin Cai, Hongning Wang

摘要：根據用戶的歷史連續行為預測用戶的偏好對于現代推薦系統來說是具有挑戰性的，也是至關重要的。現有的序列推薦算法在建模歷史事件對當前預測的影響時，大多側重于序列行為之間的過渡結構，而很大程度上忽略了時間和上下文信息。在這篇文章中，我們認為過去的事件對用戶當前行為的影響應該隨著時間的推移和不同的背景而變化。因此，我們提出了一種情境時間注意力機制（Contextualized Temporal Attention），該機制可以學習權衡歷史行為在行為以及行為發生的時間和方式上的影響。更具體地說，為了動態地校準來自自注意力機制的相對輸入的依賴關系，我們提出了多個參數化的核函數以學習各種時間動態，然后使用上下文信息來確定每個輸入要跟隨哪一個kernel（ reweighing kernels ）。在對兩個大型公開推薦數據集進行的實證評估中，我們的模型始終優于一系列最先進的序列推薦方法。

網址：

//arxiv.org/pdf/2002.00741.pdf

Directional and Explainable Serendipity Recommendation

作者：Xueqi Li, Wenjun Jiang, Weiguang Chen, Jie Wu, Guojun Wang, Kenli Li

摘要：近幾年來，Serendipity推薦越來越受到人們的關注，它致力于提供既能迎合用戶需求，又能開闊他們眼界的建議。然而，現有的方法通常使用標量而不是向量來度量用戶與項目的相關性，忽略了用戶的偏好方向，這增加了不相關推薦的風險。此外，合理的解釋增加了用戶的信任度和接受度，但目前沒有為Serendipity推薦提供解釋的工作。為了解決這些局限性，我們提出了一種有向的、可解釋的Serendipity推薦方法，稱為DESR。具體而言，首先采用基于高斯混合模型(GMM)的無監督方法提取用戶的長期偏好，然后利用膠囊（capsule ）網絡捕捉用戶的短期需求。然后，我們提出了將長期偏好與短期需求相結合的意外（serendipity）向量，并利用它生成有向的Serendipity推薦。最后，利用反向路徑選擇方案進行了解釋。在真實數據集上的大量實驗表明，與現有的基于意外（serendipity）發現的方法相比，DESR能夠有效地提高意外性和可解釋性，促進多樣性。

網址

LightRec: a Memory and Search-Efficient Recommender System

作者：Defu Lian, Haoyu Wang, Zheng Liu, Jianxun Lian, Enhong Chen, Xing Xie

摘要：近年來，深度推薦系統已經取得了顯著的進步。盡管具有出色的排名精度，但實際上運行效率和內存消耗在現實中卻是嚴重的瓶頸。為了克服這兩個瓶頸，我們提出了LightRec，這是一個輕量級的推薦系統，具有快速的在線推斷功能和經濟的內存消耗。LightRec的主干是總共B個codebooks，每個codebook均由W個潛在向量組成，稱為codewords。在這種結構的頂部，LightRec將有一個商品表示為B codewords的加法組合，這些B codewords是從每個codebook中選擇的最佳的。為了有效地從數據中學習codebooks，我們設計了一個端到端的學習工作流程，其中所提出的技術克服了固有差異性和多樣性方面的挑戰。另外，為了進一步提高表示質量，采用了幾種distillation策略，可以更好地保留用戶-商品的相關性得分和相對排名順序。我們對LightRec在四個真實數據集上進行了廣泛評估，得出了兩個經驗發現：1)與最先進的輕量級baseline相比，LightRec在召回性能方面取得了超過11%的相對改進；2)與傳統推薦算法相比，在top-k推薦算法中，LightRec的精度下降幅度可以忽略不計，但速度提高了27倍以上。

網址：

Hierarchical Adaptive Contextual Bandits for Resource Constraint based Recommendation

作者：Mengyue Yang, Qingyang Li, Zhiwei Qin, Jieping Ye

摘要：上下文多臂 bandit(MAB)在各種問題上實現了優異性能。然而，當涉及到推薦系統和在線廣告等現實場景時，必須考慮探索的資源消耗。在實踐中，通常存在與在環境中執行建議(ARM)相關聯的非零成本，因此，應該在固定的探索成本約束下學習策略。由于直接學習全局最優策略是一個NP難題，并且極大地使bandit算法的探索和開發之間的權衡復雜化，因此直接學習全局最優策略是一個很大的挑戰。現有的方法著重于通過采用貪婪策略來解決問題，該策略估計預期的收益和成本，并基于每個臂的預期收益/成本比使用貪婪的選擇，利用歷史觀察直到勘探資源耗盡為止。然而，現有的方法當沒有更多的資源時，學習過程就會終止，因此很難擴展到無限的時間范圍。本文提出了一種分層自適應上下文bandit方法(HATCH)來進行有預算約束的上下文bandit的策略學習。HATCH采用一種自適應的方法，根據剩余資源/時間和對不同用戶上下文之間報酬分配的估計來分配勘探資源。此外，我們利用充分的上下文特征信息來找到最好的個性化推薦。最后，為了證明提出的理論，我們進行了regret bound分析，并證明HATCH的regret bound低至O(√T)。實驗結果證明了該方法在合成數據集和實際應用中的有效性和效率。

網址：

Off-policy Learning in Two-stage Recommender Systems

作者：Jiaqi Ma, Zhe Zhao, Xinyang Yi, Ji Yang, Minmin Chen, Jiaxi Tang, Lichan Hong, Ed H. Chi

摘要：許多現實世界中的推薦系統需要高度可伸縮性：將數百萬個項目與數十億用戶進行匹配，并只具有毫秒級的延遲。可伸縮性的要求導致了廣泛使用的兩階段推薦系統，由第一階段高效的候選生成模型和第二階段更強大的排序模型組成。通常使用記錄的用戶反饋(例如，用戶點擊或停留時間)來構建用于推薦系統的候選生成和排名模型。雖然很容易收集大量這樣的數據，但因為反饋只能在以前系統推薦的項目上觀察到，因此這些數據在本質上是有偏見的。近年來，推薦系統研究領域對此類偏差的off-policy 修正引起了越來越多的關注。然而，現有的大多數工作要么假設推薦系統是一個單階段系統，要么只研究如何將離策略校正應用于系統的候選生成階段，而沒有顯式地考慮這兩個階段之間的相互作用。在這項工作中，我們提出了一種兩階段離策略（two-stage off-policy）策略梯度方法，并證明了在兩階段推薦系統中忽略這兩個階段之間的交互會導致次優策略。該方法在訓練候選生成模型時明確考慮了排序模型，有助于提高整個系統的性能。我們在具有大項目空間的真實數據集上進行了實驗，驗證了所提方法的有效性。

網址：

付費5元查看完整內容

WWW2020 · 圖神經網絡 · 主題模型 · 注意力機制 · 超圖學習 ·

2020 年 3 月 31 日

[付費5元查看完整內容]近期必讀的5篇頂會WWW 2020【圖神經網絡（GNN）】相關論文-Part3

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

【導讀】國際萬維網大會（The Web Conference，簡稱WWW會議）是由國際萬維網會議委員會發起主辦的國際頂級學術會議，創辦于1994年，每年舉辦一屆，是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。由于疫情影響，這次會議在線上舉行，本屆會議共收到了1129篇長文投稿，錄用217篇長文，錄用率為19.2%。近期，隨著會議的臨近，有很多paper放出來，小編發現這次WWW 2020被圖神經網絡攻占，占比非常大，可見其火爆程度。這期小編繼續為大家奉上WWW 2020五篇GNN相關論文供參考——圖注意力主題模型、超圖學習、圖神經網絡Hash、多視角圖聚類、Graph Pooling。

WWW2020GNN_Part2、WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN、EMNLP2019GNN、ICCV2019GNN_Part2、ICCV2019GNN_Part1、NIPS2019GNN、IJCAI2019GNN_Part1、IJCAI2019GNN_Part2、KDD2019GNN、ACL2019GNN、CVPR2019GNN、ICML2019GNN

Graph Attention Topic Modeling Network

作者：Liang Yang, Fan Wu, Junhua Gu, Chuan Wang, Xiaochun Cao, Di Jin, and Yuanfang Guo

摘要：現有的主題模型（topic modeling）方法存在一些問題，包括概率潛在語義索引模型(Probablistic Latent Semantic Indexing，PLSI)過擬合問題、隱狄利克雷分配(Latent Dirichlet Allocation，LDA)模型不能能捕捉主題間豐富的主題相關性與推理復雜度高等問題。本文提出了一種新的方法來克服pLSI的過擬合問題，用嵌入單詞的平攤推理（amortized inference）作為輸入，代替LDA中的狄利克雷先驗。對于生成性主題模型，大量的自由隱變量是過擬合的根源。為了減少參數個數，平攤推理用一個具有共享（平攤）可學習參數的函數代替了對隱變量的推理。共享參數的數量是固定的，并且與語料庫的規模無關。為了克服平攤推理在獨立同分布(I.I.D)數據中應用的局限性，根據以下兩個觀察結果，我們提出了一種新的圖神經網絡--圖注意力主題網絡(GATON)，用于對非I.I.D文檔的主題結構進行建模。首先，pLSI可以解釋為特定二分圖上的隨機塊模型(SBM)。其次，圖注意力網絡(GAT)可以解釋為SBM的半平攤推理（semi-amortized inference），它放寬了I.I.D數據的vanilla 平攤推理假設。GATON提供了一種新穎的基于圖卷積運算的方案，去聚合單詞相似度和單詞共現結構。具體地說，詞袋文檔表示被建模為二分圖拓撲。同時，將捕獲詞相似性的詞嵌入建模為詞節點的屬性，并采用詞頻向量作為文檔節點的屬性。基于加權（注意力）圖卷積操作，詞共現結構和詞相似度模式被無縫地集成在一起進行主題識別。大量實驗表明，GATON在主題識別方面的有效性不僅有利于文檔分類，而且能顯著細化輸入詞的嵌入。

網址：//yangliang.github.io/pdf/www20.pdf

How Much and When Do We Need Higher-order Information in Hypergraphs? A Case Study on Hyperedge Prediction

作者：Se-eun Yoon, Hyungseok Song, Kijung Shin, and Yung Yi

摘要：超圖提供了一種自然的表示組群關系的方法，其復雜性促使大量先前的工作采用某種形式抽象和簡化高階交互。然而，以下問題尚未得到解決：在解決超圖任務時，組群間交互的抽象程度需要多大？這些結果在不同的數據集中會有多大的不同？如果這個問題可以回答，將為如何在解決下游任務的復雜性和準確性之間權衡提供有用的工程指南。為此，我們提出了一種使用n投影圖（ n-projected graph ）的概念遞增表示群組交互的方法，該圖的累積量包含多達n種交互作用的信息，并隨著各種數據集的增長，量化解決任務的準確性。作為下游任務，我們考慮超邊預測，它是連接預測的擴展，是評估圖模型的典型任務。通過在15個真實數據集上的實驗，我們得出了以下信息：（a）收益遞減：較小地n足以獲得與接近完美近似值相當的精度，（b）疑難解答：隨著任務的挑戰性越來越大，n帶來了更多好處，（c）不可約性：當成對抽象化時，其成對交互并不能充分說明高階交互的數據集將失去很多準確性。

網址：

Learning to Hash with Graph Neural Networks for Recommender Systems

作者：Qiaoyu Tan, Ninghao Liu, Xing Zhao, Hongxia Yang, Jingren Zhou, and Xia Hu

摘要：工業推薦系統一般包括兩個階段：召回和排名。召回是指從海量的項目語料庫中高效地識別出數百個用戶可能感興趣的候選項目，而排名的目標是使用復雜的排名模型輸出精確的排名列表。近年來，圖表示學習在支持大規模高質量候選搜索方面受到了廣泛關注。盡管它在用戶-項目交互網絡中學習對象的嵌入向量方面是有效的，但在連續嵌入空間中推斷用戶偏好的計算代價是巨大的。在這項工作中，我們研究了基于圖神經網絡(GNNs)的哈希高質量檢索問題，并提出了一種簡單而有效的離散表示學習框架來聯合學習連續與離散編碼。具體地說，提出了一種基于GNN的深度哈希算法(HashGNN)，它由兩部分組成，一個是用于學習節點表示的GNN編碼器，另一個是用于將表示編碼為哈希碼的哈希層。整個框架通過聯合優化以下兩個損失進行端到端的訓練，即通過重建觀察到的連接而產生的重建損失，以及通過保留哈希碼的相對順序產生的排序損失。我們還提出了一種基于直通估計器（straight through estimator ，STE）指導的離散優化策略。其主要思想是在連續嵌入指導下避免STE的反向傳播中的梯度放大，在這種情況下，我們從學習一個更容易模仿連續嵌入的更簡單的網絡開始，并使其在訓練過程中發展直至最終返回STE。在三個公開可用數據集和一個真實的阿里巴巴公司數據集的綜合實驗表明，我們的模型不僅可以達到連續模型的性能，而且在推理過程中運行速度快了好幾倍。

網址：

One2Multi Graph Autoencoder for Multi-view Graph Clustering

作者：Shaohua Fan, Xiao Wang, Chuan Shi, Emiao Lu, Ken Lin, and Bai Wang

摘要：多視圖圖聚類（Multi-view graph clustering）近年來受到了相當大的關注，它是一種尋找具有多個視圖的圖的分割方法，通常提供更全面但更復雜的信息。雖然多視圖圖聚類已經做了一些努力并取得了較好的效果，但大多數都是采用淺層模型來處理多視圖間的復雜關系，這可能會嚴重限制多視圖的圖信息建模能力。本文首次嘗試將深度學習技術應用于屬性多視圖圖聚類，提出了一種新的任務導向的One2Multi圖自編碼器聚類框架。One2Multi圖自編碼器能夠通過使用一個信息豐富的圖形視圖和內容數據來重建多個圖形視圖來學習節點嵌入。因此，可以很好地捕捉多個圖的共享特征表示。在此基礎上，我們還提出了一種自訓練聚類目標，以迭代地改善聚類結果。通過將自訓練和自編碼器重構集成到一個統一的框架中，我們的模型可以聯合優化適用于圖聚類的簇標簽分配和嵌入。在真實屬性多視圖圖數據集上的實驗很好地驗證了該模型的有效性。

網址：

Structure-Feature based Graph Self-adaptive Pooling

作者：Liang Zhang, Xudong Wang, Hongsheng Li, Guangming Zhu, Peiyi Shen, Ping Li, Xiaoyuan Lu, Syed Afaq Ali Shah, and Mohammed Bennamoun

摘要：近年來，人們提出了各種處理圖數據的方法。然而，這些方法大多側重于圖的特征聚合，而不是圖的池化。此外，現有的top-k選擇圖池化方法存在一些問題。首先，在構建池化圖拓撲時，現有的top-k選擇方法只從單一的角度評價節點的重要性，這是簡單化和不客觀的。其次，未選中節點的特征信息在池化過程中直接丟失，必然導致大量的圖特征信息丟失。為了解決上述問題，我們提出了一種新穎的圖自適應池化方法，目標如下：(1)為了構造合理的池化圖拓撲，同時考慮了圖的結構信息和特征信息，增加了節點選擇的準確性和客觀性；(2)為了使池化的節點包含足夠有效的圖信息，在丟棄不重要的節點之前，先聚合節點特征信息；因此，所選擇的節點包含來自鄰居節點的信息，這可以增強未選擇節點的特征的使用。在四個不同的數據集上的實驗結果表明，我們的方法在圖分類中是有效的，并且優于最新的圖池化方法。

網址：

付費5元查看完整內容

WSDM · 最佳論文 ·

2020 年 2 月 6 日

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

【導讀】WSDM 2020全稱為第13屆國際互聯網搜索與數據挖掘會議（The 13thInternational Conference on Web Search and Data Mining, WSDM 2020），將于2020年2月3日-2月7日在美國休斯敦召開。WSDM是CCF推薦的B類國際學術會議，由SIGIR、SIGKDD、SIGMOD和SIGWEB四個專委會協調籌辦，在互聯網搜索、數據挖掘領域享有較高學術聲譽。這次會議共收到來自615篇長文投稿，僅有91篇長文被錄用，錄用率約15%。大會公布了最佳論文系列獎項，最佳論文由加利福尼亞大學圣克魯茲分校（University of California, Santa Cruz，簡稱UCSC）獲得-主軸的冪用于精確團計數，最佳論文亞軍(Runner Up)論文由雙曲度量學習由新加坡南洋理工獲得-雙曲度量學習。

最佳論文

主軸的冪用于精確團計數原文標題：The Power of Pivoting for Exact Clique Counting

地址：//arxiv.org/abs/2001.06784

作者：Shweta Jain, C. Seshadhri，University of California, Santa Cruz

摘要：集團計數是網絡分析的基本任務，甚至 3個 -cliques（三角形）最簡單的設置是最近許多研究的中心。獲得? -cliques的數量較大?算法是具有挑戰性的，由于大派系的搜索空間的指數爆破。但最近的一些應用程序（特別是對社區檢測或群集）的使用更大的集團計數。此外，一個經常希望 textit 本地計數的k個 -cliques每頂點/邊的數量。我們的主要結果是Pivoter，算法恰好計數的? -cliques數 textit對中的k 的所有值。這是在實踐中出人意料地有效，并且能夠得到的是超出以前的工作的覆蓋面圖的集團計數。例如，Pivoter獲取社會網絡的所有集團計數與商品機器的兩個小時內一個100M的邊。上一頁并行算法不終止日。Pivoter也能切實得到當地每頂點和每邊? -clique計數（所有?）的許多公共數據集的數以千萬計的邊。據我們所知，這是第一個算法，實現了這樣的結果。主要見解是一個簡潔的派樹（SCT），其存儲在輸入圖中的所有派系壓縮唯一表示的結構。它使用一種被稱為 textit 轉動，由勒布朗 - Kerbosch經典的方法，以減少回溯算法的最大派系的遞歸樹建。值得注意的是，SCT可在不實際枚舉所有派系來構建，并提供從它的確切集團統計（? -clique計數，計數地方），可以有效地讀出一個簡潔的數據結構。

最佳論文亞軍(Runner Up)論文

HyperML: A Boosting Metric Learning Approach in Hyperbolic Space for Recommender Systems Lucas Vinh Tran, Yi Tay (Nanyang Technological University, Singapore); Shuai Zhang (The University of New South Wales, Australia); Gao Cong (Nanyang Technological University, Singapore); Xiaoli Li (Institute for Infocomm Research, Singapore).

研究了非歐氏空間中學習用戶和項目表示的概念。具體來說，我們通過探索Mobius回轉向量空間來研究雙曲空間中的度量學習與協作濾波之間的關系，該空間的形式可以用來推廣最常見的歐氏向量運算。總的來說，這項工作旨在通過度量學習的方法來彌補推薦系統中歐幾里德幾何和雙曲幾何之間的差距。我們提出了HyperML（雙曲度量學習），這是一個概念簡單但效率很高的模型，可以提高性能。通過一系列廣泛的實驗，我們證明了我們提出的HyperML不僅優于歐幾里德模型，而且在多個基準數據集上達到了最新的性能，證明了個性化推薦在雙曲幾何中的有效性。

「經典論文獎」(Test of Time Award)

Nick Craswell, Onno Zoeter, Michael J. Taylor, Bill Ramsey:

An experimental comparison of click position-bias models. WSDM 2008: 87-94

Xiaowen Ding, Bing Liu, Philip S. Yu: A holistic lexicon-based approach to opinion mining. WSDM 2008: 231-240
Jianshu Weng, Ee-Peng Lim, Jing Jiang, Qi He: TwitterRank: finding topic-sensitive influential twitterers. WSDM 2010: 261-270

付費5元查看完整內容