亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

【導讀】國際萬維網大會(The Web Conference,簡稱WWW會議)是由國際萬維網會議委員會發起主辦的國際頂級學術會議,創辦于1994年,每年舉辦一屆,是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。本屆會議共收到了1129篇長文投稿,錄用217篇長文,錄用率為19.2%。上周專知小編提前整理了WWW 2020圖神經網絡(GNN)比較有意思的的論文,這期小編繼續為大家奉上WWW 2020推薦相關論文供參考! WWW2020GNN

  1. Correcting for Selection Bias in Learning-to-rank Systems

作者:Zohreh Ovaisi, Ragib Ahsan, Yifan Zhang, Kathryn Vasilaky and Elena Zheleva

摘要:現代推薦系統收集到的點擊數據是用來訓練學習排名(LTR)系統的觀察數據的重要來源。然而,這些點擊數據會受到許多偏差(bias)的影響,這些偏差可能會導致LTR系統的性能變差。在此類系統中,最近的偏差校正(bias correction)方法主要集中在位置偏差上,即雖然不是用戶查詢最相關的,但排名較高的結果(例如,頂級搜索引擎結果)更可能被點擊。由于所點擊的文檔反映了什么文檔首先向用戶展示,因此大部分方法對校正選擇偏差的關注較少。在本文中,我們提出了新的方法,這些方法可以適應Heckman的兩階段方法,并考慮LTR系統中的選擇偏差和位置偏差。我們的實驗評估表明,與現有的無偏LTR算法相比,我們提出的方法對噪聲的魯棒性更高,并且具有更好的準確性,尤其是在存在中度偏差到無位置偏差的情況下。

網址: //arxiv.org/abs/2001.11358

  1. Efficient Neural Interaction Function Search for Collaborative Filtering

作者:Quanming Yao, Xiangning Chen, James T. Kwok, Yong Li and Cho-Jui Hsieh

摘要:在協同過濾(CF)中,交互函數(IFC)扮演著捕獲項目和用戶之間交互的重要角色。最流行的交互函數(IFC)是內積,它已經成功地應用于低階矩陣分解。然而,現實世界應用中的交互可能非常復雜。因此,可以提供更好性能的操作(例如:串聯和級聯)被提出。然而,現有的IFC仍然很難在不同的應用場景中保持一致的良好性能。受AutoML的啟發,本文提出在CF中尋找簡單神經交互函數(SIF)。通過對現有CF方法的研究和推廣,設計了一種具有表現力的SIF搜索空間,并將其表示為結構化的多層感知機。我們提出了一種one-shot搜索算法,可以同時更新體系結構和學習參數。 實驗結果表明,所提出的方法比流行的AutoML方法效率更高,比最新的CF方法可以獲得更好的預測性能,并且可以針對不同的數據集和任務發現不同的IFC。

網址:

  1. Influence Function based Data Poisoning Attacks to Top-N Recommender Systems

作者:Minghong Fang, Neil Zhenqiang Gong and Jia Liu

摘要:推薦系統是Web服務中吸引用戶的重要組成部分。流行的推薦系統使用大量眾包用戶-項目交互數據(例如評級得分)對用戶偏好和項目屬性進行建模;然后,將與用戶偏好最匹配的前N個項目推薦給用戶。在這項工作中,我們展示了攻擊者可以通過向虛假用戶注入精心制作的用戶-項目交互數據,對推薦系統發起數據中毒攻擊,從而按照攻擊者的意愿進行推薦。具體地說,攻擊者可以誘導推薦系統向盡可能多的普通用戶推薦目標項目。我們關注已經在行業中得到了廣泛的應用的基于矩陣分解的推薦系統。給定攻擊者可以注入的虛假用戶數量,我們將虛假用戶評分的制定過程描述為一個優化問題。但是,該優化問題是一個非凸整數規劃問題,求解起來很有挑戰性。為了解決這一挑戰,我們開發了幾種技術來近似解決優化問題。例如,我們利用影響函數(influence function)來選擇對推薦有影響力的普通用戶子集,并基于這些有影響力的用戶來解決我們制定的優化問題。實驗結果表明,我們的攻擊是有效的,并且優于現有的方法。

網址:

  1. Learning Multi-granular Quantized Embeddings for Large-Vocab Categorical Features in Recommender Systems

作者:Wang-Cheng Kang,Derek Zhiyuan Cheng, Ting Chen, Xinyang Yi, Dong Lin, Lichan Hong and Ed H. Chi

摘要:推薦系統模型通常通過嵌入來表示像用戶、項目和分類特征這類的稀疏特征。標準方法是將每個唯一的特征值映射為嵌入向量。所產生的嵌入表的大小隨著詞匯表的大小線性增長。因此,大詞匯量不可避免地會導致巨大的嵌入表,從而產生兩個嚴重的問題:(I)使服務于資源緊張環境中的模型變得難以處理;(ii)造成過擬合的問題。在本文中,我們致力于學習用于推薦系統(recsys)中大型詞匯稀疏特征的高度簡潔的嵌入。首先,我們證明了新的可微積量化( Differentiable Product Quantization,DPQ)方法可以推廣到Recsys問題。此外,為了更好地處理Recsys中常見的冪律數據分布,我們提出了一種多粒度量化嵌入(MGQE)技術,該技術對不頻繁的項目學習更簡單的嵌入。我們嘗試以簡單的模型規模為提高推薦性能提供一個新的角度。在三個推薦任務和兩個數據集上的大量實驗表明,我們可以用原始模型規模的20%的模型獲得與原模型相當甚至更好的性能。

網址:

  1. Beyond Clicks: Modeling Multi-Relational Item Graph for Session-Based Target Behavior Prediction

作者:Wen Wang, Wei Zhang, Shukai Liu, Bo Zhang, Leyu Lin and Hongyuan Zha

摘要:基于會話的目標行為預測旨在預測要與特定行為類型(例如,點擊)進行交互的下一個項目。雖然現有的基于會話的行為預測方法利用強大的表示學習方法來編碼項目在低維空間中的順序相關性,但是它們受到一些限制。首先,它們側重于只利用同一類型的用戶行為進行預測,而忽略了將其他行為數據作為輔助信息的潛力。當目標行為稀疏但很重要(例如,購買或共享物品)時,這一點尤為重要。其次,項目到項目的關系是在一個行為序列中單獨和局部建模的,缺乏一種規定的方法來更有效地全局編碼這些關系。為了克服這些局限性,我們提出了一種新的基于會話的目標行為預測的多關系圖神經網絡模型MGNN-SPred。具體地說,我們基于來自所有會話的所有行為序列(涉及目標行為類型和輔助行為類型)構建多關系項目圖(Multi-Relational Item Graph,MRIG)。在MRIG的基礎上,MGNN-SPred學習全局項目與項目之間的關系,進而獲得用戶偏好。即分別為當前目標行為序列和輔助行為序列。最后,MGNN-SPred利用門控機制自適應地融合用戶表示,以預測與目標行為交互的下一項目。在兩個真實數據集上的廣泛實驗證明了MGNN-SPred與最新的基于會話的預測方法相比的優越性,驗證了利用輔助行為和基于MRIG學習項目到項目關系的優點。

網址:

  1. Towards Detection of Subjective Bias using Contextualized Word Embeddings

作者:Tanvi Dadu, Kartikey Pant and Radhika Mamidi

摘要:主觀偏見檢測(Subjective bias detection)對于宣傳檢測、內容推薦、情感分析和偏見消除等應用至關重要。這種偏見是在自然語言中通過煽動性的詞語和短語引入的,使人對事實產生懷疑,并預設事實。在這項工作中,我們在維基中立性語料庫(WNC)上使用基于BERT的模型進行了全面的主觀偏見檢測實驗。數據集為36萬個來自維基百科并刪除了各種偏見的標記實例組成。我們進一步提出了基于BERT的集成,其性能優于BERT_large之類的最新方法5.6 F1 score。

網址:

付費5元查看完整內容

相關內容

【導讀】作為世界數據挖掘領域的最高級別的學術會議,ACM SIGKDD(國際數據挖掘與知識發現大會,簡稱 KDD)每年都會吸引全球領域眾多專業人士參與。今年的 KDD大會計劃將于 2020 年 8 月 23 日 ~27 日在美國美國加利福尼亞州圣地亞哥舉行。上周,KDD 2020官方發布接收論文,共有1279篇論文提交到Research Track,共216篇被接收,接收率16.8%。近期KDD官網公布了接受論文列表,為此,上個月專知小編為大家整理了圖神經網絡相關的論文,這期小編繼續為大家奉上KDD 2020必讀的五篇圖神經網絡(GNN)相關論文-Part 2——多層次GCN、無監督預訓練GCN、圖Hash、GCN主題模型、采樣

KDD 2020 Accepted Paper: //www.kdd.org/kdd2020/accepted-papers

KDD2020GNN_Part1、CVPR2020SGNN、CVPR2020GNN_Part2、CVPR2020GNN_Part1、WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN、EMNLP2019GNN、ICCV2019GNN_Part2、ICCV2019GNN_Part1、NIPS2019GNN、IJCAI2019GNN_Part1、IJCAI2019GNN_Part2、KDD2019GNN、

1. Multi-level Graph Convolutional Networks for Cross-platform Anchor Link Prediction

作者:Hongxu Chen, Hongzhi Yin, Xiangguo Sun, Tong Chen, Bogdan Gabrys, Katarzyna Musial

摘要:跨平臺的賬號匹配在社交網絡分析中發揮著重要作用,并且有利于廣泛的應用。然而,現有的方法要么嚴重依賴于高質量的用戶生成內容(包括用戶興趣模型),要么只關注網絡拓撲結構,存在數據不足的問題,這使得研究這個方向變得很困難。為了解決這一問題,我們提出了一種新的框架,該框架統一考慮了局部網絡結構和超圖結構上的多級圖卷積。該方法克服了現有工作中數據不足的問題,并且不一定依賴于用戶的人口統計信息。此外,為了使所提出的方法能夠處理大規模社交網絡,我們提出了一種兩階段的空間協調機制,在基于網絡分區的并行訓練和跨不同社交網絡的帳戶匹配中對齊嵌入空間。我們在兩個大規模的真實社交網絡上進行了廣泛的實驗。實驗結果表明,該方法的性能比現有的模型有較大幅度的提高。

網址:

2. GCC: Graph Contrastive Coding for Graph Neural Network Pre-Training

作者:Jiezhong Qiu, Qibin Chen, Yuxiao Dong, Jing Zhang, Hongxia Yang, Ming Ding, Kuansan Wang, Jie Tang

摘要:圖表示學習已經成為解決現實問題的一種強有力的技術。包括節點分類、相似性搜索、圖分類和鏈接預測在內的各種下游圖學習任務都受益于它的最新發展。然而,關于圖表示學習的現有技術集中于領域特定的問題,并為每個圖訓練專用模型,這通常不可轉移到領域之外的數據。受自然語言處理和計算機視覺在預訓練方面的最新進展的啟發,我們設計了圖對比編碼(Graph Contrastive Coding,GCC)一個無監督的圖表示學習框架來捕捉跨多個網絡的通用網絡拓撲屬性。我們將GCC的預訓練任務設計為網絡內部和網絡之間的子圖級別的實例判斷,并利用對比學習來增強模型學習內在的和可遷移的結構表征能力。我們在三個圖學習任務和十個圖數據集上進行了廣泛的實驗。結果表明,GCC在一組不同的數據集上進行預訓練,可以獲得與從頭開始的特定任務訓練的方法相媲美或更好的性能。這表明,預訓練和微調范式對圖表示學習具有巨大的潛力。

網址:

代碼鏈接:

3. GHashing: Semantic Graph Hashing for Approximate Similarity Search in Graph Databases

作者:Zongyue Qin, Yunsheng Bai, Yizhou Sun

摘要:圖相似搜索的目的是根據給定的鄰近度,即圖編輯距離(GED),在圖形數據庫中找到與查詢最相似的圖。這是一個被廣泛研究但仍具有挑戰性的問題。大多數研究都是基于剪枝驗證框架,該框架首先對非看好的圖進行剪枝,然后在較小的候選集上進行驗證。現有的方法能夠管理具有數千或數萬個圖的數據庫,但由于其精確的剪枝策略,無法擴展到更大的數據庫。受到最近基于深度學習的語義哈希(semantic hashing)在圖像和文檔檢索中的成功應用的啟發,我們提出了一種新的基于圖神經網絡(GNN)的語義哈希,即GHash,用于近似剪枝。我們首先用真實的GED結果訓練GNN,以便它學習生成嵌入和哈希碼,以保持圖之間的GED。然后建立哈希索引以實現恒定時間內的圖查找。在回答一個查詢時,我們使用哈希碼和連續嵌入作為兩級剪枝來檢索最有希望的候選對象,并將這些候選對象發送到精確的求解器進行最終驗證。由于我們的圖哈希技術利用了近似剪枝策略,與現有方法相比,我們的方法在保持高召回率的同時,實現了顯著更快的查詢時間。實驗表明,該方法的平均速度是目前唯一適用于百萬級數據庫的基線算法的20倍,這表明GHash算法成功地為解決大規模圖形數據庫的圖搜索問題提供了新的方向。

網址:

4. Graph Structural-topic Neural Network

作者:Qingqing Long, Yilun Jin, Guojie Song, Yi Li, Wei Lin

摘要:圖卷積網絡(GCNS)通過有效地收集節點的局部特征,取得了巨大的成功。然而,GCNS通常更多地關注節點特征,而較少關注鄰域內的圖結構,特別是高階結構模式。然而,這種局部結構模式被顯示為許多領域中的節點屬性。此外,由于網絡很復雜,每個節點的鄰域由各種節點和結構模式的混合組成,不只是單個模式,所有這些模式上的分布都很重要。相應地,在本文中,我們提出了圖結構主題神經網絡,簡稱GraphSTONE,這是一種利用圖的主題模型的GCN模型,使得結構主題廣泛地從概率的角度捕捉指示性的圖結構,而不僅僅是幾個結構。具體地說,我們使用 anonymous walks和Graph Anchor LDA(一種LDA的變體,首先選擇重要的結構模式)在圖上建立主題模型,以降低復雜性并高效地生成結構主題。此外,我們設計了多視圖GCNS來統一節點特征和結構主題特征,并利用結構主題來指導聚合。我們通過定量和定性實驗對我們的模型進行了評估,我們的模型表現出良好的性能、高效率和清晰的可解釋性。

網址:

代碼鏈接:

5. Minimal Variance Sampling with Provable Guarantees for Fast Training of Graph Neural Networks

作者:Weilin Cong, Rana Forsati, Mahmut Kandemir, Mehrdad Mahdavi

摘要:抽樣方法(如節點抽樣、分層抽樣或子圖抽樣)已成為加速大規模圖神經網絡(GNNs)訓練不可缺少的策略。然而,現有的抽樣方法大多基于圖的結構信息,忽略了最優化的動態性,導致隨機梯度估計的方差較大。高方差問題在非常大的圖中可能非常明顯,它會導致收斂速度慢和泛化能力差。本文從理論上分析了抽樣方法的方差,指出由于經驗風險的復合結構,任何抽樣方法的方差都可以分解為前向階段的嵌入近似方差和后向階段的隨機梯度方差,這兩種方差都必須減小,才能獲得較快的收斂速度。我們提出了一種解耦的方差減小策略,利用(近似)梯度信息自適應地對方差最小的節點進行采樣,并顯式地減小了嵌入近似引入的方差。理論和實驗表明,與現有方法相比,該方法即使在小批量情況下也具有更快的收斂速度和更好的泛化能力。

網址:

付費5元查看完整內容

【導讀】作為世界數據挖掘領域的最高級別的學術會議,ACM SIGKDD(國際數據挖掘與知識發現大會,簡稱 KDD)每年都會吸引全球領域眾多專業人士參與。今年的 KDD大會計劃將于 2020 年 8 月 23 日 ~27 日在美國美國加利福尼亞州圣地亞哥舉行。上周,KDD 2020官方發布接收論文,共有1279篇論文提交到Research Track,共216篇被接收,接收率16.8%。近期一些Paper放出來了,為此,專知小編提前為大家整理了五篇KDD 2020 圖神經網絡(GNN)相關論文,供大家參考。——圖結構學習、多元時間序列預測、負采樣、多任務多視角圖表示學習、多興趣推薦

CVPR2020SGNN、CVPR2020GNN_Part2、CVPR2020GNN_Part1、WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN、EMNLP2019GNN、ICCV2019GNN_Part2、ICCV2019GNN_Part1、NIPS2019GNN、IJCAI2019GNN_Part1、IJCAI2019GNN_Part2、KDD2019GNN、ACL2019GNN、CVPR2019GNN、

1. Graph Structure Learning for Robust Graph Neural Networks

作者:Wei Jin, Yao Ma, Xiaorui Liu, Xianfeng Tang, Suhang Wang, Jiliang Tang

摘要:圖神經網絡(GNNs)是圖表示學習的有力工具。但是,最近的研究表明,GNN容易受到精心設計的擾動(稱為對抗攻擊)的攻擊。對抗性攻擊很容易欺騙GNN來預測下游任務。對于對抗攻擊的脆弱性使人們越來越關注在安全關鍵型應用中應用GNN。因此,開發穩健的算法來防御對抗攻擊具有重要意義。防御對抗攻擊的一個自然想法是清理受干擾的圖。很明顯,真實世界的圖共享一些內在屬性。例如,許多現實世界的圖都是低秩和稀疏的,兩個相鄰節點的特征往往是相似的。事實上,我們發現對抗攻擊很可能會違背這些圖的性質。因此,在本文中,我們利用這些特性來防御針對圖的對抗攻擊。特別是,我們提出了一個通用框架Pro-GNN,該框架可以從受這些特性指導的擾動圖中聯合學習結構圖和魯棒圖神經網絡模型。在真實圖上的大量實驗表明,即使在圖受到嚴重干擾的情況下,我們所提出的框架也比現有的防御方法獲得了顯著更好的性能。我們將Pro-GNN的實現發布到我們的DeepRobust存儲庫,以進行對抗性攻擊和防御。

網址: //arxiv.org/pdf/2005.10203.pdf

代碼鏈接:

2. Connecting the Dots: Multivariate Time Series Forecasting with Graph Neural Networks

作者:Zonghan Wu, Shirui Pan, Guodong Long, Jing Jiang, Xiaojun Chang, Chengqi Zhang

摘要:多變量時間序列的建模長期以來一直吸引著來自經濟、金融和交通等不同領域的研究人員的關注。多變量時間序列預測背后的一個基本假設是其變量之間相互依賴,但現有方法未能充分利用變量對之間的潛在空間相關性。同時,近些年來,圖神經網絡(GNNs)在處理關系依賴方面表現出了很高的能力。GNN需要定義良好的圖結構來進行信息傳播,這意味著它們不能直接應用于事先不知道依賴關系的多變量時間序列。本文提出了一種專門針對多變量時間序列數據設計的通用圖神經網絡框架。該方法通過圖學習模塊自動提取變量間的單向關系,可以方便地集成變量屬性等外部知識。在此基礎上,提出了一種新的max-hop傳播層和一個dilated inception層來捕捉時間序列中的時間和空間依賴關系。圖學習、圖卷積和時間卷積模塊在端到端框架中聯合學習。實驗結果表明,我們提出的模型在4個基準數據集中的3個數據上優于最新的基線方法,并且在提供額外結構信息的兩個交通數據集上,與其他方法具有同等的性能。

網址:

3. Understanding Negative Sampling in Graph Representation Learning

作者:Zhen Yang, Ming Ding, Chang Zhou, Hongxia Yang, Jingren Zhou, Jie Tang

摘要:在最近的幾年中,對圖表示學習進行了廣泛的研究。盡管它有可能為各種網絡生成連續的嵌入,但是在大型節點集中得到有效高質量的表示仍然具有挑戰性。采樣是實現該性能目標的關鍵點。現有技術通常側重于正向節點對的采樣,而對負向采樣的策略探索不夠。為了彌補這一差距,我們從目標和風險兩個角度系統地分析了負采樣的作用,從理論上論證了負采樣在確定優化目標和結果方差方面與正采樣同等重要。據我們所知,我們是第一個推導該理論并量化負采樣分布應與其正采樣分布成正相關但亞線性相關的方法。在該理論的指導下,我們提出了MCNS,用自對比度近似法近似正分布,并通過Metropolis-Hastings加速負采樣。我們在5個數據集上評估了我們的方法,這些數據集涵蓋了19個實驗設置,涵蓋了廣泛的下游圖學習任務,包括鏈接預測,節點分類和個性化推薦。這些相對全面的實驗結果證明了其穩健性和優越性。

網址:

4. M2GRL: A Multi-task Multi-view Graph Representation Learning Framework for Web-scale Recommender Systems

作者:Menghan Wang, Yujie Lin, Guli Lin, Keping Yang, Xiao-ming Wu

摘要:將圖表示學習與多視圖數據(邊信息)相結合進行推薦是工業上的一種趨勢。現有的大多數方法可以歸類為多視圖表示融合,它們首先構建一個圖,然后將多視圖數據集成到圖中每個節點的單個緊湊表示中。這些方法在工程和算法方面都引起了人們的關注:1)多視圖數據在工業中是豐富而且有用的,并且可能超過單個矢量的容量;2)由于多視圖數據往往來自不同的分布,可能會引入歸納偏置(inductive bias)。在本文中,我們使用一種多視圖表示對齊方法來解決這個問題。特別地,我們提出了一個多任務多視角圖表示學習框架(M2GRL)來學習web級推薦系統中的多視角圖節點表示。M2GRL為每個單視圖數據構造一個圖,從多個圖中學習多個單獨的表示,并執行對齊以建立模型的交叉視圖關系。M2GRL選擇了一種多任務學習范式來聯合學習視圖內表示和交叉視圖關系。此外,M2GRL在訓練過程中利用同方差不確定性自適應地調整任務的損失權重。我們在淘寶部署了M2GRL,并對570億個實例進行了訓練。根據離線指標和在線A/B測試,M2GRL的性能明顯優于其他最先進的算法。對淘寶多樣性推薦的進一步研究表明,利用M2GRL產生的多種表征是有效的,對于不同側重點的各種工業推薦任務來說,M2GRL是一個很有前途的方向。

網址:

5. Controllable Multi-Interest Framework for Recommendation

作者:Yukuo Cen, Jianwei Zhang, Xu Zou, Chang Zhou, Hongxia Yang, Jie Tang

摘要:近年來,由于深度學習的快速發展,神經網絡在電子商務推薦系統中得到了廣泛的應用。我們將推薦系統形式化為一個序列推薦問題,目的是預測可能與用戶交互的下一個項目。最近的研究通常從用戶的行為序列中給出一個整體的嵌入。然而,統一的用戶嵌入不能反映用戶在一段時間內的多個興趣。本文提出了一種新穎的可控多興趣序列推薦框架,稱為ComiRec。我們的多興趣模塊從用戶行為序列中捕獲多個興趣,可用于從大規模項目集中檢索候選項目。然后將這些項目送入聚合模塊以獲得總體推薦。聚合模塊利用一個可控因素來平衡推薦的準確性和多樣性。我們在兩個真實的數據集Amazon和Taobao進行序列推薦實驗。實驗結果表明,我們的框架相對于最新模型取得了重大改進。我們的框架也已成功部署在離線阿里巴巴分布式云平臺上。

網址:

代碼鏈接:

付費5元查看完整內容

【導讀】國際萬維網大會(The Web Conference,簡稱WWW會議)是由國際萬維網會議委員會發起主辦的國際頂級學術會議,創辦于1994年,每年舉辦一屆,是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。本屆會議共收到了1129篇長文投稿,錄用217篇長文,錄用率為19.2%。這周會議已經召開,會議論文集已經公開,大家可以自己查看感興趣的論文,專知小編繼續整理WWW 2020 系列論文,這期小編為大家奉上的是WWW 2020五篇知識圖譜+圖神經網絡(KG+GNN)相關論文,供大家參考!——多關系實體對齊、問答推理、動態圖實體鏈接、序列實體鏈接、知識圖譜補全。

WWW 2020 會議論文集: //dl.acm.org/doi/proceedings/10.1145/3366423

WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN、EMNLP2019GNN、ICCV2019GNN_Part2、ICCV2019GNN_Part1、NIPS2019GNN、IJCAI2019GNN_Part1、IJCAI2019GNN_Part2、KDD2019GNN、ACL2019GNN、CVPR2019GNN、ICML2019GNN

  1. Collective Multi-type Entity Alignment Between Knowledge Graphs

作者:Qi Zhu, Hao Wei, Bunyamin Sisman, Da Zheng, Christos Faloutsos, Xin Luna Dong and Jiawei Han

摘要:知識圖(如Freebase、Yago)是表示各類實體之間豐富真實信息的多關系圖。實體對齊是實現多源知識圖集成的關鍵步驟。它旨在識別涉及同一真實世界實體的不同知識圖中的實體。然而,現有的實體對齊系統忽略了不同知識圖的稀疏性,不能通過單一模型對多類型實體進行對齊。在本文中,我們提出了一種用于多類型實體對齊的聯合圖神經網絡(Collective Graph neural network),稱為CG-MuAlign。與以前的工作不同,CG-MuAlign聯合對齊多種類型的實體,共同利用鄰域信息并將其推廣到未標記的實體類型。具體地說,我們提出了一種新的集中聚集函數1)通過交叉圖和自注意力來緩解知識圖的不完全性,2)通過小批量訓練范例和有效的鄰域抽樣策略,有效地提高了可伸縮性。我們在具有數百萬個實體的真實知識圖上進行了實驗,觀察到了比現有方法更優越的性能。此外,我們的方法的運行時間比目前最先進的深度學習方法要少得多。

網址:

  1. Complex Factoid Question Answering with a Free-Text Knowledge Graph

作者:Chen Zhao, Chenyan Xiong, Xin Qian and Jordan Boyd-Graber

摘要:我們介紹了Delft,一個事實問答系統,它將知識圖問答方法的細微和深度與更廣泛的free-文本結合在一起。Delft從Wikipedia構建了一個自由文本知識圖,以實體為節點和句子,其中實體同時出現做為邊。對于每個問題,Delft使用文本句子作為邊,找到將問題實體節點鏈接到候選對象的子圖,創建了密集且覆蓋率高的語義圖。一種新穎的圖神經網絡在free-文本圖上進行推理-通過沿邊句子的信息組合節點上的證據-以選擇最終答案。在三個問答數據集上的實驗表明,Delft能夠比基于機器閱讀的模型、基于BERT的答案排序和記憶網絡更好地回答實體豐富的問題。Delft的優勢既來自于其free-文本知識圖譜的高覆蓋率--是DBpedia關系的兩倍多--也來自于新穎的圖神經網絡,它基于豐富而嘈雜的free-文本證據進行推理。

網址:

  1. Dynamic Graph Convolutional Networks for Entity Linking

作者:Junshuang Wu, Richong Zhang, Yongyi Mao, Hongyu Guo, Masoumeh Soflaei and Jinpeng Huai

摘要:實體鏈接將文檔中提及的命名實體映射到給定知識圖中的合適的實體,已被證明能夠從基于圖卷積網絡(GCN)對實體相關性建模中獲得顯著好處。然而,現有的GCN實體鏈接模型沒有考慮到,一組實體的結構化圖不僅依賴于給定文檔的上下文信息,而且在GCN的不同聚合層上自適應地變化,導致在捕捉實體之間的結構信息方面存在不足。在本文中,我們提出了一種動態的GCN體系結構來有效地應對這一挑戰。模型中的圖結構是在訓練過程中動態計算和修改的。通過聚合動態鏈接節點的知識,我們的GCN模型可以集中識別文檔和知識圖之間的實體映射,并有效地捕捉整個文檔中各個實體提及( mentions)之間的主題一致性。在基準實體連接數據集上的實證研究證實了我們提出的策略的優越性能和動態圖結構的好處。

網址:

  1. High Quality Candidate Generation and Sequential Graph Attention Network for Entity Linking

作者:Yichao Zhou, Shaunak Mishra, Manisha Verma, Narayan Bhamidipati and Wei Wang

摘要:實體鏈接(EL)是將文本中提及的內容映射到知識庫(KB)中相應實體的任務。這項任務通常包括候選生成(CG)和實體消歧(ED)兩個階段。目前基于神經網絡模型的EL系統取得了較好的性能,但仍然面臨著兩個挑戰:(1)以往的研究在評估模型時沒有考慮候選實體之間的差異。事實上,候選集的質量(特別是黃金召回)對EL結果有影響。因此,如何提候選的素質需要引起更多的關注。(Ii)為了利用提及實體之間的主題一致性,提出了許多聚集ED的圖和序列模型。然而,基于圖的模型對所有候選實體一視同仁,這可能會引入大量的噪聲信息。相反,序列模型只能觀察先前引用的實體,而忽略了當前提及的實體與其后續實體之間的相關性。針對第一個問題,我們提出了一種基于多策略的CG方法來生成高召回率的候選集。對于第二個問題,我們設計了一個序列圖注意力網絡(SeqGat),它結合了圖和序列方法的優點。在我們的模型中,提及( mentions)是按順序處理的。在當前提到的情況下,SeqGAT對其先前引用的實體和后續實體進行動態編碼,并為這些實體分配不同的重要性。這樣既充分利用了主題的一致性,又減少了噪聲干擾。我們在不同類型的數據集上進行了實驗,并在開放的評測平臺上與以前的EL系統進行了比較。比較結果表明,與現有的方法相比,我們的模型有了很大的改進。

網址:

  1. Mining Implicit Entity Preference from User-Item Interaction Data for Knowledge Graph Completion via Adversarial Learning

作者:Gaole He, Junyi Li, Wayne Xin Zhao, Peiju Liu and Ji-Rong Wen

摘要:知識圖補全(KGC)任務旨在自動推斷知識圖(KG)中缺失的事實信息。在本文中,我們采取了一個新的視角,旨在利用豐富的用戶-項目交互數據(簡稱用戶交互數據)來改進KGC任務。我們的工作靈感來自于觀察到許多KG實體對應于應用系統中的在線項目。然而,這兩種數據源的固有特性有很大的不同,使用簡單的融合策略很可能會損害原有的性能。為了應對這一挑戰,我們提出了一種新的對抗性學習方法,通過利用用戶交互數據來執行KGC任務。我們的生成器是從用戶交互數據中分離出來的,用來提高鑒別器的性能。鑒別器將從用戶交互數據中學習到的有用信息作為輸入,并逐步增強評估能力,以識別生成器生成的假樣本。為了發現用戶的隱含實體偏好,設計了一種基于圖神經網絡的協同學習算法,并與鑒別器進行聯合優化。這種方法有效地緩解了KGC任務的數據異構性和語義復雜性問題。在三個真實世界數據集上的廣泛實驗已經證明了我們在KGC任務上的方法的有效性。

網址:

付費5元查看完整內容

【導讀】國際萬維網大會(The Web Conference,簡稱WWW會議)是由國際萬維網會議委員會發起主辦的國際頂級學術會議,創辦于1994年,每年舉辦一屆,是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。由于疫情影響,會議在線上舉行。本屆會議共收到了1129篇長文投稿,錄用217篇長文,錄用率為19.2%。上周專知小編整理了WWW 2020 推薦系統相關論文-part2,這期小編繼續為大家奉上WWW 2020六篇推薦系統相關論文-part3 供參考——上下文感知推薦、雙邊公平推薦、MetaSelector、視覺主題推薦、社交影響力。 WWW2020RS_Part2、WWW2020RS_Part1

1. Eficient Non-Sampling Factorization Machines for Optimal Context-Aware Recommendation

作者:Chong Chen, Min Zhang, Weizhi Ma, Yiqun Liu, and Shaoping Ma

摘要:為了提供更準確的推薦,在對用戶項目交互進行建模之外考慮上下文特征已成為一個熱門話題。具有負采樣的因子分解機(FM)是一種流行的上下文感知推薦解決方案。然而,由于采樣可能丟失重要信息,并且在實際應用中通常會導致非最優性能,因此該算法的魯棒性不強。最近的一些努力通過使用深度學習框架建模高階特征交互增強了FM的性能。而他們要么只關注評分預測任務,要么通常采用負采樣策略來優化排名效果。由于采樣的巨大的波動,我們有理由認為這些基于采樣的FM方法對于上下文感知推薦仍然不是最佳的。在本文中,我們提出在不進行采樣的情況下學習FM,以有助于上下文感知推薦??的排名任務。盡管這種方法效率很高,但這種非采樣策略對模型的學習效率提出了很大的挑戰。因此,我們進一步設計了一種新的理想框架--有效非采樣樣因子分解機(ENSFM)。ENSFM不僅無縫連接了FM和矩陣分解(MF)之間的關系,而且通過新穎的記憶策略解決了具有挑戰性的效率問題。通過在三個真實的公共數據集上的大量實驗表明:1)我們提出的ENSFM的性能一致且顯著優于現有的上下文感知Top-K推薦方法,2)ENSFM在訓練效率上具有顯著的優勢,使其更適用于實際的大系統。此外,實驗結果表明,對于Top-K推薦任務,合適的學習方法比先進的神經網絡結構更為重要。

網址:

//www.thuir.cn/group/~mzhang/publications/TheWebConf2020-Chenchong.pdf

代碼鏈接:

2. FairRec: Two-Sided Fairness for Personalized Recommendations in Two-Sided Platforms

作者:Gourab K Patro, Arpita Biswas, Niloy Ganguly, Krishna P. Gummadi and Abhijnan Chakraborty

摘要:我們在雙邊在線平臺的背景下調查公平推薦(fair recommendation )問題,該平臺由一邊的客戶和另一邊的生產商組成。這些平臺推薦服務的傳統方法側重于根據個人客戶的個性化偏好定制結果,以實現客戶滿意度的最大化。然而,我們的調查顯示,這種以客戶為中心的設計可能會導致生產商之間曝光量的不公平分配,這可能會對他們的利益造成不利影響。另一方面,以生產商為中心的設計可能會對客戶不公平。因此,我們考慮了客戶和生產商之間的公平問題。我們的方法將公平推薦問題映射為一個公平分配不可分割商品問題的新穎映射。我們提出的FairRec算法可確保至少為大多數生產商提供Maximin Share(MMS)的曝光量,并為每個客戶提供多達Envy-Free(EF1)的公平性。對多個真實世界數據集的廣泛評估顯示,FairRec在確保雙面公平性的同時,在總體推薦質量方面造成了邊際損失的有效性。

網址:

3. MetaSelector: Meta-Learning for Recommendation with User-Level Adaptive Model Selection

作者:Mi Luo, Fei Chen, Pengxiang Cheng, Zhenhua Dong, Xiuqiang He, Jiashi Feng and Zhenguo Li

摘要:推薦系統通常面對包含高度個性化用戶歷史數據的異構數據集,在這些數據集中,沒有哪個模型可以為每個用戶提供最佳建議。我們在公共和私有數據集上都觀察到了這種普遍存在的現象,并解決了模型選擇問題,以追求對每個用戶的推薦質量的優化。我們提出了一個元學習框架來促進推薦系統中用戶級的自適應模型選擇。在此框架中,我們將使用來自所有用戶的數據來訓練推薦者集合,然后通過元學習對模型選擇器進行訓練,以使用用戶特定的歷史數據為每個用戶選擇最佳的單個模型。我們在兩個公共數據集和一個真實的生產數據集上進行了廣泛的實驗,證明了我們的框架在AUC和LogLoss方面比單一的模型基線和樣本級模型選擇器都有改進。特別是,當這些改進部署在在線推薦系統中時,可能會帶來巨大的利潤收益。

網址:

4. Recommending Themes for Ad Creative Design via Visual-Linguistic Representations

作者:Yichao Zhou, Shaunak Mishra, Manisha Verma, Narayan Bhamidipati and Wei Wang

摘要:在線廣告行業中經常需要更新廣告創意,即用于吸引在線用戶進入品牌的圖像和文字。進行此類更新,是為了減少在線用戶中廣告疲勞的可能性,并將其他成功的廣告加入到相關產品類別中。對于創意策略師來說,給定一個品牌,為一個新的廣告想出主題是一個費時費力的過程。創意策略師來通常從過去廣告活動中使用的圖像和文字以及有關品牌的知識中汲取靈感。為了在過去的廣告活動中通過此類多模態信息自動推斷廣告主題,我們為廣告創意策略師提出了主題(關鍵詞)推薦系統。主題推薦器基于視覺問答(VQA)任務的聚合結果,該任務提取以下內容:(i)廣告圖像,(ii)與廣告關聯的文字以及廣告中品牌的Wikipedia頁面,(iii)有關廣告的問題。我們利用基于transformer的跨模態編碼器來為VQA任務訓練視覺語言表示。我們沿著分類和排序的思路研究了VQA任務的兩個公式;通過在公共數據集上的實驗,表明跨模態表示顯著地提高了分類準確率和排序精準-召回指標。與單獨的圖像和文本表示相比,跨模式表示顯示出更好的性能。此外,與僅使用文本或視覺信息相比,多模態信息的使用表現出顯著提升。

網址:

5. The Structure of Social Influence in Recommender Networks

作者:Pantelis P. Analytis, Daniel Barkoczi, Philipp Lorenz-Spreen and Stefan M. Herzog

摘要:人們在品味(taste)上影響他人意見的能力各不相同-既包括離線與在線推薦系統。這些驚人差異背后的機制是什么?使用加權k最近鄰算法(k-nn)表示一系列社會學習策略,我們利用網絡科學的方法展示了k-nn算法如何在六個現實世界的品味領域中引發社會影響力網絡。我們給出了三個新的結果,分別適用于離線建議獲取和在線推薦器設置。首先,有影響力的個人具有主流品味,與其他人的品味相似性分散度很高。其次,個人或算法咨詢的人越少(即k越低),或者對其他更相似的人的意見給予的權重越大,具有實質性影響的人的群體就越小。第三,對部署k-nn算法后產生的影響網絡是分層組織的。我們的結果為通信和網絡科學中的經典實證發現提供了新的線索,有助于提高對線下和在線上的社會影響的理解。

網址:

6. Latent Linear Critiquing for Conversational Recommender Systems

作者:PKai Luo, Scott Sanner, Ga Wu, Hanze Li and Hojin Yang

摘要:批判(Critiquing)是一種用于會話推薦的方法,可根據用戶的偏好反饋迭代地調整建議。在該設置中,迭代地向用戶提供該項目的項目推薦和屬性描述;用戶可以接受該推薦,或者批判項目描述中的屬性以生成新的推薦。之前的批判方法主要基于顯式約束和基于實用程序的方法來修改推薦(評判的項目屬性)。在這篇文章中,我們回顧了基于潛在嵌入和主觀項目描述(即來自用戶評論的關鍵詞)的推薦方法時代的批判方法。主要兩個關鍵的研究問題:(1)如何將關鍵詞批判與用戶偏好嵌入一起嵌入以更新推薦,(2)如何調節多步驟批判性反饋的強度,其中批判性反饋不一定是獨立的,也不一定是同等重要的。為了解決(1),我們構建了一個現有的最先進的線性嵌入推薦算法,以使基于評論的關鍵詞屬性與用戶偏好嵌入保持一致。為了解決(2),我們利用嵌入和推薦預測的線性結構來建立一個基于線性規劃(LP)的優化問題,以確定納入批評反饋的最優權重。我們在兩個包含模擬用戶評論的推薦數據集上評估提出的框架。與對批判反饋進行平均的標準方法相比,實驗結果表明,我們的方法減少了找到滿意項目所需的交互次數,并提高了總體成功率。

網址:

付費5元查看完整內容

【導讀】國際萬維網大會(The Web Conference,簡稱WWW會議)是由國際萬維網會議委員會發起主辦的國際頂級學術會議,創辦于1994年,每年舉辦一屆,是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。本屆會議共收到了1129篇長文投稿,錄用217篇長文,錄用率為19.2%。近期,推薦相關也比較熱門,專知小編提前整理了WWW 2020 推薦系統比較有意思的的論文,供參考——序列推薦、可解釋Serendipity 推薦、推薦效率、 bandit推薦、Off-policy學習。 WWW2020RS_Part1

  1. A Contextualized Temporal Attention Mechanism for Sequential Recommendation

作者:Jibang Wu, Renqin Cai, Hongning Wang

摘要:根據用戶的歷史連續行為預測用戶的偏好對于現代推薦系統來說是具有挑戰性的,也是至關重要的。現有的序列推薦算法在建模歷史事件對當前預測的影響時,大多側重于序列行為之間的過渡結構,而很大程度上忽略了時間和上下文信息。在這篇文章中,我們認為過去的事件對用戶當前行為的影響應該隨著時間的推移和不同的背景而變化。因此,我們提出了一種情境時間注意力機制(Contextualized Temporal Attention),該機制可以學習權衡歷史行為在行為以及行為發生的時間和方式上的影響。更具體地說,為了動態地校準來自自注意力機制的相對輸入的依賴關系,我們提出了多個參數化的核函數以學習各種時間動態,然后使用上下文信息來確定每個輸入要跟隨哪一個kernel( reweighing kernels )。在對兩個大型公開推薦數據集進行的實證評估中,我們的模型始終優于一系列最先進的序列推薦方法。

網址:

//arxiv.org/pdf/2002.00741.pdf

  1. Directional and Explainable Serendipity Recommendation

作者:Xueqi Li, Wenjun Jiang, Weiguang Chen, Jie Wu, Guojun Wang, Kenli Li

摘要:近幾年來,Serendipity推薦越來越受到人們的關注,它致力于提供既能迎合用戶需求,又能開闊他們眼界的建議。然而,現有的方法通常使用標量而不是向量來度量用戶與項目的相關性,忽略了用戶的偏好方向,這增加了不相關推薦的風險。此外,合理的解釋增加了用戶的信任度和接受度,但目前沒有為Serendipity推薦提供解釋的工作。為了解決這些局限性,我們提出了一種有向的、可解釋的Serendipity推薦方法,稱為DESR。具體而言,首先采用基于高斯混合模型(GMM)的無監督方法提取用戶的長期偏好,然后利用膠囊(capsule )網絡捕捉用戶的短期需求。然后,我們提出了將長期偏好與短期需求相結合的意外(serendipity)向量,并利用它生成有向的Serendipity推薦。最后,利用反向路徑選擇方案進行了解釋。在真實數據集上的大量實驗表明,與現有的基于意外(serendipity)發現的方法相比,DESR能夠有效地提高意外性和可解釋性,促進多樣性。

網址

  1. LightRec: a Memory and Search-Efficient Recommender System

作者:Defu Lian, Haoyu Wang, Zheng Liu, Jianxun Lian, Enhong Chen, Xing Xie

摘要:近年來,深度推薦系統已經取得了顯著的進步。盡管具有出色的排名精度,但實際上運行效率和內存消耗在現實中卻是嚴重的瓶頸。為了克服這兩個瓶頸,我們提出了LightRec,這是一個輕量級的推薦系統,具有快速的在線推斷功能和經濟的內存消耗。LightRec的主干是總共B個codebooks,每個codebook均由W個潛在向量組成,稱為codewords。在這種結構的頂部,LightRec將有一個商品表示為B codewords的加法組合,這些B codewords是從每個codebook中選擇的最佳的。為了有效地從數據中學習codebooks,我們設計了一個端到端的學習工作流程,其中所提出的技術克服了固有差異性和多樣性方面的挑戰。另外,為了進一步提高表示質量,采用了幾種distillation策略,可以更好地保留用戶-商品的相關性得分和相對排名順序。我們對LightRec在四個真實數據集上進行了廣泛評估,得出了兩個經驗發現:1)與最先進的輕量級baseline相比,LightRec在召回性能方面取得了超過11%的相對改進;2)與傳統推薦算法相比,在top-k推薦算法中,LightRec的精度下降幅度可以忽略不計,但速度提高了27倍以上。

網址:

  1. Hierarchical Adaptive Contextual Bandits for Resource Constraint based Recommendation

作者:Mengyue Yang, Qingyang Li, Zhiwei Qin, Jieping Ye

摘要:上下文多臂 bandit(MAB)在各種問題上實現了優異性能。然而,當涉及到推薦系統和在線廣告等現實場景時,必須考慮探索的資源消耗。在實踐中,通常存在與在環境中執行建議(ARM)相關聯的非零成本,因此,應該在固定的探索成本約束下學習策略。由于直接學習全局最優策略是一個NP難題,并且極大地使bandit算法的探索和開發之間的權衡復雜化,因此直接學習全局最優策略是一個很大的挑戰。現有的方法著重于通過采用貪婪策略來解決問題,該策略估計預期的收益和成本,并基于每個臂的預期收益/成本比使用貪婪的選擇,利用歷史觀察直到勘探資源耗盡為止。然而,現有的方法當沒有更多的資源時,學習過程就會終止,因此很難擴展到無限的時間范圍。本文提出了一種分層自適應上下文bandit方法(HATCH)來進行有預算約束的上下文bandit的策略學習。HATCH采用一種自適應的方法,根據剩余資源/時間和對不同用戶上下文之間報酬分配的估計來分配勘探資源。此外,我們利用充分的上下文特征信息來找到最好的個性化推薦。最后,為了證明提出的理論,我們進行了regret bound分析,并證明HATCH的regret bound低至O(√T)。實驗結果證明了該方法在合成數據集和實際應用中的有效性和效率。

網址:

  1. Off-policy Learning in Two-stage Recommender Systems

作者:Jiaqi Ma, Zhe Zhao, Xinyang Yi, Ji Yang, Minmin Chen, Jiaxi Tang, Lichan Hong, Ed H. Chi

摘要:許多現實世界中的推薦系統需要高度可伸縮性:將數百萬個項目與數十億用戶進行匹配,并只具有毫秒級的延遲。可伸縮性的要求導致了廣泛使用的兩階段推薦系統,由第一階段高效的候選生成模型和第二階段更強大的排序模型組成。通常使用記錄的用戶反饋(例如,用戶點擊或停留時間)來構建用于推薦系統的候選生成和排名模型。雖然很容易收集大量這樣的數據,但因為反饋只能在以前系統推薦的項目上觀察到,因此這些數據在本質上是有偏見的。近年來,推薦系統研究領域對此類偏差的off-policy 修正引起了越來越多的關注。然而,現有的大多數工作要么假設推薦系統是一個單階段系統,要么只研究如何將離策略校正應用于系統的候選生成階段,而沒有顯式地考慮這兩個階段之間的相互作用。在這項工作中,我們提出了一種兩階段離策略(two-stage off-policy)策略梯度方法,并證明了在兩階段推薦系統中忽略這兩個階段之間的交互會導致次優策略。該方法在訓練候選生成模型時明確考慮了排序模型,有助于提高整個系統的性能。我們在具有大項目空間的真實數據集上進行了實驗,驗證了所提方法的有效性。

網址:

付費5元查看完整內容

【導讀】國際萬維網大會(The Web Conference,簡稱WWW會議)是由國際萬維網會議委員會發起主辦的國際頂級學術會議,創辦于1994年,每年舉辦一屆,是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。由于疫情影響,這次會議在線上舉行,本屆會議共收到了1129篇長文投稿,錄用217篇長文,錄用率為19.2%。近期,隨著會議的臨近,有很多paper放出來,小編發現這次WWW 2020被圖神經網絡攻占,占比非常大,可見其火爆程度。這期小編繼續為大家奉上WWW 2020五篇GNN相關論文供參考——圖注意力主題模型、超圖學習、圖神經網絡Hash、多視角圖聚類、Graph Pooling。

WWW2020GNN_Part2、WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN、EMNLP2019GNN、ICCV2019GNN_Part2、ICCV2019GNN_Part1、NIPS2019GNN、IJCAI2019GNN_Part1、IJCAI2019GNN_Part2、KDD2019GNN、ACL2019GNN、CVPR2019GNN、ICML2019GNN

  1. Graph Attention Topic Modeling Network

作者:Liang Yang, Fan Wu, Junhua Gu, Chuan Wang, Xiaochun Cao, Di Jin, and Yuanfang Guo

摘要:現有的主題模型(topic modeling)方法存在一些問題,包括概率潛在語義索引模型(Probablistic Latent Semantic Indexing,PLSI)過擬合問題、隱狄利克雷分配(Latent Dirichlet Allocation,LDA)模型不能能捕捉主題間豐富的主題相關性與推理復雜度高等問題。本文提出了一種新的方法來克服pLSI的過擬合問題,用嵌入單詞的平攤推理(amortized inference)作為輸入,代替LDA中的狄利克雷先驗。對于生成性主題模型,大量的自由隱變量是過擬合的根源。為了減少參數個數,平攤推理用一個具有共享(平攤)可學習參數的函數代替了對隱變量的推理。共享參數的數量是固定的,并且與語料庫的規模無關。為了克服平攤推理在獨立同分布(I.I.D)數據中應用的局限性,根據以下兩個觀察結果,我們提出了一種新的圖神經網絡--圖注意力主題網絡(GATON),用于對非I.I.D文檔的主題結構進行建模。首先,pLSI可以解釋為特定二分圖上的隨機塊模型(SBM)。其次,圖注意力網絡(GAT)可以解釋為SBM的半平攤推理(semi-amortized inference),它放寬了I.I.D數據的vanilla 平攤推理假設。GATON提供了一種新穎的基于圖卷積運算的方案,去聚合單詞相似度和單詞共現結構。具體地說,詞袋文檔表示被建模為二分圖拓撲。同時,將捕獲詞相似性的詞嵌入建模為詞節點的屬性,并采用詞頻向量作為文檔節點的屬性。基于加權(注意力)圖卷積操作,詞共現結構和詞相似度模式被無縫地集成在一起進行主題識別。大量實驗表明,GATON在主題識別方面的有效性不僅有利于文檔分類,而且能顯著細化輸入詞的嵌入。

網址://yangliang.github.io/pdf/www20.pdf

  1. How Much and When Do We Need Higher-order Information in Hypergraphs? A Case Study on Hyperedge Prediction

作者:Se-eun Yoon, Hyungseok Song, Kijung Shin, and Yung Yi

摘要:超圖提供了一種自然的表示組群關系的方法,其復雜性促使大量先前的工作采用某種形式抽象和簡化高階交互。然而,以下問題尚未得到解決:在解決超圖任務時,組群間交互的抽象程度需要多大?這些結果在不同的數據集中會有多大的不同?如果這個問題可以回答,將為如何在解決下游任務的復雜性和準確性之間權衡提供有用的工程指南。為此,我們提出了一種使用n投影圖( n-projected graph )的概念遞增表示群組交互的方法,該圖的累積量包含多達n種交互作用的信息,并隨著各種數據集的增長,量化解決任務的準確性。作為下游任務,我們考慮超邊預測,它是連接預測的擴展,是評估圖模型的典型任務。通過在15個真實數據集上的實驗,我們得出了以下信息:(a)收益遞減:較小地n足以獲得與接近完美近似值相當的精度,(b)疑難解答:隨著任務的挑戰性越來越大,n帶來了更多好處,(c)不可約性:當成對抽象化時,其成對交互并不能充分說明高階交互的數據集將失去很多準確性。

網址:

  1. Learning to Hash with Graph Neural Networks for Recommender Systems

作者:Qiaoyu Tan, Ninghao Liu, Xing Zhao, Hongxia Yang, Jingren Zhou, and Xia Hu

摘要:工業推薦系統一般包括兩個階段:召回和排名。召回是指從海量的項目語料庫中高效地識別出數百個用戶可能感興趣的候選項目,而排名的目標是使用復雜的排名模型輸出精確的排名列表。近年來,圖表示學習在支持大規模高質量候選搜索方面受到了廣泛關注。盡管它在用戶-項目交互網絡中學習對象的嵌入向量方面是有效的,但在連續嵌入空間中推斷用戶偏好的計算代價是巨大的。在這項工作中,我們研究了基于圖神經網絡(GNNs)的哈希高質量檢索問題,并提出了一種簡單而有效的離散表示學習框架來聯合學習連續與離散編碼。具體地說,提出了一種基于GNN的深度哈希算法(HashGNN),它由兩部分組成,一個是用于學習節點表示的GNN編碼器,另一個是用于將表示編碼為哈希碼的哈希層。整個框架通過聯合優化以下兩個損失進行端到端的訓練,即通過重建觀察到的連接而產生的重建損失,以及通過保留哈希碼的相對順序產生的排序損失。我們還提出了一種基于直通估計器(straight through estimator ,STE)指導的離散優化策略。其主要思想是在連續嵌入指導下避免STE的反向傳播中的梯度放大,在這種情況下,我們從學習一個更容易模仿連續嵌入的更簡單的網絡開始,并使其在訓練過程中發展直至最終返回STE。在三個公開可用數據集和一個真實的阿里巴巴公司數據集的綜合實驗表明,我們的模型不僅可以達到連續模型的性能,而且在推理過程中運行速度快了好幾倍。

網址:

  1. One2Multi Graph Autoencoder for Multi-view Graph Clustering

作者:Shaohua Fan, Xiao Wang, Chuan Shi, Emiao Lu, Ken Lin, and Bai Wang

摘要:多視圖圖聚類(Multi-view graph clustering)近年來受到了相當大的關注,它是一種尋找具有多個視圖的圖的分割方法,通常提供更全面但更復雜的信息。雖然多視圖圖聚類已經做了一些努力并取得了較好的效果,但大多數都是采用淺層模型來處理多視圖間的復雜關系,這可能會嚴重限制多視圖的圖信息建模能力。本文首次嘗試將深度學習技術應用于屬性多視圖圖聚類,提出了一種新的任務導向的One2Multi圖自編碼器聚類框架。One2Multi圖自編碼器能夠通過使用一個信息豐富的圖形視圖和內容數據來重建多個圖形視圖來學習節點嵌入。因此,可以很好地捕捉多個圖的共享特征表示。在此基礎上,我們還提出了一種自訓練聚類目標,以迭代地改善聚類結果。通過將自訓練和自編碼器重構集成到一個統一的框架中,我們的模型可以聯合優化適用于圖聚類的簇標簽分配和嵌入。在真實屬性多視圖圖數據集上的實驗很好地驗證了該模型的有效性。

網址:

  1. Structure-Feature based Graph Self-adaptive Pooling

作者:Liang Zhang, Xudong Wang, Hongsheng Li, Guangming Zhu, Peiyi Shen, Ping Li, Xiaoyuan Lu, Syed Afaq Ali Shah, and Mohammed Bennamoun

摘要:近年來,人們提出了各種處理圖數據的方法。然而,這些方法大多側重于圖的特征聚合,而不是圖的池化。此外,現有的top-k選擇圖池化方法存在一些問題。首先,在構建池化圖拓撲時,現有的top-k選擇方法只從單一的角度評價節點的重要性,這是簡單化和不客觀的。其次,未選中節點的特征信息在池化過程中直接丟失,必然導致大量的圖特征信息丟失。為了解決上述問題,我們提出了一種新穎的圖自適應池化方法,目標如下:(1)為了構造合理的池化圖拓撲,同時考慮了圖的結構信息和特征信息,增加了節點選擇的準確性和客觀性;(2)為了使池化的節點包含足夠有效的圖信息,在丟棄不重要的節點之前,先聚合節點特征信息;因此,所選擇的節點包含來自鄰居節點的信息,這可以增強未選擇節點的特征的使用。在四個不同的數據集上的實驗結果表明,我們的方法在圖分類中是有效的,并且優于最新的圖池化方法。

網址:

付費5元查看完整內容

【導讀】國際萬維網大會(The Web Conference,簡稱WWW會議)是由國際萬維網會議委員會發起主辦的國際頂級學術會議,創辦于1994年,每年舉辦一屆,是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。本屆會議共收到了1129篇長文投稿,錄用217篇長文,錄用率為19.2%。近期,隨著會議的臨近,有很多paper放出來,幾周前專知小編整理了WWW 2020圖神經網絡(GNN)比較有意思的論文,這期小編繼續為大家奉上WWW 2020五篇GNN相關論文供參考——對抗攻擊、Heterogeneous Graph Transformer、圖生成、多關系GNN、知識庫補全。

WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN、EMNLP2019GNN、ICCV2019GNN_Part2、ICCV2019GNN_Part1、NIPS2019GNN、IJCAI2019GNN_Part1、IJCAI2019GNN_Part2、KDD2019GNN、ACL2019GNN、CVPR2019GNN、ICML2019GNN

  1. Adversarial Attack on Community Detection by Hiding Individuals

作者:Jia Li, Honglei Zhang, Zhichao Han, Yu Rong, Hong Cheng and Junzhou Huang

摘要:已經證明,添加了不可察覺擾動的對抗圖(adversarial graphs),會導致深層圖模型在節點/圖分類任務中失敗。在本文中,我們將對抗性圖擴展到困難得多的社區發現(community detection)問題上。我們關注黑盒攻擊,致力于隱藏目標個體,使其不被深度圖社區檢測模型檢測到,該模型在現實場景中有很多應用,例如,保護社交網絡中的個人隱私,理解交易網絡中的偽裝模式。我們提出了一個迭代學習框架,輪流更新兩個模塊:一個作為約束圖生成器,另一個作為替代社區發現模型。我們還發現,我們的方法生成的對抗圖可以遷移到其他基于社區發現模型的學習中。

網址://arxiv.org/abs/2001.07933

  1. Heterogeneous Graph Transformer

作者:Ziniu Hu, Yuxiao Dong, Kuansan Wang and Yizhou Sun

摘要:近年來,圖神經網絡(GNNs)在結構化數據建模方面取得了突飛猛進的成功。然而,大多數GNN都是為同質圖(所有的節點和邊都屬于相同的類型)設計的,這使得這些GNN不能表示異構結構。在這篇文章中,我們提出了異構圖轉換器(HGT)結構來建模Web規模的異構圖。為了建模異構性,我們設計了與節點和邊類型相關的參數來表征對每條邊的異構關注,使得HGT能夠維護不同類型的節點和邊的專有表示。為了處理動態異構圖,我們將相對時間編碼技術引入到HGT中,能夠捕獲任意持續時間的動態結構依賴關系。為了處理Web規模的圖數據,我們設計了異構小批量圖采樣算法HGSamples,以實現高效和可擴展的訓練。在具有1.79億個節點和20億條邊的開放學術圖上的廣泛實驗表明,本文所提出的HGT模型在各種下游任務上的性能一致地比所有最新的GNN基線高出9%-21%。

網址:

代碼鏈接:

  1. GraphGen: A Scalable Approach to Domain-agnostic Labeled Graph Generation

作者:Nikhil Goyal, Harsh Vardhan Jain and Sayan Ranu

摘要:圖生成模型在數據挖掘領域中得到了廣泛的研究。傳統的技術基于預定義分布的生成結構,而最近的技術已轉向直接從數據中學習此分布。雖然基于學習的方法在質量上有了顯著的提高,但仍有一些缺點需要解決。首先,學習圖的分布會帶來額外的計算開銷,這就限制了這些方法對大型圖數據庫的可擴展性。第二,許多方法只學圖結構,并沒有學習節點和邊的標簽(這些標簽編碼重要的語義信息會影響結構自身)。第三,現有技術往往包含領域的特定規則,缺乏通用性。第四,現有方法的實驗部分要么使用了較弱的評估指標,要么主要集中在合成數據或小數據集上,實驗不夠全面上。在這項工作中,我們提出了一種稱為GraphGen的域未知(domain-agnostic)技術來克服所有這些缺點,GraphGen使用最少的DFS代碼將圖轉換為序列。最小DFS碼是規范化的標簽,并且可以精確地捕捉圖結構和標簽信息。本文通過一種新的LSTM結構學習結構標簽和語義標簽之間復雜的聯合分布。在百萬級的真實圖數據集上的廣泛實驗表明,GraphGen的平均速度是最先進方法的4倍,同時在11個不同指標的綜合集合中質量明顯更好。

網址:

代碼鏈接:

  1. Beyond Clicks: Modeling Multi-Relational Item Graph for Session-Based Target Behavior Prediction

作者:Wen Wang, Wei Zhang, Shukai Liu, Bo Zhang, Leyu Lin and Hongyuan Zha

摘要:基于會話的目標行為預測旨在預測要與特定行為類型(例如,點擊)交互的下一項。雖然現有的基于會話的行為預測方法利用強大的表示學習方法來編碼項目在低維空間中的順序相關性,但是它們受到一些限制。首先,之前的方法側重于只利用同一類型的用戶行為進行預測,而忽略了將其他行為數據作為輔助信息的潛力。當目標行為稀疏但很重要(例如,購買或共享物品)時,輔助信息尤為重要。其次,項目到項目的關系是在一個行為序列中單獨和局部建模的,缺乏一種規定的方法來更有效地全局編碼這些關系。為了克服這些局限性,我們提出了一種新的基于會話的多關系圖神經網絡模型(MGNN-SPred)。具體地說,我們基于來自所有會話的所有行為序列(涉及目標行為類型和輔助行為類型)構建多關系項目圖(Multi-Relational Item Graph,MRIG)。在MRIG的基礎上,MGNN-SPred學習全局項目與項目之間的關系,進而獲得用戶偏好分別作為為當前目標行為序列和輔助行為序列。最后,MGNN-SPred利用門控機制自適應地融合用戶表示,以預測與目標行為交互的下一項。在兩個真實數據集上的廣泛實驗證明了MGNN-SPred與最新的基于會話的預測方法相比的優越性,驗證了利用輔助行為和基于MRIG學習項目到項目關系的優點。

網址:

  1. Open Knowledge Enrichment for Long-tail Entities

作者:Ermei Cao, Difeng Wang, Jiacheng Huang and Wei Hu

摘要:知識庫(KBS)已經逐漸成為許多人工智能應用的寶貴資產。雖然目前的許多知識庫相當大,但它們被是不完整的,特別是缺乏長尾實體(例如:不太有名的人)。現有的方法主要通過補全缺失連接或補齊缺失值來豐富知識庫。然而,它們只解決了充實知識庫問題的一部分,缺乏對長尾實體的具體考慮。在這篇文章中,我們提出了一種新穎的知識補齊方法,它從開放的Web中預測缺失的屬性并推斷出長尾實體的真實值。利用來自流行實體的先驗知識來改進每個充實步驟。我們在合成數據集和真實數據集上的實驗以及與相關工作的比較表明了該方法的可行性和優越性。

網址:

付費5元查看完整內容

【導讀】國際萬維網大會(The Web Conference,簡稱WWW會議)是由國際萬維網會議委員會發起主辦的國際頂級學術會議,創辦于1994年,每年舉辦一屆,是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。本屆會議共收到了1129篇長文投稿,錄用217篇長文,錄用率為19.2%。近期,隨著會議的臨近,有很多paper放出來,專知小編提前整理了WWW 2020圖神經網絡(GNN)比較有意思的的論文—TaxoExpan,結構深度聚類網絡、MetapathGNN、對抗樣本、圖域自適應。

  1. TaxoExpan: Self-supervised Taxonomy Expansion with Position-Enhanced Graph Neural Network

作者:Jiaming Shen, Zhihong Shen, Chenyan Xiong, Chi Wang, Kuansan Wang, Jiawei Han

摘要:本體結構(Taxonomies)由機器可解釋的語義組成,并為許多Web應用程序提供有價值的知識。例如,在線零售商(亞馬遜和eBay)使用本體結構進行產品推薦,而網絡搜索引擎(Google和Bing)利用本體結構來增強查詢理解。當前我們在人工或半自動地構建本體結構方面已經做出了巨大的努力。然而,隨著網絡內容數量的快速增長,現有的本體結構無法捕捉到新興的知識。因此,在許多應用程序中,十分需要對現有本體結構進行動態擴展。在本文中,我們研究了如何通過添加一組新的概念來擴展現有的本體結構。我們提出了一種新的自監督框架TaxoExpanTM,該框架從已有的本體結構中自動生成一組 ?query concept, anchor concept ? 對作為訓練數據。使用這樣的自監督數據,TaxoExpanTM學習一個模型來預測query concept是否是 anchor concept的直接下義詞。我們在TaxoExspan中提出了兩種創新技術:(1)位置增強型圖形神經網絡,它編碼現有本體結構中anchor concept的局部結構;2)噪聲魯棒性訓練目標,使學習的模型能夠對自監控數據中的標簽噪聲不敏感。在來自不同領域的三個大規模數據集上的廣泛實驗證明了TaxoExspan在分類系統擴展方面的有效性和高效性。

網址://arxiv.org/abs/2001.09522

  1. Structural Deep Clustering Network

作者:Deyu Bo, Xiao Wang, Chuan Shi, Meiqi Zhu, Emiao Lu, Peng Cui

摘要:聚類是數據分析的基本任務。近年來,深度聚類技術(deep clustering)得到了廣泛的關注,它的靈感主要來自于深度學習方法。當前的深度聚類方法通常借助深度學習強大的表示能力(如自編碼)來提高聚類結果,這表明學習一種有效的聚類表示是一個關鍵的要求。深度聚類方法的優勢在于從數據本身中提取有用的表示,而不是從數據的結構中提取,這在表示學習中受到的關注較少。基于圖卷積網絡(GCN)在對圖結構進行編碼方面取得的巨大成功,我們提出了一種結構化深度聚類網絡(SDCN),將結構信息集成到深度聚類中。具體來說,我們設計了一個傳遞算子,將自編碼器學習到的表示轉換到相應的GCN層,并設計了雙重自監督機制來統一這兩種不同的深層神經結構,指導整個模型的更新。通過這種方式,從低階到高階的多種數據結構自然地與自動編碼器學習的多種表示相結合。在此基礎上,從理論上分析了傳遞算子。通過使用傳遞操作符,GCN改進了作為高階圖正則化約束的特定于自編碼的表示形式,并且自動編碼器有助于緩解GCN中的過度平滑問題。通過綜合實驗,我們證明我們提出的模型可以持續地比最先進的技術表現得更好。

網址:

  1. MAGNN: Metapath Aggregated Graph Neural Network for Heterogeneous Graph Embedding

作者:Xinyu Fu, Jiani Zhang, Ziqiao Meng, Irwin King

摘要:大量真實世界的圖或網絡本質上是異構的,涉及節點類型和關系類型的多樣性。異構圖嵌入是將異構圖的豐富結構和語義信息嵌入到低維節點表示中。現有的模型通常定義多個metapaths在異構圖捕捉復合關系和指導鄰居選擇。但是,這些模型要么忽略節點內容特性,要么沿著元路徑丟棄中間節點,要么只考慮一個元路徑。為了解決這三個局限性,我們提出了一種新的集合圖神經網絡模型來提高最終性能。具體來說,MAGNN使用了三個主要組件,即,節點內容轉換封裝輸入節點屬性,元內聚合合并中間語義節點,元間聚合合并來自多個元的消息。在三個真實世界的異構圖數據集上進行了大量的節點分類、節點聚類和鏈路預測實驗,結果表明MAGNN的預測結果比最先進的基線更準確。

網址:

  1. Certified Robustness of Community Detection against Adversarial Structural Perturbation via Randomized Smoothing

作者:Jinyuan Jia, Binghui Wang, Xiaoyu Cao, Neil Zhenqiang Gong

摘要:社區發現(Community detection)在理解圖結構中起著關鍵作用。但是,最近的一些研究表明,社區發現很容易受到對抗性結構的干擾。即通過在圖中添加或刪除少量選擇的邊,攻擊者可以控制發現的社區。然而,目前還沒有關于社區發現對這種對抗性結構擾動的魯棒性的研究。為了減少這一差距,在這項工作中,我們開發了第一個經過認證的可以抵御對抗性結構擾動的社區發現的魯棒性保證。在任意給定的社區發現方法的基礎上,通過對圖結構隨機進行擾動,構建了一種新的平滑社區發現方法。在理論上,當攻擊者添加/刪除有限數量的邊時,平滑社區發現方法可以將給定的任意節點集合分到相同的社區(或不同的社區)中。此外, 我們還根據經驗在真實社區的多個現實圖上評估了我們的方法。

網址:

  1. Unsupervised Domain Adaptive Graph Convolutional Networks

作者:Man Wu, Shirui Pan, Chuan Zhou, Xiaojun Chang, Xingquan Zhu

摘要:圖卷積網絡(GCNS)在許多與圖相關的分析任務中取得了成功。然而,由于圖表示學習和圖結構上的域自適應方面的挑戰,大多數GCN只工作在單個域(圖)中,不能將知識從一個域(圖)傳遞到其他域(圖)中。本文提出了一種新的圖域自適應學習方法--無監督域自適應圖卷積網絡(UDAGCN)。為了實現有效的圖表示學習,我們首先提出了一個對偶圖卷積網絡組件,該組件聯合利用局部一致性和全局一致性來進行特征聚合。注意力機制還用于為不同圖中的每個節點產生統一表示。為了便于圖之間的知識傳遞,我們提出了一個域自適應學習模塊,將源分類器損失、域分類器損失和目標分類器損失這三個不同的損失函數作為一個整體進行優化,從而可以區分源域中的類別標簽、不同領域樣本和目標領域的類別標簽。我們還在節點分類任務的真實數據集上的實驗結果驗證該方法的性能,并與最新的圖神經網絡算法進行了比較。

網址:

  1. A Kernel of Truth: Determining Rumor Veracity on Twitter by Diffusion Pattern Alone

作者:Nir Rosenfeld, Aron Szanto, David C. Parkes

摘要:最近,在錯誤信息檢測領域已經使用文本中豐富的信號以及與社交媒體上的內容相關的用戶身份來進行檢測。但由于文本可以被策略性地操縱,賬戶也可以用不同的名字重新創建,以上這些方法本質上是脆弱的。在這項工作中,我們研究了另一種更加自然與健壯的模式:信息傳播的模式。僅根據未經證實的謠言在社交網絡中的傳播模式,就能辨別在線傳播的未經證實的謠言的真實性嗎?

使用圖核(graph kernels )從Twitter中提取復雜的拓撲信息,我們訓練了不考慮語言,用戶身份和時間的準確預測模型,這首次證明了這種“sanitized”的擴散模式具有很高的準確性。 我們的結果表明,通過適當的聚集,即使在傳播的早期階段,人群的集中共享模式也可能會顯示出辨別謠言真假的強有力的信號。

網址:

付費5元查看完整內容

最近,數據挖掘領域國際最高級別會議KDD 2019 于 2019 年 8 月 4 日- 8 日在美國阿拉斯加州安克雷奇市舉行。今年的 KDD 包括兩個track:Research Track和 Applied Data Science track。據了解,Research Track 共收到約 1200 篇投稿,其中約 110 篇 接收為oral 論文,60 篇 接收為poster 論文,接收率僅為 14%。專知小編發現關于圖神經網絡的相關論文在今年的KDD上非常多,所以今天小編專門整理最新12篇圖神經網絡(GNN)相關論文——聚類-GCN、條件隨機場-GCN、Degree-GNN、GCN-MF、GCN-Pooling、GRN、異構GNN、強化學習-GNN、對抗攻擊-GCN。

  1. Cluster-GCN: An Efficient Algorithm for Training Deep and Large Graph Convolutional Networks

作者:Wei-Lin Chiang; Xuanqing Liu; Si Si; Yang Li; Samy Bengio; Cho-Jui Hsieh;

摘要:圖卷積網絡(GCN)已成功地應用于許多基于圖的應用中; 然而,訓練一個大規模的GCN仍然是具有挑戰性的。現有的基于SGD的算法要么計算成本高,且隨著GCN層數的增加呈指數級增長,要么需要很大的空間來保存整個圖以及在內存中嵌入每個節點。本文利用圖的聚類結構,提出了一種新的適合于基于SGD的訓練的GCN算法Cluster-GCN。Cluster-GCN的工作原理如下: 在每一步中,它對與圖聚類算法標識的密集子圖相關聯的節點塊進行采樣,并限制在該子圖中進行鄰域搜索。這種簡單而有效的策略能夠顯著提高內存和計算效率,同時能夠達到與以前算法相當的測試精度。為了測試算法的可擴展性,我們創建了一個新的Amazon2M數據集,包含200萬個節點和6100萬條邊,比之前最大的公共可用數據集(Reddit)大5倍以上。對于在此數據集上訓練3層GCN, Cluster-GCN比之前最先進的VR-GCN(1523秒vs. 1961秒)更快,并且使用更少的內存(2.2GB vs. 11.2GB)。此外,對于該數據集的4層GCN的訓練,我們的算法可以在36分鐘左右完成,而現有的GCN訓練算法都因為內存不足而無法訓練。此外,Cluster-GCN允許我們在不需要太多時間和內存開銷的情況下訓練更深層的GCN,從而提高了預測精度——使用5層Cluster-GCN,我們在PPI數據集上實現了最先進的測試結果,F1 score為99.36,而之前最好的結果是98.71。

網址:

//www.kdd.org/kdd2019/accepted-papers/view/cluster-gcn-an-efficient-algorithm-for-training-deep-and-large-graph-convol

  1. Conditional Random Field Enhanced Graph Convolutional Neural Networks

作者:Hongchang Gao; Jian Pei; Heng Huang;

摘要:圖卷積神經網絡近年來受到越來越多的關注。與標準卷積神經網絡不同,圖卷積神經網絡對圖數據進行卷積運算。與一般數據相比,圖數據具有不同節點間的相似性信息。因此,在圖卷積神經網絡的隱層中保存這種相似性信息是非常重要的。然而,現有的工作沒有做到這一點。另一方面,為了保持相似關系,對隱藏層的增強是一個挑戰。為了解決這一問題,我們提出了一種新的CRF層用于圖卷積神經網絡,以使得相似節點具有相似的隱藏特征。這樣,可以顯式地保存相似性信息。此外,我們提出的CRF層易于計算和優化。因此,它可以很容易地插入到現有的圖卷積神經網絡中,提高其性能。最后,大量的實驗結果驗證了我們提出的CRF層的有效性。

網址:

  1. DEMO-Net: Degree-specific Graph Neural Networks for Node and Graph Classification

作者:Jun Wu; Jingrui He; Jiejun Xu;

摘要:圖數據廣泛存在于許多具有高影響力的應用中。受網格結構數據深度學習成功的啟發,研究者提出了一種學習強大的節點級或圖級表示的圖神經網絡模型。然而,現有的圖神經網絡大多存在以下局限性:(1)對圖卷積的seed-oriented、degree-aware、order-free等特性的分析比較有限; (2) 在區分結構感知節點鄰域時,沒有將節點的degree-specific圖結構顯式表示為圖卷積; (3)圖級pooling機制的理論解釋尚不明確。為了解決這些問題,我們提出了一種基于Weisfeiler- Lehman圖同構測試的通用degree-specific圖神經網絡DEMO-Net。為了顯式地捕獲與節點屬性集成的圖的拓撲結構,我們認為圖卷積應該具有三個屬性:seed-oriented, degree-aware 和order-free。為此,我們提出了多任務圖卷積,其中每個任務表示具有specific degree value的節點的節點表示學習,從而保持了degree-specific的圖結構。特別地,我們設計了兩種多任務學習方法:degree-specific權重法和圖卷積的哈希函數法。此外,我們還提出了一種新的圖級pooling/readout方案,用于學習圖形表示,可證明位于degree-specific的Hilbert kernel空間中。在多個節點和圖分類基準數據集上的實驗結果表明,我們提出的DEMO-Net相對于最先進的圖神經網絡模型的有效性和高效性。

網址:

  1. GCN-MF: Disease-Gene Association Identification By Graph Convolutional Networks and Matrix Factorization

作者:Peng Han; Peng Yang; Peilin Zhao; Shuo Shang; Yong Liu; Jiayu Zhou; Xin Gao; Panos Kalnis;

摘要:發現疾病基因關聯是一項基礎性和關鍵性的生物醫學任務,它有助于生物學家和醫生發現癥候的致病機制。基于網絡的半監督學習(NSSL)是這些研究中常用的一種方法,它利用各種臨床生物標志物來測量基因和疾病表型之間的相似性,來解決這個類平衡的大規模數據問題。然而,大多數現有的NSSL方法都是基于線性模型的,存在兩個主要限制:1)它們隱式地考慮每個候選對象的局部結構表示; 2)他們無法捕捉疾病和基因之間的非線性聯系。本文將圖卷積網絡(GCN)和矩陣因子分解相結合,提出了一種新的疾病基因關聯任務框架GCN-MF。在GCN的幫助下,我們可以捕獲非線性相互作用,并利用測量到的相似性。此外,我們定義了一個邊際控制損失函數,以減少稀疏性的影響。實驗結果表明,所提出的深度學習算法在大多數指標上都優于其他最先進的方法。

網址:

  1. Estimating Node Importance in Knowledge Graphs Using Graph Neural Networks

作者:Namyong Park; Andrey Kan; Xin Luna Dong; Tong Zhao; Christos Faloutsos;

摘要:如何估計知識圖譜(KG)中節點的重要性? KG是一個多關系圖,它被證明對于許多任務(包括問題回答和語義搜索)都很有價值。在本文中,我們提出了GENI,一種解決KG中節點重要性估計問題的方法,該方法支持商品推薦和資源分配等多種下游應用。雖然已經有了一些方法來解決一般圖的這個問題,但是它們沒有充分利用KG中可用的信息,或者缺乏建模實體與其重要性之間復雜關系所需的靈活性。為了解決這些限制,我們探索了有監督的機器學習算法。特別是,基于圖神經網絡(GNN)的最新進展,我們開發了GENI,這是一種基于GNN的方法,旨在應對預測KG中節點重要性所涉及的獨特挑戰。我們的方法通過predicate-aware注意力機制和靈活的中心性調整來執行重要性分數的聚合,而不是聚合節點嵌入。在我們對GENI和現有方法的評估中,GENI在預測具有不同特征的真實KG中節點重要性方面比現有方法高出5-17%。

網址:

  1. Graph Convolutional Networks with EigenPooling

作者:Yao Ma; Suhang Wang; Charu Aggarwal; Jiliang Tang;

摘要:圖神經網絡將深度神經網絡模型推廣到圖結構數據中,近年來受到越來越多的關注。它們通常通過轉換、傳播和聚合節點特征來學習節點表示,并被證明可以提高許多與圖相關的任務的性能,如節點分類和鏈接預測。將圖神經網絡應用于圖分類任務,需要從節點表示生成圖表示的方法。一種常見的方法是全局組合節點表示。然而,豐富的結構信息被忽略了。因此,在圖表示學習過程中,需要一個層次的pooling過程來保持圖的結構。最近有一些關于層次學習圖表示的工作類似于傳統卷積神經網絡(CNN)中的pooling步驟。然而,在匯聚過程中,局部結構信息在很大程度上仍然被忽略。本文介紹了一種基于圖的傅里葉變換的pooling操作EigenPooling,它可以利用pooling過程中的節點特征和局部結構。然后基于pooling算子設計pooling層,并與傳統的GCN卷積層進一步結合,形成一個用于圖分類的圖神經網絡框架EigenGCN。從局部和全局的角度對EigenGCN進行了理論分析。圖分類任務在6個常用benchmark上的實驗結果表明了該框架的有效性。

網址:

  1. Graph Recurrent Networks with Attributed Random Walks

作者:Xiao Huang; Qingquan Song; Yuening Li; Xia Hu;

摘要:隨機游走被廣泛應用于從網絡嵌入到標簽傳播的各種網絡分析任務中。它可以捕獲并將幾何結構轉換為結構化序列,同時解決了稀疏性和維數的災難性問題。雖然對純網絡上的隨機游走進行了深入的研究,但在實際系統中,節點往往不是純頂點,而是具有不同的特征,并由與之相關的豐富數據集來描述。這些節點屬性包含豐富的信息,這些信息通常是網絡的補充,并為基于隨機游走的分析帶來了機會。然而,目前還不清楚如何為attributed網絡開發隨機游走來實現有效的聯合信息提取。節點屬性使得節點之間的交互更加復雜,拓撲結構也更加異構。

為了彌補這一不足,我們研究了在attributed網絡上進行聯合隨機游動,并利用它們來提高深度節點表示學習。提出的框架GraphRNA由兩個主要組件組成,即,一種協作游走機制—AttriWalk,以及一種為隨機游走量身定制的深度嵌入體系結構,稱為圖遞歸網絡(graph recurrent networks ,GRN)。AttriWalk將節點屬性看作是一個二分網絡,并利用它來促進節點間的離散化,減少節點間向高中心匯聚的趨勢。AttriWalk使我們能夠將突出的深度網絡嵌入模型-圖卷積網絡推向一個更有效的架構——GRN。GRN賦予節點表示以與原始attributed網絡中的節點交互相同的方式進行交互。在真實數據集上的實驗結果表明,與目前最先進的嵌入算法相比,GraphRNA算法很有效。

網址:

  1. HetGNN: Heterogeneous Graph Neural Network

作者:Chuxu Zhang; Dongjin Song; Chao Huang; Ananthram Swami; Nitesh V. Chawla;

摘要:異構圖表示學習的目的是為每個節點尋求一個有意義的向量表示,以便于后續應用,如鏈接預測、個性化推薦、節點分類等。然而,該任務具有挑戰性,不僅因為需要合并異構由多種類型的節點和邊組成的結構(圖)信息,但也需要考慮與每個節點相關聯的異構屬性或內容(例如,文本或圖像)。盡管在同構(或異構)圖嵌入、屬性圖嵌入以及圖神經網絡等方面都做了大量的工作,但很少有圖神經網絡能夠有效地聯合考慮圖的異構結構(圖)信息以及各節點的異構內容信息。為此,我們提出了一種異構圖神經網絡模型HetGNN。具體來說,我們首先引入一個具有重啟策略的隨機游走,為每個節點抽取一個固定大小的強相關異構鄰居,并根據節點類型對它們進行分組。接下來,我們設計了一個包含兩個模塊的神經網絡結構來聚合這些采樣的相鄰節點的特征信息。第一個模塊對異構內容的“深度”特性交互進行編碼,并為每個節點生成內容嵌入。第二個模塊聚合不同鄰近組(類型)的內容(屬性)嵌入,并通過考慮不同組的影響來進一步組合它們,以獲得最終的節點嵌入。最后,我們利用圖context loss和一個mini-batch梯度下降過程以端到端方式訓練模型。在多個數據集上的大量實驗表明,HetGNN在各種圖挖掘任務(比如鏈路預測、推薦、節點分類聚類、歸納節點分類聚類)中都能超越最先進的baseline。

網址:

  1. Learning Dynamic Context Graphs for Predicting Social Events

作者:Songgaojun Deng; Huzefa Rangwala; Yue Ning;

摘要:以建模上下文信息為目標的事件預測是自動分析生成和資源分配等應用程序的一項重要任務。為感興趣的事件捕獲上下文信息可以幫助分析人員理解與該事件相關的因素。然而,由于以下幾個因素,在事件預測中獲取上下文信息是具有挑戰性的: (i)上下文結構和形成的不確定性,(ii)高維特征,以及(iii)特征隨時間的適應性。最近,圖表示學習在交通預測、社會影響預測和可視化問題回答系統等應用中取得了成功。在本文中,我們研究了社會事件建模中的圖表示,以識別事件上下文的動態屬性作為social indicators。

受圖神經網絡的啟發,我們提出了一種新的圖卷積網絡來預測未來的事件(例如,國內動亂運動)。我們從歷史/以前的事件文檔中提取和學習圖表示。該模型利用隱藏的單詞圖特征預測未來事件的發生,并將動態圖序列識別為事件上下文。在多個真實數據集上的實驗結果表明,該方法與各種先進的社會事件預測方法相比具有較強的競爭力。

網址:

  1. Automating Feature Subspace Exploration via Multi-Agent Reinforcement Learning

作者:Kunpeng Liu; Yanjie Fu; Pengfei Wang; Le Wu; Rui Bo; Xiaolin Li;

摘要:特征選擇是機器學習的預處理步驟,它試圖為后續的預測任務選擇最相關的特征。有效的特征選擇可以降低維數,提高預測精度,提高結果的可理解性。從子集空間中尋找最優特征子集是一個非常具有挑戰性的問題,因為子集空間可能非常大。在已有研究的基礎上,增強學習為搜索策略的全局化提供了新的視角。針對特征選擇問題,提出了一種多智能體增強學習框架。具體來說,我們首先用一個增強學習框架來重新制定特征選擇,將每個特征視為一個智能體。然后,通過三種方法得到環境狀態,即為了使算法更好地理解學習過程,本文采用了統計描述、自動編碼器和圖卷積網絡(GCN)。我們展示了如何以一種基于圖的方式學習狀態表示,這種方法不僅可以處理邊的變化,還可以處理節點逐步變化的情況。此外,我們還研究了如何通過更合理的獎勵方案來改善不同特征之間的協調。該方法具有全局搜索特征子集的能力,并且由于增強學習的性質,可以很容易地適應實時情況(實時特征選擇)。此外,我們還提出了一種有效的加速多智能體強化學習收斂的策略。最后,大量的實驗結果表明,該方法比傳統方法有顯著的改進。

網址:

  1. Robust Graph Convolutional Networks Against Adversarial Attacks

作者:Dingyuan Zhu; Ziwei Zhang; Peng Cui; Wenwu Zhu;

摘要:圖卷積網絡(GCNs)是一種新興的基于圖的神經網絡模型,在節點分類任務中取得了最先進的性能。然而,近年來的研究表明,GCN容易受到惡意攻擊,即在圖結構和節點屬性上的小擾動,這給GCN網絡在實際應用中帶來了很大的挑戰。如何提高GCN的魯棒性仍然是一個關鍵的開放性問題。

為了解決這一問題,我們提出了Robust GCN (RGCN),這是一種新的模型,它“加強”了GCN的對抗攻擊能力。具體來說,我們的方法不是將節點表示為向量,而是采用高斯分布作為每個卷積層中節點的隱藏表示。這樣,當圖受到攻擊時,我們的模型可以自動吸收高斯分布方差變化的不利影響。此外,為了彌補對抗性攻擊在GCN中的傳播,我們提出了一種基于方差的注意力機制,即在執行卷積時根據節點鄰域的方差分配不同的權值。大量的實驗結果表明,我們提出的方法可以有效地提高GCN的魯棒性。在三個基準圖上,與最先進的GCN方法相比,我們的RGCN在各種對抗攻擊策略下的節點分類精度有了顯著提高。

網址:

  1. Stability and Generalization of Graph Convolutional Neural Networks

作者:Saurabh Verma; Zhi-Li Zhang;

摘要:圖卷積神經網絡(GCNNs)是受卷積神經網絡在一維和二維數據上的啟發而發展起來的一種用于各種圖數據學習任務的神經網絡,在實際數據集上表現出了良好的性能。盡管GCNN模型取得了一定的成功,但是對于GCNN模型的泛化性質等理論探索卻十分缺乏。本文通過分析單層GCNN模型的穩定性,推導出其在半監督圖學習環境下的泛化保證,為深入理解GCNN模型邁出了第一步。特別地,我們證明了GCNN模型的算法穩定性依賴于其圖卷積濾波器的最大絕對特征值。此外,為了確保提供強泛化保證所需的均勻穩定性,最大絕對特征值必須與圖的大小無關。我們的結果為設計新的和改進的具有算法穩定性的圖卷積濾波器提供了新的見解。我們對各種真實世界圖數據集的泛華差距和穩定性進行了評價,實證結果確實支持了我們的理論發現。據我們所知,我們是第一個在半監督設置下研究圖學習的穩定性邊界,并推導出GCNN模型的泛化邊界。

網址:

下載鏈接: 提取碼:zbkg

付費5元查看完整內容
北京阿比特科技有限公司