模型可解釋問題一向都是一個玄學問題,主要核心問題在于怎么評估一個好的模型解釋器。在以往的工作中,圖解釋性模型往往是取一個邊集合,并且將邊集合得到的子圖預測結果與真實標簽做對比然后算一個acc,然而,本文作者則認為如果將解釋結果與真實情況對比的話實際上并不是特別靠譜。因此,本文主要提出了幾種更貼切于解釋性方法的評估數據,包括感染檢測,社區檢測,負樣本評估。
理解用戶的偏好在推薦場景尤為重要。然而在真實的工業場景(如支付寶APP)中,往往會針對一些特定的人群,如低活躍用戶、新用戶等,專門推薦特殊的券、權益、服務等,希望以此來提高其在特點產品中的活躍程度。但是直接使用這種低活躍場景的數據做建模是困難的,原因是這種場景往往標簽少,且低活躍用戶的特征稀少。
為了解決這種數據稀疏問題,一個常用的方法是遷移學習或多任務學習。即尋找一個數據充分的源領域場景,把該領域的知識遷移到目標領域,以解決目標領域缺少數據的問題。近年來,基于深度學習的跨領域遷移學習方法得到了廣泛使用,比如基于實例的方法、映射的方法、基于網絡的方法、基于對抗的方法等等。自然地,為了幫助某個目標領域的人群學的更好,通常可以加入擁有更大量級的用戶在支付寶全域行為數據作為源領域,輔助目標領域的學習,通過上述遷移或多目標任務的方式。
然而,已有方法只關注如何將源領域的知識遷移應用到目標領域,而忽略了在遷移之前,源、目標領域是否具備一個合理的表征空間,使得任務可以遷移。以低活躍用戶/新用戶為例,這些用戶自身特征幾乎沒有。簡單的遷移無法將源豐富的信息對齊到他們身上。
為此,螞蟻集團的研究人員提出一種結合圖神經網絡來做表征的遷移方法,該方法可以為低活躍用戶/新用戶學到更好的表征并應用于推薦中。思路很簡單,分為兩步:(1)對于無論是源領域用戶還是目標領域用戶,分析關系數據,探索什么關系對于用戶自身的行為具有強相關性。找到強相關的關系數據,就可以通過去除自身的關系數據來表征自身。這樣,模型就可以將無論是源領域還是目標領域的用戶表征放在同一個表征空間下。(2)通過經典遷移方法將源領域的信息遷移到目標領域,從而幫助目標領域學的更好。
基于此,螞蟻集團的研究人員提出了一種結合GNN表征學習能力的跨領域聯合建模方案CD-GNN(Cross Domain-Graph Neural Networks),解決源領域和目標領域通過網絡關聯的情況下進行跨領域建模的問題。接下來,本文將介紹該方法的實現細節,及其在低活躍用戶上的應用。
近年來,圖已經成為表示各種真實世界數據集的抽象。作為一種圖結構數據進行機器學習的新興工具,圖神經網絡(GNN)通過遞歸聚合相鄰節點的內容(即特征或嵌入)來學習強大的圖表示,從而保留內容和結構信息。它們已被證明可以提高各種圖應用程序的性能,如節點和圖分類、推薦系統和圖生成。一般來說,GNN模型是使用(半)監督信息端到端的方式進行訓練的,不同的下游任務需要大量不同的標記數據。然而,在大多數現實場景中,大量的標記數據通常代價高昂。為了充分利用未標記的圖結構數據,最近部分工作從最近一些自然語言處理和計算機視覺中的預訓練技術中獲得了靈感,并提出在圖上進行預訓練的GNN模型。雖然這些GNN預訓練方法取得了很好的性能,但它們都是針對同構圖進行設計,其中每個節點或邊都屬于同一類型。相比之下,現有策略忽略了異構圖,其中多種類型的節點通過不同類型的邊相互作用。
現實生活中的網絡可以構成異構圖,這些圖體現了豐富的語義并組成由多種類型的節點和邊產生的獨特結構。如圖1(a)所示,為書目數據構建了一個簡單異構圖,該圖由作者、論文、會議和術語類型的節點以及作者論文、論文會議和論文術語類型的邊組成。不同類型的節點或邊通常表現出不同的網絡屬性,如度和聚類系數。例如,會議節點通常比作者節點具有更高的度。此外,這種異構性還產生了更復雜的語義上下文,涉及到多個節點之間的多方關系,例如,描述了“同一作者關于相似主題的兩篇論文”的語義語境。除了簡單的示例之外,異構圖在很多領域中也普遍存在,例如在用戶、產品、品牌和商店以各種方式交互的電子商務中,以及在疾病、蛋白質和藥物相互關聯的生物學中。考慮到它們的普遍性,為異構圖設計有效的GNN預訓練策略變得很重要。
在本文中,我們提出了一個對比預訓練的方案,它不僅考慮單個節點之間的差異,還保留了多個節點之間的高階語義。更具體的說,本文設計了一個預訓練任務來區分不同類型的兩個節點之間的關系類型(比如,作者-論文和論文-會議關系)來為下游任務編碼統一的基礎。受對比學習[42]的啟發,為了增強樣本的代表性,本文從兩個方面構造負關系級樣本:(1)來自不一致關系的負樣本,其中兩個節點與正樣本是不同的關系;(2)來自不相關節點的負樣本,其中兩個節點在圖中根本沒有鏈接。同時,本文提出了一個異構圖上的子圖級預訓練任務,使用元圖而不是元路徑來生成子圖實例進行對比學習,因此能夠對不同上下游任務相關的高階語義進行信息編碼。
現有的GNN解釋方法側重于解釋圖的節點或邊的重要性,但忽略了圖子結構。事實上子結構更直觀且容易被人理解。論文提出了一種通過識別重要的子圖來解釋GNNs 的方法,即 Subgraph X。給定一個經過訓練的GNN模型和一個輸入圖,Subgraph X 通過蒙特卡洛樹搜索有效地探索不同的子圖來解釋其預測。為了使樹搜索更加有效,論文提出使用 Shapley 值作為子圖重要性的衡量標準,這也可以捕捉到不同子圖之間的相互作用。為了加快計算速度,論文提出了高效的近似方案來計算圖數據的 Shapley 值。該論文是通過識別子圖來解釋 GNN 的第一次嘗試,實驗結果表明,Subgraph X 明顯改善了解釋結果,同時將計算量也相對合理。
先說說為啥要關注圖神經網絡的可解釋性?
現有的 GNN 模型大多被視為黑盒子,其預測結果缺乏可解釋性。如果不理解和推理預測背后的關系,這些模型就不能被人們理解信任,阻礙了它們在關鍵領域的應用,因此研究深度圖模型的可解釋性十分必要。
本文的提出的解釋方法的獨特性在于?
很多文獻在研究圖像和文本上的深度模型的解釋技術方面做了工作,這些方法可以通過不同的策略解釋網絡行為和特定輸入的預測結果。然而,GNN 的可解釋性仍未得到充分的探索。與圖像和文本不同,圖數據不是網格狀的數據,它包含重要的結構信息。因此,圖像和文本領域的方法不能直接應用。目前存在的GNN 解釋方法,如 GNNExplainer、PGExplainer 和 PGM-Explainer,但它都是關注節點、邊或節點特征層面的可解釋性,沒有進行子圖層面的可解釋性研究。本文認為子圖層面的解釋更加直觀和有用,因為子圖是復雜圖的簡單構件,與圖的功能高度相關。
近年來, 隨著海量數據的涌現, 可以表示對象之間復雜關系的圖結構數據越來越受到重視并給已有的算法帶來了極大的挑戰. 圖神經網絡作為可以揭示深層拓撲信息的模型, 已開始廣泛應用于諸多領域,如通信、生命科學和經濟金融等. 本文對近幾年來提出的圖神經網絡模型和應用進行綜述, 主要分為以下幾類:基于空間方法的圖神經網絡模型、基于譜方法的圖神經網絡模型和基于生成方法的圖神經網絡模型等,并提出可供未來進一步研究的問題.
//engine.scichina.com/publisher/scp/journal/SSM/50/3/10.1360/N012019-00133?slug=fulltext
圖是對對象及其相互關系的一種簡潔抽象的直觀數學表達. 具有相互關系的數據—圖結構數據在眾多領域普遍存在, 并得到廣泛應用. 隨著大量數據的涌現, 傳統的圖算法在解決一些深層次的重要問題, 如節點分類和鏈路預測等方面有很大的局限性. 圖神經網絡模型考慮了輸入數據的規模、異質性和深層拓撲信息等, 在挖掘深層次有效拓撲信息、 提取數據的關鍵復雜特征和 實現對海量數據的快速處理等方面, 例如, 預測化學分子的特性 [1]、文本的關系提取 [2,3]、圖形圖像的結構推理 [4,5]、社交網絡的鏈路預測和節點聚類 [6]、缺失信息的網絡補全 [7]和藥物的相互作用預測 [8], 顯示了令人信服的可靠性能.
圖神經網絡的概念最早于 2005 年由 Gori 等 [9]提出, 他借鑒神經網絡領域的研究成果, 設計了一種用于處理圖結構數據的模型. 2009 年, Scarselli 等 [10]對此模型進行了詳細闡述. 此后, 陸續有關于圖神經網絡的新模型及應用研究被提出. 近年來, 隨著對圖結構數據研究興趣的不斷增加, 圖神經網絡研究論文數量呈現出快速上漲的趨勢, 圖神經網絡的研究方向和應用領域都得到了很大的拓展.
目前已有一些文獻對圖神經網絡進行了綜述. 文獻 [11]對圖結構數據和流形數據領域的深度學習方法進行了綜述, 側重于將所述各種方法置于一個稱為幾何深度學習的統一框架之內; 文獻[12]將圖神經網絡方法分為三類: 半監督學習、無監督學習和最新進展, 并根據發展歷史對各種方法進行介紹、分析和對比; 文獻[13]介紹了圖神經網絡原始模型、變體和一般框架, 并將圖神經網絡的應用劃分為結構場景、非結構場景和其他場景; 文獻[14]提出了一種新的圖神經網絡分類方法, 重點介紹了圖卷積網絡, 并總結了圖神經網絡方法在不同學習任務中的開源代碼和基準.
本文將對圖神經網絡模型的理論及應用進行綜述, 并討論未來的方向和挑戰性問題. 與其他綜述文獻的不同之處在于, 我們給出新的分類標準, 并且介紹圖神經網絡豐富的應用成果. 本文具體結構如下: 首先介紹三類主要的圖神經網絡模型, 分別是基于空間方法的圖神經網絡、基于譜方法的圖神經網絡和基于生成方法的圖神經網絡等; 然后介紹模型在節點分類、鏈路預測和圖生成等方面的應用; 最后提出未來的研究方向.
【導讀】作為世界數據挖掘領域的最高級別的學術會議,ACM SIGKDD(國際數據挖掘與知識發現大會,簡稱 KDD)每年都會吸引全球領域眾多專業人士參與。今年的 KDD大會計劃將于 2020 年 8 月 23 日 ~27 日在美國美國加利福尼亞州圣地亞哥舉行。上周,KDD 2020官方發布接收論文,共有1279篇論文提交到Research Track,共216篇被接收,接收率16.8%。近期一些Paper放出來了,為此,專知小編提前為大家整理了五篇KDD 2020 圖神經網絡(GNN)相關論文,供大家參考。——圖結構學習、多元時間序列預測、負采樣、多任務多視角圖表示學習、多興趣推薦
CVPR2020SGNN、CVPR2020GNN_Part2、CVPR2020GNN_Part1、WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN、EMNLP2019GNN、ICCV2019GNN_Part2、ICCV2019GNN_Part1、NIPS2019GNN、IJCAI2019GNN_Part1、IJCAI2019GNN_Part2、KDD2019GNN、ACL2019GNN、CVPR2019GNN、
1. Graph Structure Learning for Robust Graph Neural Networks
作者:Wei Jin, Yao Ma, Xiaorui Liu, Xianfeng Tang, Suhang Wang, Jiliang Tang
摘要:圖神經網絡(GNNs)是圖表示學習的有力工具。但是,最近的研究表明,GNN容易受到精心設計的擾動(稱為對抗攻擊)的攻擊。對抗性攻擊很容易欺騙GNN來預測下游任務。對于對抗攻擊的脆弱性使人們越來越關注在安全關鍵型應用中應用GNN。因此,開發穩健的算法來防御對抗攻擊具有重要意義。防御對抗攻擊的一個自然想法是清理受干擾的圖。很明顯,真實世界的圖共享一些內在屬性。例如,許多現實世界的圖都是低秩和稀疏的,兩個相鄰節點的特征往往是相似的。事實上,我們發現對抗攻擊很可能會違背這些圖的性質。因此,在本文中,我們利用這些特性來防御針對圖的對抗攻擊。特別是,我們提出了一個通用框架Pro-GNN,該框架可以從受這些特性指導的擾動圖中聯合學習結構圖和魯棒圖神經網絡模型。在真實圖上的大量實驗表明,即使在圖受到嚴重干擾的情況下,我們所提出的框架也比現有的防御方法獲得了顯著更好的性能。我們將Pro-GNN的實現發布到我們的DeepRobust存儲庫,以進行對抗性攻擊和防御。
網址: //arxiv.org/pdf/2005.10203.pdf
代碼鏈接:
2. Connecting the Dots: Multivariate Time Series Forecasting with Graph Neural Networks
作者:Zonghan Wu, Shirui Pan, Guodong Long, Jing Jiang, Xiaojun Chang, Chengqi Zhang
摘要:多變量時間序列的建模長期以來一直吸引著來自經濟、金融和交通等不同領域的研究人員的關注。多變量時間序列預測背后的一個基本假設是其變量之間相互依賴,但現有方法未能充分利用變量對之間的潛在空間相關性。同時,近些年來,圖神經網絡(GNNs)在處理關系依賴方面表現出了很高的能力。GNN需要定義良好的圖結構來進行信息傳播,這意味著它們不能直接應用于事先不知道依賴關系的多變量時間序列。本文提出了一種專門針對多變量時間序列數據設計的通用圖神經網絡框架。該方法通過圖學習模塊自動提取變量間的單向關系,可以方便地集成變量屬性等外部知識。在此基礎上,提出了一種新的max-hop傳播層和一個dilated inception層來捕捉時間序列中的時間和空間依賴關系。圖學習、圖卷積和時間卷積模塊在端到端框架中聯合學習。實驗結果表明,我們提出的模型在4個基準數據集中的3個數據上優于最新的基線方法,并且在提供額外結構信息的兩個交通數據集上,與其他方法具有同等的性能。
網址:
3. Understanding Negative Sampling in Graph Representation Learning
作者:Zhen Yang, Ming Ding, Chang Zhou, Hongxia Yang, Jingren Zhou, Jie Tang
摘要:在最近的幾年中,對圖表示學習進行了廣泛的研究。盡管它有可能為各種網絡生成連續的嵌入,但是在大型節點集中得到有效高質量的表示仍然具有挑戰性。采樣是實現該性能目標的關鍵點。現有技術通常側重于正向節點對的采樣,而對負向采樣的策略探索不夠。為了彌補這一差距,我們從目標和風險兩個角度系統地分析了負采樣的作用,從理論上論證了負采樣在確定優化目標和結果方差方面與正采樣同等重要。據我們所知,我們是第一個推導該理論并量化負采樣分布應與其正采樣分布成正相關但亞線性相關的方法。在該理論的指導下,我們提出了MCNS,用自對比度近似法近似正分布,并通過Metropolis-Hastings加速負采樣。我們在5個數據集上評估了我們的方法,這些數據集涵蓋了19個實驗設置,涵蓋了廣泛的下游圖學習任務,包括鏈接預測,節點分類和個性化推薦。這些相對全面的實驗結果證明了其穩健性和優越性。
網址:
4. M2GRL: A Multi-task Multi-view Graph Representation Learning Framework for Web-scale Recommender Systems
作者:Menghan Wang, Yujie Lin, Guli Lin, Keping Yang, Xiao-ming Wu
摘要:將圖表示學習與多視圖數據(邊信息)相結合進行推薦是工業上的一種趨勢。現有的大多數方法可以歸類為多視圖表示融合,它們首先構建一個圖,然后將多視圖數據集成到圖中每個節點的單個緊湊表示中。這些方法在工程和算法方面都引起了人們的關注:1)多視圖數據在工業中是豐富而且有用的,并且可能超過單個矢量的容量;2)由于多視圖數據往往來自不同的分布,可能會引入歸納偏置(inductive bias)。在本文中,我們使用一種多視圖表示對齊方法來解決這個問題。特別地,我們提出了一個多任務多視角圖表示學習框架(M2GRL)來學習web級推薦系統中的多視角圖節點表示。M2GRL為每個單視圖數據構造一個圖,從多個圖中學習多個單獨的表示,并執行對齊以建立模型的交叉視圖關系。M2GRL選擇了一種多任務學習范式來聯合學習視圖內表示和交叉視圖關系。此外,M2GRL在訓練過程中利用同方差不確定性自適應地調整任務的損失權重。我們在淘寶部署了M2GRL,并對570億個實例進行了訓練。根據離線指標和在線A/B測試,M2GRL的性能明顯優于其他最先進的算法。對淘寶多樣性推薦的進一步研究表明,利用M2GRL產生的多種表征是有效的,對于不同側重點的各種工業推薦任務來說,M2GRL是一個很有前途的方向。
網址:
5. Controllable Multi-Interest Framework for Recommendation
作者:Yukuo Cen, Jianwei Zhang, Xu Zou, Chang Zhou, Hongxia Yang, Jie Tang
摘要:近年來,由于深度學習的快速發展,神經網絡在電子商務推薦系統中得到了廣泛的應用。我們將推薦系統形式化為一個序列推薦問題,目的是預測可能與用戶交互的下一個項目。最近的研究通常從用戶的行為序列中給出一個整體的嵌入。然而,統一的用戶嵌入不能反映用戶在一段時間內的多個興趣。本文提出了一種新穎的可控多興趣序列推薦框架,稱為ComiRec。我們的多興趣模塊從用戶行為序列中捕獲多個興趣,可用于從大規模項目集中檢索候選項目。然后將這些項目送入聚合模塊以獲得總體推薦。聚合模塊利用一個可控因素來平衡推薦的準確性和多樣性。我們在兩個真實的數據集Amazon和Taobao進行序列推薦實驗。實驗結果表明,我們的框架相對于最新模型取得了重大改進。我們的框架也已成功部署在離線阿里巴巴分布式云平臺上。
網址:
代碼鏈接: