圖神經網絡(GNNs)已成為復雜網絡中節點分類任務的強大工具。然而,它們的決策過程對用戶來說仍是一個黑盒,這使得理解它們預測背后的推理變得具有挑戰性。反事實解釋(CFE)在增強機器學習模型的可解釋性方面顯示出了前景。以前計算GNNs的CFE的方法通常是基于學習的方法,需要訓練額外的圖。在這篇論文中,我們提出了一種基于半值的非學習方法來生成節點分類任務的CFE,消除了任何額外訓練的需求。我們的結果揭示了計算班扎夫值(Banzhaf values)在識別反事實解釋方面需要的樣本復雜度比計算沙普利值(Shapley values)等其他流行方法低。我們的實證證據表明,與沙普利值相比,計算班扎夫值可以實現高達四倍的速度提升。我們還設計了一種計算班扎夫值的閾值方法,并展示了其在嘈雜環境中的魯棒性的理論和實證結果,使其優于沙普利值。此外,閾值化的班扎夫值被證明在不犧牲解釋的質量(即,忠實度)的情況下,提高了三個流行圖數據集的效率。
圖神經網絡(Graph Neural Networks,GNNs)已經廣泛應用于許多城市應用中,將城市形式化為一個城市圖,其中節點是城市對象,如區域或感興趣點。最近,一些增強型GNN架構已經被開發出來,用于處理連接節點不相似的異質圖。然而,城市圖通常可以觀察到具有獨特的空間異質性特性;也就是說,不同空間距離的鄰居的不相似性可以呈現出很大的多樣性。盡管這種特性經常存在,但尚未被探索。為此,在本文中,我們提出了一種度量指標,稱為空間多樣性評分(Spatial Diversity Score),以定量衡量空間異質性,并展示它如何影響GNNs的性能。事實上,我們的實驗調查明確表明,現有的異質性GNNs在處理具有高空間多樣性評分的城市圖時仍然存在不足。這反過來可能降低它們在城市應用中的有效性。沿著這條線,我們提出了一種空間異質性感知圖神經網絡(Spatial Heterophily Aware Graph Neural Network,SHGNN),用于處理城市圖的異質性空間多樣性。基于一個關鍵觀察結果,即城市圖上的空間鄰居越接近,它們與中心節點之間的差異模式越相似,我們首先設計了一個旋轉縮放的空間聚合模塊,其核心思想是將空間上接近的鄰居適當地分組,并分別處理每個組內較少的多樣性。然后,設計了一個異質性敏感的空間交互模塊,用于自適應地捕捉不同空間組中的共性和多樣性差異。對三個真實世界的城市數據集進行的大量實驗表明,我們的SHGNN相對于其競爭對手具有顯著優勢。
圖神經網絡(GNNs)在許多圖學習任務中表現出令人印象深刻的性能。然而,當輸入的圖數據信息弱,即結構不完整、特征不完整和標簽不足時,GNNs的性能可能會下降。大多數先前的研究試圖從具有特定類型弱信息的圖數據中學習,但在處理各種數據缺陷并相互影響的場景時,這些研究效果不佳。為了填補這個空白,我們在這篇論文中,試圖針對弱信息圖學習(GLWI)問題,開發一種有效且原則性的方法。基于我們的實證分析,我們得出了解決GLWI問題的兩個設計重點,即使GNNs能夠進行長距離傳播,并允許信息傳播到那些與最大連接組件隔離的漂泊節點。據此,我們提出了D2PT,一種雙通道GNN框架,它不僅在具有不完整結構的輸入圖上執行長距離信息傳播,而且還在編碼全局語義相似性的全局圖上執行信息傳播。我們進一步開發了一個原型對比對齊算法,它將從兩個通道中學到的類級原型進行對齊,以便兩種不同的信息傳播過程可以相互受益,最終學習的模型可以很好地處理GLWI問題。在八個真實世界的基準數據集上的大量實驗表明,我們提出的方法在各種GLWI場景中都表現出了有效性和效率。
結構化數據在網絡應用中很好地存在,如社交媒體中的社交網絡、學術網站中的引文網絡、在線論壇中的線程數據。由于拓撲結構的復雜性,這些數據中的豐富信息難以處理和利用。圖神經網絡(GNN)在結構化數據的學習表示方面顯示出極大的優勢。然而,深度學習模型的不透明性使得解釋GNN的預測變得非常重要。同時,GNN解釋的評價也是一個巨大的挑戰,因為在很多情況下,基準真相解釋是不可用的。在本文中,我們從因果推理理論中借鑒反事實和事實推理(CF^2)的觀點,來解決可解釋GNN中的學習和評價問題。為了生成解釋,我們提出了一個模型無關的框架,通過建立一個優化問題的基礎上,這兩個隨意的觀點。這將CF^2與之前只考慮其中一個的可解釋GNN區分開來。這項工作的另一個貢獻是對GNN解釋的評價。為了在不要求基本事實的情況下定量地評估生成的解釋,我們設計了基于反事實和事實推理的度量標準,以評估解釋的必要性和充分性。實驗表明,無論基準真相解釋是否可用,CF^2在真實數據集上都比以前的最先進的方法產生了更好的解釋。此外,統計分析證明了基準真相評估和我們提出的指標之間的相關性。
圖神經網絡(GNNs)被廣泛用于學習一種強大的圖結構數據表示。最近的研究表明,將知識從自監督任務遷移到下游任務可以進一步改善圖的表示。然而,自監督任務與下游任務在優化目標和訓練數據上存在內在的差距。傳統的預訓練方法可能對知識遷移不夠有效,因為它們不能適應下游任務。為了解決這一問題,我們提出了一種新的遷移學習范式,該范式可以有效地將自監督任務作為輔助任務來幫助目標任務。在微調階段,我們的方法將不同的輔助任務與目標任務進行自適應的選擇和組合。我們設計了一個自適應輔助損失加權模型,通過量化輔助任務與目標任務之間的一致性來學習輔助任務的權重。此外,我們通過元學習來學習權重模型。我們的方法可以運用于各種遷移學習方法,它不僅在多任務學習中有很好的表現,而且在預訓練和微調中也有很好的表現。在多個下游任務上的綜合實驗表明,所提出的方法能夠有效地將輔助任務與目標任務相結合,與現有的方法相比,顯著提高了性能。
最近,異質圖神經網絡(HGNNs)在處理異質信息網絡(HIN)方面展現了優越的能力。大部分的HGNNs都遵循半監督學習的設定,然而實際應用中標簽信息往往很難獲得。而自監督學習由于能夠自發地從數據本身挖掘監督信號,已經成為無監督設定下很好的選擇。作為一種典型的自監督機制,對比學習(contrastive learning)通過從數據中抽取出正負樣本,同時最大化正例間的相似度以及最小化負例間相似度,能夠學到判別性的表示。盡管對比學習在CV和NLP領域得到了廣泛應用,如何將它和HIN結合卻尚未解決。
通過認真考慮HIN以及對比學習的特性,我們總結了三個需要解決的本質問題:
1)如何設計異質對比機制 HIN中包含復雜結構,例如元路徑(meta-path),需要利用跨視圖的對比學習機制來綜合刻畫。
2)如何在HIN中選擇合適的視圖 對于視圖的基本要求是,能夠刻畫網絡的局部結構和高階結構。網絡模式(network schema)反應了節點間的直接連接情況,捕捉局部結構;元路徑通常被用來抽取多跳關系。
3)如何設置困難的對比任務 簡單的正負關系很容易被捕獲,模型學到的信息有限。增加對比任務的難度,可通過增加兩個視圖間的差異,或者生成更高質量的負樣本來實現。
在本篇文章中,我們提出了一個新的基于協同對比學習的異質圖神經網絡框架,簡稱HeCo。HeCo采用跨視圖的對比機制,選擇網絡模式和元路徑作為兩個視圖,結合視圖掩蓋機制,分別學得兩個視圖下的節點表示。之后,利用跨視圖對比學習,使得兩個視圖協同監督。此外,我們還提出兩個HeCo擴展,通過生成更高質量的負例,提升最終效果。
圖神經網絡(GNN)已經成為圖表示學習的事實標準,它通過遞歸地聚集圖鄰域的信息來獲得有效的節點表示。盡管 GNN 可以從頭開始訓練,但近來一些研究表明:對 GNN 進行預訓練以學習可用于下游任務的可遷移知識能夠提升 SOTA 性能。但是,傳統的 GNN 預訓練方法遵循以下兩個步驟:
在大量未標注數據上進行預訓練; 在下游標注數據上進行模型微調。 由于這兩個步驟的優化目標不同,因此二者存在很大的差距。
在本文中,我們分析了預訓練和微調之間的差異,并為了緩解這種分歧,我們提出了一種用于GNNs的自監督預訓練策略L2P-GNN。方法的關鍵是L2P-GNN試圖以可轉移的先驗知識的形式學習如何在預訓練過程中進行微調。為了將局部信息和全局信息都編碼到先驗信息中,我們在節點級和圖級設計了一種雙重自適應機制。最后,我們對不同GNN模型的預訓練進行了系統的實證研究,使用了一個蛋白質數據集和一個文獻引用數據集進行了預訓練。實驗結果表明,L2P-GNN能夠學習有效且可轉移的先驗知識,為后續任務提供好的表示信息。我們在//github.com/rootlu/L2P-GNN公開了模型代碼,同時開源了一個大規模圖數據集,可用于GNN預訓練或圖分類等。
總體來說,本文的貢獻如下:
圖神經網絡(GNN)已被證明是圖分析的強大工具。關鍵思想是沿著給定圖的邊遞歸地傳播和聚合信息。盡管它們取得了成功,但是,現有的GNN通常對輸入圖的質量很敏感。真實世界的圖通常是噪聲和包含任務無關的邊緣,這可能導致在學習的GNN模型中泛化性能次優。本文提出一種參數化拓撲去噪網絡PTDNet,通過學習丟棄任務無關邊來提高GNNs的魯棒性和泛化性能。PTDNet通過使用參數化網絡懲罰稀疏圖中的邊數來刪除與任務無關的邊。考慮到整個圖的拓撲結構,采用核范數正則化對稀疏圖施加低秩約束,以便更好地泛化。PTDNet可以作為GNN模型的關鍵組件,以提高其在各種任務中的性能,如節點分類和鏈路預測。在合成數據集和基準數據集上的實驗研究表明,PTDNet可以顯著提高GNNs的性能,并且對于噪聲較大的數據集性能增益更大。
//personal.psu.edu/dul262/PTDNet/WSDM2021_PTDNet_camera_ready.pdf
圖神經網絡(GNNs)最近變得越來越受歡迎,因為它們能夠學習復雜的關系系統或相互作用,這些關系或作用來源于生物學和粒子物理學到社會網絡和推薦系統等廣泛問題。盡管在圖上進行深度學習的不同模型太多了,但迄今為止,很少有人提出方法來處理呈現某種動態性質的圖(例如,隨著時間的推移而進化的特征或連通性)。在本文中,我們提出了時序圖網絡(TGNs),一個通用的,有效的框架,用于深度學習動態圖表示為時間事件序列。由于內存模塊和基于圖的運算符的新組合,TGNs能夠顯著優于以前的方法,同時在計算效率上也更高。此外,我們還展示了之前幾個用于學習動態圖的模型可以轉換為我們框架的具體實例。我們對框架的不同組件進行了詳細的消歧研究,并設計了最佳配置,在動態圖的幾個轉導和歸納預測任務中實現了最先進的性能。
圖神經網絡(GNNs)是廣泛使用的深度學習模型,從圖結構數據學習有意義的表示。由于底層循環結構的有限性質,當前的GNN方法可能難以捕獲底層圖中的長期依賴關系。為了克服這個困難,我們提出了一個圖學習框架,稱為隱式圖神經網絡(IGNN),其中的預測是基于一個涉及隱式定義的“狀態”向量的不動點平衡方程的解。利用Perron-Frobenius理論推導了保證框架良好性的充分條件。利用隱式微分,我們推出了一個易于處理的投影梯度下降方法來訓練框架。對一系列任務進行的實驗表明,IGNNs始終能夠捕獲長期依賴關系,并優于最先進的GNN模型。
大量真實世界的圖或網絡本質上是異構的,涉及節點類型和關系類型的多樣性。異構圖嵌入是將異構圖的豐富結構和語義信息嵌入到低維節點表示中。現有的模型通常定義多個metapaths在異構圖捕捉復合關系和指導鄰居選擇。但是,這些模型要么忽略節點內容特性,要么沿著元路徑丟棄中間節點,要么只考慮一個元路徑。為了解決這三個局限性,我們提出了一種新的集合圖神經網絡模型來提高最終性能。具體來說,MAGNN使用了三個主要組件,即,節點內容轉換封裝輸入節點屬性,元內聚合合并中間語義節點,元間聚合合并來自多個元的消息。在三個真實世界的異構圖數據集上進行了大量的節點分類、節點聚類和鏈路預測實驗,結果表明MAGNN的預測結果比最先進的基線更準確。