圖表示學習旨在將高維稀疏的圖結構數據有效編碼為低維稠密的向量,是機器學習、數據挖掘等眾多領域的一項基礎任務。經典的圖嵌入方法遵循圖中互聯節點的嵌入向量仍然可以保持相對近距離的基本思想,從而保留圖中節點之間的結構信息。然而,這是次優的,因為: (i)傳統方法的模型容量有限,限制了學習性能; (ii)現有技術通常依賴于無監督學習策略,無法與最新的學習范式耦合; (iii)表示學習和下游任務相互依賴,需要共同加強。隨著深度學習的顯著成功,深度圖表示學習比淺層(傳統)方法顯示出了巨大的潛力和優勢,近十年來提出了大量的深度圖表示學習技術,尤其是圖神經網絡。對當前的深度圖表示學習算法進行了全面的調研,提出了一個現有的最先進文獻的新分類法。系統地總結了圖表示學習的基本組成部分,并通過圖神經網絡架構和最新的先進學習范式對現有方法進行了分類。此外,本文還提供了深度圖表示學習的實際和有前景的應用。最后,本文闡述了新的觀點,并提出了具有挑戰性的方向,值得未來進一步研究。
//www.zhuanzhi.ai/paper/f793020f8e47a7afe6f318478fc68493
1 引言
近年來,圖成為表示各種結構化和復雜數據的有力工具,包括社交網絡、交通網絡、信息系統、知識圖譜、蛋白質相互作用網絡和物理相互作用網絡等。作為一種通用的數據組織形式,圖結構能夠自然地表達這些數據的內在關系,因此可以表征大量在各種學科和領域中至關重要的非歐幾里得結構,因為它們具有靈活的適應性。例如,將社交網絡編碼為圖,用圖上的節點來表示個體用戶,用邊來表示兩個個體之間的關系,比如朋友。在生物學領域,節點可以用來表示蛋白質,邊可以用來表示各種蛋白質之間的生物相互作用,比如蛋白質之間的動態相互作用。因此,通過對圖結構數據的分析和挖掘,我們可以了解隱藏在數據背后的深層含義,進一步發現有價值的知識,從而造福社會和人類。
在過去的十年中,針對圖結構數據學習,已經開發出了各種各樣的機器學習算法。其中,傳統的圖核方法[107,177,314,316]通常將圖分解為不同的原子子結構,然后使用核函數來衡量它們所有對之間的相似性。雖然圖核可以提供一個建模圖拓撲的視角,但這些方法往往根據給定的手工制定的標準生成子結構或特征表示。這些規則相當具有啟發式,容易受到高計算復雜度的影響,因此可擴展性較弱,性能欠佳。過去幾年不斷涌現的圖嵌入算法[2,123,276,343,344,359],試圖對圖的結構信息(通常是高維稀疏矩陣)進行編碼,并將其映射為低維稠密的向量嵌入,以盡可能保留嵌入空間中的拓撲信息和屬性信息,使學習到的圖嵌入可以自然地融入傳統的機器學習算法中。與之前在預處理階段使用特征工程來提取圖結構特征的工作相比,目前的圖嵌入算法是以數據驅動的方式利用機器學習算法(如神經網絡)來編碼圖的結構信息。
具體來說,現有的圖嵌入方法可以分為以下主要組: (i)基于矩陣分解的方法[2,36,268],對矩陣進行分解以學習保留圖屬性的節點嵌入; (ii)應用專為圖結構數據設計的深度學習技術的基于深度學習的方法[123,276,344,359]; (iii)要么最大化邊緣重建概率,要么最小化邊緣重建損失的基于邊緣重建的方法[229,253,343]。一般來說,這些方法通常依賴于淺層架構,并未能利用深度神經網絡的潛力和能力,導致次優的表示質量和學習性能。受最近深度神經網絡顯著成功的啟發,一系列用于圖結構數據學習的深度學習算法被開發出來。這些方法的核心是使用圖神經網絡(GNNs)生成有效的節點和圖表示,其次是面向目標的學習范式。通過這種方式,派生出的表示可以自適應各種下游任務和應用程序。遵循這一思路,本文提出了一種新的分類法,對現有的圖表示學習算法進行分類,即圖神經網絡架構、學習范式和各種有前途的應用,如圖1所示。具體來說,對于圖神經網絡的架構,我們調查了圖卷積、圖核神經網絡、圖池化和圖transformer的研究。對于學習范式,我們探索了三種高級類型,即圖上的監督/半監督學習,圖自監督學習和圖結構學習。為了證明學習到的圖表示的有效性,我們提供了幾個有希望的應用程序,以在表示學習和下游任務之間建立緊密的聯系,如社會分析、分子屬性預測和生成、推薦系統和流量分析。最后但并非最不重要的是,我們提出了一些思考的視角,并提出了值得在未來進一步研究的具有挑戰性的方向。本調查與現有調查的差異。到目前為止,還存在一些其他的綜述論文,側重于圖表示學習的不同視角[12,40,43,47,179,387,390,446,463,464],這些論文與我們的研究密切相關。然而,很少有全面的綜述從不同的GNN架構和相應的最新學習范式的角度同時總結了深度圖表示學習。
因此,我們在這里明確說明它們與我們調查的區別如下。已經有一些關于經典圖嵌入的調查[32,119],這些工作根據不同的訓練目標對圖嵌入方法進行了分類。Wang等人[366]更進一步,對現有的異構圖嵌入方法進行了全面的回顧。隨著深度學習的快速發展,出現了一些沿著這條路線的調查。例如,Wu et al.[387]和Zhang et al.[446]主要關注幾種經典和代表性的GNN架構,而沒有從圖自監督學習和圖結構學習等最新的高級學習范式的角度探索深度圖表示學習。Xia et al.[390]和Chami et al.[40]共同總結了圖嵌入和gnn的研究。Zhou等人[463]探索了GNNs不同類型的計算模塊。最近的一項綜述[179]對來自靜態圖和動態圖的圖表示學習的現有工作進行了分類。然而,這些分類強調了基本的GNN方法,但對學習范式關注不足,并且很少討論最有前途的應用,如推薦系統和分子性質的預測和生成。據我們所知,正式發表的最相關的調查是[464],它介紹了GNN架構的綜述,并粗略地討論了相應的應用。盡管如此,這項調查僅涵蓋了截至2020年的方法,錯過了過去兩年的最新發展。因此,非常希望將具有代表性的GNN方法、最新的先進學習范式和有前途的應用總結到一個統一和全面的框架中。此外,我們強烈相信,這項具有新的文獻分類法和400多項研究的調查將加強未來對深度圖表示學習的研究。
本綜述的貢獻。本綜述的目標是系統地回顧關于深度圖表示學習進展的文獻,并討論進一步的方向。旨在幫助對該領域感興趣的研究人員和從業人員,并支持他們了解全景圖和深度圖表示學習的最新進展。本次調研的主要貢獻總結如下:
系統分類法。我們提出了一個系統的分類法來組織現有的深度圖表示學習方法,基于GNN架構的方式和最新的先進學習范式,通過提供一些代表性的分類法。此外,還提出了幾個有前途的應用,以說明圖表示學習的優越性和潛力。 全面綜述。對于本綜述的每個分支,我們回顧了基本組成部分并提供了代表性算法的詳細描述,并系統地總結了特點以進行概述比較。 未來的方向。基于現有的深度圖表示學習算法的屬性,討論了當前方法的局限性和挑戰,并提出了值得未來研究的潛力和有前途的研究方向。
2. 圖卷積
**圖卷積已經成為最近開發的許多深度圖表示學習算法和圖神經網絡的基本構建模塊。在本節中,我們對圖卷積進行了全面的回顧,圖卷積一般分為兩類: 譜圖卷積和空間圖卷積。基于圖信號處理(GSP)的堅實數學基礎[129,303,320],譜圖卷積尋求在頻域捕獲圖的模式。另一方面,空間圖卷積繼承了循環圖神經網絡(RecGNNs)的消息傳遞思想,它們通過聚合其鄰居的特征來計算節點特征。因此,一個節點的計算圖是從其周圍的局部圖結構中派生出來的,圖拓撲結構自然地納入到節點特征的計算方式中。在本節中,我們首先介紹譜圖卷積,然后介紹空間圖卷積,然后做一個簡要的總結。在表1中,我們總結了近年來提出的一些圖卷積。
?技術。圖卷積主要分為兩種類型,即譜圖卷積和空間圖卷積。譜圖卷積具有堅實的圖信號處理數學基礎,因此其操作具有理論解釋。空間圖卷積受到循環圖神經網絡的啟發,其計算簡單直接,因為其計算圖來源于局部圖結構。一般來說,空間圖卷積在應用中更常見。 ?挑戰和局限性。盡管圖卷積取得了巨大的成功,但在更復雜的應用中,其性能并不令人滿意。一方面,圖卷積的性能嚴重依賴于圖的構造。不同的圖構造可能會導致不同的圖卷積性能。另一方面,在構建非常深的神經網絡時,圖卷積容易出現過平滑。 ?未來工作。在未來,我們希望開發更強大的圖卷積來緩解過度平滑的問題,我們也希望圖結構學習(GSL)中的技術和方法可以幫助學習更有意義的圖結構,從而有利于圖卷積的性能。
3. 圖核神經網絡
圖核(GKs)是歷史上在圖分析和表示任務中使用最廣泛的技術[107,313,463]。然而,傳統的圖核在特定任務上依賴于手工設計的模式或領域知識[194,316]。多年來,人們對圖核神經網絡(GKNNs)進行了大量的研究,取得了很好的結果。研究人員已經探索了GKNN的各個方面,包括其理論基礎、算法設計和實際應用。這些努力導致了廣泛的基于GKNN的模型和方法的發展,這些模型和方法可用于圖分析和表示任務,如節點分類、鏈接預測和圖聚類[44,237,238]。GKNNs的成功可以歸因于它們能夠利用圖核和神經網絡的優勢。通過使用核函數來度量圖之間的相似性,GKNNs可以捕獲圖的結構屬性,而神經網絡的使用使其能夠學習到圖的更復雜和抽象的表示。這種技術的組合使GKNNs在廣泛的圖相關任務上實現最先進的性能。在本節中,我們首先介紹最具代表性的傳統圖核。然后總結了結合GNN和圖核的基本框架; 最后,對流行的圖核神經網絡進行分類,并比較它們的差異。
技術。圖核神經網絡(GKNNs)是最近流行的研究領域,它結合了圖核和GNNs的優勢來學習更有效的圖表示。研究人員從理論基礎、算法設計和實際應用等各個方面對GKNNs進行了研究。因此,廣泛的基于GKNN的模型和方法被開發出來用于圖分析和表示任務,包括節點分類、鏈接預測和圖聚類。 挑戰和限制。盡管gknn在圖相關任務中顯示出了巨大的潛力,但它們也有一些需要解決的局限性。可擴展性是一個重大挑戰,特別是在處理大規模圖和網絡時。隨著圖的規模增加,GKNNs的計算成本呈指數級增長,這可能會限制它們處理大型和復雜的現實世界應用程序的能力。 未來工作。對于未來的工作,我們希望GKNNs可以將更多特定領域的知識集成到設計的核中。特定領域的知識已經被證明可以顯著提高許多應用的性能,例如藥物發現、基于知識圖譜的信息檢索系統和分子分析[90,360]。將特定領域知識納入GKNNs可以增強其處理復雜和多樣化數據結構的能力,從而產生更準確和可解釋的模型。
4. 圖池化
當涉及到圖級別的任務時,如圖分類和圖回歸,圖池化是從學習到的節點嵌入生成整個圖表示的一個重要組件。為了確保同構圖具有相同的表示,圖池化操作應與節點的排列無關。在本節中,系統地回顧了現有的圖池化算法,并將其分為兩類:全局池化算法和層次池化算法。全局池化算法直接將節點嵌入聚合為最終的圖表示,而層次池化算法減小圖規模并逐步生成即時表示,以捕獲輸入圖的層次結構和特征。表3提供了一個總結。
技術。圖池化方法通過聚合節點嵌入在生成整個圖表示中發揮著至關重要的作用。圖池化方法主要有兩類:全局池化方法和層次池化方法。全局池化方法直接一步聚合節點嵌入,層次池化方法基于TopK選擇、聚類方法或混合方法逐步粗化圖以捕獲圖的層次結構特征。
挑戰和限制。盡管圖池化方法在學習整個圖表示方面取得了巨大的成功,但仍然存在一些未解決的挑戰和限制: 1)對于層次池化,大多數基于簇的方法都涉及到密集的分配矩陣,這限制了它們的應用于大型圖,而基于topk的方法在捕捉圖的結構信息方面不太好,可能會因為節點丟棄而丟失信息。 2)大多數圖池化方法是為簡單屬性圖設計的,而為其他類型的圖(如動態圖和異構圖)量身定制的池化算法在很大程度上還沒有得到充分的探索。
未來工作。在未來,我們預計可以研究更多的混合或其他池化方法,以充分捕獲圖結構信息,并對大型圖高效。在現實場景中,有各種類型的圖,涉及動態、異構或時空信息。專門針對這些圖設計圖池化方法是很有希望的,這可以有利于更真實的應用,如流量分析和推薦系統。
5. 圖 Transformer
盡管基于消息傳遞范式的gnn在多個眾所周知的任務[115,205,363,403]上取得了令人印象深刻的性能,但它們仍然面臨一些內在問題,迭代鄰居聚合操作。之前的許多工作已經證明了消息傳遞GNN的兩個主要缺陷,即所謂的過平滑和長距離建模問題。而且也有很多解釋性的工作試圖從這兩個問題中挖掘見解。過平滑問題可以解釋為各種只關注低頻信息[23]的GNN,混合不同類型節點之間的信息破壞模型性能[45],GCN相當于拉普拉斯平滑[213],鄰居之間的各向同性聚集導致與隨機游走相同的影響分布[404]等。無法對GNN的長距離依賴關系進行建模,部分原因是過度平滑問題,因為在傳統的鄰居聚合GNN的背景下,節點信息只能通過多個GNN層進行長距離傳遞。最近,Alon et al.[6]發現這個問題也可能是由過度擠壓(over- squeeashing)引起的,這意味著隨著距離的增加,計算路徑呈指數增長。雖然這兩個基本的性能瓶頸可以通過精心設計的消息傳遞和聚合策略來解決,但GNN的表征能力本質上受到Weisfeiler-Lehman同構層次結構的限制[264]。更糟糕的是,大多數GNN[115, 182, 351]都受到最簡單的一階Weisfeiler-Lehman檢驗(1-WL)的限制。一些努力致力于打破這一限制,如基于超圖的[93,149],基于路徑的[31,415]和基于k- wl的[15,264]方法。在解決這些基本問題的許多嘗試中,一個重要的嘗試是將Transformer[350]用于圖表示學習。transformer,無論是vanilla版本還是幾個變體,都已經在包括NLP [70, 350], CV[38, 469]等各種深度學習領域被采用,并取得了令人印象深刻的結果。最近,Transformer也在許多研究中顯示出強大的圖建模能力[46,81,193,386,415]。而廣泛的經驗結果表明,在基于transformer的方法中,傳統gnn中的一些慢性缺點可以很容易地克服。本節概述了這類方法的當前進展。
注意力操作的核心是基于源與待更新目標之間的相似度來完成信息遷移。這與全連接圖上的消息傳遞過程非常相似。然而,將這種架構直接應用到任意圖上并不能利用結構信息,因此在圖拓撲很重要的時候可能會導致性能不佳。另一方面,在圖中定義位置編碼并不是一個微不足道的問題,因為圖節點的順序或坐標是欠定義的。根據這兩個挑戰,基于transformer的圖表示學習方法可以分為兩大類,一類是在注意力過程中考慮圖結構,另一類是將圖的拓撲信息編碼為初始節點特征。我們將第一種命名為注意力修正,第二種命名為編碼增強。表4提供了一個總結。在接下來的討論中,如果在一篇論文中同時使用了兩種方法,我們將在不同的小節中列出,我們將忽略注意力操作中的多頭技巧。
本節介紹了基于transformer的圖表示學習方法,總結如下:
技術。圖Transformer方法修改了Transformer中的兩項基本技術,注意力操作和位置編碼,以增強其編碼圖數據的能力。通常,它們引入全連接注意力來建模長距離關系,利用最短路徑和拉普拉斯特征向量來打破1-WL瓶頸,并將屬于不同類別的點和邊分開以避免過度混合問題。
挑戰和限制。盡管圖transformer取得了令人鼓舞的性能,但它們仍然面臨兩個主要挑戰。第一個挑戰是二次注意力機制和最短路徑計算的計算成本。這些操作需要大量的計算資源,可能成為瓶頸,特別是對于大型圖。其次是基于transformer的模型對大量數據的依賴,以獲得穩定的性能。它在處理缺乏足夠數據的問題時提出了挑戰,特別是在少樣本和零樣本設置時。
未來的工作。我們期望進一步探索Graph Transformer的效率提升。此外,有一些工作使用預訓練和微調框架來平衡下游任務中的性能和復雜性[415],這可能是解決上述兩個挑戰的有希望的解決方案。
6. 圖半監督學習
我們研究了圖神經網絡的各種架構,其中的參數應該由學習目標調整。最流行的優化方法是圖數據上的監督學習。由于標簽scarify的存在,半監督學習在數據挖掘界引起了越來越多的關注。在細節上,這些方法試圖將圖表示學習與當前包括偽標記、一致性學習、知識蒸餾和主動學習在內的半監督技術相結合。這些工作可以進一步細分為節點級表示學習和圖級表示學習。我們將分別在第7.1節和第7.2節中詳細介紹這兩部分。表5給出了一個總結。
本節介紹用于圖表示學習的半監督學習,我們提供如下摘要:
技術。經典節點分類旨在對訪問未標記數據的圖進行直推式學習,這是一個自然的半監督問題。半監督圖分類旨在緩解對大量標記圖的需求。在這里,人們提出了多種半監督方法,以在標簽稀缺的情況下實現更好的性能。通常,他們試圖將主動學習、偽標記、一致性學習和一致性學習等半監督技術與圖表示學習相結合。
挑戰和限制。盡管取得了巨大的成功,但這些方法的性能仍然不令人滿意,特別是在圖級表示學習方面。例如,DSGC在二分類數據集REDDIT-BINARY中只能達到57%的準確率。更糟糕的是,標簽稀缺往往伴隨著不平衡的數據集和潛在的域偏移,這為現實世界的應用提供了更多的挑戰。
未來工作。在未來,我們期望這些方法可以應用于不同的問題,如分子性質預測。還有一些工作可以擴展圖表示學習的應用場景,如少樣本學習[41,249]。對于更先進、更有效的半監督技術,總是期待更高的精度。
7. 圖自監督學習
除了監督或半監督方法之外,近年來自監督學習(SSL)在數據挖掘和表示嵌入方面也顯示出強大的能力。在本節中,我們研究了基于SSL的圖神經網絡,并對幾個典型的模型進行了詳細介紹。圖SSL方法通常有一個統一的管道,包括前置任務和下游任務。前置任務幫助模型編碼器學習更好的表示,這是在下游任務中表現更好的前提。因此,精致的前置任務設計對于Graph SSL至關重要。我們將首先在8.1節介紹Graph SSL的整體框架,然后在8.2節和8.3節分別介紹兩種前置任務設計,基于生成的方法和基于對比的方法。表6提供了一個總結。本節介紹圖的自監督學習,總結如下:
技術。與經典的監督學習和半監督學習不同,自監督學習提高了模型泛化能力和魯棒性,同時降低了對標簽的依賴。Graph SSL利用前置任務來提取表示分布中的固有信息。典型的Graph SSL方法可以分為基于生成的和基于對比的兩種。基于生成的方法學習一個編碼器,該編碼器具有盡可能精確地重建圖的能力,由自動編碼器驅動。基于對比的方法最近引起了極大的興趣,它們學習一個編碼器,以最小化相關實例之間的互信息和最大化不相關實例之間的互信息。 挑戰和局限。盡管graph SSL在許多任務中取得了卓越的性能,但它的理論基礎并不那么堅實。許多眾所周知的方法只是通過實驗進行驗證,而沒有解釋理論或提出數學證明。為graph SSL建立一個強大的理論基礎是勢在必行的。 未來的工作。未來,我們期待更多基本上通過理論證明設計的graph ssl方法,而不是通過直覺專門設計的增強過程或偽裝任務。這將給我們帶來更明確的數學屬性和更少模糊的經驗意義。此外,圖是跨不同領域的數據表示的一種普遍形式,然而獲得手工標簽可能非常昂貴。將graph SSL的應用擴展到更廣泛的領域是未來研究的一個有希望的途徑。
8. 圖結構學習
圖結構決定了節點特征如何相互傳播和影響,在圖表示學習中起著至關重要的作用。在某些場景中,提供的圖是不完整的、有噪聲的,甚至根本沒有結構信息。最近的研究還發現,圖的對抗攻擊(即修改少量節點特征或邊)可以顯著降低學習到的表示。這些問題激發了圖結構學習(GSL),它旨在學習一種新的圖結構以產生最優的圖表示。根據邊連接的建模方式,GSL中有三種不同的方法,即基于度量的方法、基于模型的方法和直接的方法。除了邊建模,正則化也是一種常用的技巧,可以使學習到的圖滿足一些期望的屬性。我們首先介紹了基本框架和分別在9.1節和9.2節中介紹GSL的正則化方法,然后在9.3節、9.4節和9.5節中介紹GSL的不同類別。我們在表7中總結了GSL的方法
本節和我們提供的總結如下:
技術。GSL旨在學習一個優化的圖結構以獲得更好的圖表示。它還用于對抗對抗攻擊的更魯棒的圖表示。根據邊緣建模的方式,我們將GSL分為三組:基于度量的方法、基于模型的方法和直接方法。正則化也是一種常用的原理,使學習到的圖結構滿足包括稀疏性、低秩性和平滑性在內的特定屬性。 挑戰和限制。由于沒有辦法訪問groundtruth或最佳圖結構作為訓練數據,GSL的學習目標要么是間接的(例如,在下游任務上的性能),要么是手動設計的(例如,稀疏性和平滑性)。因此,GSL的優化是困難的,性能并不令人滿意。此外,許多GSL方法都是基于同質性假設,即相似的節點更容易相互連接。然而,現實世界中存在著許多其他類型的連接,這給GSL帶來了巨大的挑戰。 未來的工作。在未來,我們期望更高效和可泛化的GSL方法被應用于大規模和異構圖。大多數現有的GSL方法專注于成對節點相似性,因此難以擴展到大型圖。此外,它們通常學習同質的圖結構,但在許多場景中圖是異構的。
9 結論
在本綜述中,我們對深度圖表示學習進行了全面和最新的概述。提出了現有算法的一種新的分類法,分為GNN架構、學習范式和應用。技術上,我們首先總結了GNN架構的方法,即圖卷積、圖核神經網絡、圖池化和圖transformer。基于不同的訓練目標,我們提出了三種最新的高級學習范式,即:圖上的監督/半監督學習,圖自監督學習和圖結構學習。然后,我們提供了幾個有希望的應用,以證明深度圖表示學習的有效性。最后但同樣重要的是,我們討論了深度圖表示學習中具有潛在機會的未來方向。
將數據表示為圖在生物化學、社交網絡、交通網絡、自動駕駛和天氣預測等諸多領域中越來越普遍。圖的流行源于其靈活的表達方式和模擬交互的內在能力。然而,這種豐富的表示方式在對數據建模時提出了獨特的挑戰,需要在盡可能多地獲取圖的信息與保持計算可行性之間找到平衡。經過幾十年的嵌入方法和圖核方法等多種方法的探索后,現在的焦點已轉向可以在圖上操作的深度學習方法的發展。這些方法,被稱為圖神經網絡(GNNs),通過鄰域聚合更新每個節點的表示。盡管GNNs在實證上取得了強大的成功,但最近的工作發現了它們的一些局限性,例如無法在圖中長距離傳輸信息,以及在區分非同構圖方面的限制。這些局限性直接與圖神經網絡的設計范例相關,該范例通過鄰域聚合模型圖中的局部結構信息。雖然這種范式編碼了相關和關鍵的信息,但如何最好地抵消由此產生的局限性仍然是一個開放的問題。
本論文探討了全局信息在生成有意義的圖表示中的作用,這些圖表示不受鄰域聚合問題的影響。我們并不尋求取代現今強大的鄰域聚合方法,而是研究全局信息如何補充或提供圖中局部信息的替代視角。 本論文的第一個貢獻是介紹一種將圖表示為高維曲線的新穎方式,我們稱之為過濾曲線。過濾曲線是一種通過在多個尺度上捕捉信息來生成圖的全局表示的有效方法,可以完全無參數。基于曲線的表示還帶來了其他好處,比如直接創建圖的向量表示的方法,使其可以與標準的機器學習算法一起使用。除了其效率和易用性之外,我們發現我們最簡單的過濾曲線形式已經達到了與更復雜、高度參數化的最新競爭方法競爭的實證性能,這證明了全局圖表示的價值。
第二個貢獻是研究如何結合全局和位置信息來改善圖表示。我們引入了一種結構感知的Transformer,它結合了來自消息傳遞GNNs的局部結構信息和來自Transformer架構的全局信息,這是第一個將Transformer和任意GNN集成到一個單一模塊的圖Transformer。我們通過引入一種新的結構感知自注意力計算來實現這一點,該計算基于子圖在感興趣的節點處的相似性過濾節點,使得基于結構和屬性相似性的比較更加穩健。此外,我們抽象這個公式,并提供一個可以定制到感興趣的領域的通用框架。我們的圖Transformer在幾個基準數據集上達到了最先進的性能,并且優于架構的僅全局和僅局部等效項,突顯了結合這兩種圖視角的潛力。 最后,第三個貢獻是對當前評估圖生成模型的過程的實證分析,該過程依賴于全局圖摘要統計和最大平均差異(MMD)。我們發現了社區采用的當前程序中的一些問題,這在最壞的情況下會導致偽結果,因此我們提出了一個修改后的工作流程來避免這些情況。
我們通過為將全局和局部信息結合在圖表示中的未來工作提供展望來結束這篇論文。隨著越來越多的新領域開始將它們的數據表示為圖,如何學習圖的有意義表示的范式可能會發生變化或需要新的方法。從這個角度來看,我們預期將全局信息融入圖表示的提出的方法將在圖學習的當前和未來應用中證明其實用性。
拓撲深度學習最新概述文章,值得關注!
拓撲深度學習是一個迅速發展的領域,涉及為支持拓撲域(如單純復合物、胞復合物和超圖)的數據開發深度學習模型,這些拓撲域推廣了在科學計算中遇到的許多領域。在本文中,我們提出了一個統一的深度學習框架,該框架基于一種更豐富的數據結構,包括廣泛采用的拓撲域。具體來說,我們首先引入組合復合物,一種新型的拓撲域。組合復合物可以看作是保持某些期望性質的圖的泛化。與超圖類似,組合復合物對關系集合沒有約束。此外,組合復合物允許構建類似于單純復合物和胞復合物中的分層高階關系。因此,組合復合物泛化并結合了超圖和胞復合物的有用特性,這兩者已經成為促使圖神經網絡向拓撲空間推廣的有前景的抽象。其次,基于組合復合物及其豐富的組合和代數結構,我們開發了一般類的消息傳遞組合復合物神經網絡(CCNNs),主要關注基于注意力的CCNNs。我們描述了CCNNs的排列和方向等變性,并詳細討論了CCNNs中的匯集和反匯集操作。第三,我們評估了CCNNs在與網格形狀分析和圖學習相關的任務上的性能。我們的實驗表明,與專門針對相同任務的最先進的深度學習模型相比,CCNNs具有競爭性的性能。我們的研究結果證明了將高階關系納入不同應用的深度學習模型的優勢。
引言
近年來,用于計算分析的數據量呈指數級增長,包括科學數據以及文本、圖像和音頻等常見數據類型。這大量的數據使得包括物理學、化學、計算社會科學和生物學在內的各個領域得以利用機器學習技術(主要是深度神經網絡)取得重大進展。由于深度神經網絡可以有效地總結和提取大型數據集中的模式,因此它們適用于許多復雜任務。最初,深度神經網絡是為了學習基于規律(歐幾里得)領域的數據而發展起來的,例如圖像中的網格、文本序列和時間序列。這些模型,包括卷積神經網絡(CNNs)[156, 162, 243]、循環神經網絡(RNNs)[249, 13]和變換器(Transformers)[256],在處理這類歐幾里得數據方面已被證明具有很高的效果[117],在各種應用中取得了空前的性能,最近的例子包括聊天機器人(例如 ChatGPT [2])和文本控制的圖像合成[223]。
然而,各個領域的科學數據往往具有不同的結構,并不都是基于規律的歐幾里得域。因此,調整深度神經網絡來處理這類數據一直是個挑戰。在這一背景下,幾何深度學習(GDL)[50, 284, 268]作為深度學習模型在非歐幾里得領域的擴展應運而生。為了實現這一目標,GDL通過幾何規律原理(如對稱性、不變性和等變性)對執行的計算進行限制。GDL的視角使得在處理任意數據域時可以施加適當的歸納偏見,包括集合[215, 217, 81, 283, 138]、網格[45, 187, 46, 154, 242, 267, 196]、流形[45, 187, 46, 154, 242, 267, 196]和圖[232, 101, 284, 268, 46, 196, 49, 150]。特別是圖,由于其在眾多科學研究中的適用性以及它們能夠泛化傳統網格的能力,因而受到了人們的關注。因此,圖神經網絡(GNNs)[49, 150]的發展顯著提高了我們在自然出現圖的多種數據類型中進行建模和分析的能力。
盡管幾何深度學習(GDL)和圖神經網絡(GNNs)取得了成功,但僅從純幾何的角度看待圖形會產生純粹的局部抽象,并無法捕捉數據中的非局部特性和依賴關系。拓撲數據,包括邊(在圖中)、三角形(在網格中)或團的相互作用,在復雜物理系統[30, 161]、交通預測[144]、社會影響[285]、蛋白質相互作用[200]、分子設計[237]、視覺增強[95]、推薦系統[160]和流行病學[82]等眾多新穎應用中自然產生。為了本質上和有效地對這些數據建模,我們必須超越圖形,考慮在某些幾何變換下保持不變的定性空間屬性。換句話說,我們需要考慮數據的拓撲結構[58],以構建能夠從復雜數據中提取語義含義的神經網絡架構。從數據中提取更多全局信息的一種方法是超越基于圖的抽象,考慮圖的擴展,如單純復形、胞復形和超圖,這些概念可以推廣到科學計算中遇到的大多數數據領域[41, 29, 32, 253]。學習從這些拓撲領域支持的數據中學習的機器學習模型的發展[97, 53, 222, 234, 42, 121, 123, 91, 235, 221, 112, 272]是一個迅速增長的新領域,我們將其稱為拓撲深度學習(TDL)。TDL融合了幾個研究領域,包括拓撲數據分析(TDA)[93, 58, 86, 178, 108]、拓撲信號處理[233, 273, 236, 222, 21, 219, 229]、網絡科學[245, 161, 20, 29, 41, 39, 33, 80, 19, 203]和幾何深度學習[278, 56, 99, 177, 27, 197, 26]。
盡管對拓撲深度學習(TDL)的興趣日益增長,但迄今為止尚未建立這些思想的基本原則的更廣泛綜合。我們認為,這種不足阻礙了TDL的進展,因為這使得在不同概念之間建立聯系變得具有挑戰性,阻礙了比較,并使其他領域的研究者難以找到進入TDL的切入點。因此,在本文中,我們旨在提供一個關于TDL原則的基本概述,不僅作為近年來文獻中涌現出的許多令人興奮的想法的統一框架,還作為一個概念性的起點,以促進新想法的探索。最終,我們希望這項工作將有助于TDL的加速發展,我們相信這將成為將深度學習成功轉移到更廣泛應用場景的關鍵推動力。受到代數拓撲[108, 133]中傳統拓撲概念以及高階網絡方面的最新進展[29, 253, 41, 30]的啟發,我們首先引入組合復形(CCs)作為我們TDL框架的主要構建模塊。組合復形構成了一個新穎的拓撲領域,將圖形、單純復形、胞復形和超圖作為特殊情況加以統一,如圖11所示。與超圖類似,CCs(連接復合體)可以在抽象實體集合之間編碼任意集合式關系。此外,CCs允許構建類似于在單純形和胞腔復合體中發現的分層高階關系。因此,CCs將超圖和胞腔復合體的最期待的 特性進行了概括和整合。
此外,我們引入了構建深度神經網絡所需的運算符,以便基于組合復合體學習輸入特征和抽象概括。這些運算符提供了卷積、注意力機制、信息傳遞方案以及實現不變性、等變性或其他幾何規律的方法。具體而言,我們的新穎的前推操作允許在不同維度之間傳遞數據,從而構成了在CCs(連接復合體)上定義高階信息傳遞協議和(非)池化操作的基本構建模塊。由此產生的學習機器,我們稱之為組合復合體神經網絡(CCNNs),如我們的實驗評估中所清楚地展示的那樣,它們能夠學習抽象的高階數據結構。 我們設想我們的貢獻將成為一個平臺,鼓勵研究人員和實踐者擴展我們的CCNNs,并邀請社區在我們的工作基礎上擴展高階領域的TDL(拓撲數據學習)。我們的貢獻如圖1所示,包括以下幾點:
首先,我們將CCs(連接復合體)引入作為TDL(拓撲數據學習)領域。我們描述了CCs及其屬性,并解釋了它們如何概括主要現有領域,例如圖、超圖、單純形和胞腔復合體。因此,CCs可以作為一個統一的起點,實現拓撲數據的表達式表示的學習。
其次,使用CCs作為領域,我們構建了CCNNs,這是一種基于超圖和胞腔復合體的TDL模型的抽象高階信息傳遞神經網絡類,為這些模型提供了統一的藍圖。
*基于在CCs上定義的前推操作符,我們為CCNNs引入了卷積、注意力、池化和反池化操作符。
第三,我們在實際場景中評估我們的想法。
雖然強化學習(RL)在許多領域的連續決策問題上取得了巨大的成功,但它仍然面臨著數據效率低下和缺乏可解釋性的關鍵挑戰。有趣的是,近年來,許多研究人員利用因果關系文獻的見解,提出了大量統一因果關系優點的著作,并很好地解決了RL帶來的挑戰。因此,整理這些因果強化學習(CRL)著作,回顧CRL方法,研究因果強化學習的潛在功能是非常必要和有意義的。**特別是,我們根據現有CRL方法是否預先給出基于因果關系的信息,將其分為兩類。我們從不同模型的形式化方面進一步分析了每個類別,包括馬爾可夫決策過程(MDP)、部分觀察馬爾可夫決策過程(POMDP)、多臂賭博機(MAB)和動態處理制度(DTR)。**此外,我們總結了評估矩陣和開源,同時我們討論了新興的應用程序。
//www.zhuanzhi.ai/paper/2831beac5d3d0e0e8a42fa338f171c62
強化學習(RL)是智能體在[1]-[3]環境中學習最大化期望獎勵的策略(從狀態到動作的映射函數)的通用框架。當智能體與環境交互時,它試圖通過試錯方案來解決序列決策問題。由于其在性能上的顯著成功,已在各種真實世界應用中得到快速開發和部署,包括游戲[4]-[6]、機器人控制[7]、[8],以及推薦系統[9]、[10]等,受到不同學科研究人員的越來越多的關注。
然而,強化學習仍有一些關鍵挑戰需要解決。例如,**(一)數據效率低下。以前的方法大多需要交互數據,而在現實世界中,例如在醫療或醫療健康[11]中,只有少量記錄數據可用,這主要是由于昂貴、不道德或困難的收集過程。(二)缺乏可解釋性。**現有的方法往往通過深度神經網絡將強化學習問題形式化,將序列數據作為輸入,策略作為輸出,屬于黑盒理論。它們很難揭示數據背后的狀態、動作或獎勵之間的內部關系,也很難提供關于策略特征的直覺。這種挑戰將阻礙其在工業工程中的實際應用。有趣的是,因果關系可能在處理上述強化學習[12],[13]的挑戰中發揮著不可或缺的作用。因果關系考慮兩個基本問題[14]:(1)因果關系的合法推斷需要什么經驗證據?利用證據發現因果關系的過程簡稱為因果發現。(2)給定一個現象的公認的因果信息,我們可以從這些信息中得出什么推論,如何推斷?這種推斷因果效果或其他利益的過程稱為因果推斷。因果關系可以授權智能體進行干預或通過因果階梯進行反事實推理,放松了對大量訓練數據的要求;它還能夠描述世界模型,可能為智能體如何與環境交互提供可解釋性。
**在過去的幾十年里,因果學習和強化學習各自取得了巨大的理論和技術發展,而它們本可以相互融合。**Bareinboim[15]通過將它們放在相同的概念和理論框架下,開發了一個名為因果強化學習的統一框架,并提供了一個在線介紹教程;Lu[16]受當前醫療健康和醫學發展的啟發,將因果強化學習與強化學習相結合,引入因果強化學習并強調其潛在的適用性。近年來,一系列與因果強化學習相關的研究相繼提出,需要對其發展和應用進行全面的綜述。本文致力于為讀者提供關于因果強化學習的概念、類別和實際問題的良好知識。 盡管已有相關綜述,如Grimbly等人對[17]因果多智能體強化學習進行了綜述;Bannon等人,[18]關于批量強化學習中的因果效應估計和策略外評估,本文考慮了但不限于多智能體或策略外評估的情況。最近,Kaddour等人,[19]在arXiv上上傳了一篇關于因果機器學習的綜述,其中包括一章關于因果強化學習的內容。他們根據因果關系可以帶來的不同強化學習問題總結了一些方法,例如因果匪類、基于模型的強化學習、off-policy策略評估等。這種分類方法可能不完整或不完整,從而遺漏了其他一些強化學習問題,例如多智能體強化學習[18]。本文只是但完整地為這些因果強化學習方法構建了一個分類框架。我們對這份調研綜述的貢獻如下:
**本文正式定義了因果強化學習,并首次從因果性的角度將現有方法分為兩類。**第一類是基于先驗因果信息,通常這樣的方法假設關于環境或任務的因果結構是由專家給出的先驗信息,而第二類是基于未知的因果信息,其中相對的因果信息必須為策略學習。對每個類別上的當前方法進行了全面的回顧,并有系統的描述(和草圖)。針對第一類,CRL方法充分利用了策略學習中的先驗因果信息,以提高樣本效率、因果解釋能力或泛化能力。對于因果信息未知的CRL,這些方法通常包含因果信息學習和策略學習兩個階段,迭代或依次進行。進一步分析和討論了CRL的應用、評估指標、開源以及未來方向。
因果強化學習
定義18(因果強化學習,CRL): CRL是一套算法,旨在將因果知識嵌入到RL中,以實現更高效的模型學習、策略評估或策略優化。它被形式化為元組(M, G),其中M代表RL模型設置,如MDP、POMDP、MAB等,G代表關于環境或任務的基于因果的信息,如因果結構、因果表示或特征、潛在混雜因素等。
根據因果信息是否由經驗提供,因果強化學習方法大致分為兩類:(i)基于已知或假設的因果信息的方法;(2)基于技術學習的未知因果信息的方法。因果信息主要包括因果結構、因果表示或因果特征、潛在混淆因素等。
CRL框架的示意圖如上圖所示,概述了規劃和因果啟發學習程序之間可能的算法聯系。因果關系啟發的學習可以發生在三個地方:在學習因果表示或抽象(箭頭a),學習動態因果模型(箭頭b),以及學習策略或值函數(箭頭e和f)。大多數CRL算法只實現與因果關系的可能聯系的子集,在數據效率、可解釋性、魯棒性或模型或策略的泛化方面享受潛在好處。例如,t時刻的所有狀態會影響(t + 1)時刻的所有狀態。對于離線策略的學習和評估,因果信息未知的CRL會評估不同行為的影響,而因果信息已知的CRL通常通過敏感性分析來研究混淆對策略的影響。傳統的強化學習不會對混淆效應進行建模。對于數據增強問題,經典RL有時基于基于模型的RL,而CRL基于結構因果模型。CRL在學習到這樣的模型后,可以進行反事實推理來實現數據增強。在泛化方面,經典RL試圖探索不變性,而CRL試圖利用因果信息來產生因果不變性,例如結構不變性、模型不變性等。在理論分析方面,經典強化學習通常關注收斂性問題,包括學習策略的樣本復雜度、后悔界或模型誤差;CRL關注的是收斂性,但關注的是因果信息,側重于因果結構的可識別性分析。
圖在表示關系數據(如化合物、蛋白質和社交網絡)方面具有卓越的能力。因此,圖級學習以一組圖作為輸入,已應用于許多任務,包括比較、回歸、分類等。傳統的圖學習方法往往依賴于手工設計的特征,如子結構。但是,雖然這些方法受益于良好的可解釋性,但它們往往遭受計算瓶頸,因為它們不能繞過圖同構問題。相反,深度學習通過自動提取特征并將圖解碼為低維表示,幫助圖級學習適應不斷增長的圖規模。**因此,這些深度圖學習方法取得了許多成功。然而,沒有一個全面的調研來回顧從傳統學習到深度學習方法的圖級學習。本文填補了這一空白,并將具有代表性的算法框架化為一個系統的分類,包括傳統學習、圖級深度神經網絡、圖級圖神經網絡和圖池化。為了確保一個徹底的全面的綜述,從四個不同的分支的開發方法之間的演變,交互和交流也被檢查。**接下來簡要回顧基準數據集、評估指標和常見的下游應用。該調研總結了13個必要研究的未來方向,這些研究將有助于克服這一蓬勃發展的領域面臨的挑戰。
1. 引言
對圖結構數據的研究始于18世紀的哥尼斯堡橋問題,即:“我們如何在哥尼斯堡市的7座橋中設計一條每座橋只穿過一次的路徑?”1741年,Euler將7座橋梁建模成一個圖,并證明在沒有重復路徑[1]的情況下,該圖是不能完全遍歷的。在圖中,節點表示橋梁之間的連接點,而邊表示橋梁本身。**從那時起,圖結構數據已經成為建模和探索世界不可或缺的一部分。在大量與圖相關的文獻中,圖級學習引起了相當大的關注。圖級學習是對由圖組成的數據集的分析。**例如,圖同構問題,即兩個成對圖是否同構的問題,自1942年首次提出以來吸引了大量的研究[2]-[4][5]。進一步,在2016年[6]提出一個擬多項式時間解之前,圖同構被認為是NP-immediate的候選對象。還研究了其他有重要價值的應用。例如,Wang et al.[7]采用分子圖,其中節點表示原子,邊表示化學鍵,并執行圖回歸作為預測分子特性的一種方法,以幫助發現更經濟的晶體。在另一項研究中,基于一系列蛋白質圖的圖生成任務用于生成具有特定功能的蛋白質圖,以支持藥物發現[8]。同樣,基于腦圖的圖分類具有將神經系統疾病的腦結構與健康個體[9]的腦結構區分開來的潛力。
**傳統的圖級學習主要依賴手工設計的特征來區分圖。然而,盡管手工特征賦予了傳統方法良好的可解釋性,但它們通常具有較高的計算復雜度,這是阻礙其部署的主要障礙。**該方法的復雜性在于:(1)大規模圖數據中手工特征通常過于稀疏;(2)大多數依賴于這些手工特征的圖級學習算法通常涉及圖同構問題。例如,一些傳統的圖分類方法是根據從圖數據集中分解出的一系列子結構對圖進行分類的,其主要問題是判斷是否存在同構子結構。然而,深度學習技術已經開啟了圖級學習的新時代。通過這些方法,可以以端到端的方式自動學習圖的非線性和特定任務的特征,這為最先進的性能帶來了新的基準。此外,深度神經網絡學習的高維表示可以支持不斷增長的圖數據規模。美中不足的是,深度學習的黑箱性質導致可信性下降,因此一個新的趨勢是通過傳統技術開發可靠的神經網絡。
**此外,要理解跨越傳統和深度學習的各種圖級學習技術,需要全面回顧大量的圖級學習文獻。有一些關于學習圖結構數據的調研。**然而,這些評論有兩個主要缺點。首先,現有的研究大多集中在探索單個圖中的節點/邊/子結構的文章,如網絡嵌入[10]、社區檢測[11]、[12]、異常檢測[13]和圖神經網絡[14]、[15];圖級學習被視為占用分段或更少部分的副產品。圖1說明了單個圖上的圖學習和圖級別學習之間的差異。其次,僅從單一角度研究圖級學習,如圖核[16]或圖池[17]。因此,這些調研并不全面,因為它們忽略了不同圖級學習技術之間的相互作用。據我們所知,這是對圖級學習的第一次全面調查,涵蓋了傳統方法和基于深度學習的技術。詳盡地描述了圖級學習不同時期的主流技術(見圖2),并進一步討論了它們之間的演變、相互作用和交流。因此,本調研的貢獻包括: * 全面的分類法:本文提出了圖級學習技術的全面分類法。具體來說,該分類涵蓋了通過傳統和深度學習方法進行的圖級學習。 * 深度回顧:總結了四類具有代表性的算法,進行了比較,并討論了現有方法的貢獻和局限性。 * 豐富的資源:這份調研為讀者提供了豐富的圖級學習資源,包括最先進算法的信息,不同領域的基準數據集,不同圖級學習任務的公平評估指標,以及實際的下游應用。本文的存儲庫可在 * 未來方向:本文確定了圖級學習領域的13個重要未來方向。
圖2:四種主流技術下的圖級學習時間線。
**本節提供圖級學習技術的分類。**它的類別包括傳統學習,圖級深度神經網絡(GL-DNNs),圖級圖神經網絡(GL-GNNs)和圖池化。圖3中的分類樹描述了圖級學習的這四個分支,并突出了所選算法。接下來簡要介紹每一類。 A. 傳統的學習:
在深度學習技術取得巨大成功之前,傳統的學習形式曾經是圖級學習的主流。傳統的學習方法大多依賴手工特征來描述圖,如隨機游走序列[16]。給定確定性的圖描述,使用現成的機器學習模型以非端到端的方式執行下游任務,如圖分類。即使在今天,傳統方法也比深度學習技術具有一些優勢,例如更好的可解釋性和更好的建模不規則結構的能力。出于這些原因,傳統方法仍然為圖級學習社區提供了有價值的見解。
B.圖級深度神經網絡(GL-DNNs):
傳統方法不僅僅包括經典方法。它們還包括對深度學習技術的初步探索,如RNN、CNN和CapsNet。這三種類型的深度神經網絡最初并不是為了學習像圖這樣的非歐氏數據而設計的。因此,GL-DNNs的一個重要問題是如何使這些深度神經網絡學習大小不一且鄰域結構不規則的圖結構數據。
C.圖級圖神經網絡(GL-GNNs):
GL-GNNs使用專門為圖結構數據提出的圖卷積操作作為執行圖級學習的主干。大多數GL-GNN使用圖卷積MPNNs框架,因為它們簡單,易于理解,并且具有線性復雜度。GL-GNNs凝聚了圖級學習最豐富的成果。此外,一些從業者將基于MPNN的GL-GNN的優勢與其他技術,特別是傳統學習技術相結合,以提高圖級學習。
D .圖池化:
圖池化是一種縮小圖規模的技術,通過將一系列節點壓縮為一個超級節點來產生圖的緊湊表示。例如,圖池化可以通過求和或平均操作將圖的所有節點嵌入全局聚合到一個最終超級節點中。同時,圖池化可以逐層減小圖的大小。這種多層縮小過程傾向于在每一層聚集同一層次結構(例如,社區)中的節點。
來自東北大學最新《大規模圖神經網絡系統》綜述論文
圖神經網絡(GNN)是一類基于深度學習的處理圖域信息的方法, 它通過將圖廣播操作和深度學習算法結合, 可以讓圖的結構信息和頂點屬性信息都參與到學習中, 在頂點分類、圖分類、鏈接預測等應用中表現出良好的效果和可解釋性, 已成為一種廣泛應用的圖分析方法. 然而現有主流的深度學習框架(如TensorFlow、PyTorch等)沒有為圖神經網絡計算提供高效的存儲支持和圖上的消息傳遞支持, 這限制了圖神經網絡算法在大規模圖數據上的應用. 目前已有諸多工作針對圖結構的數據特點和圖神經網絡的計算特點, 探索了大規模圖神經網絡系統的設計和實現方案. 首先對圖神經網絡的發展進行簡要概述, 總結了設計圖神經網絡系統需要面對的挑戰; 隨后對目前圖神經網絡系統的工作進行介紹, 從系統架構、編程模型、消息傳遞優化、圖分區策略、通信優化等多個方面對系統進行分析; 最后使用部分已開源的圖神經網絡系統進行實驗評估, 從精確度、性能、擴展性等多個方面驗證這些系統的有效性.
圖神經網絡概述
深度學習在對象檢測[1,2]、機器翻譯[3,4]、語音識別[5]、物理系統[6,7]等領域取得了革命性的成功, 推動了對模 式識別和數據挖掘的研究. 現有的深度學習方法能夠處理歐式空間表示下的規則數據, 例如圖像數據可以表示為 歐幾里得空間中的規則網絡, 而現實中的很多應用的數據以圖的形式來表示. 比如在社交網絡[8]中, 可以通過圖來 表示對象之間的關聯關系, 從而能夠進行社區發現、聚類[9]等算法. 在生物領域[10] , 可以通過圖來表示蛋白質分子 之間的關系, 從而能夠對蛋白質進行分類. 在引文網絡[11]領域, 可以用圖來表示論文之間的引用關系, 從而能夠對論文按領域進行分組. 在電子商務領域, 可以用圖來表示用戶和商品之間的交互關系, 從而能夠對用戶進行商品的 推薦. 由于圖數據的不規則性和稀疏性, 每個頂點可能具有不同數量的鄰居, 并且圖數據之間具有依賴性, 圖中每個頂點的計算依賴于其他的頂點, 所以導致很多深度學習方法無法直接應用在圖數據中. 例如, 卷積只能對圖像或文本這樣的歐幾里德數據進行操作, 無法直接應用于圖數據, 限制了深度學習方法在圖領域的發展.
隨著圖領域深度學習方法逐漸受到廣泛關注, 近些年出現了很多圖神經網絡算法, 這些方法通過在傳統深度 學習模型中添加圖操作, 應用圖的結構信息和屬性信息, 來處理圖數據的復雜性, 成為解決圖學習問題的有效方 法. 比較典型的工作有 Structure2Vec[12]、GCN[13]、FastGCN[14]、AS-GCN[15]、GraphSAGE[16]等.
圖神經網絡算法將傳統深度學習的方法, 如卷積, 擴展到了圖數據領域, 并結合數據傳播的思想形成了在圖上的深度學習算法, 其 在社交網絡、推薦系統[17]、知識圖譜[18]、鏈接預測[19]等領域都取得了良好的效果. 圖神經網絡受到廣泛關注的原因如下: 首先, 現有標準神經網絡無法正確處理圖數據的輸入, 因為其按照特定 順序處理節點特征, 而圖中的頂點沒有自然順序. 圖神經網絡算法采用在頂點上傳播信息的計算方式, 忽略頂點的 輸入順序解決了這個問題. 第二, 在標準神經網絡中, 圖中頂點的依賴關系僅能作為頂點特征輸入, 而圖神經網絡 算法根據圖中頂點的依賴關系進行信息傳播, 保留了圖結構的信息, 為下游深度學習任務提供了更加完整的信息. 第三, 推理是高級人工智能的一個重要研究課題, 圖神經網絡強大的表示能力, 為進一步生成強大的神經模型提供 了基礎.
現有的深度學習框架如 TensorFlow[20]、PyTorch[21]、MXNet[22]以及 CNTK[23] , 和圖處理框架 PowerLyra[24]、 PowerGraph[25]、Garaph[26]、Pregel[27]、TuX2[28]都不能很好地支持圖神經網絡的計算, 這阻礙了圖神經網絡的進一 步發展, 也限制了圖神經網絡在大規模數據中的應用. 因此突破現有框架限制, 開發專用于圖神經網絡訓練的系 統, 對于充分發揮圖神經網絡的潛力十分重要.
本文首先分析圖神經網絡算法的計算模式, 提出大規模圖神經系統訓練存在的挑戰, 并對現有系統進行介紹. 然后從系統架構、通信優化等多個維度對這些系統進行詳細的分析和對比, 對圖神經網絡系統的不同優化技術進 行總結和分析, 并對目前已經開源的圖神經網絡系統設計實驗, 從多個方面測評系統的性能, 驗證系統有效性.
大規模圖神經網絡訓練的挑戰
隨著圖神經網絡在不同領域的應用越來越廣, 對訓練圖神經網絡系統的性能要求也越來越高. 結合對圖嵌入[42-44]以及圖神經網絡[45, 46]的分析, 本文對設計開發神經網絡訓練系統存在的挑戰進行如下總結.
(1) 現有深度學習系統不能很好地抽象圖傳播過程. 現有的深度學習系統處理的是規則數據, 規則數據中每個樣本的計算圖是獨立的, 與其他樣本無關, 而圖神經網絡是將深度神經網絡和迭代圖傳播結合起來進行計算的, 圖數據的每個樣本(即圖頂點)之間具有依賴性, 所以現有系統不能自然地表達和有效地支持圖傳播模型. 如何突破現有框架的局限, 設計一種適用于圖神經網絡的系統架構是發展圖神經網絡的重要問題;
(2) 訓練大規模圖神經網絡的計算、存儲復雜度高. 真實世界中的尺寸都非常大, 而且由于頂點之間具有復雜的依賴性, 隨著圖神經網絡層數的增加, 計算成本和內存空間需求呈指數級增長. 例如Facebook的社交網絡圖包含超過20億個頂點和1萬億條邊, 這種規模的圖在訓練時可能會產生100 TB的數據. 所以針對大圖的訓練, 如何設計計算和存儲策略以利用有限的資源來使系統達到理想的性能也是發展圖神經網絡系統的一大挑戰;
(3) 圖計算局部性差導致系統開銷問題. 真實世界圖的稀疏性會導致非常差的空間局部性, 在單機系統中這會導致Cache命中率降低. 而在分布式系統中, 這會導致頻繁的跨節點訪問, 進而產生大量的消息傳遞開銷. 所以如何針對圖的特殊性質減少系統開銷是提高系統性能的一大挑戰;
(4) 圖的冪律分布導致分布式計算負載均衡問題. 對于具有數億個頂點的大型圖, 通常需要對圖進行分布式處理, 圖神經網絡算法不同于傳統的圖算法, 平衡的圖分區不僅依賴于分區內的頂點數量, 還依賴于分區內頂點鄰居的數量, 多層圖神經網絡模型中不同頂點多階鄰居的數量可能相差極大, 并且這些分區之間需要頻繁的數據交換, 如何對圖數據進行合理的分區來保證分布式訓練的性能是對于分布式系統的重大挑戰;
(5) 異構計算架構中的任務劃分和負載調度的合理性問題. GPU的廣泛應用為訓練深度學習模型帶來了很多機會和挑戰. 在利用GPU加速神經網絡的訓練時, 通常將數據存儲在主機內存中, 在計算時需要將數據傳輸到GPU, 由于圖神經網絡算法在反向傳播階段的復雜性, 需要頻繁的在主機和GPU之間進行數據傳輸, 如何設計合理的調度方案來最大程度地減少數據傳輸成本也是提高系統性能的一大挑戰.
為了應對這些挑戰, 出現了很多針對圖神經網絡的訓練框架, 其中單機系統如PyTorch Geomertic、DGL、NeuGraph. 圖神經網絡通常處理非常大且不規則的圖, 這些大圖無法存儲在單個設備中, 因此必須以分布式方式進行分區和處理, 其中分布式圖神經網絡框架如Euler、AliGraph、Roc、AGL. 接下來本文將介紹若干典型的單機圖神經網絡系統以及分布式圖神經網絡系統.
圖神經網絡系統介紹
圖神經網絡算法將深度神經網絡的運算(如卷積、梯度計算)與迭代圖傳播結合在一起: 每個頂點的特征都是由其鄰居頂點的特征結合一組深度神經網絡來計算. 但是, 現有的深度學習框架不能擴展和執行圖傳播模型, 因此缺乏高效訓練圖神經網絡的能力, 并且現有框架一般采用數據/模型并行來分布式訓練深度神經網絡, 這種并行計算方法難以直接應用于圖神經網絡, 因此限制了訓練大規模圖神經網絡的能力. 而現有的圖處理系統雖然能夠表示迭代圖傳播模型, 并能有效支持大規模圖的迭代計算, 但是缺乏支持神經網絡計算的關鍵能力, 如張量抽象、自動微分等. 因此, 為了支持圖神經網絡在大規模圖上的應用, 以及對更復雜圖神經網絡結構的探索, 開發針對圖神經網絡的訓練系統是十分有必要的.
目前具有代表性的圖神經網絡框架: DGL[47]、PyTorch Geometric[48]、NeuGraph[49]、EnGN[50]、Euler[51]、PSGraph[52]、AliGraph[53]、Roc[54]、AGL[55]、PGL[56]. DGL[47]是易于使用, 高性能且可擴展的Python庫, 用于圖結構的深度學習, 能夠與主流的深度學習框架集成, 例如Tensorflow[20]、PyTorch[21]、MXNet[22]. PyTorch Geometric[48]是基于PyTorch構建的深度學習庫, 用于處理非結構化數據的深度學習. NeuGraph[49]是一種將數據流系統和圖處理系統結合起來訓練圖神經網絡的框架, 它構建在現有的數據流引擎之上, 使用Python和C++作為開發語言. EnGN[50]是一種以邊為中心, 專門用于大規模圖神經網絡訓練的加速器. Euler[51]與PSGraph[52]是一個與深度學習工具集成的大規模分布式圖學習框架, 支持用戶在數十億點數百億邊的圖上進行模型訓練. AliGraph[53]是由阿里巴巴團隊開發的采樣建模訓練一體化的圖神經網絡平臺. Roc[54]是一種用于快速圖神經網絡訓練的分布式多GPU框架. AGL[55]是用于工業用途圖學習的集成系統, 利用傳統基礎架構(MapReduce、參數服務器[57])實現了容錯性和一致性. PGL (paddle graph learning)[56]是由百度開發的基于PaddlePaddle的高效靈活的圖學習框架.
圖神經網絡系統總結和分析
本節從系統架構、處理模型、圖分區策略、通信優化策略、以及社區活躍度與系統易用性方面, 對現有圖神經網絡系統進行分析和對比, 并從多個維度對系統的特點進行總結, 以表格的形式清晰的展示系統的共性與不同, 來為研究人員提供有效參考.
(1) 系統架構. DGL和PyTorch Geometric都是結合現有的深度學習框架來實現的, 并且針對圖神經網絡的特點做了多種優化, 達到了很好的性能. 結合現有深度學習框架來實現的系統, 更加方便用戶使用, 能夠幫助其更快地實現圖神經網絡模型. 但結合現有深度學習框架來實現的系統, 在針對圖操作的優化上有很多局限性. NeuGraph采用了一種新的架構, 將圖模型和數據流模型結合起來, 以支持高效的圖神經網絡訓練, 這種架構既彌補了現有數據流引擎不能有效地支持圖計算的缺點, 又彌補了圖引擎不能支持數據流編程模型的缺點. EnGN在統一的處理模型基礎上, 開發了一個定制的EnGN加速器, 它集成了一個神經圖處理單元(NGPU), 可以在統一的體系結構中執行特征提取, 聚合和更新操作. EnGN的專用加速器突破了硬件結構的限制, 相比于其他系統配備的多個CPU或GPU, 大大降低了成本和能源開銷. AliGraph、Euler和PGL的架構類似, 都采用分層架構, 構建于現有數據流框架之上, 并且都構建在CPU平臺上. Roc將圖神經網絡的計算分布在多個計算節點上, 每個計算節點可以包含多個GPU, 每個計算節點在子圖上執行圖神經網絡的訓練, 并與CPU通信來獲得輸入張量并保存中間結果. Roc采用分布式多GPU的架構不僅解決了單節點系統對于大規模圖的限制, 并且比基于CPU的系統更高效. AGL、PSGraph都是利用現有大數據處理系統和參數服務器的并行體系結構來組建的基于CPU的分布式圖神經網絡訓練框架, 這些系統具有良好的容錯性和可伸縮性.
(2) 處理模型. DGL和PyTorch Geometric通過使用面向圖的消息傳遞接口包裝深度學習系統, 來支持針對圖神經網絡的編程. 這種消息傳遞模型很好地表示了圖上的數據流動, 整個模型分為兩步. 第1步: “消息”生成操作, 這個操作定義在每個邊上, 通過將邊的特征與兩端頂點特征組合為每一條邊生成一條“消息”. 第2步: 更新操作, 定義在每個頂點上, 通過匯總頂點入邊傳入的消息來更新頂點特征. 通過系統提供的消息傳遞接口, 用戶可以快速實現圖神經網絡的原型制作. PGL也采用消息傳遞范式構建圖神經網絡的接口, 并提供多種聚合方法, 提高了并行處理效率. NeuGraph提出了一種新的處理模型SAGA-NN, 提高了在頂點和邊上執行批量操作的靈活性, 提供了在圖計算和數據流調度中實現優化的機會, 提高了系統性能. EnGN提供一種以邊為中心的處理模型, 將圖神經網絡的計算抽象為特征提取, 聚合和更新3個階段. EnGN與其他3個系統不同, 在處理模型基礎上定制了針對圖神經網絡的加速器, 不依賴于現有的深度學習系統, 并擁有獨特的數據流處理方法. EnGN優化了頂點數據和邊數據移動的內存訪問模式. 對于大圖中的源頂點數據訪問, 采用圖切片技術, 并確保對源節點的訪問僅引起對連續內存地址的訪問. 對于聚合和更新階段中的隨機目標頂點訪問, EnGN利用哈希邊數據布局和多級緩存方法來避免寫沖突并提高片上緩沖器中的數據命中率.
(3) 圖分區策略. 平衡的圖分區是實現分布式圖神經網絡系統的關鍵之一. Euler采用簡單的哈希方法將圖的頂點進行分片, 這種分片方式使各個節點擁有目標頂點的數量基本一致, 但是在每個頂點的子圖中擁有的鄰居數量是不同的, 所以每個節點的計算負載并不均衡. AliGraph則提供了多種內置的圖分區算法供用戶選擇, 比如適合處理稀疏圖的METIS方法, 適合稠密圖的點割和邊割方法, 這種方法雖然為用戶提供了多種選擇, 但需要用戶自己去判斷使用哪種分區方式, 給用戶造成很大不便. Roc采用一種在線線性回歸模型來優化圖分區. 這種基于線性回歸的圖分區方法在圖神經網絡系統中能夠達到比傳統分區更好的性能.
(4) 通信優化策略. 針對通信開銷影響分布式系統性能的問題, Euler采用的是緩存對應頂點k階內的鄰居頂點信息, 這種方式雖然直接避免了計算節點之間的通信, 但是造成了很嚴重的內存浪費, 并且在冪律分布的圖中還會使各個計算節點之間負載不均衡. AGL采用的策略和Euler相同, 但是AGL提出了重新索引的策略來均衡負載. AliGraph提出了一種緩存重要頂點的鄰居的方法來降低通信開銷, 同時提出了一種對頂點重要性的度量標準, 既能有效減低通信開銷, 又防止產生巨大的存儲成本, 避免資源浪費. ROC引入了代價模型, 可以最大程度地減少CPU和GPU之間的數據傳輸. 這種動態的方法突破了手動優化的局限, 將影響通信的多種因素綜合考慮, 從而更好的降低通信成本, 提高系統性能. PGL的分布式參數服務器提供了一種高效的參數更新策略: GeoSSD, 在全異步的條件下進行參數更新, 并重疊模型訓練與節點通信, 在保證模型效果的前提下提升了訓練效率.
(5)社區活躍度與系統易用性. PyTorch Geometric、DGL、AliGraph、Euler、PSGraph、PGL為開源系統, 這里的社區活躍度以GitHub上討論區的數量為標準, 這其中最活躍的社區為PyTorch Geometric. 在系統易用性方面, 從配置文件的完整度、對其他系統的依賴度、用戶使用的方便度多個角度綜合考量, 這其中DGL和PyTorch Geometric的易用性排在前列, 而Euler與PSGraph雖然給出了配置文件, 但在配置系統時, 需要配置其他多個依賴包, 并且數據處理過程繁瑣, 不易用戶使用. 本文為系統的社區活躍度和易用性給出星級評價, 星級越高, 系統在這兩方面表現越好, 其中空白符號表示系統未開源.
本文對目前的圖神經網絡系統從多個維度進行了綜合分析, 對這些系統的共同特性進行提取, 并總結歸納, 見表1.
總結
本文首先簡要介紹了圖神經網絡的發展, 并對典型的圖神經網絡算法的計算模式進行了介紹, 并簡要分析了圖神經網絡訓練的難點. 然后本文對現有圖神經網絡系統做了詳細描述, 并對這些系統從系統架構、處理模型以及優化策略和系統易用性等多個角度進行分析和總結, 總結了針對圖神經網絡系統的多種優化技術, 最后使用目前可用的開源系統驗證了現有分布式圖神經網絡系統的有效性. 經過論文分析與總結, 發現現有圖神經網絡系統仍存在以下問題, 同時也是未來的研究方向: 首先, 目前系統所采用的架構仍依賴于現有數據流框架, 現有數據流框架針對深度神經網絡的運算做了一系列優化, 但缺少針對圖操作的優化尤其是高效分布式圖操作, 與這些框架結合起來搭建系統, 制約了分布式圖神經網絡系統的進一步發展. 第二, 目前系統所采用的小批量并行計算方式, 并不適用于基于譜方法的圖卷積網絡, 本文通過實驗發現, 采用這種并行計算方式會對基于譜方法圖卷積網絡的訓練精度產生影響. 第三, 圖的分區操作和通信管理是影響系統性能的關鍵因素, 盡管目前的系統已經在這兩方面提出多種優化, 減少了內存消耗和通信開銷, 但這兩者仍存在非常大的優化空間.
社區揭示了不同于網絡中其他社區成員的特征和聯系。社區檢測在網絡分析中具有重要意義。除了經典的譜聚類和統計推理方法,我們注意到近年來用于社區檢測的深度學習技術在處理高維網絡數據方面的優勢有了顯著的發展。因此,通過深度學習對社區檢測的最新進展進行全面概述,對學者和從業者都是及時的。本文設計并提出了一種新的分類方法,包括基于深度神經網絡的深度學習模型、深度非負矩陣分解和深度稀疏濾波。主要的類別,即深度神經網絡,進一步分為卷積網絡,圖注意力網絡,生成對抗網絡和自動編碼器。綜述還總結了流行的基準數據集、模型評估指標和開源實現,以解決實驗設置。然后討論了社區檢測在各個領域的實際應用,并提出了實現方案。最后,通過提出這一快速發展的深度學習領域中具有挑戰性的課題,我們概述了未來的發展方向。
//www.zhuanzhi.ai/paper/eb70a346cb2540dab57be737828445c6
引言
早在20世紀20年代,社會學和社會人類學就對社區進行了研究。然而,直到21世紀之后,研究人員才開始利用強大的數學工具和大規模數據操作來檢測社區,以解決具有挑戰性的問題[2]。自2002年[3]以來,Girvan和Newman將圖劃分問題引起了更廣泛的關注。在過去的10年里,計算機科學研究者廣泛研究了基于網絡拓撲結構[5]-[8]和實體語義信息[9]-[11]、靜態網絡[12]-[14]、小型網絡和大型網絡[15]-[17]的社區檢測問題[4]。越來越多的基于圖的方法被開發出來用于檢測具有復雜數據結構[18],[19]環境中的社區。通過社區檢測,可以詳細分析網絡中社區的動態和影響,如謠言傳播、病毒爆發、腫瘤進化等。
社區的存在推動了社區檢測研究的發展,是一個越來越具有現實意義的研究領域。俗話說,物以類聚,人以群分。根據六度分離理論,世界上任何一個人都可以通過六個熟人認識其他人[21]。事實上,我們的世界是一個由一系列社區組成的巨大網絡。例如,通過檢測社交網絡[22]-[24]中的社區,如圖1所示,平臺贊助商可以向目標用戶推廣他們的產品。在引文網絡[25]中,社區檢測決定了研究主題的重要性、關聯性、演化和識別研究趨勢。在代謝網絡[26]、[27]和蛋白質-蛋白質相互作用(PPI)網絡[28]中,社區檢測揭示了具有相似生物學功能的代謝和蛋白質。同樣,腦網絡[19]、[29]中的社區檢測反映了腦區域的功能和解剖分離。
許多傳統的技術,如譜聚類[30],[31]和統計推理[32]-[35],被用于小型網絡和簡單的場景。然而,由于它們的計算和空間成本巨大,它們無法擴展到大型網絡或具有高維特征的網絡。現實網絡中非線性結構信息豐富,使得傳統模型在實際應用中不太適用。因此,需要更強大的具有良好計算性能的技術。目前,深度學習提供了最靈活的解決方案,因為深度學習模型: (1) 學習非線性網絡屬性,如節點之間的關系,(2) 提供一個低維的網絡表示,保持復雜的網絡結構,(3) 提高了從各種信息中檢測社區的性能。因此,深度學習用于社區檢測是一種新的趨勢,需要及時全面的調查。
據我們所知,本文是第一次全面調研深度學習在社區檢測方面的貢獻。以往的研究主要集中在傳統的社區檢測上,回顧了其在發現網絡固有模式和功能[36]、[37]方面的重要影響。這篇論文綜述了一些具體的技術,但不限于: 基于隨機塊模型(sms)的部分檢測[38],標簽傳播算法(LPAs)[39],[40],以及單目標和多目標優化的進化計算[13],[14]。在網絡類型方面,研究人員綜述了動態網絡[12]、有向網絡[41]和多層網絡[5]中的社區檢測方法。此外,[6],[7]還回顧了一系列關于不相交和重疊的社區缺陷的概述。圍繞應用場景,以往的論文綜述了社交網絡[9]、[42]中的社區檢測技術。
本文旨在幫助研究人員和從業者從以下幾個方面了解社區檢測領域的過去、現在和未來趨勢:
系統性分類和綜合評價。我們為此項綜述提出了一個新的系統分類(見圖3)。對于每個類別,我們回顧、總結和比較代表性的工作。我們還簡要介紹了現實世界中的社區檢測應用。這些場景為未來的社區檢測研究和實踐提供了見解。
豐富的資源和高影響力的參考資料。該綜述不僅是文獻綜述,而且是基準數據集、評估指標、開源實現和實際應用的資源集合。我們在最新的高影響力國際會議和高質量同行評審期刊上廣泛調查社區檢測出版物,涵蓋人工智能、機器學習、數據挖掘和數據發現等領域。
未來的發展方向。由于深度學習是一個新的研究趨勢,我們討論了當前的局限性,關鍵的挑戰和開放的問題,為未來的方向。
社區檢測在網絡分析和數據挖掘中具有重要意義。圖4展示了傳統學習方法和深度學習方法的發展。傳統的方法是在網絡結構上探索社區。這七種方法(圖3左圖)僅以一種簡單的方式捕捉淺連接。傳統方法的檢測結果往往是次優的。我們將在本節簡要回顧它們的代表性方法。深度學習方法(圖3右圖)揭示了深度網絡信息,復雜關系,處理高維數據。
本文提出了一種深度社區檢測的分類方法。分類法將方法歸納為六類: 卷積網絡、圖注意力網絡(GAT)、生成對抗網絡(GAN)、自動編碼器(AE)、深度非負矩陣分解(DNMF)和基于深度稀疏濾波(DSF)的深度社區檢測方法。卷積網絡包括卷積神經網絡(CNN)和圖卷積網絡(GCN)。AE又分為堆疊型AE、稀疏型AE、去噪型AE、圖卷積型AE、圖關注型AE和變分型AE (VAE)。
知識圖譜補全是一類重要的問題。近年來基于圖神經網絡的知識圖譜表示得到了很多關注。這邊綜述論文總結了圖神經網絡知識圖譜補全的工作,值得查看!
摘要:知識圖譜在諸如回答問題和信息檢索等各種下游任務中越來越流行。然而,知識圖譜往往不完備,從而導致性能不佳。因此,人們對知識庫補全的任務很感興趣。最近,圖神經網絡被用來捕獲固有地存儲在這些知識圖譜中的結構信息,并被證明可以跨各種數據集實現SOTA性能。在這次綜述中,我們了解所提出的方法的各種優勢和弱點,并試圖在這一領域發現新的令人興奮的研究問題,需要進一步的調研。
知識庫是以關系三元組形式的事實信息的集合。每個關系三元組可以表示為(e1,r,e2),其中e1和e2是知識庫中的實體,r是e1和e2之間的關系。最受歡迎的知識庫表示方式是多關系圖,每個三元組(r e1, e2)是表示為有向邊從e1, e2與標簽r。知識圖譜被用于各種下游任務。
然而,由于知識庫是從文本中自動挖掘來填充的,它們通常是不完整的,因為不可能手動編寫所有事實,而且在提取過程中經常會出現不準確的情況。這種不準確性會導致各種下游任務的性能下降。因此,大量工作開發一種有效的工具來完成知識庫(KBs)方面,它可以在不需要額外知識的情況下自動添加新的事實。這個任務被稱為知識庫補全(或鏈接預測),其目標是解決諸如(e1,r,?)這樣的查詢。
第一種實現高效知識庫補全的方法是像TransE (Bordes et al.(2013))和TransH (Wang et al.(2014))這樣的加法模型,其中關系被解釋為隱藏實體表示的簡單翻譯。然后觀察到,諸如Distmult (Yang et al.(2015))和Complex (Trouillon et al.(2016))等乘法模型優于這些簡單的相加模型。與平移不同,旋轉(Sun等人(2019a))將關系定義為簡單的旋轉,這樣頭部實體就可以在復雜的嵌入空間中旋轉來匹配尾部實體,這已經被證明滿足了很多有用的語義屬性,比如關系的組合性。最近,引入了表達性更強的基于神經網絡的方法(如ConvE (Dettmers等人(2018))和ConvKB(Nguyen等人(2018)),其中評分函數與模型一起學習。然而,所有這些模型都獨立地處理每個三元組。因此,這些方法不能捕獲語義豐富的鄰域,從而產生低質量的嵌入。
圖已被廣泛用于可視化真實世界的數據。在將ML技術應用于圖像和文本方面已經取得了巨大進展,其中一些已成功應用于圖形(如Kipf和Welling(2017)、Hamilton等人(2017)、Velickovic等人(2018)。基于該方法的啟發,許多基于圖神經網絡的方法被提出用于KBC任務中獲取知識圖的鄰域。在這次調查中,我們的目的是研究這些工作。
近年來,人們對學習圖結構數據表示的興趣大增。基于標記數據的可用性,圖表示學習方法一般分為三大類。第一種是網絡嵌入(如淺層圖嵌入或圖自動編碼器),它側重于學習關系結構的無監督表示。第二種是圖正則化神經網絡,它利用圖來增加半監督學習的正則化目標的神經網絡損失。第三種是圖神經網絡,目的是學習具有任意結構的離散拓撲上的可微函數。然而,盡管這些領域很受歡迎,但在統一這三種范式方面的工作卻少得驚人。在這里,我們的目標是彌合圖神經網絡、網絡嵌入和圖正則化模型之間的差距。我們提出了圖結構數據表示學習方法的一個綜合分類,旨在統一幾個不同的工作主體。具體來說,我們提出了一個圖編碼解碼器模型(GRAPHEDM),它將目前流行的圖半監督學習算法(如GraphSage、Graph Convolutional Networks、Graph Attention Networks)和圖表示的非監督學習(如DeepWalk、node2vec等)歸納為一個統一的方法。為了說明這種方法的一般性,我們將30多個現有方法放入這個框架中。我們相信,這種統一的觀點既為理解這些方法背后的直覺提供了堅實的基礎,也使該領域的未來研究成為可能。
概述
學習復雜結構化數據的表示是一項具有挑戰性的任務。在過去的十年中,針對特定類型的結構化數據開發了許多成功的模型,包括定義在離散歐幾里德域上的數據。例如,序列數據,如文本或視頻,可以通過遞歸神經網絡建模,它可以捕捉序列信息,產生高效的表示,如機器翻譯和語音識別任務。還有卷積神經網絡(convolutional neural networks, CNNs),它根據移位不變性等結構先驗參數化神經網絡,在圖像分類或語音識別等模式識別任務中取得了前所未有的表現。這些主要的成功僅限于具有簡單關系結構的特定類型的數據(例如,順序數據或遵循規則模式的數據)。
在許多設置中,數據幾乎不是規則的: 通常會出現復雜的關系結構,從該結構中提取信息是理解對象之間如何交互的關鍵。圖是一種通用的數據結構,它可以表示復雜的關系數據(由節點和邊組成),并出現在多個領域,如社交網絡、計算化學[41]、生物學[105]、推薦系統[64]、半監督學習[39]等。對于圖結構的數據來說,將CNNs泛化為圖并非易事,定義具有強結構先驗的網絡是一項挑戰,因為結構可以是任意的,并且可以在不同的圖甚至同一圖中的不同節點之間發生顯著變化。特別是,像卷積這樣的操作不能直接應用于不規則的圖域。例如,在圖像中,每個像素具有相同的鄰域結構,允許在圖像中的多個位置應用相同的過濾器權重。然而,在圖中,我們不能定義節點的順序,因為每個節點可能具有不同的鄰域結構(圖1)。此外,歐幾里德卷積強烈依賴于幾何先驗(如移位不變性),這些先驗不能推廣到非歐幾里德域(如平移可能甚至不能在非歐幾里德域上定義)。
這些挑戰導致了幾何深度學習(GDL)研究的發展,旨在將深度學習技術應用于非歐幾里德數據。特別是,考慮到圖在現實世界應用中的廣泛流行,人們對將機器學習方法應用于圖結構數據的興趣激增。其中,圖表示學習(GRL)方法旨在學習圖結構數據的低維連續向量表示,也稱為嵌入。
廣義上講,GRL可以分為兩類學習問題,非監督GRL和監督(或半監督)GRL。第一個系列的目標是學習保持輸入圖結構的低維歐幾里德表示。第二系列也學習低維歐幾里德表示,但為一個特定的下游預測任務,如節點或圖分類。與非監督設置不同,在非監督設置中輸入通常是圖結構,監督設置中的輸入通常由圖上定義的不同信號組成,通常稱為節點特征。此外,底層的離散圖域可以是固定的,這是直推學習設置(例如,預測一個大型社交網絡中的用戶屬性),但也可以在歸納性學習設置中發生變化(例如,預測分子屬性,其中每個分子都是一個圖)。最后,請注意,雖然大多數有監督和無監督的方法學習歐幾里德向量空間中的表示,最近有興趣的非歐幾里德表示學習,其目的是學習非歐幾里德嵌入空間,如雙曲空間或球面空間。這項工作的主要動機是使用一個連續的嵌入空間,它類似于它試圖嵌入的輸入數據的底層離散結構(例如,雙曲空間是樹的連續版本[99])。
鑒于圖表示學習領域的發展速度令人印象深刻,我們認為在一個統一的、可理解的框架中總結和描述所有方法是很重要的。本次綜述的目的是為圖結構數據的表示學習方法提供一個統一的視圖,以便更好地理解在深度學習模型中利用圖結構的不同方法。
目前已有大量的圖表示學習綜述。首先,有一些研究覆蓋了淺層網絡嵌入和自動編碼技術,我們參考[18,24,46,51,122]這些方法的詳細概述。其次,Bronstein等人的[15]也給出了非歐幾里德數據(如圖或流形)的深度學習模型的廣泛概述。第三,最近的一些研究[8,116,124,126]涵蓋了將深度學習應用到圖數據的方法,包括圖數據神經網絡。這些調查大多集中在圖形表示學習的一個特定子領域,而沒有在每個子領域之間建立聯系。
在這項工作中,我們擴展了Hamilton等人提出的編碼-解碼器框架,并介紹了一個通用的框架,圖編碼解碼器模型(GRAPHEDM),它允許我們將現有的工作分為四大類: (i)淺嵌入方法,(ii)自動編碼方法,(iii) 圖正則化方法,和(iv) 圖神經網絡(GNNs)。此外,我們還介紹了一個圖卷積框架(GCF),專門用于描述基于卷積的GNN,該框架在廣泛的應用中實現了最先進的性能。這使我們能夠分析和比較各種GNN,從在Graph Fourier域中操作的方法到將self-attention作為鄰域聚合函數的方法[111]。我們希望這種近期工作的統一形式將幫助讀者深入了解圖的各種學習方法,從而推斷出相似性、差異性,并指出潛在的擴展和限制。盡管如此,我們對前幾次綜述的貢獻有三個方面
我們介紹了一個通用的框架,即GRAPHEDM,來描述一系列廣泛的有監督和無監督的方法,這些方法對圖形結構數據進行操作,即淺層嵌入方法、圖形正則化方法、圖形自動編碼方法和圖形神經網絡。
我們的綜述是第一次嘗試從同一角度統一和查看這些不同的工作線,我們提供了一個通用分類(圖3)來理解這些方法之間的差異和相似之處。特別是,這種分類封裝了30多個現有的GRL方法。在一個全面的分類中描述這些方法,可以讓我們了解這些方法究竟有何不同。
我們為GRL發布了一個開源庫,其中包括最先進的GRL方法和重要的圖形應用程序,包括節點分類和鏈接預測。我們的實現可以在//github.com/google/gcnn-survey-paper上找到。