亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

題目: 屬性異質信息網絡上的半監督雙聚類

期刊: Information Processing & Management (Volume 57, Issue 6)

論文代碼: //github.com/yuduo93/SCCAIN

異質信息網絡上的節點聚類被用于許多實際應用。早先的方法獨立地針對指定類型的節點進行結構相似性度量而忽視了不同類型節點之間的關聯關系。本文研究同時聚合不同類型節點的問題,其目的是挖掘異質節點之間的潛在關聯,并同時針對不同類型的節點進行聚類劃分。該問題主要面臨兩個方面的挑戰:1. 節點之間的相似性/相關性不僅和結構信息相關,同時也和離散/連續的節點屬性相關;2. 聚類和相似性度量往往是相互促進的。為解決以上問題,本文首先利用多條元路徑和節點屬性,設計了一種融合結構和屬性的可學習的整體相關性度量方法。繼而,本文提出了屬性異質網絡半監督雙聚類方法SCCAIN,基于約束的正交非負矩陣三分解對不同類型的節點同時進行聚類。最后,我們設計了一種端到端的優化框架,可以聯合優化相關性度量和雙聚類。在三個真實數據上的實驗驗證了模型的有效性。

付費5元查看完整內容

相關內容

異質信息網絡是一種信息網絡,包含了節點和邊,并且該節點和邊具有一種或多種類型,異質信息網絡包含了更更豐富的語義信息。

信息網絡被定義為一個有向網絡圖G=(V,E),其中,V是所有實體結點的集合,E是所有關系邊的集合。并且存在著一個結點類型的映射函數φ:V→A和一個邊類型的映射函數Ψ:E→R,對于每個對象v∈V屬于一種特殊的對象類型φ(v)∈A,每個鏈接e∈E屬于一種特殊的關系類型Ψ(e)∈R,那么這種網絡類型就是信息網絡。當對象類型的種類|A|>1或者關系類型的種類|R|>1時,這種信息網絡是異質信息網絡,否則,它是一種同質信息網絡

//www.zhuanzhi.ai/paper/3696ec78742419bdaa9c23dce139b3d4

消息傳遞圖神經網絡(GNNs)為關系數據提供了強大的建模框架。曾經,現有GNN的表達能力上界取決于1- Weisfeiller -Lehman (1-WL)圖同構測試,這意味著gnn無法預測節點聚類系數和最短路徑距離,無法區分不同的d-正則圖。在這里,我們提出了一類傳遞消息的GNN,稱為身份感知圖神經網絡(ID- GNNs),具有比1-WL測試更強的表達能力。ID-GNN為現有GNN的局限性提供了一個最小但強大的解決方案。ID-GNN通過在消息傳遞過程中歸納地考慮節點的身份來擴展現有的GNN體系結構。為了嵌入一個給定的節點,IDGNN首先提取以該節點為中心的自我網絡,然后進行輪次異構消息傳遞,中心節點與自我網絡中其他周圍節點應用不同的參數集。我們進一步提出了一個簡化但更快的ID-GNN版本,它將節點標識信息作為增強節點特征注入。總之,ID-GNN的兩個版本代表了消息傳遞GNN的一般擴展,其中實驗表明,在具有挑戰性的節點、邊緣和圖屬性預測任務中,將現有的GNN轉換為ID-GNN平均可以提高40%的準確率;結點和圖分類在基準測試上提高3%精度;在實際鏈路預測任務提高15%的ROC AUC。此外,與其他特定于任務的圖網絡相比,ID- GNN表現出了更好的或相當的性能。

付費5元查看完整內容

由于不同道路間交通流時空分布格局具有復雜的空間相關性和動態趨勢,交通流時空數據預測是一項具有挑戰性的任務。現有框架通常利用給定的空間鄰接圖和復雜的機制為空間和時間相關性建模。然而,具有不完全鄰接連接的給定空間圖結構的有限表示可能會限制模型的有效時空依賴學習。此外,現有的方法在解決復雜的時空數據時也束手無策:它們通常利用獨立的模塊來實現時空關聯,或者只使用獨立的組件捕獲局部或全局的異構依賴關系。為了克服這些局限性,本文提出了一種新的時空融合圖神經網絡(STFGNN)用于交通流預測。首先,提出一種數據驅動的“時序圖”生成方法,以彌補空間圖可能無法反映的幾種現有相關性。SFTGNN通過一種新的時空圖融合操作,對不同的時間段進行并行處理,可以有效地學習隱藏的時空依賴關系。同時,該融合圖模塊與一種新的門控卷積模塊集成到一個統一的層中,SFTGNN可以通過層堆疊學習更多的時空依賴關系來處理長序列。在幾個公共交通數據集上的實驗結果表明,我們的方法達到了最先進的性能比其他基準一致。

//arxiv.org/pdf/2012.09641.pdf

付費5元查看完整內容

屬性網絡嵌入的目的是結合網絡的拓撲結構和節點屬性學習低維節點表示。現有的大多數方法要么通過網絡結構傳播屬性,要么通過編碼-解碼器框架學習節點表示。然而,基于傳播的方法傾向于選擇網絡結構而不是節點屬性,而編碼-解碼器方法傾向于忽略近鄰之外的長連接。為了解決這些限制,同時得到這兩個方面的優點,我們設計了交叉融合層的無監督屬性網絡嵌入。具體來說,我們首先構建兩個獨立的視圖來處理網絡結構和節點屬性,然后設計跨融合層來實現兩視圖之間靈活的信息交換和集成。交叉融合層的關鍵設計目標有三方面:1)允許關鍵信息沿著網絡結構傳播;2)在傳播過程中對每個節點的局部鄰域進行異構編碼;3)加入額外的節點屬性通道,使屬性信息不被結構視圖所掩蓋。在三個數據集和三個下游任務上的大量實驗證明了該方法的有效性。

//cs.nju.edu.cn/yuanyao/static/wsdm2021.pdf

付費5元查看完整內容

1 論文簡介

異質圖(Heterogeneous Graph, HG)也稱為異質信息網絡(Heterogeneous Information Network, HIN),在現實世界中已經無處不在。異質圖嵌入(Heterogeneous Graph Embedding, HGE),旨在在低維的空間中學習節點表示,同時保留異質結構和語義用于下游任務(例如,節點/圖分類,節點聚類,鏈接預測),在近年來受到了廣泛的關注。在綜述中,我們對異質圖嵌入的方法和技術的最新進展進行了全面回顧,探索了異質圖嵌入的問題和挑戰,并預測了該領域的未來研究方向。

該論文的主要貢獻如下:

  • 討論了與同質圖相比,異質圖的異質性帶來的獨特挑戰 。該論文對現有的異質圖嵌入方法進行了全面的調研,并基于它們在學習過程中使用的信息進行分類,以解決異質性帶來的特定的挑戰。
  • 對于每類代表性的異質圖嵌入方法和技術,提供詳細的介紹并進一步分析了其優缺點。此外,該論文首次探索了異質圖嵌入方法在現實工業環境中的可轉換性和適用性。
  • 總結了開源代碼和基準數據集,并對現有的圖學習平臺進行了詳細介紹,以促進該領域的未來研究和應用。
  • 探討異質圖嵌入的其他問題和挑戰,并預測該領域的未來研究方向。

2 獨特挑戰

復雜結構:同質圖中的結構可以被認為是一階,二階甚至更高階的信息,所有的結構都是定義明確并具有良好直覺的。但是在異質圖中,結構將根據選擇的關系而發生巨大的變化。以學術網絡為例,一篇論文的鄰居可以是具有writing關系的作者,也可以是具有contain關系的關鍵詞。更困難的是,這些關系的組合(可以被認為是異質圖中的一個高階結構)將產生更加復雜的結構。因此,如何有效且有效率地保持這些復雜的結構,是異構圖嵌入中的一個巨大挑戰,目前已經有一些工作探索了元路徑結構[1]和元圖結構[2]。

異質屬性:由于同質圖中的節點和邊具有相同的類型,所以節點或邊屬性的每個維度都具有相同的含義。在這種情況下,節點可以直接融合其鄰居的屬性。然而,在異質圖中,不同類型的節點和邊的屬性可能具有不同的含義[3], [4]。因此,如何克服屬性的異質性,有效地融合鄰居的屬性成為異質圖嵌入的又一大挑戰。

任務依賴:異質圖與實際應用密切相關,但有許多實際問題尚未解決。例如,在實際應用中,構建合適的異質圖可能需要足夠的領域知識。此外,元路徑或者元圖被廣泛用于捕獲異質圖的結構,然而,與同質圖中結構(例如一階和二階結構)被很好的定義不同,元路徑選擇也可能需要先驗知識。此外,為了更好地方便實際應用,我們通常需要在異質圖的嵌入過程中,仔細地編碼輔助信息(如節點屬性)[3],[4]或更高級的領域知識[5],[6]。

3 方法歸納

該論文首先從使用的信息這一角度對現有的異質圖嵌入方法進行總結歸納,具體如下:

結構保持的異質圖嵌入:主要集中于捕捉和保持異質的結構和語義,如元路徑和元圖。 信息輔助的異質圖嵌入:在嵌入過程中加入了更多的非結構信息,如節點或者邊屬性,從而更有效地利用鄰域信息。 應用導向的異質圖嵌入:進一步探討了異構圖嵌入方法的應用(即在異質圖上學習面向特定應用的節點嵌入)。 動態異質圖嵌入:捕捉異質圖的演化過程,并在節點嵌入中保留時序信息。

4 技術總結

我們從技術的角度對異質圖嵌入中廣泛使用的技術(或模型)進行了總結,一般分為淺層模型和深層模型兩大類。

淺層模型(Shallow Model) 基于隨機游走的方法 基于分解的方法 深度模型(Deep Model) 基于信息傳遞的方法 基于編碼器-解碼器的方法 基于對抗的方法 圖片

5 實際應用

電子商務:電子商務,如淘寶網和亞馬遜,是通過在線平臺進行產品電子交易的服務。電子商務平臺涉及到大規模的異質對象和交互,如用戶、物品和商店等。異質圖可以自然地對這些復雜的數據進行建模。異質圖嵌入已經被應用到電子商務中的各種重要服務和任務中,例如商品/意圖推薦、用戶分析(User Profiling)和欺詐者檢測。 網絡安全:安全一直是社會發展的最大威脅之一,它造成無數財產和生命損失。由于安全系統通常涉及多個異質實體和復雜的結構,因此,最近的研究人員更加關注使用異質圖嵌入方法來廣泛檢測安全區域中的異常值,例如惡意軟件檢測,地下論壇中的關鍵參與者標識,毒品販運者標識等。 電子健康記錄(Electronic Health Records),乘車平臺上的實時事件預測等。

6 未來工作

保持異質圖結構和性質:異質圖嵌入的成功在于保留異質圖結構和性質。但是對結構的探索是遠遠不夠,比如選擇最合適的元路徑仍然非常具有挑戰性;此外對于新的結構,比如網絡模式(Motif)或者網絡主題(Schema),也是值得探索的。除了網絡結構以外,現有模型還沒有充分考慮某些有用的性質,比如動態性和不確定性。 深度學習應用于異質圖數據:在異質圖的深度學習領域,一個重要的問題是同質圖神經網絡和異質圖神經網絡的本質區別是什么?理論上的分析可能會給深度學習在異質圖上的應用帶來突破。此外,從模型的角度考慮,異質圖上的自監督學習(Self-supervised Learning)和預訓練(Pre-training)也是重要的研究方向。 讓異質圖嵌入可信:除了異質圖的性質和技術外,我們還關注異質圖嵌入中的道德問題,例如公平性,魯棒性和可解釋性。考慮到大多數方法都是黑匣子,因此使異質圖嵌入可靠是一項重要的未來工作。 實際應用中的技術場景:異質圖嵌入已經在電子商務和網絡安全等領域顯示出很好的性能,未來在其他領域探索更多的異質圖嵌入能力將具有巨大潛力,比如軟件工程、生物醫藥等。此外,由于異質圖神經網絡的復雜度相對較高,并且技術難以并行化,因此,在各種實際應用中成功部署技術,同時解決可伸縮性和高效率挑戰將是非常重要的。 [1] Y. Dong, N. V. Chawla, and A. Swami, “metapath2vec: Scalable representation learning for heterogeneous networks,” in KDD, 2017.

[2] D. Zhang, J. Yin, X. Zhu, and C. Zhang, “Metagraph2vec: complex semantic path augmented heterogeneous network embedding,” in PAKDD, 2018.

[3] X. Wang, H. Ji, C. Shi, B. Wang, Y. Ye, P. Cui, and P. S. Yu, “Heterogeneous graph attention network,” in WWW, 2019.

[4] C. Zhang, D. Song, C. Huang, A. Swami, and N. V. Chawla, “Heterogeneous graph neural network,” in KDD, 2019.

[5] T. Chen and Y. Sun, “Task-guided and path-augmented heterogeneous network embedding for author identi?cation,” in WSDM, 2017.

[6] Z. Liu, V. W. Zheng, Z. Zhao, Z. Li, H. Yang, M. Wu, and J. Ying, “Interactive paths embedding for semantic proximity search on heterogeneous graphs,” in KDD, 2018.

付費5元查看完整內容

實際系統往往由大量類型各異、彼此交互的組件構成.當前大多數工作將其建模為同質信息網絡,并未對網絡中不同類型的對象及鏈接加以區分.近年來,越來越多的研究者將這些互聯數據建模為由不同類型節點和邊構成的異質信息網絡,并利用網絡中全面的結構信息和豐富的語義信息進行更精準的知識發現.隨著大數據時代的到來,異質信息網絡自然融合異構多源數據的優勢使其成為解決大數據多樣性的重要途徑.因此,異質信息網絡分析迅速成為數據挖掘研究和產業應用的熱點.本文對異質信息網絡分析與應用進行了全面綜述. 除介紹異質信息網絡領域的基本概念外,重點聚焦基于元路徑的數據挖掘方法、異質信息網絡的表示學習技術和實際應用三個方面的最新研究進展,并對未來的發展方向進行了展望.

付費5元查看完整內容
北京阿比特科技有限公司