亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

作者:Jiaming Shen, Zhihong Shen, Chenyan Xiong, Chi Wang, Kuansan Wang, Jiawei Han

摘要:本體結構(Taxonomies)由機器可解釋的語義組成,并為許多Web應用程序提供有價值的知識。例如,在線零售商(亞馬遜和eBay)使用本體結構進行產品推薦,而網絡搜索引擎(Google和Bing)利用本體結構來增強查詢理解。當前我們在人工或半自動地構建本體結構方面已經做出了巨大的努力。然而,隨著網絡內容數量的快速增長,現有的本體結構無法捕捉到新興的知識。因此,在許多應用程序中,十分需要對現有本體結構進行動態擴展。在本文中,我們研究了如何通過添加一組新的概念來擴展現有的本體結構。我們提出了一種新的自監督框架TaxoExpanTM,該框架從已有的本體結構中自動生成一組 ?query concept, anchor concept ? 對作為訓練數據。使用這樣的自監督數據,TaxoExpanTM學習一個模型來預測query concept是否是 anchor concept的直接下義詞。我們在TaxoExspan中提出了兩種創新技術:(1)位置增強型圖形神經網絡,它編碼現有本體結構中anchor concept的局部結構;2)噪聲魯棒性訓練目標,使學習的模型能夠對自監控數據中的標簽噪聲不敏感。在來自不同領域的三個大規模數據集上的廣泛實驗證明了TaxoExspan在分類系統擴展方面的有效性和高效性。

付費5元查看完整內容

相關內容

了解在線用戶可能關注的內容是內容推薦和搜索服務的關鍵。這些服務將受益于實體、概念、事件、主題和類別的高度結構化和web級本體。雖然現有的知識庫和分類法包含了大量的實體和類別,但我們認為它們未能以online population的語言風格發現適當粒度的概念、事件和主題。這些概念之間也不存在邏輯結構的本體。在本文中,我們提出GIANT,一種構建一個以用戶為中心的、網絡規模的、結構化的本體論的機制,該本體論包含了大量的自然語言短語,這些短語在不同的粒度上符合用戶的需要,這些短語是從大量的網絡文檔和搜索點擊圖中挖掘出來的。此外,還構造了各種類型的邊來維護本體中的層次結構。我們介紹了在GIANT中使用的基于圖神經網絡的技術,并與各種基線進行了比較,對提出的方法進行了評估。騰訊開發出了注意力本體,并將其應用到騰訊的各種應用中,涉及用戶超過10億。在騰訊QQ瀏覽器上進行的在線A/B測試表明,注意力本體可以顯著提高新聞推薦的點擊率。

付費5元查看完整內容

【導讀】國際萬維網大會(The Web Conference,簡稱WWW會議)是由國際萬維網會議委員會發起主辦的國際頂級學術會議,創辦于1994年,每年舉辦一屆,是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。由于疫情影響,這次會議在線上舉行,本屆會議共收到了1129篇長文投稿,錄用217篇長文,錄用率為19.2%。小編推薦一份圖深度學習-圖神經網絡教程,預覽版可以查看。

從圖數據和關系數據中學習在許多應用中起著重要的作用,包括社交網絡分析、市場營銷、電子商務、信息檢索、知識建模、醫學和生物科學、工程等。在過去的幾年里,圖神經網絡(GNNs)已經成為一種很有前途的新型監督學習框架,能夠將深度表示學習的能力引入到圖和關系數據中。越來越多的研究表明,GNNs在鏈路預測、欺詐檢測、目標配體結合活性預測、知識圖譜補全和產品推薦等方面的性能達到了最新水平。

本教程的目標有兩個。首先,它將概述GNN背后的理論,討論GNN非常適合的問題類型,并介紹一些最廣泛使用的GNN模型體系結構和設計用來解決的問題/應用程序。其次,它將引入深度圖庫(Deep Graph Library, DGL),這是一種新的軟件框架,簡化了高效的基于GNN的訓練和推理程序的開發。為了使事情更具體,本教程將提供使用DGL的實踐會話。這個實踐部分將涵蓋基本的圖形應用程序(例如,節點分類和鏈接預測),以及更高級的主題,包括在大型圖和分布式設置中訓練GNN。此外,它還將提供使用GNNs和DGL進行實際應用(如推薦和欺詐檢測)的實踐教程。

  • 第1節:圖神經網絡概述。本節描述了圖神經網絡是如何運作的,它們的基本理論,以及它們相對于其他圖學習方法的優勢。此外,它還描述了圖形上的各種學習問題,并展示了如何使用GNNs來解決這些問題。

  • 第2節:深度圖庫(DGL)概述。本節描述DGL提供的不同的抽象和api,這些抽象和api旨在簡化GNN模型的實現,并解釋DGL如何與MXNet、Pytorch和TensorFlow進行接口。然后介紹DGL的消息傳遞API,該API可用于開發任意復雜的GNNs和它提供的預定義GNN nn模塊。

  • 第3節:基本圖任務的GNN模型。本節演示如何使用GNNs解決四個關鍵的圖數據學習任務:節點分類、鏈接預測、圖數據分類和網絡嵌入前訓練。它將展示如何使用DGL的nn模塊實現一個流行的GNN模型GraphSage,并展示如何在不同類型的下游任務中使用由GraphSage計算出的節點嵌入。此外,本文還將演示使用DGL的消息傳遞接口實現定制的GNN模型。

  • 第4節:大型圖的GNN訓練。本節使用第3節中描述的一些模型來演示DGL中的微型批處理訓練、多GPU訓練和分布式訓練。它首先描述了mini-batch訓練的概念如何應用于GNN,以及如何通過使用各種抽樣技術來加速mini-batch計算。接下來將舉例說明一種稱為鄰接抽樣的抽樣技術,如何使用木星筆記本在DGL中實現。然后將該筆記本擴展為多GPU訓練和分布式訓練。

  • 第5節:實際應用的GNN模型。本節使用前面幾節中描述的技術,展示如何使用GNNs開發用于推薦和欺詐檢測的可伸縮解決方案。在推薦方面,本文提出了一種基于最近鄰的項目推薦方法,該方法通過采用端到端的學習方法,利用GNN模型學習項目嵌入。對于欺詐檢測,它擴展了上一節中的節點分類模型,以處理異構圖,并解決了標記樣本很少的情況。

付費5元查看完整內容

主題分類法的自動構建可以使許多應用程序受益,包括web搜索、推薦和知識發現。自動分類構建的主要優點之一是能夠捕獲特定于語料庫的信息并適應不同的場景。為了更好地反映語料庫的特點,我們考慮了文檔的元數據,將語料庫看作是一個文本豐富的網絡。在本文中,我們提出了NetTaxo,這是一個新的自動主題分類構建框架,它超越了現有的范式,允許文本數據與網絡結構協作。具體來說,我們從文本和網絡作為上下文學習術語嵌入。采用網絡圖形來捕獲適當的網絡上下文。我們對motifs進行實例級選擇,該選擇根據每個分類節點的粒度和語義進一步細化術語嵌入。然后應用集群來獲得分類法節點下的子主題。在兩個真實數據集上的大量實驗證明了我們的方法優于最先進的,并進一步驗證了實例級基序選擇的有效性和重要性。

付費5元查看完整內容

【導讀】國際萬維網大會(The Web Conference,簡稱WWW會議)是由國際萬維網會議委員會發起主辦的國際頂級學術會議,創辦于1994年,每年舉辦一屆,是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。本屆會議共收到了1129篇長文投稿,錄用217篇長文,錄用率為19.2%。近期,隨著會議的臨近,有很多paper放出來,專知小編提前整理了WWW 2020圖神經網絡(GNN)比較有意思的的論文—TaxoExpan,結構深度聚類網絡、MetapathGNN、對抗樣本、圖域自適應。

  1. TaxoExpan: Self-supervised Taxonomy Expansion with Position-Enhanced Graph Neural Network

作者:Jiaming Shen, Zhihong Shen, Chenyan Xiong, Chi Wang, Kuansan Wang, Jiawei Han

摘要:本體結構(Taxonomies)由機器可解釋的語義組成,并為許多Web應用程序提供有價值的知識。例如,在線零售商(亞馬遜和eBay)使用本體結構進行產品推薦,而網絡搜索引擎(Google和Bing)利用本體結構來增強查詢理解。當前我們在人工或半自動地構建本體結構方面已經做出了巨大的努力。然而,隨著網絡內容數量的快速增長,現有的本體結構無法捕捉到新興的知識。因此,在許多應用程序中,十分需要對現有本體結構進行動態擴展。在本文中,我們研究了如何通過添加一組新的概念來擴展現有的本體結構。我們提出了一種新的自監督框架TaxoExpanTM,該框架從已有的本體結構中自動生成一組 ?query concept, anchor concept ? 對作為訓練數據。使用這樣的自監督數據,TaxoExpanTM學習一個模型來預測query concept是否是 anchor concept的直接下義詞。我們在TaxoExspan中提出了兩種創新技術:(1)位置增強型圖形神經網絡,它編碼現有本體結構中anchor concept的局部結構;2)噪聲魯棒性訓練目標,使學習的模型能夠對自監控數據中的標簽噪聲不敏感。在來自不同領域的三個大規模數據集上的廣泛實驗證明了TaxoExspan在分類系統擴展方面的有效性和高效性。

網址://arxiv.org/abs/2001.09522

  1. Structural Deep Clustering Network

作者:Deyu Bo, Xiao Wang, Chuan Shi, Meiqi Zhu, Emiao Lu, Peng Cui

摘要:聚類是數據分析的基本任務。近年來,深度聚類技術(deep clustering)得到了廣泛的關注,它的靈感主要來自于深度學習方法。當前的深度聚類方法通常借助深度學習強大的表示能力(如自編碼)來提高聚類結果,這表明學習一種有效的聚類表示是一個關鍵的要求。深度聚類方法的優勢在于從數據本身中提取有用的表示,而不是從數據的結構中提取,這在表示學習中受到的關注較少。基于圖卷積網絡(GCN)在對圖結構進行編碼方面取得的巨大成功,我們提出了一種結構化深度聚類網絡(SDCN),將結構信息集成到深度聚類中。具體來說,我們設計了一個傳遞算子,將自編碼器學習到的表示轉換到相應的GCN層,并設計了雙重自監督機制來統一這兩種不同的深層神經結構,指導整個模型的更新。通過這種方式,從低階到高階的多種數據結構自然地與自動編碼器學習的多種表示相結合。在此基礎上,從理論上分析了傳遞算子。通過使用傳遞操作符,GCN改進了作為高階圖正則化約束的特定于自編碼的表示形式,并且自動編碼器有助于緩解GCN中的過度平滑問題。通過綜合實驗,我們證明我們提出的模型可以持續地比最先進的技術表現得更好。

網址:

  1. MAGNN: Metapath Aggregated Graph Neural Network for Heterogeneous Graph Embedding

作者:Xinyu Fu, Jiani Zhang, Ziqiao Meng, Irwin King

摘要:大量真實世界的圖或網絡本質上是異構的,涉及節點類型和關系類型的多樣性。異構圖嵌入是將異構圖的豐富結構和語義信息嵌入到低維節點表示中。現有的模型通常定義多個metapaths在異構圖捕捉復合關系和指導鄰居選擇。但是,這些模型要么忽略節點內容特性,要么沿著元路徑丟棄中間節點,要么只考慮一個元路徑。為了解決這三個局限性,我們提出了一種新的集合圖神經網絡模型來提高最終性能。具體來說,MAGNN使用了三個主要組件,即,節點內容轉換封裝輸入節點屬性,元內聚合合并中間語義節點,元間聚合合并來自多個元的消息。在三個真實世界的異構圖數據集上進行了大量的節點分類、節點聚類和鏈路預測實驗,結果表明MAGNN的預測結果比最先進的基線更準確。

網址:

  1. Certified Robustness of Community Detection against Adversarial Structural Perturbation via Randomized Smoothing

作者:Jinyuan Jia, Binghui Wang, Xiaoyu Cao, Neil Zhenqiang Gong

摘要:社區發現(Community detection)在理解圖結構中起著關鍵作用。但是,最近的一些研究表明,社區發現很容易受到對抗性結構的干擾。即通過在圖中添加或刪除少量選擇的邊,攻擊者可以控制發現的社區。然而,目前還沒有關于社區發現對這種對抗性結構擾動的魯棒性的研究。為了減少這一差距,在這項工作中,我們開發了第一個經過認證的可以抵御對抗性結構擾動的社區發現的魯棒性保證。在任意給定的社區發現方法的基礎上,通過對圖結構隨機進行擾動,構建了一種新的平滑社區發現方法。在理論上,當攻擊者添加/刪除有限數量的邊時,平滑社區發現方法可以將給定的任意節點集合分到相同的社區(或不同的社區)中。此外, 我們還根據經驗在真實社區的多個現實圖上評估了我們的方法。

網址:

  1. Unsupervised Domain Adaptive Graph Convolutional Networks

作者:Man Wu, Shirui Pan, Chuan Zhou, Xiaojun Chang, Xingquan Zhu

摘要:圖卷積網絡(GCNS)在許多與圖相關的分析任務中取得了成功。然而,由于圖表示學習和圖結構上的域自適應方面的挑戰,大多數GCN只工作在單個域(圖)中,不能將知識從一個域(圖)傳遞到其他域(圖)中。本文提出了一種新的圖域自適應學習方法--無監督域自適應圖卷積網絡(UDAGCN)。為了實現有效的圖表示學習,我們首先提出了一個對偶圖卷積網絡組件,該組件聯合利用局部一致性和全局一致性來進行特征聚合。注意力機制還用于為不同圖中的每個節點產生統一表示。為了便于圖之間的知識傳遞,我們提出了一個域自適應學習模塊,將源分類器損失、域分類器損失和目標分類器損失這三個不同的損失函數作為一個整體進行優化,從而可以區分源域中的類別標簽、不同領域樣本和目標領域的類別標簽。我們還在節點分類任務的真實數據集上的實驗結果驗證該方法的性能,并與最新的圖神經網絡算法進行了比較。

網址:

  1. A Kernel of Truth: Determining Rumor Veracity on Twitter by Diffusion Pattern Alone

作者:Nir Rosenfeld, Aron Szanto, David C. Parkes

摘要:最近,在錯誤信息檢測領域已經使用文本中豐富的信號以及與社交媒體上的內容相關的用戶身份來進行檢測。但由于文本可以被策略性地操縱,賬戶也可以用不同的名字重新創建,以上這些方法本質上是脆弱的。在這項工作中,我們研究了另一種更加自然與健壯的模式:信息傳播的模式。僅根據未經證實的謠言在社交網絡中的傳播模式,就能辨別在線傳播的未經證實的謠言的真實性嗎?

使用圖核(graph kernels )從Twitter中提取復雜的拓撲信息,我們訓練了不考慮語言,用戶身份和時間的準確預測模型,這首次證明了這種“sanitized”的擴散模式具有很高的準確性。 我們的結果表明,通過適當的聚集,即使在傳播的早期階段,人群的集中共享模式也可能會顯示出辨別謠言真假的強有力的信號。

網址:

付費5元查看完整內容

 大量真實世界的圖或網絡本質上是異構的,涉及節點類型和關系類型的多樣性。異構圖嵌入是將異構圖的豐富結構和語義信息嵌入到低維節點表示中。現有的模型通常定義多個metapaths在異構圖捕捉復合關系和指導鄰居選擇。但是,這些模型要么忽略節點內容特性,要么沿著元路徑丟棄中間節點,要么只考慮一個元路徑。為了解決這三個局限性,我們提出了一種新的集合圖神經網絡模型來提高最終性能。具體來說,MAGNN使用了三個主要組件,即,節點內容轉換封裝輸入節點屬性,元內聚合合并中間語義節點,元間聚合合并來自多個元的消息。在三個真實世界的異構圖數據集上進行了大量的節點分類、節點聚類和鏈路預測實驗,結果表明MAGNN的預測結果比最先進的基線更準確。

付費5元查看完整內容

摘要:文本蘊涵是自然語言處理的基本任務。大多數解決這個問題的方法只使用訓練數據中的文本內容。一些方法已經表明,來自外部知識來源(如知識圖譜)的信息除了文本內容之外,還可以通過提供對任務至關重要的背景知識來增加價值。然而,所提出的模型并沒有充分利用通常大而有噪聲的公斤中所包含的信息,而且也不清楚如何有效地編碼這些信息以使其對加密有用。我們提出了一種方法,通過(1)使用個性化的PageR- ank生成低噪聲的上下文子圖和(2)使用圖卷積網絡捕獲KG結構對這些子圖進行編碼,用KGs的信息來補充基于文本的嵌入模型。我們的技術擴展了文本模型挖掘知識結構和語義信息的能力。我們在多個文本蘊涵數據集上評估了我們的方法,并表明使用外部知識有助于提高預測準確性。這一點在極具挑戰性的BreakingNLI數據集中表現得尤為明顯,我們看到在多個基于文本的entailment模型上有5-20%的絕對改進。

付費5元查看完整內容
北京阿比特科技有限公司