隨著網絡新聞的爆炸式增長,個性化的新聞推薦對于網絡新聞平臺幫助用戶發現感興趣的信息變得越來越重要。現有的新聞推薦方法通過從新聞內容和用戶與新聞的直接交互(如點擊)中構建精確的新聞表示和用戶表示來實現個性化,而忽略了用戶與新聞之間的高階關聯。**本文提出了一種新聞推薦方法,通過對用戶和新聞之間的關系進行圖形化建模,增強用戶和新聞之間的表示學習。**在我們的方法中,用戶和新聞都被看作是歷史用戶點擊行為構造的二部圖中的節點。對于新聞表示,首先利用transformer架構構建新聞語義表示。然后通過一個圖注意力網絡將其與圖中相鄰新聞信息相結合。對于用戶表示,我們不僅表示來自其歷史上單擊的新聞的用戶,而且還仔細地將其鄰居用戶的表示合并到圖中。在大型真實數據集上的改進性能驗證了我們所提方法的有效性。
題目: Heterogeneous Graph Attention Network
摘要: 圖神經網絡作為一種基于深度學習的功能強大的圖表示技術,表現出了優越的性能,引起了廣泛的研究興趣。然而,對于包含不同節點和鏈接類型的異構圖,圖神經網絡還沒有充分考慮到這一點。異構性和豐富的語義信息給異構圖的圖神經網絡設計帶來了很大的挑戰。最近,深度學習領域最令人興奮的進展之一是注意力機制,其巨大的潛力在各個領域都得到了很好的展示。本文首先提出了一種基于分層關注的異構圖神經網絡,包括節點級關注和語義級關注。具體來說,節點級注意的目的是學習節點與其基于元路徑的鄰居之間的重要性,而語義級注意能夠學習不同元路徑之間的重要性。通過對節點級和語義級注意的學習,可以充分考慮節點和元路徑的重要性。然后將基于元路徑的鄰域的特征分層聚合,生成節點嵌入。在三個真實世界的異構圖上的廣泛實驗結果不僅顯示了我們所提出的模型的優越性能,而且也顯示了它對圖分析的潛在良好的可解釋性。
題目: Learning Attention-based Embeddings for Relation Prediction in Knowledge Graphs
摘要: 近年來隨著知識圖譜(KGs)的大量涌現,加上實體間缺失關系(鏈接)的不完全或部分信息,催生了大量關于知識庫補全(也稱為關系預測)的研究。最近的一些研究表明,基于卷積神經網絡(CNN)的模型能夠生成更豐富、更有表現力的特征嵌入,因此在關系預測方面也有很好的表現。然而,我們觀察到這些KG嵌入獨立地處理三元組,因此不能捕獲到三元組周圍的復雜和隱藏的信息。為此,本文提出了一種新的基于注意的特征嵌入方法,該方法能同時捕獲任意給定實體鄰域內的實體特征和關系特征。此外,我們還在模型中封裝了關系集群和多跳關系。我們的實驗研究為我們基于注意力的模型的有效性提供了深入的見解,并且與所有數據集上的最先進的方法相比,有顯著的性能提升。
我們提出了一種學習視覺特征的方法,即使這些特征具有不同的維數,并且是通過不同的神經網絡結構和損失函數來學習的,也能與之前的計算結果相兼容。兼容意味著,如果這些特性用于比較圖像,那么“新”特性可以直接與“舊”特性進行比較,因此它們可以互換使用。這使得視覺搜索系統在更新嵌入模型時,可以繞過計算所有以前看到的圖像的新特性,這個過程稱為回填。向后兼容性對于快速部署新的嵌入模型至關重要,這些模型利用了不斷增長的大規模訓練數據集和深度學習體系結構和訓練方法的改進。我們提出一個框架來訓練嵌入模型,稱為向后兼容訓練(BCT),作為向后兼容表示學習的第一步。在人臉識別的嵌入學習實驗中,使用BCT訓練的模型在不犧牲精度的前提下,成功實現了向后兼容,實現了可視化嵌入的無填充模型更新。
論文題目: MAGNN: Metapath Aggregated Graph Neural Network for Heterogeneous Graph Embedding
摘要: 大量真實世界的圖或網絡本質上是異構的,涉及節點類型和關系類型的多樣性。異構圖嵌入是將異構圖的豐富結構和語義信息嵌入到低維節點表示中。現有的模型通常在異構圖中定義多個元數據來捕獲復合關系并指導鄰居選擇。但是,這些模型要么忽略節點內容特性,要么沿著元路徑丟棄中間節點,要么只考慮一個元路徑。為了解決這三個局限性,我們提出了一種新的集合圖神經網絡模型來提高最終性能。具體來說,MAGNN使用了三個主要組件,即,節點內容轉換封裝輸入節點屬性,元內聚合合并中間語義節點,元間聚合合并來自多個元的消息。在三個真實世界的異構圖數據集上進行了大量的節點分類、節點聚類和鏈路預測實驗,結果表明MAGNN的預測結果比最先進的基線更準確。
【導讀】近年來,隨著網絡數據量的不斷增加,挖掘圖形數據已成為計算機科學領域的熱門研究課題,在學術界和工業界都得到了廣泛的研究。 但是,大量的網絡數據為有效分析帶來了巨大的挑戰。 因此激發了圖表示的出現,該圖表示將圖映射到低維向量空間中,同時保持原始圖結構并支持圖推理。 圖的有效表示的研究具有深遠的理論意義和重要的現實意義,本教程將介紹圖表示/網絡嵌入的一些基本思想以及一些代表性模型。
關于圖或網絡的文獻有兩個名稱:圖表示和網絡嵌入。我們注意到圖和網絡都指的是同一種結構,盡管它們每個都有自己的術語,例如,圖和網絡的頂點和邊。挖掘圖/網絡的核心依賴于正確表示的圖/網絡,這使得圖/網絡上的表示學習成為學術界和工業界的基本研究問題。傳統表示法直接基于拓撲圖來表示圖,通常會導致許多問題,包括稀疏性,高計算復雜性等,從而激發了基于機器學習的方法的出現,這種方法探索了除矢量空間中的拓撲結構外還能夠捕獲額外信息的潛在表示。因此,對于圖來說,“良好”的潛在表示可以更加精確的表示圖形。但是,學習網絡表示面臨以下挑戰:高度非線性,結構保持,屬性保持,稀疏性。
深度學習在處理非線性方面的成功為我們提供了研究新方向,我們可以利用深度學習來提高圖形表示學習的性能,作者在教程中討論了將深度學習技術與圖表示學習相結合的一些最新進展,主要分為兩類方法:面向結構的深層方法和面向屬性的深層方法。
對于面向結構的方法:
對于面向屬性的方法:
本教程的第二部分就以上5種方法,通過對各個方法的模型介紹、算法介紹、對比分析等不同方面進行詳細介紹。
1、Structural Deep Network Embedding
network embedding,是為網絡中的節點學習出一個低維表示的方法。目的在于在低維中保持高度非線性的網絡結構特征,但現有方法多采用淺層網絡不足以挖掘高度非線性,或同時保留局部和全局結構特征。本文提出一種結構化深度網絡嵌入方法,叫SDNE該方法用半監督的深度模型來捕捉高度非線性結構,通過結合一階相似性(監督)和二階相似性(非監督)來保留局部和全局特征。
2、 Deep recursive network embedding with regular equivalence
網絡嵌入旨在保留嵌入空間中的頂點相似性。現有方法通常通過節點之間的連接或公共鄰域來定義相似性,即結構等效性。但是,位于網絡不同部分的頂點可能具有相似的角色或位置,即規則的等價關系,在網絡嵌入的文獻中基本上忽略了這一點。以遞歸的方式定義規則對等,即兩個規則對等的頂點具有也規則對等的網絡鄰居。因此,文章中提出了一種名為深度遞歸網絡嵌入(DRNE)的新方法來學習具有規則等價關系的網絡嵌入。更具體地說,我們提出了一種層歸一化LSTM,以遞歸的方式通過聚合鄰居的表示方法來表示每個節點。
3、Structural Deep Embedding for Hyper-Networks
是在hyperedge(超邊是不可分解的)的基礎上保留object的一階和二階相似性,學習異質網絡表示。于與HEBE的區別在于,本文考慮了網絡high-oeder網絡結構和高度稀疏性。 傳統的基于clique expansion 和star expansion的方法,顯式或者隱式地分解網絡。也就說,分解后hyper edge節點地子集,依然可以構成一個新的超邊。對于同質網絡這個假設是合理地,因為同質網絡地超邊,大多數情況下都是根據潛在地相似性(共同地標簽等)構建的。
4、 Deep variational network embedding in wasserstein space
大多數現有的嵌入方法將節點作為點向量嵌入到低維連續空間中。這樣,邊緣的形成是確定性的,并且僅由節點的位置確定。但是,現實世界網絡的形成和發展充滿不確定性,這使得這些方法不是最優的。為了解決該問題,在本文中提出了一種新穎的在Wasserstein空間中嵌入深度變分網絡(DVNE)。所提出的方法學習在Wasserstein空間中的高斯分布作為每個節點的潛在表示,它可以同時保留網絡結構并為節點的不確定性建模。具體來說,我們使用2-Wasserstein距離作為分布之間的相似性度量,它可以用線性計算成本很好地保留網絡中的傳遞性。此外,我們的方法通過深度變分模型隱含了均值和方差的數學相關性,可以通過均值矢量很好地捕獲節點的位置,而由方差可以很好地捕獲節點的不確定性。此外,本文方法通過保留網絡中的一階和二階鄰近性來捕獲局部和全局網絡結構。
5、 Learning embeddings of out-of-sample nodes in dynamic networks
迄今為止的網絡嵌入算法主要是為靜態網絡設計的,在學習之前,所有節點都是已知的。如何為樣本外節點(即學習后到達的節點)推斷嵌入仍然是一個懸而未決的問題。該問題對現有方法提出了很大的挑戰,因為推斷的嵌入應保留復雜的網絡屬性,例如高階鄰近度,與樣本內節點嵌入具有相似的特征(即具有同質空間),并且計算成本較低。為了克服這些挑戰,本文提出了一種深度轉換的高階拉普??拉斯高斯過程(DepthLGP)方法來推斷樣本外節點的嵌入。 DepthLGP結合了非參數概率建模和深度學習的優勢。特別是,本文設計了一個高階Laplacian高斯過程(hLGP)來對網絡屬性進行編碼,從而可以進行快速和可擴展的推理。為了進一步確保同質性,使用深度神經網絡來學習從hLGP的潛在狀態到節點嵌入的非線性轉換。 DepthLGP是通用的,因為它適用于任何網絡嵌入算法學習到的嵌入。
NeurIPS 2019(Neural Information Processing Systems)將在12月8日-14日在加拿大溫哥華舉行。NeurIPS 是全球最受矚目的AI、機器學習頂級學術會議之一,每年全球的人工智能愛好者和科學家都會在這里聚集,發布最新研究。今天小編整理了表示學習相關論文。
作者: Da Xu, Chuanwei Ruan, Evren Korpeoglu, Sushant Kumar, Kannan Achan
摘要:在自然語言處理中,具有self-attention的序列模型已經取得了很好的效果。self-attention具有模型靈活性、計算復雜性和可解釋性等優點,正逐漸成為事件序列模型的重要組成部分。然而,像大多數其他的序列模型一樣,自我注意并不能解釋事件之間的時間跨度,因此它捕捉的是序列信號而不是時間模式。在不依賴遞歸網絡結構的情況下,self-attention通過位置編碼來識別事件的順序。為了彌補時間無關和時間相關事件序列建模之間的差距,我們引入了一個嵌入時間跨度到高維空間的功能特征映射。通過構造相關的平移不變時間核函數,揭示了經典函數函數分析結果下特征圖的函數形式,即Bochner定理和Mercer定理。我們提出了幾個模型來學習函數性時間表示以及與事件表示的交互。這些方法是在各種連續時間事件序列預測任務下對真實數據集進行評估的。實驗結果表明,所提出的方法與基線模型相比,具有更好的性能,同時也能捕獲有用的時間-事件交互。
論文鏈接:
//papers.nips.cc/paper/9720-self-attention-with-functional-time-representation-learning
作者:Jeff Donahue, Karen Simonyan
摘要:對抗訓練生成模型(GANs)最近取得了引人注目的圖像合成結果。GANs在無監督的表現學習中盡管在早期取得了的成功,但是它們已經被基于自監督的方法所取代。在這項工作中,我們證明了圖像生成質量的進步轉化為極大地改進了表示學習性能。我們的方法BigBiGAN建立在最先進的BigGAN模型之上,通過添加編碼器和修改鑒別器將其擴展到表示學習。我們廣泛地評估了這些BigBiGAN模型的表示學習和生成能力,證明了這些基于生成的模型在ImageNet的無監督表示學習方面達到了最新的水平,并在無條件生成圖像方面取得了令人信服的結果。
論文鏈接:
作者:Yu Tian, Long Zhao, Xi Peng, Dimitris Metaxas
摘要:圖核是度量圖相似性的核心方法,是圖分類的標準工具。然而,作為與圖表示學習相關的一個問題,使用核方法進行節點分類仍然是不適定的,目前最先進的方法大多基于啟發式。在這里,我們提出了一個新的基于核的節點分類理論框架,它可以彌補這兩個圖上表示學習問題之間的差距。我們的方法是由圖核方法驅動的,但是擴展到學習捕獲圖中結構信息的節點表示。我們從理論上證明了我們的公式與任何半正定核一樣強大。為了有效地學習內核,我們提出了一種新的節點特征聚合機制和在訓練階段使用的數據驅動的相似度度量。更重要的是,我們的框架是靈活的,并補充了其他基于圖形的深度學習模型,如圖卷積網絡(GCNs)。我們在一些標準節點分類基準上對我們的方法進行了經驗評估,并證明我們的模型設置了最新的技術狀態。
論文鏈接:
作者:Dushyant Rao, Francesco Visin, Andrei Rusu, Razvan Pascanu, Yee Whye Teh, Raia Hadsell
摘要:持續學習旨在提高現代學習系統處理非平穩分布的能力,通常是通過嘗試按順序學習一系列任務。該領域的現有技術主要考慮監督或強化學習任務,并經常假設對任務標簽和邊界有充分的認識。在這項工作中,我們提出了一種方法(CURL)來處理一個更普遍的問題,我們稱之為無監督連續學習。重點是在不了解任務身份的情況下學習表示,我們將探索任務之間的突然變化、從一個任務到另一個任務的平穩過渡,甚至是數據重組時的場景。提出的方法直接在模型中執行任務推斷,能夠在其生命周期內動態擴展以捕獲新概念,并結合其他基于排練的技術來處理災難性遺忘。我們用MNIST和Omniglot演示了CURL在無監督學習環境中的有效性,在這種環境中,沒有標簽可以確保沒有關于任務的信息泄露。此外,與現有技術相比,我們在i.i.中表現出了較強的性能。在i.i.d的設置下,或將該技術應用于監督任務(如漸進式課堂學習)時。 論文鏈接:
作者: Jean-Yves Franceschi, Aymeric Dieuleveut, Martin Jaggi
摘要:由于時間序列在實際應用中具有高度可變的長度和稀疏標記,因此對機器學習算法而言,時間序列是一種具有挑戰性的數據類型。在本文中,我們提出了一種學習時間序列通用嵌入的無監督方法來解決這一問題。與以前的工作不同,它的長度是可伸縮的,我們通過深入實驗和比較來展示學習表示的質量、可移植性和實用性。為此,我們將基于因果擴張卷積的編碼器與基于時間負采樣的新三重態損耗相結合,獲得了可變長度和多元時間序列的通用表示。
論文鏈接:
作者:Shen-Huan Lyu, Liang Yang, Zhi-Hua Zhou
摘要:在本文中,我們將森林表示學習方法casForest作為一個加法模型,并證明當與邊際標準差相對于邊際均值的邊際比率足夠小時,泛化誤差可以以O(ln m/m)為界。這激勵我們優化比例。為此,我們設計了一種邊際分布的權重調整方法,使深林模型的邊際比較小。實驗驗證了邊緣分布與泛化性能之間的關系。我們注意到,本研究從邊緣理論的角度對casForest提供了一個新的理解,并進一步指導了逐層的森林表示學習。
論文鏈接:
作者:Shuangfei Zhai, Walter Talbott, Carlos Guestrin, Joshua Susskind
摘要:我們通過基于深度能量的模型(EBMs)來研究生成對抗網絡(GANs),目的是利用從這個公式推導出的密度模型。與傳統的鑒別器在達到收斂時學習一個常數函數的觀點不同,這里我們證明了它可以為后續的任務提供有用的信息,例如分類的特征提取。具體來說,在EBM公式中,鑒別器學習一個非歸一化密度函數(即,負能量項),它描述了數據流形。我們建議通過從EBM中獲得相應的Fisher分數和Fisher信息來評估生成器和鑒別器。我們證明了通過假設生成的示例形成了對學習密度的估計,費雪信息和歸一化費雪向量都很容易計算。我們還證明了我們能夠推導出例子之間和例子集之間的距離度量。我們進行的實驗表明,在分類和感知相似性任務中,甘氏神經網絡誘導的費雪向量作為無監督特征提取器表現出了競爭力。代碼地址:
論文鏈接:
作者:Fan-Yun Sun, Meng Qu, Jordan Hoffmann, Chin-Wei Huang, Jian Tang
摘要:本文重點研究了圖數據分析的兩個基本任務:社區檢測和節點表示學習,它們分別捕獲圖數據的全局結構和局部結構。在現有的文獻中,這兩個任務通常是獨立研究的,但實際上是高度相關的。提出了一種協作學習社區成員和節點表示的概率生成模型vGraph。具體地說,我們假設每個節點都可以表示為群落的混合,并且每個群落都定義為節點上的多項分布。混合系數和群落分布均由節點和群落的低維表示參數化。我們設計了一種有效的變分推理算法,通過反向傳播進行優化,使相鄰節點的社區成員關系在潛在空間中相似。在多個真實圖上的實驗結果表明,vGraph在社區檢測和節點表示學習兩方面都非常有效,在兩方面都優于許多有競爭力的基線。結果表明,該vGraph框架具有良好的靈活性,可以方便地擴展到層次社區的檢測。
論文鏈接:
論文題目: Rule-Guided Compositional Representation Learning on Knowledge Graphs
摘要:
知識圖的表示學習是將知識圖中的實體和關系嵌入到低維連續向量空間中。早期的KG嵌入方法只關注編碼在三元組中的結構化信息,由于KG的結構稀疏性,其性能受到限制。最近的一些嘗試考慮路徑信息來擴展KGs的結構,但是在獲取路徑表示的過程中缺乏可解釋性。本文提出了一種新的基于規則和路徑的聯合嵌入(RPJE)方案,該方案充分利用了邏輯規則的可解釋性和準確性、KG嵌入的泛化性以及路徑的補充語義結構。具體來說,首先從KG中挖掘出不同長度(規則體中的關系數)的Horn子句形式的邏輯規則,并對其進行編碼,用于表示學習。然后,利用長度2的規則來精確地組合路徑,而使用長度1的規則來明確地創建關系之間的語義關聯和約束關系嵌入。優化時還考慮了規則的置信度,保證了規則在表示學習中的可用性。大量的實驗結果表明,RPJE在KG完成任務上的表現優于其他最先進的基線,這也證明了利用邏輯規則和路徑來提高表示學習的準確性和可解釋性的優越性。
論文作者:
張永飛:男,博士,副教授,博士生導師。2005年畢業于北京航空航天大學自動化學院,獲學士學位,免推直博;2011年畢業于北京航空航天大學模式識別與智能系統專業,獲博士學位。2007年至2009年在美國密蘇里大學哥倫比亞分校電氣與工程學院訪問。2011年加入北航計算機學院數字媒體北京市重點實驗室。科研工作:目前主要研究方向包括(1)(視覺)大數據智能分析處理;(2)高性能實時圖像/視頻編解碼與可靠傳輸。主持國家自然科學基金項目面上項目、國家重點研發計劃項目子課題、國家自然科學基金重點項目子課題、863項目子課題、國家重點實驗室自主課題、企業合作預研項目等多項科研任務;作為技術骨干參與國家973計劃、杰出青年基金、國家自然科學基金項目等多項國家級課題的科研工作等。
劉偲,計算機學院副教授、博導。 2012年博士畢業于中科院自動化所,2009-2014年于新加坡國立大學(NUS)任研究助理、博后。2016年在微軟亞洲研究院(MSRA)任鑄星計劃研究員。2014-2018在中國科學院信工所任副研究員。其研究方向是跨模態多媒體智能分析,包括自然語言處理(NLP)和計算機視覺(CV)。共發表了CCF A類論文 40余篇,其研究成果發表于TPAMI、IJCV、TIP、CVPR、ICCV和ACM MM等。 Google Scholar引用4000+次。2017年入選中國科協青年人才托舉工程,2017年獲CCF-騰訊犀牛鳥專利獎。任2017中國計算機大會(CNCC)主論壇特邀講者,2017 CCF青年精英大會“青年技術秀”講者。獲2017 ACM 中國新星提名獎,2017國際計算機學會人工智能專委會中國區(ACM SIGAI China) 新星獎,2018吳文俊人工智能優秀青年獎。 另外,她獲CCF A類會議ACM MM 2012最佳技術演示獎,ACM MM 2013最佳論文獎。指導學生獲得ChinaMM2018 最佳學生論文獎。帶領學生多次獲得國際、國內競賽冠軍: 2016年獲CCF大數據與計算智能大賽(BDCI)綜合特等獎,2017年獲CVPR Look Into Person Challenge Human Parsing Track冠軍,2019年獲得ICCV Youtube-Video Object Segmentation 競賽冠軍。 主辦了ECCV 2018和ICCV 2019‘Person in Context’workshop。擔任中國圖像圖形學學會理事、副秘書長。任ICCV 2019、CVPR 2020 Area chair,AAAI 2019、IJCAI2019、IJCAI 2020 SPC。