知識圖譜補全(KGC)任務的目的是自動推斷知識圖譜(KG)中缺失的事實信息。在本文中,我們采用了一個新的視角,旨在利用豐富的用戶-項目交互數據(簡稱用戶交互數據)來改進KGC任務。我們的工作靈感來自于許多KG實體對應于應用程序系統中的在線項目的觀察。然而,這兩種數據源具有非常不同的內在特性,使用簡單的融合策略可能會影響原始的性能。
為了解決這一挑戰,我們提出了一種利用KGC任務的用戶交互數據的新穎的對抗性學習方法。我們的生成器是與用戶交互數據隔離的,用于提高鑒別器的性能。鑒別器將從用戶交互數據中學習到的有用信息作為輸入,逐步增強評價能力,以識別生成器生成的虛假樣本。為了發現用戶的隱式實體偏好,我們設計了一種基于圖神經網絡的協同學習算法,該算法將與鑒別器共同優化。這種方法可以有效地緩解KGC任務的數據異構性和語義復雜性問題。在三個真實數據集上的大量實驗證明了我們的方法在KGC任務上的有效性。
知識圖譜被廣泛用于提高推薦準確度。知識圖譜上的多跳用戶-物品連接還提供了關于為什么推薦某個項的推理。然而,路徑推理是一個復雜的組合優化問題。傳統的推薦方法通常采用蠻力方法來尋找可行路徑,這導致了與可解釋性和收斂性相關的問題。在本文中,我們通過更好地監督尋路過程來解決這些問題。關鍵思想是用最小的標記努力提取不完美的路徑演示,并有效地利用這些演示來指導尋路。特別地,我們設計了一個基于演示的知識圖推理框架用于可解釋推薦。我們還提出了一個反面的actor批評家(ADAC)模型用于演示導向的尋路。在三個真實基準上的實驗表明,我們的方法比最先進的基準更快地收斂,并且具有更好的推薦精度和可解釋性。
主題: Joint Item Recommendation and Attribute Inference: An Adaptive Graph Convolutional Network Approach
摘要: 在許多推薦系統中,用戶和項目與屬性相關聯,并且用戶顯示對項目的偏好。屬性信息描述了用戶(項目)的特征,并具有廣泛的應用程序,例如用戶配置文件,項目注釋和功能增強的推薦。由于注釋用戶(項目)屬性是一項勞動密集型任務,因此屬性值通常不完整,缺少許多屬性值。因此,項目推薦和屬性推理已成為這些平臺中的兩個主要任務。研究人員長期以來一直認為用戶(項目)屬性與偏好行為高度相關。一些研究人員提議將一種數據用于剩余任務,并表明可以提高性能。盡管如此,這些模型要么忽略了用戶(項目)屬性的不完整,要么將兩個任務的相關性與簡單模型相結合,導致這兩個任務的性能欠佳。為此,在本文中,我們將這兩個任務歸因于用戶項二部圖,并提出了一種用于聯合項推薦和屬性推斷的自適應圖卷積網絡(AGCN)方法。 AGCN的關鍵思想是迭代執行兩個部分:1)使用先前學習的近似屬性值來學習圖形嵌入參數,以簡化兩個任務; 2)將近似的更新屬性值發送回屬性圖以更好地進行圖嵌入學習。因此,AGCN可以通過合并給定屬性和估計屬性值來自適應地調整圖嵌入學習參數,以提供弱監督信息來細化圖兩個任務。在三個真實數據集上的大量實驗結果清楚地表明了該模型的有效性。
實體交互預測在許多重要的應用如化學、生物、材料科學和醫學中是必不可少的。當每個實體由一個復雜的結構(即結構化實體)表示時,這個問題就變得非常具有挑戰性,因為涉及到兩種類型的圖:用于結構化實體的局部圖和用于捕獲結構化實體之間交互的全局圖。我們注意到,現有的結構化實體交互預測工作不能很好地利用圖的唯一圖模型。在本文中,我們提出了一個圖的神經網絡圖,即GoGNN,它以分層的方式提取了結構化實體圖和實體交互圖中的特征。我們還提出了雙重注意力機制,使模型在圖的兩個層次上都能保持相鄰的重要性。在真實數據集上的大量實驗表明,GoGNN在兩個有代表性的結構化實體交互作用預測任務上的表現優于最先進的方法:化學-化學交互作用預測和藥物-藥物交互作用預測。我們的代碼可以在Github上找到。
【導讀】國際萬維網大會(The Web Conference,簡稱WWW會議)是由國際萬維網會議委員會發起主辦的國際頂級學術會議,創辦于1994年,每年舉辦一屆,是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。本屆會議共收到了1129篇長文投稿,錄用217篇長文,錄用率為19.2%。這周會議已經召開,會議論文集已經公開,大家可以自己查看感興趣的論文,專知小編繼續整理WWW 2020 系列論文,這期小編為大家奉上的是WWW 2020五篇知識圖譜+圖神經網絡(KG+GNN)相關論文,供大家參考!——多關系實體對齊、問答推理、動態圖實體鏈接、序列實體鏈接、知識圖譜補全。
WWW 2020 會議論文集: //dl.acm.org/doi/proceedings/10.1145/3366423
WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN、EMNLP2019GNN、ICCV2019GNN_Part2、ICCV2019GNN_Part1、NIPS2019GNN、IJCAI2019GNN_Part1、IJCAI2019GNN_Part2、KDD2019GNN、ACL2019GNN、CVPR2019GNN、ICML2019GNN
作者:Qi Zhu, Hao Wei, Bunyamin Sisman, Da Zheng, Christos Faloutsos, Xin Luna Dong and Jiawei Han
摘要:知識圖(如Freebase、Yago)是表示各類實體之間豐富真實信息的多關系圖。實體對齊是實現多源知識圖集成的關鍵步驟。它旨在識別涉及同一真實世界實體的不同知識圖中的實體。然而,現有的實體對齊系統忽略了不同知識圖的稀疏性,不能通過單一模型對多類型實體進行對齊。在本文中,我們提出了一種用于多類型實體對齊的聯合圖神經網絡(Collective Graph neural network),稱為CG-MuAlign。與以前的工作不同,CG-MuAlign聯合對齊多種類型的實體,共同利用鄰域信息并將其推廣到未標記的實體類型。具體地說,我們提出了一種新的集中聚集函數1)通過交叉圖和自注意力來緩解知識圖的不完全性,2)通過小批量訓練范例和有效的鄰域抽樣策略,有效地提高了可伸縮性。我們在具有數百萬個實體的真實知識圖上進行了實驗,觀察到了比現有方法更優越的性能。此外,我們的方法的運行時間比目前最先進的深度學習方法要少得多。
網址:
作者:Chen Zhao, Chenyan Xiong, Xin Qian and Jordan Boyd-Graber
摘要:我們介紹了Delft,一個事實問答系統,它將知識圖問答方法的細微和深度與更廣泛的free-文本結合在一起。Delft從Wikipedia構建了一個自由文本知識圖,以實體為節點和句子,其中實體同時出現做為邊。對于每個問題,Delft使用文本句子作為邊,找到將問題實體節點鏈接到候選對象的子圖,創建了密集且覆蓋率高的語義圖。一種新穎的圖神經網絡在free-文本圖上進行推理-通過沿邊句子的信息組合節點上的證據-以選擇最終答案。在三個問答數據集上的實驗表明,Delft能夠比基于機器閱讀的模型、基于BERT的答案排序和記憶網絡更好地回答實體豐富的問題。Delft的優勢既來自于其free-文本知識圖譜的高覆蓋率--是DBpedia關系的兩倍多--也來自于新穎的圖神經網絡,它基于豐富而嘈雜的free-文本證據進行推理。
網址:
作者:Junshuang Wu, Richong Zhang, Yongyi Mao, Hongyu Guo, Masoumeh Soflaei and Jinpeng Huai
摘要:實體鏈接將文檔中提及的命名實體映射到給定知識圖中的合適的實體,已被證明能夠從基于圖卷積網絡(GCN)對實體相關性建模中獲得顯著好處。然而,現有的GCN實體鏈接模型沒有考慮到,一組實體的結構化圖不僅依賴于給定文檔的上下文信息,而且在GCN的不同聚合層上自適應地變化,導致在捕捉實體之間的結構信息方面存在不足。在本文中,我們提出了一種動態的GCN體系結構來有效地應對這一挑戰。模型中的圖結構是在訓練過程中動態計算和修改的。通過聚合動態鏈接節點的知識,我們的GCN模型可以集中識別文檔和知識圖之間的實體映射,并有效地捕捉整個文檔中各個實體提及( mentions)之間的主題一致性。在基準實體連接數據集上的實證研究證實了我們提出的策略的優越性能和動態圖結構的好處。
網址:
作者:Yichao Zhou, Shaunak Mishra, Manisha Verma, Narayan Bhamidipati and Wei Wang
摘要:實體鏈接(EL)是將文本中提及的內容映射到知識庫(KB)中相應實體的任務。這項任務通常包括候選生成(CG)和實體消歧(ED)兩個階段。目前基于神經網絡模型的EL系統取得了較好的性能,但仍然面臨著兩個挑戰:(1)以往的研究在評估模型時沒有考慮候選實體之間的差異。事實上,候選集的質量(特別是黃金召回)對EL結果有影響。因此,如何提候選的素質需要引起更多的關注。(Ii)為了利用提及實體之間的主題一致性,提出了許多聚集ED的圖和序列模型。然而,基于圖的模型對所有候選實體一視同仁,這可能會引入大量的噪聲信息。相反,序列模型只能觀察先前引用的實體,而忽略了當前提及的實體與其后續實體之間的相關性。針對第一個問題,我們提出了一種基于多策略的CG方法來生成高召回率的候選集。對于第二個問題,我們設計了一個序列圖注意力網絡(SeqGat),它結合了圖和序列方法的優點。在我們的模型中,提及( mentions)是按順序處理的。在當前提到的情況下,SeqGAT對其先前引用的實體和后續實體進行動態編碼,并為這些實體分配不同的重要性。這樣既充分利用了主題的一致性,又減少了噪聲干擾。我們在不同類型的數據集上進行了實驗,并在開放的評測平臺上與以前的EL系統進行了比較。比較結果表明,與現有的方法相比,我們的模型有了很大的改進。
網址:
作者:Gaole He, Junyi Li, Wayne Xin Zhao, Peiju Liu and Ji-Rong Wen
摘要:知識圖補全(KGC)任務旨在自動推斷知識圖(KG)中缺失的事實信息。在本文中,我們采取了一個新的視角,旨在利用豐富的用戶-項目交互數據(簡稱用戶交互數據)來改進KGC任務。我們的工作靈感來自于觀察到許多KG實體對應于應用系統中的在線項目。然而,這兩種數據源的固有特性有很大的不同,使用簡單的融合策略很可能會損害原有的性能。為了應對這一挑戰,我們提出了一種新的對抗性學習方法,通過利用用戶交互數據來執行KGC任務。我們的生成器是從用戶交互數據中分離出來的,用來提高鑒別器的性能。鑒別器將從用戶交互數據中學習到的有用信息作為輸入,并逐步增強評估能力,以識別生成器生成的假樣本。為了發現用戶的隱含實體偏好,設計了一種基于圖神經網絡的協同學習算法,并與鑒別器進行聯合優化。這種方法有效地緩解了KGC任務的數據異構性和語義復雜性問題。在三個真實世界數據集上的廣泛實驗已經證明了我們在KGC任務上的方法的有效性。
網址:
隨著網絡新聞的爆炸式增長,個性化的新聞推薦對于網絡新聞平臺幫助用戶發現感興趣的信息變得越來越重要。現有的新聞推薦方法通過從新聞內容和用戶與新聞的直接交互(如點擊)中構建精確的新聞表示和用戶表示來實現個性化,而忽略了用戶與新聞之間的高階關聯。**本文提出了一種新聞推薦方法,通過對用戶和新聞之間的關系進行圖形化建模,增強用戶和新聞之間的表示學習。**在我們的方法中,用戶和新聞都被看作是歷史用戶點擊行為構造的二部圖中的節點。對于新聞表示,首先利用transformer架構構建新聞語義表示。然后通過一個圖注意力網絡將其與圖中相鄰新聞信息相結合。對于用戶表示,我們不僅表示來自其歷史上單擊的新聞的用戶,而且還仔細地將其鄰居用戶的表示合并到圖中。在大型真實數據集上的改進性能驗證了我們所提方法的有效性。
為了更好的用戶體驗和業務效能,點擊率(CTR)預測一直是電子商務中最重要的任務之一。雖然已經提出了大量的CTR預測模型,但從多模態特征中學習項目的良好表示仍然較少研究,因為電子商務中的一個項目通常包含多個異質模態。以往的作品要么將多個模態特征串聯起來,相當于給每個模態一個固定的重要性權重;或者通過注意力機制等技術學習不同項目不同模式的動態權重。然而,一個問題是,通常存在跨多個模態的公共冗余信息。利用冗余信息計算不同模態的動態權值,可能不能正確反映不同模態的不同重要性。為了解決這個問題,我們通過考慮模態特性和模態不變特性來探索模態的互補性和冗余性。針對CTR預測任務,我們提出了一種新的多模態對抗表示網絡(MARN)。多模態注意網絡首先根據每個項目的模態特征計算其多模態的權重。然后,一個多模態對抗網絡學習模態不變表示,在此基礎上引入雙鑒別器策略。最后,我們將模態特定表示與模態不變表示相結合,實現了多模態項表示。我們在公共數據集和工業數據集上進行了大量的實驗,所提出的方法不斷地對最先進的方法進行顯著的改進。此外,該方法已應用于實際的電子商務系統,并在網上進行了A/B測試,進一步證明了該方法的有效性。
正確處理丟失的數據是推薦中的一個基本挑戰。目前的工作大多是對未觀測數據進行負采樣,為推薦模型的訓練提供負信號。然而,現有的負采樣策略,無論是靜態的還是自適應的,都不足以產生高質量的負采樣——既能提供模型訓練的信息,又能反映用戶的真實需求。在這項工作中,我們假設項目知識圖譜(KG),它提供了豐富的項目和KG實體之間的關系,可以用來推斷信息和事實的陰性樣本。為此,我們提出了一種新的負采樣模型——知識圖譜策略網絡(KGPolicy),它作為一種強化學習代理來探索高質量的負樣本。具體來說,通過我們設計的探索操作,它從目標的正交互中導航,自適應地接收到知識感知的負信號,最終產生一個潛在的負項來訓練推薦器。我們在一個配備了KGPolicy的矩陣分解(MF)模型上進行了測試,它在最先進的采樣方法(如DNS和IRGAN)和kg增強的推薦模型(如KGAT)上都取得了顯著的改進。進一步從不同的角度進行分析,為知識感知抽樣提供了思路。我們通過這個https URL發布代碼和數據集。