亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

知識圖譜一直關注的研究熱點。中山大學等最新《知識圖譜嵌入:表征空間視角》研究綜述,32頁pdf闡述代數、幾何、分析下角度的知識圖譜嵌入,值得關注!

知識圖譜嵌入(Knowledge graph embedding, KGE)是一種日益流行的技術,旨在將知識圖譜中的實體和關系表示為低維的語義空間,在鏈接預測、知識推理和知識補全等領域有著廣泛的應用。在本文中,我們對現有的基于表示空間的KGE技術進行了系統的回顧。特別地,我們基于表示空間的三個數學角度** (1)代數角度、(2)幾何角度和(3)分析角度**建立了一個細粒度分類來對模型進行分類。在深入KGE模型及其數學性質之前,我們先介紹基本數學空間的嚴格定義。我們進一步討論了這三類不同的KGE方法,并總結了空間優勢如何在不同的嵌入需求中發揮作用。通過整理下游任務的實驗結果,我們還探索了數學空間在不同場景下的優勢及其背后的原因。進一步從表征空間的角度提出了一些有前景的研究方向,希望能啟發研究者在設計KGE模型及其相關應用時更多地考慮其數學空間性質。

//www.zhuanzhi.ai/paper/44427b32a1eea79e689822dd16ac0561

1. 概述

知識圖譜是一種存儲現實世界中事實知識的多關系圖。KGs中的節點表示現實世界中的實體(如名稱、事件和產品),邊表示實體之間的關系。通常,一個KG可以有效地存儲為知識三元組,其中每個三元組由兩個實體和它們之間的一個事實關系(即<頭實體、關系、尾實體>)組成。例如,在三重< RNA病毒,子類,COVID-19 >, RNA病毒和COVID-19是現實世界的實體和子類RNA病毒和COVID-19代表之間的關系。近年來,大型KGs的建設出現了快速增長,如YAGO[94]、Wikidata[104]、Freebase[7]和DBepedia[2]。由于它們在存儲和表示事實知識方面的有效性,它們已成功地應用于問答[91,132]、推薦系統[95,151]、信息檢索[34,118]和其他特定領域的應用[58,68]。盡管KGs在表示結構化事實信息方面是有效的,但由于其大規模和復雜的圖結構,它們很難操作。因此,如何有效、高效地從大規模KGs中提取和利用有用信息,用于下游任務,如鏈接預測[17,97,142]和實體分類[49,123,134],是一項艱巨的任務。為了解決這一具有挑戰性的任務,知識圖譜嵌入(Knowledge Graph Embedding, KGE)技術被提出,并在機器學習領域受到了大量關注[10,17,48,62,73,97]。KGE的基本思想是學習將一個KG的實體和關系嵌入到一個低維空間中(即向量嵌入),其中的嵌入要求保留原始KG的語義和關系結構。然后,可以利用學習到的實體和關系嵌入來解決下游應用,如KG補全[1,10,115,137,141],問題回答[24,61,127,132,150],信息提取[30,47,119,147]和實體分類[59,92]。

許多KGE技術被提出來學習KGs中實體和關系的嵌入[50,65,97,115,120]。一些KGE方法提出通過保留KGs中實體之間的關系模式來學習KG嵌入,例如,為了捕獲實體之間的轉換關系,提出了TransE[10]將KGs嵌入到歐氏空間中,并將實體之間的關系表示為向量空間中實體嵌入之間的平移向量。此外,為了保留和推斷KGs中的其他關系模式,包括對稱、反對稱、反轉和復合,RotatE[97]被提出將KGs映射到復向量空間中,其中關系表示為實體之間的旋轉。

另一種KGE方法提出通過保留KGs的結構模式來學習KG嵌入,這一工作的動機是大型KGs通常包含許多復雜和復合結構。例如,在圖1中,我們給出了KGs中三種典型的結構模式,即鏈結構、環結構和層次結構。為了有效地捕獲知識圖譜中的層次結構,提出了ATTH[3]將知識圖譜嵌入到曲率可訓練的雙曲空間中,在雙曲空間中可以使用比歐氏空間更豐富的變換來分離節點[76],同時捕獲邏輯模式。此外,一些KGE方法也嘗試將KGs嵌入到其他數學空間中,以在KGs中建模一些理想的性質,如KG2E[45]是第一個“基于密度”的嵌入技術,它學習KGs在高斯分布概率空間中的嵌入,以建模實體和關系的不確定性。此外,TorusE[26]選擇一個緊湊的李群作為其嵌入流形來處理正則化問題,ModulE[16]還引入了群理論,將實體和關系建模為群元素,這可以適應并優于大多數現有的KGE模型。從表示空間的角度,我們發現上述KGE方法大多學習在不同的數學空間(如歐氏空間、雙曲空間和概率空間)中嵌入,以捕獲KGs中不同的關系和結構模式,的確,不同的數學空間有其獨特的優勢,這有利于捕獲KGs中不同的模式和屬性,因此,我們認為表示空間在KGE方法中扮演著重要的角色。因為它決定了可以被KG嵌入捕獲和保存的KG的模式和屬性。除了KGE領域,一些研究[13,74,82]也證明了數學空間在傳統機器學習中的重要性。

一些研究致力于從數學空間的角度討論傳統的機器學習模型[74,82]。然而,目前還沒有從數學空間的角度對KGE方法進行系統的綜述。現有關于KGE方法的研究主要集中在編碼模型和KGE方法的應用上。例如Wang等[108]根據KGE方法的嵌入函數對其進行了分類,并將其分為三層:基于翻譯的模型、語義匹配模型和附加信息模型。Ji等人[51]從表示學習、評分函數、編碼模型和輔助信息四個方面全面介紹了KGE。Lu等人[70]調查了KGE方法,重點是利用文本信息。因此,本文旨在對知識圖嵌入技術的表示空間進行全面綜述,總結表示空間的不同性質,并為構建知識圖嵌入方法提供指導。為了從新的空間視角更好地理解KGE方法,在基本數學空間系統的啟發下,我們建立了一個系統的、全面的、多角度的分類法,根據現有KGE方法的表示空間對其進行分類。具體而言,我們建議將現有的KGE方法分為三類,即代數結構(algeaic Structure)、幾何結構(Geometric Structure)和分析結構(Analytical Structure)。圖2提供了我們的分類框架和屬于每個類別的一些代表性KGE方法的概述(詳細版本可以在第3節中找到)。在本綜述中,我們將介紹上述三種數學結構的定義和性質,并詳細介紹屬于這些類別的一些代表性KGE方法。此外,我們將總結不同的KGE方法的實驗結果,并為構建更有表現力和更強大的KGE方法提供一些建議和指導。此外,我們將從表示空間的角度指出KGE方法的新趨勢和進一步的發展方向。

據我們所知,我們是第一個通過建立一個全面的數學空間結構來總結KGE模型的調研。綜上所述,我們的工作貢獻可歸納如下:

這是第一篇全面綜述數學空間和KGE技術之間關系的論文。特別是,我們總結了KGE方法中不同數學空間的性質,以便清楚地了解它們在不同KGE方法中的數學性質。

我們根據現有的KGE模型的表示空間進行分類,同時從數學空間的角度對這些作品進行詳細的描述和比較。

基于對不同空間本質屬性的分析,我們為KGE任務提供了空間選擇的思路,這可以幫助研究人員和實踐者更好地理解空間特征,并為構建他們的KGE模型(包括損失函數、優化等)提供指導。

通過展示不同數學空間/結構中的一些獨特性質,對KGE任務提出了一些建議和未來的發展方向。這些性質可以啟發和推廣到其他場景,如自然語言處理,transformer等,不僅是KGE任務。

本文的其余部分組織如下。第2節介紹了基本數學空間的符號和嚴格定義,以及它們之間的關系。本節將提供關于各種表示空間的一些初步知識,并在這些空間與KGE模型的三個關鍵組件(即嵌入映射、評分函數和表示訓練)之間建立聯系。由于基本數學空間無法覆蓋現有KGE方法所使用的各種空間,我們從表示空間的角度開發了一個系統而全面的KGE方法分類框架。為了突出不同數學特征對KGE模型的出色作用,第3節介紹了提出的分類類別、不同空間的性質,并總結了空間優勢在KGE模型中的作用。隨后,第4節將介紹一些與空間相關的KG下游任務。通過結果,總結了數學空間在特定場景中的優勢以及哪些特征對任務至關重要。最后,我們在第5節中提出了我們的結論和未來的工作,在其中我們總結了三種不同的數學結構各自的優點及其背后的原因,這將有助于啟發我們在更多的領域構建最先進的算法,不限于KGE。

2. 知識圖嵌入中的表示空間

由于KG通常包含許多復雜的結構(如1-to-N、N-to-N和層次關系),研究人員提出將KG嵌入不同的表示空間,以更好地保存這些復雜的結構信息[17,26,41,122,142]。事實上,不同的表示空間有其獨特的結構和屬性,如我們在第2節中所示。但是,除了第2節中介紹的基本數學空間之外,還有更多的空間可以為KGE提供更好的屬性。例如,在雙曲空間中,區域和長度隨半徑呈指數增長,這為嵌入任務提供了更多的可用空間[3,17,76]。此外,在李群中,嵌入向量永遠不會無限發散,因此有效學習[26]不再需要對嵌入向量進行正則化。因此,建立在不同表示空間上的KGE方法能夠在原始KGs中捕獲和保存不同的結構和歸因信息。然而,從表示空間的角度對KG嵌入方法的系統綜述還沒有,也沒有文獻說明在特定KGE任務下如何正確選擇表示空間。在本文中,我們旨在通過總結基于其數學表示空間的結構和性質的KGE方法來填補這一空白。

3. 知識圖譜嵌入下游任務

在從數學結構的角度對現有的KGE模型進行系統回顧之后,本節將重點介紹基于KGE的下游任務。我們強調了一些重要的和流行的應用,它們通常被用來評估嵌入模型的性能。在總結和比較了幾種KGE模型的性能之后,從不同的空間角度分析了KGE模型的優缺點。在接下來的內容中,我們首先描述了鏈路預測的過程,這是KGE領域的一項基本任務,并重點介紹了一個流行的任務:鏈路預測場景中的層次獲取。此外,我們還對模式推理的任務進行了分析和討論。總結了數學特性在上述任務中的優勢。

付費5元查看完整內容

相關內容

知識圖譜(Knowledge Graph),在圖書情報界稱為知識域可視化或知識領域映射地圖,是顯示知識發展進程與結構關系的一系列各種不同的圖形,用可視化技術描述知識資源及其載體,挖掘、分析、構建、繪制和顯示知識及它們之間的相互聯系。 知識圖譜是通過將應用數學、圖形學、信息可視化技術、信息科學等學科的理論與方法與計量學引文分析、共現分析等方法結合,并利用可視化的圖譜形象地展示學科的核心結構、發展歷史、前沿領域以及整體知識架構達到多學科融合目的的現代理論。它能為學科研究提供切實的、有價值的參考。

知識薈萃

精品入門和進階教程、論文和代碼整理等

更多

查看相關VIP內容、論文、資訊等

知識圖譜推理(Knowledge graph reasoning, KGR)旨在從知識圖譜(Knowledge graphs, KGs)中挖掘出邏輯規則,從已有事實中推理出新的事實,已成為一個快速發展的研究方向。事實證明,知識圖譜在許多人工智能應用中可以顯著受益,如問答和推薦系統等。根據圖的類型,現有的KGR模型大致可以分為靜態模型、時序模型和多模態模型3類。該領域的早期工作主要集中在靜態KGR上,傾向于將通用的知識圖譜嵌入模型直接應用于推理任務。然而,這些模型并不適用于更復雜但實用的任務,如歸納靜態KGR、時序KGR和多模態KGR。為此,近年來開展了多項工作,但尚未有綜述性論文和開源庫對這一重要方向的模型進行全面的總結和討論為填補這一空白,從靜態知識圖譜到時序知識圖譜再到多模態知識圖譜,對知識圖譜推理的研究進展進行了綜述,介紹了知識圖譜推理模型的初步研究進展,總結了知識圖譜推理的典型數據集。此外,我們還討論了面臨的挑戰和潛在的機遇。對應的開源存儲庫共享在GitHub: //github.com/LIANGKE23/Awesome-Knowledge-Graph-Reasoning上。

1. 引言

人類學習技能有兩個主要來源,即專業書籍和工作經驗。例如,一個好醫生需要從學校獲得知識,從醫院獲得實踐經驗。然而,現有的人工智能模型大多只從經驗中模仿學習過程,而忽略了經驗中的學習過程,使得模型的可解釋性較差,性能也不夠理想。知識圖譜(knowledge graphs, KGs)以直觀的圖結構[1],[2],[3]存儲人類知識事實,可作為提供特定領域知識的書籍,因此被許多研究者視為潛在的解決方案。為了利用知識圖譜中的先驗知識,知識圖譜推理(knowledge graph reasoning,簡稱KGR)近年來受到了越來越多的關注。具體來說,KGR模型旨在從已有事實中推導出(A,父,B)∧(A,夫,C)→(C,母,B)的邏輯規則,從而推斷出圖1 (A)中的新事實(Savannah,母,Bronny)。實驗證明,KGR模型在問答[4]、推薦系統[5]、信息提取[6]、圖像分類[7]等應用中顯著提高了知識圖譜的使用效率。

根據圖譜類型(見圖1),知識圖譜推理可分為靜態KGR、時序KGR和多模態KGR 3類。早期工作主要關注靜態知識圖譜,并傾向于直接將通用知識圖譜嵌入(KGE)模型應用于推理任務,這顯示了轉導場景中靜態知識圖譜嵌入的巨大潛力。然而,對于更復雜但實用的任務,如歸納靜態KGR、時序KGR和多模態KGR,它們的表達能力受到限制。請注意,直推式和歸納式是與靜態KGR相關的兩種不同的推理場景,定義見第2.2節。為了解決這些問題,近年來提出了多種KGR模型。例如,GraIL[8]首先進行基于圖神經網絡(GNNs)的歸納推理,并以此為基礎提出了許多相關工作。此外,循環神經網絡(RNN)與GNN模型廣泛集成,以更好地表達時域KGR[9]、[10]、[11]的時間信息。有幾篇關于KGR任務的綜述論文。例如,[12]首先將KGR分為符號推理和統計推理,而[13]進一步將模型歸納為符號推理、神經推理和混合推理3種類型。隨后,[14]和[15]在基于邏輯和基于嵌入的KGR模型中提出了更細粒度的分類。然而,這些工作僅關注靜態KGR,而忽略了最近的進展,特別是在時態和多模態KGR領域。此外,它們都沒有討論所述KGR模型的推理場景,即直推式、歸納式、插值式和外推式。為填補這一空白,本文對知識圖譜推理進行了綜述,從靜態到時序再到多模態知識圖譜。然后,根據知識圖譜類型對近年來KGR模型和典型數據集進行了系統綜述;注意,還對所審閱的模型進行了推理場景的討論。最后總結了面臨的挑戰和潛在的機遇。我們的主要貢獻如下:

全面綜述。系統地回顧了161種知識圖譜推理模型,是其他模型的3倍多,并根據知識圖譜的類型,全面收集了67個典型數據集,即靜態知識圖譜、時序知識圖譜和多模態知識圖譜。此外,還分析了所述模型的推理技術和場景。據我們所知,這是第一個以圖類型和推理場景為標準來回顧模型的綜述。

深刻的分析。分析了現有KGR模型的優缺點及其適用范圍,為讀者研究基線的選擇提供有益的指導。

潛在的機會。文中總結了知識圖譜推理面臨的挑戰,并指出了一些潛在的機遇,可能對讀者有所啟發。

開源資源。我們在GitHub上分享了最先進的KGR模型和相關數據集:

本次綜述的結構組織如圖2所示。第二章簡要介紹了預審結果。然后,第3節對不同KG類型的SOTA KGR模型進行了全面回顧。在此之后,第4節列出了典型的基準KGR數據集。稍后,我們將在第5節討論KGR面臨的一些挑戰和機遇。最后,第六章對全文進行了總結。

2. 知識圖推理模型

對161種知識圖譜推理(KGR)模型進行了全面的綜述。具體地,根據知識圖譜類型,即靜態知識圖譜、時序知識圖譜和多模態知識圖譜,總結了KGR模型;

靜態 KGR模型

首先系統地介紹了88個靜態KGR模型。然后,根據推理場景對綜述模型進行分類;靜態KGR模型的分類如圖6所示。

基于嵌入的模型根據已有的事實三元組學習嵌入向量,然后根據評分函數計算的似然分數對前k個候選事實進行排序。大多數數量中有三種類型,即平移模型,張量分解模型和神經網絡模型。根據我們的觀察,基于嵌入的模型比其他模型多得多。因此,圖7給出了模型的時間軸,以便清晰地展示。

表2:靜態知識圖推理模型總結。

時序知識圖譜推理首先,系統地介紹了50種時態KGR模型,根據它們如何整合時間信息;然后,根據推理場景對綜述模型進行分類;時序KGR模型的分類如圖8所示

多模態KGR模型

現有的多模態KGR模型一般采用基于嵌入的推理模型,融合文本、圖像等多模態輔助特征后推斷出被查詢的事實。由于缺乏融合模塊,將靜態和時序KGR模型直接應用于多模態KGR任務通常會導致性能次優。作為一個早期的研究領域,相關的工作還不夠系統[164],[165],[166]。為此,本節只全面回顧了沿時間軸的23個典型多模態KGR模型(見圖9)。

3. 數據集

經驗表明,沒有針對KGR任務的全面數據集,特別是時間知識圖譜和多模態知識圖譜。為了更好地方便社區,我們全面地總結了數據集,并系統地提供了它們的統計數據。

4. 機會與挑戰

4.1 分布外推理

在現實場景中,知識圖譜中不斷出現新的實體和關系,而這些實體和關系在原知識圖譜中還未被充分挖掘,利用這些未被挖掘的元素對事實進行推理稱為分布外推理,這對知識圖譜模型的設計提出了更高的要求。最近的一些嘗試為推理未見過的實體提供了潛在的解決方案,稱為歸納推理模型,如[7],[70],[71],[73]。這些模型挖掘圖結構背后的邏輯規則,沒有考慮實體的具體含義,取得了較好的效果。對于未見過的關系推理,少樣本KGR模型[72]、[86]、[121]傾向于提高模型的泛化能力,使得訓練好的模型可以很好地擴展到具有少量事實的未見關系。換句話說,這些小樣本KGR模型可以根據之前學習到的相似知識快速學習新任務。此外,BERTRL[84]試圖根據語言模型計算出的文本語義來處理這種情況。而當語言模型沒有經過精細訓練時,這些模型的性能會急劇下降。綜上所述,面向分布外推理任務的KGR模型仍處于早期階段,值得未來深入探索。

4.2 大規模推理

工業領域的知識圖譜通常是大規模的,這就需要更高效的知識圖譜模型。為此,現有的一些工作試圖以漸進的方式優化傳播過程[242]。例如,NBF-net[81]集成了bellman-ford算法,以替代基于GNN的KGR模型中原始的基于dfs的聚合過程。此外,?Star[242]網絡使用貪婪算法進一步優化聚合過程。此外,圖聚類的思想[243],[244],[245]也被用于它。例如,CURL[93]首先根據實體語義將KGs分成不同的簇,然后將路徑搜索過程細化為兩級,即簇內級和簇間級。它減少了對整個圖的不必要搜索。同樣,許多工作是在子圖上進行推理,而不是在完全圖上進行推理,如GraIL [7], CSR[86]等。但其中大多數犧牲了推理的精度,對于更全面的模型,仍然可以探索推理的精度。

5.3多關系推理

multi-relational事實兩個實體之間存在的情況是常見的KG如圖11所示(一個)。然而,他們更多樣的結構和更復雜的語義uni-relational和bi-relational事實相比,如圖11所示(b)和(c)。因此,現有KGR模型主要關注uni-relational bi-relational事實甚至通常對待multi-relational事實uni-relational和bi-relational省略一些事實的事實。這樣的KGR模型不能準確地建模真實情況,丟失了大量有意義的語義信息,導致表達能力不足。未來需要研究如何利用多關系事實來提高推理能力。

4.4多模態推理

基于多源信息融合的知識推理可以通過結合文本語料庫或其他模態中的附加信息來降低知識圖譜的脫節和稀疏性。基于多模態數據融合的知識推理可以實現優勢互補,提高推理性能。然而,現有的多模態KGR模型仍處于早期階段。他們仍然傾向于直接將不同模態的嵌入連接在一起以進行最終得分計算。這些簡單的融合模式已經顯示出了良好的性能,而開發更細粒度和可擴展的模式仍然是有價值的。例如,權衡不同模態重要性的自適應融合模式值得探索。

4.5可解釋推理

可解釋性是各個領域深度學習模型普遍存在的重要問題。雖然KGR模型通常更易于解釋,但在這個主題中仍然值得進行更多的探索,特別是基于嵌入的KGR模型。目前,越來越多的KGR模型基于神經網絡,如GNN。他們中的大多數具有很強的表達能力,但缺乏可解釋性。相比之下,基于規則和基于路徑的KGR模型可解釋性強,但計算量大,表達能力弱。為了在表達能力和可解釋性之間取得良好的權衡,有一些嘗試將基于嵌入的模型與基于規則和基于路徑的模型相結合,如ARGCN[192]。它基于RGCN[57]生成的嵌入構建獎勵函數,這使那些基于路徑的模型更具解釋性。然而,大多數這些嘗試仍然很艱難。

4.6知識圖譜推理應用

雖然近年來提出了大量的KGR方法,展示了KGR在理論領域的巨大潛力,但其應用還需要更多的研究。目前,知識圖譜被廣泛應用于醫學、金融、抄襲檢測等領域。醫學知識推理模型旨在輔助醫生從電子病歷中進行疾病診斷。例如,[246]和[247]都對從電子醫療數據庫構建的KG進行推理。利用Bert等預訓練語言模型來生成實體的文本嵌入,這在現有的多模態KGR模型中被證明是有效的。此外,KGR模型還可以幫助反欺詐檢測,這是金融領域的一項重要任務。例如,[248]提出了一種基于案例推理的方法來幫助人們對信息進行驗證,以提前區分欺詐。此外,[249]通過持續學習的方式進行KGR方法來執行抄襲檢測。

付費5元查看完整內容

知識圖譜(KG)是一種用圖模型來描述知識和建模事物之間關聯關系的技術. 知識圖譜嵌入(KGE)作為一 種被廣泛采用的知識表示方法,其主要思想是將知識圖譜中的實體和關系嵌入到連續的向量空間中,用來簡化操作, 同時保留 KG 的固有結構.它可以使得多種下游任務受益,例如 KG 補全和關系提取等. 本文首先對現有的知識圖譜嵌入技術進行全面回顧,不僅包括使用 KG 中觀察到的事實進行嵌入的技術,還包括添加時間維度的動態 KG 嵌入方法, 以及融合多源信息的 KG 嵌入技術.對相關模型從實體嵌入、關系嵌入、評分函數等方面進行分析、對比與總結. 然后簡要介紹 KG 嵌入技術在下游任務中的典型應用,包括問答系統、推薦系統和關系提取等.最后闡述知識圖譜 嵌入面臨的挑戰,對未來的研究方向進行展望.

引言

知識圖譜(Knowledge Graph,KG)作為人工智能的一個分支,引起了學術界和工業界的廣泛關注,其構建與應用也得到了迅速發展.例如 Freebase[1] ,DBpedia[2] ,YAGO[3] ,NELL[4] ,Wikidata[5]等知識圖譜已經被成功創建并 應用于許多現實世界應用,從語義分析[6,7]、命名實體消歧[8,9] ,到信息提取[10,11]和問答系統[12,13]等.知識圖譜是以 現實世界的實體為節點,實體之間的關系為邊的有向圖.在這個圖中,每個有向邊連同其頭實體與尾實體構成了 一個三元組,即(頭實體,關系,尾實體),表示頭實體與尾實體通過關系進行連接.盡管知識圖譜在表示結構化數據 方面非常有效,但這種三元組的基本符號性質使 KG 難以操作[14] .

為了解決這個問題,近年來提出了一個新的研究方向,稱為知識圖譜嵌入(Knowledge Graph Embedding, KGE)或知識表示學習(Knowledge Representation Learning, KRL),旨在將 KG 的組成部分(包括實體和關系)嵌入 到連續的向量空間中,以在簡化操作的同時保留 KG 的固有結構.與傳統的表示方法相比,KGE 為 KG 中的實體 和關系提供了更加密集的表示,降低了其應用中的計算復雜度.此外,KGE 可以通過度量實體和關系低維嵌入的 相似性來顯式地捕獲實體和關系之間的相似性.

盡管研究者已提出多種模型來學習 KG 中的實體和關系表示,但是目前大多數可用的技術仍然僅根據知識 圖譜中觀察到的事實來執行嵌入任務.具體地說,給定一個 KG,首先在低維向量空間中表示實體和關系,并為每 個三元組定義一個評分函數以衡量其在該空間中的合理性.然后通過最大化觀察到的三元組的總合理性來學 習實體和關系的嵌入.這些學習的嵌入還可以進一步用于實現各種任務,例如 KG 補全[15,16] ,關系提取[10,17] ,實體 分類[18,19] ,實體解析[18,20]等.由于在整個過程中僅要求學習的嵌入在每個單獨的事實中兼容,因此對下游任務可 能沒有足夠的預測性[21,22] .近年來,越來越多的研究者開始進一步考慮利用其他類型的信息,例如實體類型 [23,24] ,文本描述[25-28] ,關系路徑[29-31] ,甚至邏輯規則[32,33]來學習更多的預測嵌入.

本文內容結構組織如下:第 1 節介紹相關工作調查與基本符號定義;第 2 節對僅使用 KG 中觀察到的事實進 行嵌入的技術進行全面回顧,具體介紹基于距離的模型,語義匹配模型以及最新的 KGE 技術;第 3 節主要討論了 融合時間信息的動態知識圖譜嵌入技術,詳細介紹 t-TransE、Know-Evolve、HyTE、TDG2E 等代表性的動態 KGE 方法;第 4 節歸納了除 KG 中觀察到的事實以外的結合附加信息的 KGE 技術,例如實體類別、文本描述、 關系路徑等.第 5 節介紹 KGE 技術在下游任務中的典型應用.第 6 節對 KGE 技術面臨的挑戰與未來研究方向 進行討論.最后,第 7 節對全文工作進行總結.

1 符號定義

知識圖譜嵌入旨在將 KG 中的實體和關系嵌入到一個低維連續的語義空間中.為了便于說明,本小節定義 幾種基本符號.首先,定義知識圖譜為 G=(E,R,S).

2. 使用事實進行知識圖譜嵌入

本節對僅使用事實進行知識圖譜嵌入的方法采用評分函數進行劃分.評分函數用于衡量事實的合理性,在 基于能量的學習框架中也被稱為能量函數.典型類型的評分函數分為兩種:基于距離的評分函數(如圖 1(a))與基 于相似性的評分函數(如圖 1(b)).

2.1 基于距離的模型

基于距離的模型使用基于距離的評分函數,即通過計算實體之間的距離來衡量事實的合理性,在這種情況 下,翻譯原理 h+r=t, 被廣泛使用.也就是說,基于距離的模型通常由關系執行翻譯后,根據兩個實體之間的距離 來度量一個事實的合理性.本小節將基于距離的模型進一步細分為基本距離模型,翻譯模型和復雜關系建模.

基于距離的模型總結

2.2 語義匹配模型

語義匹配模型利用基于相似性的評分函數,即通過語義匹配來衡量事實的合理性.語義匹配通常采用乘法 公式圖片來變換表示空間中的頭實體,使其與尾實體相近.本節根據實體和關系編碼的不同模型結構來 介紹代表性的語義匹配模型.

語義匹配模型總結

2.3 最新的知識圖譜嵌入模型

大多數翻譯模型和雙線性模型是 2016 年之前提出的方法,而最近幾年研究 KGE 的方法眾多.本小節簡要 介紹其中的主流方法,具體劃分為卷積神經網絡模型,旋轉模型,雙曲幾何模型和其他模型.

最新的知識圖譜嵌入模型總結

第 2 節主要介紹了 3 大類知識圖譜嵌入方法,即:基于距離的模型,語義匹配模型與最新的 KGE 模型,并結 合已有的研究成果對其進行了分析.根據上述分析結果,表 5 從類別,方法,提出年份及優缺點四方面對這幾類知 識圖譜嵌入方法的部分代表模型進行對比.

3 動態知識圖譜嵌入

當前 KGE 的研究主要集中于靜態知識圖譜,其中事實不會隨時間發生變化,例如:TransE,TransH,TransR, RESCAL 等等.但是,在實際應用中,知識圖譜通常是動態的,例如 Twitter 中的社交知識圖,DBLP 中的引文知識 圖等,其中事實隨時間演變,僅在特定時間段內有效.以往的靜態 KGE 方法完全忽略了時間信息,這使得靜態 KGE 方法無法在這些實際場景中工作.因此,有必要設計一種用于動態知識圖譜嵌入的方法.

4 融合多源信息的知識圖譜嵌入

多源信息提供了知識圖譜中三元組事實以外的信息,能夠幫助構建更加精準的知識表示,僅使用事實進行 知識圖譜嵌入的方法忽略了蘊含在多源信息中的豐富知識,例如:實體類別信息、文本描述信息、關系路徑等. 充分利用這些多源信息對于降低實體與關系之間的模糊程度,進而提高推理預測的準確度至關重要.

5 知識圖譜嵌入的應用

近年來,知識驅動的應用在信息檢索和問答等領域取得了巨大成功,這些應用有望幫助準確深入地了解用 戶需求,并給出適當響應.知識圖譜嵌入方法的核心思想是將每個實體、關系表示為一個低維向量,而學習到的 實體、關系嵌入可以受益于多種下游任務.在本節中,我們將介紹 KGE 的典型應用.

5.1 基于知識圖譜嵌入的問答

隨著大規模知識圖譜的興起,基于知識圖譜的問答(QA)成為重要的研究方向,引起了人們的廣泛關注.現實 世界的領域中通常包含數百萬到數十億個事實,其龐大的數據量和復雜的數據結構使得用戶很難訪問其中有 價值的知識.為了緩解這個問題,提出了基于知識圖譜的問答(QA-KG). QA-KG 旨在利用知識圖譜中的事實來回答自然語言問題.可以幫助普通用戶在不知道 KG 數據結構的情 況下,高效地訪問 KG 中對自己有價值的知識.然而,由于涉及到語義分析[114]和實體鏈接[115,116]等多個具有挑戰 性的子問題,QA-KG 的問題還遠未得到解決.近年來,隨著 KGE 在不同的實際應用中表現出的有效性,人們開始 探索其在解決 QA-KG 問題中的一些潛在作用. Bordes 等人[117]基于訓練問題和問題釋義學習單詞,關系和實體的低維表示,以便將新問題和候選事實投影 到同一空間中進行比較.Yang 等人[118,119]利用問題和潛在事實的邏輯性質,將問題和候選答案投影到統一的低 維度空間中.還有一些基于深度學習的模型[120-124]通過將問題中的單詞輸入神經網絡來實現這種投影.

值得注意的是,最近,Huang 等人[125]提出了一個簡單有效的基于知識圖譜嵌入的問答框架(KEQA),旨在解 決簡單問題,即 QA-KG 中最常見的問題類型.KEQA 不是直接推斷問題的頭實體和謂詞,而是在 KGE 空間中聯 合恢復自然語言問題的頭實體,關系和尾實體表示來回答問題.最后,基于知識圖譜子集(FB2M、FB5M[125] )和問 答數據集 SimpleQuestions[117]進行實驗,通過與七個??最新提出的 QA-KG 算法進行對比,KEQA憑借在簡單問題 上獲得 20.3%的準確性改進獲得了優于所有基線的性能. 此外,為了驗證在使用不同的 KGE 算法時 KEQA 的 通用性,分別使用 TransE [15]、TransH [16]、TransR [43]執行知識圖譜嵌入,實驗結果表明 KGE算法顯著提高了 KEQA 的性能,與 KEQA_noEmbed??相比,KEQA 基于 TransE 時實現了 3.1%的改進,并且 KEQA 在使用不同的 KGE 算 法時性能相近,證明了 KEQA 的通用性,此外,即使不使用 KGE,KEQA 仍然可以獲得與最先進的 QA-KG 方法相 當的性能,驗證了 KEQA 的健壯性。

5.2 推薦系統

在過去的幾年中,利用知識圖譜的推薦系統已被證明與最先進的協作過濾系統具有競爭力,能有效地解決 新項目和數據稀疏性等問題[126-130] .最近,KGE 的流行促進了利用 KGE 捕獲實體語義進行推薦這一研究熱點, 使用 KGE 已被證明對推薦系統有效. Zhang 等人提出使用 TransR[43]的協作知識圖嵌入(collaborative knowledge base embedding,CKE)[131] ,以學 習結合視覺和文本嵌入的項目結構表示.深度知識感知網絡(deep knowledge-aware network,DKN) [132]利用 TransD[44]學習實體嵌入,并通過將它們與詞嵌入相結合來設計 CNN 框架,用于新聞推薦.但是,由于需要提前學 習實體嵌入,DKN 不能以端到端的方式進行訓練.為了實現端到端的訓練,MKR(multi-task feature learning approach for knowledge graph)[133]通過共享潛在特征和建模高階項-實體交互,將多任務知識圖譜表示和推薦關 聯起來.Ai 等人[134]通過 TransE[15]方法學習用戶和項目嵌入,并基于投影空間中的用戶-項目相似度評分進行推 薦.文獻[135]為優惠推薦任務提出了一個神經分解(neural factorization,NF)模型,以 KG 的形式對可用數據進行 建模,并使用 TransE 學習實體和關系的嵌入. 最近,Sha 等人提出了一種新穎的注意力知識圖譜嵌入(attentive knowledge graph embedding,AKGE)框架 [136] ,以更好地利用 KG 進行有效推薦.該框架以交互特定的方式充分利用了 KG 的語義和拓撲,為推薦結果提供 了可解釋性.此外,Ni 等人描述了一種用于 Wikipedia 的基于嵌入的實體推薦框架[137] ,該框架將 Wikipedia 組織 成一系列彼此重疊的圖,從它們的拓撲結構和內容中學習互補的實體表示,并將其與輕量級的學習方法相結合, 以推薦 Wikipedia 上的相關實體.通過使用 Wikipedia 作為框架的輸入,兩個實體推薦數據集??作為基礎事實,進 行離線和在線評估,證明了所產生的嵌入和推薦在質量和用戶參與度方面表現良好.

5.3 關系提取 關系提取(relation extraction,RE)是信息提取中的一項重要任務,旨在根據兩個給定實體的上下文來提取它 們之間的關系.由于 RE 具有提取文本信息的能力,并使許多自然語言處理應用受益(例如:信息檢索,對話生成, 問答等),因此受到很多研究者的青睞. 常規的監督模型已經在關系提取任務中得到深入研究,但是,它們的性能在很大程度上依賴于訓練數據的 規模和質量.為了構建大規模數據,Mintz 等人[138]提出了一種新穎的遠程監督(distant supervision,DS)機制,通過 將現有知識圖譜與文本對齊來自動標記訓練實例.DS 使 RE 模型能夠在大規模的訓練語料庫上工作,因此遠程 監督的 RE 模型[139-141]已經成為從純文本中提取新事實的主流方法.但是,這些方法僅在知識獲取中使用純文本 中的信息,而忽略了 KG 結構所包含的豐富信息.

受 KG 豐富的知識啟發,很多研究工作在 KG 的指導下擴展了 DS 模型.Weston 等人[142]提出將 TransE 與現 有的遠程監督的 RE 模型相結合以提取新的事實,并且獲得了較大改進.此外,Han 等人[143]提出了一種針對 KRL和 RE 的聯合表示學習框架,文獻[37]證實了現有的 KRL 模型可以有效增強遠程監督的 RE 模型.最近,Han 等人 [144]提出了一個通用的聯合表示學習框架,用于知識圖譜補全(knowledge graph completion,KGC)和從文本中提 取關系(relation extraction,RE)兩個任務,該框架適用于非嚴格對齊的數據.此外,Lei 等人[145]提出了一種具有雙 向知識提煉的神經關系提取框架,以協同使用不同的信息源,減輕了遠程監督關系提取中的噪聲標簽問題.但 是,這些工作忽略了關系之間的豐富關聯.Zhang 等人[146]提出 KG 中的關系符合三層層次關系結構(hierarchical relation structure,HRS),并擴展了現有的 KGE 模型:TransE,TransH 和 DistMult,以利用 HRS 的信息學習知識表 示.Zhang 等人在 FB15k[15]、FB15k237[147]、FB13 [78]、WN18[15]和 WN11[78]數據集上進行了鏈接預測和三元組 分類任務的實驗評估,結果表明,相比于原始模型以及其他基線模型 TransE、TransH、DistMult,擴展模型 (TransE-HRS、TransH-HRS、DistMult-HRS)始終獲得最佳性能,驗證了模型的有效性,同時也證明了考慮關系結 構對于 KG 補全非常有效.

6 挑戰與展望

目前,KGE 作為處理大型知識圖譜的一種方便有效的工具,被廣泛探索并應用于多種知識驅動型任務,極大 地提高了任務的性能,同時也存在許多可能的有待探索的領域.在本小節中,我們將討論 KGE 面臨的挑戰及其 未來研究方向.

6.1 面臨的挑戰 6.1.1 探索 KG 的內部和外部信息 KG 中的實體和關系具有復雜的特性和豐富的信息,而這些信息尚未得到充分考慮.本小節將討論為增強 KGE 方法的性能而需要進一步探索的內部和外部信息.

知識類型:不同的 KGE 方法在處理 1-1,1-N,N-1 和 N-N 關系時具有不同的性能,這表明針對不同類型的知 識或關系需要設計不同的 KGE 框架.然而,現有的 KGE 方法簡單地將所有關系分為 1-1,1-N,N-1 和 N-N 關系, 不能有效地描述知識的特征.根據知識的認知和計算特性,現有知識可分為以下幾種類型:(1)表示實體之間從屬 關系(如 has part).(2)表示實體屬性信息(如 nationality).(3)表示實體之間的相互關系(如 friend of).這些不同類型 的關系應該采用不同的方式建模.

多語言嵌入:文獻[40]觀察到不同語言的向量空間之間對應概念的幾何排列具有很強的相似性,并提出兩個 向量空間之間的跨語言映射在技術上是可行的.多語言 KG 對于知識共享具有重要意義,并且在跨語言信息檢 索,機器翻譯,問答等領域發揮著重要作用.然而,現有的關于多語言 KG 嵌入的研究很少,因此多語言 KGE 的研 究是一項有待解決的有意義但又具有挑戰性的工作.

多源信息學習:隨著網絡技術的快速發展,如今的互聯網不僅包含頁面和超鏈接,音頻、圖片和視頻等多源 信息也越來越多地出現在網絡上.因此,如何高效地利用從文本到視頻的多源信息已成為 KGE 中的一個關鍵且 具有挑戰性的問題.現有的利用多源信息的方法尚處于初步階段,諸如社交網絡之類的其他形式的多源信息仍 然獨立于知識圖譜表示的構建,因此還有待進一步研究.

One-shot/Zero-shot 學習:近年來,One-shot/Zero-shot 學習在單詞表示,情感分類,機器翻譯等各個領域中蓬 勃發展.One-shot/Zero-shot 學習的目的是從一個只有少量實例的類或一個從未見過的類的實例中學習,在知識 圖譜表示中,一個實際的問題是低頻實體和關系的學習比高頻實體和關系的學習更差.然而,借助實體和關系的 多語言和多模態表示,低頻實體和關系的表示可以在一定程度上得到改善.此外,有必要設計新的 KGE 框架,使 其更適合于低頻實體和關系的表示學習.

6.1.2 知識應用的復雜性

KG 在各種應用中發揮著重要的作用,例如 Web 搜索,知識推理和問答.但是,由于現實世界中知識應用的復 雜性,難以高效地利用 KG.在本小節中,將討論在實際應用中使用 KG 時遇到的問題. KG 質量低:知識應用的主要挑戰之一是大型 KG 本身的質量問題.Freebase,DBpedia,Yago,Wikidata 等典型 的 KG 通常是從互聯網上的大量純文本中自動獲取知識來獲取事實三元組.由于缺乏人工標注,這些 KG 遭受噪 音和矛盾的問題.當涉及到實際應用時,這些噪音和矛盾將導致錯誤傳播.因此,如何自動檢測現有 KG 中的矛盾 或錯誤已成為將 KG 的信息納入實際應用中的重要問題. KG 體積過大:現有的 KG 過于繁瑣,無法有效地部署在實際應用中.此外,由于 KG 的體積過大,現有的一些 方法由于計算復雜度的問題也并不實用.因此,有必要在現有的方法上進行改進. KG 不斷變化:隨著時間推移,不斷有新的知識產生.現有的 KGE 方法由于其優化目標與 KG 中的所有事實 三元組相關,因此每次 KG 發生變化時都需要從頭開始重新學習模型.如果在實際應用中使用 KG,那么它既費時 又不實用.因此,設計一種可以進行在線學習并逐步更新模型參數的 KGE 框架對 KG 的應用至關重要.

6.2 未來方向 6.2.1 統一框架 一些知識圖譜表明學習模型已經被證明是等價的.例如,文獻[68]證明 HolE 和 ComplEx 在數學上等價于具 有某些約束的鏈接預測.ANALOGY[69]提供了包括 DistMult,ComplEx 和 HolE 在內的幾種代表性模型的統一視 圖.Wang 等人[62]探討了幾種雙線性模型之間的聯系.Chandrahas 等人[159]探索了加法和乘法 KGE 模型的幾何理 解.大多數工作使用不同的模型來描述知識獲取和關系提取.然而,以類似于圖網絡統一框架的方式進行的統一 研究[158]是彌合研究差距的一種有價值的方法.

6.2.2 可解釋性 知識表示的可解釋性是知識獲取和實際應用中的關鍵問題.現有方法已為可解釋性作出了初步努力. ITransF[51]采用稀疏向量進行知識遷移,通過注意力可視化進行解釋.CrossE[92]利用基于嵌入的路徑搜索生成對 鏈接預測的解釋,探索了知識圖譜的解釋方案.然而,這些神經模型在透明度和可解釋性方面受到了限制,一些 方法結合邏輯規則來提高互操作性,從而將黑盒神經模型與符號推理相結合.因此,應該進一步研究可解釋性并 提高預測知識的可靠性.

6.2.3 可擴展性 在大規模知識圖譜中,可擴展性非常重要.幾種嵌入方法利用簡化來降低計算代價,例如,通過循環相關運 算簡化張量積[66] .但是,這些方法仍然難以擴展到數以百萬計的實體和關系中.最近的神經邏輯模型[161]中的規 則是由簡單的蠻力搜索產生的,這使得它們在大規模知識圖上表現不足.ExpressGNN[162]試圖使用 NeuralLP [163] 進行有效的規則歸納.但是,要處理繁瑣的深層架構和不斷增長的知識圖還需要進一步完善. 6.2.4 自動構建 當前的 KG 高度依賴于人工構建,這是勞動密集且昂貴的.知識圖譜在不同認知智能領域的廣泛應用需要 從大規模的非結構化內容中自動構建知識圖譜.最近的研究主要是在現有知識圖的監督下進行半自動構建.面 對多模態,異構性和大規模應用,自動構建仍然是未來亟待解決的重要問題.

7 總結

知識圖譜作為一種語義網絡擁有極強的表達能力和建模靈活性,可以對現實世界中的實體、概念、屬性以 及它們之間的關系進行建模.隨著最近出現的知識表示學習、知識獲取方法和各種知識圖譜應用,知識圖譜引 起了越來越多的研究關注.知識圖譜嵌入旨在將實體和關系嵌入到連續向量空間中,在各種面向實體的任務中得到了重要應用.本文圍繞知識圖譜嵌入技術的研究現狀,通過回顧僅使用事實進行知識圖譜嵌入的方法、添 加時間維度的動態 KGE 方法以及融合多源信息的 KG E 技術介紹了現有的知識圖譜嵌入技術.并簡要討論了 KGE 技術在下游任務中的實際應用.最后總結了知識圖譜嵌入領域所面臨的挑戰,并對其未來的方向做出展望. 我們進行這項調查的目的是對當前 KGE 的代表性研究工作進行總結,并且希望這一探索可以為 KGE 的未來研 究提供幫助.

付費5元查看完整內容

圖是連接數據網絡結構的一種常用表示形式。圖數據可以在廣泛的應用領域中找到,如社會系統、生態系統、生物網絡、知識圖譜和信息系統。隨著人工智能技術的不斷滲透發展,圖學習(即對圖進行機器學習)越來越受到研究者和實踐者的關注。圖學習對許多任務都非常有效,如分類,鏈接預測和匹配。圖學習方法通常是利用機器學習算法提取圖的相關特征。在這個綜述中,我們提出了一個關于圖學習最全面的概述。特別關注四類現有的圖學習方法,包括圖信號處理、矩陣分解、隨機游走和深度學習。分別回顧了這些類別下的主要模型和算法。我們研究了諸如文本、圖像、科學、知識圖譜和組合優化等領域的圖學習應用。此外,我們還討論了該領域幾個有前景的研究方向。

真實的智能系統通常依賴于機器學習算法處理各種類型的數據。盡管圖數據無處不在,但由于其固有的復雜性,給機器學習帶來了前所未有的挑戰。與文本、音頻和圖像不同,圖數據嵌入在一個不規則的領域,使得現有機器學習算法的一些基本操作不適用。許多圖學習模型和算法已經被開發出來解決這些挑戰。本文系統地綜述了目前最先進的圖學習方法及其潛在的應用。這篇論文有多種用途。首先,它作為不同領域(如社會計算、信息檢索、計算機視覺、生物信息學、經濟學和電子商務)的研究人員和從業者提供圖學習的快速參考。其次,它提供了對該領域的開放研究領域的見解。第三,它的目的是激發新的研究思路和更多的興趣在圖學習。

圖,又稱網絡,可以從現實世界中豐富的實體之間的各種關系中提取。一些常見的圖表已經被廣泛用于表達不同的關系,如社會網絡、生物網絡、專利網絡、交通網絡、引文網絡和通信網絡[1]-[3]。圖通常由兩個集合定義,即頂點集和邊集。頂點表示圖形中的實體,而邊表示這些實體之間的關系。由于圖學習在數據挖掘、知識發現等領域的廣泛應用,引起了人們的廣泛關注。由于圖利用了頂點[4],[5]之間的本質和相關關系,在捕獲復雜關系方面,圖學習方法變得越來越流行。例如,在微博網絡中,通過檢測信息級聯,可以跟蹤謠言的傳播軌跡。在生物網絡中,通過推測蛋白質的相互作用可以發現治療疑難疾病的新方法。在交通網絡中,通過分析不同時間戳[6]的共現現象,可以預測人類的移動模式。對這些網絡的有效分析很大程度上取決于網絡的表示方式。

一般來說,圖學習是指對圖進行機器學習。圖學習方法將圖的特征映射到嵌入空間中具有相同維數的特征向量。圖學習模型或算法直接將圖數據轉換為圖學習體系結構的輸出,而不將圖投影到低維空間。由于深度學習技術可以將圖數據編碼并表示為向量,所以大多數圖學習方法都是基于或從深度學習技術推廣而來的。圖學習的輸出向量在連續空間中。圖學習的目標是提取圖的期望特征。因此,圖的表示可以很容易地用于下游任務,如節點分類和鏈接預測,而無需顯式的嵌入過程。因此,圖學習是一種更強大、更有意義的圖分析技術。

在這篇綜述論文中,我們試圖以全面的方式檢驗圖機器學習方法。如圖1所示,我們關注現有以下四類方法:基于圖信號處理(GSP)的方法、基于矩陣分解的方法、基于隨機游走的方法和基于深度學習的方法。大致來說,GSP處理圖的采樣和恢復,并從數據中學習拓撲結構。矩陣分解可分為圖拉普拉斯矩陣分解和頂點接近矩陣分解。基于隨機游動的方法包括基于結構的隨機游動、基于結構和節點信息的隨機游動、異構網絡中的隨機游動和時變網絡中的隨機游動。基于深度學習的方法包括圖卷積網絡、圖注意力網絡、圖自編碼器、圖生成網絡和圖時空網絡。基本上,這些方法/技術的模型架構是不同的。本文對目前最先進的圖學習技術進行了廣泛的回顧。

傳統上,研究人員采用鄰接矩陣來表示一個圖,它只能捕捉相鄰兩個頂點之間的關系。然而,許多復雜和不規則的結構不能被這種簡單的表示捕獲。當我們分析大規模網絡時,傳統的方法在計算上是昂貴的,并且很難在現實應用中實現。因此,有效地表示這些網絡是解決[4]的首要問題。近年來提出的網絡表示學習(NRL)可以學習低維表示[7]-[9]的網絡頂點潛在特征。當新的表示被學習后,可以使用以前的機器學習方法來分析圖數據,并發現數據中隱藏的關系。

當復雜網絡被嵌入到一個潛在的、低維的空間中時,結構信息和頂點屬性可以被保留[4]。因此,網絡的頂點可以用低維向量表示。在以往的機器學習方法中,這些向量可以看作是輸入的特征。圖學習方法為新的表示空間中的圖分析鋪平了道路,許多圖分析任務,如鏈接預測、推薦和分類,都可以有效地解決[10],[11]。網絡的圖形化表現方式揭示了社會生活的各個方面,如交流模式、社區結構和信息擴散[12],[13]。根據頂點、邊和子圖的屬性,可以將圖學習任務分為基于頂點、基于邊和基于子圖三類。圖中頂點之間的關系可以用于分類、風險識別、聚類和社區檢測[14]。通過判斷圖中兩個頂點之間的邊的存在,我們可以進行推薦和知識推理。基于子圖[15]的分類,該圖可用于聚合物分類、三維可視化分類等。對于GSP,設計合適的圖形采樣方法以保持原始圖形的特征,從而有效地恢復原始圖形[16]具有重要意義。在存在不完整數據[17]的情況下,可以使用圖恢復方法構造原始圖。然后利用圖學習從圖數據中學習拓撲結構。綜上所述,利用圖學習可以解決傳統的圖分析方法[18]難以解決的以下挑戰。

付費5元查看完整內容

摘要

知識圖譜(KGs)在工業和學術領域有很多應用,這反過來又推動了朝著大規模地從各種來源提取信息大量的研究工作。盡管付出了這些努力,但眾所周知,即使是最先進的KGs也是不完整的。鏈路預測(Link Prediction, LP)是一種根據KG中已存在的實體去預測缺失事實的任務,是一種有前途的、廣泛研究的、旨在解決KG的不完整的任務。在最近的LP技術中,基于KG嵌入的LP技術在一些基準測試中取得了很好的性能。盡管這方面的文獻在迅速增加,但對這些方法中各種設計選擇的影響卻沒有引起足夠的注意。此外,這一領域的標準做法是通過測試大量的事實來報告準確性,其中一些實體被過度表示;這允許LP方法通過只修改包含這些實體的結構屬性來展示良好的性能,而忽略KG的主要部分。本篇綜述分析提供了基于嵌入的LP方法的全面比較,將分析的維度擴展到常見的文獻范圍之外。我們通過實驗比較了16種最先進的方法的有效性和效率,考慮了一個基于規則的基準,并報告了文獻中最流行的基準的詳細分析。

介紹

知識圖譜(KGs)是真實世界信息的結構化表示。在一個KG中,節點表示實體,例如人和地點;標簽是連接它們的關系類型;邊是用關系連接兩個實體的特定事實。由于KGs能夠以機器可讀的方式對結構化、復雜的數據進行建模,因此它被廣泛應用于各個領域,從問答到信息檢索和基于內容的推薦系統,并且對于任何語義web項目都非常重要。常見的KG有FreeBase、WikiData、DBPedia、Yago和行業KG有谷歌KG、Satori和Facebook Graph Search。這些巨大的KG可以包含數百萬個實體和數十億個事實。

盡管有這樣的努力,但眾所周知,即使是最先進的KGs也存在不完整性問題。例如,據觀察FreeBase是用于研究目的的最大和最廣泛使用的KGs之一,但是在FreeBase中超過70%的個體沒有出生地點,超過99%的個體沒有民族。這使得研究人員提出了各種各樣的技術來糾正錯誤,并將缺失的事實添加到KGs中,通常稱為知識圖譜補全或知識圖譜增強任務。可以通過從外部源(如Web語料庫)提取新的事實,或者從KG中已經存在的事實推斷缺失的事實,來增長現有的KG。后來的方法,稱為鏈接預測(LP),是我們分析的重點。

LP一直是一個日益活躍的研究領域,最近受益于機器學習和深度學習技術的爆炸式增長。目前絕大多數LP模型使用原始的KG元素來學習低維表示,稱為知識圖譜嵌入,然后利用它們來推斷新的事實。在短短幾年的時間里,研究人員受到RESCAL和TransE等一些開創性工作的啟發,開發了幾十種基于不同的架構的新模型。這一領域的絕大多數論文都有一個共同點,但也存在問題,那就是它們報告的結果匯總在大量的測試事實之上,其中很少有實體被過度表示。因此,LP方法可以在這些基準上表現出良好的性能,只對這些實體進行訪問,而忽略其他實體。此外,當前最佳實踐的局限性可能使人們難以理解這一文獻中的論文是如何結合在一起的,以及如何描述出值得追求的研究方向。除此之外,目前技術的優點、缺點和局限性仍然是未知的,也就是說,幾乎沒有研究過允許模型更好地執行的情況。粗略地說,我們仍然不知道是什么可以讓一個事實變得容易還是難以學習和預測。

為了緩解上述問題,我們對一組有代表性的基于KG嵌入的LP模型進行了廣泛的比較分析。我們優先考慮最先進的系統,并考慮屬于廣泛的體系結構的工作。我們從零開始對這些系統進行訓練和調整,并通過提出新的、信息豐富的評估實踐,提供超出原始論文的實驗結果。具體是:

我們考慮了16個模型,屬于不同的機器學習和深度學習架構;我們還采用了一個基于規則挖掘的附加的最先進的LP模型作為基線。我們提供了實驗比較考慮的方法的詳細描述和相關文獻的總結,以及知識圖譜嵌入技術的教育分類。 我們考慮了5個最常用的數據集,以及目前用于基準測試的最流行的指標;我們詳細分析了它們的特點和特性。 對于每個模型,我們為每個數據集提供了效率和有效性的定量結果。 我們在訓練數據中提出一組結構特征,并測量它們如何影響每個模型對每個測試事實的預測性能。

方法概述

在本節中,我們描述并討論了基于潛在特征的知識管理的主要方法。正如在第2節中所描述的,LP模型可以利用各種各樣的方法和架構,這取決于它們如何對優化問題進行建模,以及它們實現來處理優化問題的技術。

為了概述它們高度不同的特征,我們提出了一種新的分類法,如圖1所示。我們列出了三個主要的系列模型,并進一步將它們劃分為更小的組,以獨特的顏色標識。對于每個組,我們都包括最有效的代表性模型,優先考慮那些達到最先進性能的模型,并且在任何可能的情況下,優先考慮那些具有公開可用實現的模型。結果是一組16個模型,基于極其多樣化的架構;這些是我們隨后在比較分析的實驗部分所使用的模型。對于每個模型,我們還報告了發表的年份以及從其他模型得到的信息。我們認為,這種分類有助于理解這些模型和在我們的工作中進行的實驗。表1報告了關于所包括的模型的進一步信息,例如它們的損失函數和空間復雜性。我們確定了三大類模型:1)張量分解模型;2)幾何模型;3)深度學習模型。

張量分解模型

這個家族的模型將LP解釋為一個張量分解的任務。這些模型隱式地將KG考慮為一個三維鄰接矩陣(即一個3維張量),由于KG的不完整性,這個鄰接矩陣只有部分可觀測。張量被分解成低維向量的組合(比如一個多線性乘積):這些向量被用作實體和關系的嵌入表示。張量分解的核心思想是,只要訓練集訓練不過擬合,則學習到的嵌入應該能夠泛化,并將高值與圖鄰接矩陣中不可觀測的真實事實相關聯。在實踐中,每個事實的得分都是通過對事實中涉及的特定嵌入進行組合計算得出的;通過優化所有訓練事實的評分函數,可以像往常一樣進行學習嵌入。這些模型傾向于使用很少或根本沒有共享參數;這使得它們特別容易訓練。

幾何模型

幾何模型將關系解釋為潛在空間的幾何變換。對于給定的事實,頭實體嵌入進行空間轉換τ,使用嵌入的關系作為參數的值。對事實評分的值是結果向量和尾向量之間的距離;這樣則可以使用距離函數計算δ(例如L1和L2范數)。

?

深度學習模型

深度學習模型使用深度神經網絡來執行LP任務。神經網絡學習參數,如權重和偏差,它們結合輸入數據,以識別顯著模式。深度神經網絡通常將參數組織成獨立的層,通常穿插非線性激活函數。

隨著時間的推移,人們開發了許多不同類型的層,對輸入數據應用不同的操作。例如,全連接層將把輸入數據X與權重W結合起來,并添加一個偏差B: W X + B。為了簡單起見,在下面的公式中我們將不提及偏差的使用,使其保持隱式。更高級的層執行更復雜的操作,如卷積層(它學習卷積內核以應用于輸入數據)或遞歸層(以遞歸方式處理順序輸入)。

在LP任務中,通常結合各層的權重和偏差來學習KG嵌入;這些共享的參數使這些模型更有表現力,但可能導致參數更多,更難訓練,更容易過擬合。

付費5元查看完整內容
北京阿比特科技有限公司