亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

在本文中,我們對知識圖譜進行了全面的介紹,在需要開發多樣化、動態、大規模數據收集的場景中,知識圖譜最近引起了業界和學術界的極大關注。在大致介紹之后,我們對用于知識圖譜的各種基于圖的數據模型和查詢語言進行了歸納和對比。我們將討論模式、標識和上下文在知識圖譜中的作用。我們解釋如何使用演繹和歸納技術的組合來表示和提取知識。我們總結了知識圖譜的創建、豐富、質量評估、細化和發布的方法。我們將概述著名的開放知識圖譜和企業知識圖譜及其應用,以及它們如何使用上述技術。最后,我們總結了未來高層次的知識圖譜研究方向。

盡管“知識圖譜”一詞至少從1972年就開始出現在文獻中了[440],但它的現代形式起源于2012年發布的谷歌知識圖譜[459],隨后Airbnb[83]、亞馬遜[280]、eBay[392]、Facebook[365]、IBM[123]、LinkedIn[214]、微軟[457]、優步[205]等公司相繼發布了開發知識圖譜的公告。事實證明,學術界難以忽視這一概念的日益普及: 越來越多的科學文獻發表關于知識圖譜的主題,其中包括書籍(如[400]),以及概述定義(如[136])的論文,新技術(如[298,399,521]),以及對知識圖譜具體方面的調查(如[375,519])。

所有這些發展的核心思想是使用圖形來表示數據,通常通過某種方式顯式地表示知識來增強這種思想[365]。結果最常用于涉及大規模集成、管理和從不同數據源提取價值的應用場景[365]。在這種情況下,與關系模型或NoSQL替代方案相比,使用基于圖的知識抽象有很多好處。圖為各種領域提供了簡潔而直觀的抽象,其中邊捕獲了社會數據、生物交互、書目引用和合作作者、交通網絡等[15]中固有實體之間的(潛在的循環)關系。圖允許維護者推遲模式的定義,允許數據(及其范圍)以比關系設置中通常可能的更靈活的方式發展,特別是對于獲取不完整的知識[2]。與(其他)NoSQL模型不同,專門的圖形查詢語言不僅支持標準的關系運算符(連接、聯合、投影等),而且還支持遞歸查找通過任意長度路徑[14]連接的實體的導航運算符。標準的知識表示形式主義——如本體論[66,228,344]和規則[242,270]——可以用來定義和推理用于標記和描述圖中的節點和邊的術語的語義。可伸縮的圖形分析框架[314,478,529]可用于計算中心性、集群、摘要等,以獲得對所描述領域的洞察。各種表示形式也被開發出來,支持直接在圖上應用機器學習技術[519,527]。

總之,構建和使用知識圖譜的決策為集成和從不同數據源提取價值提供了一系列技術。但是,我們還沒有看到一個通用的統一總結,它描述了如何使用知識圖譜,使用了哪些技術,以及它們如何與現有的數據管理主題相關。

本教程的目標是全面介紹知識圖譜: 描述它們的基本數據模型以及如何查詢它們;討論與schema, identity, 和 context相關的表征;討論演繹和歸納的方式使知識明確;介紹可用于創建和充實圖形結構數據的各種技術;描述如何識別知識圖譜的質量以及如何改進知識圖譜;討論發布知識圖譜的標準和最佳實踐;并提供在實踐中發現的現有知識圖譜的概述。我們的目標受眾包括對知識圖譜不熟悉的研究人員和實踐者。因此,我們并不假設讀者對知識圖譜有特定的專業知識。

知識圖。“知識圖譜”的定義仍然存在爭議[36,53,136],其中出現了一些(有時相互沖突的)定義,從具體的技術建議到更具包容性的一般性建議;我們在附錄a中討論了這些先前的定義。在這里,我們采用了一個包容性的定義,其中我們將知識圖譜視為一個數據圖,目的是積累和傳遞真實世界的知識,其節點表示感興趣的實體,其邊緣表示這些實體之間的關系。數據圖(又稱數據圖)符合一個基于圖的數據模型,它可以是一個有向邊標記的圖,一個屬性圖等(我們在第二節中討論具體的替代方案)。這些知識可以從外部資源中積累,也可以從知識圖譜本身中提取。知識可以由簡單的語句組成,如“圣地亞哥是智利的首都”,也可以由量化的語句組成,如“所有的首都都是城市”。簡單的語句可以作為數據圖的邊來積累。如果知識圖譜打算積累量化的語句,那么就需要一種更有表現力的方式來表示知識——例如本體或規則。演繹的方法可以用來繼承和積累進一步的知識(例如,“圣地亞哥是一個城市”)。基于簡單或量化語句的額外知識也可以通過歸納方法從知識圖譜中提取和積累。

知識圖譜通常來自多個來源,因此,在結構和粒度方面可能非常多樣化。解決這種多樣性, 表示模式, 身份, 和上下文常常起著關鍵的作用,在一個模式定義了一個高層結構知識圖譜,身份表示圖中哪些節點(或外部源)引用同一個真實的實體,而上下文可能表明一個特定的設置一些單位的知識是真實的。如前所述,知識圖譜需要有效的提取、充實、質量評估和細化方法才能隨著時間的推移而增長和改進。

在實踐中 知識圖譜的目標是作為組織或社區內不斷發展的共享知識基礎[365]。在實踐中,我們區分了兩種類型的知識圖譜:開放知識圖譜和企業知識圖譜。開放知識圖譜在網上發布,使其內容對公眾有好處。最突出的例子——DBpedia[291]、Freebase[51]、Wikidata[515]、YAGO[232]等——涵蓋了許多領域,它們要么是從Wikipedia[232,291]中提取出來的,要么是由志愿者社區[51,515]建立的。開放知識圖譜也在特定領域內發表過,如媒體[406]、政府[222,450]、地理[472]、旅游[11,263,308,540]、生命科學[79]等。企業知識圖譜通常是公司內部的,并應用于商業用例[365]。使用企業知識圖譜的著名行業包括網絡搜索(如Bing[457]、谷歌[459])、商業(如Airbnb[83]、亞馬遜[127、280]、eBay[392]、Uber[205])、社交網絡(如Facebook[365]、LinkedIn[214])、金融(如埃森哲[368]、意大利銀行[32][326]、彭博[326]、Capital One[65]、富國銀行[355])等。應用包括搜索[457,459],推薦[83,205,214,365],個人代理[392],廣告[214],商業分析[214],風險評估[107,495],自動化[223],以及更多。我們將在第10節中提供更多關于在實踐中使用知識圖譜的細節。

結構。本文件其余部分的結構如下:

  • 第2節概述了圖形數據模型和可用于查詢它們的語言。
  • 第3節描述了知識圖譜中模式、標識和上下文的表示形式。
  • 第四節介紹了演繹式的形式主義,通過這種形式主義,知識可以被描述和推導出來。
  • 第5節描述了可以提取額外知識的歸納技術。
  • 第6節討論了如何從外部資源中創建和豐富知識圖譜。
  • 第7節列舉了可用于評估知識圖譜的質量維度。
  • 第8節討論知識圖譜細化的各種技術。
  • 第9節討論發布知識圖譜的原則和協議。
  • 第10節介紹了一些著名的知識圖譜及其應用。
  • 第11節總結了知識圖譜的研究概況和未來的研究方向。
  • 附錄A提供了知識圖譜的歷史背景和以前的定義。
  • 附錄B列舉了將從論文正文中引用的正式定義。
付費5元查看完整內容

相關內容

知識圖譜(Knowledge Graph),在圖書情報界稱為知識域可視化或知識領域映射地圖,是顯示知識發展進程與結構關系的一系列各種不同的圖形,用可視化技術描述知識資源及其載體,挖掘、分析、構建、繪制和顯示知識及它們之間的相互聯系。 知識圖譜是通過將應用數學、圖形學、信息可視化技術、信息科學等學科的理論與方法與計量學引文分析、共現分析等方法結合,并利用可視化的圖譜形象地展示學科的核心結構、發展歷史、前沿領域以及整體知識架構達到多學科融合目的的現代理論。它能為學科研究提供切實的、有價值的參考。

知識薈萃

精品入門和進階教程、論文和代碼整理等

更多

查看相關VIP內容、論文、資訊等

現實網絡由多種相互作用、不斷進化的實體組成,而現有的研究大多將其簡單地描述為特定的靜態網絡,而沒有考慮動態網絡的演化趨勢。近年來,動態網絡的特性跟蹤研究取得了重大進展,利用網絡中實體和鏈接的變化來設計網絡嵌入技術。與被廣泛提出的靜態網絡嵌入方法相比,動態網絡嵌入努力將節點編碼為低維密集表示,有效地保持了網絡結構和時間動態,有利于處理各種下游機器學習任務。本文對動態網絡嵌入問題進行了系統的研究,重點介紹了動態網絡嵌入的基本概念,首次對現有的動態網絡嵌入技術進行了分類,包括基于矩陣分解的、基于躍格的、基于自動編碼器的、基于神經網絡的等嵌入方法。此外,我們仔細總結了常用的數據集和各種各樣的后續任務,動態網絡嵌入可以受益。在此基礎上,提出了動態嵌入模型、大規模動態網絡、異構動態網絡、動態屬性網絡、面向任務的動態網絡嵌入以及更多的嵌入空間等現有算法面臨的挑戰,并提出了未來可能的研究方向。

付費5元查看完整內容

【導讀】異構網絡表示學習Heterogeneous Network Representation Learning是當前自數據挖掘以及其他應用的研究熱點,在眾多任務中具有重要的應用。近日,UIUC韓家煒等學者發布了異構網絡表示學習的綜述大全,共15頁pdf115篇參考文獻,從背景知識到當前代表性HNE模型和應用研究挑戰等,是最新可參考絕好的異構網絡表示學習模型的文獻。

由于現實世界中的對象及其交互通常是多模態和多類型的,所以異構網絡被廣泛地用作傳統同構網絡(圖)的一個更強大、更現實和更通用的超類。與此同時,表示學習(representation learning,又稱嵌入)最近得到了深入的研究,并被證明對各種網絡挖掘和分析任務都是有效的。由于已有大量的異構網絡嵌入(HNE)算法,但沒有專門的調研綜述,作為這項工作的第一個貢獻,我們率先提供了一個統一的范式,對各種現有的HNE算法的優點進行系統的分類和分析。此外,現有的HNE算法雖然大多被認為是通用的,但通常是在不同的數據集上進行評估。由于HNE在應用上的天然優勢,這種間接的比較在很大程度上阻礙了任務性能的改善,特別是考慮到從真實世界的應用數據構建異構網絡的各種可能的方法。因此,作為第二項貢獻,我們創建了四個基準數據集,這些數據集具有不同來源的尺度、結構、屬性/標簽可用性等不同屬性,以全面評估HNE算法。作為第三個貢獻,我們對十種流行的HNE算法的實現進行了細致的重構和修改,并創建了友好的接口,并在多個任務和實驗設置上對它們進行了全方位的比較。

1.概述

網絡和圖形構成了一種規范的、普遍存在的交互對象建模范式,已經引起了各個科學領域的重要研究關注[59、30、24、3、89、87]。然而,現實世界的對象和交互通常是多模態和多類型的(例如,作者、論文、場所和出版物網絡中的術語[69,65];基于位置的社交網絡中的用戶、地點、類別和gps坐標[101,91,94];以及生物醫學網絡中的基因、蛋白質、疾病和物種[38,14])。為了捕獲和利用這種節點和鏈路的異構性,異構網絡被提出并廣泛應用于許多真實的網絡挖掘場景中,如基于元路徑的相似度搜索[70、64、92]、節點分類和聚類[18、20、11]、知識庫補全[68、48、103]和推薦[23、106、31]。

與此同時,目前對圖數據的研究主要集中在表示學習(圖數據嵌入)方面,特別是在神經網絡算法的先行者們展示了前所未有的有效而高效的圖數據挖掘的經驗證據之后[25,4,13]。他們的目標是將圖數據(如節點[49、72、26、77、37、28、9、75]、鏈接[107、1、50、96]和子圖[47、93、97、45])轉換為嵌入空間中的低維分布向量,在嵌入空間中保留圖的拓撲信息(如高階鄰近性[5、76、105、34]和結構[55、102、42、17])。這樣的嵌入向量可以被各種下游的機器學習算法直接執行[58,39,10]。

在異構網絡與圖嵌入的交叉點上,異構網絡嵌入(HNE)近年來也得到了較多的研究關注[8、85、108、16、66、67、27、22、90、35、104、57、52、99、7、98、32、83、95、82、41]。由于HNE的應用優勢,許多算法在不同的應用領域分別被開發出來,如搜索和推薦[23,63,6,89]。此外,由于知識庫(KBs)也屬于異構網絡的一般范疇,許多KB嵌入算法可以與HNE算法相比較[81、3、40、68、88、15、48、79、60]。

不幸的是,不同的HNE算法是在學術界和工業界完全不同的社區開發的。無論是在概念上還是在實驗中,都沒有對其進行系統全面的分析。事實上,由于缺乏基準平臺(有現成的數據集和基線),研究人員往往傾向于構建自己的數據集,并重新實現一些最流行的(有時是過時的)比較算法,這使得公平的性能評估和明確的改進屬性變得極其困難。

只需考慮圖1中發布數據小例子。較早的HNE算法如metapath2vec [16])是在作者、論文和場所節點類型為(a)的異構網絡上發展起來的,但是可以像(b)那樣用大量的術語和主題作為附加節點來豐富論文,這使得基于隨機游走的淺嵌入算法效果不佳,而傾向于R-GCN[57]這樣的基于鄰域聚合的深度圖神經網絡。此外,還可以進一步加入術語嵌入等節點屬性和研究領域等標簽,使其只適用于半監督歸納學習算法,這可能會帶來更大的偏差[104、82、33、54]。最后,通常很難清楚地將性能收益歸因于技術新穎性和數據調整之間的關系。

在這項工作中,我們首先制定了一個統一而靈活的數學范式,概括了所有的HNE算法,便于理解每個模型的關鍵優點(第2節)。特別地,基于對現有模型(以及可能的未來模型)進行清晰分類和總結的統一分類,我們提出了網絡平滑度的一般目標函數,并將所有現有的模型重新組織成統一的范式,同時突出其獨特的新穎貢獻(第3節)。我們認為該范式將有助于指導未來新型HNE算法的發展,同時促進它們與現有算法的概念對比。

作為第二個貢獻,我們通過詳盡的數據收集、清理、分析和整理(第4節),特意準備了四個基準的異構網絡數據集,具有規模、結構、屬性/標簽可用性等多種屬性。這些不同的數據集,以及一系列不同的網絡挖掘任務和評估指標,構成了未來HNE算法的系統而全面的基準資源。

作為第三個貢獻,許多現有的HNE算法(包括一些非常流行的算法)要么沒有一個靈活的實現(例如,硬編碼的節點和邊緣類型、固定的元路徑集等),要么不能擴展到更大的網絡(例如,在訓練期間的高內存需求),這給新的研究增加了很多負擔(例如,,在正確的重新實現中需要大量的工程工作)。為此,我們選擇了10種流行的HNE算法,在這些算法中,我們仔細地重構和擴展了原始作者的實現,并為我們準備好的數據集的插件輸入應用了額外的接口(第5節)。基于這些易于使用和有效的實現,我們對算法進行了全面的經驗評估,并報告了它們的基準性能。實證結果在提供了與第3節的概念分析相一致的不同模型的優點的同時,也為我們的基準平臺的使用提供了范例,以供今后對HNE的研究參考。

本文的其余部分組織如下。第2節首先介紹我們提出的通用HNE范式。隨后,第3節對我們調查中的代表性模型進行了概念上的分類和分析。然后,我們在第4節中提供了我們準備好的基準數據集,并進行了深入的分析。在第5節中,我們對10種常用的HNE算法進行了系統而全面的實證研究,對HNE的發展現狀進行了評價。第六部分是對未來HNE平臺使用和研究的展望。

異構網絡示例

算法分類

Proximity-Preserving Methods

如前所述,網絡嵌入的一個基本目標是捕獲網絡拓撲信息。這可以通過在節點之間保留不同類型的鄰近性來實現。在HNE中,有兩類主要的接近性保護方法:基于隨機步法的方法(靈感來自DeepWalk[49])和基于一階/二階接近性的方法(靈感來自LINE[72])。

Message-Passing Methods

網絡中的每個節點都可以將屬性信息表示為特征向量xu。消息傳遞方法的目標是通過聚合來自u鄰居的信息來學習基于xu的節點嵌入eu。在最近的研究中,圖神經網絡(GNNs)[37]被廣泛用于促進這種聚合/消息傳遞過程。

Relation-Learning方法

異類網絡中的每條邊都可以看作是一個三元組(u, l, v),由兩個節點u, v∈v和一個邊緣類型l∈TE(即。,實體和關系,用KG表示)。關系學習方法的目標是學習一個評分函數sl(u, v),該函數對任意三元組求值并輸出一個標量來度量該三元組的可接受性。這種思想在KB嵌入中被廣泛采用。由于已經有關于KB嵌入算法的調查[81],我們在這里只討論最流行的方法,并強調它們與HNE的聯系。

基準

未來方向

在這項工作中,我們對各種現有的HNE算法進行了全面的調研,并提供了基準數據集和基線實現,以方便今后在這方面的研究。盡管HNE已經在各種下游任務中表現出了強大的性能,但它仍處于起步階段,面臨著許多尚未解決的挑戰。為了總結這項工作并啟發未來的研究,我們現在簡要地討論一下當前HNE的局限性和幾個可能值得研究的具體方向。

超越同質性。如式(1)所述,目前的HNE算法主要關注網絡同質性作用。由于最近對同構網絡的研究,研究位置和結構嵌入的組合,探索如何將這種設計原則和范式推廣到HNE將是很有趣的。特別是在異構網絡中,節點的相對位置和結構角色都可以在不同的元路徑或元圖下測量,這自然更具有信息性和多樣性。然而,這樣的考慮也帶來了更困難的計算挑戰。

超越準確性。大多數,如果不是全部,現有的研究主要集中在對不同的下游任務的準確性。進一步研究HNE的效率和可擴展性(用于大規模網絡)、時間適應性(用于動態演化網絡)、魯棒性(用于對抗攻擊)、可解釋性、不確定性、公平性等將是非常有趣的。

超越節點嵌入。圖級和子圖級嵌入在同構網絡上得到了廣泛的研究,但在異構網絡上卻很少有研究。雖然諸如HIN2Vec[22]等現有的工作都在研究元路徑的嵌入以改進節點的嵌入,但是圖和子圖級嵌入在異構網絡環境中的直接應用仍然處于萌芽狀態。

回顧KB嵌入。KB嵌入與其他HNE類型的區別主要在于節點和鏈接類型的數量不同。直接將KB嵌入到異構網絡中不能考慮具有豐富語義的元路徑,而將HNE直接應用到KB中由于元路徑的數量呈指數增長而不現實。然而,研究這兩組方法(以及兩種類型的數據)之間的交集仍然很有趣。例如,我們如何將異構網絡上的元路徑和HNE在KB上嵌入轉換的思想與更多的語義感知轉換結合起來?我們如何設計基于截斷隨機游走的方法來包含高階關系的知識庫嵌入?

異構上下文建模。異構網絡主要模擬不同類型的節點和鏈接。然而,現在的網絡常常與豐富的內容相關聯,這些內容提供了節點、鏈接和子網的上下文。因此,如何通過多模態內容和結構的集成來對多方面環境下的異構交互進行建模可能是一個具有挑戰性但值得研究的領域。

理解局限性。雖然HNE(以及許多神經表示學習模型)已經在各個領域顯示出了強大的性能,但值得了解其潛在的局限性。例如,與傳統的網絡挖掘方法(例如,路徑計數、子圖匹配、非神經或線性傳播)相比,現代HNE算法何時能更好地工作?我們怎樣才能把兩個世界的優點結合起來呢?此外,雖然對同構網絡數據的神經網絡背后的數學機制(如平滑、低通濾波、不變和等變變換)進行了深入的研究,通過統一現有的HNE模型,本工作也旨在激發對HNE的能力和局限性的進一步理論研究。

付費5元查看完整內容

大數據正在成為智能交通系統(ITS)的一個研究熱點,這可以在世界各地的許多項目中看到。智能交通系統會產生大量的數據,將對智能交通系統的設計和應用產生深遠的影響,從而使智能交通系統更安全、更高效、更有利可圖。在ITS中研究大數據分析是一個蓬勃發展的領域。本文首先回顧了大數據和智能交通系統的發展歷史和特點,接著討論了ITS系統中進行大數據分析的框架,總結了ITS系統中的數據源和采集方法、數據分析方法和平臺以及大數據分析應用領域。同時介紹了大數據分析在智能交通系統中的幾個應用實例,包括道路交通事故分析、道路交通流量預測、公共交通服務規劃、個人出行路線規劃、軌道交通管理與控制、資產維護等。最后,本文討論了在ITS中應用大數據分析的一些開放性挑戰。

付費5元查看完整內容

題目: Attention Models in Graphs: A Survey

摘要: 圖結構數據自然地出現在許多不同的應用領域。通過將數據表示為圖形,我們可以捕獲實體(即節點)以及它們之間的關系(即邊)。許多有用的見解可以從圖形結構的數據中得到,這一點已被越來越多的關注于圖形挖掘的工作所證明。然而,在現實世界中,圖可以是大的-有許多復雜的模式-和噪聲,這可能會給有效的圖挖掘帶來問題。解決這一問題的一個有效方法是將“注意力”融入到圖挖掘解決方案中。注意機制允許一個方法關注圖中與任務相關的部分,幫助它做出更好的決策。在這項工作中,我們對圖形注意模型這一新興領域的文獻進行了全面而集中的調查。我們介紹了三個直觀的分類組現有的工作。它們基于問題設置(輸入和輸出類型)、使用的注意機制類型和任務(例如,圖形分類、鏈接預測等)。我們通過詳細的例子來激勵我們的分類法,并使用每種方法從一個獨特的角度來調查競爭方法。最后,我們強調了該領域的幾個挑戰,并討論了未來工作的前景。

作者簡介: Ryan A. Rossi,目前在Adobe Research工作,研究領域是機器學習;涉及社會和物理現象中的大型復雜關系(網絡/圖形)數據的理論、算法和應用。在普渡大學獲得了計算機科學博士和碩士學位。

Nesreen K. Ahmed,英特爾實驗室的高級研究員。她在普渡大學計算機科學系獲得博士學位,在普渡大學獲得統計學和計算機科學碩士學位。研究方向是機器學習和數據挖掘,涵蓋了大規模圖挖掘、統計機器學習的理論和算法,以及它們在社會和信息網絡中的應用。

付費5元查看完整內容

題目: Understanding Deep Learning Techniques for Image Segmentation

簡介: 機器學習已被大量基于深度學習的方法所淹沒。各種類型的深度神經網絡(例如卷積神經網絡,遞歸網絡,對抗網絡,自動編碼器等)有效地解決了許多具有挑戰性的計算機視覺任務,例如在不受限制的環境中對對象進行檢測,定位,識別和分割。盡管有很多關于對象檢測或識別領域的分析研究,但相對于圖像分割技術,出現了許多新的深度學習技術。本文從分析的角度探討了圖像分割的各種深度學習技術。這項工作的主要目的是提供對圖像分割領域做出重大貢獻的主要技術的直觀理解。從一些傳統的圖像分割方法開始,本文進一步描述了深度學習對圖像分割域的影響。此后,大多數主要的分割算法已按照專用于其獨特貢獻的段落進行了邏輯分類。

付費5元查看完整內容
北京阿比特科技有限公司