亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

知識圖譜中的數據往往代表了現實世界的部分現狀。因此,為了保持最新的狀態,圖數據需要經常更新。為了利用知識圖譜中的信息,許多最先進的機器學習方法使用了嵌入技術。這些技術通常計算一個嵌入,即節點的向量表示,作為主要機器學習算法的輸入。如果后來發生了圖譜更新--特別是當節點被添加或刪除時--訓練就必須重新進行了。這是不可取的,因為它需要時間,也因為如果下游模型發生重大變化,用這些嵌入訓練的模型必須重新訓練。在本文中,我們研究了不需要完全重新訓練的嵌入更新,并在涵蓋多種用例的真實動態知識圖譜上結合各種嵌入模型對其進行評估。我們研究了根據本地信息優化放置新出現的節點的方法,但注意到這并不奏效。然而,我們發現,如果我們繼續訓練舊的嵌入,并在其間穿插一些歷時,只對新增和刪除的部分進行優化,那么在鏈接預測中使用的典型指標方面,我們可以獲得良好的結果。這種性能比完全重新訓練要快得多,因此有可能為動態知識圖譜保持嵌入。

付費5元查看完整內容

相關內容

知識圖譜(Knowledge Graph),在圖書情報界稱為知識域可視化或知識領域映射地圖,是顯示知識發展進程與結構關系的一系列各種不同的圖形,用可視化技術描述知識資源及其載體,挖掘、分析、構建、繪制和顯示知識及它們之間的相互聯系。 知識圖譜是通過將應用數學、圖形學、信息可視化技術、信息科學等學科的理論與方法與計量學引文分析、共現分析等方法結合,并利用可視化的圖譜形象地展示學科的核心結構、發展歷史、前沿領域以及整體知識架構達到多學科融合目的的現代理論。它能為學科研究提供切實的、有價值的參考。

知識薈萃

精品入門和進階教程、論文和代碼整理等

更多

查看相關VIP內容、論文、資訊等

時序知識圖譜推理是信息檢索和語義搜索的關鍵任務。當TKG頻繁更新時,這是特別具有挑戰性的。該模型必須適應TKG的變化,以便進行有效的訓練和推理,同時保持其對歷史知識的表現。最近的工作通過增加一個時間感知編碼函數來實現TKG補全(TKGC)。然而,使用這些方法在每個時間步驟中直接微調模型并不能解決以下問題:1)災難性遺忘;2)模型不能識別事實的變化(例如,政治派別的變化和婚姻的結束);3)缺乏訓練效率。為了解決這些挑戰,我們提出了時間感知增量嵌入(TIE)框架,該框架結合了TKG表示學習、經驗回放和時間正則化。我們引入一組度量標準來描述模型的不妥協性,并提出一個約束,將刪除的事實與負面標簽相關聯。在Wikidata12k和YAGO11k數據集上的實驗結果表明,本文提出的TIE框架減少了大約10倍的訓練時間,并在提出的指標上有所改進。對于任何傳統的度量方法,它都不會造成性能上的重大損失。廣泛的消融研究揭示了不同評估指標之間的性能權衡,這對于真實世界的TKG應用的決策是至關重要的。

付費5元查看完整內容

論文題目: Meta-Learning to Cluster

摘要: 聚類是探索性數據分析中最基本、最廣泛應用的技術之一。然而,聚類的基本方法并沒有真正改變:專業人員手工挑選特定于任務的聚類損失,以優化并適合給定的數據,以揭示底層聚類結構。某些類型的損失——例如k-means或其非線性版本:kernelized k-means(基于質心的)和DBSCAN(基于密度的)——由于它們在一系列應用中具有良好的經驗性能,因此很受歡迎。盡管使用這些標準損失的聚類輸出常常不能揭示底層結構,而且執行者必須自定義設計它們自己的變體。在這項工作中,我們采用了一種本質上不同的聚類方法:我們不是根據特定的聚類損失來擬合數據集,而是訓練一個學習如何聚類的遞歸模型。該模型使用數據集的示例(作為輸入)和相應的聚類標識(作為輸出)作為訓練對。通過提供多種類型的訓練數據集作為輸入,我們的模型能夠很好地泛化不可見的數據集(新的集群任務)。實驗表明,與標準的基準聚類技術相比,在簡單的綜合生成數據集或現有的真實數據集上進行訓練,可以獲得更好的聚類性能。我們的元聚類模型即使對于通常的深度學習模型表現較差的小數據集也能很好地工作。

作者: Yibo Jiang, Nakul Verma

付費5元查看完整內容

知識圖譜在很多的真實的應用中都起著重要的作用,比如語義搜索、智能問答、文本理解等。通用知識圖譜構建中最重要的數據源之一是百科類網站,比如維基百科、百 度百科等。如英文知識圖譜 Freebase 最主要的數據源即是維基百科,大型中文通用知識圖譜 CN-DBpedia 主要的數據源是百度百科、互動百科等中文類百科網站。知識圖 譜相當于是現實世界的知識集合,這些知識并不是恒定不變的而是不斷變化的,沒有及時更新的知識圖譜無法及時地捕獲到已經變化的知識以及新出現的知識,而其數據源 百科類網站可以很及時的覆蓋新的知識和變化的知識。一個未能及時更新的知識圖譜會包含一些過時的知識、甚至是錯誤的知識,這會對知識圖譜的下層應用的產生很大的 限制。因而一個很重要的問題就是如何對知識圖譜進行更新,也就是使得知識圖譜和其數據源進行同步,這里的數據源只考慮百科類網站。

對于大部分的知識圖譜所采用的更新方式周期性批量更新,這種更新方式會有很多的弊端。其中一個弊端是在進行更新時的代價較大,百科類的網站通常會包含千萬級別的實體,在每次周期批量更新時會花費大量的時間代價,以及會占用大量的網絡帶寬。另一個主要的弊端是在周期性更新的周期內,會不斷有新知識的出現以及一些變化的知識,也就是周期性的更新方式也會導致知識圖譜中包含一些過時的知識。為了解決以上兩個問題,本文提出了智能知識圖譜更新系統 S-USB,一個更加智能的知識圖譜更新方案。

本文提出的智能知識圖譜更新系統 S-USB 可以智能的識別出已發生變化的實體并僅更新這些實體。S-USB 的核心部分是一個實體更新頻率預測器用于預測實體的更新頻率,該實體更新頻率預測器主要包括一系列高效的特征和回歸器。我們做了一系列實驗去檢測本文提出的知識圖譜智能更新系統 S-USB 以及實體更新頻率預測器的效果,實驗結果表明本文所提出的知識圖譜更新系統 S-USB 可以有效地識別出變化的實體和新出現的實體。特別的,本文所提出的知識圖譜智能更新系統已經在一些知識圖譜中得到應用落地,其中包括最大中文知識圖譜系統 CN-DBpedia。

本文的主要創新點主要有以下幾點:

    1. 智能更新系統:本文針對知識圖譜的更新問題創新性地提出了智能主動知識圖譜更新系統 S-USB,以較小的代價保持知識圖譜時效性。
    1. 實體更新頻率預測器:本文提出一種實體更新頻率預測模型,其中包含了一系列高效的特征和回歸器,該預測器可以有效的提高更新系統的準確率。
    1. 更新系統應用落地:本文將智能更新系統已經應用到真實的知識圖譜的更新中,有效地提高了知識圖譜的時效性,并且可以使得比較熱門的實體的知識總是處于最新的狀態。
付費5元查看完整內容
北京阿比特科技有限公司