論文題目
Model Cards for Model Reporting
論文摘要
在給定一些具有足夠訓練樣本的基本類別上,少鏡頭學習的目的是從很少的樣本中學習新的類別。這項任務的主要挑戰是新的類別容易受到顏色、紋理、物體形狀或背景背景(即特異性)的支配,這對于給定的少數訓練樣本是不同的,但對于相應的類別則不常見。幸運的是,我們發現基于范疇可以幫助學習新概念,從而避免新概念被特定性所支配。此外,結合不同類別之間的語義關聯,可以有效地規范這種信息傳遞。在這項工作中,我們以結構化知識圖的形式來表示語義關聯,并將此圖集成到深度神經網絡中,利用一種新的知識圖轉移網絡(KGTN)來促進少量鏡頭的學習。具體地說,通過使用對應類別的分類器權重初始化每個節點,學習傳播機制以自適應地通過圖來探索節點間的相互作用,并將基本類別的分類器信息傳遞給新類別的分類器信息。在ImageNet數據集上進行的大量實驗表明,與當前領先的競爭對手相比,性能有了顯著提高。此外,我們還構建了一個涵蓋更大尺度類別(即6000個類別)的ImageNet-6K數據集,在該數據集上的實驗進一步證明了我們提出的模型的有效性。
論文作者 陳日泉,陳天水,許曉璐,吳鶴峰,李冠斌,梁林,中山大學達克馬特人工智能研究所。
主題: Heterogeneous Graph-based Knowledge Transfer for Generalized Zero-shot Learning
摘要: 廣義零樣本學習(GZSL)解決了同時涉及可見類和不可見類的實例分類問題。關鍵問題是如何有效地將從可見類學習到的模型轉換為不可見類。GZSL中現有的工作通常假設關于未公開類的一些先驗信息是可用的。然而,當新的不可見類動態出現時,這種假設是不現實的。為此,我們提出了一種新的基于異構圖的知識轉移方法(HGKT),該方法利用圖神經網絡對GZSL、不可知類和不可見實例進行知識轉移。具體地說,一個結構化的異構圖,它是由所見類的高級代表節點構造而成,這些代表節點通過huasstein-barycenter來選擇,以便同時捕獲類間和類內的關系,聚集和嵌入函數可以通過圖神經網絡來學習,它可以用來計算不可見類的嵌入,方法是從它們的內部遷移知識。在公共基準數據集上的大量實驗表明,我們的方法達到了最新的結果。
主題: DEPARA: Deep Attribution Graph for Deep Knowledge Transferability
摘要: 探索經過PRe訓練的深度神經網絡(PR-DNN)編碼的異構任務之間的知識之間的內在聯系,揭示了它們的相互可移植性,從而使知識能夠從一項任務轉移到另一項任務,從而減少了后者的培訓工作量。在本文中,我們提出了DEeP屬性圖(DEPARA),以研究從PR-DNN中獲得的知識的可傳遞性。在DEPARA中,節點對應于輸入,并由其相對于PR-DNN輸出的矢量歸因圖表示。邊緣表示輸入之間的相關性,并通過從PR-DNN中提取的特征相似性來衡量。兩個PR-DNN的知識可傳遞性是通過它們對應的DEPARA的相似性來衡量的。我們將DEPARA應用于轉移學習中的兩個重要但尚未充分研究的問題:預先訓練的模型選擇和層選擇。進行了廣泛的實驗以證明所提出的方法在解決這兩個問題上的有效性和優越性。
【導讀】2020 年 2 月 7 日-2 月 12 日,AAAI 2020 在美國紐約舉辦。Michael Galkin撰寫了AAAI2020知識圖譜論文相關研究趨勢包括:KG-Augmented語言模型,異構KGs中的實體匹配,KG完成和鏈路預測,基于kg的會話人工智能和問題回答,包括論文,值得查看!
Hiroaki Hayashi, Zecong Hu, Chenyan Xiong, Graham Neubig: Latent Relation Language Models. AAAI 2020
【導讀】知識圖譜一直是學術界和工業界關注的熱點。隨著AAAI2020的到來,專知小編整理了最新10篇關于知識圖譜的論文,來自清華大學、中科大、北航、中山大學、UCL、Facebook、騰訊、阿里巴巴等,包含義原知識圖譜、知識遷移、知識圖譜層次表示、常識知識圖譜補全。
1、Towards Building a Multilingual Sememe Knowledge Base: Predicting Sememes for BabelNet Synsets(建立多語言義原知識庫:預測BabelNet Synsets的義原)
AAAI2020 oral ,清華大學
作者:Fanchao Qi, Liang Chang, Maosong Sun, Sicong Ouyang, Zhiyuan Liu
摘要:義原是人類語言中最小的語義單位。義原知識庫(KBs)包含了由義原標注的詞,已成功地應用于許多自然語言處理任務中。然而,現有的義原KBs僅建立在少數幾種語言上,這阻礙了它們的廣泛應用。為了解決這個問題,我們提出基于BabelNet(一種多語言百科詞典)為多種語言構建統一的義原知識庫。我們首先構建一個作為多語言義原知識庫種子的數據集。它為超過15000個synset (BabelNet的條目)手工注釋義位。然后,我們提出了一種新的自動預測synsets義位的任務,目的是將種子數據集擴展成一個可用的知識庫。我們還提出了兩個簡單有效的模型,利用了不同的synsets信息。最后,我們進行了定量和定性分析,以探索任務中的重要因素和困難。所有的源代碼和數據,這項工作可以獲得 //github.com/thunlp/BabelNet-Sememe-Prediction
論文地址:
2、Knowledge Graph Transfer Network for Few-Shot Recognition(知識圖譜遷移網絡小樣本識別)
AAAI2020 oral ,中山大學,暗物質
作者:Riquan Chen, Tianshui Chen, Xiaolu Hui, Hefeng Wu, Guanbin Li, Liang Lin
摘要:小樣本學習的目標是在給定一些基類有充足訓練樣本的情況下,從非常少的樣本中學習新的類別。這個任務的主要挑戰是新類很容易由顏色、質地、形狀的物體或背景上下文(即特異性),這特別是對于訓練樣本少且不常見的相應的類別非常突出(見圖1)。幸運的是,我們發現遷移信息的相關類別可以幫助學習新概念,從而避免新概念主導的特異性。此外,結合不同類別之間的語義關聯可以有效地規范這種信息傳遞。在本文中,我們將語義關聯以結構化的知識圖譜的形式表示出來,并將此圖集成到深度神經網絡中,通過一種新的知識圖譜傳輸網絡(KGTN)來促進小樣本學習。具體地,通過使用對應類別的分類器權值初始化每個節點,學習一種傳播機制,通過圖來自適應地傳播節點消息,探索節點間的交互,將基類的分類器信息傳遞給新類別的分類器信息。在ImageNet數據集上的大量實驗表明,與當前領先的對比方法相比,性能有了顯著的改進。此外,我們還構建了一個覆蓋更大范圍類別的ImageNet-6K數據集。在這個數據集上的實驗進一步證明了我們提出的模型的有效性。
論文地址:
3、Reasoning on Knowledge Graphs with Debate Dynamics(基于辯論動力學的知識圖譜推理)
AAAI2020 ,Siemens Corporate Technology
作者:Marcel Hildebrandt, Jorge Andres Quintero Serna, Yunpu Ma, Martin Ringsquandl, Mitchell Joblin, Volker Tresp
摘要: 我們提出了一種基于辯論動力學的知識圖譜自動推理方法。其主要思想是將三元組分類任務框定為兩個抽取論點(知識圖譜中的路徑)的強化學習代理之間的辯論游戲,目標分別是促進事實為真(正題)或事實為假(反題)。基于這些論據,一個叫做“法官”的二元分類器決定事實是對還是錯。這兩個代理可以被看作是稀疏的、對抗性的特征生成器,它們為正題或反題提供了可解釋的證據。與其他黑盒方法相比,這些參數允許用戶了解法官的決定。由于這項工作的重點是創建一個可解釋的方法,以保持一個有競爭力的預測精度,我們基準的三重分類和鏈接預測任務我們的方法。因此,我們發現我們的方法優于基準數據集FB15k-237、WN18RR和Hetionet上的幾個基線。我們也進行了一個調查,發現提取的參數對用戶是有益的。
論文地址:
4、Differentiable Reasoning on Large Knowledge Bases and Natural Language(大規模知識庫與自然語言上的可微分推理)
AAAI2020 ,UCL Centre for Artificial Intelligence, University College London,Facebook AI Research
作者:Pasquale Minervini, Matko Bo?njak, Tim Rockt?schel, Sebastian Riedel, Edward Grefenstette
摘要:用自然語言和知識庫(KBs)表達的知識進行推理是人工智能面臨的主要挑戰,在機器閱讀、對話和問題回答等方面都有應用。聯合學習文本表示和轉換的一些神經體系結構非常缺乏數據效率,很難分析它們的推理過程。這些問題由端到端的可微推理系統(如神經定理證明程序(NTPs))來解決,盡管它們只能用于小型符號KBs。在本文中,我們首先提出貪心NTPs (GNTPs),這是NTPs的擴展,解決了它們的復雜性和可伸縮性限制,從而使它們適用于真實世界的數據集。該結果是通過動態構建NTPs的計算圖來實現的,并且只包含推理過程中最有希望的證明路徑,從而獲得更有效的模型。然后,我們提出了一種新的方法,通過在一個共享的嵌入空間中嵌入邏輯事實和自然語言句子來聯合推理KBs和篇章提及。我們發現,GNTPs的性能與NTPs相當,但成本僅為NTPs的一小部分,同時在大型數據集上獲得了具有競爭力的鏈接預測結果,為預測提供了解釋,并引入了可解釋的模型。源代碼,數據集,和補充材料可在網上
論文地址:
5、Improving Knowledge-aware Dialogue Generation via Knowledge Base Question Answering(通過知識庫問題回答來改進知識感知對話的生成)
AAAI2020 ,華南理工,騰訊
作者:Jian Wang, Junhao Liu, Wei Bi, Xiaojiang Liu, Kejing He, Ruifeng Xu, Min Yang
摘要:神經網絡模型常常面臨將常識引入開放域對話系統的挑戰。本文提出了一種新的知識感知對話生成模型(TransDG),該模型將基于知識庫問答(KBQA)任務的問題表示和知識匹配能力進行轉換,以促進話語理解和對話生成的事實知識選擇。此外,我們提出了一種響應引導注意和多步驟解碼策略,以指導我們的模型將重點放在用于響應生成的相關特征上。在兩個基準數據集上的實驗表明,該模型在生成信息豐富、流暢的對話方面具有較強的優越性。我們的代碼在 .
論文地址:
6、Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction(用于鏈接預測的學習層次感知知識圖嵌入)
AAAI2020 ,中科大
作者:Zhanqiu Zhang, Jianyu Cai, Yongdong Zhang, Jie Wang
摘要:知識圖譜嵌入的目的是將實體和關系表示為低維向量(或矩陣、張量等),已經被證明是一種預測知識圖譜中缺失鏈接的強大技術。現有的知識圖譜嵌入模型主要側重于對稱/反對稱、反轉、復合等關系模式的建模。然而,許多現有的方法無法對語義層次結構建模,而這在實際應用程序中是很常見的。為了解決這一問題,我們提出了一種新的知識圖譜嵌入模型——層次感知知識圖譜嵌入(HAKE),它將實體映射到極坐標系統中。HAKE的靈感來自于這樣一個事實,即在極坐標系統中的同心圓可以自然地反映層次結構。具體來說,徑向坐標的目標是在層次結構的不同層次上對實體進行建模,半徑較小的實體被期望在更高的層次上;角坐標的目的是區分層次結構中同一層次上的實體,這些實體的半徑大致相同,但角度不同。實驗表明,HAKE可以有效地對知識圖譜中的語義層次進行建模,并在鏈接預測任務的基準數據集上顯著優于現有的最先進的方法。
.
論文地址:
7、Knowledge Graph Alignment Network with Gated Multi-hop Neighborhood Aggregation(用具有門控多跳鄰居聚合的知識圖譜對齊網絡)
AAAI2020 ,南京大學,阿里巴巴
作者:Zequn Sun, Chengming Wang, Wei Hu, Muhao Chen, Jian Dai, Wei Zhang, Yuzhong Qu
摘要:圖神經網絡由于具有識別同構子圖的能力,已經成為一種強大的基于嵌入的實體對齊范式。然而,在實知識圖(KGs)中,對應實體通常具有非同構的鄰域結構,這很容易導致gnn產生不同的表示。為了解決這一問題,我們提出了一種新的KG對齊網絡,即AliNet,旨在以端到端方式緩解鄰域結構的非同構性。由于模式異構性,對等實體的直接鄰居通常是不相似的,AliNet引入了遠程鄰居來擴展它們的鄰居結構之間的重疊。它采用了一種注意機制,以突出有益的遙遠的鄰居和減少噪音。然后,利用門控機制控制直接和遠處鄰居信息的聚合。我們進一步提出了一個關系損失來細化實體表示。我們進行了深入的實驗,詳細的燒蝕研究和分析的五個實體對齊數據集,證明了AliNet的有效性。
.
論文地址:
8、Rule-Guided Compositional Representation Learning on Knowledge Graphs(規則指導的知識圖譜組合式表示學習)
AAAI2020 ,北航
作者:Guanglin Niu, Yongfei Zhang, Bo Li, Peng Cui, Si Liu, Jingyang Li, Xiaowei Zhang
摘要:知識圖譜的表示學習是將知識圖中的實體和關系嵌入到低維連續向量空間中。早期的KG嵌入方法只關注三元組編碼的結構化信息,由于KGs的結構稀疏性,導致其性能有限。最近的一些嘗試考慮路徑信息來擴展KGs的結構,但在獲取路徑表示的過程中缺乏可解釋性。本文提出了一種新的基于規則和路徑的聯合嵌入(RPJE)方案,該方案充分利用了邏輯規則的可解釋性和準確性、KG嵌入的泛化性以及路徑的補充語義結構。具體來說,首先從KG中挖掘出不同長度(規則體中的關系數)的Horn子句形式的邏輯規則,并對其進行編碼,用于表示學習。然后,利用長度2的規則來精確地組合路徑,而使用長度1的規則來明確地創建關系之間的語義關聯和約束關系嵌入。優化時還考慮了規則的置信度,保證了規則在表示學習中的可用性。大量的實驗結果表明,RPJE在KG完成任務上的表現優于其他最先進的基線,這也證明了利用邏輯規則和路徑來提高表示學習的準確性和可解釋性的優越性。
.
論文地址:
9、InteractE: Improving Convolution-based Knowledge Graph Embeddings by Increasing Feature Interactions(規InteractE:通過增加特征交互來改進基于卷積的知識圖譜嵌入)
AAAI2020 ,Indian Institute of Science, Columbia University
作者:Shikhar Vashishth, Soumya Sanyal, Vikram Nitin, Nilesh Agrawal, Partha Talukdar
摘要:現有的知識圖譜大多存在不完備性,可以通過基于已知事實推斷缺失的鏈接來緩解不完備性。一種流行的方法是生成實體和關系的低維嵌入,并使用它們進行推論。ConvE是最近提出的一種方法,它將卷積濾波器應用于實體和關系嵌入的二維重塑,以捕獲其組件之間豐富的交互。然而,ConvE能夠捕獲的交互的數量是有限的。在這篇論文中,我們分析了增加這些相互作用的數量如何影響鏈路預測性能,并利用我們的觀測結果提出了相互作用。InteractE基于三個關鍵思想:特征置換、新穎的特征重塑和循環卷積。通過大量的實驗,我們發現InteractE在FB15k-237上的性能優于最先進的卷積鏈路預測基線。此外,InteractE在FB15k-237、WN18RR和YAGO3-10數據集上的MRR評分分別比ConvE高9%、7.5%和23%。結果驗證了我們的中心假設——增加特征交互有助于鏈接預測性能。我們提供InteractE的源代碼,以鼓勵可重復的研究。 InteractE.
.
論文地址:
10、Commonsense Knowledge Base Completion with Structural and Semantic Context(具有結構和語義上下文的常識知識庫的完成)
AAAI2020 ,Allen Institute for Artificial Intelligence 華盛頓大學
作者:Chaitanya Malaviya, Chandra Bhagavatula, Antoine Bosselut, Yejin Choi
摘要:與經過大量研究的傳統知識庫(如Freebase)相比,對常識知識圖譜(如原子圖和概念圖)的自動知識庫補全帶來了獨特的挑戰。常識知識圖譜使用自由格式的文本來表示節點,這使得節點的數量比傳統KBs多了幾個數量級(ATOMIC比Freebase多18倍(FB15K-237))。重要的是,這意味著圖數據結構將顯著稀疏化——這是現有KB補全方法面臨的主要挑戰,因為這些方法在相對較小的節點集上采用密集連接的圖數據。在本文中,我們提出了新的知識庫完成模型,該模型可以通過利用節點的結構和語義上下文來解決這些挑戰。具體來說,我們研究了兩個關鍵的思想: (1) 從局部圖結構學習,使用圖卷積網絡和自動圖加密,(2) 從預先訓練的語言模型學習到知識圖譜,以增強知識的上下文表示。我們描述了將來自這兩個來源的信息合并到一個聯合模型中的方法,并提供了原子知識庫完成和使用ConceptNet上的排名指標進行評估的第一個經驗結果。我們的結果證明了語言模型表示在提高鏈接預測性能方面的有效性,以及在訓練子圖以提高計算效率時從局部圖結構(對ConceptNet的MRR +1.5分)學習的優勢。對模型預測的進一步分析揭示了語言模型能夠很好地捕捉到的常識類型。
.
論文地址:
題目
Few-Shot Knowledge Graph Completion
簡介
知識圖是各種自然語言處理應用的有用資源。以前的KG完成方法需要為每個關系提供大量的訓練實例(即頭-尾實體對)。實際情況是,對于大多數關系,很少有實體對可用。現有的單鏡頭學習極限方法普遍適用于少鏡頭場景,不能充分利用監控信息,但很少有人對KG完工的研究還很少。在這項工作中,我們提出了一個新的少數鏡頭關系學習模型(FSRL),旨在發現新的關系事實很少鏡頭參考。FSRL可以有效地從異構圖結構中獲取知識,聚集少量鏡頭引用的表示,并為每個關系匹配相似的引用集實體對。在兩個公共數據集上進行的大量實驗表明,FSRL優于最新技術。
作者
Chuxu Zhang, Meng Jiang,Nitesh V. Chawla,來自圣母大學
Huaxiu Yao, Zhenhui Li,來自賓夕法尼亞州立大學
Chao Huang, 來自JD金融美國公司
論文題目: Knowledge Graph Alignment Network with Gated Multi-hop Neighborhood Aggregation
論文摘要
圖神經網絡由于具有識別同構子圖的能力,已經成為一種強大的基于嵌入的實體對齊范式。然而,在真實知識圖(KGs)中,通常是對應的實體 具有非同構的鄰域結構,這很容易導致GNN產生不同的表示。為了解決這一問題,我們提出了一種新的KG對齊網絡,即AliNet,旨在以端到端方式緩解鄰域結構的非同構性。由于模式異構性,對等實體的直接鄰域通常是不相似的,AliNet引入了遠程鄰域來擴展它們的鄰域結構之間的重疊。它采用了一種注意機制,以突出有益的遙遠的鄰域和減少噪音。然后,利用門控機制控制直接和遠處鄰域信息的聚合。我們進一步提出了一個關系損失來細化實體表示。我們進行了深入的實驗,詳細的研究和分析的五個實體對齊數據集,證明了AliNet的有效性。
論文作者
孫澤群是南京大學計算機科學與技術系在讀博士,目前在南京大學軟件新技術國家重點實驗室,博士導師為胡偉副教授。
胡偉,博士,南京大學計算機科學與技術系副教授,博士生導師。2005年、2009年分別于東南大學計算機科學與工程學院獲學士、博士學位。2009年12月加入南京大學工作至今。研究領域為知識挖掘,數據集成,智能軟件。
論文題目
Few Shot Network Compression via Cross Distillation
論文摘要
模型壓縮已被廣泛應用于獲得輕量化的深層神經網絡。然而,大多數流行的方法需要使用足夠的訓練數據進行微調以確保準確性,這可能會受到隱私和安全問題的挑戰。作為隱私性和性能之間的折衷,本文研究了少鏡頭網絡壓縮:在每類樣本數較少的情況下,如何有效地壓縮性能可以忽略不計的網絡?少鏡頭網絡壓縮的核心挑戰在于在推理過程中原始網絡的高估計誤差,因為壓縮后的網絡很容易過度適應少數訓練實例。估計誤差能夠很好地預測和積累層,最終決定網絡輸出。為了解決這個問題,我們提出了一種新的分層知識提取方法cross蒸餾。通過將教師網絡和學生網絡的隱含層交織在一起,可以有效地減少層內累積的估計誤差。該方法提供了一個通用的框架,與流行的網絡壓縮技術(如剪枝)兼容。在基準數據集上進行的大量實驗表明,當只有少量訓練實例可用時,交叉蒸餾可以顯著提高學生網絡的準確性。
論文作者
郝麗百,賈翔悟,Irwin King,Michael Lyu,香港中文大學。
摘要: 對于沒有標注資源的語言,從資源豐富的語言中轉移知識是命名實體識別(NER)的有效解決方案。雖然現有的方法都是直接從源學習模型轉移到目標語言中,但在本文中,我們建議通過一個測試用例的幾個類似例子對學習模型進行微調,這樣可以利用類似例子中傳遞的結構和語義信息來幫助預測。為此,我們提出了一種元學習算法,通過計算句子相似度來尋找一種能快速適應給定測試用例的模型參數初始化方法,并提出了構造多個偽ner任務進行元訓練的方法。為了進一步提高模型在不同語言間的泛化能力,我們引入了掩蔽機制,并在元訓練中增加了一個最大損失項。我們在五種目標語言中以最少的資源進行了大量的跨語言命名實體識別實驗。結果表明,我們的方法在整體上顯著優于現有的最先進的方法。