【導讀】一年一度的全球學術大會EMNLP是計算機語言學和自然語言處理領域最受關注的國際學術會議之一,由國際語言學會(ACL)旗下SIGDAT組織。據悉,EMNLP 2020共收到有效投稿3114篇,錄用602篇長文和150篇短文。近期,所有Paper list 放出,也包括(Findings of EMNLP),知識圖譜補全特別是時序知識圖譜補全(KGC)相關的接受paper很多,希望大家多多關注。
為此,這期小編為大家奉上EMNLP 2020必讀的五篇知識圖譜補全(Knowledge Graph Completion (KGC))相關論文——知識圖譜補全數據集、少樣本知識圖譜補全、時序知識圖譜補全
EMNLP 2020 Accepted Papers : //2020.emnlp.org/papers/main
EMNLP2020CI、EMNLP2020KG、ICLR2020CI、ICML2020CI
1. CODEX: A Comprehensive Knowledge Graph Completion Benchmark
作者:Tara Safavi, Danai Koutra
摘要:我們提出了CODEX,這是一組從Wikidata和Wikipedia提取的知識圖譜補全(knowledge graph completion)數據集,它們在難度和范圍上改進了現有知識圖譜補全基準。就范圍而言,CODEX包括三個大小和結構各異的知識圖譜,實體和關系的多語言描述,以及成千上萬個合理但被證實為假的難負樣本(hard negative)三元組。為了表征CODEX,我們提供了詳盡的經驗分析和基準測試。首先,我們根據邏輯關系模式分析每個CODEX數據集。接下來,我們針對五個經過廣泛調整的KG嵌入模型在CODEX上報告基準鏈接預測和三元組分類結果。最后,我們通過顯示CODEX涵蓋了更多樣化和可解釋的內容,并且它是一個更困難的鏈接預測基準,將CODEX與流行的FB15K-237知識圖譜補全數據集區分開。
代碼:
網址:
2. Adaptive Attentional Network for Few-Shot Knowledge Graph Completion
作者:Jiawei Sheng, Shu Guo, Zhenyu Chen, Juwei Yue, Lihong Wang, Tingwen Liu, Hongbo Xu
摘要:少樣本知識圖譜(KG)的補全是當前研究的重點,其中每個任務旨在根據給定的少樣本參考實體對(reference entity pairs),來查詢關系中未知的事實。最近的嘗試通過學習實體和參考的靜態表示來解決這個問題,而忽略了它們的動態屬性,即,實體可能在任務關系中發揮不同的作用,并且參考可能對查詢做出不同的貢獻。這項工作提出了自適應注意力網絡,通過學習自適應實體和參考表示來實現少樣本KG補全。具體而言,實體由自適應鄰居編碼器建模以識別其面向任務的角色,而參考則由自適應查詢感知聚合器建模以區分其貢獻。通過注意力機制,實體和參考都可以捕獲其細粒度的語義,從而呈現更具表達力的表示形式。在少數情況下,這對于知識獲取將更具預測性。對兩個公共數據集的鏈接預測的評估表明,我們的方法以不同的少樣本數量獲得了最新的最新結果。
代碼:
網址:
3. DyERNIE: Dynamic Evolution of Riemannian Manifold Embeddings for Temporal Knowledge Graph Completion
作者:Zhen Han, Peng Chen, Yunpu Ma, Volker Tresp
摘要:最近,人們對學習時序知識圖譜(KG)表示的興趣日益濃厚,這些知識記錄了實體之間隨時間的動態關系。時序KG經常表現出多個同時的非歐幾里德結構,例如層次結構和循環結構。但是,現有的時序KG嵌入方法通常會在歐幾里得空間中學習實體表示及其動態演化,這可能無法很好地捕獲此類內在結構。為此,我們提出了DyERNIE,這是一種非歐幾里得的嵌入方法,它可以學習黎曼流形(Riemannian manifolds)乘積中的演化實體表示,其中的組合空間是根據基礎數據的截面曲率估算的。這使我們的方法能夠更好地反映時間KG上的各種幾何結構。此外,為了捕獲時間KG的演化動力學,我們讓實體表示根據每個時間戳處切線空間中定義的速度矢量進行演化。我們詳細分析了幾何空間對時序KG表示學習的貢獻,并評估了我們在時序知識圖補全任務上的模型。在三個真實世界的數據集上進行的大量實驗表明,性能得到了顯著改善,這表明可以通過黎曼流形上的嵌入演化來更正確地建模多關系圖數據的動力學。
網址:
4. Temporal Knowledge Base Completion: New Algorithms and Evaluation Protocols
作者:Prachi Jain, Sushant Rathi, Mausam, Soumen Chakrabarti
摘要:將關系事實(s,r,o)與有效時間段(或時間瞬間)相關聯的時序知識庫的研究仍處于早期階段。我們的工作將預測缺失的實體(鏈接預測)和缺失的時間間隔(時間預測)視為聯合的時序知識庫補全(TKBC)任務,并提出了TIMEPLEX,這是一種新穎的TKBC方法,其中實體,關系和時間都嵌入統一的兼容空間。TIMEPLEX利用某些事實/事件的經常性和關系對之間的時間交互作用,在兩個預測任務上都產生了最新的結果。
我們還發現,由于評估機制不完善,現有的TKBC模型嚴重高估了鏈接預測性能。作為回應,我們針對鏈接和時序預測任務提出了改進的TKBC評估協議,處理了黃金實例和系統預測中時間間隔的部分重疊引起的細微問題。
網址:
5. TeMP: Temporal Message Passing for Temporal Knowledge Graph Completion
作者:Jiapeng Wu, Meng Cao, Jackie Chi Kit Cheung, William L. Hamilton
摘要:在時序知識圖譜中(TKG)推斷缺失的事實是一項基本且具有挑戰性的任務。以前的工作通過擴展靜態知識圖的方法來利用時間相關表示來解決此問題。但是,這些方法沒有顯式地利用時間步驟中的多跳結構信息和時間事實來增強其預測。此外,現有工作未明確解決TKG中實體分布的時間稀疏性和可變性。我們提出了時間信息傳遞(TeMP)框架,通過結合圖神經網絡,時間動力學模型,數據缺失處理和基于頻率的門控技術來應對這些挑戰。在標準TKG任務上進行的實驗1表明,與以前的最新技術水平相比,我們的方法可帶來可觀的收益,在三個標準基準中,Hits @ 10的平均相對改進為10.7%。我們的分析還揭示了TKG數據集內和TKG數據集之間可變性的重要來源,并且我們引入了一些簡單而強大的基線,這些基線在某些情況下優于現有技術。
網址:
【導讀】機器學習頂會 NeurIPS 2020, 是人工智能領域全球最具影響力的學術會議之一,因此在該會議上發表論文的研究者也會備受關注。據官方統計,今年NeurIPS 2020 共收到論文投稿 9454 篇,接收 1900 篇(其中 oral 論文 105 篇、spotlight 論文 280 篇),論文接收率為 20.1%。NeurIPS 2020已經開完了,小編發現三維點云(3 D Point Cloud)相關的接受paper不少,近幾年點云分析在CV上出現了一系列工作,在NeurIPS上越來越多,也顯示出點云分析這個傳統任務近幾年非常火。
為此,這期小編為大家奉上NeurIPS 2020必讀的五篇三維點云(3 D Point Cloud)相關論文——時空點云表示、組上下文編碼、點云邊緣檢測、GCN局部全局點云表示、自監督少樣本點云學習
NeurIPS 2020 Accepted Papers : //proceedings.neurips.cc/paper/2020
NIPS2020OD、NIPS2020VRL、NIPS2020DA、NIPS2020CI、ICLR2020CI、ICML2020CI
1. CaSPR: Learning Canonical Spatiotemporal Point Cloud Representations
作者:Davis Rempe, Tolga Birdal, Yongheng Zhao, Zan Gojcic, Srinath Sridhar, Leonidas J. Guibas
摘要:我們提出了CaSPR,這是一種學習以目標為中心的動態移動或演化的典型時空點云表示方法。我們處理的目標是隨著時間進行信息聚合,并在過去的任何時空鄰域中查詢目標狀態。與以前的工作不同,CaSPR支持時空連續性的學習表示,對可變和不規則的時空采樣點云具有魯棒性,并且能夠泛化到對不可知的目標實例進行表示。我們的方法將問題分為兩個子任務。首先,我們通過將輸入點云序列映射到時空規范化的目標空間來顯式編碼時間信息。然后,我們利用這種規范化來學習使用神經常微分方程的時空潛在表示,以及使用標準連續化流(continuous normalizing flows)動態生成形狀的生成模型。我們證明了我們的方法在幾種應用中的有效性,包括形狀重建,相機姿態估計,連續時空序列重建以及從不規則或間歇采樣的觀測值進行對應估計。
代碼:
網址:
2. Group Contextual Encoding for 3D Point Clouds
作者:Xu Liu, Chengtao Li, Jian Wang, Jingbo Wang, Boxin Shi, Xiaodong He
摘要:全局上下文對于3D點云場景理解任務至關重要。在這項工作中,我們將最初為2D任務設計的上下文編碼層擴展到3D點云方案。編碼層在3D點云的特征空間中學習一組字典(code words)以表征全局語義上下文,然后基于這些字典,該方法學習全局上下文描述符以相應地對特征圖進行加權。此外,與2D場景相比,數據稀疏性成為3D點云場景中的主要問題,并且隨著字典數量的增加,上下文編碼的性能迅速飽和。為了減輕這個問題,我們進一步提出了一種組上下文(group contextual)編碼方法,該方法將通道劃分為組,然后對組劃分的特征向量執行編碼。此方法有助于學習3D點云的分組子空間中的全局上下文。我們在三個被廣泛研究的3D點云任務上評估了我們方法的有效性和可推廣性。實驗結果表明,當指標為[email protected]時所提出的方法在SUN-RGBD基準上mAP為3,性能明顯優于VoteNet;而在ScanNet上,指標為mAP@0.5時其mAP為6.57 。與PointNet ++的基線相比,該方法的準確率為86%,優于基線的1.5%。
代碼:
網址:
3. PIE-NET: Parametric Inference of Point Cloud Edges
作者:Xiaogang Wang, Yuelang Xu, Kai Xu, Andrea Tagliasacchi, Bin Zhou, Ali Mahdavi-Amiri, Hao Zhang
摘要:我們引入了一種端到端的可學習技術,能夠可靠地識別3D點云數據中的特征邊緣。我們將這些邊緣表示為參數曲線(即線,圓和B樣條曲線)的集合。因此,我們的深度神經網絡(稱為PIE-NET)經過訓練可進行邊的參數推斷。該網絡依賴于候選區域(region proposal)的體系結構,其中第一個模塊先統計proposal邊緣和拐角點的完整集合,第二個模塊對每個proposal進行排名以決定是否應考慮。我們通過消融研究在ABC數據集(最大的CAD模型的公共可用數據集)上訓練和評估我們的方法,并將我們的結果與傳統(非學習)處理通道以及最近基于深度學習的邊緣檢測器(ECNet)所產生的結果進行比較。我們的結果在數量和質量上都大大超過了現有技術,并且很好地推廣到了新穎的形狀類別上。
網址:
4. Rotation-Invariant Local-to-Global Representation Learning for 3D Point Cloud
作者:SEOHYUN KIM, JaeYoo Park, Bohyung Han
摘要:我們提出了一種用于3D點云數據的局部到全局表示學習算法,該算法適合于處理各種幾何變換,尤其是旋轉,而無需針對變換進行顯式的數據增強。我們的模型利用了基于圖卷積神經網絡的多級抽象,它構建了一個描述符層次結構,以自下而上的方式對輸入對象的旋轉不變形狀信息進行編碼。每個級別的描述符都是通過3D點的隨機采樣從圖神經網絡中獲得的,這對于使學習的表示形式對輸入數據的變化具有魯棒性是非常有效。我們提出的算法在旋轉增強型3D對象識別和分割基準測試中展現了最新技術,并通過綜合的ablative實驗進一步分析了其特性。
代碼:
網址:
5. Self-Supervised Few-Shot Learning on Point Clouds
作者:Charu Sharma, Manohar Kaul
摘要:大規模點云的實用性不斷提高,加上它們在機器人技術,形狀合成和自動駕駛等廣泛應用中的實用性,引起了業界和學術界的越來越多的關注。最近,在標記的點云上運行的深度神經網絡已在有監督學習任務(如分類和分割)上顯示出令人鼓舞的結果。然而,有監督學習導致對點云進行標注是一項非常繁瑣的任務。為了解決這個問題,我們提出了兩種新穎的自監督預訓練任務,它們使用cover-tree對點云的分層分區進行編碼,其中,點云子集位于cover-tree的每個層次的半徑不同的球中。此外,我們的自監督學習網絡僅限于在少樣本學習(FSL)設置中用于訓練下游網絡的支持集合上進行預訓練(包含稀缺的訓練示例)。最后,將經過全面訓練的自監督網絡的點嵌入輸入到下游任務的網絡。我們針對下游分類和細分任務對我們的方法進行了全面的經驗評估,結果表明,使用我們的自監督學習方法進行預訓練的監督方法顯著提高了最新方法的準確性。此外,我們的方法在下游分類任務中也優于以前的無監督方法。
網址:
【導讀】一年一度的全球學術大會EMNLP是計算機語言學和自然語言處理領域最受關注的國際學術會議之一,由國際語言學會(ACL)旗下SIGDAT組織。據悉,EMNLP 2020共收到有效投稿3114篇,錄用602篇長文和150篇短文。近期,所有Paper list 放出,也包括(Findings of EMNLP),因果推理及其應用相關的接受Paper很多,在其他領域比如CV、數據挖掘、推薦等也廣受關注。
為此,這期小編為大家奉上EMNLP 2020必讀的六篇反事實推理(Counterfactual Reasoning)相關論文——常識推理、反事實生成器、開放式對話生成、VQA、文本分類
EMNLP 2020 Accepted Papers : //2020.emnlp.org/papers/main
ICLR2020CI、ICML2020CI
1. Back to the Future: Unsupervised Backprop-based Decoding for Counterfactual and Abductive Commonsense Reasoning
作者:Lianhui Qin, Vered Shwartz, Peter West, Chandra Bhagavatula, Jena D. Hwang, Ronan Le Bras, Antoine Bosselut, Yejin Choi
摘要:推理和反事實推理是人類日常認知的核心能力,需要對時間t可能發生的事情進行推理,同時要根據過去和未來的多個背景進行推理。然而,使用生成語言模型(LMS)同時合并過去和未來的上下文可能是具有挑戰性的,因為它們要么被訓練成僅以過去的上下文為條件,要么被訓練成執行范圍狹窄的文本填充。
在本文中,我們提出了一種新的無監督解碼算法DeLorean,它可以在只使用現成的、從左到右的(off-the-shelf, left-to-right)語言模型,并且無監督的情況下,靈活地合并過去和未來的上下文。我們算法的關鍵點是通過反向傳播與未來相結合,在此過程中,我們只更新輸出的內部表示,同時固定模型參數。通過在前向和后向傳播之間交替,DeLorean可以解碼既反映左上下文又反映右上下文的輸出表示。我們證明了我們的方法是通用的,適用于兩個非單調(nonmonotonic)推理任務:推理文本生成和反事實故事修改,在這兩個任務中,DeLorean基于自動和人工評估,優于一系列無監督和一些監督方法。
代碼:
網址:
2. Counterfactual Generator: A Weakly-Supervised Method for Named Entity Recognition
作者:Xiangji Zeng, Yunliang Li, Yuchen Zhai, Yin Zhang
摘要:神經模型的進展已經證明,如果我們有足夠的標簽數據,命名實體識別(named entity recognition)不再是一個問題。然而,收集足夠的數據并對其進行注釋是需要大量勞動、耗時和昂貴的。在本文中,我們將句子分解為實體和上下文兩個部分,并從因果關系的角度重新思考它們與模型性能的關系。在此基礎上,我們提出了反事實生成器,它通過對已有觀測實例的干預來增強原始數據集,從而生成反事實實例。在三個數據集上的實驗表明,我們的方法在有限的觀測樣本下提高了模型的泛化能力。此外,我們還使用一個結構因果模型來研究輸入特征和輸出標簽之間的偽相關性,從而提供了理論基礎。在非增廣和增廣兩種情況下,我們考察了實體或上下文對模型性能的因果影響。有趣的是,我們發現非偽相關性更多地位于實體表示中,而不是上下文表示中。因此,我們的方法消除了上下文表示和輸出標簽之間的部分虛假相關性。
代碼: .
網址:
3. Counterfactual Off-Policy Training for Neural Dialogue Generation
作者:Qingfu Zhu, Wei-Nan Zhang, Ting Liu, William Yang Wang
摘要:由于潛在反應( potential responses)的巨大規模,開放式對話生成(Open-domain dialogue generation)存在數據不足的問題。在本文中,我們提出通過反事實推理來探索潛在的反應。給出一個觀察到的反應,反事實推理模型會自動推斷出可以采取的替代策略的結果。事后合成的反事實反應比從頭合成的反應質量更高。對抗性學習框架下的反事實反應訓練有助于探索潛在反應空間的高回報領域。在DailyDialog數據集上的實證研究表明,該方法的性能明顯優于HRED模型和傳統的對抗性學習方法。
網址:
作者:Zujie Liang, Weitao Jiang, Haifeng Hu, Jiaying Zhu
摘要:在視覺問答(VQA)任務中,大多數先進的模型往往會在訓練集中學習虛假的相關性,并且在非分布(out-of-distribution)測試數據中表現不佳。為了緩解這一問題,已經提出了一些生成反事實樣本的方法。然而,大多數以前的方法生成的反事實樣本只是簡單地添加到訓練數據中進行擴充,沒有得到充分的利用。因此,我們引入了一種新的自監督對比學習(contrastive learning)機制來學習原始樣本、真實樣本和反事實樣本之間的關系。通過從輔助訓練目標中學習到更好的跨模態聯合嵌入,VQA模型的推理能力和穩健性都得到了顯著的提高。我們通過在VQA-CP數據集(VQA-CP數據集是評估VQA模型穩健性的診斷基準)上超過當前最先進的模型來評估我們方法的有效性。
網址:
5. Less is More:Attention Supervision with Counterfactuals for Text Classification
作者:Seungtaek Choi, Haeju Park, Jinyoung Yeo, Seung-won Hwang
摘要:我們的目標是利用人類和機器的智能來進行注意力監督。具體地說,我們證明了人工標注的代價可以保持在合理的低水平,而標注的質量可以通過機器的自監督來提高。具體地說,為了達到這一目標,我們探索了反事實推理相對于通常用于注意監督的聯想推理的優勢。實驗結果表明,在情感分析和新聞分類等文本分類任務中,這種機器增強的人類注意力監督方法比現有的標注代價更高的方法更有效。
網址:
【導讀】一年一度的全球學術大會EMNLP是計算機語言學和自然語言處理領域最受關注的國際學術會議之一,由國際語言學會(ACL)旗下SIGDAT組織。據悉,EMNLP 2020共收到有效投稿3114篇,錄用602篇長文和150篇短文。近期,所有Paper list 放出,也包括(Findings of EMNLP),知識圖譜表示及其應用相關的接受paper很多,在其他領域比如CV、數據挖掘、推薦等也廣受關注。
為此,這期小編為大家奉上EMNLP 2020必讀的六篇知識圖譜(Knowledge Graph)相關論文——知識圖譜表示、常識、任務型對話、多語種知識庫補全、開放式KG表示、社會常識推理
EMNLP 2020 Accepted Papers : //2020.emnlp.org/papers/main
ICLR2020CI、ICML2020CI
1. AutoETER: Automated Entity Type Representation for Knowledge Graph Embedding
作者:Guanglin Niu, Bo Li, Yongfei Zhang, Shiliang Pu, Jingyang Li
摘要:知識圖譜嵌入(KGE)可以表示連續向量空間中的實體和關系。一些利用附加類型信息的傳統KGE模型可以改善實體的表示,但這些模型完全依賴于顯式類型(explicit types),或者忽略了特定于各種關系的不同類型表示。此外,現有的方法中沒有一種方法能夠同時推斷對稱、反轉、合成的所有關系模式以及1-N、N-1和n-N關系的復雜屬性。為了探索任何KG的類型信息,我們提出了一種新的KGE框架自動實體類型表示(AutoETER),通過將每個關系看作是兩個實體類型之間的轉換(translation)操作來學習每個實體的潛在類型嵌入,并利用關系感知映射機制來學習每個實體的潛在類型嵌入。特別是,我們設計的自動類型表示學習機制是一個可插拔的模塊,可以很容易地與任何KGE模型集成。此外,我們的方法可以對所有的關系模式和復雜關系進行建模和推理。在四個數據集上的實驗表明,該模型在鏈接預測任務上的性能優于最新的基線,類型聚類的可視化清楚地解釋了類型嵌入的原因,驗證了該模型的有效性。
網址:
2. COSMIC: COmmonSense knowledge for eMotion Identification in Conversations
作者:Deepanway Ghosal, Navonil Majumder,
Alexander Gelbukh, Rada Mihalcea, Soujanya Poria
摘要:在本文中,我們利用常識知識解決了會話中語言級別的情感識別問題。我們提出了COSMIC,這是一個新的框架,它融合了不同的常識元素,如心理狀態、事件和因果關系,并在它們的基礎上學習參與對話的對話者之間的互動。目前最先進的方法在上下文傳播、情感轉移檢測和區分相關情感類別方面經常遇到困難。通過學習不同的常識表示,COSMIC解決了這些挑戰,并在四個不同的基準對話數據集上取得了新的情感識別最先進的結果。
代碼: .
網址:
3. Learning Knowledge Bases with Parameters for Task-Oriented Dialogue Systems
作者:Andrea Madotto, Samuel Cahyawijaya,
Genta Indra Winata, Yan Xu, Zihan Liu, Zhaojiang Lin, Pascale Fung
摘要:面向任務的對話系統要么通過單獨的對話狀態跟蹤(DST)和管理步驟實現模塊化,要么是端到端可訓練。在這兩種情況下,知識庫(KB)在滿足用戶請求方面起著至關重要的作用。模塊化系統依賴DST與知識庫交互,這在注釋和推理時間方面是昂貴的。端到端系統直接使用知識庫作為輸入,但當知識庫大于幾百個條目時,它們無法進行擴展。在本文中,我們提出了一種將任意大小的知識庫直接嵌入到模型參數中的方法。所得到的模型不需要任何DST或模板響應,也不需要知識庫作為輸入,并且它可以通過微調來動態更新其知識庫。我們在五個小、中、大的KB的面向任務的對話數據集中對我們的解決方案進行了評估。我們的實驗表明,端到端模型可以有效地將知識庫嵌入到它們的參數中,并在所有被評估的數據集上獲得具有競爭力的性能。
代碼:
網址:
4. Multilingual Knowledge Graph Completion via Ensemble Knowledge Transfer
作者:Xuelu Chen, Muhao Chen, Changjun Fan, Ankith Uppunda, Yizhou Sun, Carlo Zaniolo
摘要:預測知識圖(KG)中的缺失事實是知識庫構建和推理中的一項重要任務,也是近年來利用知識圖嵌入(KG embeddings)進行研究的一個重要課題。雖然現有的KG嵌入方法主要是在單個KG中學習和預測事實,但考慮到不同KG在數據質量和覆蓋范圍方面有各自的優勢和局限性,一個更合理的解決方案是從多個特定語言KG中的知識去嘗試融合。但這是相當具有挑戰性的,因為多個獨立維護的KG之間的知識遷移經常受到比對信息不足和描述事實不一致的障礙。在本文中,我們提出了一種新的框架KENS,用于嵌入學習和跨多個特定語言的KG進行集成知識遷移。KENS將所有KG嵌入到一個共享的嵌入空間中,在那里基于自學習捕獲實體之間的關聯。然后,KENS進行集成推理,合并來自多個特定語言KG嵌入的預測結果,并為此研究了多個集成技術。在五個實際語言特定的KG上的實驗表明,KENS通過有效地識別和利用互補知識,不斷改進KG補全的最新方法。
網址:
5. Out-of-Sample Representation Learning for Knowledge Graphs
作者:Marjan Albooyeh, Rishab Goel, Seyed Mehran Kazemi
摘要:許多重要問題都可以表示為知識圖中的推理。表示學習已經被證明對直推式推理(transductive reasoning)非常有效,在transductive 推理中,一個人需要對已經觀察到的實體做出新的預測,屬性圖(其中每個實體都有初始特征向量)和非屬性圖(其中唯一的初始信息來自與其他實體的已知關系)都是如此。對于樣本外推理( out-of-sample reasoning),人們需要對訓練時看不到的實體進行預測,許多以前的工作都考慮屬性圖。然而,對于非屬性圖的樣本外推理,并沒有得到充分的研究。在本文中,我們研究了非屬性知識圖的樣本外表示學習問題,為這一任務創建了基準數據集,開發了幾個模型和基線,并對所提出的模型和基線進行了實證分析和比較。
網址:
6. Social Commonsense Reasoning with Multi-Head Knowledge Attention
作者:Debjit Paul, Anette Frank
摘要:社會常識推理需要對文本的理解,對社會事件及其實際含義的了解以及常識推理能力。在這項工作中,我們提出了一種新的多頭知識注意模型,該模型對半結構化常識推理規則進行編碼,并學習將其合并到基于transformer的推理單元中。我們評估了該模型在兩個需要不同推理技能的任務上的性能:作為一項新任務的歸納自然語言推理(Abductive Natural Language Inference)和反事實不變性預測(Counterfactual Invariance Prediction)。我們表明,我們提出的模型在兩個推理任務上都比最先進模型(即Roberta)提高了性能。值得注意的是,據我們所知,我們是第一個證明學習執行反事實推理的模型有助于在溯因推理任務中預測最佳解釋的人。通過對知識的擾動,我們驗證了模型推理能力的健壯性,并對模型的知識融合能力進行了定性分析。
網址:
【導讀】IJCAI(國際人工智能聯合會議,International Joint Conferences on Artificial Intelligence)作為人工智能領域最頂級的國際學術會議之一,IJCAI 的舉辦自然備受矚目。第29屆國際人工智能聯合會議和第17屆環太平洋國際人工智能會議原定于2020年7月11日在日本橫濱召開,但由于疫情影響,將延期半年,至 2021年1月召開。近期,IJCAI 2020 論文集已經放出來。在 4717 份有效投稿中,最終僅有 592 篇被接收,接收率為 12.6%,這也是 IJCAI 史上最低的接收率。我們發現在今年的IJCAI 2020會議上圖神經網絡相關的論文非常多,今天小編專門整理最新6篇圖神經網絡(GNN)應用在自然語言處理上的相關論文——AMR-to-text生成、Path GCN、圖互注意力網絡、常識知識、有向超圖GCN
IJCAI 2020 Accepted Paper: //www.ijcai.org/Proceedings/2020/
IJCAI2020GNN_Part1、ICML2020GNN_Part1、KDD2020GNN_Part1、CVPR2020SGNN、CVPR2020GNN_Part2、CVPR2020GNN_Part1、WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、
1、Better AMR-To-Text Generation with Graph Structure Reconstruction 作者:Tianming Wang, Xiaojun Wan, Shaowei Yao
摘要:AMR-to-text 生成是一項艱巨的任務,它需要從基于圖的語義表示中生成文本。最近的研究將這一任務看作是圖到序列的學習問題,并使用各種圖神經網絡來建模圖結構。在本文中,我們提出了一種新的方法,在重構輸入圖結構的同時,從AMR圖中生成文本。我們的模型使用圖注意力機制來聚合信息以對輸入進行編碼。此外,通過優化兩個簡單而有效的輔助重構目標:鏈接預測目標(需要預測節點之間的語義關系)和距離預測目標(需要預測節點之間的距離),能夠學習到更好的節點表示。在兩個基準數據集上的實驗結果表明,我們提出的模型在強基線上有很大的改善,并達到了新的技術水平。
網址:
2、Multi-hop Reading Comprehension across Documents with Path-based Graph Convolutional Network
作者:Zeyun Tang, Y ongliang Shen, Xinyin Ma, Wei Xu, Jiale Yu, Weiming Lu
摘要:跨多個文檔的多跳(Multi-hop )閱讀理解近年來備受關注。在本文中,我們提出了一種新的方法來解決這個多跳閱讀理解問題。受人類推理過程的啟發,我們從支持文檔(supporting documents)中構造了一個基于路徑的推理圖。該推理圖結合了基于圖的方法和基于路徑的方法的思想,更適合于多跳推理。同時,我們提出了GATED-RGCN在基于路徑的推理圖上積累證據,GATED-RGCN包含了一種新的問題感知門控機制,以規范跨文檔傳播信息的有用性,并在推理過程中添加問題信息。我們在WikiHop數據集上對我們的方法進行了評估,與以前發布的方法相比,我們的方法達到了最先進的準確性。特別值得一提的是,我們的集成模型比人類的表現高出4.2%。
網址:
3、The Graph-based Mutual Attentive Network for Automatic Diagnosis
作者:Quan Yuan, Jun Chen, Chao Lu, Haifeng Huang 摘要:自動診斷一直存在缺乏可靠語料庫來訓練可信預測模型的問題。此外,以往的基于深度學習的診斷模型大多采用序列學習技術(CNN或RNN),難以提取關鍵醫療實體之間的復雜結構信息(如圖結構)。本文提出基于真實醫院的高標準電子病歷文檔建立的診斷模型,以提高模型的準確性和可信度。同時,我們將圖卷積網絡引入到該模型中,緩解了稀疏特征的問題,便于提取用于診斷的結構信息。此外,我們還提出了mutual注意網絡來增強輸入的表示,以獲得更好的模型性能。我們在真實電子病歷文檔( EMR documents)上進行實驗,結果表明與以往基于序列學習的診斷模型相比,該模型具有更高的準確性。我們提出的模型已被集成到中國數百家初級衛生保健機構的信息系統中,以協助醫生進行診斷。
網址:
4、TransOMCS: From Linguistic Graphs to Commonsense Knowledge
作者:Hongming Zhang, Daniel Khashabi, Yangqiu Song, Dan Roth
摘要:常識知識獲取是人工智能的關鍵問題。傳統獲取常識知識的方法通常需要昂貴的人工注釋并且費力,在大范圍內是不可行的。本文探索了一種從語言圖中挖掘常識知識的實用方法,目的是將從語言模式中獲得的廉價知識轉化為昂貴的常識知識。其結果是將大規模的選擇偏好知識資源ASER[Zhang et al., 2020]轉換為TransOMCS,其表示與ConceptNet[Liu and Singh,2004]相同,但比ConceptNet大兩個數量級。實驗結果表明,語言知識可以轉化為常識知識,并且該方法在數量、新穎性和質量方面都是有效的。
代碼:
網址:
5、Two-Phase Hypergraph Based Reasoning with Dynamic Relations for Multi-Hop KBQA
作者:Jiale Han, Bo Cheng, Xu Wang
摘要:多跳知識庫問答(KBQA)旨在通過跨多個三元組的推理來尋找事實問題的答案。值得注意的是,當人類執行多跳推理時,傾向于在不同的跳中集中于特定的關系,并精確定位由該關系連接的一組實體。與利用成對連接來模擬人類執行多跳推理不同,超圖卷積網絡(HGCN)可以通過利用超邊連接兩個以上的節點。然而,HGCN是針對無向圖的,沒有考慮信息傳遞的方向。為了適應具有方向性的知識圖,我們引入了有向HGCN(Directed-HGCN, DHGCN)。受人類逐跳推理的啟發,我們提出了一種基于DHGCN的可解釋KBQA模型,即基于動態關系的兩階段超圖推理,該模型顯式更新關系信息,動態關注不同跳點的不同關系。此外,該模型逐跳預測關系以生成中間關系路徑。我們在兩個廣泛使用的多跳KBQA數據集上進行了大量的實驗,以證明該模型的有效性。
網址:
【導讀】計算語言學協會(the Association for Computational Linguistics, ACL)年度會議作為頂級的國際會議,在計算語言學和自然語言處理領域一直備受關注。今年,第58屆計算語言學協會(the Association for Computational Linguistics, ACL)年度會議將于2020年7月5日至10日在美國華盛頓西雅圖舉行。受COVID-19疫情影響,ACL 2020將全部改為線上舉行。本次ACL大會共提交了3429篇論文,共有571篇長論文、以及208篇短論文入選。不久之前,專知小編為大家整理了大會的圖神經網絡(GNN)相關論文,上周,專知小編為大家整理了大會的圖神經網絡(GNN)相關論文,這期小編繼續為大家奉上ACL 2020知識圖譜表示學習(KGR)相關論文供參考——開放域知識圖譜嵌入、Multi-hop QA、雙曲嵌入、圖上下文建模、SEEK ACL2020GNN_Part2、ACL2020GNN_Part1、WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN
1. Can We Predict New Facts with Open Knowledge Graph Embeddings? A Benchmark for Open Link Prediction
作者:Samuel Broscheit, Kiril Gashteovski, Yanjie Wang, Rainer Gemulla
摘要:開放式信息抽取系統從原始文本中抽取(“主體文本”、“關系文本”、“客體文本”)三元組。有些三元組是事實的文本版本,即對實體和關系的非規范化提及。在這篇文章中,我們調查是否有可以不需要對精選的知識進行任何規范化或監督,直接從開放的知識圖中推斷出新的事實。為此,我們提出了一個open的鏈接預測任務,即通過補全(“主體文本”,“關系文本”,?)來預測測試事實問題。在這樣設置中的評估提出了如下這個問題:正確的預測是由開放域知識圖上的推理所誘導的新事實,還是說可以簡單地解釋。例如,事實可能出現在不同的措辭文本變體中。為此,我們提出了一種評估協議和建立了開放域鏈接預測基準的方法--OLPBENCH。我們使用一個用于開放域鏈接預測的典型知識圖嵌入模型進行了實驗。雖然這項任務非常具有挑戰性,但我們的結果表明,預測真正的新事實是可能的,并且這是不能簡單解釋的。
2. Improving Multi-hop Question Answering over Knowledge Graphs using Knowledge Base Embeddings
作者:Apoorv Saxena, Aditay Tripathi, Partha Talukdar
摘要:知識圖(KG)是由實體作為節點,實體之間的關系作為類型邊組成的多關系圖。KGQA任務的目標是回答在KG上提出的自然語言問題。多跳(Multi-hop)KGQA需要在KG的多個邊上進行推理才能得到正確的答案。KG通常是不完整的,有許多缺失的鏈接,這給KGQA帶來了額外的挑戰,特別是對于多跳KGQA。最近關于多跳KGQA的研究試圖使用相關的外部文本來處理KG稀疏性,但這并不總是容易獲得的。在另一項研究中,已經提出了通過執行缺失鏈接預測來降低KG稀疏的KG嵌入方法。這種KG嵌入方法雖然高度相關,但到目前為止還沒有被探索用于多跳KGQA。本文填補了這一空白,提出了EmbedKGQA。EmbedKGQA在稀疏KG上執行多跳KGQA特別有效。EmbedKGQA還放寬了從預先確定的鄰域中選擇答案的要求,這是以前的多跳KGQA方法實施的次優約束。通過在多個基準數據集上的廣泛實驗,我們證明了EmbedKGQA在其他最先進的基線上的有效性。
網址:
代碼鏈接:
3. Low-Dimensional Hyperbolic Knowledge Graph Embeddings
作者:Ines Chami, Adva Wolf, Da-Cheng Juan, Frederic Sala, Sujith Ravi, Christopher Ré
摘要:知識圖(KG)嵌入學習實體和關系的低維表示,用于預測另外實體或者補全關系。KG通常表現出必須保留在嵌入空間中的分層和邏輯模式。對于分層數據,雙曲嵌入(hyperbolic embedding)方法在高保真和簡約表示方面顯示出了希望。然而,現有的雙曲嵌入方法沒有考慮KG中豐富的邏輯模式。在這項工作中,我們引入了一類同時捕捉層次模式和邏輯模式的雙曲KG嵌入模型。我們的方法結合了雙曲線反射和旋轉,并注意建模復雜的關系模式。在標準KG基準上的實驗結果表明,我們的方法在低維的MRR(mean reciprocal rank)上比以前的基于歐幾里得和雙曲的工作提高了6.1%。此外,我們觀察到不同的幾何變換捕獲不同類型的關系,而基于注意力的變換概括為多個關系。在高維方面,我們的方法在WN18RR上的MRR為49.6%,在YAGO3-10上的MRR為57.7%。
網址:
4. Orthogonal Relation Transforms with Graph Context Modeling for Knowledge Graph Embedding
作者:Yun Tang, Jing Huang, Guangtao Wang, Xiaodong He, Bowen Zhou
摘要:基于距離的知識圖嵌入已經在知識圖鏈接預測任務上有了實質性的改進,從TransE到目前最先進的RotatE。然而,諸如 N-to-1, 1-to-N和N-to-N的復雜關系仍然難以預測。在這項工作中,我們提出了一種新的基于距離的知識圖鏈接預測方法。首先,通過對模型關系的正交變換,將RotatE從二維復數域擴展到高維空間。關系的正交變換嵌入保持了對于對稱/反對稱關系、逆關系和復合關系的建模能力,同時具有更好的建模能力。其次,將圖形上下文直接集成到距離評分函數中。具體地說,圖上下文是通過兩個有向上下文表示來顯式建模的。嵌入到知識圖中的每個節點都增加了兩個上下文表示,這兩個上下文表示分別從相鄰的傳出節點/邊和傳入節點/邊計算得到。該方法提高了N-to-1, 1-to-N和N-to-N情況下的預測精度。實驗結果表明,該算法在兩個常用的基準測試FB15k237和WNRR-18上都取得了最好的結果,特別是在節點數較多的FB15k-237上。
網址:
5. SEEK: Segmented Embedding of Knowledge Graphs
作者:Wentao Xu, Shun Zheng, Liang He, Bin Shao, Jian Yin, Tie-Yan Liu
摘要:近年來,知識圖嵌入成為人工智能領域的研究熱點,在推薦、問答等各種下游應用中發揮著越來越重要的作用。然而,現有的知識圖嵌入方法沒有在模型復雜度和模型表現力之間取得適當的折衷,這使得它們仍然遠遠不能令人滿意。為了緩解這一問題,我們提出了一個輕量級的建模框架,它可以在不增加模型復雜度的情況下獲得具有高度競爭力的關系表達能力。我們的框架側重于評分函數的設計,并突出了兩個關鍵特征:1)促進充分的特征交互;2)保持關系的對稱性和反對稱性。值得注意的是,由于評分函數設計的通用性和美觀性,我們的框架可以將現有的許多著名的方法作為特例合并在一起。此外,在公共基準上的大量實驗證明了該框架的有效性。
網址:
代碼鏈接:
人工智能領域的頂會AAAI 2020將在2020年2月7日-12日在美國紐約舉行。據官方統計消息,AAAI 2020今年共收到的有效論文投稿超過 8800 篇,其中 7737 篇論文進入評審環節,最終收錄數量為 1591 篇,接收率 20.6%。開會在即,專知小編提前整理了AAAI 2020圖神經網絡(GNN)相關的接收論文,讓大家先睹為快——跨模態、部分標簽學習、交通流預測、少樣本學習、貝葉斯圖神經網絡。
作者:Renchun You, Zhiyao Guo, Lei Cui, Xiang Long, Yingze Bao, Shilei Wen
摘要:多標簽圖像和視頻分類是計算機視覺中最基本也是最具挑戰性的任務。主要的挑戰在于捕獲標簽之間的空間或時間依賴關系,以及發現每個類的區別性特征的位置。為了克服這些挑戰,我們提出將語義圖嵌入的跨模態注意力機制用于多標簽分類。基于所構造的標簽圖,我們提出了一種基于鄰接關系的相似圖嵌入方法來學習語義標簽嵌入,該方法顯式地利用了標簽之間的關系。在學習標簽嵌入的指導下,生成我們新穎的跨模態注意力圖。在兩個多標簽圖像分類數據集(MS-COCO和NUS-WIDE)上的實驗表明,我們的方法優于其他現有的方法。此外,我們在一個大的多標簽視頻分類數據集(YouTube-8M Segments)上驗證了我們的方法,評估結果證明了我們的方法的泛化能力。
網址: //arxiv.org/abs/1912.07872
作者:Brian Chen, Bo Wu, Alireza Zareian, Hanwang Zhang, Shih-Fu Chang
摘要:我們提出了一個實際但有挑戰性的問題: 通用部分標簽學習(General Partial Label Learning,GPLL)。相比傳統的部分標簽學習(Partial Label Learning,PLL)問題, GPLL將監督假設從從實例級別(標簽集部分標記一個實例)放到了組級別: 1)標簽集部分標簽了一組實例, 其中組內 instance-label link annotations 丟失, 2)組間的link是允許的——組中的實例可以部分鏈接到另一個組中的標簽集。這種模糊的組級監督在實際場景中更實用,因為不再需要實例級的附加標注,例如,在視頻中組由一個幀中的人臉組成,并在相應的標題中使用名稱集進行標記,因此不再需要對實例級進行命名。本文提出了一種新的圖卷積網絡(GCN)——Dual Bipartite Graph Autoencoder (DB-GAE)來解決GPLL的標簽模糊問題。首先,我們利用組間的相互關系將實例組表示為dual bipartite圖:組內圖和組間圖,它們相互補充以解決鏈接的歧義。其次,我們設計了一個GCN自動編碼器來對它們進行編碼和解碼,其中的解碼被認為是經過改進的結果。值得注意的是DB-GAE是自監督和轉導的,因為它只使用組級的監督,而沒有單獨的offline訓練階段。對兩個真實數據集的大量實驗表明,DB-GAEG跟最佳baseline相比有著絕對的提升,0.159 的F1 score和24.8%的accuracy。我們還進一步分析了標簽歧義的各個層次。
網址:
作者:Chuanpan Zheng, Xiaoliang Fan, Cheng Wang, Jianzhong Qi
摘要:由于交通系統的復雜性和影響因素的不斷變化,長期的交通預測具有很大的挑戰性。在本文中,我們以時空因素為研究對象,提出了一種多注意力圖網絡(graph multi-attention network ,GMAN)來預測道路網絡圖中不同位置的時間步長的交通狀況。GMAN采用了一種encoder-decoder結構,其中編碼器和解碼器都由多個時空注意力塊組成,以模擬時空因素對交通條件的影響。編碼器對輸入流量特征進行編碼,解碼器對輸出序列進行預測。在編碼器和解碼器之間,應用轉換注意力層來轉換已編碼的流量特征,以生成未來時間步長的序列表示作為解碼器的輸入。轉換注意力機制模擬了歷史時間步長與未來時間步長之間的直接關系,有助于緩解預測時間步長之間的誤差傳播問題。在兩個現實世界中的交通預測任務(即交通量預測和交通速度預測)上的實驗結果證明了GMAN的優越性。特別地,在提前1個小時的預測中,GMAN的MAE指標提高了4%,優于最新技術。源代碼可在
網址:
作者:Huaxiu Yao, Chuxu Zhang, Ying Wei, Meng Jiang, SuhangWang, Junzhou Huang, Nitesh V. Chawla, Zhenhui Li
摘要:對于具有挑戰性的半監督節點分類問題,已經進行了廣泛的研究。圖神經網絡(GNNs)作為一個前沿領域,近年來引起了人們極大的興趣。然而,大多數GNN具有較淺的層,接收域有限,并且可能無法獲得令人滿意的性能,特別是在標記節點數量很少的情況下。為了解決這一問題,我們創新性地提出了一種基于輔助圖的先驗知識的graph few-shot learning (GFL)算法,以提高目標圖的分類精度。具體來說,輔助圖與目標之間共享一個可遷移的度量空間,該空間以節點嵌入和特定于圖的原型嵌入函數為特征,便于結構知識的傳遞。對四個真實世界圖數據集的大量實驗和消融研究證明了我們提出的模型的有效性以及每個組件的貢獻。
網址:
作者:Yongfei Liu, Bo Wan, Xiaodan Zhu, Xuming He
摘要:Visual grounding是許多視覺語言任務中普遍存在的一個基本單元,但由于grounding實體的視覺和語言特征的巨大差異、強大的語境效應以及由此產生的語義歧義,visual grounding仍然具有挑戰性。以前的研究主要集中在學習單個短語在有限的語境信息下的表達。針對其局限性,本文提出了一種languageguided graph representation表示方法來捕獲grounding實體的全局上下文及其關系,并針對多短語visual grounding任務開發了一種跨模態圖匹配策略。特別地,我們引入一個模塊化圖神經網絡,通過消息傳播分別計算短語和目標建議的上下文感知表示,然后引入一個基于圖的匹配模塊來生成全局一致的基礎短語定位。我們在兩階段策略中聯合訓練整個圖神經網絡,并在Flickr30K Entities基準上對其進行評估。大量的實驗表明,我們的方法比之前的技術有相當大的優勢,證明了我們的基礎框架的有效性。代碼可以在 找到。
網址:
作者:Yadan Luo, Zi Huang, Zheng Zhang, Ziwei Wang, Mahsa Baktashmotlagh, Yang Yang
摘要:元學習(Meta-learning)用于few-shot learning,允許機器利用以前獲得的知識作為優先級,從而在只有少量數據的情況下提高新任務的性能。然而,大多數主流模型都存在災難性遺忘和魯棒性不足的問題,因此不能充分保留或利用長期知識,同時容易導致嚴重的錯誤累積。本文提出了一種新的基于貝葉斯圖神經網絡(CML-BGNN)的連續元學習方法。通過將每個任務形成一個圖,可以通過消息傳遞和歷史遷移很好地保存任務內部和任務間的相關性。為了解決圖初始化過程中的拓撲不確定性問題,我們使用了Bayes by Backprop算法,該算法利用amortized推理網絡逼近任務參數的后驗分布,并將其無縫地集成到端到端邊緣學習中。在miniImageNet和tieredImageNet數據集上進行的大量實驗證明了該方法的有效性和效率,與最先進的miniImageNet 5-way 1-shot分類任務相比,性能提高了42:8%。
網址:
作者:Wei Li, Shaogang Gong, Xiatian Zhu
摘要:現有的神經體系結構搜索((NAS))方法往往直接在離散空間或連續空間中進行搜索,忽略了神經網絡的圖形拓撲知識。考慮到神經網絡本質上是有向無環圖(DAG),這會導致搜索性能和效率欠佳。在這項工作中,我們通過引入一種新的神經圖嵌入(NGE)思想來解決這個限制。具體來說,我們用神經DAG表示神經網絡的構建塊(即cell),并利用圖卷積網絡來傳播和建模網絡結構的固有拓撲信息。這導致可與現有的不同NAS框架集成的通用神經網絡表示。大量實驗表明,在圖像分類和語義分割方面,NGE優于最新方法。
網址:
作者:Songtao He, Favyen Bastani, Satvat Jagwani, Edward Park, Sofiane Abbar, Mohammad Alizadeh, Hari Balakrishnan, Sanjay Chawla, Samuel Madden, Mohammad Amin Sadeghi
摘要:從衛星圖像中推斷道路屬性(例如車道數和道路類型)是一項挑戰。通常,由于衛星圖像的遮擋和道路屬性的空間相關性,僅當考慮道路的較遠路段時,道路上某個位置的道路屬性才可能是顯而易見的。因此,為了魯棒地推斷道路屬性,模型必須整合分散的信息,并捕捉道路沿線特征的空間相關性。現有的解決方案依賴于圖像分類器,無法捕獲這種相關性,導致準確性較差。我們發現這種失敗是由于一個基本的限制–圖像分類器的有效接受范圍有限。
為了克服這一局限性,我們提出了一種結合卷積神經網絡(CNNs)和圖神經網絡(GNNs)來推斷道路屬性的端到端體系結構RoadTagger。使用GNN允許信息在路網圖上傳播,消除了圖像分類器的接收域限制。我們在一個覆蓋美國20個城市688平方公里面積的大型真實數據集和一個綜合數據集上對RoadTagger進行了評估。在評估中,與基于CNN圖像分類器的方法相比,RoadTagger提高了推理的準確性。此外,RoadTagger對衛星圖像的中斷具有較強的魯棒性,能夠學習復雜的inductive rule來聚合道路網絡上分散的信息。
網址:
最近小編推出CVPR2019圖卷積網絡、CVPR2019生成對抗網絡、【可解釋性】,CVPR視覺目標跟蹤,CVPR視覺問答,醫學圖像分割,圖神經網絡的推薦,CVPR域自適應, ICML圖神經網絡,ICML元學習相關論文,反響熱烈。最近,ACL 2019最新接受文章出爐,大會共收到2905 篇論文投稿,其中660 篇被接收(接收率為22.7%)。小編發現,今年接受的文章結合GNN的工作有二三十篇,看來,圖神經網絡已經攻占NLP領域,希望其他領域的同學多多學習,看能否結合,期待好的工作!今天小編專門整理最新十篇ACL長文,圖神經網絡(GNN)+NLP—注意力機制引導圖神經網絡、Graph-to-Sequence、動態融合圖網絡、實體和關系抽取、Multi-hop閱讀理解、多模態上下文圖理解等。
1、Attention Guided Graph Convolutional Networks for Relation Extraction (注意力機制引導圖神經網絡的關系抽取)
ACL ’19
作者:Zhijiang Guo*, Yan Zhang* and Wei Lu
摘要:Dependency trees傳遞豐富的結構信息,這些信息對于提取文本中實體之間的關系非常有用。然而,如何有效利用相關信息而忽略Dependency trees中的無關信息仍然是一個具有挑戰性的研究問題。現有的方法使用基于規則的hard-pruning策略來選擇相關的部分依賴結構,可能并不總是產生最佳結果。本文提出了一種直接以全依賴樹為輸入的Attention Guided圖卷積網絡(AGGCNs)模型。我們的模型可以理解為一種soft-pruning方法,它自動學習如何有選擇地關注對關系提取任務有用的相關子結構。在包括跨句n元關系提取和大規模句級關系提取在內的各種任務上的大量結果表明,我們的模型能夠更好地利用全依賴樹的結構信息,其結果顯著優于之前的方法。
網址: //www.statnlp.org/paper/2019/attention-guided-graph-convolutional-networks-relation-extraction.html
代碼鏈接:
2、Cognitive Graph for Multi-Hop Reading Comprehension at Scale(大規模認知圖的Multi-Hop閱讀理解)
ACL ’19
作者:Ming Ding, Chang Zhou, Qibin Chen, Hongxia Yang, Jie Tang
摘要:我們提出了一種新的基于CogQA的web級文檔multi-hop問答框架。該框架以認知科學的對偶過程理論為基礎,通過協調隱式抽取模塊(System 1)和顯式推理模塊(System 2),在迭代過程中逐步構建認知圖,在給出準確答案的同時,進一步提供了可解釋的推理路徑。具體來說,我們基于BERT和graph neural network (GNN)的實現有效地處理了HotpotQA fullwiki數據集中數百萬個multi-hop推理問題的文檔,在排行榜上獲得了34.9的F1 score,而最佳競爭對手的得分為23.6。
網址:
代碼鏈接:
3、Coherent Comment Generation for Chinese Articles with a Graph-to-Sequence Model(使用Graph-to-Sequence模型為中文文章生成連貫的評論)
ACL ’19
作者:Wei Li, Jingjing Xu, Yancheng He, Shengli Yan, Yunfang Wu, Xu sun
摘要:自動文章評論有助于鼓勵用戶參與和在線新聞平臺上的互動。然而,對于傳統的基于encoder-decoder的模型來說,新聞文檔通常太長,這往往會導致一般性和不相關的評論。在本文中,我們提出使用一個Graph-to-Sequence的模型來生成評論,該模型將輸入的新聞建模為一個主題交互圖。通過將文章組織成圖結構,我們的模型可以更好地理解文章的內部結構和主題之間的聯系,這使得它能夠更好地理解故事。我們從中國流行的在線新聞平臺Tencent Kuaibao上收集并發布了一個大規模的新聞評論語料庫。廣泛的實驗結果表明,與幾個強大的baseline模型相比,我們的模型可以產生更多的連貫性和信息豐富性的評論。
網址:
代碼鏈接:
4、Dynamically Fused Graph Network for Multi-hop Reasoning(基于動態融合圖網絡的Multi-hop Reasoning)
ACL ’19
作者:Yunxuan Xiao, Yanru Qu, Lin Qiu, Hao Zhou, Lei Li, Weinan Zhang, Yong Yu
摘要:近年來,基于文本的問答(TBQA)得到了廣泛的研究。大多數現有的方法側重于在一段話內找到問題的答案。然而,許多有難度的問題需要來自兩個或多個文檔的分散文本的支持證據。本文提出了動態融合圖網絡(Dynamically Fused Graph Network ,DFGN),這是一種解決需要多個分散證據和推理的問題的新方法。受人類逐步推理行為的啟發,DFGN包含一個動態融合層,從給定查詢中提到的實體開始,沿著文本動態構建的實體圖進行探索,并逐步從給定文檔中找到相關的支持實體。我們在需要multi-hop reasoning的公共TBQA數據集HotpotQA上評估了DFGN。DFGN在公共數據集上取得了有競爭力的成績。此外,我們的分析表明,DFGN可以產生可解釋的推理鏈。
網址:
5、 Encoding Social Information with Graph Convolutional Networks for Political Perspective Detection in News Media(利用圖卷積網絡對Social Information進行編碼,用于新聞媒體中的政治傾向性檢測)
ACL ’19
作者:Chang Li, Dan Goldwasser
摘要:確定新聞事件在媒體中討論方式的政治視角是一項重要而富有挑戰性的任務。在這篇文章中,我們強調了將社交網絡置于情景化的重要性,捕捉這些信息如何在社交網絡中傳播。我們使用最近提出的一種表示關系信息的神經網絡結構——圖卷積網絡(Graph Convolutional Network)來捕獲這些信息,并證明即使在很少的social information分類中也可以得到顯著改進。
網址:
6、Graph Neural Networks with Generated Parameters for Relation Extraction(用于關系抽取的具有生成參數的圖神經網絡)
ACL ’19
作者:Hao Zhu, Yankai Lin, Zhiyuan Liu, Jie Fu, Tat-seng Chua, Maosong Sun
摘要:近年來,在改進機器學習領域的關系推理方面取得了一些進展。在現有的模型中,圖神經網絡(GNNs)是最有效的multi-hop關系推理方法之一。事實上,在關系抽取等自然語言處理任務中,multi-hop關系推理是必不可少的。本文提出了一種基于自然語言語句生成圖神經網絡(GP-GNNs)參數的方法,使神經網絡能夠對非結構化文本輸入進行關系推理。我們驗證了從文本中提取關系的GPGNN。 實驗結果表明,與baseline相比,我們的模型取得了顯著的改進。我們還進行了定性分析,證明我們的模型可以通過multi-hop關系推理發現更精確的關系。
網址:
7、Incorporating Syntactic and Semantic Information in Word Embeddings using Graph Convolutional Networks(使用圖卷積網絡在詞嵌入中結合句法和語義信息)
ACL ’19
作者:Shikhar Vashishth, Manik Bhandari, Prateek Yadav, Piyush Rai, Chiranjib Bhattacharyya, Partha Talukdar
摘要:詞嵌入已被廣泛應用于多種NLP應用程序中。現有的詞嵌入方法大多利用詞的sequential context來學習詞的嵌入。雖然有一些嘗試利用詞的syntactic context,但這種方法會導致詞表數的爆炸。在本文中,我們通過提出SynGCN來解決這個問題,SynGCN是一種靈活的基于圖卷積的學習詞嵌入的方法。SynGCN在不增加詞表大小的情況下利用單詞的dependency context。SynGCN學習的詞嵌入在各種內部和外部任務上都優于現有方法,在與ELMo一起使用時提供優勢。我們還提出了SemGCN,這是一個有效的框架,用于整合不同的語義知識,以進一步增強所學習的單詞表示。我們提供了兩個模型的源代碼,以鼓勵可重復的研究。
網址:
代碼鏈接:
8、 GraphRel: Modeling Text as Relational Graphs for Joint Entity and Relation Extraction(GraphRel: 將文本建模為關系圖,用于實體和關系抽取)
ACL ’19
作者:Tsu-Jui Fu, Peng-Hsuan Li, Wei-Yun Ma
摘要:本文提出了一種利用圖卷積網絡(GCNs)聯合學習命名實體和關系的端到端關系抽取模型GraphRel。與之前的baseline相比,我們通過關系加權GCN來考慮命名實體和關系之間的交互,從而更好地提取關系。線性結構和依賴結構都用于提取文本的序列特征和區域特征,并利用完整的詞圖進一步提取文本所有詞對之間的隱式特征。基于圖的方法大大提高了對重疊關系的預測能力。我們在兩個公共數據集NYT和webnlg上評估了GraphRel。結果表明,GraphRel在大幅度提高recall的同時,保持了較高的precision。GraphRel的性能也比之前的工作好3.2%和5.8% (F1 score),實現了關系抽取的最先進的方法。
網址:
代碼鏈接:
9、Multi-hop Reading Comprehension across Multiple Documents by Reasoning over Heterogeneous Graphs(通過對異構圖進行推理,實現跨多個文檔的Multi-hop閱讀理解)
ACL ’19
作者:Ming Tu, Guangtao Wang, Jing Huang, Yun Tang, Xiaodong He, Bowen Zhou
摘要:跨文檔的Multi-hop閱讀理解(RC)對單文本RC提出了新的挑戰,因為它需要對多個文檔進行推理才能得到最終答案。在本文中,我們提出了一個新的模型來解決multi-hop RC問題。我們引入了具有不同類型的節點和邊的異構圖,稱為異構文檔-實體(HDE)圖。HDE圖的優點是它包含不同粒度級別的信息,包括特定文檔上下文中的候選信息、文檔和實體。我們提出的模型可以對HDE圖進行推理,節點表示由基于co-attention 和 self-attention的上下文編碼器初始化。我們使用基于圖神經網絡(GNN)的消息傳遞算法,在提出的HDE圖上累積evidence。通過對Qangaroo WIKIHOP數據集的blind測試集的評估,我們的基于HDE圖的單模型給出了具有競爭力的結果,并且集成模型達到了最先進的性能。
網址:
10、Textbook Question Answering with Multi-modal Context Graph Understanding and Self-supervised Open-set Comprehension(多模態上下文圖理解和自監督開放集理解的Textbook問答)
ACL ’19
作者:Daesik Kim, Seonhoon Kim, Nojun Kwak
摘要:在本文中,我們介紹了一種解決教科書問答(TQA)任務的新算法。在分析TQA數據集時,我們主要關注兩個相關問題。首先,解決TQA問題需要理解復雜輸入數據中的多模態上下文。為了解決從長文本中提取知識特征并與視覺特征相結合的問題,我們從文本和圖像中建立了上下文圖,并提出了一種基于圖卷積網絡(GCN)的f-GCN模塊。其次,科學術語不會分散在各個章節中,而且主題在TQA數據集中是分開的。為了克服這個所謂的“領域外”問題,在學習QA問題之前,我們引入了一種新的沒有任何標注的自監督開放集學習過程。實驗結果表明,我們的模型明顯優于現有的最先進的方法。此外,消融研究證實,將f-GCN用于從多模態上下文中提取知識的方法和我們新提出的自監督學習過程對于TQA問題都是有效的。
網址:
下載鏈接: 提取碼:rr1c
1、 Adversarial Graph Embedding for Ensemble Clustering
作者:Zhiqiang Tao , Hongfu Liu , Jun Li , ZhaowenWang and Yun Fu;
摘要:Ensemble Clustering通常通過圖分區方法將基本分區集成到共識分區(consensus partition)中,但這種方法存在兩個局限性: 1) 它忽略了重用原始特征; 2)獲得具有可學習圖表示的共識分區(consensus partition)仍未得到充分研究。在本文中,我們提出了一種新穎的對抗圖自動編碼器(AGAE)模型,將集成聚類結合到深度圖嵌入過程中。具體地,采用圖卷積網絡作為概率編碼器,將特征內容信息與共識圖信息進行聯合集成,并使用簡單的內積層作為解碼器,利用編碼的潛變量(即嵌入表示)重建圖。此外,我們還開發了一個對抗正則化器來指導具有自適應分區依賴先驗的網絡訓練。通過對8個實際數據集的實驗,證明了AGAE在幾種先進的深度嵌入和集成聚類方法上的有效性。
網址://www.ijcai.org/proceedings/2019/0494.pdf
2、Attributed Graph Clustering via Adaptive Graph Convolution
作者:Xiaotong Zhang, Han Liu, Qimai Li and Xiao-Ming Wu;
摘要:Attributed Graph聚類是一項具有挑戰性的工作,它要求對圖結構和節點屬性進行聯合建模。圖卷積網絡的研究進展表明,圖卷積能夠有效地將結構信息和內容信息結合起來,近年來基于圖卷積的方法在一些實際屬性網絡上取得了良好的聚類性能。然而,對于圖卷積如何影響聚類性能以及如何正確地使用它來優化不同圖的性能,人們的了解有限。現有的方法本質上是利用固定低階的圖卷積,只考慮每個節點幾跳內的鄰居,沒有充分利用節點關系,忽略了圖的多樣性。本文提出了一種自適應圖卷積方法,利用高階圖卷積捕獲全局聚類結構,并自適應地為不同的圖選擇合適的順序。通過對基準數據集的理論分析和大量實驗,驗證了該方法的有效性。實驗結果表明,該方法與現有的方法相比具有較好的優越性。
網址:
3、Dynamic Hypergraph Neural Networks
作者:Jianwen Jiang , Yuxuan Wei , Yifan Feng , Jingxuan Cao and Yue Gao;
摘要:近年來,基于圖/超圖(graph/hypergraph)的深度學習方法引起了研究者的廣泛關注。這些深度學習方法以圖/超圖結構作為模型的先驗知識。然而,隱藏的重要關系并沒有直接表現在內在結構中。為了解決這個問題,我們提出了一個動態超圖神經網絡框架(DHGNN),它由兩個模塊的堆疊層組成:動態超圖構造(DHG)和超圖卷積(HGC)。考慮到最初構造的超圖可能不適合表示數據,DHG模塊在每一層上動態更新超圖結構。然后引入超圖卷積對超圖結構中的高階數據關系進行編碼。HGC模塊包括兩個階段:頂點卷積和超邊界卷積,它們分別用于聚合頂點和超邊界之間的特征。我們已經在標準數據集、Cora引文網絡和微博數據集上評估了我們的方法。我們的方法優于最先進的方法。通過更多的實驗驗證了該方法對不同數據分布的有效性和魯棒性。
網址:
4、Exploiting Interaction Links for Node Classification with Deep Graph Neural Networks
作者:Hogun Park and Jennifer Neville;
摘要:節點分類是關系機器學習中的一個重要問題。然而,在圖邊表示實體間交互的場景中(例如,隨著時間的推移),大多數當前方法要么將交互信息匯總為鏈接權重,要么聚合鏈接以生成靜態圖。在本文中,我們提出了一種神經網絡結構,它可以同時捕獲時間和靜態交互模式,我們稱之為Temporal-Static-Graph-Net(TSGNet)。我們的主要觀點是,利用靜態鄰居編碼器(可以學習聚合鄰居模式)和基于圖神經網絡的遞歸單元(可以捕獲復雜的交互模式),可以提高節點分類的性能。在我們對節點分類任務的實驗中,與最先進的方法相比,TSGNet取得了顯著的進步——與四個真實網絡和一個合成數據集中的最佳競爭模型相比,TSGNet的分類錯誤減少了24%,平均減少了10%。
網址:
5、Fine-grained Event Categorization with Heterogeneous Graph Convolutional Networks
作者:Hao Peng, Jianxin Li, Qiran Gong, Yangqiu Song, Yuanxing Ning, Kunfeng Lai and Philip S. Yu;
摘要:事件在現實世界中實時發生,可以是涉及多個人和物體的計劃和組織場合。社交媒體平臺發布了大量包含公共事件和綜合話題的文本消息。然而,由于文本中事件元素的異構性以及顯式和隱式的社交網絡結構,挖掘社會事件是一項具有挑戰性的工作。本文設計了一個事件元模式來表征社會事件的語義關聯,并構建了一個基于事件的異構信息網絡(HIN),該網絡融合了外部知識庫中的信息,提出了一種基于對偶流行度圖卷積網絡(PP-GCN)的細粒度社會事件分類模型。我們提出了一種基于事件間社會事件相似度(KIES)的知識元路徑實例,并建立了一個加權鄰域矩陣作為PP-GCN模型的輸入。通過對真實數據收集的綜合實驗,比較各種社會事件檢測和聚類任務。實驗結果表明,我們提出的框架優于其他可選的社會事件分類技術。
網址:
6、Graph Contextualized Self-Attention Network for Session-based Recommendation
作者:Chengfeng Xu, Pengpeng Zhao, Yanchi Liu, Victor S. Sheng, Jiajie Xu, Fuzhen Zhuang, Junhua Fang and Xiaofang Zhou;
摘要:基于會話的推薦旨在預測用戶基于匿名會話的下一步行動,是許多在線服務(比如電子商務,媒體流)中的關鍵任務。近年來,在不使用遞歸網絡和卷積網絡的情況下,自注意力網絡(SAN)在各種序列建模任務中取得了顯著的成功。然而,SAN缺乏存在于相鄰商品上的本地依賴關系,并且限制了其學習序列中商品的上下文表示的能力。本文提出了一種利用圖神經網絡和自注意力機制的圖上下文自注意力模型(GC-SAN),用于基于會話的推薦。在GC-SAN中,我們動態地為會話序列構造一個圖結構,并通過圖神經網絡(GNN)捕獲豐富的局部依賴關系。然后,每個會話通過應用自注意力機制學習長期依賴關系。最后,每個會話都表示為全局首選項和當前會話興趣的線性組合。對兩個真實數據集的大量實驗表明,GC-SAN始終優于最先進的方法。
網址:
7、Graph Convolutional Network Hashing for Cross-Modal Retrieval
作者:Ruiqing Xu , Chao Li , Junchi Yan , Cheng Deng and Xianglong Liu;
摘要:基于深度網絡的跨模態檢索近年來取得了顯著的進展。然而,彌補模態差異,進一步提高檢索精度仍然是一個關鍵的瓶頸。本文提出了一種圖卷積哈希(GCH)方法,該方法通過關聯圖學習模態統一的二進制碼。一個端到端深度體系結構由三個主要組件構成:語義編碼模塊、兩個特征編碼網絡和一個圖卷積網絡(GCN)。我們設計了一個語義編碼器作為教師模塊來指導特征編碼過程,即學生模塊,用于語義信息的挖掘。此外,利用GCN研究數據點之間的內在相似性結構,有助于產生有區別的哈希碼。在三個基準數據集上的大量實驗表明,所提出的GCH方法優于最先進的方法。
網址: