題目: Towards Hierarchical Importance Attribution:explaining compositional semantics for Neural Sequence Models
摘要:
深度神經網絡在處理復雜的自然語言語義方面取得了令人印象深刻的成績,但大多數情況下被當作黑匣子。為了解釋該模型如何處理單詞和短語的組合語義,我們研究了層次解釋問題。我們強調的關鍵挑戰是計算非附加和上下文無關的單個單詞和短語的重要性。我們展示了之前在層次解釋上的一些努力,例如上下文分解,在數學上不能滿足期望的屬性,導致不同模型的解釋質量不一致。在本文中,我們提出了一種形式化的方法來量化每個詞或短語的重要性,從而產生層次解釋。我們根據我們的公式修改了上下文分解算法,并提出了一個具有競爭性能的與模型無關的解釋算法。對LSTM模型和對多個數據集的微調BERT Transformer模型進行人工評估和自動度量評估表明,我們的算法在層次解釋方面明顯優于先前的工作。我們展示了我們的算法有助于解釋語義的組合性,提取分類規則,提高模型的人類可信度。
題目: Interpretable Deep Graph Generation with Node-edge Co-disentanglement
摘要:
解糾纏表示學習近年來受到了廣泛的關注,特別是在圖像表示學習領域。然而,學習圖背后的解糾纏表示在很大程度上仍未探索,特別是對于同時具有節點和邊緣特征的屬性圖。圖生成的解糾纏學習具有實質性的新挑戰,包括
為了解決這些問題,提出了一個新的屬性圖深層生成模型的解糾纏增強框架。特別地,提出了一種新的變分目標來解開上述三種潛在因素,并具有新的節點和邊緣反褶積結構。此外,在每種類型中,個體因素的分離進一步增強,這被證明是對現有圖像框架的一般化。在綜合數據集和真實數據集上的定性和定量實驗證明了該模型及其擴展的有效性。
題目: Hierarchical Knowledge Graphs: A Novel Information Representation for Exploratory Search Tasks
簡介: 在探索性搜索任務中,除了信息檢索之外,信息表示是有意義的重要因素。在本文中,我們探索了知識圖的多層擴展,即層次知識圖(HKG),它將層次化和網絡可視化結合為統一的數據表示形式,作為支持探索性搜索工具。我們將描述我們的算法,以構建可視化效果,分析結果以定量地展示與網絡的性能奇偶性以及相對于層次結構的性能優勢,并從交互日志,interviews和thinkalouds的數據綜合到測試平臺數據集上,以證明統一的分層結構+ HKG中的網絡結構。除了上述研究,我們還對精度和召回率對兩種不同的探索性搜索任務的層次知識圖的性能進行了其他混合方法分析。雖然定量數據顯示精確度和召回率對用戶性能和用戶工作量的影響有限,但定性數據與事后統計分析相結合提供了證據,表明探索性搜索任務的類型(例如學習與調查)可能會受到精確度和召回影響。此外,我們的定性分析發現用戶無法感知所提取信息的質量差異。我們討論了結果的含義,并分析了在實驗任務中對探索性搜索性能產生更大影響的其他因素。
題目: Knowledge Graph Embeddings and Explainable AI
摘要: 知識圖譜嵌入是一種廣泛采用的知識表示方法,它將實體和關系嵌入到向量空間中。在這一章中,我們通過解釋知識圖譜嵌入是什么,如何生成它們以及如何對它們進行評估,向讀者介紹知識圖譜嵌入的概念。我們總結了這一領域的最新研究成果,對向量空間中表示知識的方法進行了介紹。在知識表示方面,我們考慮了可解釋性問題,并討論了通過知識圖譜嵌入來解釋預測的模型和方法。
主題: DEPARA: Deep Attribution Graph for Deep Knowledge Transferability
摘要: 探索經過PRe訓練的深度神經網絡(PR-DNN)編碼的異構任務之間的知識之間的內在聯系,揭示了它們的相互可移植性,從而使知識能夠從一項任務轉移到另一項任務,從而減少了后者的培訓工作量。在本文中,我們提出了DEeP屬性圖(DEPARA),以研究從PR-DNN中獲得的知識的可傳遞性。在DEPARA中,節點對應于輸入,并由其相對于PR-DNN輸出的矢量歸因圖表示。邊緣表示輸入之間的相關性,并通過從PR-DNN中提取的特征相似性來衡量。兩個PR-DNN的知識可傳遞性是通過它們對應的DEPARA的相似性來衡量的。我們將DEPARA應用于轉移學習中的兩個重要但尚未充分研究的問題:預先訓練的模型選擇和層選擇。進行了廣泛的實驗以證明所提出的方法在解決這兩個問題上的有效性和優越性。
題目: Learning Representations For Images With Hierarchical Labels
摘要:
圖像分類已經得到了廣泛的研究,但是除了傳統的圖像標簽對之外,在使用非常規的外部指導來訓練這些模型方面的工作還很有限。在本文中,我們提出了一組利用類標簽引起的語義層次信息的方法。在論文的第一部分,我們將標簽層次知識注入到任意的分類器中,并通過實驗證明,將這些外部語義信息與圖像的視覺語義相結合,可以提高整體性能。在這個方向上更進一步,我們使用自然語言中流行的基于保留順序的嵌入模型來更明確地建模標簽-標簽和標簽-圖像的交互,并將它們裁剪到計算機視覺領域來執行圖像分類。盡管在本質上與之相反,在新提出的、真實世界的ETH昆蟲學收集圖像數據集上,注入層次信息的CNN分類器和基于嵌入的模型都優于不可知層次的模型。
通過對異構任務的預訓練深度神經網絡(PR-DNNs)中編碼的知識之間的內在聯系,揭示了它們之間的互換性,從而使知識從一個任務轉移到另一個任務,從而減少后者的訓練工作量。本文提出了深度歸因圖(depa)來研究從PR-DNNs中學習到的知識的可轉移性。在DEPARA中,節點對應于輸入,并由與PR-DNN輸出相關的向量化屬性映射表示。邊緣表示輸入之間的相關性,并通過從PR-DNN中提取的特征的相似性來度量。兩種PR-DNNs的知識轉移能力是通過其對應基因間的相似性來衡量的。我們將DEPARA應用于轉移學習中兩個重要但尚未研究的問題:預先訓練的模型選擇和層選擇。大量的實驗證明了所提出的方法在解決這兩個問題上的有效性和優越性。復制本文結果的代碼、數據和模型可以在
題目
不解析,生成!用于面向任務的語義分析的序列到序列體系結構,Don't Parse, Generate! A Sequence to Sequence Architecture for Task-Oriented Semantic Parsing
類型
自然語言語義解析
關鍵字
自然語言理解與生成,語義解析,智能搜索查詢,智能語音助手,機器學習
簡介
諸如Amazon Alexa,Apple Siri和GoogleAssistant之類的虛擬助手通常依靠語義解析組件來了解要執行哪些操作以使其用戶說出一句話。傳統上,基于規則或統計空位填充系統曾被用來解析“簡單”查詢;也就是說,包含單個動作的查詢可以分解為一組不重疊的實體。最近,提出了移位減少解析器來處理更復雜的話語。這些方法雖然功能強大,但對可以解析的查詢類型施加了特定的限制。在這項工作中,我們提出了一種基于順序序列模型和指針生成器網絡的統一體系結構,以處理簡單查詢和復雜查詢。與其他作品不同,我們的方法不對語義剖析施加任何限制。此外,實驗表明,它在三個公開可用的數據集(ATIS,SNIPS,Facebook TOP)上均達到了最先進的性能,與以前的系統相比,不精確匹配的準確性相對提高了3.3%至7.7%。最后,我們在兩個內部數據集上展示了我們的方法的有效性。
作者
Subendhu Rongali?,馬薩諸塞大學阿默斯特分校
Luca Soldaini,亞馬遜Alexa搜索
Wael Hamza,亞馬遜Alexa
Emilio Monti,亞馬遜Alexa AI
題目: Background Knowledge Injection forInterpretable Sequence Classification
摘要: 序列分類是一項有監督的學習任務,它建立模型來預測未知符號序列的類標簽。盡管準確性是最重要的,但在某些情況下,可解釋性是必須的。不幸的是,我們回溯了人類獨立的可解釋性度量,這樣的權衡通常很難實現。我們介紹了一種新的序列學習算法,它結合了(i)線性分類器,已知線性分類器在預測能力和可解釋性之間取得了很好的平衡,以及(ii)背景知識嵌入。我們將經典的子序列特征空間擴展為由嵌入字或圖的背景知識生成的符號組,并利用這個新的特征空間學習線性分類器。提出了一種新的基于符號嵌入的符號特征集可解釋性評價方法。從可穿戴設備和氨基酸序列分類中識別人類活動的實驗表明,我們的分類方法保留了預測能力,同時提供了更多的可解釋模型。
作者簡介: Severin Gsponer,都柏林大學學院數據分析洞察中心博士生。
Luca Costabello,都柏林大學學院埃森哲實驗室,研究科學家。等