題目: Background Knowledge Injection forInterpretable Sequence Classification
摘要: 序列分類是一項有監督的學習任務,它建立模型來預測未知符號序列的類標簽。盡管準確性是最重要的,但在某些情況下,可解釋性是必須的。不幸的是,我們回溯了人類獨立的可解釋性度量,這樣的權衡通常很難實現。我們介紹了一種新的序列學習算法,它結合了(i)線性分類器,已知線性分類器在預測能力和可解釋性之間取得了很好的平衡,以及(ii)背景知識嵌入。我們將經典的子序列特征空間擴展為由嵌入字或圖的背景知識生成的符號組,并利用這個新的特征空間學習線性分類器。提出了一種新的基于符號嵌入的符號特征集可解釋性評價方法。從可穿戴設備和氨基酸序列分類中識別人類活動的實驗表明,我們的分類方法保留了預測能力,同時提供了更多的可解釋模型。
作者簡介: Severin Gsponer,都柏林大學學院數據分析洞察中心博士生。
Luca Costabello,都柏林大學學院埃森哲實驗室,研究科學家。等
題目: Knowledge Graph Embeddings and Explainable AI
摘要: 知識圖譜嵌入是一種廣泛采用的知識表示方法,它將實體和關系嵌入到向量空間中。在這一章中,我們通過解釋知識圖譜嵌入是什么,如何生成它們以及如何對它們進行評估,向讀者介紹知識圖譜嵌入的概念。我們總結了這一領域的最新研究成果,對向量空間中表示知識的方法進行了介紹。在知識表示方面,我們考慮了可解釋性問題,并討論了通過知識圖譜嵌入來解釋預測的模型和方法。
題目:
Generating new concepts with hybrid neuro-symbolic models
簡介:
人類的概念知識支持生成新穎而高度結構化的概念的能力,而這種概念知識的形式引起科學家的極大興趣。一種傳統強調結構化知識,將概念視為嵌入直觀理論中或組織為復雜的符號知識結構的概念。第二種傳統強調統計知識,將概念知識視為訓練神經網絡和其他統計模型所捕獲的豐富相關結構中的新興知識。在本文中,我們通過用于產生新概念的新型神經符號模型探索了這兩種傳統的綜合。使用簡單的視覺概念作為測試平臺,我們將神經網絡和符號概率程序結合在一起,以學習新型手寫字符的生成模型。使用更通用的神經網絡體系結構探索了兩個替代模型。我們比較了這三種模型中每種模型在保留字符類上的可能性以及它們的產品質量,發現我們的混合模型學習了最有說服力的表示,并從訓練中得到了進一步的概括。
【導讀】2020 年 2 月 7 日-2 月 12 日,AAAI 2020 在美國紐約舉辦。Michael Galkin撰寫了AAAI2020知識圖譜論文相關研究趨勢包括:KG-Augmented語言模型,異構KGs中的實體匹配,KG完成和鏈路預測,基于kg的會話人工智能和問題回答,包括論文,值得查看!
Hiroaki Hayashi, Zecong Hu, Chenyan Xiong, Graham Neubig: Latent Relation Language Models. AAAI 2020
題目: Embedding Symbolic Knowledge into Deep Networks
摘要:
在這項工作中,我們的目標是利用先前的符號知識來提高深層模型的性能。提出了一種利用增廣圖卷積網絡(GCN)將命題公式(和賦值)投影到流形上的圖嵌入網絡。為了生成語義上可靠的嵌入,我們開發了識別節點異構性的技術和將結構約束合并到嵌入中的語義正則化。實驗結果表明,該方法提高了訓練后的模型的性能,使其能更好地進行蘊涵檢測和視覺關聯預測。有趣的是,我們觀察到命題理論表達的可追蹤性和嵌入的容易程度之間的聯系。對這一聯系的進一步探索可以闡明知識編輯與向量表示學習之間的關系。
作者:
Ziwei Xu是新加坡國立大學博士研究生。之前是中國科學技術大學的一名本科生,對計算機視覺感興趣,尤其對搭建自然語言、人類知識和視覺世界之間的橋梁感興趣。
題目: Towards Hierarchical Importance Attribution:explaining compositional semantics for Neural Sequence Models
摘要:
深度神經網絡在處理復雜的自然語言語義方面取得了令人印象深刻的成績,但大多數情況下被當作黑匣子。為了解釋該模型如何處理單詞和短語的組合語義,我們研究了層次解釋問題。我們強調的關鍵挑戰是計算非附加和上下文無關的單個單詞和短語的重要性。我們展示了之前在層次解釋上的一些努力,例如上下文分解,在數學上不能滿足期望的屬性,導致不同模型的解釋質量不一致。在本文中,我們提出了一種形式化的方法來量化每個詞或短語的重要性,從而產生層次解釋。我們根據我們的公式修改了上下文分解算法,并提出了一個具有競爭性能的與模型無關的解釋算法。對LSTM模型和對多個數據集的微調BERT Transformer模型進行人工評估和自動度量評估表明,我們的算法在層次解釋方面明顯優于先前的工作。我們展示了我們的算法有助于解釋語義的組合性,提取分類規則,提高模型的人類可信度。
題目: Knowledge-Enriched Visual Storytelling
摘要: 故事具有多樣性和高度個性化,為故事生成提供了很大的可能輸出空間。現有的端到端方法產生單調的故事,因為它們僅限于單個訓練數據集中的詞匯和知識。本文介紹了KG-Story,一個三階段的框架,它允許故事生成模型利用外部知識圖生成有趣的故事。KG-Story從輸入提示中提取一組有代表性的單詞,利用外部知識圖豐富單詞集,最后根據豐富的單詞集生成故事。這種蒸餾-濃縮-生成框架不僅允許在濃縮階段使用外部資源,還允許在蒸餾和生成階段使用外部資源。在本文中,我們展示了KG故事在視覺講故事方面的優越性,輸入提示是五張照片的序列,輸出是一個短篇故事。根據人類排名評估,KG Story生成的故事平均排名高于最先進的系統。
作者簡介: Chao Chun Hsu,美國科羅拉多大學博德分校計算機科學系研究助理。
Lun-Wei Ku,中國科學院信息科學研究所博士。
主題: Effective Linear Models for Learning with Sequences and Time Series
摘要: 在這篇演講中,演講者介紹了他的研究小組在開發用于序列和時間序列數據的分類和回歸任務的機器學習算法方面所做的一些工作。重點是訓練線性模型的算法。盡管這些線性模型被認為過于簡單,無法在許多學習任務中實現高精度,但當在豐富的特征空間中進行訓練時,它們是非常復雜的模型(如集成和深度學習模型)的有力競爭對手。具有豐富特征的線性模型與復雜的非線性模型一樣精確,但訓練效率高,易于解釋。這種情況下的可解釋性意味著模型(加權特征列表)和預測(特征權重之和)對用戶是透明的。他首先概述了他們遇到序列和時間序列的重要和廣泛的應用領域,討論了使用序列學習的常用方法,并提出了序列分類和回歸任務的算法。他還展示了序列學習的思想如何自然地傳遞給時間序列數據,并展示了一個從多個符號表示中選擇特征的線性模型,實現了最先進的時間序列分類精度。通過組合序列數據的多種表示形式來創建豐富的特征,使得線性模型能夠獲得高精度、高效的訓練和保持可解釋性,后者是許多應用中的一個關鍵要求。
邀請嘉賓: Georgiana Ifrim博士是都柏林大學學院計算機科學學院的助理教授,是SFI機器學習研究培訓中心(ML Labs)的聯合負責人,同時也是SFI資助的Insight Centre for Data Analytics和VistaMilk Research centres的調查員。她是加州大學計算機科學學院的研究生研究主任。 個人主頁://people.ucd.ie/georgiana.ifrim
論文題目: Rule-Guided Compositional Representation Learning on Knowledge Graphs
摘要:
知識圖的表示學習是將知識圖中的實體和關系嵌入到低維連續向量空間中。早期的KG嵌入方法只關注編碼在三元組中的結構化信息,由于KG的結構稀疏性,其性能受到限制。最近的一些嘗試考慮路徑信息來擴展KGs的結構,但是在獲取路徑表示的過程中缺乏可解釋性。本文提出了一種新的基于規則和路徑的聯合嵌入(RPJE)方案,該方案充分利用了邏輯規則的可解釋性和準確性、KG嵌入的泛化性以及路徑的補充語義結構。具體來說,首先從KG中挖掘出不同長度(規則體中的關系數)的Horn子句形式的邏輯規則,并對其進行編碼,用于表示學習。然后,利用長度2的規則來精確地組合路徑,而使用長度1的規則來明確地創建關系之間的語義關聯和約束關系嵌入。優化時還考慮了規則的置信度,保證了規則在表示學習中的可用性。大量的實驗結果表明,RPJE在KG完成任務上的表現優于其他最先進的基線,這也證明了利用邏輯規則和路徑來提高表示學習的準確性和可解釋性的優越性。
論文作者:
張永飛:男,博士,副教授,博士生導師。2005年畢業于北京航空航天大學自動化學院,獲學士學位,免推直博;2011年畢業于北京航空航天大學模式識別與智能系統專業,獲博士學位。2007年至2009年在美國密蘇里大學哥倫比亞分校電氣與工程學院訪問。2011年加入北航計算機學院數字媒體北京市重點實驗室。科研工作:目前主要研究方向包括(1)(視覺)大數據智能分析處理;(2)高性能實時圖像/視頻編解碼與可靠傳輸。主持國家自然科學基金項目面上項目、國家重點研發計劃項目子課題、國家自然科學基金重點項目子課題、863項目子課題、國家重點實驗室自主課題、企業合作預研項目等多項科研任務;作為技術骨干參與國家973計劃、杰出青年基金、國家自然科學基金項目等多項國家級課題的科研工作等。
劉偲,計算機學院副教授、博導。 2012年博士畢業于中科院自動化所,2009-2014年于新加坡國立大學(NUS)任研究助理、博后。2016年在微軟亞洲研究院(MSRA)任鑄星計劃研究員。2014-2018在中國科學院信工所任副研究員。其研究方向是跨模態多媒體智能分析,包括自然語言處理(NLP)和計算機視覺(CV)。共發表了CCF A類論文 40余篇,其研究成果發表于TPAMI、IJCV、TIP、CVPR、ICCV和ACM MM等。 Google Scholar引用4000+次。2017年入選中國科協青年人才托舉工程,2017年獲CCF-騰訊犀牛鳥專利獎。任2017中國計算機大會(CNCC)主論壇特邀講者,2017 CCF青年精英大會“青年技術秀”講者。獲2017 ACM 中國新星提名獎,2017國際計算機學會人工智能專委會中國區(ACM SIGAI China) 新星獎,2018吳文俊人工智能優秀青年獎。 另外,她獲CCF A類會議ACM MM 2012最佳技術演示獎,ACM MM 2013最佳論文獎。指導學生獲得ChinaMM2018 最佳學生論文獎。帶領學生多次獲得國際、國內競賽冠軍: 2016年獲CCF大數據與計算智能大賽(BDCI)綜合特等獎,2017年獲CVPR Look Into Person Challenge Human Parsing Track冠軍,2019年獲得ICCV Youtube-Video Object Segmentation 競賽冠軍。 主辦了ECCV 2018和ICCV 2019‘Person in Context’workshop。擔任中國圖像圖形學學會理事、副秘書長。任ICCV 2019、CVPR 2020 Area chair,AAAI 2019、IJCAI2019、IJCAI 2020 SPC。