多標簽文本分類涉及到從標簽集中為每個給定文檔分配其最相關標簽的問題。通常,給定文檔的元數據和標簽的層次結構在實際應用是可用的。然而,現有的研究大多只關注于文本信息的建模,也有少數嘗試使用元數據或層次信號,但沒有同時使用它們。在本文中,我們通過在一個大的標簽層次結構(例如,有成千上萬個標簽)中形式化元數據感知文本分類的問題來彌補這一差距。為了解決這個問題,我們提出了MATCH解決方案——一個利用元數據和層次結構信息的端到端框架。為了整合元數據,我們預先訓練文本和元數據在同一空間的嵌入,并利用完全連接的注意力來捕捉它們之間的相互關系。為了充分利用標簽層次結構,我們提出了不同的方法來規整每個子標簽的參數和輸出概率。在兩個具有大規模標簽層次的大規模文本數據集上進行的大量實驗證明了在最先進的深度學習基線上匹配的有效性。
城市流量預測從許多方面使得智慧城市的建設受益,例如交通管理和風險評估。但是關鍵先決條件是對城市的細粒度動態有足夠的掌握。因此,與之前的工作僅限于粗粒度數據不同,這篇論文中將城市流量預測的范圍擴展到細粒度,這帶來了一些具體挑戰:1)在細粒度數據中觀察到的網格間的轉移動態使預測變得更加復雜,需要在全局范圍內捕獲網格單元之間的空間依賴性;2)單獨學習外部因素(例如天氣)對大量網格單元的影響是非常具有挑戰性的。為了解決這兩個挑戰,本文中提出了時空關系網(STRN)來預測細粒度的城市流量。首先,骨干網用于學習每個網格單元的高級表示,第二,文中還提出了一個全局關系模塊(GloNet),與現有方法相比,該模塊可以更有效地捕獲全局空間依賴性。第三,模型中設計了一個元學習器,它將外部因素和土地功能(例如POI密度)作為輸入以產生元知識并提高模型性能。論文提出的模型在兩個現實世界的數據集進行了充足的實驗。結果表明,與最新方法相比,STRN減少了7.1%到11.5%的誤差,而使用了更少的參數。
在推薦系統中,當用戶-物品交互數據稀疏時,常用社會關系來提高推薦質量。大多數現有的社交推薦模型都是利用成對關系來挖掘潛在的用戶偏好。然而,現實生活中用戶之間的互動非常復雜,用戶關系可以是高階的。超圖提供了一種自然的方式來建模復雜的高階關系,而它在改善社會推薦方面的潛力還有待開發。在本文中,我們填補了這一空白,提出了一種利用高階用戶關系增強社交推薦的多通道超圖卷積網絡。技術上,網絡中的每個通道通過超圖卷積編碼一個描述常見高階用戶關系模式的超圖。通過聚合通過多種渠道學習到的嵌入,我們獲得了全面的用戶表示,從而產生推薦結果。然而,聚合操作也可能掩蓋不同類型高階連接信息的固有特征。為了彌補累積損失,我們創新性地將自監督學習融入到超圖卷積網絡的訓練中,以獲取具有層次互信息最大化的連通信息。在多個真實數據集上的實驗結果表明,該模型優于SOTA方法,消融研究驗證了多通道設置和自監督任務的有效性。我們的模型的實現可以通過//github.com/Coder-Yu/RecQ獲得。
特別檢索任務是給定查詢和文檔集合對相關文檔進行排序。一系列基于深度學習的方法被提出來解決這一問題,并得到了廣泛的關注。但是,我們認為它們本質上是基于局部詞序列的,忽略了細微的長距離文檔級詞關系。為了解決這一問題,我們通過圖結構明確地建模文檔級詞關系,并通過圖神經網絡捕獲微妙信息。此外,由于文檔集合的復雜性和規模,在更一般的級別上探索不同粒度層次匹配信號是相當重要的。因此,我們提出了一種基于圖的層次關聯匹配模型(GHRM)用于特殊檢索,該模型可以同時捕捉細微的和一般的層次匹配信號。我們在兩個具有代表性的特別檢索基準上驗證了GHRM的效果,綜合的實驗和結果表明它優于最新的檢索方法。
//www.zhuanzhi.ai/paper/f8e503be30747a4059bfb9e80e79705e
圖卷積網絡(GCNs)在推薦方面表現出巨大的潛力。這歸功于他們通過利用來自高階鄰居的協作信號來學習良好的用戶和項目嵌入的能力。與其他GCN模型一樣,基于GCN的推薦模型也存在著臭名昭著的過平滑問題——當疊加更多層時,節點嵌入變得更加相似,最終無法區分,導致性能下降。最近提出的LightGCN和LR-GCN在一定程度上緩解了這一問題,但是我們認為他們忽略了推薦中出現過平滑問題的一個重要因素,即在圖卷積操作中,用戶的嵌入學習也可以涉及到與用戶沒有共同興趣的高階鄰域用戶。因此,多層圖卷積會使不同興趣的用戶具有相似的嵌入性。在本文中,我們提出了一種新的興趣感知消息傳遞GCN (IMP-GCN)推薦模型,該模型在子圖中進行高階圖卷積。子圖由具有相似興趣的用戶及其交互項組成。為了形成子圖,我們設計了一個無監督的子圖生成模塊,該模塊利用用戶特征和圖結構來有效識別具有共同興趣的用戶。為此,我們的模型可以避免將高階鄰域的負面信息傳播到嵌入學習中。在三個大規模基準數據集上的實驗結果表明,我們的模型可以通過疊加更多的層來獲得性能的提高,顯著優于目前最先進的基于GCN的推薦模型。
異構網絡的表示學習方法為每個節點產生一個低維向量嵌入,通常在所有涉及節點的任務中都是固定的。許多現有的方法關注于以一種與下游應用程序無關的方式獲取節點的靜態向量表示。然而,在實踐中,下游任務(如鏈接預測)需要特定的上下文信息,這些信息可以從與節點相關的子圖中提取出來,作為任務的輸入。為了解決這一挑戰,我們提出了SLiCE,這是一個使用整個圖的全局信息和局部注意驅動機制來學習上下文節點表示的靜態表示學習方法的框架。我們首先通過引入高階語義關聯和屏蔽節點以自監督的方式預訓練我們的模型,然后針對特定的鏈接預測任務微調我們的模型。我們不再通過聚合所有通過元路徑連接的語義鄰居的信息來訓練節點表示,而是自動學習不同元路徑的組合,這些元路徑表征了特定任務的上下文,而不需要任何預先定義的元路徑。SLiCE在幾個公開可用的基準網絡數據集上顯著優于靜態和上下文嵌入學習方法。通過廣泛的評價,我們也證明了上下文學習的可解釋性、有效性和SLiCE的可擴展性。
分類法是一種層次結構的知識圖譜,在機器智能中起著至關重要的作用。分類法擴展任務旨在為現有分類法中的新術語找到一個位置,以捕獲世界上正在出現的知識,并保持分類法的動態更新。以往的分類法擴展解決方案忽略了層次結構所帶來的有價值的信息,只評估了增加的一條邊的正確性,從而將問題降級為節點對評分或小路徑分類。在本文中,我們提出了層次擴展框架(HEF),充分利用層次結構的特性,最大限度地提高擴展分類的一致性。HEF在多個方面利用了分類法的層次結構: (i) HEF利用包含相關節點最多的子樹作為自監督數據,對親兄弟關系進行完整的比較; (ii) HEF采用一致性建模模塊,通過整合hypernymy關系檢測和多個樹獨占特征來評估分類子樹的一致性; iii) HEF引入了位置選擇的擬合得分,明確評價路徑選擇和水平選擇,并充分利用親代關系交換信息進行消歧和自我修正。大量的實驗表明,通過更好地利用層次結構和優化分類法的一致性,HEF在三個基準數據集上的準確率平均提高了46.7%,平均倒數排名提高了32.3%。
//www.zhuanzhi.ai/paper/adeba9959c7b75259d5b83a0e99d79e2
面向物體語義理解的視覺表示學習
在對真實世界中的物體進行描述時,人們通常使用大量抽象的語義概念,如物體的顏色、形狀、類別等。一方面,這些抽象的語義概念在不同的物體間是可以共享的,因此語義概念天然地可以將不同的物體聯系在一起,從而快速、準確地建立真實世界中身邊的物體與已知的物體之間的關聯,方便人們理解周圍的世界。另一方面,不同抽象程度的語義概念之間也并非完全相互獨立,而是存在一定的關聯關系,因此語義概念也是人在進行推理過程中的重要線索之一。綜上所述,語義概念在感知和認知任務中都有重要的作用,因此對于計算機視覺算法來說,掌握和理解語義概念具有巨大的潛在價值。具體來說,算法對于語義概念的理解可以分為以下四個層次:第一,識別物體具有的語義概念,如物體屬性預測、物體識別等;第二,挖掘物體間由語義概念組成的關聯,如統計出多個物體具有相同的屬性;第三,建立多維度的語義關聯知識網絡,如建立起尐馬少這類物體基本都具有尐四足少屬性這樣的知識;第四,利用語義關聯知識進行邏輯推理。近年來,盡管計算機視覺技術取得了長足的發展,但是由于物體語義的高度復雜,上述感知問題仍然沒有被完全解決。而在更高的層面上,只有很少的工作涉及到了挖掘不同抽象程度的語義概念之間的聯系。針對上述物體間及語義概念間的關聯學習,本文利用表示學習的方法,著手解決其中的三個關鍵問題:(就)快速、準確地識別物體間的語義關聯;(尲)在不同的語義抽象程度上挖掘物體間的關聯關系;(尳)使用盡可能少的人工標注,建立不同抽象程度的語義概念之間的關聯。在理論方面,本文提出的方法可以實現對圖像、場景的深層次理解,在一定程度上解決計算機視覺問題中的知其然而不知其所以然的問題。在應用方面,本文提出的方法在多個不同抽象程度的語義概念上建立了物體之間的關聯,并且通過學習的方式建立了不同抽象程度的語義概念之間的關聯,因此本文提出的方法在個性化圖像檢索、知識推理等任務上具有潛在的應用價值。具體地,本文以最常見的語義概念——類別作為出發點,逐漸深入地展開研究工作,圍繞物體間語義關聯及語義概念間的關聯學習開展以下四個主要工作:
(1)提出了一種端到端的有監督二值碼深度學習算法,用來解決大規模依據類別的圖像檢索任務。該任務中,給定一張查詢圖像,系統的目標是檢索屬于同類的數據庫中圖像。為了引入判別性,該方法對圖像對或圖像三元組之間。的距離進行約束,要求相似的圖像具有相似的二值碼,反之亦然。此外,針對哈希編碼學習中的二值量化導致的損失函數不可導問題,該方法提出了一種全新的量化損失約束,在保持判別性約束的同時,通過施加量化損失約束,減少量化損失帶來的檢索精度損失。
(2)提出了一種基于離散優化的兩階段有監督二值碼深度學習方法,主要針對上一個工作中,由于判別性損失與量化損失的優化目標不同而導致的判別性損失難以收斂到最優的問題。其中,在第一階段,通過設計一種離散優化算法,直接在漢明空間中迭代優化,得到具有強判別性的二值碼;在第二階段,通過訓練模型擬合優化得到的二值碼,從而避免判別性損失與量化損失之間的沖突,得到檢索精度更高的二值碼。
(3)提出了一種可以在多個維度的語義概念上建立物體間關聯的二值碼學習方法,從而相比于前兩個工作,可以更好地建模物體間豐富的語義關聯。該方法通過同時使用多個損失函數對模型進行訓練,將多種不同抽象程度的語義概念編碼到同一組二值碼中。因此,該方法可以根據不同用戶的特定需求,按照不同的方式使用學習到的二值編碼,進行相應的圖像檢索任務,找到在特定語義標準下相似的數據庫圖像。另外,考慮到目前公開的數據集中,只有極少數的數據同時具有多種不同抽象程度的語義概念的標注,為了使模型具有更強的泛化性能,該方法被設計為可以使用大量存在的部分標注數據進行訓練。
(4)設計了一種算法來自動地挖掘語義概念間天然存在的關聯,包括物體的類別之間的關聯,以及物體類別與視覺屬性之間的關聯。在前三個方法中,并沒有很好地利用不同語義概念之間的關聯進行模型的學習。其中一個重要原因是語義概念間關聯數據的匱乏。由于目前的公開數據集上幾乎沒有這類標注,該方法基于表示學習技術,自動地從大量圖像中學習視覺屬性的概念,并基于學習到的視覺屬性,建立類別層級結構中不同語義概念之間的關聯,從而構建起語義關聯知識。在應用層面上,該方法可以對物體識別模型的預測結果給出人類可理解的解釋。此外,該方法學習到的語義關聯知識,對于需要進行知識推理的計算機視覺認知任務具有巨大的潛在應用價值。
由于層次主題結構在海量文本語料庫中普遍存在,將文檔分類到給定的標簽層次結構直觀上很有吸引力。雖然相關研究在全監督層次文檔分類方面取得了令人滿意的效果,但通常需要大量的人工標注訓練數據,且只利用文本信息。但在很多領域,(1)標注代價很高,可以獲取的訓練樣本很少;(2)文檔伴隨元數據信息。因此,本文研究弱監管下如何整合標簽層次結構、元數據和文本信號進行文檔分類。我們開發了HiMeCat,一個基于嵌入的生成框架用于我們的任務。具體地說,我們提出了一種新的聯合表示學習模塊,它允許對類別相關性、元數據信息和文本語義進行同步建模,我們的實驗證明了HiMeCat在Baseline上的持續改進,并驗證了我們的表示學習和數據增強模塊的貢獻。
//www.zhuanzhi.ai/paper/78629167dfc41e4a21cb8484c0b86e0a
中科院自動化所智能感知與計算研究中心張羽豐、吳書等人,受到圖結構數據易于建立整體關聯關系的啟發,提出一種基于圖神經網絡的歸納式文本分類方法。不再以完全順序化的方式學習文本內容,而是將文本構建為復雜關聯的圖結構進行學習,為上述問題提供了解決思路。相關成果發表于頂級國際會議ACL 2020。
該工作以單詞為節點、單詞間的共現關系為邊,將每個文檔構建為擁有自身結構的圖,將文本分類任務轉化為圖分類任務。通過應用圖神經網絡模型,單詞可聚合學習所有關聯單詞的表示,同時也可捕獲中長距離的上下文關系。最后使用最大池化加平均池化的方法,將所有單詞聚合為該文本的表示,進而得到其分類標簽。
基于圖神經網絡的文本分類模型示意圖
該模型在多個數據集中均取得最好性能,同時適用于歸納式學習,即當文本包含較多新詞的時候,也能取得不錯的效果。
該項研究在自然語言處理、信息組織和管理、內容信息過濾等領域都有著廣泛的應用,例如輿情監測、新聞分類、垃圾郵件過濾、個性化推薦等,也為相關領域的問題提供了新的研究思路。
摘要:文本序列中各單詞的重要程度以及其之間的依賴關系對于識別文本類別有重要影響.膠囊網絡不能選擇性關注文本中重要單詞,并且由于不能編碼遠距離依賴關系,在識別具有語義轉折的文本時有很大局限性.為解決上述問題,該文提出了一種基于多頭注意力的膠囊網絡模型,該模型能編碼單詞間的依賴關系、捕獲文本中重要單詞,并對文本語義編碼,從而有效提高文本分類任務的效果.結果表明:該文模型在文本分類任務中效果明顯優于卷積神經網絡和膠囊網絡,在多標簽文本分類任務上效果更優,能更好地從注意力中獲益。