亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

由于層次主題結構在海量文本語料庫中普遍存在,將文檔分類到給定的標簽層次結構直觀上很有吸引力。雖然相關研究在全監督層次文檔分類方面取得了令人滿意的效果,但通常需要大量的人工標注訓練數據,且只利用文本信息。但在很多領域,(1)標注代價很高,可以獲取的訓練樣本很少;(2)文檔伴隨元數據信息。因此,本文研究弱監管下如何整合標簽層次結構、元數據和文本信號進行文檔分類。我們開發了HiMeCat,一個基于嵌入的生成框架用于我們的任務。具體地說,我們提出了一種新的聯合表示學習模塊,它允許對類別相關性、元數據信息和文本語義進行同步建模,我們的實驗證明了HiMeCat在Baseline上的持續改進,并驗證了我們的表示學習和數據增強模塊的貢獻。

//www.zhuanzhi.ai/paper/78629167dfc41e4a21cb8484c0b86e0a

付費5元查看完整內容

相關內容

弱監督學習:監督學習的一種。大致分3類,第一類是不完全監督(incomplete supervision),即,只有訓練集的一個(通常很小的)子集是有標簽的,其他數據則沒有標簽。這種情況發生在各類任務中。例如,在圖像分類任務中,真值標簽由人類標注者給出的。從互聯網上獲取巨量圖片很容易,然而考慮到標記的人工成本,只有一個小子集的圖像能夠被標注。第二類是不確切監督(inexact supervision),即,圖像只有粗粒度的標簽。第三種是不準確的監督(inaccurate supervision),模型給出的標簽不總是真值。出現這種情況的常見原因有,圖片標注者不小心或比較疲倦,或者某些圖片就是難以分類。

解決冷啟動問題對于為新用戶和新項目提供有意義的推薦結果是必不可少的。在稀疏觀察數據下,未觀察到的用戶物品對也是提取潛在用戶信息需求的重要來源。目前的研究大多利用未觀察到的樣本來提取負信號。然而,這種優化策略可能會導致對已經受歡迎的項目的偏見結果,因為它會頻繁地將新項目作為負面實例處理。在本研究中,我們通過適當利用未觀察到的樣本來解決新用戶/物品的冷啟動問題。我們提出了一種基于圖神經網絡的知識圖譜感知推薦器,該推薦器通過偽標注來增加標注樣本。我們的方法積極地使用未觀察到的樣本作為積極的實例。為了避免對所有可能的用戶和項目進行詳盡的標簽分配,我們利用KG為每個用戶選擇可能為正的項目。我們還采用了改進的負抽樣策略,從而抑制受歡迎偏見的加劇。通過實驗,我們證明了在各種場景下,我們的方法比最先進的KG感知推薦器都有改進; 特別是,我們的方法成功地改善了冷啟動用戶/項目的推薦性能。

付費5元查看完整內容

針對自監督學習的深度聚類是無監督視覺表示學習中一個非常重要和有前途的方向,因為設計前置任務需要較少的領域知識。而關鍵組件嵌入聚類由于需要保存整個數據集的全局潛在嵌入,限制了其擴展到超大規模的數據集。在這項工作中,我們的目標是使這個框架在不降低性能的情況下更加簡單和優雅。提出了一種不使用嵌入聚類的無監督圖像分類框架,與標準的監督訓練方法非常相似。為了進一步解釋,我們進一步分析了其與深度聚類和對比學習的關系。在ImageNet數據集上進行了大量的實驗,驗證了該方法的有效性。此外,在遷移學習基準上的實驗驗證了它對其他下游任務的推廣,包括多標簽圖像分類、目標檢測、語義分割和小樣本圖像分類。

地址:

//arxiv.org/abs/2006.11480

付費5元查看完整內容

摘要:文本序列中各單詞的重要程度以及其之間的依賴關系對于識別文本類別有重要影響.膠囊網絡不能選擇性關注文本中重要單詞,并且由于不能編碼遠距離依賴關系,在識別具有語義轉折的文本時有很大局限性.為解決上述問題,該文提出了一種基于多頭注意力的膠囊網絡模型,該模型能編碼單詞間的依賴關系、捕獲文本中重要單詞,并對文本語義編碼,從而有效提高文本分類任務的效果.結果表明:該文模型在文本分類任務中效果明顯優于卷積神經網絡和膠囊網絡,在多標簽文本分類任務上效果更優,能更好地從注意力中獲益。

付費5元查看完整內容

圖分類的目的是對圖結構數據進行準確的信息提取和分類。在過去的幾年里,圖神經網絡(GNNs)在圖分類任務上取得了令人滿意的成績。然而,大多數基于GNNs的方法側重于設計圖卷積操作和圖池操作,忽略了收集或標記圖結構數據比基于網格的數據更困難。我們利用元學習來進行小樣本圖分類,以減少訓練新任務時標記圖樣本的不足。更具體地說,為了促進圖分類任務的學習,我們利用GNNs作為圖嵌入主干,利用元學習作為訓練范式,在圖分類任務中快速捕獲特定任務的知識并將其轉移到新的任務中。為了提高元學習器的魯棒性,我們設計了一種新的基于強化學習的步進控制器。實驗表明,與基線相比,我們的框架運行良好。

付費5元查看完整內容

作者:Jiaming Shen, Zhihong Shen, Chenyan Xiong, Chi Wang, Kuansan Wang, Jiawei Han

摘要:本體結構(Taxonomies)由機器可解釋的語義組成,并為許多Web應用程序提供有價值的知識。例如,在線零售商(亞馬遜和eBay)使用本體結構進行產品推薦,而網絡搜索引擎(Google和Bing)利用本體結構來增強查詢理解。當前我們在人工或半自動地構建本體結構方面已經做出了巨大的努力。然而,隨著網絡內容數量的快速增長,現有的本體結構無法捕捉到新興的知識。因此,在許多應用程序中,十分需要對現有本體結構進行動態擴展。在本文中,我們研究了如何通過添加一組新的概念來擴展現有的本體結構。我們提出了一種新的自監督框架TaxoExpanTM,該框架從已有的本體結構中自動生成一組 ?query concept, anchor concept ? 對作為訓練數據。使用這樣的自監督數據,TaxoExpanTM學習一個模型來預測query concept是否是 anchor concept的直接下義詞。我們在TaxoExspan中提出了兩種創新技術:(1)位置增強型圖形神經網絡,它編碼現有本體結構中anchor concept的局部結構;2)噪聲魯棒性訓練目標,使學習的模型能夠對自監控數據中的標簽噪聲不敏感。在來自不同領域的三個大規模數據集上的廣泛實驗證明了TaxoExspan在分類系統擴展方面的有效性和高效性。

付費5元查看完整內容
北京阿比特科技有限公司