主題: A Unified Dual-view Model for Review Summarization and Sentiment Classification with Inconsistency Loss
摘要: 從用戶的評論中獲取準確的摘要和情感是現代電子商務平臺的重要組成部分。評論摘要旨在生成簡潔的摘要,描述評論的主要觀點和觀點,而情感分類旨在預測觀點標簽表示評論的情感態度。為了在評論摘要和情感分類任務中有效利用共享情感信息,我們提出了一種新穎的雙視圖模型,可以共同提高這兩個任務的性能。在我們的模型中,編碼器首先學習評論的上下文表示,然后摘要解碼器逐詞生成評論摘要。然后,源視圖情感分類器使用編碼的上下文表示來預測評論的情感標簽,而摘要視圖情感分類器則使用解碼器的隱藏狀態為生成的摘要預測情感標簽。在訓練過程中,我們引入了不一致的損失來懲罰這兩個分類器之間的分歧。它可以幫助解碼器生成摘要,從而與評論產生一致的情感趨勢,還可以幫助兩個情感分類器相互學習。來自不同領域的四個真實世界數據集的實驗結果證明了我們模型的有效性。
最近發布的GPT-3讓我對NLP中的零學習和小樣本的狀態產生了興趣。雖然大多數的零樣本學習研究集中在計算機視覺,也有一些有趣的工作在NLP領域。
我將會寫一系列的博文來涵蓋現有的關于NLP零樣本學習的研究。在這第一篇文章中,我將解釋Pushp等人的論文“一次訓練,到處測試:文本分類的零樣本學習”。本文從2017年12月開始,首次提出了文本分類的零樣本學習范式。
什么是零樣本學習?
零樣本學習是檢測模型在訓練中從未見過的類的能力。它類似于我們人類在沒有明確監督的情況下歸納和識別新事物的能力。
例如,我們想要做情感分類和新聞分類。通常,我們將為每個數據集訓練/微調一個新模型。相比之下,零樣本學習,你可以直接執行任務,如情緒和新聞分類,沒有任何特定的任務訓練。
一次訓練,隨處測試
本文提出了一種簡單的零樣本分類方法。他們沒有將文本分類為X類,而是將任務重新組織為二元分類,以確定文本和類是否相關。
題目
Keywords extraction with deep neural network model
關鍵詞
關鍵詞提取,自然語言處理,深度神經語言模型,人工智能
簡介
關鍵字可以表達文章或句子的主要內容。關鍵字提取是許多自然語言處理(NLP)應用程序中的關鍵問題,它可以提高許多NLP系統的性能。關鍵字提取的傳統方法基于機器學習或圖模型。這些方法的性能受功能選擇和手動定義的規則影響。近年來,隨著深度學習技術的出現,具有深度學習算法的自動學習功能可以提高許多任務的性能。在本文中,我們提出了一種用于關鍵字提取任務的深度神經網絡模型。我們在傳統LSTM模型的基礎上進行了兩個擴展。首先,為了更好地利用給定目標詞的歷史和后續上下文信息,我們提出了基于目標中心的LSTM模型(TC-LSTM),該模型通過考慮目標詞的上下文信息來學習對目標詞進行編碼。其次,在TC-LSTM模型的基礎上,我們應用了自我關注機制,這使我們的模型能夠專注于相關文本的信息部分。另外,我們還介紹了一種利用大規模偽訓練數據的兩階段訓練方法。實驗結果表明了我們方法的優勢,我們的模型擊敗了所有基準系統。而且,兩階段訓練方法對于提高模型的有效性也具有重要意義。
作者
Yu Zhang, Mingxiang Tuo, Qingyu Yin, Le Qi, Xuxiang Wang, Ting Liu
題目: Neural Abstractive Summarization with Structural Attention
簡介: 基于RNN的注意力編碼器-解碼器體系結構在新聞文章的抽象摘要方面實現了令人印象深刻的性能。但是,這些方法無法解決文檔句子中的長期依賴性。在多文檔摘要任務中,例如在諸如Yahoo等社區問題解答(CQA)網站中出現的主題中總結流行觀點時,此問題會更加嚴重。這些線索包含的答案通常相互重疊或矛盾。在這項工作中,我們提出了一種基于結構注意力的分層編碼器,以對諸如句子間和文檔間的依存關系進行建模。我們將流行的指針生成器體系結構和從中衍生的某些體系結構設置為基線,并表明它們無法在多文檔設置中生成良好的摘要。我們進一步說明,我們提出的模型在單文檔和多文檔摘要設置中均比基線有了顯著改進–在以前的設置中,它在CNN和CQA數據集上分別比最佳基線低1.31和7.8 ROUGE-1點;在后一種設置中,CQA數據集的性能進一步提高了1.6 ROUGE-1點
題目: Probabilistic Regression for Visual Tracking
簡介:
從根本上說,視覺跟蹤是在每個視頻幀中使目標狀態回歸的問題。盡管取得了重大進展,但跟蹤器仍然容易出現故障和不準確的情況。因此,至關重要的是在目標估算中表示不確定性。盡管當前的主要范式依賴于估計與狀態有關的置信度得分,但是該值缺乏明確的概率解釋,使它的使用變得復雜。因此,在這項工作中,我們提出了概率回歸公式,并將其應用于跟蹤。我們的網絡預測給定輸入圖像后焦油狀態的條件概率密度。至關重要的是,我們的配方能夠對由于任務中不正確的注釋和歧義而產生的標簽噪聲進行建模。通過最小化Kullback Leibler差異來訓練回歸網絡。當應用于跟蹤時,我們的公式不僅允許輸出的概率表示,而且還可以顯著提高性能。我們的跟蹤器在六個數據集上設置了最新的技術,在LaSOT上實現了59.8%的AUC,在Tracking Net上實現了75.8%的成功。可以在//github.com/visionml/pytracking獲得代碼和模型。
題目: Bayesian Neural Networks With Maximum Mean Discrepancy Regularization
摘要: 貝葉斯神經網絡(BNNs)訓練來優化整個分布的權重,而不是一個單一的集合,在可解釋性、多任務學習和校準等方面具有顯著的優勢。由于所得到的優化問題的難解性,大多數BNNs要么通過蒙特卡羅方法采樣,要么通過在變分近似上最小化一個合適的樣本下界(ELBO)來訓練。在這篇論文中,我們提出了后者的一個變體,其中我們用最大平均偏差(MMD)估計器代替了ELBO項中的Kullback-Leibler散度,這是受到了最近的變分推理工作的啟發。在根據MMD術語的性質提出我們的建議之后,我們接著展示了公式相對于最先進的公式的一些經驗優勢。特別地,我們的BNNs在多個基準上實現了更高的準確性,包括多個圖像分類任務。此外,它們對權重上的先驗選擇更有魯棒性,而且它們的校準效果更好。作為第二項貢獻,我們提供了一個新的公式來估計給定預測的不確定性,表明與更經典的標準(如微分熵)相比,它在對抗攻擊和輸入噪聲的情況下表現得更穩定。
主題: Concept to Code: Aspect Sentiment Classification with Deep Learning
摘要: 在情感分析中,方面情感分類(ASC)比文檔或句子級別的任務更細粒度。神經網絡緩解了特征工程,特別是注意機制解決了有針對性的上下文檢測問題。LSTM和記憶網絡是近年來研究ASC的兩種模型。在過去5年中,NLP社區進行了大量充滿活力的研究。我們不僅回顧了來自多個研究小組的論文中的相關概念,而且還展示了說明這些技術的代碼片段,并可在Flipkart等在線市場的用例中適時加以利用,因為產品評論會影響用戶的購買。
邀請嘉賓: Mohit Gupta,印度 Gurgaon, Haryana的首席程序員。等
In sentiment analysis (SA) of product reviews, both user and product information are proven to be useful. Current tasks handle user profile and product information in a unified model which may not be able to learn salient features of users and products effectively. In this work, we propose a dual user and product memory network (DUPMN) model to learn user profiles and product reviews using separate memory networks. Then, the two representations are used jointly for sentiment prediction. The use of separate models aims to capture user profiles and product information more effectively. Compared to state-of-the-art unified prediction models, the evaluations on three benchmark datasets, IMDB, Yelp13, and Yelp14, show that our dual learning model gives performance gain of 0.6%, 1.2%, and 0.9%, respectively. The improvements are also deemed very significant measured by p-values.
Most existing video summarisation methods are based on either supervised or unsupervised learning. In this paper, we propose a reinforcement learning-based weakly supervised method that exploits easy-to-obtain, video-level category labels and encourages summaries to contain category-related information and maintain category recognisability. Specifically, We formulate video summarisation as a sequential decision-making process and train a summarisation network with deep Q-learning (DQSN). A companion classification network is also trained to provide rewards for training the DQSN. With the classification network, we develop a global recognisability reward based on the classification result. Critically, a novel dense ranking-based reward is also proposed in order to cope with the temporally delayed and sparse reward problems for long sequence reinforcement learning. Extensive experiments on two benchmark datasets show that the proposed approach achieves state-of-the-art performance.