近年來, 隨著深度學習技術的廣泛應用, 人機對話研究取得了突破性進展. 但是, 目前的人機對話系統大多是在人機雙方參與的假設下進行設計的, 而更具挑戰性的人機多方對話的研究和應用尚不成熟. 本文將立足于自然語言處理領域, 對近幾年基于深度學習的多方對話研究進展進行綜述. 首先從人機對話角度出發, 整理多方對話系統的關鍵問題和已有解決方案; 然后, 梳理基于多方對話的其他自然語言處理任務; 之后, 總結已有多方對話研究的數據集, 并分析現有數據集的局限性和改進方案; 最后, 展望多方對話研究的未來發展趨勢.
摘要 預訓練技術當前在自然語言處理領域占有舉足輕重的位置。尤其近兩年提出的ELMo、GTP、BERT、XLNet、T5、GTP-3等預訓練模型的成功,進一步將預訓練技術推向了研究高潮。該文從語言模型、特征抽取器、上下文表征、詞表征四個方面對現存的主要預訓練技術進行了分析和分類,并分析了當前自然語言處理中的預訓練技術面臨的主要問題和發展趨勢。
摘要: 圖像異常檢測是計算機視覺領域的一個熱門研究課題, 其目標是在不使用真實異常樣本的情況下, 利用現有的正常樣本構建模型以檢測可能出現的各種異常圖像, 在工業外觀缺陷檢測, 醫學圖像分析, 高光譜圖像處理等領域有較高的研究意義和應用價值. 本文首先介紹了異常的定義以及常見的異常類型. 然后, 本文根據在模型構建過程中有無神經網絡的參與, 將圖像異常檢測方法分為基于傳統方法和基于深度學習兩大類型, 并分別對相應的檢測方法的設計思路、優點和局限性進行了綜述與分析. 其次, 梳理了圖像異常檢測任務中面臨的主要挑戰. 最后, 對該領域未來可能的研究方向進行了展望.
對話系統作為人機交互的重要方式,有著廣泛的應用前景。現有的對話系統專注于解決語義一致性和內容豐富性等問題,對于提高人機交互以及產生人機共鳴方向的研究關注度不高。如何讓生成的語句在具有語義相關性的基礎上更自然地與用戶交流是當前對話系統面臨的主要問題之一。首先對對話系統進行了整體情況的概括。接著介紹了情感對話系統中的對話情緒感知和情感對話生成兩大任務,并分別調研歸納了相關方法。對話情緒感知任務大致分為基于上下文和基于用戶信息兩類方法。情感對話生成的方法包括規則匹配算法、指定情感回復的生成模型和不指定情感回復的生成模型,并從情緒數據類別和模型方法等方面進行了對比分析。然后總結整理了兩大任務下數據集的特點和鏈接便于后續的研究,并歸納了當前情感對話系統中不同的評估方法。最后對情感對話系統的工作進行了總結和展望。
摘要
對話系統是一個流行的自然語言處理(NLP)任務,因為它在現實生活中應用前景廣闊。這也是一個復雜的任務,因為涉及到許多需要研究的自然語言處理任務。因此,關于深度學習的對話系統研究的大量工作開展了。在這個綜述中,我們主要關注基于深度學習的對話系統。我們全面回顧了對話系統的研究成果,并從模型類型和系統類型兩個角度對其進行了分析。具體地,從模型類型的角度,討論了對話系統中廣泛應用的各種模型的原理、特點和應用。這將幫助研究人員了解這些模型,并了解它們如何應用于最先進的框架中,這在設計一個新的對話系統時非常有幫助。從系統類型的角度,討論了任務導向對話系統和開放領域對話系統這兩個研究方向,并對相關的熱點問題進行了深入的探討。此外,我們還對對話系統的評價方法和數據集進行了全面的綜述,為未來的研究鋪平了道路。最后,根據最近的研究成果,確定了一些可能的研究趨勢。據我們所知,這個綜述是目前對話系統和對話相關任務領域中最全面和最新的,廣泛覆蓋了流行的框架、主題和數據集。
//www.zhuanzhi.ai/paper/a34ced4ac06f1af10dea73064600db50
引言
對話系統(或聊天機器人)正在世界上發揮更大的作用。人們可能仍然有一種刻板印象,即聊天機器人是那些給銀行打電話時死板的代理。然而,由于人工智能的復興,現代聊天機器人可以談論豐富的話題,從你的生日派對到拜登的演講,如果你愿意,它們甚至可以為你預訂聚會地點或播放演講視頻。對話系統是目前自然語言處理領域的熱點之一,在工業和日常生活中都有很高的要求。聊天機器人的市場規模預計將從2021年的26億美元增長到2024年的94億美元,復合年增長率(CAGR)為29.7%。預計到2021年底,80%的企業將配備聊天機器人自動化。
對話系統可以與人聊天,也可以作為對話的助手。根據其應用,對話系統通常分為兩類:面向任務的對話系統和開放域對話系統。面向任務的對話系統解決了特定領域的特定問題,如電影票預訂、餐廳餐桌預訂等。傳統的任務導向對話系統采用流水線結構,由四個功能模塊組成: 自然語言理解、對話狀態跟蹤、策略學習和自然語言生成,這將在第三節詳細討論。許多最先進的作品設計端到端面向任務的對話系統,以實現比流水線方法更好的優化。開放域對話系統的目標是在沒有任務和域限制的情況下與用戶聊天,而不是專注于任務完成(Ritter et al., 2011),這通常是完全數據驅動的。開放域對話系統一般分為三類: 生成式系統、基于檢索的系統和集成系統。生成系統運用序列到序列模型將用戶消息和對話歷史映射到一個可能不會出現在訓練語料庫中的響應序列。相比之下,基于檢索的系統嘗試從某個回復應集中選擇已存在的回復。集成系統通過兩種方式將生成法和基于檢索的方法相結合: 將檢索到的響應與生成的響應進行比較,從中選擇最優的回復; 生成模型還可以用于提煉檢索到的回復(Zhu et al., 2018; Song et al., 2016; Qiu et al., 2017; Serban et al., 2017b)。生成系統可以產生靈活的、對話的、與上下文相關的回復,但有時它們缺乏連貫性,傾向于做出枯燥的回應。基于檢索的系統從人的回復集中選擇回復,從而能夠獲得更好的表層語言的連貫性。然而,檢索系統受限于響應集的有限性,有時檢索到的回復與對話上下文的相關性較弱(Zhu et al., 2018)。
對于對話系統,現有的綜述論文(Arora et al., 2013; Wang and Yuan, 2016; Mallios and Bourbakis, 2016; Chen et al., 2017a; Gao et al., 2018)要么過時,要么不全面。這些論文中的一些定義目前已經不再使用,很多新的著作和話題沒有涉及到。此外,它們大多缺乏多角度的分析。因此,在本綜述中,我們全面回顧了近年來基于深度學習方法的高質量研究,并從模型角度和系統角度提供了對最新研究的見解。此外,本綜述根據最新的研究成果更新了定義,并廣泛覆蓋了對話系統中的各種熱點問題。
傳統的對話系統大多是基于有限狀態(Arora et al., 2013)、基于統計學習和基于機器學習的系統。基于有限狀態的系統易于實現,并且能夠自然地響應,這使得它們在早期的行業產品中很受歡迎。但是,這些系統的對話流是預先確定的,這使對話系統的應用程序保持在特定的場景中。基于統計學習和基于機器學習的系統通常執行模板填充來管理某些任務。與基于有限狀態的系統相比,這些系統更加靈活,因為對話流不是預先確定的。但是,由于模板固定,在模板填寫方面F1分數不高,在應用場景和響應多樣性方面也受到限制。大多數最先進的對話系統都是基于深度學習的系統。深度學習的快速增長提高了對話系統的性能(Chen et al., 2017a)。深度學習可以被看作是多層神經網絡的表示學習。深度學習體系結構廣泛應用于對話系統及其子任務。第2節討論了各種流行的深度學習架構。
從對話系統出發,NLP也有很多與對話相關的任務,包括但不限于問答、閱讀理解、對話解纏、視覺對話、視覺問答、對話推理、對話語義解析、對話關系提取、對話情感分析、仇恨言語檢測,MISC檢測等。在這個調查中,我們還談到了一些處理這些對話相關任務的工作,因為對話系統的設計可以從這些相關領域的進展中受益。
我們為這篇長文章制作了一個圖,以幫助讀者熟悉整體結構(圖1)。在這個綜述中,第一部分簡要介紹了對話系統和深度學習;第二節討論了現代對話系統中流行的神經模型及其相關工作;第三部分介紹了任務導向對話系統的原理和相關工作,并討論了當前的研究挑戰和熱點問題;第4節簡要介紹了這三種系統,并重點介紹了開放域對話系統的研究熱點;第5節回顧了對話系統的主要評價方法;第6節全面總結了對話系統常用的數據集;最后,第七部分對全文進行了總結,并提出了一些研究趨勢。
文本情感分析是自然語言處理領域的一個重要分支,廣泛應用于輿情分析和內容推薦等方面,是近 年來的研究熱點。根據使用的不同方法,將其劃分為基于情感詞典的情感分析方法、基于傳統機器學習的情 感分析方法、基于深度學習的情感分析方法。通過對這三種方法進行對比,分析其研究成果,并對不同方法 的優缺點進行歸納總結,介紹相關數據集和評價指標,及應用場景,對情感分析子任務進行簡單概括,發現 將來的情感分析問題的研究趨勢及應用領域,并為研究者在相關領域方面提供一定的幫助和指導。
信息論的經典結果表明,信源信道分離編碼是漸進最優的。但現代通信系統對時延、帶寬等愈發敏 感,分離設計對解碼具有無限計算能力這一假設難以成立。帶寬有限時,相對于信源信道聯合編碼,分離編 碼已被證明是次優的。傳統的聯合信源信道編碼需要復雜的編碼方案,相較之下,數據驅動的深度學習技術 則帶來了新的設計思路。適時地對相關研究成果進行總結,有助于進一步明確深度學習方法解決信源信道聯 合編碼問題的方式,為研究新的研究方向提供依據。首先介紹了基于深度學習的信源壓縮方案和端對端收發 信機模型,隨后分析不同信源類型下的兩種聯合編碼設計思路,最后探討了基于深度學習的信源信道聯合編 碼的潛在問題和未來的工作方向。
【摘要】 人機對話技術作為人工智能領域的重要研究內容,它是人與機器的一種新型交互方式,受到學術界和工業界的廣泛關注。近些年來,得益于深度學習技術在自然語言領域的突破性進展,極大地促進了人機對話技術的發展。將深度學習融入人機對話系統技術中,不但使得端到端的方法成為可能,而且提取出的特征向量非常有效幾乎完全取代了人工特征。本文首先回顧了人機對話系統的發展歷程,介紹了人機對話系統的兩種類型,任務型對話系統和非任務型對話系統。其次,本文從理論模型、研究進展、可用性及存在的問題與挑戰等角度深度剖析了任務型對話系統的兩種方法,管道方法和端到端方法。重點分析深度學習技術和強化學習技術的具有代表性的前沿算法,并與傳統方法進行對比。最后,對任務型人機對話系統目前的評估方法和存在的問題進行總結,并展望了任務型對話系統的未來研究方向。
//tow.cnki.net/kcms/detail/detail.aspx?filename=JSJX20191105000&dbcode=CRJT_CJFD&dbname=CAPJLAST&v=
題目: A Survey of Deep Learning Techniques for Neural Machine Translation
摘要: 近年來,隨著深度學習技術的發展,自然語言處理(NLP)得到了很大的發展。在機器翻譯領域,出現了一種新的方法——神經機器翻譯(NMT),引起了學術界和工業界的廣泛關注。然而,在過去的幾年里提出的大量的研究,很少有人研究這一新技術趨勢的發展過程。本文回顧了神經機器翻譯的起源和主要發展歷程,描述了神經機器翻譯的重要分支,劃分了不同的研究方向,并討論了未來該領域的一些研究趨勢。
人機對話系統能夠讓機器通過人類語言與人進行交互,是人工智能領域的一項重要工作。因其在虛擬助手和社交聊天機器人等領域的商業價值而廣受工業界和學術界的關注。近年來,互聯網社交數據快速增長促進了數據驅動的開放領域對話系統研究,尤其是將深度學習技術應用到其中取得了突破性進展。基于深度學習的開放領域對話系統使用海量社交對話數據,通過檢索或者生成的方法建立對話模型學習對話模式。將深度學習融入檢索式系統中研究提高對話匹配模型的效果,將深度學習融入生成式系統中構建更高質量的生成模型,成為了基于深度學習的開放領域對話系統的主要任務。本文對近幾年基于深度學習的開放領域對話系統研究進展進行綜述,梳理、比較和分析主要方法,整理其中的關鍵問題和已有解決方案,總結評測指標,展望未來研究趨勢。