摘要 自然語言處理中的評測任務引導和推動著技術、模型和方法上的研究。近年來,新的評測數據集和評測任務不斷被提出,與此同時,現有評測暴露的一系列問題也限制了自然語言處理技術的進步。該文從自然語言處理評測的概念、構成、發展和意義出發,分類綜述了主流自然語言處理評測的任務和特點,進而總結歸納了自然語言處理評測中的問題及其成因。最后,該文參照人類語言能力評測規范,提出類人機器語言能力評測的概念,并從信度、難度、效度三個方面提出了一系列類人機器語言能力評測的基本原則和實施設想,并對評測技術的未來發展進行了展望。
機器閱讀理解(MRC)是一個受數據集推動的研究領域,其目標是讓機器在理解文章內容的基礎上能夠正確回答相關問題。早期受數據集限制,機器閱讀理解任務大多局限于單輪問答,問答對之間缺少依賴關系。而會話問答(ConvQA)是使機器在幫助人類獲取信息時可以進行連續主題的人機交互過程。近年來,隨著機器閱讀理解數據集和深度神經網絡的發展,研究人員將機器閱讀理解與會話問答結合,形成更為復雜真實的會話式機器閱讀理解(CMC),這極大地推動了機器閱讀理解領域的發展。對近幾年會話式機器閱讀理解相關最新研究進展從三方面歸納總結:首先闡述該任務的定義、所面臨的挑戰以及相關數據集的特性;然后歸納總結當前最新模型的架構及其研究進展,著重介紹會話歷史嵌入表示以及會話推理所使用的相關技術方法;最后梳理分析當前會話式機器閱讀理解模型,并對未來研究重點和研究方法進行展望。
隨著人工智能技術的飛速發展,深度神經網絡在計算機視覺、信號分析和自然語言處理等領域中都得到了廣泛應用.自然語言處理通過語法分析、語義分析、篇章理解等功能幫助機器處理、理解及運用人類語言.但是,已有研究表明深度神經網絡容易受到對抗文本的攻擊,通過產生不可察覺的擾動添加到正常文本中,就能使自然語言處理模型預測錯誤.為了提高模型的魯棒安全性,近年來也出現了防御相關的研究工作.針對已有的研究,全面地介紹自然語言處理攻防領域的相關工作,具體而言,首先介紹了自然語言處理的主要任務與相關方法;其次,根據攻擊和防御機制對自然語言處理的攻擊方法和防御方法進行分類介紹;然后,進一步分析自然語言處理模型的可驗證魯棒性和評估基準數據集,并提供自然語言處理應用平臺和工具包的詳細介紹;最后總結面向自然語言處理的攻防安全領域在未來的研究發展方向.
在目前已發表的自然語言處理預訓練技術綜述中,大多數文章僅介紹神經網絡預訓練技術或者極簡單介紹傳統預訓練技術,存在人為割裂自然語言預訓練發展歷程。為此,以自然語言預訓練發展歷程為主線,從以下四方面展開工作:首先,依據預訓練技術更新路線,介紹了傳統自然語言預訓練技術與神經網絡預訓練技術,并對相關技術特點進行分析、比較,從中歸納出自然語言處理技術的發展脈絡與趨勢;其次,主要從兩方面介紹了基于BERT改進的自然語言處理模型,并對這些模型從預訓練機制、優缺點、性能等方面進行總結;再者,對自然語言處理的主要應用領域發展進行了介紹,并闡述了自然語言處理目前面臨的挑戰與相應解決辦法;最后,總結工作,預測了自然語言處理的未來發展方向。旨在幫助科研工作者更全面地了解自然語言預訓練技術發展歷程,繼而為新模型、新預訓練方法的提出提供一定思路。
近年來,深度學習技術得到了快速發展。在自然語言處理(NLP)任務中,隨著文本表征技術從詞級上升到了文檔級,利用大規模語料庫進行無監督預訓練的方式已被證明能夠有效提高模型在下游任務中的性能。首先,根據文本特征提取技術的發展,從詞級和文檔級對典型的模型進行了分析;其次,從預訓練目標任務和下游應用兩個階段,分析了當前預訓練模型的研究現狀,并對代表性的模型特點進行了梳理和歸納;最后,總結了當前預訓練模型發展所面臨的主要挑戰并提出了對未來的展望。
近幾年,神經網絡因其強大的表征能力逐漸取代傳統的機器學習成為自然語言處理任務的基本模型。然而經典的神經網絡模型只能處理歐氏空間中的數據,自然語言處理領域中,篇章結構,句法甚至句子本身都以圖數據的形式存在。因此,圖神經網絡引起學界廣泛關注,并在自然語言處理的多個領域成功應用。該文對圖神經網絡在自然語言處理領域中的應用進行了系統性的綜述, 首先介紹了圖神經網絡的核心思想并梳理了三種經典方法: 圖循環網絡,圖卷積網絡和圖注意力網絡;然后在具體任務中,詳細描述了如何根據任務特性構建合適的圖結構以及如何合理運用圖結構表示模型。該文認為,相比專注于探索圖神經網絡的不同結構,探索如何以圖的方式建模不同任務中的關鍵信息,是圖神經網絡未來工作中更具普遍性和學術價值的一個研究方向。
近年來深度學習在圖像、語音、自然語言處理等諸多領域得到廣泛應用,但隨著人們對深度學習的訓練速度和數據處理能力的需求不斷提升,傳統的基于單機的訓練過程愈發難以滿足要求,分布式的深度學習訓練方法成為持續提升算力的有效途徑.其中訓練過程中節點間網絡的通信性能至關重要,直接影響訓練性能.分析了分布式深度學習中的性能瓶頸,在此基礎上對目前常用的網絡性能優化方案進行綜述,詳細闡述了目前最新的超大規模分布式訓練的體系結構、優化方法、訓練環境和最有效的優化方法,最后對分布式訓練仍然存在的困難進行了總結,對其未來研究方向進行了展望.
深度學習模型被證明存在脆弱性并容易遭到對抗樣本的攻擊,但目前對于對抗樣本的研究主要集中在計算機視覺領域而忽略了自然語言處理模型的安全問題.針對自然語言處理領域同樣面臨對抗樣本的風險,在闡明對抗樣本相關概念的基礎上,文中首先對基于深度學習的自然語言處理模型的復雜結構、難以探知的訓練過程和樸素的基本原理等脆弱性成因進行分析,進一步闡述了文本對抗樣本的特點、分類和評價指標,并對該領域對抗技術涉及到的典型任務和數據集進行了闡述;然后按照擾動級別對主流的字、詞、句和多級擾動組合的文本對抗樣本生成技術進行了梳理,并對相關防御方法進行了歸納總結;最后對目前自然語言處理對抗樣本領域攻防雙方存在的痛點問題進行了進一步的討論和展望.
摘要 近年來,跨模態研究吸引了越來越多學者的關注,尤其是連接視覺和語言的相關課題。該文針對跨視覺和語言模態研究中的核心任務——圖像描述生成,進行文獻綜述。該文從基于視覺的文本生成框架、基于視覺的文本生成研究中的關鍵問題、圖像描述生成模型的性能評價和圖像描述生成模型的主要發展過程四個方面對相關文獻進行介紹和總結。最后,該文給出了幾個未來的重點研究方向,包括跨視覺和語言模態的特征對齊、自動化評價指標的設計以及多樣化圖像描述生成。
//cea.ceaj.org/CN/abstract/abstract39198.shtml
近年來,深度學習技術被廣泛應用于各個領域,基于深度學習的預處理模型將自然語言處理帶入一個新時代。預訓練模型的目標是如何使預訓練好的模型處于良好的初始狀態,在下游任務中達到更好的性能表現。對預訓練技術及其發展歷史進行介紹,并按照模型特點劃分為基于概率統計的傳統模型和基于深度學習的新式模型進行綜述;簡要分析傳統預訓練模型的特點及局限性,重點介紹基于深度學習的預訓練模型,并針對它們在下游任務的表現進行對比評估;梳理出具有啟發意義的新式預訓練模型,簡述這些模型的改進機制以及在下游任務中取得的性能提升;總結目前預訓練的模型所面臨的問題,并對后續發展趨勢進行展望。