文本風格遷移是近年來自然語言處理領域的熱點問題之一,旨在保留文本內容的基礎上通過編輯或生成的方式更改文本的特定風格或屬性(如情感、時態和性別等).文章旨在梳理已有的技術,以推進該方向的研究.首先,給出文本風格遷移問題的定義及其面臨的挑戰;然后,對已有方法進行分類綜述,重點介紹基于無監督學習的文本風格遷移方法并將其進一步分為隱式和顯式兩類方法,對各類方法在實現機制、優勢、局限性和性能等方面進行分析和比較;同時,還通過實驗比較了幾種代表性方法在風格遷移準確率、文本內容保留和困惑度等自動化評價指標上的性能;最后,對文本風格遷移研究進行總結和展望.
隨著圖結構化數據挖掘的興起, 超圖作為一種特殊的圖結構化數據, 在社交網絡分析、圖像處理、生物反應解析等領域受到廣泛關注. 研究者通過解析超圖中的拓撲結構與節點屬性等信息, 能夠有效解決實際應用場景中所遇到的如興趣推薦、社群劃分等問題. 根據超圖學習算法的設計特點, 將其劃分為譜分析方法和神經網絡方法, 根據方法對超圖處理的不同手段, 可進一步劃分為展開式方法和非展開式方法. 若將展開式方法用于不可分解超圖, 則很有可能會造成信息損失. 然而, 現有的超圖相關綜述文章鮮有就超圖學習方法適用于哪類超圖這一問題做出相關歸納. 因此, 分別從超圖上的譜分析方法和神經網絡方法兩方面出發, 對展開式方法和非展開式方法展開討論, 并結合其算法特性和應用場景作進一步細分; 然后, 分析比較各類算法的設計思路, 結合實驗結果總結各類算法的優缺點; 最后, 對超圖學習未來可能的研究方向進行了展望.
人臉合成由于其應用與技術價值,是機器視覺領域的熱點之一,而近年來深度學習的突破性進展使該領域吸引了更多關注。將該領域的研究分為四個子類:人臉身份合成、人臉動作合成、人臉屬性合成與人臉生成,并系統地總結了這些子類的發展歷程、現狀,以及現有技術存在的問題。首先針對人臉身份合成,從圖形學、數字圖像處理與深度學習三個角度總結了各自的合成流程,對關鍵技術原理進行了詳細的解釋與分析。其次將人臉動作合成進一步分為利用標簽驅動的表情編輯與利用真實人臉驅動的人臉重演,并指出了各自領域中存在的缺陷與難題。然后介紹了基于生成模型,尤其是生成對抗網絡在人臉屬性合成方面的發展,最終對人臉生成的各類工作進行了簡單的闡述。此外,介紹了人臉合成技術的實際應用與當前面臨的相關問題,并展望了該領域未來可能的研究方向。
知識圖譜問答是通過處理用戶提出的自然語言問題,基于知識圖譜的某種形式,從中獲取相關答案的過程。由于知識規模、計算能力及自然語言處理能力的制約,早期知識庫問答系統被應用于限定領域。近年來,隨著知識圖譜的發展,以及開放領域問答數據集的陸續提出,知識圖譜已用于開放領域問答研究與實踐。以技術發展為主線,對開放領域知識圖譜問答進行綜述。首先,介紹五種基于規則模板的開放領域知識圖譜問答方法:傳統語義解析、傳統信息檢索、三元組匹配、話語模板和查詢模板,這類方法主要依賴人工定義的規則模板完成問答工作。其次,描述五種基于深度學習的方法,這類方法采用神經網絡模型完成問答過程的各類子任務,包括知識圖譜嵌入、記憶網絡、基于神經網絡的語義解析、基于神經網絡的查詢圖、基于神經網絡的信息檢索。接著,介紹開放領域知識圖譜問答常用的4個通用領域知識圖譜和11個開放領域問答數據集。隨后,按照問題的難易程度選擇3個經典問答數據集比較各問答系統的性能指標,對比不同方法間的性能差異并進行分析。最后,展望開放領域知識圖譜問答的未來研究方向。
對抗樣本攻擊與防御是最近幾年興起的一個研究熱點,攻擊者通過微小的修改生成對抗樣本來使深度神經網絡預測出錯。生成的對抗樣本可以揭示神經網絡的脆弱性,并可以修復這些脆弱的神經網絡以提高模型的安全性和魯棒性。對抗樣本的攻擊對象可以分為圖像和文本兩種,大部分研究方法和成果都針對圖像領域,由于文本與圖像本質上的不同,在攻擊和防御方法上存在很多差異。該文對目前主流的文本對抗樣本攻擊與防御方法做出了較為詳盡的介紹,同時說明了數據集、主流攻擊的目標神經網絡, 并比較了不同攻擊方法的區別。最后總結文本對抗樣本領域面臨的挑戰,并對未來的研究進行展望。
摘要: 近年來, 基于卷積神經網絡的目標檢測研究發展十分迅速, 各種檢測模型的改進方法層出不窮. 本文主要對近幾年內目標檢測領域中一些具有借鑒價值的研究工作進行了整理歸納. 首先, 對基于卷積神經網絡的主要目標檢測框架進行了梳理和對比. 其次, 對目標檢測框架中主干網絡、頸部連接層、錨點等子模塊的設計優化方法進行歸納, 給出了各個模塊設計優化的基本原則和思路. 接著, 在COCO數據集上對各類目標檢測模型進行測試對比, 并根據測試結果分析總結了不同子模塊對模型檢測性能的影響. 最后, 對目標檢測領域未來的研究方向進行了展望.
問題生成是指機器主動對一段文本進行提問,生成一個自然語言的問題.神經問題生成則是完全采用端到端的訓練方式,使用神經網絡完成文檔和答案到問題的轉換,是自然語言處理中一個新興而又重要的研究方向.文中首先對神經問題生 成進行了簡單介紹,包括基本概念、主流框架和評價方法. 接著介紹了該研究方向的關鍵問題,包括輸入建模、長文本處理、多任務學習、機器學習方法的應用、其他研究問題和改進點.最后,介紹了問題生成和問答系統的關系,以及問題生成的未來研究方向。
//www.jsjkx.com/CN/10.11896/jsjkx.201100013
對話系統作為人機交互的重要方式,有著廣泛的應用前景。現有的對話系統專注于解決語義一致性和內容豐富性等問題,對于提高人機交互以及產生人機共鳴方向的研究關注度不高。如何讓生成的語句在具有語義相關性的基礎上更自然地與用戶交流是當前對話系統面臨的主要問題之一。首先對對話系統進行了整體情況的概括。接著介紹了情感對話系統中的對話情緒感知和情感對話生成兩大任務,并分別調研歸納了相關方法。對話情緒感知任務大致分為基于上下文和基于用戶信息兩類方法。情感對話生成的方法包括規則匹配算法、指定情感回復的生成模型和不指定情感回復的生成模型,并從情緒數據類別和模型方法等方面進行了對比分析。然后總結整理了兩大任務下數據集的特點和鏈接便于后續的研究,并歸納了當前情感對話系統中不同的評估方法。最后對情感對話系統的工作進行了總結和展望。
面對人工標注大量樣本費時費力,一些稀有類別樣本難于獲取等問題,零樣本圖像分類成為計算機視覺領域的一個研究熱點。首先,對零樣本學習,包括直推式零樣本學習和歸納式零樣本學習進行了簡單介紹;其次,重點介紹了基于空間嵌入零樣本圖像分類方法和基于生成模型零樣本圖像分類方法以及它們的子類方法,并對這些方法的機制、優缺點和適用場景等進行了分析和總結;然后,簡單介紹了零樣本圖像分類常用數據集和評估方法,并對典型零樣本圖像分類方法進行了性能比較;接著,指出了現有零樣本圖像分類中存在的領域漂移、樞紐點和語義鴻溝等問題及相應的解決思路;最后,對零樣本圖像分類未來發展趨勢和研究熱點,如判別性區域的準確定位、生成高質量不可見類視覺特征、廣義零樣本圖像分類等進行了探討。
行人再識別的主要任務是利用計算機視覺對特定行人進行跨視域匹配和檢索。相比于傳統算法,由數據驅 動的深度學習方法所提取的特征更能表征行人之間的區分性。對行人再識別的背景及研究歷史、主要面臨的挑 戰、主要方法、數據集及評價指標進行了梳理和總結。主要從特征表達、局部特征、生成對抗網絡三個方面對行人 再識別的算法進行分析,列舉了行人再識別9個常用數據集、3個評價標準和14種典型方法在 Market1501數據集 上取得的準確率,最后對行人再識別的未來研究方向進行展望。
摘要: 在自然語言處理領域,信息抽取一直以來受到人們的關注.信息抽取主要包括3項子任務:實體抽取、關系抽取和事件抽取,而關系抽取是信息抽取領域的核心任務和重要環節.實體關系抽取的主要目標是從自然語言文本中識別并判定實體對之間存在的特定關系,這為智能檢索、語義分析等提供了基礎支持,有助于提高搜索效率,促進知識庫的自動構建.綜合闡述了實體關系抽取的發展歷史,介紹了常用的中文和英文關系抽取工具和評價體系.主要從4個方面展開介紹了實體關系抽取方法,包括:早期的傳統關系抽取方法、基于傳統機器學習、基于深度學習和基于開放領域的關系抽取方法,總結了在不同歷史階段的主流研究方法以及相應的代表性成果,并對各種實體關系抽取技術進行對比分析.最后,對實體關系抽取的未來重點研究內容和發展趨勢進行了總結和展望.
//crad.ict.ac.cn/CN/10.7544/issn1000-1239.2020.20190358#1