基于人工智能技術的人機對話系統在人機交互、智能助手、智能客服、問答咨詢等多個領域應用日益廣泛,這極大地促進了自然語言理解及生成、對話狀態追蹤和端到端的深度學習模型構建等相關理論與技術的發展,并成為目前工業界與學術界共同關注的研究熱點之一。該文聚焦特定場景下的任務型對話系統,在對其基本概念進行形式化定義的基礎上,圍繞著以最少的對話輪次來獲得最佳用戶需求相匹配的對話內容為目標,針對目前存在的復雜業務場景下基于自然語言的用戶意圖的準確理解和識別、針對訓練數據的標注依賴及模型結果的可解釋性不足,以及多模態條件下對話內容的個性化生成這三個重大的技術問題和挑戰,對當前的技術與研究進展進行系統地對比分析和綜述,為進一步的研究工作奠定基礎。同時,對新一代的面向任務型的人機對話系統未來的關鍵研究方向與任務進行總結。
開放型對話是對話系統的一個重要分支,有著極強的應用前景。它不同于任務型對話,具有較強的隨機性和不確定性。該文從回復方式驅動對話技術發展這個角度切入,進行開放型對話技術發展過程的梳理,緊扣序列到序列及其改良模型在對話生成場景中應用的這條主要線索,對開放型對話的關鍵技術進行了探討和研究。上述研究勾畫出了從單輪對話到多輪對話發展的主要研究主線。為進一步探索對話技術發展的內在規律和發展趨勢,通過研究發現,基于序列到序列的生成模型在面向多輪對話生成的任務場景時,顯現出模型實現特點和應用場景不完全匹配的問題。因此,在該文的最后,從引入外部知識、改寫機制及代理機制三個角度切入,初步探索了相關技術針對多輪對話生成的可能改進方向。
圖神經網絡(GNN)在多個領域的復雜任務中已經得到成功的應用,但研究表明其易受到對抗攻擊而導致性能嚴重下降,這種脆弱性影響了包含節點分類、鏈路預測和社團探測在內的所有應用。圖對抗攻擊已經可以高效地實施,這帶來了嚴重的安全隱患和隱私問題,圖對抗防御致力于提高GNN的魯棒性和泛化能力以抵御對抗攻擊。綜述了圖對抗防御算法研究進展,首先,介紹了圖對抗防御的背景和相關概念,并對圖對抗防御研究發展脈絡進行梳理和分析。然后,根據防御算法的不同防御策略將算法分為四類,包括攻擊檢測、對抗訓練、可認證魯棒性以及免疫防御,對每類防御算法原理進行分析總結。在此基礎上,分析了每種防御算法的原理和實現,并從防御策略、目標任務、優缺點和實驗數據等方面對典型算法進行全面的比較。最后,通過對現有圖對抗防御算法全面、系統的分析,對防御算法當前存在的問題及未來發展方向進行了總結和探討,為圖對抗防御進一步的發展提供幫助。
知識圖譜問答是通過處理用戶提出的自然語言問題,基于知識圖譜的某種形式,從中獲取相關答案的過程。由于知識規模、計算能力及自然語言處理能力的制約,早期知識庫問答系統被應用于限定領域。近年來,隨著知識圖譜的發展,以及開放領域問答數據集的陸續提出,知識圖譜已用于開放領域問答研究與實踐。以技術發展為主線,對開放領域知識圖譜問答進行綜述。首先,介紹五種基于規則模板的開放領域知識圖譜問答方法:傳統語義解析、傳統信息檢索、三元組匹配、話語模板和查詢模板,這類方法主要依賴人工定義的規則模板完成問答工作。其次,描述五種基于深度學習的方法,這類方法采用神經網絡模型完成問答過程的各類子任務,包括知識圖譜嵌入、記憶網絡、基于神經網絡的語義解析、基于神經網絡的查詢圖、基于神經網絡的信息檢索。接著,介紹開放領域知識圖譜問答常用的4個通用領域知識圖譜和11個開放領域問答數據集。隨后,按照問題的難易程度選擇3個經典問答數據集比較各問答系統的性能指標,對比不同方法間的性能差異并進行分析。最后,展望開放領域知識圖譜問答的未來研究方向。
摘要 近年來,涌現了很多高質量大規模的知識庫,基于知識庫的問答系統(Knowledge Base Question Answering,KBQA)隨著知識庫的發展而得到了快速發展.知識庫問答系統通過對自然語言問句進行理解和解析,進而利用知識庫中的事實來回答自然語言問題,使用戶在不了解知識庫數據結構的情況下快速、精準的得到有價值的知識或答案.本文對知識庫問答系統的研究方法進行了詳細介紹并對目前的研究進展進行了總結,包括基于模板的方法、基于語義解析的方法和基于深度學習的方法.通過對這些研究方法進行對比,指出了各方法中存在的問題和不足,進而對知識庫問答系統所面臨的問題和挑戰進行了總結.
摘要: 隨著互聯網上多媒體數據的爆炸式增長,單一模態的檢索已經無法滿足用戶需求,跨模態檢索應運而生。跨模態檢索旨在以一種模態的數據去檢索另一種模態的相關數據,其核心任務是數據特征提取和不同模態間數據的相關性度量。文中梳理了跨模態檢索領域近期的研究進展,從傳統方法、深度學習方法、手工特征的哈希編碼方法以及深度學習的哈希編碼方法等角度歸納論述了跨模態檢索領域的研究成果。在此基礎上,對比分析了各類算法在跨模態檢索常用標準數據集上的性能。最后,分析了跨模態檢索研究存在的問題,并對該領域未來發展趨勢以及應用進行了展望。
對話系統作為人機交互的重要方式,有著廣泛的應用前景。現有的對話系統專注于解決語義一致性和內容豐富性等問題,對于提高人機交互以及產生人機共鳴方向的研究關注度不高。如何讓生成的語句在具有語義相關性的基礎上更自然地與用戶交流是當前對話系統面臨的主要問題之一。首先對對話系統進行了整體情況的概括。接著介紹了情感對話系統中的對話情緒感知和情感對話生成兩大任務,并分別調研歸納了相關方法。對話情緒感知任務大致分為基于上下文和基于用戶信息兩類方法。情感對話生成的方法包括規則匹配算法、指定情感回復的生成模型和不指定情感回復的生成模型,并從情緒數據類別和模型方法等方面進行了對比分析。然后總結整理了兩大任務下數據集的特點和鏈接便于后續的研究,并歸納了當前情感對話系統中不同的評估方法。最后對情感對話系統的工作進行了總結和展望。
摘要: 當前,以網絡數據為代表的跨媒體數據呈現爆炸式增長的趨勢,呈現出了跨模態、跨數據源的復雜關聯及動態演化特性,跨媒體分析與推理技術針對多模態信息理解、交互、內容管理等需求,通過構建跨模態、跨平臺的語義貫通與統一表征機制,進一步實現分析和推理以及對復雜認知目標的不斷逼近,建立語義層級的邏輯推理機制,最終實現跨媒體類人智能推理。文中對跨媒體分析推理技術的研究背景和發展歷史進行概述,歸納總結視覺-語言關聯等任務的關鍵技術,并對研究應用進行舉例。基于已有結論,分析目前跨媒體分析領域所面臨的關鍵問題,最后探討未來的發展趨勢。
摘要: 圖像修復是計算機視覺領域中極具挑戰性的研究課題。近年來,深度學習技術的發展推動了圖像修復性能的顯著提升,使得圖像修復這一傳統課題再次引起了學者們的廣泛關注。文章致力于綜述圖像修復研究的關鍵技術。由于深度學習技術在解決“大面積缺失圖像修復”問題時具有重要作用并帶來了深遠影響,文中在簡要介紹傳統圖像修復方法的基礎上,重點介紹了基于深度學習的修復模型,主要包括模型分類、優缺點對比、適用范圍和在常用數據集上的性能對比等,最后對圖像修復潛在的研究方向和發展動態進行了分析和展望。
目前諸多模式識別任務的識別精度獲得不斷提升,在一些任務上甚至超越了人的水平。單從識別精度的角度來看,模式識別似乎已經是一個被解決了的問題。然而,高精度的模式識別系統在實際應用中依舊會出現不穩定和不可靠的現象。因此,開放環境下的魯棒性成為制約模式識別技術發展的新瓶頸。實際上,在大部分模式識別模型和算法背后蘊含著三個基礎假設:封閉世界假設、獨立同分布假設、以及大數據假設。這三個假設直接或間接影響了模式識別系統的魯棒性,并且是造成機器智能和人類智能之間差異的主要原因。本文簡要論述如何通過打破三個基礎假設來提升模式識別系統的魯棒性。