摘要: 圖像異常檢測是計算機視覺領域的一個熱門研究課題, 其目標是在不使用真實異常樣本的情況下, 利用現有的正常樣本構建模型以檢測可能出現的各種異常圖像, 在工業外觀缺陷檢測, 醫學圖像分析, 高光譜圖像處理等領域有較高的研究意義和應用價值. 本文首先介紹了異常的定義以及常見的異常類型. 然后, 本文根據在模型構建過程中有無神經網絡的參與, 將圖像異常檢測方法分為基于傳統方法和基于深度學習兩大類型, 并分別對相應的檢測方法的設計思路、優點和局限性進行了綜述與分析. 其次, 梳理了圖像異常檢測任務中面臨的主要挑戰. 最后, 對該領域未來可能的研究方向進行了展望.
對話系統作為人機交互的重要方式,有著廣泛的應用前景。現有的對話系統專注于解決語義一致性和內容豐富性等問題,對于提高人機交互以及產生人機共鳴方向的研究關注度不高。如何讓生成的語句在具有語義相關性的基礎上更自然地與用戶交流是當前對話系統面臨的主要問題之一。首先對對話系統進行了整體情況的概括。接著介紹了情感對話系統中的對話情緒感知和情感對話生成兩大任務,并分別調研歸納了相關方法。對話情緒感知任務大致分為基于上下文和基于用戶信息兩類方法。情感對話生成的方法包括規則匹配算法、指定情感回復的生成模型和不指定情感回復的生成模型,并從情緒數據類別和模型方法等方面進行了對比分析。然后總結整理了兩大任務下數據集的特點和鏈接便于后續的研究,并歸納了當前情感對話系統中不同的評估方法。最后對情感對話系統的工作進行了總結和展望。
摘要: 人臉親子關系驗證即通過給定的不同人的兩幅人臉圖像判斷其是否具有親子關系, 是計算機視覺和機器學習領域中一個重要的研究問題, 在丟失兒童尋找、社會媒體分析、圖像自動標注等領域具有廣泛的應用價值. 隨著人臉親子關系驗證問題受到越來越多的關注, 其在多個方面都得到了相應的發展, 本文對人臉親子關系驗證方法做了綜述整理. 首先, 簡要介紹了人臉親子關系驗證在近十年的研究現狀, 隨后對問題進行了定義并討論其面臨的挑戰. 接下來, 匯總了常用的親子數據庫, 對數據庫屬性做了詳細的總結和對比. 然后, 對人臉親子關系驗證方法進行了分類總結、對比, 以及不同方法的性能表現. 最后, 展望了人臉親子關系驗證今后可能的研究方向.
為滿足智能制造企業對產品質量檢測的需求, 服務制造企業生產管理, 對缺陷檢測技術的研究現狀、典型方法和應用 進行梳理. 首先總結了磁粉檢測法、滲透檢測法、渦流檢測法、超聲波檢測法、機器視覺和基于深度學習的缺陷檢測技術的 優缺點; 對比分析了磁粉檢測法、滲透檢測法、渦流檢測法、超聲波檢測法、機器視覺檢測的主流缺陷檢測技術和基于深度 學習的缺陷檢測技術的研究現狀; 然后, 梳理了缺陷檢測技術在電子元器件、管道、焊接件、機械零件和質量控制中的典型應 用; 最后, 對缺陷檢測技術的研究情況進行了總結和展望, 指出該研究領域亟需解決的問題和未來發展的方向, 并從高精度、 高定位、快速檢測、小目標、復雜背景、被遮擋物體檢測、物體關聯關系等幾個方面總結近年來發表在 ICCV (International Conference on Computer Vision) 和 CVPR (International Conference on Computer Vision and Pattern Recognition) 等 知名國際會議上相關論文的核心思想和源代碼, 為缺陷檢測技術的進一步發展提供理論和應用上的借鑒與參考。
//www.aas.net.cn/fileZDHXB/journal/article/zdhxb/2020/11/PDF/zdhxb-46-11-2319.pdf
摘要: 當前,以網絡數據為代表的跨媒體數據呈現爆炸式增長的趨勢,呈現出了跨模態、跨數據源的復雜關聯及動態演化特性,跨媒體分析與推理技術針對多模態信息理解、交互、內容管理等需求,通過構建跨模態、跨平臺的語義貫通與統一表征機制,進一步實現分析和推理以及對復雜認知目標的不斷逼近,建立語義層級的邏輯推理機制,最終實現跨媒體類人智能推理。文中對跨媒體分析推理技術的研究背景和發展歷史進行概述,歸納總結視覺-語言關聯等任務的關鍵技術,并對研究應用進行舉例。基于已有結論,分析目前跨媒體分析領域所面臨的關鍵問題,最后探討未來的發展趨勢。
摘要: 圖像修復是計算機視覺領域中極具挑戰性的研究課題。近年來,深度學習技術的發展推動了圖像修復性能的顯著提升,使得圖像修復這一傳統課題再次引起了學者們的廣泛關注。文章致力于綜述圖像修復研究的關鍵技術。由于深度學習技術在解決“大面積缺失圖像修復”問題時具有重要作用并帶來了深遠影響,文中在簡要介紹傳統圖像修復方法的基礎上,重點介紹了基于深度學習的修復模型,主要包括模型分類、優缺點對比、適用范圍和在常用數據集上的性能對比等,最后對圖像修復潛在的研究方向和發展動態進行了分析和展望。
隨著信息技術的快速發展,網絡攻擊逐漸呈現多階段、分布式和智能化的特性,單一的防火墻、入侵檢測系統等傳統網絡防御措施不能很好地保護開放環境下的網絡系統安全。網絡攻擊模型作為一種攻擊者視角的攻擊場景表示,能夠綜合描述復雜多變環境下的網絡攻擊行為,是常用的網絡攻擊分析與應對工具之一。本文首先介紹主要網絡攻擊模型,包括傳統樹、圖、網結構模型和現代殺傷鏈、ATT&CK、鉆石模型等;然后再對網絡攻擊模型的分析與應用進行說明,其中以求解攻擊指標為目的的分析過程主要包括概率框架、賦值方法和求解方法,基于生命周期的攻擊模型應用則包括了攻擊者視角和防守者視角的應用過程;最后總結了網絡攻擊模型及其分析應用的現有挑戰與未來方向。
摘要:小目標檢測是針對圖像中像素占比少的目標,借助計算機視覺在圖像中找到并判斷該目標所屬類別的目標檢測技術。與目前應用較為成熟的大尺度、中尺度目標檢測不同,小目標自身存在著語義信息少、覆蓋面積小等先天不足,導致小目標的檢測效果并不理想,因此如何提高小目標的檢測效果依然是計算機視覺領域的一大難題。對近年來國內外小目標檢測領域研究成果進行了梳理,以小目標檢測技術為核心,首先對關于小目標的定義、檢測難點進行分析;隨后將能有效提高小目標檢測精度的方法進行分類匯總,并介紹了各種方法的應用與優缺點;最后對未來小目標檢測領域發展趨勢進行了預測與展望。
我們生活在一個由大量不同模態內容構建而成的多媒體世界中,不同模態信息之間具有高度的相關性和互補性,多模態表征學習的主要目的就是挖掘出不同模態之間的共性和特性,產生出可以表示多模態信息的隱含向量.該文章主要介紹了目前應用較廣的視覺語言表征的相應研究工作,包括傳統的基于相似性模型的研究方法和目前主流的基于語言模型的預訓練的方法.目前比較好的思路和解決方案是將視覺特征語義化然后與文本特征通過一個強大的特征抽取器產生出表征,其中Transformer[1]作為主要的特征抽取器被應用表征學習的各類任務中.文章分別從研究背景、不同研究方法的劃分、測評方法、未來發展趨勢等幾個不同角度進行闡述.
//www.jos.org.cn/jos/ch/reader/view_abstract.aspx?file_no=6125&flag=1
意識問題是尚未解決的重大哲學問題與科學問題. 機器意識是人工智能最前沿的研究領域之一. 研發意識機器人對于人工智能與機器人學的發展具有重要科學意義與應用價值. 本文首先介紹了意識與感受性的相關概念和理論, 然后詳細討論了機器意識的概念與研究分類、實現方法與計算模型, 重點論述了實現機器意識的量子方法, 最后總結了機器意識目前面臨的困境與未來可能的發展, 并給出了一套機器意識總體實現框架.
行人再識別的主要任務是利用計算機視覺對特定行人進行跨視域匹配和檢索。相比于傳統算法,由數據驅 動的深度學習方法所提取的特征更能表征行人之間的區分性。對行人再識別的背景及研究歷史、主要面臨的挑 戰、主要方法、數據集及評價指標進行了梳理和總結。主要從特征表達、局部特征、生成對抗網絡三個方面對行人 再識別的算法進行分析,列舉了行人再識別9個常用數據集、3個評價標準和14種典型方法在 Market1501數據集 上取得的準確率,最后對行人再識別的未來研究方向進行展望。