深度學習被廣泛應用于自然語言處理、計算機視覺和無人駕駛等領域,引領了新一輪的人工智能浪潮。然而,深度學習也被用于構建對國家安全、社會穩定和個人隱私等造成潛在威脅的技術,如近期在世界范圍內引起廣泛關注的深度偽造技術能夠生成逼真的虛假圖像及音視頻內容。本文介紹了深度偽造的背景及深度偽造內容生成原理,概述和分析了針對不同類型偽造內容(圖像、視頻、音頻等)的檢測方法和數據集,最后展望了深度偽造檢測和防御未來的研究方向和面臨的挑戰。
隨著web技術的發展,多模態或多視圖數據已經成為大數據的主要流,每個模態/視圖編碼數據對象的單個屬性。不同的模態往往是相輔相成的。這就引起了人們對融合多模態特征空間來綜合表征數據對象的研究。大多數現有的先進技術集中于如何融合來自多模態空間的能量或信息,以提供比單一模態的同行更優越的性能。最近,深度神經網絡展示了一種強大的架構,可以很好地捕捉高維多媒體數據的非線性分布,對多模態數據自然也是如此。大量的實證研究證明了深多模態方法的優勢,從本質上深化了多模態深特征空間的融合。在這篇文章中,我們提供了從淺到深空間的多模態數據分析領域的現有狀態的實質性概述。在整個調查過程中,我們進一步指出,該領域的關鍵要素是多模式空間的協作、對抗性競爭和融合。最后,我們就這一領域未來的一些方向分享我們的觀點。
摘要: 三維重建在視覺方面具有很高的研究價值, 在機器人視覺導航、智能車環境感知系統以及虛擬現實中被廣泛應用.本文對近年來國內外基于視覺的三維重建方法的研究工作進行了總結和分析, 主要介紹了基于主動視覺下的激光掃描法、結構光法、陰影法以及TOF (Time of flight)技術、雷達技術、Kinect技術和被動視覺下的單目視覺、雙目視覺、多目視覺以及其他被動視覺法的三維重建技術, 并比較和分析這些方法的優點和不足.最后對三維重建的未來發展作了幾點展望。
摘要: 大數據時代,數據呈現維度高、數據量大和增長快等特點。如何有效利用其中蘊含的有價值信息,以實現數據的智能化處理,已成為當前理論和應用的研究熱點。針對現實普遍存在的多義性對象,數據多標簽被提出并被廣泛應用于數據智能化組織。近年來,深度學習在數據特征提取方面呈現出高速、高精度等優異性,使基于深度學習的多標簽生成得到廣泛關注。文中分五大類別總結了最新研究成果,并進一步從數據、關系類型、應用場景、適應性及實驗性能方面對其進行對比和分析,最后探討了多標簽生成面臨的挑戰和未來的研究方向。
簡介:
如今,深度學習已被廣泛應用于圖像分類和圖像識別的問題中,取得了令人滿意的實際效果,成為許多人 工智能應用的關鍵所在.在對于模型準確率的不斷探究中,研究人員在近期提出了“對抗樣本”這一概念.通過在原有 樣本中添加微小擾動的方法,成功地大幅度降低原有分類深度模型的準確率,實現了對于深度學習的對抗目的,同時 也給深度學習的攻方提供了新的思路,對如何開展防御提出了新的要求.在介紹對抗樣本生成技術的起源和原理的 基礎上,對近年來有關對抗樣本的研究和文獻進行了總結,按照各自的算法原理將經典的生成算法分成兩大類——全像素添加擾動和部分像素添加擾動.之后,以目標定向和目標非定向、黑盒測試和白盒測試、肉眼可見和肉眼不可見的二級分類標準進行二次分類.同時,使用 MNIST 數據集對各類代表性的方法進行了實驗驗證,以探究各種方法的優缺點.最后總結了生成對抗樣本所面臨的挑戰及其可以發展的方向,并就該技術的發展前景進行了探討.
內容簡介:
本文重點對生成對抗樣本的已有研究工作進行綜述,主要選取了近年來有代表性的或取得比較顯著效果的方法進行詳細的原理介紹和優缺點分析.按照其生成方式和原理的不同,分為全像素添加擾動和部分像素添 加擾動兩類.在此基礎上,根據目標是否定向、是否黑盒和是否肉眼可見這 3 個標準進行細分,將各類方法中的 代表性算法在統一數據集(MNIST)上進行測試,驗證并分析其優缺點,終總結提出未來的發展前景. 本文第 1 節主要介紹對抗樣本的基本概念和基礎知識,包括對抗樣本本身的定義、其延伸有關的相關概念 以及基本操作流程.第 2 節則指出對抗樣本是從深度學習中衍生出來的概念,同時介紹了對抗樣本有效性的評估方法.第 3 節則介紹對抗樣本的起源,說明了對抗樣本的產生契機和原理解釋.第 4 節介紹生成對抗樣本的發展狀況,以全像素添加擾動和部分像素添加擾動兩大類進行算法說明,同時總結生成方法中常用的數據集.第 5 節是對第 4 節中代表方法的實驗,結合對同一數據集的效果測試來說明各類方法的優缺點.通過這些優缺點,在 第 6 節中討論對抗樣本生成技術面臨的挑戰和前景預測.
目錄:
1 簡 介
2 前 傳
3 起源
4 發 展
5 實驗結果對比
6 面臨挑戰與前景預測
簡介:
深度學習技術在圖像降噪方面獲得了極大的關注。但是,處理噪聲的不同類型的學習方法有很大的差異。具體來說,基于深度學習的判別式學習可以很好地解決高斯噪聲。基于深度學習的優化模型方法對真實噪聲的估計有很好的效果。迄今為止,很少有相關研究來總結用于圖像去噪的不同深度學習技術。在本文中,作者對圖像去噪中不同深度技術進行了比較研究。我們首先對(1)用于加白噪聲圖像的深卷積神經網絡(CNN),(2)用于真實噪聲圖像的深CNN,(3)用于盲目去噪的深CNN和(4)用于混合噪聲圖像的深CNN進行分類,這是噪聲,模糊和低分辨率圖像的組合。然后,又分析了不同類型的深度學習方法的動機和原理。接下來,將在定量和定性分析方面比較和驗證公共去噪數據集的最新方法。最后,論文指出了一些潛在的挑戰和未來研究的方向。
簡要內容:
圖像去噪的深度學習方法的基礎框架:
圖像去噪中的深度學習技術:
在過去的幾年里,深度學習取得了巨大的成功,無論是從政策支持還是科研和工業應用,都是一片欣欣向榮。然而,近期的許多研究發現,深度學習擁有許多固有的弱點,這些弱點甚至可以危害深度學習系統的擁有者和使用者的安全和隱私。深度學習的廣泛使用進一步放大了這一切所造成的后果。為了揭示深度學習的一些安全弱點,協助建立健全深度學習系統,來自中科院信息工程所和中國科學院大學網絡安全學院的研究人員,全面的調查了針對深度學習的攻擊方式,并對這些手段進行了多角度的研究。
摘要: 圖像內容自動描述是計算機視覺和自然語言處理領域的一個重要任務,在生活娛樂、智慧 交通以及幫助視覺障礙者理解視覺內容等領域有著廣泛而重要的應用價值.相比于圖像分類和目標 檢測等感知任務,圖像內容自動描述是一種更高級別、更復雜的認知任務,對幫助分析和理解圖像有 著重要的意義.旨在對現有的圖像自動描述技術進行全面的綜述.討論圖像內容自動描述中常用的數 據集和評價指標,以及現有圖像自動描述技術的性能、優點和局限性。
關鍵詞: 圖像內容描述;卷積神經網絡;循環神經網絡;注意力機制;深度學習