摘要: 人臉活體檢測是為了提高人臉識別系統安全性而需要重點研究的問題.本文首先從人臉活體檢測的問題出發, 分個體、類內、類間三個層面對人臉活體檢測存在的困難與挑戰進行了闡述分析.接下來, 本文以算法使用的分類線索為主線, 分類別對人臉活體檢測算法及其優缺點進行了梳理和總結.之后, 本文就常用人臉活體檢測數據集的特點、數據量、數據多樣性等方面進行了對比分析, 對算法評估常用的性能評價指標進行了闡述, 總結分析了代表性人臉活體檢測方法在照片視頻類數據集CASIA-MFSD、Replay-Attack、Oulu-NPU、SiW以及面具類數據集3DMAD、SMAD、HKBU-MARsV2上的實驗性能.最后本文對人臉活體檢測未來可能的發展方向進行了思考和探討.
圖像/視頻的獲取及傳輸過程中,由于物理環境及算法性能的限制,其質量難免會遭受無法預估的衰減,導致其在實際場景中的應用受到限制,并對人的視覺體驗造成顯著影響。因此,作為計算機視覺領域中一項重要任務,圖像/視頻質量評價應運而生。其目的在于通過構建計算機數學模型來衡量圖像/視頻中的失真信息以判斷其質量的好壞,達到自動預測質量的效果。在城市生活、交通監控以及多媒體直播等多個場景中具有廣泛的應用前景。近年來,圖像/視頻質量評價研究取得了長足的發展,為計算機視覺領域中其他任務提供了一定的便利。本文在廣泛調研前人研究的基礎上,回顧了整個圖像/視頻質量評價領域的發展歷程,分別列舉了傳統方法和深度學習方法中一些具有里程碑意義的算法和影響力較大的算法,然后從全參考、半參考和無參考三個方面分別對圖像/視頻質量評價領域的一些文獻進行了綜述,具體涉及的方法包含基于結構信息、基于人類視覺系統和基于自然圖像統計的方法等;在LIVE、CSIQ、TID2013等公開數據集的基礎上,基于SROCC、PLCC等評價指標,對一些具有代表性算法的性能進行了分析;最后總結當前質量評價領域仍存在的一些挑戰與問題,并對其進行了展望。論文旨在為質量評價領域的研究人員提供一個比較全面的參考。
//www.cjig.cn/jig/ch/reader/view_abstract.aspx?flag=2&file_no=2021&journal_id=jig
摘要: 圖像異常檢測是計算機視覺領域的一個熱門研究課題, 其目標是在不使用真實異常樣本的情況下, 利用現有的正常樣本構建模型以檢測可能出現的各種異常圖像, 在工業外觀缺陷檢測, 醫學圖像分析, 高光譜圖像處理等領域有較高的研究意義和應用價值. 本文首先介紹了異常的定義以及常見的異常類型. 然后, 本文根據在模型構建過程中有無神經網絡的參與, 將圖像異常檢測方法分為基于傳統方法和基于深度學習兩大類型, 并分別對相應的檢測方法的設計思路、優點和局限性進行了綜述與分析. 其次, 梳理了圖像異常檢測任務中面臨的主要挑戰. 最后, 對該領域未來可能的研究方向進行了展望.
目標檢測是一種廣泛應用于工業控制、航空航天等安全攸關場景的重要技術。近年來,隨著深度學習在目標檢 測領域的應用,檢測的精度得到了較大提升,但由于深度學習固有的脆弱性,使得基于深度學習的目標檢測技術的可靠性 和安全性面臨新的挑戰。本文通過對近幾年面向目標檢測的對抗樣本生成及防御的研究進行分析和總結,致力于為增強目 標檢測模型的魯棒性和提出更好的防御策略提供思路。首先,介紹了對抗樣本的概念、產生原因以及目標檢測領域對抗樣 本生成常用的評價指標和數據集。然后根據對抗樣本生成的擾動范圍將攻擊分為全局擾動攻擊和局部擾動攻擊。在這個分 類基礎上,又分別從攻擊的目標檢測器類型、損失函數設計等六個方面對目標檢測的對抗樣本生成方法進行了分析和總結, 并通過實驗對比了幾種典型目標檢測對抗攻擊方法的性能,同時比較了這幾種方法的跨模型的遷移攻擊能力。此外,本文 還對目前目標檢測領域常用的對抗防御策略進行了分析和歸納。最后,總結了目標檢測領域對抗樣本的生成及防御所面臨 的挑戰,并對未來發展方向做出了展望。
摘 要:小目標檢測長期以來是計算機視覺中的一個難點和研究熱點。在深度學習的驅動下,小目標 檢測已取得了重大突破,并成功應用于國防安全、智能交通和工業自動化等領域。為了進一步促進小 目標檢測的發展,本文對小目標檢測算法進行了全面的總結,并對已有算法進行了歸類、分析和比較。首先,對小目標進行了定義,并概述小目標檢測所面臨的挑戰。然后,重點闡述從數據增強、多尺度學 習、上下文學習、生成對抗學習以及無錨機制等方面來提升小目標檢測性能的方法,并分析了這些方法 的優缺點和關聯性。之后,全面介紹小目標數據集,并在一些常用的公共數據集上對已有算法進行了 性能評估。最后本文對小目標檢測技術的未來發展方向進行了展望。
摘要: 人臉親子關系驗證即通過給定的不同人的兩幅人臉圖像判斷其是否具有親子關系, 是計算機視覺和機器學習領域中一個重要的研究問題, 在丟失兒童尋找、社會媒體分析、圖像自動標注等領域具有廣泛的應用價值. 隨著人臉親子關系驗證問題受到越來越多的關注, 其在多個方面都得到了相應的發展, 本文對人臉親子關系驗證方法做了綜述整理. 首先, 簡要介紹了人臉親子關系驗證在近十年的研究現狀, 隨后對問題進行了定義并討論其面臨的挑戰. 接下來, 匯總了常用的親子數據庫, 對數據庫屬性做了詳細的總結和對比. 然后, 對人臉親子關系驗證方法進行了分類總結、對比, 以及不同方法的性能表現. 最后, 展望了人臉親子關系驗證今后可能的研究方向.
面對人工標注大量樣本費時費力,一些稀有類別樣本難于獲取等問題,零樣本圖像分類成為計算機視覺領域的一個研究熱點。首先,對零樣本學習,包括直推式零樣本學習和歸納式零樣本學習進行了簡單介紹;其次,重點介紹了基于空間嵌入零樣本圖像分類方法和基于生成模型零樣本圖像分類方法以及它們的子類方法,并對這些方法的機制、優缺點和適用場景等進行了分析和總結;然后,簡單介紹了零樣本圖像分類常用數據集和評估方法,并對典型零樣本圖像分類方法進行了性能比較;接著,指出了現有零樣本圖像分類中存在的領域漂移、樞紐點和語義鴻溝等問題及相應的解決思路;最后,對零樣本圖像分類未來發展趨勢和研究熱點,如判別性區域的準確定位、生成高質量不可見類視覺特征、廣義零樣本圖像分類等進行了探討。
經典機器學習算法假設訓練數據和測試數據具有相同的輸入特征空間和相同的數據分布。在諸多現實問題中,這一假設往往不能滿足,導致經典機器學習算法失效。領域自適應是一種新的學習范式,其關鍵技術在于通過學習新的特征表達來對齊源域和目標域的數據分布,使得在有標簽源域訓練的模型可以直接遷移到沒有標簽的目標域上,同時不會引起性能的明顯損失。本文介紹領域自適應的定義,分類和代表性算法,重點討論基于度量學習的領域自適應算法和基于對抗學習的領域自適應算法。最后,分析領域自適應的典型應用和存在挑戰,明確領域自適應的發展趨勢,并提出未來可能的研究方向。
摘要: 目標檢測技術是光學遙感圖像理解的基礎問題, 具有重要的應用價值. 本文對遙感圖像目標檢測算法發展進行了梳理和分析. 首先闡述了遙感圖像目標檢測的特點和挑戰; 之后系統總結了典型的檢測方法, 包括早期的基于手工設計特征的算法和現階段基于深度學習的方法, 對于深度學習方法首先介紹了典型的目標檢測模型, 進而針對遙感圖像本身的難點詳細梳理了優化改進方案; 接著介紹了常用的檢測數據集, 并對現有方法的性能進行比較; 最后對現階段問題進行總結并對未來發展趨勢進行展望.
摘要: 當前,以網絡數據為代表的跨媒體數據呈現爆炸式增長的趨勢,呈現出了跨模態、跨數據源的復雜關聯及動態演化特性,跨媒體分析與推理技術針對多模態信息理解、交互、內容管理等需求,通過構建跨模態、跨平臺的語義貫通與統一表征機制,進一步實現分析和推理以及對復雜認知目標的不斷逼近,建立語義層級的邏輯推理機制,最終實現跨媒體類人智能推理。文中對跨媒體分析推理技術的研究背景和發展歷史進行概述,歸納總結視覺-語言關聯等任務的關鍵技術,并對研究應用進行舉例。基于已有結論,分析目前跨媒體分析領域所面臨的關鍵問題,最后探討未來的發展趨勢。
摘 要 圖像自動標注技術是減少圖像數據與內容之間“語義鴻溝”的其中一種最有效途徑,對于幫助人類理解圖像內容,從海量圖像數據中檢索感興趣的信息具有重要現實意義.通過研究近20年公開發表的圖像標注文獻,總結了圖像標注模型的一般性框架;并通過該框架結合各種具體工作,分析出在圖像標注研究過程中需要解決的一般性問題;將各種圖像標注模型所采用的主要方法歸為9種類型,分別為相關模型、隱Markov模型、主題模型、矩陣分解模型、近鄰模型、基于支持向量機的模型、圖模型、典型相關分析模型以及深度學習模型,并對每種類型的圖像標注模型,按照“基本原理介紹—具體模型差異—模型總結”3個層面進行了研究與分析.此外,總結了圖像標注模型常用的一些數據集、評測指標,對一些比較著名的標注模型的性能進行了比較,并據此對各種類型的標注模型做了優缺點分析.最后,提出了圖像標注領域一些開放式問題和研究方向.