人臉特征點定位是根據輸入的人臉數據自動定位出預先按人臉生理特征定義的眼角、鼻尖、嘴角和臉部輪廓等面部關鍵特征點,在人臉識別和分析等系統中起著至關重要的作用。本文對基于深度學習的人臉特征點自動定位進行綜述,闡釋了人臉特征點自動定位的含義,歸納了目前常用的人臉公開數據集,系統闡述了針對2維和3維數據特征點的自動定位方法,總結了各方法的研究現狀及其應用,分析了當前人臉特征點自動定位技術在深度學習應用中的現狀、存在問題及發展趨勢。在公開的2維和3維人臉數據集上對不同方法進行了比較。通過研究可以看出,基于深度學習的2維人臉特征點的自動定位方法研究相對比較深入,而3維人臉特征點定位方法的研究在模型表示、處理方法和樣本數量上都存在挑戰。未來基于深度學習的3維人臉特征點定位方法將成為研究趨勢。
//www.cjig.cn/jig/ch/reader/view_abstract.aspx?file_no=20211108&flag=1
人臉合成由于其應用與技術價值,是機器視覺領域的熱點之一,而近年來深度學習的突破性進展使該領域吸引了更多關注。將該領域的研究分為四個子類:人臉身份合成、人臉動作合成、人臉屬性合成與人臉生成,并系統地總結了這些子類的發展歷程、現狀,以及現有技術存在的問題。首先針對人臉身份合成,從圖形學、數字圖像處理與深度學習三個角度總結了各自的合成流程,對關鍵技術原理進行了詳細的解釋與分析。其次將人臉動作合成進一步分為利用標簽驅動的表情編輯與利用真實人臉驅動的人臉重演,并指出了各自領域中存在的缺陷與難題。然后介紹了基于生成模型,尤其是生成對抗網絡在人臉屬性合成方面的發展,最終對人臉生成的各類工作進行了簡單的闡述。此外,介紹了人臉合成技術的實際應用與當前面臨的相關問題,并展望了該領域未來可能的研究方向。
近年來,卷積神經網絡(CNN)憑借強大的特征提取和表達能力,在圖像分析領域的諸多應用中取得了令人矚目的成就。但是,CNN性能的不斷提升幾乎完全得益于網絡模型的越來越深和越來越大,在這個情況下,部署完整的CNN往往需要巨大的內存開銷和高性能的計算單元(如GPU)支撐,而在計算資源受限的嵌入式設備以及高實時要求的移動終端上,CNN的廣泛應用存在局限性。因此,CNN迫切需要網絡輕量化。目前解決以上難題的網絡壓縮和加速途徑主要有知識蒸餾、網絡剪枝、參數量化、低秩分解、輕量化網絡設計等。首先介紹了卷積神經網絡的基本結構和發展歷程,簡述和對比了五種典型的網絡壓縮基本方法;然后重點針對知識蒸餾方法進行了詳細的梳理與總結,并在CIFAR數據集上對不同方法進行了實驗對比;其后介紹了知識蒸餾方法目前的評價體系,給出多類型方法的對比分析和評價;最后對該技術未來的拓展研究給出了初步的思考。
圖像/視頻的獲取及傳輸過程中,由于物理環境及算法性能的限制,其質量難免會遭受無法預估的衰減,導致其在實際場景中的應用受到限制,并對人的視覺體驗造成顯著影響。因此,作為計算機視覺領域中一項重要任務,圖像/視頻質量評價應運而生。其目的在于通過構建計算機數學模型來衡量圖像/視頻中的失真信息以判斷其質量的好壞,達到自動預測質量的效果。在城市生活、交通監控以及多媒體直播等多個場景中具有廣泛的應用前景。近年來,圖像/視頻質量評價研究取得了長足的發展,為計算機視覺領域中其他任務提供了一定的便利。本文在廣泛調研前人研究的基礎上,回顧了整個圖像/視頻質量評價領域的發展歷程,分別列舉了傳統方法和深度學習方法中一些具有里程碑意義的算法和影響力較大的算法,然后從全參考、半參考和無參考三個方面分別對圖像/視頻質量評價領域的一些文獻進行了綜述,具體涉及的方法包含基于結構信息、基于人類視覺系統和基于自然圖像統計的方法等;在LIVE、CSIQ、TID2013等公開數據集的基礎上,基于SROCC、PLCC等評價指標,對一些具有代表性算法的性能進行了分析;最后總結當前質量評價領域仍存在的一些挑戰與問題,并對其進行了展望。論文旨在為質量評價領域的研究人員提供一個比較全面的參考。
//www.cjig.cn/jig/ch/reader/view_abstract.aspx?flag=2&file_no=2021&journal_id=jig
軟件缺陷是軟件開發和維護過程中不可避免的.隨著現代軟件規模的不斷變大,軟件缺陷的數量以及修復難度隨之增加,為企業帶來了巨大的經濟損失.修復軟件缺陷,成為了開發人員維護軟件質量的重大負擔.軟件缺陷自動修復技術有希望將開發者從繁重的調試中解脫出來,近年來成為熱門的研究領域之一.搜集了94篇該領域最新的高水平論文,進行了詳細的分析和總結.基于缺陷修復技術在補丁生成階段所使用的技術手段不同,系統性地將軟件自動修復技術分為4大類,分別是基于啟發式搜索、基于人工模板、基于語義約束和基于統計分析的修復技術.特殊地,根據對近幾年最新研究的總結,首次提出了基于統計分析的技術分類,對已有分類進行了補充和完善.隨后,基于對已有研究的分析,總結了該領域研究所面臨的關鍵挑戰及對未來研究的啟示.最后,對缺陷修復領域常用的基準數據集和開源工具進行了總結.
行人檢測技術在智能交通系統,智能安防監控等領域表現出了極高的應用價值,已經成為計算機視覺領域的重要研究方向之一。得益于深度學習的飛速發展,基于深度卷積神經網絡的通用目標檢測模型被不斷擴展應用到行人檢測領域,并取得了良好的性能。但是由于行人目標內在的特殊性、復雜性,特別是考慮到復雜場景下的行人遮擋、尺度變化等問題,深度學習方法也面臨著嚴峻的挑戰。本文針對上述問題,以基于深度學習的行人檢測技術為研究對象,在充分調研文獻的基礎上,分別從基于錨點框、基于無錨點框以及通用技術改進(例如損失函數,非極大值抑制等)三個角度,對各類行人檢測算法進行細分,并選取具有代表性的方法進行詳細介紹和對比分析。此外,本文對行人檢測的通用數據集進行了詳細的介紹,對該領域先進算法的性能進行了對比分析,對行人檢測中待解決的問題與未來的研究方向做出預測和展望。
//www.cjig.cn/jig/ch/reader/view_abstract.aspx?flag=2&file_no=2020&journal_id=jig
摘要: 人臉識別是生物特征識別領域的一項關鍵技術,長期以來得到研究者的廣泛關注。視頻人臉識別任務特指從一段視頻中提取出人臉的關鍵信息,從而完成身份識別。相較于基于圖像的人臉識別任務來說,視頻數據中的人臉變化模式更為多樣且視頻幀之間存在較大差異,如何從冗長而復雜的視頻中抽取到人臉的關鍵特征成為當前的研究重點。以視頻人臉識別技術為研究對象,首先介紹了該技術的研究價值和存在的挑戰;接著對當前研究工作的發展脈絡進行了系統的梳理,依據建模方式將傳統基于圖像集合建模的方法分為線性子空間建模、仿射子空間建模、非線性流形建模、統計建模四大類,同時對深度學習背景下基于圖像融合的方法進行了介紹;另外對現有視頻人臉識別數據集進行分類整理并簡要介紹了常用的評價指標;最后分別采用灰度特征和深度特征在YTC數據集及IJB-A數據集上對代表性工作進行評測。實驗結果表明:神經網絡可以從大規模數據中提取到魯棒的視頻幀特征,從而帶來識別性能的大幅提升,而有效的視頻數據建模能夠挖掘出人臉潛在的變化模式,從視頻序列包含的大量樣本中找到更具判別力的關鍵信息,排除噪聲樣本的干擾,因此基于視頻的人臉識別具有廣泛的通用性和實用價值。
行人再識別的主要任務是利用計算機視覺對特定行人進行跨視域匹配和檢索。相比于傳統算法,由數據驅 動的深度學習方法所提取的特征更能表征行人之間的區分性。對行人再識別的背景及研究歷史、主要面臨的挑 戰、主要方法、數據集及評價指標進行了梳理和總結。主要從特征表達、局部特征、生成對抗網絡三個方面對行人 再識別的算法進行分析,列舉了行人再識別9個常用數據集、3個評價標準和14種典型方法在 Market1501數據集 上取得的準確率,最后對行人再識別的未來研究方向進行展望。