神經風格遷移技術主要用于對圖像、視頻等進行風格化,使其具有藝術美感,該領域極具應用價值,是人工智能的熱門研究領域之一。為推動神經風格遷移領域的研究發展,對神經風格遷移技術進行了全面概述。簡述了非真實感渲染技術和傳統的紋理遷移技術。對現有神經風格遷移模型進行了分類整理,并詳細探討了各類代表性模型的算法原理及后續改進,分析了神經風格遷移技術的應用市場。提出對風格遷移模型質量的評判應該從定性評估和定量評估兩個方面來考慮,并從各個角度討論了現階段風格遷移技術存在的問題以及未來研究方向。最后強調應提高模型的綜合能力,在保證生成質量的情況下提升生成速度以及泛化能力。
圖像/視頻的獲取及傳輸過程中,由于物理環境及算法性能的限制,其質量難免會遭受無法預估的衰減,導致其在實際場景中的應用受到限制,并對人的視覺體驗造成顯著影響。因此,作為計算機視覺領域中一項重要任務,圖像/視頻質量評價應運而生。其目的在于通過構建計算機數學模型來衡量圖像/視頻中的失真信息以判斷其質量的好壞,達到自動預測質量的效果。在城市生活、交通監控以及多媒體直播等多個場景中具有廣泛的應用前景。近年來,圖像/視頻質量評價研究取得了長足的發展,為計算機視覺領域中其他任務提供了一定的便利。本文在廣泛調研前人研究的基礎上,回顧了整個圖像/視頻質量評價領域的發展歷程,分別列舉了傳統方法和深度學習方法中一些具有里程碑意義的算法和影響力較大的算法,然后從全參考、半參考和無參考三個方面分別對圖像/視頻質量評價領域的一些文獻進行了綜述,具體涉及的方法包含基于結構信息、基于人類視覺系統和基于自然圖像統計的方法等;在LIVE、CSIQ、TID2013等公開數據集的基礎上,基于SROCC、PLCC等評價指標,對一些具有代表性算法的性能進行了分析;最后總結當前質量評價領域仍存在的一些挑戰與問題,并對其進行了展望。論文旨在為質量評價領域的研究人員提供一個比較全面的參考。
//www.cjig.cn/jig/ch/reader/view_abstract.aspx?flag=2&file_no=2021&journal_id=jig
圖像的模糊問題影響人們對信息的感知、獲取及圖像的后續處理. 無參考模糊圖像質量評價是該問題的主要研究方向之一. 本文分析了近20年來模糊圖像無參考質量評價相關技術的發展. 首先, 本文結合主要數據集對圖像模糊失真進行分類說明; 其次, 對主要的模糊圖像無參考質量評價方法進行分類介紹與詳細分析; 隨后, 介紹了用來衡量模糊圖像無參考質量評價方法性能優劣的主要評價指標; 接著, 選擇典型數據集及評價指標, 并采用常見的模糊圖像無參考質量評價方法進行性能比較; 最后, 對無參考模糊圖像質量評價的相關技術及發展趨勢進行總結與展望.
大數據伴隨著物聯網、云計算和人工智能等技術的發展成為目前的研究熱點,并在許多領域得到了應用。蓬勃發展的航空領域具備天然的大數據土壤,受到人們越來越高的重視。近年來,學者們開始研究面向航空的大數據技術;航空公司也著手利用航空大數據為其提供服務,并將之提升至發展戰略的高度。已有研究和實踐表明,航空大數據不僅有利于降低航空公司的運營成本,而且可以提升客戶的體驗品質。首先從數據和系統性兩個角度給出了航空大數據的定義,并對相應的組織結構進行了比較系統的論述;然后從采集、存儲管理、預處理、分析和虛擬仿真與可視化五個方面詳細闡述了航空大數據中的關鍵技術,并對其中一些主要的模型和算法進行了比較分析;其次從多個方面描述了航空大數據的典型應用場景;最后深入地分析了航空大數據中存在的問題及未來的研究方向,以期對相關研究應用提供有益的參考。
摘要: 近年來, 基于卷積神經網絡的目標檢測研究發展十分迅速, 各種檢測模型的改進方法層出不窮. 本文主要對近幾年內目標檢測領域中一些具有借鑒價值的研究工作進行了整理歸納. 首先, 對基于卷積神經網絡的主要目標檢測框架進行了梳理和對比. 其次, 對目標檢測框架中主干網絡、頸部連接層、錨點等子模塊的設計優化方法進行歸納, 給出了各個模塊設計優化的基本原則和思路. 接著, 在COCO數據集上對各類目標檢測模型進行測試對比, 并根據測試結果分析總結了不同子模塊對模型檢測性能的影響. 最后, 對目標檢測領域未來的研究方向進行了展望.
精準地預判網絡流量變化趨勢可以幫助運營商準確預估網絡的使用情況,合理分配并高效利用網絡資源,以滿足日益增長且多樣化的用戶需求。以深度學習算法在網絡流量預測領域的進展為線索,闡述了網絡流量預測的評價指標和目前公開的網絡流量數據集及應用,具體分析了網絡流量預測中常用的深度信念網絡、卷積神經網絡、循環神經網絡和長短時記憶網絡共四種深度學習方法,并重點介紹了近年來針對不同問題所提出的改進神經網絡模型,總結了各模型特點及應用場景。最后對網絡流量預測未來發展進行了展望。
行人檢測技術在智能交通系統,智能安防監控等領域表現出了極高的應用價值,已經成為計算機視覺領域的重要研究方向之一。得益于深度學習的飛速發展,基于深度卷積神經網絡的通用目標檢測模型被不斷擴展應用到行人檢測領域,并取得了良好的性能。但是由于行人目標內在的特殊性、復雜性,特別是考慮到復雜場景下的行人遮擋、尺度變化等問題,深度學習方法也面臨著嚴峻的挑戰。本文針對上述問題,以基于深度學習的行人檢測技術為研究對象,在充分調研文獻的基礎上,分別從基于錨點框、基于無錨點框以及通用技術改進(例如損失函數,非極大值抑制等)三個角度,對各類行人檢測算法進行細分,并選取具有代表性的方法進行詳細介紹和對比分析。此外,本文對行人檢測的通用數據集進行了詳細的介紹,對該領域先進算法的性能進行了對比分析,對行人檢測中待解決的問題與未來的研究方向做出預測和展望。
//www.cjig.cn/jig/ch/reader/view_abstract.aspx?flag=2&file_no=2020&journal_id=jig
摘要 隨著深度學習算法在圖像分割領域的成功應用,在圖像實例分割方向上涌現出一大批優秀的算法架構.這些架構在分割效果、運行速度等方面都超越了傳統方法.本文圍繞圖像實例分割技術的最新研究進展,對現階段經典網絡架構和前沿網絡架構進行梳理總結,結合常用數據集和權威評價指標對各個架構的分割效果進行比較和分析.最后,對目前圖像實例分割技術面臨的挑戰以及可能的發展趨勢進行了展望.
現在注意力機制已廣泛地應用在深度學習的諸多領域。基于注意力機制的結構模型不僅能夠記錄信息間的位置關系,還能依據信息的權重去度量不同信息特征的重要性。通過對信息特征進行相關與不相關的抉擇建立動態權重參數,以加強關鍵信息弱化無用信息,從而提高深度學習算法效率同時也改進了傳統深度學習的一些缺陷。因此從圖像處理領域、自然語言處理、數據預測等不同應用方面介紹了一些與注意力機制結合的算法結構,并對近幾年大火的基于注意力機制的transformer和reformer算法進行了綜述。鑒于注意力機制的重要性,綜述了注意力機制的研究發展,分析了注意力機制目前的發展現狀并探討了該機制未來可行的研究方向。
//cea.ceaj.org/CN/abstract/abstract39198.shtml
近年來,深度學習技術被廣泛應用于各個領域,基于深度學習的預處理模型將自然語言處理帶入一個新時代。預訓練模型的目標是如何使預訓練好的模型處于良好的初始狀態,在下游任務中達到更好的性能表現。對預訓練技術及其發展歷史進行介紹,并按照模型特點劃分為基于概率統計的傳統模型和基于深度學習的新式模型進行綜述;簡要分析傳統預訓練模型的特點及局限性,重點介紹基于深度學習的預訓練模型,并針對它們在下游任務的表現進行對比評估;梳理出具有啟發意義的新式預訓練模型,簡述這些模型的改進機制以及在下游任務中取得的性能提升;總結目前預訓練的模型所面臨的問題,并對后續發展趨勢進行展望。
摘要:卷積神經網絡在廣泛的應用中取得了優秀的表現,但巨大的資源消耗量使得其應用于移動端和嵌入式設備成為了挑戰。為了解決此類問題,需要對網絡模型在大小、速度和準確度方面做出平衡。首先,從模型是否預先訓練角度,簡要介紹了網絡壓縮與加速的兩類方法——神經網絡壓縮和緊湊的神經網絡。具體地,闡述了緊湊的神經網絡設計方法,展示了其中不同運算方式,強調了這些運算特點,并根據基礎運算不同,將其分為基于空間卷積的模型設計和基于移位卷積模型設計兩大類,然后每類分別選取三個網絡模型從基礎運算單元、核心構建塊和整體網絡結構進行論述。同時,分析了各網絡以及常規網絡在ImageNet數據集上的性能。最后,總結了現有的緊湊神經網絡設計技巧,并展望了未來的發展方向。