亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

視頻標題生成與描述是使用自然語言對視頻進行總結與重新表達. 由于視頻與語言之間存在異構特性, 其數據處理過程較為復雜. 本文主要對基于“編碼-解碼”架構的模型做了詳細闡述, 以視頻特征編碼與使用方式為依據, 將其分為基于視覺特征均值/最大值的方法、基于視頻序列記憶建模的方法、基于三維卷積特征的方法及混合方法, 并對各類模型進行了歸納與總結. 最后, 對當前存在的問題及可能趨勢進行了總結與展望, 指出需要生成融合情感、邏輯等信息的結構化語段, 并在模型優化、數據集構建、評價指標等方面進行更為深入的研究.

付費5元查看完整內容

相關內容

摘要: 當前,以網絡數據為代表的跨媒體數據呈現爆炸式增長的趨勢,呈現出了跨模態、跨數據源的復雜關聯及動態演化特性,跨媒體分析與推理技術針對多模態信息理解、交互、內容管理等需求,通過構建跨模態、跨平臺的語義貫通與統一表征機制,進一步實現分析和推理以及對復雜認知目標的不斷逼近,建立語義層級的邏輯推理機制,最終實現跨媒體類人智能推理。文中對跨媒體分析推理技術的研究背景和發展歷史進行概述,歸納總結視覺-語言關聯等任務的關鍵技術,并對研究應用進行舉例。基于已有結論,分析目前跨媒體分析領域所面臨的關鍵問題,最后探討未來的發展趨勢。

//www.jsjkx.com/CN/10.11896/jsjkx.210200086

付費5元查看完整內容

摘要:隨著深度學習技術的快速發展,許多研究者嘗試利用深度學習來解決文本分類問題,特別是在卷積神經網絡和循環神經網絡方面,出現了許多新穎且有效的分類方法。對基于深度神經網絡的文本分類問題進行分析,介紹卷積神經網絡、循環神經網絡、注意力機制等方法在文本分類中的應用和發展,分析多種典型分類方法的特點和性能,從準確率和運行時間方面對基礎網絡結構進行比較,表明深度神經網絡較傳統機器學習方法在用于文本分類時更具優勢,其中卷積神經網絡具有優秀的分類性能和泛化能力。在此基礎上,指出當前深度文本分類模型存在的不足,并對未來的研究方向進行展望。

//www.ecice06.com/article/2021/1000-3428/2121.htm

文本分類技術經歷了從專家系統到機器學習再到深度學習的發展過程。在20世紀80年代以前,基于規則系統的文本分類方法需要領域專家定義一系列分類規則,通過規則匹配判斷文本類別。基于規則的分類方法容易理解,但該方法依賴專家知識,系統構建成本高且可移植性差。20世紀90年代,機器學習技術逐漸走向成熟,出現了許多經典的文本分類算法,如決策樹[1]、樸素貝葉斯[2]、支持向量機[3]、最大熵[4]、最近鄰[5]等,這些方法部分克服了上述缺點,一定程度上實現了分類器的自動生成,被廣泛應用于各個領域。然而,機器學習方法在構建分類器之前通常需要繁雜的人工特征工程,這限制了其進一步發展。

2012年之后,深度學習算法引起了研究者的廣泛關注。深度學習為機器學習建模提供了一種直接端到端的解決方案,可避免復雜的特征工程。GolVe[6]和word2vec[7]等詞向量模型的提出,使深度學習算法成功地應用到文本處理領域,隨后出現了各種基于深度神經網絡(Deep Neural Network,DNN)的文本分類方法。這些方法主要采用卷積神經網絡(Convolutional Neural Network,CNN)、循環神經網絡(Recurrent Neural Network,RNN)和注意力機制等深度學習技術,并且取得了比傳統方法更為出色的性能。近年來,圖卷積網絡(Graph Convolutional Network,GCN)、區域嵌入和元學習等一些新的深度學習方法也被應用于文本分類領域。

本文對基于深度神經網絡的文本分類技術進行介紹和分析,闡述卷積神經網絡、循環神經網絡和注意力機制等方法在文本分類中的應用和發展情況,總結各類方法的特點及區別,并對不同方法的性能表現和適用場景進行比較,討論在應用深度學習方法處理文本分類任務時應當注意的問題。在此基礎上,指出針對該技術未來的研究方向。

付費5元查看完整內容

生成對抗網絡(GAN)是無監督學習領域最近幾年快速發展的一個研究方向,其主要特點是能夠以一種間接的方 式對一個未知分布進行建模。在計算機視覺研究領域中,生成對抗網絡有著廣泛的應用,特別是在圖像生成方面,與其他的 生成模型相比,生成對抗網絡不僅可以避免復雜的計算,而且生成的圖像質量也更好。因此,本文將對生成對抗網絡及其在 圖像生成中的研究進展做一個小結和分析;本文首先從模型的架構、目標函數的設計、生成對抗網絡在訓練中存在的問題, 以及如何處理模式崩潰問題等角度對生成對抗網絡進行一個詳細的總結和歸納;其次介紹生成對抗網絡在圖像生成中的兩 種方法;隨后對一些典型的、用來評估生成圖像質量和多樣性的方法進行小結;并且對基于圖像生成的應用進行詳細分析;最后對生成對抗網絡和圖像生成進行總結,同時對其發展趨勢進行一個展望。

付費5元查看完整內容

摘要 近年來,跨模態研究吸引了越來越多學者的關注,尤其是連接視覺和語言的相關課題。該文針對跨視覺和語言模態研究中的核心任務——圖像描述生成,進行文獻綜述。該文從基于視覺的文本生成框架、基于視覺的文本生成研究中的關鍵問題、圖像描述生成模型的性能評價和圖像描述生成模型的主要發展過程四個方面對相關文獻進行介紹和總結。最后,該文給出了幾個未來的重點研究方向,包括跨視覺和語言模態的特征對齊、自動化評價指標的設計以及多樣化圖像描述生成。

//jcip.cipsc.org.cn/CN/abstract/abstract2995.shtml

付費5元查看完整內容

近年來,三維人臉識別研究取得了較大進展.相比 二維人臉識別,三維人臉識別更具有優勢,主要特點是在識 別中利用了三維形狀數據.該文首先根據三維形狀數據的 來源,將三維人臉識別分為基于彩色圖像的三維人臉識別、 基于高質 量 三 維 掃 描 數 據 的 三 維 人 臉 識 別、基 于 低 質 量 RGBGD圖像的三維人臉識別,分別闡述了各自具有代表性 的方法及其優缺點;其次分析了深度學習在三維人臉識別 中的應用方式;然后分析了三維人臉數據與二維圖像在雙 模態人臉識別中的融合方法,并介紹了常用的三維人臉數 據庫;最后 討 論 了 三 維 人 臉 識 別 面 臨 的 主 要 困 難 及 發 展 趨勢.

//jst.tsinghuajournals.com/CN/Y2021/V61/I1/77

付費5元查看完整內容

摘 要 圖像自動標注技術是減少圖像數據與內容之間“語義鴻溝”的其中一種最有效途徑,對于幫助人類理解圖像內容,從海量圖像數據中檢索感興趣的信息具有重要現實意義.通過研究近20年公開發表的圖像標注文獻,總結了圖像標注模型的一般性框架;并通過該框架結合各種具體工作,分析出在圖像標注研究過程中需要解決的一般性問題;將各種圖像標注模型所采用的主要方法歸為9種類型,分別為相關模型、隱Markov模型、主題模型、矩陣分解模型、近鄰模型、基于支持向量機的模型、圖模型、典型相關分析模型以及深度學習模型,并對每種類型的圖像標注模型,按照“基本原理介紹—具體模型差異—模型總結”3個層面進行了研究與分析.此外,總結了圖像標注模型常用的一些數據集、評測指標,對一些比較著名的標注模型的性能進行了比較,并據此對各種類型的標注模型做了優缺點分析.最后,提出了圖像標注領域一些開放式問題和研究方向.

付費5元查看完整內容

通過學習可觀測數據的概率密度而隨機生成樣本的生成模型在近年來受到人們的廣泛關注, 網絡結構中包含多個隱藏層的深度生成式模型以更出色的生成能力成為研究熱點, 深度生成模型在計算機視覺、密度估計、自然語言和語音識別、半監督學習等領域得到成功應用, 并給無監督學習提供了良好的范式. 本文根據深度生成模型處理似然函數的不同方法將模型分為三類: 第一類方法是近似方法, 包括采用抽樣方法近似計算似然函數的受限玻爾茲曼機和以受限玻爾茲曼機為基礎模塊的深度置信網絡、深度玻爾茲曼機和亥姆霍茲機, 與之對應的另一種模型是直接優化似然函數變分下界的變分自編碼器以及其重要的改進模型, 包括重要性加權自編碼和可用于半監督學習的深度輔助深度模型; 第二類方法是避開求極大似然過程的隱式方法, 其代表模型是通過生成器和判別器之間的對抗行為來優化模型參數從而巧妙避開求解似然函數的生成對抗網絡以及重要的改進模型, 包括WGAN、深度卷積生成對抗網絡和當前最頂級的深度生成模型BigGAN; 第三類方法是對似然函數進行適當變形的流模型和自回歸模型, 流模型利用可逆函數構造似然函數后直接優化模型參數, 包括以NICE為基礎的常規流模型、變分流模型和可逆殘差網絡(i-ResNet), 自回歸模型(NADE)將目標函數分解為條件概率乘積的形式, 包括神經自回歸密度估計(NADE)、像素循環神經網絡(PixelRNN)、掩碼自編碼器(MADE)以及WaveNet等. 詳細描述上述模型的原理和結構以及模型變形后, 闡述各個模型的研究進展和應用, 最后對深度生成式模型進行展望和總結.

//www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190866

受益于當前計算機性能的快速提升, 學習可觀測樣本的概率密度并隨機生成新樣本的生成模型成為熱點. 相比于需要學習條件概率分布的判別模型, 生成模型的訓練難度大、模型結構復雜, 但除了能夠生成新樣本外, 生成模型在圖像重構、缺失數據填充、密度估計、風格遷移和半監督學習等應用領域也獲得了巨大的成功. 當前可觀測樣本的數量和維數都大幅度增加, 淺層的生成模型受到性能瓶頸的限制而無法滿足應用需求, 從而被含有多個隱藏層的深度生成模型替代, 深度生成模型能夠學習到更好的隱表示, 模型性能更好. 本文對有重要意義的深度生成模型進行全面的分析和討論, 對各大類模型的結構和基本原理進行梳理和分類. 本文第1節介紹深度生成模型的概念和分類; 第2節介紹受限玻爾茲曼機和以受限玻爾茲曼機為基礎模塊的幾種深度生成模型, 重點內容是各種模型的不同訓練算法; 第3節介紹變分自編碼器的基本結構、變分下界的推理和重參數化方法; 第4節介紹生成對抗網絡, 主要內容為模型原理、訓練方法和穩定性研究, 以及兩種重要的模型結構; 第5節總結了流模型的結構, 詳細介紹了流模型的技術特點; 第6節分析了自回歸模型的模型結構以及幾種重要分支的研究進展; 第7節將介紹生成模型中的兩個小分支: 矩陣匹配模型和隨機生成模型; 第8節對深度生成模型存在的問題進行分析討論, 并對未來的研究方向和發展趨勢做出了展望.

付費5元查看完整內容

摘要:近年來,跨模態研究吸引了越來越多學者的關注,尤其是連接視覺和語言的相關課題。該文針對跨視覺和語言模態研究中的核心任務——圖像描述生成,進行文獻綜述。該文從基于視覺的文本生成框架、基于視覺的文本生成研究中的關鍵問題、圖像描述生成模型的性能評價和圖像描述生成模型的主要發展過程四個方面對相關文獻進行介紹和總結。最后,該文給出了幾個未來的重點研究方向,包括跨視覺和語言模態的特征對齊、自動化評價指標的設計以及多樣化圖像描述生成。

//jcip.cipsc.org.cn/CN/abstract/abstract2995.shtml

付費5元查看完整內容
北京阿比特科技有限公司