亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

題目:

Transformation-based Adversarial Video Prediction on Large-Scale Data

簡介:

對抗式生成建模技術的最新突破使模型能夠生成高質量的視頻樣本,即使是在大型和復雜的真實視頻集上也是如此。在這項工作中,我們專注于視頻預測的任務,其中給定了從視頻中提取的幀序列,目標是生成合理的未來序列。我們首先通過對鑒別器分解進行系統的經驗研究并提出一種比以前的方法產生更快的收斂性和更高性能的體系結構來改善現有技術。然后,我們分析生成器中的循環單元,并提出一種新穎的循環單元,該單元根據預測的類似運動的特征轉換其過去的隱藏狀態,并對其進行優化以處理遮擋,場景更改和其他復雜行為。我們表明,該循環裝置始終優于以前的設計。最終模型導致了最先進性能的飛躍,在大規模Kinetics-600數據集上獲得的測試集Frechet′視頻距離從69.2降低到25.7。

付費5元查看完整內容

相關內容

 Google DeepMind 是一家英國的人工智能公司。公司創建于 2010 年,最初名稱是 DeepMind 科技,在 2014 年被谷歌收購。

題目:

Con?dence-Aware Learning for Deep Neural Networks

簡介:

盡管深度神經網絡可以執行多種任務,但過分一致的預測問題限制了它們在許多安全關鍵型應用中的實際應用。已經提出了許多新的工作來減輕這個問題,但是大多數工作需要在訓練和/或推理階段增加計算成本,或者需要定制的體系結構來分別輸出置信估計。在本文中,我們提出了一種使用新的損失函數訓練深度神經網絡的方法,稱為正確排名損失,該方法將類別概率顯式規范化,以便根據依據的有序等級更好地進行置信估計。所提出的方法易于實現,并且無需進行任何修改即可應用于現有體系結構。而且,它的訓練計算成本幾乎與傳統的深度分類器相同,并且通過一次推斷就可以輸出可靠的預測。在分類基準數據集上的大量實驗結果表明,所提出的方法有助于網絡產生排列良好的置信度估計。我們還證明,它對于與置信估計,分布外檢測和主動學習密切相關的任務十分有效。

付費5元查看完整內容

題目: Smooth Adversarial Training

摘要:

人們通常認為,網絡不能兼具準確性和魯棒性,獲得魯棒性意味著失去準確性。還普遍認為,除非擴大網絡規模,否則網絡架構元素對提高對抗性的健壯性影響不大。本文通過對對抗訓練的仔細研究,提出了挑戰這些共同信念的證據。主要觀察結果是,廣泛使用的ReLU激活功能由于其不平滑的特性而大大削弱了對抗訓練。因此,提出了平滑對抗訓練(SAT),在其中我們用ReLU平滑近似代替了ReLU,以加強對抗訓練。SAT中平滑激活函數的目的是使它能夠找到更難的對抗示例,并在對抗訓練期間計算出更好的梯度更新。與標準的對抗訓練相比,SAT提高了“free”的對抗魯棒性,即準確性沒有降低,計算成本也沒有增加。例如,在不引入其他計算的情況下,SAT可將ResNet-50的魯棒性從33.0%提高到42.3%,同時還將ImageNet的準確性提高0.9%。SAT在較大的網絡上也能很好地工作:它可以幫助EfficientNet-L1在ImageNet上實現82.2%的準確性和58.6%的魯棒性,在準確性和魯棒性方面分別比以前的最新防御提高9.5%和11.6%。

付費5元查看完整內容

題目: Deep Isometric Learning for Visual Recognition

簡介: 初始化,正則化和skip連接被認為是訓練非常深的卷積神經網絡并獲得最新性能的三種必不可少的技術。 本文表明,無需規范化或skip連接的深層卷積網絡也可以訓練出在標準圖像識別基準上獲得令人驚訝的良好性能。 這是通過在初始化和訓練過程中強制卷積內核接近等距來實現的,還可以通過使用ReLU的變體來實現等距變遷。 進一步的實驗表明,如果與skip連接結合使用,則即使完全不進行正則化,此類近等距網絡也可以達到ResNet在ImageNet與COCO數據集上相同的性能。

付費5元查看完整內容

題目: CAST: A Correlation-based Adaptive Spectral Clustering Algorithm on Multi-scale Data

摘要:

本文研究了利用光譜聚類方法對多尺度數據進行聚類的問題。傳統的光譜聚類技術通過處理一個反映物體接近度的相似矩陣來發現聚類。對于多尺度數據,基于距離的相似度是無效的,因為稀疏聚類的對象可能相距很遠,而密集聚類的對象必須足夠近。可以通過將物體的“可達相似性”概念與給定的基于距離的相似性相結合,得到物體的系數矩陣,解決了多尺度數據的光譜聚類問題。本文提出了利用軌跡套索對系數矩陣進行正則化的算法CAST。證明了所得到的系數矩陣具有“分組效應”和“稀疏性”。我們表明,這兩個特征意味著非常有效的光譜聚類。我們評估CAST和其它10種聚類方法在廣泛的數據集w.r.t.各種應用。實驗結果表明,該算法在多尺度數據的測試用例中具有良好的魯棒性。

付費5元查看完整內容

自回歸文本生成模型通常側重于局部的流暢性,在長文本生成過程中可能導致語義不一致。此外,自動生成具有相似語義的單詞是具有挑戰性的,而且手工編寫的語言規則很難應用。我們考慮了一個文本規劃方案,并提出了一個基于模型的模仿學習方法來緩解上述問題。具體來說,我們提出了一種新的引導網絡來關注更長的生成過程,它可以幫助下一個單詞的預測,并為生成器的優化提供中間獎勵。大量的實驗表明,該方法具有較好的性能。

付費5元查看完整內容

主題: A Review on Deep Learning Techniques for Video Prediction

摘要: 預測,預期和推理未來結果的能力是智能決策系統的關鍵組成部分。鑒于深度學習在計算機視覺中的成功,基于深度學習的視頻預測已成為有前途的研究方向。視頻預測被定義為一種自我監督的學習任務,它代表了一個表示學習的合適框架,因為它展示了提取自然視頻中潛在模式的有意義的表示的潛在能力。視頻序列預測的深度學習方法。我們首先定義視頻預測的基礎知識,以及強制性的背景概念和最常用的數據集。接下來,我們會仔細分析根據擬議的分類法組織的現有視頻預測模型,突出顯示它們的貢獻及其在該領域的意義。數據集和方法的摘要均附有實驗結果,有助于在定量基礎上評估現有技術。通過得出一些一般性結論,確定開放研究挑戰并指出未來的研究方向來對本文進行總結。

付費5元查看完整內容

題目:

Probabilistic Video Prediction from Noisy Data with a Posterior Confidence

簡介:

我們從一系列嘈雜的輸入中研究了概率視頻預測的新研究問題,這很有用,因為在實際的時空預測應用中很難保證輸入幀的質量。它也具有挑戰性,因為它涉及兩個級別的不確定性:來自噪聲觀測的感知不確定性和正向建模中的動力學不確定性。在本文中,我們通過端到端訓練模型,稱為貝葉斯預測網絡(BP-Net)。與先前在隨機視頻預測中假設時空一致性并因此無法處理感知不確定性的工作不同,BP-Net在集成框架中對兩個不確定性水平進行建模。此外,與以前的工作僅能提供未分類的未來幀估計不同,BP-Net利用可微的順序重要性抽樣(SIS)方法基于基礎物理狀態的推論做出未來的預測,從而根據SIS重要性權重,即置信度。我們的實驗結果表明,BP-Net在根據嘈雜數據預測未來幀方面明顯優于現有方法。

付費5元查看完整內容

真實的顏色紋理生成是RGB-D表面重建的一個重要步驟,但由于重建幾何形狀的不準確性、相機姿態的不正確以及與視圖相關的成像偽影,在實踐中仍然具有挑戰性。在這項工作中,我們提出了一種利用從弱監督視圖中獲得的條件對抗損失來生成顏色紋理的新方法。具體地說,我們提出了一種方法,通過學習一個目標函數來生成近似表面的真實感紋理,即使是在未對齊的圖像中。我們的方法的關鍵思想是學習一個基于補丁的條件鑒別器,它可以引導紋理優化對不匹配的容忍度。我們的鑒別器采用一個合成的視圖和一個真實的圖像,并在一個廣義的真實感定義下評估合成的圖像是否真實。我們通過提供輸入視圖的“真實”示例對及其未對齊的版本來訓練鑒別器,這樣學習到的競爭損失將能夠容忍掃描的錯誤。在定量或定性評價下對合成和真實數據進行的實驗表明,我們的方法與現有方法相比具有優勢。我們的代碼是公開的視頻演示。

付費5元查看完整內容

題目: Large Scale Learning of General Visual Representations for Transfer

摘要: 在訓練深層視覺神經網絡時,預訓練表示的傳遞提高了樣本效率,簡化了超參數整定。我們重新審視了在大監督數據集上進行預訓練和微調目標任務權重的范例。我們擴大了訓練前的規模,并創建了一個簡單的配方,我們稱之為大轉移(BiT)。通過組合一些精心挑選的組件,并使用簡單的啟發式進行傳輸,我們在20多個數據集上獲得了很強的性能。BiT在一系列出人意料的數據體系中表現良好——從10到100萬個標記示例。BiT在ILSVRC-2012上達到87.8%的top-1精度,在CIFAR-10上達到99.3%,在視覺任務適應基準(包括19個任務)上達到76.7%。在小型數據集上,ILSVRC-2012每類25個示例的BiT達到86.4%,CIFAR-10每類10個示例的BiT達到97.6%。我們對導致高傳輸性能的主要組件進行了詳細的分析。

作者簡介: Alexander Kolesnikov,谷歌儀器科學家。個人主頁:[//neutrons.ornl.gov/contacts/kolesnikovai]{}

付費5元查看完整內容

論文題目: Unsupervised Pre-training for Natural Language Generation

論文摘要: 最近,由于無監督預訓練在促進自然語言理解(NLU)方面取得了令人驚訝的成功以及有效利用大規模未標記語料庫的潛力,因此在計算語言學領域正變得越來越受歡迎。但是,無論NLU是否成功,當涉及自然語言生成(NLG)時,無監督預訓練的功能只能被部分挖掘。 NLG特質的主要障礙是:文本通常是基于特定的上下文生成的,可能會因目標應用程序而異。結果,像在NLU場景中一樣,設計用于預訓練的通用體系結構是很難的。此外,在目標任務上學習時保留從預訓練中學到的知識也是不容置疑的。這篇綜述總結了近期在無監督的預訓練下增強NLG系統的工作,特別著重于催化將預訓練的模型集成到下游任務中的方法。根據它們處理上述障礙的方式,它們分為基于體系結構的方法和基于策略的方法。還提供了討論,以提供這兩種工作方式之間的進一步相互了解,一些有益的經驗現象以及未來工作可能涉及的一些方向。

付費5元查看完整內容
北京阿比特科技有限公司