亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

在這篇論文中,深度表示中的不變性,我們對學習不變性表示的問題提出了新的解決方案。我們采用兩種不同的不變性概念。一個根植于對稱群體,另一個根植于因果關系。最后,盡管它們是相互獨立發展的,我們的目標是邁出統一這兩個不變性概念的第一步。我們提出了一個基于神經網絡的排列不變聚合算子,它對應于注意機制(第2節)。我們開發了一種新的集合分類方法。值得注意的是,所提出的基于注意力的算子的應用可以深入了解每個元素對集合標簽的貢獻。我們發現面向應用的研究領域,如醫學成像或機器人,數據增強技術用于學習域不變特征。通過描述因果概念如何削弱觀察到的域和任務標簽之間的偽相關(第3節),我們演示了因果概念可以用來解釋數據增強的成功。我們演示了數據增強可以作為模擬介入數據的工具。我們利用這些理論見解來推導一個簡單的算法,它能夠選擇數據增強技術,從而導致更好的領域泛化。我們提出了一種新穎的因果減少方法(第4節),將任意數量的可能高維潛在混雜物替換為與治療變量位于同一空間的單個潛在混雜物,而不改變因果模型所包含的觀察和介入分布。在簡化之后,我們使用一種靈活的轉換類參數化簡化的因果模型,稱為規范化流。我們提出了一種從觀測數據和介入數據聯合估計參數化簡化模型的學習算法。我們提出了域不變變分自動編碼器(第5節),這是一種生成模型,通過學習三個獨立的潛在子空間來解決域移位問題,一個用于域,一個用于類,一個用于任何殘留變化。我們表明,由于我們的模型的生成特性,我們也可以合并來自已知或以前未見領域的未標記數據。

付費5元查看完整內容

相關內容

阿姆斯特丹大學(荷蘭文:Universiteit van Amsterdam,縮寫為 UvA),成立于1632年,坐落在荷蘭首都阿姆斯特丹市中心。阿姆斯特丹大學是歷史悠久的著名世界百強學府,也是歐洲最大的綜合性大學之一,擁有眾多國際學生交流項目和優良的國際聲譽。它同時是Universitas 21大學聯盟、歐洲大學協會、歐洲研究型大學聯盟與歐洲首都大學聯盟成員之一。[1] 阿姆斯特丹大學有高質量的研究生和世界前沿的研究培訓,同時本科教育也是世界最優秀的之一。它產生過6名諾貝爾獎得主,其中諾貝爾物理學家得主3名,和平、醫學和化學獎得主各一名。 如今,作為研究型大學的阿姆斯特丹大學有超過30000名學生,5000名員工和285個研究項目(學士和碩士項目),其中許多都是用英語授課的。阿姆斯特丹大學擁有超過6億歐元的預算,大學學院星羅棋布地分布在阿姆斯特丹城市的各個角落,目前該校設有七個學院:人文學院、社會與行為科學學院、商學院、法學院、理學院、醫學院和牙醫學院。 阿姆斯特丹大學的聲譽享譽全球,被譽為“歐洲的哈佛”。在2020年度USNEWS世界大學排名中,位列世界第四十位,歐盟區位列前三。

在過去的十年里,深度學習取得了巨大的成功,但在權值更新和訓練樣本數量方面,實際有用的深度模型的訓練仍然非常低效。為了解決這些問題的一個方面,本文研究了持續學習設置,該模型利用一系列的任務,利用之前的知識來快速學習新任務。持續學習的主要挑戰是,在為新任務更新模型時,避免模型災難性地忘記之前的信息。

//ora.ox.ac.uk/objects/uuid:7a3e5c33-864f-4cfe-8b80-e85cbf651946

為此,本文首先提出了一種持續學習算法,通過正則化兩個連續任務的條件似然之間的kl -散度來保留之前的知識。結果表明,這種正則化對網絡權值施加了二次懲罰,該懲罰基于上一個任務的最小曲率。其次,本文提出了一種更有效的持續學習算法,利用對過去任務的情景記憶作為約束,這樣當對新任務進行權重更新時,情景記憶的損失不會增加。結果表明,使用情景記憶約束目標比正則化網絡參數更有效。此外,為了提高學習新任務的速度,提出了使用組合任務描述符的聯合嵌入模型,大大提高了正向遷移。基于情景記憶的持續學習目標通過直接在損失函數中使用記憶來簡化。盡管它傾向于記憶出現在微小情景記憶中的數據,結果算法顯示出比使用記憶作為約束的算法更好的泛化。分析認為,這種驚人的概化是由于新任務數據帶來的正則化效應。然后利用該算法對合成數據和真實數據進行持續學習。為此,提出了一種方法,通過優化重放緩沖區上的事后遺忘損失,為每個任務生成合成數據點。設計了一個嵌套的持續學習優化目標,有效地利用這些綜合點來減少基于記憶的持續學習方法的遺忘。最后,本文提出了一種持續學習算法,在不重疊的特征子空間中學習不同的任務。通過保持不同任務的子空間相互正交來最小化重疊,可以減少這些任務表示之間的干擾。

付費5元查看完整內容

在本文中,我們的目標是改進深度強化學習中的泛化。對任何類型的學習來說,泛化都是一項基本挑戰,它決定了如何將已獲得的知識轉移到新的、以前從未見過的情況中。本文專注于強化學習,這是一個描述人工智能體如何學習與環境交互以實現目標的框架。近年來,利用神經網絡表示智能體取得了顯著的成功,并極大地擴展了其可能的應用范圍。本文的目標是通過允許這些智能體更快地學習,學習更好的解決方案,并對以前未見過的情況做出魯棒的反應,從而提高它們的性能。在這個探索中,我們探索了一系列不同的方法和途徑。我們專注于將額外的結構,也稱為歸納偏差,納入主體。專注于特定的,但廣泛適用的問題領域,我們可以開發專門的架構,從而大大提高性能。在第3章中,我們關注的是部分可觀察環境,在這種環境中,智能體每時每刻都不能完全訪問所有與任務相關的信息。在第4章中,我們將注意力轉向多任務和遷移學習,并設計了一種新的訓練方法,允許訓練分層結構的智能體。我們的方法優化了單個解決方案的可重用性,大大提高了傳輸設置中的性能。

//ora.ox.ac.uk/objects/uuid:9fdfadb0-e527-4421-9a22-8466c9fed9c8 在本文的第二部分中,我們將注意力轉向正則化,這是另一種形式的歸納偏差,作為提高深度智能體泛化的方法。在第五章中,我們首先探討了強化學習(RL)中的隨機正則化。雖然這些技術已被證明在監督學習中非常有效,但我們強調并克服了將它們直接應用到在線RL算法中的困難,這是RL中最強大和應用最廣泛的學習類型之一。在第6章中,我們通過探索訓練數據中的瞬態非平穩性如何干擾神經網絡的隨機梯度訓練,并使其偏向較差的解,在更基本的水平上研究了深度rl中的泛化。許多先進的RL算法將這些類型的非平穩性引入到訓練中,甚至在平穩環境中,通過使用持續改進的數據收集策略。我們提出了一個新的框架,以減少經過訓練的策略所經歷的非平穩性,從而允許改進的泛化。

付費5元查看完整內容

近年來,在Instagram、Podcast、Clubhouse、YouTube等各種平臺上產生和發布了大量的多媒體數據。這一現象啟發了大規模多媒體分析的研究工作,包括分析方法的基礎,以及一些具體的下游應用(如識別、檢索和信息提取)。特別是多媒體的表示學習是其中最重要的研究方向之一。一個良好的多媒體數據實例特征表示具有可解釋性和通用性,可以提高下游任務的性能和效率。 由于多媒體內容的豐富性和噪聲性,對其進行良好的表示具有挑戰性。例如,在語音處理任務中,人類的話語包含語言信息,以及說話人的身份、說話風格和背景噪聲等其他因素。在這種情況下,我們需要一種表示類型,它從所有這些因素中捕獲信息,并為下游應用程序恢復有用的因素。大多數主流技術利用特征向量來表示訓練數據集中的每個實例,并通過進行預訓練任務來優化特征提取器。然而,基于向量的表示方法不足以保持多媒體數據的豐富度和處理噪聲。此外,常見的預訓練程序,如計算機視覺研究領域的ImageNet分類任務,只關注單一類型的鑒別信息,對于某些應用可能是不夠的。因此,在本文中,我探索了兩個研究方向來解決這些問題。 在本文的第一部分,我提出了兩種新的多媒體內容表示類型:概率分布和線性子空間。與基于向量的表示方法相比,這兩種方法都能較好地處理多媒體的豐富度和噪聲。為了在下游任務中利用這兩種表示,設計特定的算法和訓練策略是必要的。在這部分論文中,我介紹了將分布和子空間表示與深度神經網絡架構相結合的方法,這些方法可以端到端地進行優化。在下游任務上的實驗結果表明,與主流的向量表示方法相比,本文提出的兩種表示方法具有更好的性能。 在本文的第二部分,我研究了風格和內容解糾纏技術,它明確地保留了表征學習過程中多媒體內容中的不同因素。解糾纏表示提供了更好的可解釋性,并允許在數據合成場景中操縱隱藏因素。基于這一動機,我提出了兩種方法來有效地分離多媒體數據中的隱藏因素。第一種方法將風格和內容之間的關系建模為隱藏特征空間中的簡單矩陣操作。第二種方法通過制定對抗訓練準則來最小化兩個隱藏因素之間的互信息。在數據合成/生成任務的定性和定量實驗中,評價了兩種方法的優勢。此外,我進一步論證了風格和內容解糾纏技術的適用性,通過構建一個預訓練框架與生成模型。具體來說,生成模型產生的合成數據可以支持語音識別、人的重新識別等下游任務的監督訓練過程。此外,解纏生成過程將數據擴充的思想從原始數據空間擴展到可解釋的表示空間,允許我們在下游任務中納入更多的先驗知識。

付費5元查看完整內容

深度卷積網絡的出現推動了視覺識別領域的新一波進步。這些學習到的表示大大優于手工設計的特征,在視覺任務上獲得更高的性能,同時在數據集上有更好的泛化性。盡管這些模型看起來很普遍,但當它們所訓練的數據與所要求操作的數據之間存在不匹配時,它們仍然會受到影響。領域適應提供了一種潛在的解決方案,允許我們將網絡從源領域訓練到新的目標領域。在這些領域中,標記數據是稀疏的或完全缺失的。然而,在端到端可學習表示出現之前,視覺域適應技術很大程度上局限于在固定的、手工設計的視覺特征上訓練的分類器。在這篇論文中,我們展示了如何將視覺域適應與深度學習相結合,以直接學習能夠適應域移動的表示,從而使模型能夠泛化到源域之外。

在第2章中,我們將演示如何設計損失,以衡量兩個領域的不同程度。我們表明,通過優化表示來最小化這些損失,我們可以學習從源到目標更好地泛化的表示。在第3章和第4章中,我們展示了我們可以訓練模型來嘗試測量域差異,而不是手工設計這些域損失。由于這些模型本身是端到端可學習的,我們可以通過它們反向傳播來學習表示,從而最小化學習的差異。這在概念上與生成式對抗網絡類似,我們還探索了兩者之間的關系,以及我們如何在對抗環境中使用為GANs開發的技術。最后,在第5章和第6章中,我們證明了適應性不需要局限于深度網絡的中間特征。對抗適應技術也可以用于訓練模型,直接改變圖像的像素,將它們轉換成跨域的類似物。然后,這些轉換后的圖像可以用作標記的偽目標數據集,以學習更適合目標領域的監督模型。我們表明,這種技術是基于特征的適應性的補充,當兩者結合時產生更好的性能。

//www2.eecs.berkeley.edu/Pubs/TechRpts/2020/EECS-2020-69.html

付費5元查看完整內容

平移的不變性為卷積神經網絡注入了強大的泛化特性。然而,我們通常無法預先知道數據中存在哪些不變性,或者模型在多大程度上應該對給定的對稱組保持不變。我們展示了如何通過參數化增強分布和同時優化網絡參數和增強參數的訓練損失來學習不變性和等方差。通過這個簡單的過程,我們可以在一個很大的擴充空間中,僅在訓練數據上,恢復圖像分類、回歸、分割和分子性質預測上的正確不變量集和范圍。

//arxiv.org/pdf/2010.11882.pdf

付費5元查看完整內容

最近,人們對在非歐幾里得空間中表示數據的方法(例如雙曲或球面)越來越感興趣,這些方法提供了對某些真實世界數據屬性(例如無尺度、分層或循環)有用的特定歸納偏差。然而,流行的圖神經網絡目前僅限于通過歐幾里得幾何和相關的向量空間操作來建模數據。在這里,我們通過提出將圖卷積網絡(GCN)在數學基礎上推廣為常曲率空間的(乘積)來彌補這一差距。我們通過i)引入一種統一的形式,可以在所有常曲率幾何之間平滑地插入,ii)利用陀螺質心坐標,推廣了經典的歐幾里德質心概念。當曲率從任何一邊變為零時,我們這類模型平滑地恢復它們的歐幾里得對應模型。根據其離散曲率,我們在非歐幾里得行為的符號數據上的節點分類和失真最小化的任務表現優于歐幾里得GCNs。

//arxiv.org/abs/1911.05076

概述

圖卷積網絡 針對圖像數據的卷積網絡和深度學習的成功啟發了對于共享參數與圖形幾何形狀一致的圖推廣。Bruna等人(2014);Henaff等人(2015)是利用圖上的局部譜濾波器在圖傅里葉空間中開發頻譜圖卷積神經網絡的先驅。然而,為了減少對拉普拉斯特征模式的圖依賴,Defferrard等人(2016)利用Hammond等人(2011)的結果使用Chebyshev多項式近似卷積濾波器。所得到的方法(在附錄A中討論)在計算效率和精度和復雜性方面是優越的。此外,Kipf和Welling(2017)通過考慮一階近似來簡化這種方法,從而獲得高可伸縮性。提出的圖卷積網絡(GCN)是通過對稱歸一化鄰接矩陣來插值節點嵌入,而這種權值共享可以理解為一種有效的擴散式正則化器。最近的工作擴展了GCNs,實現了鏈接預測(Zhang & Chen, 2018)、圖分類(Hamilton等,2017;和節點分類(Klicpera et al., 2019;Velickoviˇc et al .′, 2018)。

ML中的歐幾里得幾何。在機器學習(ML)中,由于各種原因,數據通常在歐幾里得空間中表示。首先,有些數據本質上是歐幾里得的,比如經典力學中三維空間中的位置。其次,直覺在這樣的空間中更容易,因為它們擁有一個吸引人的矢量結構,允許基本的算術和豐富的線性代數理論。最后,許多感興趣的量,如距離和內積在封閉公式中是已知的,可以在現有的硬件上非常有效地計算。這些操作是當今大多數流行的機器學習模型的基本構建模塊。因此,歐幾里得幾何強大的簡單性和效率已經導致許多方法實現了最先進的任務,如機器翻譯(Bahdanau等,2015;wani et al., 2017),語音識別(Graves et al., 2013),圖像分類(He et al., 2016)或推薦系統(He et al., 2017)。

黎曼ML 盡管取得了成功,但某些類型的數據(例如分層數據、無標度數據或球形數據)被證明可以更好地用非歐幾里德幾何表示(Defferrard et al., 2019;Bronstein等,2017;Nickel & Kiela, 2017;Gu et al., 2019),尤其帶來了豐富的流形學習理論(Roweis & Saul, 2000;和信息幾何(Amari & Nagaoka, 2007)。在活力操縱非歐幾里得幾何的數學框架被稱為黎曼幾何(Spivak, 1979)。雖然它的理論導致了許多強而優雅的結果,但它的一些基本量,如距離函數d(·,·),通常不能以封閉的形式提供,這對許多計算方法都是禁止的。

常曲率幾何的代表性優勢。在一般黎曼流形和歐幾里得空間之間的一個有趣的權衡是由常截面曲率流形給出的。他們一起定義了所謂的雙曲(負曲率),橢圓(正曲率)和歐幾里得(零曲率)幾何。正如下面和附錄B中所討論的,歐幾里得空間在嵌入某些類型的數據(如樹)時具有局限性,并且會產生很大的失真。在這些情況下,雙曲空間和球面空間具有代表性的優勢,為各自的數據提供了更好的歸納偏差。

雙曲空間可以直觀地理解為一棵連續樹:球的體積隨半徑呈指數增長,類似于二叉樹的節點數隨深度呈指數增長(圖1)。它的樹狀性質已經被數學研究了很長時間(Gromov, 1987;哈曼,2017;與歐幾里得幾何結構相比,它被證明能夠更好地嵌入復雜網絡(Krioukov et al., 2010)、無標度圖和分層數據(Cho et al., 2019; Sala et al., 2018; Ganea et al., 2018b; Gu et al., 2019; Nickel & Kiela, 2018; 2017; Tifrea et al., 2019)。一些重要的工具或方法找到了它們的雙曲線對應物,例如變分自編碼器(Mathieu et al., 2019;、注意力機制(Gulcehre等,2018)、矩陣乘法、遞歸單位和多項logistic回歸(Ganea等,2018)。

常曲率空間中的GCNs。在這項工作中,我們引入了一個擴展的圖形卷積網絡,它允許學習存在于具有任何曲率符號的常曲率空間(乘積)中的表示。我們通過將導出的統一陀螺框架與GCNs的有效性相結合來實現這一點(Kipf & Welling, 2017)。與我們的工作同時,Chami等人(2019年);Liu等人(2019)考慮了通過切線空間聚合在雙曲空間中學習嵌入的圖神經網絡。他們的方法將在第3.4節中作更詳細的分析。我們的模型更一般化,因為它在一個包含雙曲空間的嚴格超集中產生表示。

付費5元查看完整內容
北京阿比特科技有限公司