亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

IJCAI 大會將 7 月23日到29日在奧地利維也納舉辦。IJCAI 2022 共收到 4535 篇提交,最終接收率為 15%,對比去年 13.9% 的接收率有所提高。來自微軟研究院、香港城市大學和南洋理工等最新IJCAI2022《領域泛化》教程,介紹了領域泛化(DG)的最新進展,非常值得關注!

機器學習模型在很大程度上依賴于海量訓練數據的可用性。對于資源匱乏、標簽良好的數據難以獲取的場景,進行跨領域知識轉移非常重要,即從現有領域向目標領域進行知識轉移。針對這一問題,遷移學習和領域適應研究取得了很大進展。除了這些進步之外,學習能夠在任何新的看不見的環境中很好地推廣的模型也是非常重要的。這促使研究社區開發算法,以更好地利用現有的訓練領域,同時處理它們的分布轉移。

本教程致力于介紹領域泛化(DG)的最新進展。與假設目標域數據可用性的遷移學習和域適應不同,DG更進一步,不需要訪問目標數據。DG的目的是從一個或多個具有不同概率分布的訓練域學習一個廣義模型,并能很好地實現非分布泛化。潛在受眾將是機器學習研究人員和行業從業者,對遷移學習、領域適應和泛化特別感興趣。我們的教程旨在使這些技術在實際應用中更容易學習和使用。

//dgresearch.github.io/ 視頻: 代碼:

引言 Introduction and background * 相關研究 Related research areas * 領域泛化 Methodology of DG * 應用 Applications * 數據集 Datasets, benchmarks, and evaluations * 理論與未來挑戰,Theory and future challenges

領域泛化問題與領域自適應(Domain Adaptation, DA)最大的不同:領域自適應在訓練中,源域和目標域數據均能訪問(無監督領域自適應中則只有無標記的目標域數據);而在領域泛化問題中,我們只能訪問若干個用于訓練的源域數據,測試數據是不能訪問的。毫無疑問,領域泛化是比領域自適應更具有挑戰性和實用性的場景:畢竟我們都喜歡「一次訓練、到處應用」的足夠泛化的機器學習模型。

例如,在下圖中,領域自適應問題假定訓練集和測試集都可以在訓練過程中被訪問,而領域泛化問題中則只有訓練集。

圖1:PACS數據集中領域泛化示例。訓練集數據由簡筆畫、卡通畫、藝術畫作構成的圖片。領域泛化的目的是學習一個在未知目標域中表現良好的泛化模型。

領域泛化問題的示意圖如下所示,其形式化定義如下:

圖2:領域泛化示意圖

領域泛化不僅與領域自適應問題有相似之處,其與多任務學習、遷移學習、元學習、終身學習等,都有一些類似和差異之處。我們在下表中對它們的差異進行了總結。

表1:領域泛化與其它相關學習范式對比

領域泛化方法是我們的核心。我們將已有的領域泛化方法按照數據操作、表征學習、學習策略分為三大方面,如下圖所示。

圖3:領域泛化方法分類

其中:

  • . 數據操作,指的是通過對數據的增強和變化使訓練數據得到增強。這一類包括數據增強和數據生成兩大部分。
  • . 表征學習,指的是學習領域不變特征(Domain-invariant representation learning)以使得模型對不同領域都能進行很好地適配。領域不變特征學習方面主要包括四大部分:核方法、顯式特征對齊、領域對抗訓練、以及不變風險最小化(Invariant Risk Minimiation, IRM)。特征解耦與領域不變特征學習的目標一致、但學習方法不一致,我們將其單獨作為一大類進行介紹。
  • . 學習策略,指的是將機器學習中成熟的學習模式引入多領域訓練中使得模型泛化性更強。這一部分主要包括基于集成學習和元學習的方法。同時,我們還會介紹其他方法,例如自監督方法在領域泛化中的應用。

在文章中,我們對每大類方法都進行了詳細地介紹與總結。

付費5元查看完整內容

相關內容

當與人工智能系統合作時,我們需要評估何時信任它的建議。假設我們錯誤地相信了它可能出錯的區域。在這種情況下,可能會發生災難性的故障,因此需要使用貝葉斯方法進行推理和學習,以確定查詢結果的概率的置信度(或認知不確定性)。然而,純貝葉斯方法的計算成本很高。為了克服它們,我們恢復到高效和有效的逼近。在本教程中,博士生和早期研究人員將被介紹到技術的名稱為證據推理和學習,從貝葉斯更新給定假設的過程中基于額外收集的證據。該教程為讀者提供了一個關于證據推理與學習的調研領域,包括最新的研究成果。

為了確定人工智能系統可能出錯的區域,我們需要(至少)區分兩種不同的不確定性來源:偶然的(或任意的)和認知的不確定性。偶然性不確定性指的是由于固有的隨機效應(如拋硬幣)導致的實驗結果的可變性:沒有額外的信息來源,但拉普拉斯的守護進程可以減少這種可變性。認知不確定性指的是使用模型的代理的認知狀態,因此它的知識缺乏,原則上可以根據額外的數據樣本來減少。

本教程詳細介紹了在推理和學習中量化偶然和認知不確定性的交叉研究,同時根據進一步收集到的支持(或反對)假設的證據,使用非常有效的逼近來更新貝葉斯后驗。我們主要關注的情況下,不確定的概率表示為貝塔或狄利克雷分布遵循貝葉斯統計范式。與現有的關于(深度)學習中知識不確定性量化方法的調研不同,在本教程中,我們的目標是概述在存在知識不確定性的情況下進行推理以及在使用全部和部分數據進行學習時所面臨的挑戰。當希望限制對計算資源的需求時,存在偶然性和認知不確定性的邏輯推理帶來了需要解決的全新問題。我們用概率電路的概念來說明這個想法,它可以包含大量的推理問題。我們進一步討論了確定概率電路參數的認知不確定性和偶然不確定性的挑戰,特別是訓練數據的部分可觀察性。最后討論了如何從現實世界中確定不確定概率。不出所料,它們要么由先知(例如,情報分析師)提供,要么從原始數據中學習。

//federico-cerutti.unibs.it/tutorials/2022-ijcai-erl/

  • 貝葉斯統計 A primer in Bayesian Statistics: Fundamentals of statistics and Bayes Beta and Dirichlet distributions as uncertain probabilities.

  • 證據推理 Evidential Reasoning: From logic to probabilistic circuits; Probabilistic circuits as a unifying method for probabilistic reasoning; Probabilistic circuits with uncertain probabilities.

  • 證據參數學習 Evidential Parameter Learning: Learning with complete observations; Learning with partial observations: preliminary proposals and discussions.

  • 從真實世界中尋找證據 Ascertain Evidence from the Real World: Intelligence analysis and uncertainty Evidential Deep Learning; Alternative proposals. 總結與結論 Summary and conclusion.

付費5元查看完整內容

本文介紹TPAMI 2021的中稿論文:VideoDG: Generalizing Temporal Relations in Videos to Novel Domains。

作者:姚治宇*,王韞博*,王建民,俞士綸,龍明盛

鏈接://www.zhuanzhi.ai/paper/028b77e5d88a032032f2e567580b7d8d

代碼:

引言

傳統的機器學習一般假設源領域(source domain)和目標領域(target domain)的數據分布符合獨立同分布i.i.d假設。然而實際中,源領域和目標領域往往存在領域偏移(domain shift),即會有分布外Out of Distribution(OOD)情景出現。領域泛化(Domain Generalization)旨在僅通過使用源領域數據進行模型學習來實現在不可見的目標領域的OOD泛化。

領域泛化的研究已經經歷了十年的發展,涵蓋了各種圖像應用,例如圖像識別,圖像分割等。然而對于視頻方面的應用,比如視頻動作識別,領域泛化卻鮮有涉及。本文致力于探究視頻領域泛化(video domain generalization)在動作識別問題中的應用,我們認為訓練更具泛化性的動作識別模型對解決視頻領域泛化問題至關重要。比如,不同的人執行相同的動作在不同的場景下,模型往往可能無法識別一個執行在新的環境的舊動作。

在本文中,我們首先發現以前模型之所以視頻領域泛化能力較差,是因為當泛化到目標領域時,目標時空數據同時存在著空域偏移(spatial domain shift)和時域偏移(temporal domain shift)。空域偏移是由于視頻幀的靜態特征的變化引起的,如圖4所示,相同人做的動作在不同的視角下靜態特征是完全不同的。以往的圖像域泛化方法可以部分解決這一問題,比如對抗性自適應數據增強方法ADA。不同于圖像之間只共享靜態物體特征,時空序列之間會共享同一類型的局部時空運動特征,時域偏移往往由于局部時空運動在未知目標領域的意外缺失或錯位而產生。如圖1所示,運球上籃與踢足球共享“跑步”這一局部運動。

我們的分析表明局部時空運動更具備遷移性,而能夠刻畫物體運動的整體趨勢的全局時空運動更具備判別性(見圖1)。克服時域偏移的關鍵是如何防止提取的局部時空運動特征在目標領域的錯誤泛化。本文提出首個旨在解決視頻OOD問題的泛化基礎架構VideoDG,核心思想是利用全局關系特征來指導局部運動的泛化,并動態地找到與全局關系特征高度相關的事件。VideoDG的核心貢獻主要是兩個方面:

VideoDG通過對抗性金字塔網絡(APN)在不同的時間尺度上校準局部時空運動關系和全局運動關系特征,利用全局時空運動防止局部時空泛化到錯誤的方向,兼顧了遷移性與判別性。 VideoDG引入了配套的魯棒時空金字塔對抗數據增強方法(RADA)訓練算法,使用局部時空運動生成對抗樣本來增強源領域并提高了APN對由關系特征衍生的不同時空對抗樣本的魯棒性。

圖1. 視頻領域泛化問題的求解依賴于局部時空運動關系的正確對齊,而局部時空運動關系可以被具有較長時間分辨性的全局時空運動關系所引導。

付費5元查看完整內容

摘要:

域泛化(DG),即分布外泛化,近年來引起了越來越多的關注。領域泛化處理一個具有挑戰性的設置,其中給出了一個或幾個不同但相關的領域,目標是學習一個可以泛化到看不見的測試領域的模型。近年來,取得了很大的進展。本文首次綜述了領域泛化的最新進展。首先,我們給出了領域泛化的形式化定義,并討論了幾個相關的領域。接下來,我們對領域泛化的相關理論進行了全面的回顧,并對泛化背后的理論進行了仔細的分析。然后,我們將最近出現的算法分為三類,分別是數據操作、表示學習和學習策略,每一類都包含了一些流行的算法。第三,介紹了常用的數據集及其應用。最后,對已有文獻進行了總結,并提出了未來的研究方向。

//www.zhuanzhi.ai/paper/5b8b8958327cabc8b6694d7fc5c7ac75

引言

機器學習(ML)在計算機視覺、自然語言處理和醫療保健等各個領域都取得了顯著的成功。ML的目標是設計一個可以從訓練數據中學習通用和預測性知識的模型,然后將該模型應用于新的(測試)數據。

傳統的ML模型訓練基于i.i.d.假設,訓練數據和測試數據是相同的,獨立分布的。然而,這種假設在現實中并不總是成立的。當訓練數據和測試數據的概率分布不同時,由于域分布的差異,ML模型的性能往往會下降。收集所有可能領域的數據來訓練ML模型是昂貴的,甚至是不可能的。因此,提高ML模型的泛化能力具有重要的工業和學術意義。

與廣義相關的研究課題有很多,如領域適應、元學習、遷移學習、協變量轉移等。近年來,領域泛化(DG)受到了廣泛的關注。如圖1所示,領域泛化的目標是從一個或幾個不同但相關的領域(即不同的訓練數據集)學習模型,這些領域將在看不見的測試領域上很好地泛化。

圖片

近年來,領域泛化在計算機視覺、自然語言處理等領域取得了長足的進展。除此之外,目前還沒有一項關于該領域的調查能夠全面介紹和總結其主要思想、學習算法等相關問題,為未來的研究提供見解。

本文首先介紹了領域泛化的研究概況,重點介紹了領域泛化的公式、理論、算法、數據集、應用以及未來的研究方向。希望本研究能為相關研究者提供一個全面的回顧,并對相關領域的研究有所啟發。

本文的結構組織如下。我們將在第2節中闡述領域概括并討論其與現有研究領域的關系。第3節介紹了領域泛化的相關理論。在第4節中,我們詳細描述了有代表性的DG方法。第5節介紹了應用程序,第6節介紹了DG的基準數據集。我們在第7節中總結了現有工作的見解,并提出了一些可能的未來方向。最后,在第8節對本文進行總結。

方法體系

領域泛化方法是我們的核心。本文將已有的領域泛化方法按照數據操作、表示學習、學習策略分為三大方面,如下圖所示。

數據操作,指的是通過對數據的增強和變化使訓練數據得到增強。這一類包括數據增強和數據生成兩大部分。

表示學習,指的是學習領域不變特征(Domain-invariant representation learning)以使得模型對不同領域都能進行很好地適配。領域不變特征學習方面主要包括四大部分:核方法、顯式特征對齊、領域對抗訓練、以及不變風險最小化(Invariant Risk Minimiation, IRM)。特征解耦與領域不變特征學習的目標一致、但學習方法不一致,我們將其單獨作為一大類進行介紹。 學習策略,指的是將機器學習中成熟的學習模式引入多領域訓練中使得模型泛化性更強。這一部分主要包括基于集成學習和元學習的方法。同時,我們還會介紹其他方法,例如自監督方法在領域泛化中的應用。

付費5元查看完整內容

雖然在許多領域產生并提供了大量的未標記數據,但獲取數據標簽的成本仍然很高。另一方面,用深度神經網絡解決問題已經變得非常流行,但目前的方法通常依賴大量的標記訓練數據來實現高性能。為了克服注釋的負擔,文獻中提出了利用來自同一領域的可用未標記數據的解決方案,稱為半監督學習;利用相似但又不同領域的已有標記的數據或訓練過的模型,稱為領域自適應。本教程的重點將是后者。領域自適應在社會上也越來越重要,因為視覺系統部署在任務關鍵應用中,其預測具有現實影響,但現實世界的測試數據統計可以顯著不同于實驗室收集的訓練數據。我們的目標是概述視覺領域適應方法,這一領域在計算機視覺領域的受歡迎程度在過去幾年中顯著增加,這可以從過去幾年在頂級計算機視覺和機器學習會議上發表的大量的相關論文中得到證明。

//europe.naverlabs.com/eccv-2020-domain-adaptation-tutorial/

付費5元查看完整內容

雖然在許多領域產生并提供了大量的未標記數據,但獲取數據標簽的成本仍然很高。另一方面,用深度神經網絡解決問題已經變得非常流行,但目前的方法通常依賴大量的標記訓練數據來實現高性能。為了克服注釋的負擔,文獻中提出了利用來自同一領域的可用未標記數據的解決方案,稱為半監督學習;利用相似但又不同領域的已有標記的數據或訓練過的模型,稱為領域自適應。本教程的重點將是后者。領域自適應在社會上也越來越重要,因為視覺系統部署在任務關鍵應用中,其預測具有現實影響,但現實世界的測試數據統計可以顯著不同于實驗室收集的訓練數據。我們的目標是概述視覺領域適應方法,這一領域在計算機視覺領域的受歡迎程度在過去幾年中顯著增加,這可以從過去幾年在頂級計算機視覺和機器學習會議上發表的大量的相關論文中得到證明。

//europe.naverlabs.com/eccv-2020-domain-adaptation-tutorial/

付費5元查看完整內容
北京阿比特科技有限公司