亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

學習視覺相似度對于各種視覺任務至關重要,如圖像聚類、人臉檢測或圖像檢索,從而為日常應用奠定基礎,如智能手機上的圖像集合的智能排列、瀏覽器中的網絡規模的圖像搜索或在線購物時推薦產品。今天,學習捕捉相似度的視覺表示的主要方法是深度度量學習,它專門針對從新穎的、看不見的類中檢索對象和圖像。此外,相似性學習與對比學習密切相關,對比學習是自監督學習的主導方法,分別是遷移學習。

在本教程中,我們將深入介紹深度度量學習(DML)的領先學習范式,以及如何實際評估其(超出分布)泛化的未來方向。具體來說,本教程將涵蓋以下主題: (i) DML目標函數的概況,(ii)先進的和上下文相關的DML公式,(iii) DML中數據采樣的重要性,(iv)公平和現實地評估DML方法的最佳實踐,最后,(v)我們將DML與計算機視覺和模式識別的相關領域聯系起來,如對比學習,少樣本學習,遷移學習和人臉識別。

付費5元查看完整內容

相關內容

開發智能和自主學習代理的關鍵挑戰之一是它們與人類有效互動的能力。在本教程中,我們計劃涵蓋交互式代理的理論和實踐基礎。具體而言,在本教程的第一部分中,我們將側重于單獨的人類行為模型,如何使用這些模型進行有效的協調,以及如何優化它們以影響伙伴。在本教程的第二部分,我們將繼續介紹共同適應的環境,在這種環境中,人類的偏好是不穩定的,他們會適應,我們將討論這如何導致新的規范、慣例和平衡的出現。最后,我們將介紹一些方法來推斷人類伴侶的偏好,這些方法使用交互式領域中呈現的一系列離線和在線數據源。在本教程中,我們還將討論自動駕駛、混合自主交通網絡、個人機器人和多智能體游戲中的應用實例。

//icml.cc/Conferences/2022/Schedule?showEvent=18436

付費5元查看完整內容

人類通過多種渠道感知世界,如眼睛看到的圖像或耳朵聽到的聲音。盡管任何一個單獨的通道可能是不完整的或有噪聲的,但人類可以自然地將從多個通道收集的信息進行排列和融合,以便掌握更好地理解世界所需的關鍵概念。人工智能的核心愿望之一是開發算法,使計算機具有從多模態(或多通道)數據中有效學習的能力。這些數據類似于通過視覺和語言獲得的視覺和聲音,幫助人類理解周圍的世界。例如,計算機可以通過搜索最相似的圖像來進行文本查詢(反之亦然),并通過使用自然語言描述圖像的內容來模擬這種能力。

視覺與語言(VL),一個位于計算機視覺和自然語言處理(NLP)之間的熱門研究領域,旨在實現這一目標。視覺與語言預訓練(vision and language pre-training, VLP)受到語言模型預訓練在NLP中的巨大成功的啟發,近年來迅速引起了兩方面的關注。在本教程中,我們將涵蓋VLP前沿的最新方法和原則,包括(1) 基于區域特征和端到端圖像文本訓練前;(2) 統一的視覺語言建模;(3) 延伸到視頻語言預訓練; (4) 從語言監督中學習視覺模型;(5) 視覺合成。

//dvsml2022-tutorial.github.io/index.html/

付費5元查看完整內容

CVPR 2022 線下會議將于 2022 年 6 月 21 日-24 日在美國新奧爾良舉行。而今年投稿量創新高超過了一萬,其中 2067 篇論文被接收。各位學者帶來了一系列教程。來自卡內基梅隆大學研究學者講述了《多模態機器學習》教程,200+頁ppt值得關注。

多模態機器學習是一個充滿活力的多學科研究領域,通過設計計算機agent來實現人工智能的一些原始目標,這些計算機agent能夠通過集成和建模多種通信模態(包括語言、聲學和視覺信息)來展示智能能力,如理解、推理和規劃。隨著視聽語音識別的初步研究,以及最近的語言和視覺項目,如圖像和視頻字幕、視覺問題回答和語言引導強化學習,該研究領域給多模態研究人員帶來了一些獨特的挑戰,因為數據的異質性和通常發現的模態之間的偶然性。

本教程建立在卡內基梅隆大學教授的多模態機器學習年度課程的基礎上,是CVPR、ACL和ICMI會議上多模態學習以前教程的一個完全修訂版本。本教程基于多模態機器學習中存在的核心技術挑戰的修訂分類,圍繞這六個核心挑戰: 表示、對齊、推理、遷移、生成和量化。最近的技術成果將通過這種多模態核心挑戰的分類法來展示,使研究人員能夠理解方法和新模型之間的相似性和差異性。本教程還旨在對多模態機器學習的未來研究方向提供一個視角。

//cmu-multicomp-lab.github.io/mmml-tutorial/cvpr2022/

講者:

目錄內容:

1. 介紹

  • 什么是多模態?定義,異質性的維度和跨模態的相互作用。
  • 歷史觀與多模態研究任務。
  • 核心技術挑戰: 表示、對齊、轉移、推理、生成和量化。
  • 單模態語言、視覺和聽覺表征。

2. 表示

  • 表示融合: 融合策略,多模態自編碼器。
  • 表示協調: 對比學習,向量空間模型,典型相關分析。
  • 表象裂變: 因式分解、成分分析、解纏。

3. 對齊

  • 粒度: 分割、聚類、單元定義。
  • 對應: 潛在對齊方法,注意力模型,多模態transformers。
  • 依存類型: 圖神經網絡,多實例學習。

4. 推理

  • 結構: 層次結構、圖形結構、時序結構和交互結構、結構發現。
  • 概念: 密集和神經象征。
  • 構成: 因果關系和邏輯關系。
  • 知識: 外部知識基礎,常識推理。

5. 生成

  • 總結、翻譯、創作。
  • 模型評估和倫理問題。

6. 遷移

  • 模態轉移: 損失,幻覺,跨模態轉移。
  • 基礎模型:預訓練模型和適應。
  • 模型歸納:協同訓練,跨模式學習。

7. 量化

輸出質量:泛化、魯棒性、復雜性。 內部機制:可解釋性,理解跨模型交互。 模態權衡: 數據集偏差、社會偏差、理論收益、優化挑戰。

付費5元查看完整內容

要實現人工智能的夢想,就需要學會做出正確決策的自主系統。強化學習是這樣做的一個強大范式,它與大量的任務相關,包括機器人、游戲、消費者建模和醫療保健。本課程將提供強化學習領域的充實介紹,學生將學習強化學習的核心挑戰和方法,包括推廣和探索。通過講課、書面作業和編碼作業的結合,學生將學習RL的關鍵思想和技術。作業將包括強化學習的基礎知識以及深度強化學習——一個結合了深度學習技術和強化學習的極具前景的新領域。

學生能夠學習到:

  • 定義強化學習與人工智能和非交互式機器學習的區別的關鍵特征。
  • 給定一個應用問題(例如,計算機視覺,機器人等),決定它是否應該被表述為RL問題;如果是,可以正式定義它(根據狀態空間,行動空間,動態和獎勵模型),說明什么算法(從類)是最適合解決它,并證明你的答案。
  • 在代碼中實現通用的RL算法。
  • 描述(列出和定義)分析RL算法的多種標準,并根據這些指標評估算法:例如遺憾度、樣本復雜度、計算復雜度、經驗性能、收斂性等。
  • 描述探索與開發的挑戰,并對至少兩種解決這一挑戰的方法進行比較和對比(從性能、可伸縮性、實現的復雜性和理論保證方面)。

內容目錄:
1 Introduction to Reinforcement Learning

2 Tabular MDP planning

3 Tabular RL policy evaluation

4 Q-learning

5 RL with function approximation

6 Policy search

7 Fast Learning

8 Batch Reinforcement Learning

付費5元查看完整內容

雖然在許多領域產生并提供了大量的未標記數據,但獲取數據標簽的成本仍然很高。另一方面,用深度神經網絡解決問題已經變得非常流行,但目前的方法通常依賴大量的標記訓練數據來實現高性能。為了克服注釋的負擔,文獻中提出了利用來自同一領域的可用未標記數據的解決方案,稱為半監督學習;利用相似但又不同領域的已有標記的數據或訓練過的模型,稱為領域自適應。本教程的重點將是后者。領域自適應在社會上也越來越重要,因為視覺系統部署在任務關鍵應用中,其預測具有現實影響,但現實世界的測試數據統計可以顯著不同于實驗室收集的訓練數據。我們的目標是概述視覺領域適應方法,這一領域在計算機視覺領域的受歡迎程度在過去幾年中顯著增加,這可以從過去幾年在頂級計算機視覺和機器學習會議上發表的大量的相關論文中得到證明。

//europe.naverlabs.com/eccv-2020-domain-adaptation-tutorial/

付費5元查看完整內容

雖然在許多領域產生并提供了大量的未標記數據,但獲取數據標簽的成本仍然很高。另一方面,用深度神經網絡解決問題已經變得非常流行,但目前的方法通常依賴大量的標記訓練數據來實現高性能。為了克服注釋的負擔,文獻中提出了利用來自同一領域的可用未標記數據的解決方案,稱為半監督學習;利用相似但又不同領域的已有標記的數據或訓練過的模型,稱為領域自適應。本教程的重點將是后者。領域自適應在社會上也越來越重要,因為視覺系統部署在任務關鍵應用中,其預測具有現實影響,但現實世界的測試數據統計可以顯著不同于實驗室收集的訓練數據。我們的目標是概述視覺領域適應方法,這一領域在計算機視覺領域的受歡迎程度在過去幾年中顯著增加,這可以從過去幾年在頂級計算機視覺和機器學習會議上發表的大量的相關論文中得到證明。

//europe.naverlabs.com/eccv-2020-domain-adaptation-tutorial/

付費5元查看完整內容

第14屆推薦系統頂級會議ACM RecSys在9月22日到26日在線舉行。來自意大利Polytechnic University of Turin做了關于對抗推薦系統的教程《Adversarial Learning for Recommendation: Applications for Security and Generative Tasks – Concept to Code》,186頁ppt,干貨內容,值得關注。

//recsys.acm.org/recsys20/tutorials/#content-tab-1-3-tab

對抗式機器學習(AML)是從識別計算機視覺任務中的漏洞(如圖像分類)開始,研究現代機器學習(ML)推薦系統中的安全問題的研究領域。

在本教程中,我們將全面概述AML技術在雙重分類中的應用:(i)用于攻擊/防御目的的AML,以及(ii)用于構建基于GAN的推薦模型的AML。此外,我們將把RS中的AML表示與兩個實際操作會話(分別針對前面的分類)集成在一起,以顯示AML應用程序的有效性,并在許多推薦任務中推進新的想法和進展。

本教程分為四個部分。首先,我們總結了目前最先進的推薦模型,包括深度學習模型,并定義了AML的基本原理。在此基礎上,我們提出了針對RSs的攻擊/防御策略的對抗性推薦框架和基于GAN實踐環節。最后,我們總結了這兩種應用的開放挑戰和可能的未來工作。

付費5元查看完整內容

本文推薦來自Emanuele Rodolà博士講述《幾何深度學習》,100頁ppt系統性講述了幾何深度學習基礎知識和最新進展,非常干貨。 //lcsl.mit.edu/courses/regml/regml2020/

幾何深度學習

過去十年在計算機視覺研究已經見證了“深度學習”的重新崛起,特別是卷積神經網絡(CNN)技術, 它允許從大量的樣例中學習強大的圖像特征表示。CNNs在圖像分類、分割、檢測和標注等廣泛的應用中取得了性能上的突破。然而,當試圖將CNN范式應用于三維形狀、點云和圖形(基于特征的描述、相似度、對應、檢索等)時,必須面對圖像與幾何對象之間的根本差異。形狀分析、圖形分析和幾何處理帶來了圖像分析中不存在的新挑戰,而深度學習方法直到最近才開始滲透到這些領域。本教程的目的是概述非歐幾里得數據學習技術的基礎和目前的技術現狀。本教程將特別關注應用于歐氏和非歐氏流形的深度學習技術(CNN),以完成形狀分類、檢索和對應的任務。本教程將從新的角度介紹3D計算機視覺和幾何數據處理的問題,強調與傳統2D設置的類比和區別,并展示如何適應流行的學習方案,以處理非歐幾里得結構。

付費5元查看完整內容

盡管在深度學習方面取得了最近的進展,但大多數方法仍然采用類似“筒倉”的解決方案,專注于孤立地學習每個任務:為每個單獨的任務訓練一個單獨的神經網絡。然而,許多現實問題需要多模態方法,因此需要多任務模型。多任務學習(MTL)旨在利用跨任務的有用信息來提高模型的泛化能力。在這個綜述中,我們提供了一個最先進的在深度神經網絡的背景下MTL技術的全面觀點。我們的貢獻涉及以下方面。首先,我們從網絡架構的角度來考慮MTL。我們包括了一個廣泛的概述,并討論了最近流行的MTL模型的優缺點。其次,我們研究了解決多任務聯合學習的各種優化方法。我們總結了這些工作的定性要素,并探討了它們的共性和差異。最后,我們在各種數據集上提供了廣泛的實驗評估,以檢查不同方法的優缺點,包括基于架構和優化的策略。

//arxiv.org/abs/2004.13379

概述

在過去的十年中,神經網絡在許多任務中都顯示了令人印象深刻的結果,例如語義分割[1],實例分割[2]和單目深度估計[3]。傳統上,這些任務是單獨處理的,即為每個任務訓練一個單獨的神經網絡。然而,許多現實世界的問題本質上是多模態的。例如,一輛自動駕駛汽車應該能夠檢測場景中的所有物體,定位它們,了解它們是什么,估計它們的距離和軌跡,等等,以便在它的周圍安全導航。同樣的,一個智能廣告系統應該能夠在它的視點上檢測到人們的存在,了解他們的性別和年齡,分析他們的外貌,跟蹤他們正在看的地方,等等,從而提供個性化的內容。與此同時,人類非常擅長同時解決許多任務。生物數據處理似乎也遵循多任務處理策略: 不同的處理過程似乎共享大腦中相同的早期處理層,而不是將任務分開單獨處理。上述觀察結果促使研究人員開發了多任務學習(MTL)模型,即給定一個輸入圖像可以推斷出所有所需的任務輸出。

在深度學習時代之前,MTL工作試圖對任務之間的共同信息進行建模,希望通過聯合任務學習獲得更好的泛化性能。為了實現這一點,他們在任務參數空間上放置了假設,例如:任務參數應該彼此靠近w.r.t.一些距離度量[5],[6],[16]0,[16]2,共享一個共同的概率先驗[16]1,[10],[11],[12],[13],或駐留在一個低維子空間[14],[15],[16]或流形[17]。當所有任務都是相關的[5]、[14]、[18]、[19]時,這些假設可以很好地工作,但是如果在不相關的任務之間發生信息共享,則可能導致性能下降。后者是MTL中已知的問題,稱為負轉移。為了緩解這一問題,其中一些研究人員選擇根據先前對任務的相似性或相關性的認識將任務分組。

在深度學習時代,MTL轉化為能夠從多任務監控信號中學習共享表示的網絡設計。與單任務情況下,每個單獨的任務由自己的網絡單獨解決相比,這種多任務網絡理論上給表帶來了幾個優點。首先,由于它們固有的層共享,結果內存占用大大減少。其次,由于他們明確地避免重復計算共享層中的特征,每次都要計算一次,因此他們的推理速度有所提高。最重要的是,如果相關的任務能夠分享互補的信息,或者互相調節,它們就有可能提高績效。對于前者,文獻已經為某些對任務提供了證據,如檢測和分類[20],[21],檢測和分割[2],[22],分割和深度估計[23],[24],而對于后者,最近的努力指向了那個方向[25]。這些工作導致了第一個深度多任務網絡的發展,歷史上分為軟或硬參數共享技術。

在本文中,我們回顧了在深度神經網絡范圍內的MTL的最新方法。首先,我們對MTL基于架構和優化的策略進行了廣泛的概述。對于每種方法,我們描述了其關鍵方面,討論了與相關工作的共性和差異,并提出了可能的優點或缺點。最后,我們對所描述的方法進行了廣泛的實驗分析,得出了幾個關鍵的發現。我們在下面總結了我們的一些結論,并提出了未來工作的一些可能性。

  • 首先,MTL的性能在很大程度上取決于任務字典。它的大小、任務類型、標簽源等等,都影響最終的結果。因此,最好根據每個案例選擇合適的架構和優化策略。盡管我們提供了具體的觀察結果,說明為什么某些方法在特定設置中工作得更好,但是MTL通常可以從更深的理論理解中獲益,從而在每種情況下最大化預期收益。例如,這些收益似乎取決于多種因素,例如數據量、任務關系、噪音等。未來的工作應該嘗試分離和分析這些不同因素的影響。

  • 其次,當使用單一MTL模型處理多個密集預測任務時,基于解碼器的架構目前在多任務性能方面提供了更多優勢,與基于編碼器的架構相比,其計算開銷有限。如前所述,這是由于基于解碼器的體系結構促進了常見的跨任務模式的對齊,這自然很適合密集的預測任務。基于編碼器的架構在密集預測任務設置中仍然具有一定的優勢,但其固有的層共享似乎更適合處理多個分類任務。

  • 最后,我們分析了多種任務均衡策略,并分離出對任務均衡學習最有效的要素,如降低噪聲任務的權重、平衡任務梯度等。然而,許多優化方面仍然缺乏了解。與最近的研究相反,我們的分析表明避免任務之間的梯度競爭會損害性能。此外,我們的研究顯示,一些任務平衡策略仍然存在不足,突出了現有方法之間的一些差異。我們希望這項工作能促進對這一問題的進一步研究。

付費5元查看完整內容
北京阿比特科技有限公司