CVPR 2022 線下會議將于 2022 年 6 月 21 日-24 日在美國新奧爾良舉行。而今年投稿量創新高超過了一萬,其中 2067 篇論文被接收。相關一系列教程從19號就開始了。來自ETH研究學者講述了《仿射變換》教程,介紹了**本教程的主要目的是介紹仿射對應(AC)在計算機視覺中的理論和應用,**200+頁ppt值得關注。
本教程的主要目的是介紹仿射對應(AC)在計算機視覺中的理論和應用。本教程將展示在單視圖和雙視圖問題中利用仿射特征的最新進展,包括圖像校正,單應性和極線幾何估計。此外,我們將討論傳統的和最新的基于深度學習的算法,用于檢測、匹配,并在現實世界的圖像中魯棒地使用這些特征。
講者
近年來,人們對計算機視覺中的具身人工智能研究越來越感興趣。在研究界已經舉辦了多個嵌入式AI研討會和挑戰,包括ICLR 2022年物理世界的廣義策略學習、IROS 2020年的OCRTOC:開放云機器人表組織挑戰、CVPR 2019年的棲息地:嵌入式agent挑戰和研討會,以及CVPR 2020年和2021年的嵌入式AI研討會。計算機視覺現在是具身人工智能研究的一個重要模塊,但我們仍然缺少一個基本的教程來指導研究人員,尤其是那些有視覺和機器學習背景的研究人員,開始在這個領域。
特別是,在物理模擬和渲染技術的最新進展的推動下,虛擬環境中的具身AI已經取得了許多令人印象深刻的進展。這些平臺使得許多視覺機器人問題的研究成為可能,而這些問題在現實世界中是無法進行大規模研究的。更快的速度、更容易的并行化、更簡單的數據收集和更低的成本的本質允許模擬中的嵌入式AI研究建立更大的社區,具有不同的研究人員背景、改進的代碼共享和標準基準。但是,虛擬環境也有其自身的問題,例如模擬參數和域間隙,在構建和使用它們時值得注意。
我們的教程旨在為計算機視覺研究人員提供入門指南,以研究環境中具身代理的視覺問題,以及突出使用這些環境時遇到的常見問題。本教程將側重于跨平臺共享的原則,并教授使用多個模擬環境的概念。
//ai-workshops.github.io/building-and-working-in-environments-for-embodied-ai-cvpr-2022/
人類通過多種渠道感知世界,如眼睛看到的圖像或耳朵聽到的聲音。盡管任何一個單獨的通道可能是不完整的或有噪聲的,但人類可以自然地將從多個通道收集的信息進行排列和融合,以便掌握更好地理解世界所需的關鍵概念。人工智能的核心愿望之一是開發算法,使計算機具有從多模態(或多通道)數據中有效學習的能力。這些數據類似于通過視覺和語言獲得的視覺和聲音,幫助人類理解周圍的世界。例如,計算機可以通過搜索最相似的圖像來進行文本查詢(反之亦然),并通過使用自然語言描述圖像的內容來模擬這種能力。
視覺與語言(VL),一個位于計算機視覺和自然語言處理(NLP)之間的熱門研究領域,旨在實現這一目標。視覺與語言預訓練(vision and language pre-training, VLP)受到語言模型預訓練在NLP中的巨大成功的啟發,近年來迅速引起了兩方面的關注。在本教程中,我們將涵蓋VLP前沿的最新方法和原則,包括(1) 基于區域特征和端到端圖像文本訓練前;(2) 統一的視覺語言建模;(3) 延伸到視頻語言預訓練; (4) 從語言監督中學習視覺模型;(5) 視覺合成。
//dvsml2022-tutorial.github.io/index.html/
學習視覺相似度對于各種視覺任務至關重要,如圖像聚類、人臉檢測或圖像檢索,從而為日常應用奠定基礎,如智能手機上的圖像集合的智能排列、瀏覽器中的網絡規模的圖像搜索或在線購物時推薦產品。今天,學習捕捉相似度的視覺表示的主要方法是深度度量學習,它專門針對從新穎的、看不見的類中檢索對象和圖像。此外,相似性學習與對比學習密切相關,對比學習是自監督學習的主導方法,分別是遷移學習。
在本教程中,我們將深入介紹深度度量學習(DML)的領先學習范式,以及如何實際評估其(超出分布)泛化的未來方向。具體來說,本教程將涵蓋以下主題: (i) DML目標函數的概況,(ii)先進的和上下文相關的DML公式,(iii) DML中數據采樣的重要性,(iv)公平和現實地評估DML方法的最佳實踐,最后,(v)我們將DML與計算機視覺和模式識別的相關領域聯系起來,如對比學習,少樣本學習,遷移學習和人臉識別。
通過大氣湍流成像是計算機攝影、圖像處理和計算機視覺領域發展最快的課題之一。在這個領域做研究的挑戰是光學初學者很難管理的陡峭的學習曲線。本教程的目的是介紹通過湍流成像的核心思想,專門針對那些在計算機視覺和信號處理方面有一些經驗的人。我們不希望參與者有任何光學方面的先驗知識。本教程可以分成幾個關鍵部分: 介紹傅里葉光學的一些基本概念;討論對湍流造成統計失真的基本而有效的描述;提出在成像系統中模擬這類畸變的兩種方法;為重建的目的考慮這些想法。我們鼓勵與會者帶上他們的筆記本電腦,因為我們的許多目標都得到了Python演示的支持,與會者可以使用這些演示。離開本教程,我們預計與會者有一個圖像形成過程的感覺,一些有用的概念,為設計重建方法的目的,和一個合適的基礎。
本教程涵蓋了大規模的視覺定位任務,其目標是僅基于視覺信息對單個圖像進行定位。該教程包括不同粒度級別的定位方法,從簡單的命名位置識別和GPS估計到6D相機姿態的精確估計。教程的范圍涵蓋了不同的空間/地理擴展,例如小型室內/室外場景,城市級別,世界級別,以及變化條件下的本地化。
在粗定位機制中,任務通常通過檢索方法處理,這在本教程的第一部分中有所介紹。一個典型的用例如下:給定一個帶有地理標記的圖像數據庫,目標是確定新查詢圖像中描述的位置。傳統上,這個問題是通過將最相似的數據庫圖像的地理標記轉移到查詢圖像來解決的。本部分主要關注用于檢索的可視化表示模型,其中包括經典的基于特征的方法和最近的深度學習方法。本教程的第二部分和第三部分分別介紹了基于特征和深度學習的精確定位方法。這些算法的一個典型用例是估計(6自由度)構成完整的6自由度的查詢圖像,即圖像拍攝的位置和姿態,對于某些應用,如機器人、自動車輛自動駕駛汽車,增強/混合/虛擬現實,環路閉合檢測在大滿貫,和Structure-from-Motion。
本教程涵蓋了視覺定位的最新技術,有三個目標:1) 全面概述當前的最新技術。本課程面向剛開始學習或對該主題感興趣的一、二年級博士生和工業工程師。2) 讓專家教授更多有經驗的博士生和工程師,他們想要完善自己的視覺定位知識。3) 突出當前的公開挑戰。這概述了當前算法能做和不能做的事情。在本教程中,我們提供了有關所討論方法的公開源代碼的鏈接。我們還將強調用于實驗評估的數據集的不同屬性。
國際計算機視覺與模式識別會議(CVPR)是由IEEE主辦的計算機視覺、模式識別及人工智能等領域最具影響力和最重要的國際頂級會議,是中國計算機學會(CCF)推薦的 A類國際會議,谷歌正式發布了2020年的學術指標(Scholar Metrics)榜單,在最新一期排名中,CVPR成為了AI 領域排名第一的大會。CVPR每年都吸引全球眾多頂尖科研工作者投稿,其錄用論文指引著計算機視覺和模式識別領域未來的研究方向。CVPR官網顯示,本次會議共收到有效投稿7015篇,最終錄用1663篇,錄用率為23.7%。本屆會議在6月19到25日舉行。
//interpretablevision.github.io
近年來,深度卷積神經網絡和遞歸神經網絡等復雜機器學習模型在物體/場景識別、圖像描述、視覺問答等計算機視覺應用領域取得了很大的進展。但它們通常被視為黑匣子。隨著模型在尋找更好的識別精度方面的深入,理解模型給出的預測以及原因變得更加困難。
本系列教程旨在介紹計算機視覺模型的可解釋性和可解釋性的主題。我們將回顧我們在計算機視覺中分析數據和模型的可視化、解釋(interpretation)和解釋方法方面所取得的最新進展。本教程的主要主題是通過闡明機器學習可解釋性的動機、典型方法、未來趨勢和潛在的工業應用,建立對機器學習可解釋性這一新興話題的共識。
目錄內容:
Lecture 1 by Wojciech Samek: XXAI: eXtending XAI towards Actionable Interpretability video, slide, bili
Lecture 2 by Cynthia Rudin: Interpretable Neural Networks for Computer Vision: Clinical Decisions that are Computer-Aided, not Automated video, slide
Lecture 3 by Ari Morcos: Towards Falsifiable Interpretability Research video, slide, bili
Lecture 4 by Bolei Zhou: Interpreting Deep Generative Models for Interactive AI Content Creation video, slide, bili
雖然在許多領域產生并提供了大量的未標記數據,但獲取數據標簽的成本仍然很高。另一方面,用深度神經網絡解決問題已經變得非常流行,但目前的方法通常依賴大量的標記訓練數據來實現高性能。為了克服注釋的負擔,文獻中提出了利用來自同一領域的可用未標記數據的解決方案,稱為半監督學習;利用相似但又不同領域的已有標記的數據或訓練過的模型,稱為領域自適應。本教程的重點將是后者。領域自適應在社會上也越來越重要,因為視覺系統部署在任務關鍵應用中,其預測具有現實影響,但現實世界的測試數據統計可以顯著不同于實驗室收集的訓練數據。我們的目標是概述視覺領域適應方法,這一領域在計算機視覺領域的受歡迎程度在過去幾年中顯著增加,這可以從過去幾年在頂級計算機視覺和機器學習會議上發表的大量的相關論文中得到證明。
//europe.naverlabs.com/eccv-2020-domain-adaptation-tutorial/
一份來自FarizDarari的簡明教程