計算機視覺(Computer Vision)是一門多學科科學,致力于讓機器具備“看”的能力。 這個問題是很具有挑戰性的,因為我們從現實的視覺世界中觀察到了巨大的復雜性和外觀的變化。迄今為止,機器學習技術提供了最有有效的方法來設計具有人類圖像理解能力的系統。今天為大家再來了劍橋大學Alex Kendall的博士論文-計算機視覺深度學習中的幾何結構與不確定性。
針對一些核心計算機視覺問題,包括語義分割,實例分割,深度預測,定位,立體視覺和視頻場景理解等等問題,論文中的介紹了一些端到端深度學習架構。這些的框架優于傳統方法,并在許多具有挑戰性的計算機視覺問題上具有很不錯的效果。
近年來,深度學習在更高層級的視覺任務中取得矚目的成績,如:物體識別,語義分割等。這些課題曾是傳統視覺無法或很難解決的任務。深度學習方法的這種能力拓展了我們對視覺任務的想象空間,越來越多的 SLAM 開始在他們的框架中通過融合學習的方法來改進位姿估計的準確程度和環境重建的效果。但是深度學習是一個非常寬廣的領域,和 SLAM 相關的課題只是它的一個分支,本書稿將會挑選、聚焦與 SLAM 相關的深度學習任務,希望能通過這本書稿來介紹SLAM 系統中使用的幾何和深度學習的方法,幫助讀者掌握最新的進展。
最近計算機視覺三大頂會之一CVPR2020接收結果已經公布,一共有1470篇論文被接收,接收率為22%,相比去年降低3個百分點,競爭越來越激烈。專知在這里整理來自Twitter、arXiv、知乎放出來的30篇最新CVPR論文,方便大家搶先閱覽!這些論文包括視覺常識、?視頻超分處理、圖像分類、目標跟蹤等。