NeurIPS 接收論文中,29% 的作者有中國大學的本科學位,但他們在畢業后有 54% 會去美國攻讀研究生博士,這其中又有 90% 選擇留美工作。劍橋大學的 2020 版《AI 全景報告》寫出了 AI 領域哪些值得關注的新觀察?
人工智能是基礎科學與工程實踐結合的技術領域,近年來已經融合了越來越多的其他方向。在數字化逐漸成型的今天,AI 將為技術進步產生推動作用。
近日,劍橋大學的 2020 版《AI 全景報告》終于出爐,這是該年度報告的第三期。和往年一樣,該報告援引的數據來自知名科技公司和研究小組。新版 AI 全景報告以幾個方面分別介紹了人工智能領域最近一段時間的發展趨勢:研究、人才、業界、政策和未來展望。
該調查的兩位主要作者 Nathan Benaich 與 Ian Hogarth 均來自劍橋大學。
今日,ECCV 2020五項大獎出爐,分別是最佳論文獎、最佳論文提名獎、Koenderink獎、Mark Everingham獎、Demo獎。 在每年大獎中都最受期待的最佳論文獎這一次來到了李飛飛的三代門下! ECCV的全稱是European Conference on Computer Vision(歐洲計算機視覺國際會議) ,兩年一次,與ICCV和CVPR并稱計算機視覺三大會議。 以下我們對各個大獎一一作介紹。
1 最佳論文獎
獲獎論文:《RAFT:Recurrent All-Pairs Field Transforms for Optical Flow 》 論文作者為Zachary Teed和鄧嘉,他們實為師徒二人,而鄧嘉正是李飛飛的徒弟。
Zachary Teed,普林斯頓大學鄧嘉門下的一名博士生,是普林斯頓視覺與學習實驗室的一名成員。Zachary Teed目前的研究重點是從視頻進行3D重建;包括運動,場景流和SLAM中的結構。在此之前,他曾獲得圣路易斯華盛頓大學的計算機科學學士學位,并在那里獲得了Langsdorf 獎學金和 McKevely研究獎。
Zachary Teed個人主頁://zachteed.github.io/。
鄧嘉,2006年本科畢業于清華大學計算機系,隨后赴美國普林斯頓大學師從 Kai Li(李凱,普林斯頓大學教授,美國工程院院士)攻讀博士學位。2007 年,當時李飛飛回到他的母校普林斯頓大學任職后便開始啟動 ImageNet 項目,李凱教授作為支撐,將鄧嘉介紹到李飛飛的實驗組中。2012 年于普林斯頓大學獲計算機科學博士學位。 2014 起任密歇根大學計算機科學系助理教授。2018年鄧嘉在密歇根大學的時候獲得了美國斯隆研究獎。鄧嘉現在在普林斯頓大學視覺與學習實驗室任助理教授,主要研究方向為計算機視覺和機器學習,即通過感知、認知和學習相結合來實現人類層面的視覺理解。 而鄧嘉本人其實還有個更為出名的稱號,那就是ImageNet的第一作者:
鄧嘉是李飛飛的弟子,Zachary Teed則稱得上是李飛飛的徒孫,這一次他們憑借在ImageNet之外的光流估計領域做出的不平凡研究獲獎也是實至名歸。以下是具體論文。
論文鏈接: 代碼鏈接: 論文摘要: 我們介紹了一種新的光流深度網絡架構——遞歸全對場變換(RAFT)。RAFT提取每個像素特征,為所有像素對構建多尺度4D相關體,并通過一個循環單元迭代更新流場,該單元執行相關體積的查找。 RAFT達到了SOTA的性能。在KITTI上,RAFT的F1-all誤差為5.10%,比已知的最佳結果(6.10%)減少了16%。 在Sintel上,RAFT獲得的end-point-誤差為2.855像素,比已知最佳結果(4.098像素)減少了30%。此外,RAFT算法具有較強的跨數據集泛化能力,在推理時間、訓練速度、參數計數等方面具有較高的效率。
2 最佳論文提名獎 今年有兩篇論文獲得了最佳論文提名獎:
最佳論文提名一:《Towards Streaming Image Understanding》
論文鏈接:
論文摘要: 實體感知是指一個自主的主體感知其所處環境從而能夠(重新)行動的能力。智能體的響應很大程度上取決于其處理pipeline的延遲。雖然過去的工作已經研究了算法在延遲和準確度之間的權衡,但是還沒有一個明確的指標來比較不同的方法沿著帕累托最優的延遲精度曲線。 我們指出了標準離線評估和實時應用程序之間的一個差異:當一個算法完成對特定圖像幀的處理時,周圍的世界已經發生了變化。為了達到這些目的,我們提出了一種方法,將延遲和準確度統一到一個用于實時在線感知的指標中,我們稱之為流式準確性(streaming accuracy)。 此指標背后的關鍵洞察是在每個時刻聯合評估整個感知堆棧的輸出,迫使堆棧考慮在進行計算時應忽略的流數據。更廣泛地說,基于這個指標,我們引入了一個元基準,它系統地將任何圖像理解任務轉換為流圖像理解任務。針對城市視頻流中的目標檢測和實例分割,提出了一種具有高質量和時間密集標注的數據集。我們提出的解決方案及其實證分析證明了許多令人驚訝的結論: (1) 在帕累托最佳延遲精度曲線上,存在一個最優點,最大限度地提高流媒體的準確性; (2) 異步跟蹤和未來預測自然而然地成為支持流式圖像理解的內部表示形式; (3)動態調度可用于克服時間混疊,產生一個矛盾的結果,即有時通過閑置和“無所事事”來最小化延遲。 最佳論文提名獎二: 《NeRF:Representing Scenes as Neural Randince Fields for View Synthesis》
論文鏈接:
論文摘要: 我們提出了一種通過使用稀疏輸入視圖集優化底層連續體積場景函數來獲得合成復雜場景新視圖的方法,這種方法取得了SOTA結果。
我們的算法使用一個全連接(非卷積)的深度網絡來表示場景,其輸入是一個單連續的5D坐標(空間位置(x,y,z)和觀察方向(θ,φ)),其輸出是該空間位置的體積密度和視景相關的發射輻射。我們通過查詢沿相機光線的5D坐標來合成視圖,并使用經典的體積繪制技術將輸出的顏色和密度投影到圖像中。因為體積繪制是自然可微的,所以優化表征的唯一輸入是一組已知相機姿態的圖像。我們描述了如何有效地優化神經輻射場,以渲染具有復雜幾何和外觀的真實感場景的新視圖,并展示了優于先前神經渲染和視圖合成的結果。視圖合成結果最好以視頻形式查看,因此我們敦促讀者觀看我們的補充視頻,以便進行令人信服的比較。