題目: 基于深度學習的行人重識別研究進展
摘要:
行人重識別是計算機視覺領域近年來非常熱的一個研究課題, 可以被視為圖像檢索的一個子問題, 其目標是給定一個監控行人圖像檢索跨設備下的該行人圖像. 傳統的方法依賴手工特征, 不能適應數據量很大的復雜環境。近年來隨著深度學習的發展, 大量基于深度學習的行人重識別方法被提出。本文先簡單介紹了該問題的定義及傳統方法的局限, 并列舉了一些適用于深度學習方法的行人重識別數據集。 此外我們詳細地總結了一些比較典型的基于深度學習的行人重識別方法, 并比較了部分算法在 Market1501 數據集上的性能表現。最后我們對該問題未來的研究方向做了一個展望。
作者簡介:
羅浩,浙江大學控制科學與工程學院智能系統與控制研究所博士研究生。2015年獲得浙江大學控制科學與工程學士學位,主要研究方向為行人重識別, 多目標跟蹤, 深度學習, 計算機視覺方向。
姜偉,浙江大學控制科學與工程學院智能系統與控制研究所副教授。2005年獲得日本東京工業大學博士學位,主要研究方向為機器視覺, 計算機圖形學, 機器學習。
范星,浙江大學控制科學與工程學院博士研究生。2015年獲得浙江大學控制科學與工程學士學位,主要研究方向為行人重識別。
張思朋,2016年獲得浙江大學控制科學與工程碩士學位,主要研究方向為計算機視覺, 行人重識別。
摘要:近年來,基于深度學習的表面缺陷檢測技術廣泛應用在各種工業場景中.本文對近年來基于深度學習的表面缺陷檢測方法進行了梳理,根據數據標簽的不同將其分為全監督學習模型方法、無監督學習模型方法和其他方法三大類,并對各種典型方法進一步細分歸類和對比分析,總結了每種方法的優缺點和應用場景.本文探討了表面缺陷檢測中三個關鍵問題,介紹了工業表面缺陷常用數據集.最后,對表面缺陷檢測的未來發展趨勢進行了展望.
智能視頻監控(IVS)是當前計算機視覺和機器學習領域的一個活躍研究領域,為監控操作員和取證視頻調查者提供了有用的工具。人的再識別(PReID)是IVS中最關鍵的問題之一,它包括識別一個人是否已經通過網絡中的攝像機被觀察到。PReID的解決方案有無數的應用,包括檢索顯示感興趣的個體的視頻序列,甚至在多個攝像機視圖上進行行人跟蹤。文獻中已經提出了不同的技術來提高PReID的性能,最近研究人員利用了深度神經網絡(DNNs),因為它在類似的視覺問題上具有令人信服的性能,而且在測試時執行速度也很快。鑒于再識別解決方案的重要性和廣泛的應用范圍,我們的目標是討論在該領域開展的工作,并提出一項最先進的DNN模型用于這項任務的調查。我們提供了每個模型的描述以及它們在一組基準數據集上的評估。最后,我們對這些模型進行了詳細的比較,并討論了它們的局限性,為今后的研究提供了指導。
摘要: 三維重建在視覺方面具有很高的研究價值, 在機器人視覺導航、智能車環境感知系統以及虛擬現實中被廣泛應用.本文對近年來國內外基于視覺的三維重建方法的研究工作進行了總結和分析, 主要介紹了基于主動視覺下的激光掃描法、結構光法、陰影法以及TOF (Time of flight)技術、雷達技術、Kinect技術和被動視覺下的單目視覺、雙目視覺、多目視覺以及其他被動視覺法的三維重建技術, 并比較和分析這些方法的優點和不足.最后對三維重建的未來發展作了幾點展望。
摘要: 大數據時代,數據呈現維度高、數據量大和增長快等特點。如何有效利用其中蘊含的有價值信息,以實現數據的智能化處理,已成為當前理論和應用的研究熱點。針對現實普遍存在的多義性對象,數據多標簽被提出并被廣泛應用于數據智能化組織。近年來,深度學習在數據特征提取方面呈現出高速、高精度等優異性,使基于深度學習的多標簽生成得到廣泛關注。文中分五大類別總結了最新研究成果,并進一步從數據、關系類型、應用場景、適應性及實驗性能方面對其進行對比和分析,最后探討了多標簽生成面臨的挑戰和未來的研究方向。
簡介: 近幾年來, 深度學習在機器學習研究領域中取得了巨大的突破, 深度學習能夠很好地實現復雜問題的學習, 然而, 深度學習最大的弊端之一, 就是需要大量人工標注的訓練數據, 而這需要耗費大量的人力成本. 因此, 為了緩解深度學習存在的這一問題, Palatucci 等于 2009 年提出了零樣本學習 (Zero-shot learning). 零樣本學習是遷移學習的一種特殊場景, 在零樣本學習過程中, 訓練類集和測試類集之間沒有交集, 需要通過訓練類與測試類之間的知識遷移來完成學習, 使在訓練類上訓練得到的模型能夠成功識別測試類輸入樣例的類標簽. 零樣本學習的意義不僅在于可以對難以標注的樣例進行識別, 更在于這一方法模擬了人類對于從未見過的對象的認知過程, 零樣本學習方法的研究, 也會在一定程度上促進認知科學的研究. 鑒于零樣本學習的應用價值、理論意義和未來的發展潛力, 文中系統綜述了零樣本學習的研究進展, 首先概述了零樣本學習的定義, 介紹了 4 種典型的零樣本學習模型, 并對零樣本學習存在的關鍵問題及解決方法進行了介紹, 對零樣本學習的多種模型進行了分類和闡述, 并在最后指明了零樣本學習進一步研究中需要解決的問題以及未來可能的發展方向。
作者簡介:
劉建偉,男。中國石油大學博士生導師/碩士生導師。曾任加拿大溫哥華英屬哥倫比亞大學訪問學者,加拿大滑鐵盧大學高級訪問學者。講授模式識別專題(博士生),可編程序控制器原理及其應用,模式識別與機器學習導論等課程。
長期從事模式識別與智能系統、復雜系統分析與智能控制、機器學習和數據挖掘方面的研究工作。美國數學會《數學評論》評論員,中國人工智能學會機器學習分會高級會員。在計算機學報,自動化學報、計算機研究與發展、電子學報、TNNLS、Neurocomputing等期刊上和國內國際會議上發表學術研究論文180多篇,其中三大檢索100多篇。
題目: A Survey of Deep Learning Applications to Autonomous Vehicle Control
摘要:
為自動駕駛車輛設計一個能夠在所有駕駛場景中提供足夠性能的控制器是一個挑戰,因為它的環境非常復雜,而且無法在部署后可能遇到的各種場景中測試系統。然而,深度學習方法已經顯示出巨大的潛力,不僅為復雜的非線性控制問題提供了出色的性能,而且還可以將以前學習的規則推廣到新的場景中。基于這些原因,在車輛控制中使用深度學習變得越來越流行。雖然在這一領域取得了重要的進展,但這些工作尚未得到全面總結。本文調查了文獻報道的廣泛的研究工作,旨在通過深度學習的方法來控制車輛。雖然控制和感知之間存在重疊,但本文的重點是車輛控制,而不是更廣泛的感知問題,包括語義分割和目標檢測等任務。本文通過比較分析,明確了現有深度學習方法的優勢和局限性,并從計算、體系結構選擇、目標規范、泛化、驗證和驗證以及安全性等方面探討了研究的挑戰。總的來說,這項調查為智能交通系統相關的一個快速發展的領域帶來了及時和熱門的信息。
作者:
Sampo Kuutti是薩里大學汽車工程中心碩士研究生,研究興趣是機器學習,強化學習,自動車輛。
Richard Bowden是英國薩里大學計算機視覺和機器學習教授,在倫敦大學獲得計算機科學學士學位,利茲大學獲得理學碩士學位,布魯內爾大學獲得計算機視覺博士學位。Richard Bowden教授領導視覺、語言和信號處理中心的認知視覺小組,他的研究中心是利用計算機視覺來定位、跟蹤和理解人類。他是圖像和視覺計算、IEEE模式分析和機器智能的副主編,是英國機器視覺協會(BMVA)執行委員會的成員。