報告題目:
Deep Reinforcement Learning for Computer Vision
報告簡介:
近年來,深度強化學習作為機器學習的基本技術之一得到了發展,并成功地應用于各種計算機視覺任務(表現出最先進的性能)。在本教程中,我們將概述深度強化學習技術的趨勢,并討論如何使用它們來提高各種計算機視覺任務的性能(解決計算機視覺中的各種問題)。首先,我們簡要介紹了深度強化學習的基本概念,并指出了在不同的計算機視覺任務中所面臨的主要挑戰。其次,介紹了一些用于計算機視覺任務的深度強化學習技術及其種類:策略學習、注意感知學習、不可微優化和多智能體學習。第三,介紹了深度強化學習在計算機視覺不同領域的應用。最后,我們將討論深度強化學習中的一些開放性問題,以說明未來如何進一步發展更先進的計算機視覺算法。
嘉賓介紹:
Jiwen Lu,副教授,中國清華大學,自動化系。清華大學自動化系副教授,2015.11-至今,新加坡高級數字科學中心研究科學家,2011.3-2015.11,2003.7-2007.7西安理工大學信息科學系助理講師。
Liangliang Ren ,清華大學博士生,研究方向是計算機視覺與機器學習、度量學習與深度強化學習
【導讀】來自加州大學圣地亞哥分校《計算機視覺中的領域自適應》中生成式對抗網絡GAN介紹
本文綜述了元學習在圖像分類、自然語言處理和機器人技術等領域的應用。與深度學習不同,元學習使用較少的樣本數據集,并考慮進一步改進模型泛化以獲得更高的預測精度。我們將元學習模型歸納為三類: 黑箱適應模型、基于相似度的方法模型和元學習過程模型。最近的應用集中在將元學習與貝葉斯深度學習和強化學習相結合,以提供可行的集成問題解決方案。介紹了元學習方法的性能比較,并討論了今后的研究方向。
主題: GANs in computer vision: Introduction to generative learning
主要內容: 在這個綜述系列文章中,我們將重點討論計算機視覺應用程序的大量GANs。具體地說,我們將慢慢地建立在導致產生性對抗網絡(GAN)進化的思想和原則之上。我們將遇到不同的任務,如條件圖像生成,3D對象生成,視頻合成。
目錄:
一般來說,數據生成方法存在于各種各樣的現代深度學習應用中,從計算機視覺到自然語言處理。在這一點上,我們可以用肉眼生成幾乎無法區分的生成數據。生成性學習大致可分為兩大類:a)變分自編碼器(VAE)和b)生成性對抗網絡(GAN)。
主題: A Review on Deep Learning Techniques for Video Prediction
摘要: 預測,預期和推理未來結果的能力是智能決策系統的關鍵組成部分。鑒于深度學習在計算機視覺中的成功,基于深度學習的視頻預測已成為有前途的研究方向。視頻預測被定義為一種自我監督的學習任務,它代表了一個表示學習的合適框架,因為它展示了提取自然視頻中潛在模式的有意義的表示的潛在能力。視頻序列預測的深度學習方法。我們首先定義視頻預測的基礎知識,以及強制性的背景概念和最常用的數據集。接下來,我們會仔細分析根據擬議的分類法組織的現有視頻預測模型,突出顯示它們的貢獻及其在該領域的意義。數據集和方法的摘要均附有實驗結果,有助于在定量基礎上評估現有技術。通過得出一些一般性結論,確定開放研究挑戰并指出未來的研究方向來對本文進行總結。
題目
深度殘差強化學習,Deep Residual Reinforcement Learning
關鍵字
強化學習,殘差算法,機器學習
簡介
我們在無模型和基于模型的強化學習設置中重新研究殘差算法。 我們建議使用雙向目標網絡技術來穩定殘差算法,從而產生DDPG的殘差版本,該版本明顯優于DeepMind Control Suite基準測試中的原始DDPG。 此外,我們發現殘差算法是解決基于模型的規劃中分布不匹配問題的有效方法。 與現有的TD(k)方法相比,我們的基于殘差的方法對模型的假設更弱,并且性能提升更大。
作者
Shangtong Zhang, Wendelin Boehmer, Shimon Whiteson,來自牛津大學
Deep Reinforcement Learning via Policy Optimization
簡介:
使用Python、OpenCV庫構建計算機視覺的實際應用程序。這本書討論了不同方面的計算機視覺,如圖像和對象檢測,跟蹤和運動分析及其應用實例。作者首先介紹了計算機視覺,然后使用Python從頭開始創建OpenCV。下一節討論專門的圖像處理和分割,以及計算機如何存儲和處理圖像。這涉及到使用OpenCV庫進行模式識別和圖像標記。接下來,將使用OpenCV處理對象檢測、視頻存儲和解釋,以及人類檢測。跟蹤和運動也進行了詳細的討論。該書還討論了如何使用CNN和RNN創建復雜的深度學習模型。最后對計算機視覺的應用現狀和發展趨勢進行了總結。
閱讀本書之后,您將能夠理解并使用Python、OpenCV實現計算機視覺及其應用程序。您還將能夠使用CNN和RNN創建深度學習模型,并了解這些前沿的深度學習架構是如何工作的。
您將學習
作者:
Sunila Gollapudi是Broadridge Financial Solutions India (Pvt)有限公司的執行副總裁。擁有超過17年的架構、設計和開發以客戶為中心、企業級和數據驅動的解決方案的經驗。在過去的十年中,她主要專注于銀行和金融服務領域,是一名數據鑒賞家和架構師,擅長設計一個通過分析最大化數據價值的整體數據策略。她的專長包括通過綜合業務和領域驅動因素以及大數據工程和分析領域的新興技術趨勢來構建整體智能自動化戰略;領導針對CI/CD的云遷移和DevOps戰略;指導應用程序現代化、重用和技術標準化計劃。
主題: Reinforcement Learning 101
摘要: 強化學習是現代人工智能領域最熱門的研究課題之一,它的普及程度也在不斷提高。讓我們看看開始學習RL需要知道的5件有用的事情:
作者簡介: Shweta Bhatt,理學碩士,數據科學家,谷歌開發人員機器學習專家。
論文題目
視頻游戲中深度強化學習的研究綜述,A Survey of Deep Reinforcement Learning in Video
論文摘要
摘要深度強化學習(DRL)自提出以來取得了很大的成就。通常,DRL代理在每個步驟都接收高維輸入,并根據基于深度神經網絡的策略進行操作。這種學習機制通過端到端的方法更新策略以最大化回報。本文綜述了DRL方法的研究進展,包括基于價值的方法、基于策略梯度的方法和基于模型的方法,比較了它們的主要技術和性能,并指出DRL在智能游戲中的重要作用。我們還回顧了DRL在各種電子游戲中的成就,包括經典的街機游戲、第一人稱視角游戲和多智能體實時戰略游戲,從2D到3D,從單智能體到多智能體,大量帶有DRL的電子游戲AIs都取得了超人的性能,在這個領域還有一些挑戰。因此,我們還討論了將DRL方法應用于該領域的一些關鍵點,包括探索性開發、樣本效率、泛化和遷移、多智能體學習、不完全信息和延遲備用研究,以及一些研究方向。
論文作者
Kun Shao, Zhentao Tang, Yuanheng Zhu,IEEE成員。Nannan Li, Dongbin Zhao,IEEE資深會員。