報告題目:
Visual Recognition of Families In the Wild
報告簡介:
親屬關系自動識別具有廣泛的應用價值。首先,協助法醫調查,因為親屬關系是一個強有力的線索,可以縮小搜索空間(例如,知道波士頓爆炸案是兄弟可能有助于更快地確定嫌疑人)。簡言之,這類技術可能帶來許多好處:消費者(例如,自動照片庫管理)、學者(例如,歷史血統和家譜研究)、數據分析儀(例如,基于社交媒體的分析)、調查員(例如,失蹤兒童和人口販運案件——例如,然而,在網上找到的失蹤兒童不太可能出現在任何數據庫中,甚至不太可能是難民。除了基于應用的問題之外,正如已經暗示的,親屬關系是一個強大的線索,可以作為一個人臉屬性,在更一般的人臉識別問題中,能夠大大減少搜索空間。有了我們的FIW數據庫,我們可以以比以往任何時候都大得多的規模提出這一相對較新和具有挑戰性的問題(例如,64.4萬對人臉的親屬關系驗證,而不是只有2000對,1000個家庭的家庭分類,而不是只有101個)。最后,我們也希望FIW能作為一個豐富的資源,進一步將基于人臉識別的問題的語義鴻溝與更廣泛的人機交互激勵聯系起來。
嘉賓介紹:
Joseph Robinson & Ming Shao,獲得電氣和計算機工程學士學位(2014年),并在東北大學(NEU)攻讀計算機工程博士學位,同時兼任兼職教師:設計和教授數據分析本科課程。研究方向是應用機器視覺,重點是人臉、深度學習、多媒體和大型數據庫。此前,帶領球隊首次亮相特雷維德(MED,獲得第三名最佳準確率)。此外,建立了許多圖像和視頻數據集,其中最引人注目的是FIW。擔任各種研討會和挑戰(如NECV17、RFIW@ACM-MM17、RFIW@FG18、AMFG@CVPR18、FacesMM@ICME18)、教程(ACM-MM18)、PC成員(如CVPR、FG、MIRP、MMEDIA、AAAI)、評審員(如IEEE Trans)的組織主席和主持人。在生物醫學電路和系統,圖像處理,模式分析和機器智能)和領導職位,如IEEE@NEU總裁和IEEE SAC R1地區的關系官員。完成了兩項NSF REUs(2010和2011);Analogic Corporation和BBN Technology的合作;在麻省理工學院林肯實驗室(2014)、系統與技術研究(2016和2017)、Snap Inc.(即Snapchat)(2018)和ISMConnect(2019)實習。
Ming Shao,Joseph Robinson
論文題目: Spatio-temporal Action Recognition: A Survey
論文摘要: 動作識別或動作檢測的任務包括分析視頻并確定正在執行的動作或動作。這些視頻的主要主題是人類表演一些動作。然而,這一要求可以放寬,以推廣到其他學科,如動物或機器人。應用范圍從人機交互到自動視頻編輯方案。當我們考慮時空動作識別時,我們處理的是動作定位。此任務不僅涉及確定正在執行的操作,而且還涉及在所述視頻中執行操作的時間和位置。本文旨在綜述解決這一問題的各種方法和算法,對它們進行全面的比較,探索可用于解決這一問題的各種數據集,并確定最有希望的方法。
主題: Graph-based Methods in Pattern Recognition and Document Image Analysis
簡介: 模式識別和文檔圖像分析中的許多任務被公式化為圖形匹配問題。盡管問題具有NP難性,但快速準確的收斂已在模式識別的廣泛應用中取得了重大進展。因此,學習基于圖的表示形式和相關技術是真正興趣。在本教程中,我們將介紹用于獲得不同應用程序的圖形表示的許多方法。之后,我們將解釋用于在圖域中識別,分類,檢測和許多其他任務的基于圖的不同算法,方法和技術。我們將介紹最近的趨勢,包括圖卷積網絡和圖中的消息傳遞,重點介紹在各種模式識別問題中的應用,例如化學分子分類和網絡圖形表示中的檢測。此外,除了這些算法在文檔圖像分析和識別(尤其是模式識別)領域的不同應用之外,還將提供相關經驗。
嘉賓介紹: DUTTA Anjan是位于巴塞羅那計算機視覺中心的P-SPHERE項目下的Marie-Curie博士后。他于2014年獲得巴塞羅那自治大學(UAB)的計算機科學博士學位。他是IJCV,IEEE TCYB,IEEE TNNLS,PR,PRL等期刊的定期審稿人,并經常擔任BMVC,ICPR,ACPR和ICFHR等各種科學會議的程序委員會委員。他最近的研究興趣圍繞視覺對象的基于圖形的表示和解決計算機視覺,模式識別和機器學習中各種任務的基于圖形的算法。
Luqman Muhammad Muzzamil博士是文檔圖像分析,模式識別和計算機視覺的研究科學家。自2015年11月以來,盧克曼目前在拉羅謝爾大學(法國)的L3i實驗室擔任研究工程師。Luqman曾在波爾多生物信息學中心(波爾多生物信息中心)擔任研究工程師,并在拉羅謝爾大學(法國)的L3i實驗室擔任Jean-Marc Ogier教授的博士后研究員。 Luqman擁有Fran?oisRabelais的圖爾大學(法國)和巴塞羅那的Autonoma大學(西班牙)的計算機科學博士學位。他的博士學位論文由Jean-Yves Ramel教授和Josep Llados教授共同指導。他的研究興趣包括結構模式識別,文檔圖像分析,基于相機的文檔分析和識別,圖形識別,機器學習,計算機視覺,增強現實和仿生學。
題目: Capsule Networks for Computer Vision
報告簡介: 膠囊網絡提供了一種有效的方法來建模實體之間的部分對整個關系,并允許學習視點不變表示。 通過這種改進的表示學習,膠囊網絡能夠在多個域中實現良好的性能,而參數數量卻大大減少。 最近,膠囊網絡已顯示出人類動作在視頻中的定位,醫學圖像中的對象分割以及文本分類的最新結果。 本教程將提供對膠囊網絡的基本了解,并且我們將討論其在各種計算機視覺任務中的使用,例如圖像分類,對象分割和活動檢測。
嘉賓介紹:
Mubarak Shah,計算機科學講座教授,UCF計算機視覺研究中心的創始主任。他的研究興趣包括:視頻監視,視覺跟蹤,人類活動識別,擁擠場景的視覺分析,視頻注冊,無人機視頻分析等。Shah博士是IEEE,AAAS,IAPR和SPIE的研究員。 2006年,他被授予飛馬教授獎,這是UCF的最高獎項。他是ACM杰出的演講者。他曾在1997-2000年擔任IEEE杰出訪客發言人,并于1997年獲得IEEE杰出工程教育家獎。他于1999年獲得了哈里斯公司的工程成就獎,并于1995、1997和2000年獲得了聯合國開發計劃署的TOKTEN獎; 1995年和2003年授予教學激勵計劃獎,2003年和2009年授予研究激勵獎,2005年和2006年授予百萬富翁俱樂部獎,2007年授予大學杰出研究員獎,并為2005年ICCV榮譽獎。挑戰問題,并在2005年ACM多媒體會議上獲得最佳論文獎提名。他是視頻計算國際叢書的編輯。 《機器視覺與應用》雜志主編,《 ACM計算調查》雜志副主編。他是IEEE Transactions on PAMI的副編輯,也是《國際計算機視覺視頻計算雜志》特刊的特約編輯。
Rawat博士是UCF計算機視覺研究中心的助理教授。他的研究興趣在于計算機視覺,機器學習,社交計算和多媒體的交叉領域。他于2012年至2017年在新加坡國立大學計算機學院獲得計算機科學博士學位,并在該大學的多媒體分析與綜合實驗室與Mohan Kankanhalli教授一起工作。他的博士論文致力于利用社交媒體和相機傳感器增強用戶的攝影體驗。它的重點是計算媒體美學和對用于攝影的社交媒體圖像的分析。他于2017-2019年在UCF計算機視覺研究中心與Mubarak Shah教授進行了博士后培訓。他于2009年在瓦拉納西IIT-BHU印度理工學院獲得了計算機科學與工程學士學位。在2012年夏季加入NUS之前,他曾于2009年至2012年在印度Mentor Graphics的Praveen Shukla工作。在Veloce Emulation團隊工作。他是乒乓球愛好者,并且在這項運動中贏得了許多獎牌。
題目: Visual Recognition and Beyond
報告簡介: 本教程涵蓋了視覺識別研究前沿的主題。 我們將討論來自圖像和視頻的實例級識別的最新進展,詳細介紹視覺識別任務系列中的最新工作。 講座涵蓋了圖像分類,視頻分類,對象檢測,動作檢測,實例分割,語義分割,全景分割和姿勢估計背后的方法和原理。
報告目錄:
嘉賓介紹:
Ross Girshick,是Facebook人工智能研究(FAIR)的一名研究科學家,致力于計算機視覺和機器學習。2012年,他在Pedro Felzenszwalb的指導下獲得了芝加哥大學的計算機科學博士學位。加入FAIR之前,羅斯曾在微軟研究院(Microsoft Research)、雷德蒙(Redmond)和加州大學伯克利分校(University of California, Berkeley)做研究員,他的興趣包括實例級別的對象理解和將自然語言處理與計算機視覺相結合的視覺推理挑戰。他獲得了2017年PAMI青年研究員獎,并以開發R-CNN(基于區域的卷積神經網絡)方法來檢測對象而聞名。2017年,還憑借《面具R-CNN》在ICCV獲得馬爾獎。
,斯坦福大學博士,導師是計算機視覺領域頂級學者李飛飛博士。研究興趣包括計算機視覺和機器學習方面,涉及到視覺推理、視覺和語言,以及使用深層神經網絡生成圖像。Johnson目前是Facebook AI Research的研究科學家。從2019年秋季開始,我將加入密歇根大學計算機科學與工程專業,擔任助理教授。Johnson在2018年夏天完成博士學位,其博士論文組成式視覺智能《Compositional visual intelligence》,195頁詳述采用組合式學習的方法對計算機視覺中圖像描述、視覺問答、文本圖像生成三方面的問題進行了研究,是組合式視覺智能的代表性研究工作。