本課程涉及深度學習和表示學習的最新技術,重點包括監督式深度學習和無監督深度學習、(詞)嵌入、度量學習、卷積和遞歸網絡,以及在計算機視覺、自然語言理解和語音識別方面的應用。先修課程包括:DS-GA 1001 數據科學入門 或一門研究生級別的機器學習課程。
目錄內容:
第一周
第二周
第三周
第四周
第五周
講座A部分:我們以介紹梯度下降算法開始。我們將討論它的目的以及討論步長大小在獲得解答中所起到的重要作用。然后我們將繼續介紹隨機梯度下降算法以及它和全批次梯度下降算法比較下的表現。最后我們將討論動量更新,明確使用動量背后的兩條更新規則和目的,以及它對收斂的影響
講座B部分:我們將討論適用于隨機梯度下降的方法,比如RMSprop優化算法和ADAM優化算法。我們也會討論歸一化層和它們在神經網絡訓練進程中的作用。最后,我們將討論一個神經網絡在工業中使核磁共振掃描更快和更有效的例子。
動手做:我們將簡單復習一下矩陣乘法然后討論卷積。我們使用卷積核的關鍵是通過堆疊和滑動。我們先通過手寫推導理解一維卷積,然后使用PyTorch學習卷積核的維度以及一維和二維卷積例子中的輸出寬度。更多地,我們使用PyTorch學習自動梯度和自定義梯度是如何運作的。
第六周
(New York University),成立于 1831 年,是全美最大的私立大學之一,也是美國唯一一座坐落于紐約心臟地帶的名校。所設課程壓力不大,但要求甚高。而34名諾貝爾獎得主更是使紐約大學光芒四射,享譽世界。紐約大學較為偏重人文藝術及社會科學,研究生院享有很高的聲譽。屬下的帝勢藝術學院是全美最佳的美術學院之一;斯特恩商學院由于得到地靈人杰之助,是蜚聲世界的著名商學院,聚集著世界最頂尖的人才。
【導讀】DeepMind開設了一系列深度學習課程。本次課講述了深度學習計算機視覺。
繼上一講之后,DeepMind研究科學家Viorica Patraucean介紹了圖像分類之外的經典計算機視覺任務(目標檢測、語義分割、光流估計),并描述了每種任務的最新模型以及標準基準。她討論了視頻處理任務的類似模型,如動作識別、跟蹤和相關挑戰。她特別提到了最近提高視頻處理效率的工作,包括使用強化學習的元素。接下來,她介紹了單模態和多模態(vision+audio, visio+language)自監督學習的各種設置,在這些設置中,大規模學習是有益的。最后,Viorica討論了視覺中的開放問題,以及計算機視覺研究在構建智能代理這一更廣泛目標中的作用。
本課程涉及深度學習和表示學習的最新技術,重點是有監督和無監督的深度學習、嵌入方法、度量學習、卷積網和遞歸網,并應用于計算機視覺、自然語言理解和語音識別。
第五講:
第六講:
第七講:
本課程涉及深度學習和表示學習的最新技術,重點是有監督和無監督的深度學習、嵌入方法、度量學習、卷積網和遞歸網,并應用于計算機視覺、自然語言理解和語音識別。
● Course public folder: bit.ly/DLSP20.
● Class material available
● Piazza Q&A interface available here. Sign-up token: DLSP20.
Yann LeCun(//www.zhuanzhi.ai/topic/20021)
在人工智能研究領域,Yann LeCun、Geoffrey Hinton 和 Yoshua Bengio一直被公認為深度學習三巨頭,一起獲得2018年圖靈獎。
Yann LeCun,自稱中文名“楊立昆”,計算機科學家,被譽為“卷積網絡之父”,為卷積神經網絡(CNN,Convolutional Neural Networks)和圖像識別領域做出了重要貢獻,以手寫字體識別、圖像壓縮和人工智能硬件等主題發表過 190 多份論文,研發了很多關于深度學習的項目,并且擁有14項相關的美國專利。他同Léon Bottou和Patrick Haffner等人一起創建了DjVu圖像壓縮技術,同Léon Bottou一起開發了一種開源的Lush語言,比Matlab功能還要強大,并且也是一位Lisp高手。(Backpropagation,簡稱BP)反向傳播這種現階段常用來訓練人工神經網絡的算法,就是 LeCun 和其老師“神經網絡之父”Geoffrey Hinton 等科學家于 20 世紀 80 年代中期提出的,而后 LeCun 在貝爾實驗室將 BP 應用于卷積神經網絡中,并將其實用化,推廣到各種圖像相關任務中。
下載鏈接:鏈接: 提取碼: i3ed