內容簡介:
生成對抗網絡(GAN)是訓練模型的新思想,生成器和鑒別器相互對抗以提高生成質量。最近,GAN在圖像生成方面取得了驚人的成果,并在此基礎上迸發發了大量新的思想,技術和應用。雖然只有少數成功的案例,但GAN在文本和語音領域具有很大的潛力,以克服傳統方法的局限性。
本教程分為三個部分。在第一部分中,我們將介紹生成對抗網絡(GAN)并提供有關此技術的全面介紹。在第二部分中,我們將重點介紹GAN在語音信號處理中的應用,包括語音增強,語音轉換,語音合成,以及域對抗訓練在說話人識別和唇讀等方面的應用。在第三部分中,我們將描述GAN生成句子的主要挑戰,并回顧一系列應對挑戰的方法。同時,我們將提出使用GAN實現文本樣式轉換,機器翻譯和抽象摘要的算法,而無需配對數據。
講者簡介: 李宏毅教授分別于2010年和2012年在國立臺灣大學獲得了碩士與博士學位。2012年9月至2013年8月,他是中國科學院信息技術創新研究中心的博士后。2013年9月至2014年7月,他是麻省理工學院計算機科學與人工智能實驗室(CSAIL)語言系統組的訪問科學家。現任國立臺灣大學電氣工程系助理教授,并任職于該大學計算機科學與信息工程系。他的研究重點是機器學習(尤其是深度學習),口語理解和語音識別。
曹昱副研究員分別于1999年和2001年獲得臺灣大學電子工程學士學位和碩士學位。他于2008年獲得佐治亞理工學院電氣與計算機工程博士學位. 2009至2011年,曹博士是日本國家信息與通信技術研究所(NICT)的研究員,從事自動語音研究和產品開發,識別多語言語音到語音翻譯。目前,他是臺灣臺北中央研究院信息技術創新研究中心(CITI)的副研究員。他于2017年獲得了中央研究院職業發展獎。曹博士的研究興趣包括語音和說話人識別,聲學和語言建模,音頻編碼和生物信號處理。
目錄: GAN的基本思想及一些基礎的理論知識
GAN在語音方面的應用
GAN在自然語言處理方面的應用
【導讀】來自加州大學圣地亞哥分校《計算機視覺中的領域自適應》中生成式對抗網絡GAN介紹
【導讀】慕尼黑大學開設的《高級深度學習》技術課程,重點介紹計算機視覺的前沿深度學習技術。最新一期介紹了《生成式對抗網絡》進展,講述了GAN的知識體系,值得關注。
報告主題: 生成對抗網絡
報告摘要: 生成對抗網絡(Generative Adversarial Network,GAN)是非監督式學習的一種生成模型,其由一個生成網絡與一個判別網絡組成,通過讓兩個神經網絡相互博弈的方式進行學習。生成網絡從潛在空間(latent space)中隨機取樣 作為輸入,其輸出結果需要盡量模仿訓練集中的真實樣本。判別網絡的輸入則為真實樣本或生成網絡的輸出,其目的是將生成網絡的輸出從真實樣本中盡可能分辨出來。而生成網絡則要盡可能地欺騙判別網絡。兩個網絡相互對抗、不斷調整參數,最終目的 是使判別網絡無法判斷生成網絡的輸出結果是否真實。雖然生成對抗網絡原先是為了無監督學習提出的,它也被證明對半監督學習、監督學習、強化學習同樣有用。本報告主要講述生成對抗網絡的基本原理和最新研究進展。
邀請嘉賓: 復旦大學計算機科學技術學院副教授,博士生導師。于復旦大學獲得理學學士和博士學位。主要從事自然語言處理、深度學習等方向的研究,在ACL、EMNLP、AAAI、IJCAI等計算機學會A/B類期刊、會議上發表50余篇學術論文,引用 1900余次。開源中文自然語言處理工具FudanNLP作者,FastNLP項目負責人。2015年入選首屆中國科協人才托舉工程,2017年ACL杰出論文獎,2018年獲中國中文信息學會“錢偉長中文信息處理科學技術獎—漢王青年創新獎”。
報告題目: Discreteness in Neural Natural Language Processin
報告摘要: 本教程對神經NLP離散化過程提供了全面的介紹。首先,我們將簡要介紹基于NLP的深度學習的背景,指出自然語言普遍存在的離散性及其在神經信息處理中的挑戰。特別地,我們將集中在這樣的離散性如何在一個神經網絡的輸入空間、潛在空間和輸出空間中發揮作用。在每個部分中,我們將提供示例,討論機器學習技術,并演示NLP應用程序。
*邀請嘉賓: Lili Mou博士是阿爾伯塔大學計算機科學系的助理教授。Lili分別于2012年和2017年在北京大學EECS學院獲得了學士和博士學位。之后,他在滑鐵盧大學(University of Waterloo)擔任博士后,并在Adeptmind(加拿大多倫多的一家初創公司)擔任研究科學家。他的研究興趣包括應用于自然語言處理以及編程語言處理的深度學習。他在頂級會議和期刊上都有出版物,包括AAAI,ACL,CIKM,COLING,EMNLP,ICASSP,ICML,IJCAI,INTERSPEECH,NAACL-HLT和TACL(按字母順序)。
周浩是Bytedance AI實驗室的研究員 ,從事自然語言處理。2017年獲得南京大學計算機科學博士學位。他的研究興趣是機器學習及其在自然語言處理中的應用。目前,他專注于自然語言生成的深度生成模型。
李磊博士是今日頭條的研究科學家和今日頭條實驗室的主任。Lei擁有上海交通大學計算機科學與工程學士學位(ACM類)和博士學位。分別從卡內基梅隆大學獲得計算機科學博士學位。他的有關挖掘共同演化時間序列的快速算法的論文工作被ACM KDD授予最佳論文獎(排名提高)。在加入頭條之前,他曾在百度的硅谷深度學習研究所擔任首席研究科學家(“少帥學者”)。在此之前,他曾在Microsoft Research(亞洲和Redmond),Google(Mountain View)和IBM(TJ Watson Reserch Center)工作過。在加入百度之前,他曾在加州大學伯克利分校的EECS部門擔任博士后研究員。他的研究興趣在于深度學習,統計推斷,自然語言理解和時間序列分析。他曾在ICML 2014,ECML / PKDD 2014/2015,SDM 2013/2014,IJCAI 2011/2013/2016,KDD 2015 / 2016、2017 KDD Cup聯合主席的程序委員會中任職,并在2014年暑期學校擔任講師促進機器學習的概率編程研究。他發表了30多篇技術論文,并擁有3項美國專利。