主題: Artificial Intelligence in Transportation
簡介:
交通是生活的基本必需品。在人類歷史上,探索更好的交通方式從來沒有停止過。近年來,拼車行業的革命和自動駕駛技術的創新每天都產生大量的交通數據。如此龐大的數據量開啟了現代智能交通的新時代。許多傳統的交通問題可以通過現代機器學習和數據挖掘方法找到更好的解決方案。本教程的目的是為參與者提供一個廣泛和全面的基礎,最近的發展和交通AI的開放問題。
交通運輸是一個非常廣泛的研究領域。本教程以全球最大的移動交通平臺滴滴出行的實際應用和需求為基礎,圍繞移動交通平臺的主題展開。我們將主題分為三類。首先是地圖服務,包括地圖匹配、交通預測、預計到達時間(ETA)和路線規劃等,為后續的決策過程提供準確的基礎信息。這些問題大多在純交通或地理信息系統的文獻中進行了研究。然而,這些都不能滿足實時移動交通平臺的準確性或效率要求。有必要以現代的觀點重新審視這些問題,并探索適應更嚴格要求的新解決方案。第二類是決策,構建核心共乘平臺。類似的問題在交通運輸以外的研究領域也得到了廣泛的研究。然而,隨著移動交通系統的新挑戰,它們被重新定義。最后一類是用戶體驗,如出行安全評估,這是移動交通平臺的獨特需求。
邀請嘉賓:
王征博士,滴滴AI實驗室研究員,滴滴智能地圖服務架構研究員。2011年獲得清華大學博士學位,2011-2014年在亞利桑那州立大學擔任研究員,2014-2016年在密歇根大學安娜堡分校擔任研究員。他獲得了多個獎項,包括KDD的最佳研究論文獎亞軍和IEEE國際社會計算會議(SocialCom)的最佳論文獎。曾擔任ICML、NIPS、SDM、IJCAI等重要會議PC委員,并在ICDM上做過輔導。他現在領導著研發團隊,致力于設計和開發新的機器學習系統和服務,用于滴滴地圖和滴滴能力預測平臺。他設計了滴滴ETA和路線規劃服務的新型機器學習和深度學習解決方案,每天服務超過200億次請求。
秦志偉博士在滴滴AI實驗室領導強化學習研究,致力于拼車市場優化的核心問題。他在哥倫比亞大學獲得運籌學博士學位,在溫哥華不列顛哥倫比亞大學獲得計算機科學和統計學學士學位。對優化和機器學習交叉領域的研究課題非常感興趣,最近的研究領域是強化學習及其在運營優化、數字營銷、交通信號控制和教育中的應用。曾在ICML、KDD、IEEE ICDM、WWW、JMLR和MPC等頂級會議和機器學習與優化期刊上發表文章。
強化學習(RL)研究的是當環境(即動力和回報)最初未知,但可以通過直接交互學習時的順序決策問題。RL算法最近在許多問題上取得了令人印象深刻的成果,包括游戲和機器人。 然而,大多數最新的RL算法需要大量的數據來學習一個令人滿意的策略,并且不能用于樣本昂貴和/或無法進行長時間模擬的領域(例如,人機交互)。朝著更具樣本效率的算法邁進的一個基本步驟是,設計適當平衡環境探索、收集有用信息的方法,以及利用所學策略收集盡可能多的回報的方法。
本教程的目的是讓您認識到探索性開發困境對于提高現代RL算法的樣本效率的重要性。本教程將向觀眾提供主要算法原理(特別是,面對不確定性和后驗抽樣時的樂觀主義)、精確情況下的理論保證(即表格RL)及其在更復雜環境中的應用,包括參數化MDP、線性二次控制,以及它們與深度學習架構的集成。本教程應提供足夠的理論和算法背景,以使AI和RL的研究人員在現有的RL算法中集成探索原理,并設計新穎的樣本高效的RL方法,能夠處理復雜的應用,例如人機交互(例如,會話代理),醫學應用(例如,藥物優化)和廣告(例如,營銷中的終身價值優化)。在整個教程中,我們將討論開放的問題和未來可能的研究方向。
課程名稱: Introduction to Articial Intelligence
課程簡介:
本課程主要講述了人工智能相關知識,包括基本理論、練習和項目。
課程部分大綱:
講師介紹:
Gilles Louppe是比利時列日大學人工智能和深度學習的副教授。他曾是紐約大學物理系和數據科學中心的博士后助理,與歐洲核子研究中心的阿特拉斯實驗關系密切。他的研究處于機器學習、人工智能和物理科學的交叉點上,他目前的研究興趣包括使用和設計新的機器學習算法,以新的和變革性的方式處理來自基礎科學的數據驅動的問題。
講座題目
深強化學習及其在交通運輸中的應用:Deep Reinforcement Learning with Applications in Transportation
講座簡介
交通領域,特別是移動共享領域,有許多傳統上具有挑戰性的動態決策問題,這些問題有很長的研究文獻,很容易從人工智能(AI)中受益匪淺。一些核心例子包括在線乘車命令調度,它將可用的駕駛員與在共享平臺上請求乘客的行程實時匹配;路線規劃,它規劃行程的起點和終點之間的最佳路線;交通信號控制,它動態和自適應地調整實現低延遲的區域。所有這些問題都有一個共同的特點,即當我們關注某一特定時間范圍內的一些累積目標時,需要做出一系列的決定。強化學習(RL)是一種機器學習范式,它通過與環境的交互和獲取反饋信號,訓練agent學會在環境中采取最佳行動(以獲得的總累積回報衡量)。因此,它是一類求解序列決策問題的優化方法。
講座嘉賓
Jen-Tzung Chien在臺灣新竹國立清華大學取得電機工程博士學位。現任職于臺灣新竹國立交通大學電子及電腦工程學系及電腦科學系講座教授。2010年,他擔任IBM沃森研究中心的客座教授。他的研究興趣包括機器學習、深度學習、自然語言處理和計算機視覺。在2011年獲得了IEEE自動語音識別和理解研討會的最佳論文獎,并在2018年獲得了AAPM Farrington Daniels獎。2015年,劍橋大學出版社出版《貝葉斯語音與語言處理》;2018年,學術出版社出版《源分離與機器學習》。他目前是IEEE信號處理技術委員會機器學習的當選成員。
題目: Reinforcement Learning:Theory and Algorithms
簡介:
強化學習是近幾年研究的熱點,特別是伴隨DeepMind AlphaGo的出現名聲大噪。強化學習(RL)是一種機器學習范式,在這種范式中,agent從經驗中學習完成順序決策任務,RL在機器人、控制、對話系統、醫療等領域有廣泛的應用。《強化學習:理論與算法》這本書講述了強化學習最新進展,包括MDP、樣本復雜度、策略探索、PG、值函數等關鍵議題,是了解強化學習的材料。
章節:
作者簡介:
Alekh Agarwal目前是微軟人工智能研究中心的研究員,領導強化學習研究小組。之前,在加州大學伯克利分校獲得計算機科學博士學位后,與彼得·巴特利特(Peter Bartlett)和馬丁·溫賴特(Martin Wainwright)一起在紐約微軟研究院(Microsoft Research)度過了六年美好的時光。
姜楠,UIUC助理教授,機器學習研究員。核心研究領域是強化學習(RL),關注于RL的樣本效率,并利用統計學習理論中的思想來分析和開發RL算法。
沙姆·卡卡德(Sham M. Kakade)是華盛頓研究基金會(Washington Research Foundation)數據科學主席,同時在華盛頓大學(University of Washington)艾倫學院(Allen School)和統計學系任職。他致力于機器學習的理論基礎,專注于設計(和實現)統計和計算效率的算法。
報告題目: Bayesian Deep Learning
報告摘要: 深度神經網絡是連接主義系統,通過它通過學習例子來完成任務,而不需要事先了解這些任務。它們可以很容易地擴展到數百萬個數據點,并且可以通過隨機梯度下降進行優化。貝葉斯方法可以用于學習神經網絡權重的概率分布。貝葉斯深度學習與貝葉斯深度學習(如何對DNNs進行貝葉斯推理?如何學習分層結構的貝葉斯模型?),本篇報告給出一定解釋。
嘉賓介紹: 朱軍博士是清華大學計算機系長聘副教授、智能技術與系統國家重點實驗室副主任、卡內基梅隆大學兼職教授。2013年,入選IEEE Intelligent Systems的“人工智能10大新星”(AI’s 10 to Watch)。他主要從事機器學習研究,在國際重要期刊與會議發表學術論文80余篇。擔任國際期刊IEEE TPAMI和Artificial Intelligence的編委、國際會議ICML 2014地區聯合主席、以及ICML、NIPS等國際會議的領域主席。
報告名稱: Modern Artificial Intelligence
報告簡介: 紐約大學丹東分校的電氣和計算機工程系舉辦了一個研討會系列,探討了人工智能(AI)世界上最重要的新研究,其中有為新興技術做出了重要貢獻的研究人員。
報告部分大綱:
邀請嘉賓:
Leon Bottou是一名研究科學家,對機器學習和人工智能有著廣泛的興趣。近年來,在大規模學習和隨機梯度算法方面的工作受到了廣泛的關注。他也以DjVu文件壓縮系統而聞名,于2015年3月加入Facebook人工智能研究。
Francis Bach是Inria的研究員,自2011年以來一直領導著隸屬于巴黎高等師范學院計算機科學系的機器學習團隊。他畢業于加州理工學院,2005年在加州大學伯克利分校獲得計算機科學博士學位,師從邁克爾·喬丹教授。他在巴黎礦業大學數學形態學組學習了兩年,然后在2007年至2010年期間加入了Inria/Ecole Normale Superieure計算機視覺項目組。Francis Bach主要對機器學習感興趣,特別是在稀疏方法、基于核的學習、大規模優化、計算機視覺和信號處理方面。
Raia Hadsel是DeepMind機器人研究的負責人,ICLR,WiML和CoRL的執行董事會成員。她的早期研究是使用暹羅網絡來學習神經嵌入,這種方法現在通常用于表示學習。在完成了具有針對移動機器人的自我監督式深度學習視覺系統的博士學位后,她繼續在卡內基梅隆大學的機器人研究所和SRI International進行科學研究,并于2014年初加入倫敦的DeepMind研究人工智能。Hadsell博士目前的研究重點在于對AI代理和機器人進行持續學習的挑戰,她提出了神經方法,例如策略提純,漸進式網絡和彈性權重合并,以解決災難性遺忘問題。
課程介紹:
本課程介紹用于自然語言處理(NLP)的深度學習(DL)技術。與其他DL4NLP課程相反,我們將在一些講座中對所有神經體系結構(例如CNN,RNN,注意力)進行一次旋風之旅。 然后,我們將在使用貝葉斯和馬爾可夫網絡學習結構化預測方面做出巨大的努力,并應用順序標注,句法解析和句子生成。 在這個過程中,我們還將看到如何將這些傳統方法與簡單的神經網絡相結合并加以改進。
主講人:
Lili Mou博士是阿爾伯塔大學計算機科學系的助理教授。Lili分別于2012年和2017年在北京大學EECS學院獲得了學士和博士學位。之后,他在滑鐵盧大學(University of Waterloo)擔任博士后,并在Adeptmind(加拿大多倫多的一家初創公司)擔任研究科學家。他的研究興趣包括應用于自然語言處理以及編程語言處理的深度學習。他在頂級會議和期刊上都有出版物,包括AAAI,ACL,CIKM,COLING,EMNLP,ICASSP,ICML,IJCAI,INTERSPEECH,NAACL-HLT和TACL(按字母順序)。
課程大綱:
神經網絡基礎
結構化預測
句子生成
離散空間
論壇嘉賓:楊成 北京郵電大學 助理教授
報告主題:圖神經網絡在自然語言處理領域的前沿應用
報告摘要:很多真實世界的應用場景需要處理包含著元素間豐富關系信息的圖形式的數據。在例如物理系統建模、化學分子功能預測等領域中,數據都擁有顯式的圖結構;而在另一些例如文本的非結構數據中,如何從數據中抽取推理并利用如句法樹等結構信息,也是相關領域中重要的研究方向。圖神經網絡可以通過節點間的信息傳遞(message passing)有效地捕捉結構信息。自該概念提出以來,圖神經網絡技術已經在自然語言處理、數據挖掘等多個領域得到了廣泛的應用。本報告將重點介紹圖神經網絡技術在自然語言處理領域的前沿應用。
嘉賓簡介:楊成,博士,北京郵電大學計算機學院助理教授,2019年7月畢業于清華大學計算機科學與技術系,從事自然語言處理與社會計算相關方向的研究,博士期間在國內外頂級期刊會議上發表多篇論文,Google Scholar累計獲得引用近500次,并擔任國內外頂級會議包括ACL、EMNLP、SMP等在內的程序委員會成員和期刊的審稿人。
主題: Adaptive Influence Maximization
簡介:
在當今的網絡生態系統中,信息擴散和社會影響越來越多。對于所有在網絡上做廣告的參與者(媒體公司、政黨、公司等)來說,擁有優化社交媒體存在和信息傳播的算法確實至關重要。由于需要有效的病毒式營銷策略,因此影響估計和影響最大化成為重要的研究問題,導致了方法的過剩。然而,這些方法中的大多數是非自適應的,因此不適用于可能在多個回合中運行和觀察影響活動的場景,也不適用于不能假定對擴散網絡和其中的信息傳播方式具有充分知識的場景。
在本教程中,我們打算介紹自適應影響最大化的最新研究,旨在解決這些限制。這可以被視為一種特殊情況下的影響最大化問題(種子在社會圖選擇最大化信息傳播),一個決策作為影響運動的展開,在多個回合,知識圖拓撲結構和影響過程甚至可能部分或完全缺失。這種設置,取決于基本的假設,導致變量和原始的方法和算法技術,正如我們在最近的文獻中看到的。我們將回顧這一領域最相關的研究,按照幾個關鍵維度進行組織,討論這些方法的優點和缺點,以及開放式研究問題及其實施的實際方面。
邀請嘉賓:
Bogdan Cautis,法國巴黎大學計算機科學系教授,2013年9月至今。在此之前,他是巴黎電信ParisTech的副教授(2007-2013)。2007年,他獲得了法國巴黎大學的博士學位。他目前的研究興趣是數據管理和數據挖掘的廣泛領域,特別是社會網絡和信息擴散。
Silviu Maniu,法國巴黎大學計算機科學系副教授,2015年9月至今。在此之前,他曾任華為諾亞方舟實驗室研究員(2014-2015)。2012年,他獲得了ParisTech電信公司的博士學位。他的研究興趣主要集中在圖形數據挖掘的一般領域,側重于處理不確定性的模型和算法。
Nikolaos Tziortziotis是法國巴黎Tradelab項目平臺的數據科學家研發人員。在此之前,他是法國巴黎南部大學計算機科學系的博士后研究員(2018年11月至12月)。他也是法國巴黎理工學院計算機科學實驗室(LIX)的博士后研究員(2015-2018)。他獲得了希臘約阿尼納大學計算機科學與工程系的博士學位。他的研究興趣跨越了機器學習和數據挖掘的廣泛領域,主要集中在強化學習、貝葉斯學習、影響最大化和實時競價。
主題: Deep Reinforcement Learning with Applications in Transportation
簡介: 交通運輸,特別是移動乘車共享領域,存在許多傳統上具有挑戰性的動態決策問題,這些問題涉及研究文獻,而且很容易從人工智能(AI)中受益匪淺。一些核心示例包括在線乘車指令調度,該系統將可用的駕駛員與乘車共享平臺上的出行請求乘客實時匹配;路線規劃,用于規劃行程起點和終點之間的最佳路線;交通信號控制,可動態自適應地調整區域內的交通信號以實現低延遲。所有這些問題都有一個共同的特征,即在我們關注某個范圍內的一些累積目標時,要做出一系列決定。強化學習(RL)是一種機器學習范例,可訓練代理通過與之交互并獲取反饋信號來學習在環境中采取最佳行動(以所獲得的總累積獎勵衡量)。因此,它是用于解決順序決策問題的一類優化方法。得益于深度學習研究和計算能力的飛速發展,深度神經網絡和RL的集成為解決復雜的大規模學習問題在RL中產生了爆炸性的進展,近年來引起了巨大的興趣。深度學習和RL的結合甚至被認為是通往真正AI的道路。它具有巨大的潛力,以前所未有的方式解決運輸中的一些難題。
目錄簡介: