主題: Production ML pipelines with TensorFlow Extended (TFX)
摘要: AurélienGéron致力于使用TensorFlow Extended(TFX)創建生產ML管道,并使用TFX從ML編碼過渡到ML工程。在這里可以學習者可以遍歷基礎知識,將自己的第一個管道整合在一起,然后學習如何自定義TFX組件以及對模型性能進行深入分析。
課程大綱:
邀請嘉賓: AurélienGéron,是Kiwisoft的機器學習顧問,也是O'Reilly暢銷書*《 Scikit-Learn,Keras和TensorFlow的動手機器學習》的作者*。之前,他領導YouTube的視頻分類團隊,是Wifirst 的創始人兼CTO,并曾在以下多個領域擔任顧問:金融(摩根大通和法國興業銀行),國防(加拿大國防部)和醫療保健(輸血)。他還出版了幾本技術書籍(有關C ++,WiFi和Internet體系結構),并且是巴黎多芬大學的講師。
題目: Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2nd Edition
書籍簡介: 通過最近的一系列突破,深度學習促進了整個機器學習領域的發展。現在,即使對這項技術一無所知的程序員也可以使用簡單、高效的工具來實現能夠從數據中學習的程序。這本實用的書告訴你怎么做。通過使用具體的例子、最小理論和兩個可用于生產的Python框架Scikit Learn和TensorFlow的作者Aurélien Géron幫助您直觀地理解用于構建智能系統的概念和工具。您將學習一系列技術,從簡單的線性回歸開始,然后進入深層神經網絡。每一章的練習都有助于你應用你所學的知識。
探索機器學習領域,特別是神經網絡
使用Scikit Learn端到端跟蹤示例機器學習項目
探索幾種訓練模型,包括支持向量機、決策樹、隨機森林和集成方法
利用TensorFlow庫建立和訓練神經網絡
深入研究神經網絡結構,包括卷積網絡、遞歸網絡和深度強化學習
學習深度神經網絡的訓練和縮放技術
作者簡介: Aurélien Géron,Kiwisoft的機器學習顧問,也是暢銷書《與Scikit-Learn、Keras和TensorFlow一起進行機器學習》的作者。此前,他曾領導YouTube的視頻分類團隊,是Wifirst的創始人和首席技術官,并在多個領域擔任顧問:金融(摩根大樓和法國興業銀行)、國防(加拿大國防部)和醫療(輸血)。他還出版了一些技術書籍(關于c++、WiFi和互聯網架構),他是巴黎多芬大學的講師。
主題: Machine learning over real-time streaming data with TensorFlow
報告簡介: 在流數據上應用機器學習來發現有用的信息一直是人們感興趣的話題。在物聯網傳感器、網絡交易、全球定位系統位置或社交媒體更新等許多現實應用中,不斷產生大量數據。關鍵是要有一個能夠可靠和方便地接收、預處理和提供數據的數據管道,以便進行模型推理和訓練。Yong Tang使用TensorFlow開發了用于流數據處理的TensorFlow I/O包。TensorFlow I/O由TensorFlow項目的SIG IO開發,是一個軟件包,主要關注TensorFlow的數據I/O、流和文件格式。除了機器學習本身之外,它還支持各種各樣的開源軟件和框架。在流數據領域,TensorFlow I/O為Apache Kafka、AWS kinisis和Google Cloud PubSub提供支持,這是目前應用最廣泛的流框架。TensorFlow I/O構建在tf.data之上,與簡潔的tf.keras API完全兼容。這意味著使用Kafka、kinisis和PubSub對流式數據進行模型推斷可以像一行代碼一樣簡單。再加上tf.data中的數據轉換功能,還可以直接對成批流數據進行模型訓練。除了流輸入外,TensorFlow I/O還提供流輸出支持,使得機器學習算法實時生成的數據可以返回到Kafka,從而允許其他應用程序連續接收數據。有了輸入和輸出支持,就可以用最少的組件構建以TensorFlow為中心的流媒體管道,這從長遠來看大大減少了基礎設施的維護。您將看到一個演示,展示了TensorFlow I/O使用的便利性,以及使用完整的流數據管道輕松進行機器學習的能力。
嘉賓介紹: 唐勇是美孚電子的工程總監。他為開源社區的不同容器和機器學習項目做出了貢獻。他最近的研究重點是機器學習中的數據處理。他是TensorFlow項目的提交者和SIG I/O負責人,并因對TensorFlow的貢獻而獲得了谷歌的開源同行獎。除了TensorFlow,唐勇還為開源社區的許多其他項目做出了貢獻,并且是Docker和CoreDNS項目的提交者。
主題: Zero to ML hero with TensorFlow 2.0
摘要: 從基礎到使用卷積神經網絡構建復雜的計算機視覺場景,再到使用遞歸神經網絡進行自然語言處理,讓程序員了解勞倫斯·莫羅尼的機器學習。這篇教程對數學和理論輕描淡寫,對代碼要求很高。您將從學習訓練與編程的概念開始,創建一個非常簡單的示例,訓練神經網絡來識別模式,再擴展到計算機視覺的一個場景,在這個場景中,你訓練一個神經網絡來識別衣服上的物品,并分支到更復雜的圖像中,學習如何使用卷積來提取圖像中的特征,這樣你就可以通過貓的耳朵來識別貓,通過馬的鼻子來識別馬。
邀請嘉賓: 勞倫斯·莫羅尼(Laurence Moroney)是Google Brain團隊的開發倡導者,致力于TensorFlow和機器學習。他是數十本編程書籍的作者,其中包括幾本暢銷書以及Google電路的定期發言人。在不使用谷歌搜索時,他還是出版小說家,漫畫書作家和編劇。
報告主題: TensorFlow, open source, and IBM
報告摘要: IBM長期致力于為客戶帶來最大利益的開源項目,并且公司多年來一直致力于為企業數據科學問題構建負責任的解決方案。本報告了解IBM在開源軟件TensorFlow,構建AI解決方案中的作用,以及IBM對最新版本(2.0)的興奮之處。
嘉賓介紹: Fred Reiss,加州大學伯克利分校博士,現在是位于舊金山的IBM Spark技術中心的首席架構師,并且是該中心的創始員工之一。 在此之前,他曾在IBM Research – Almaden工作,從事SystemML和SystemT項目以及DB2 with BLU Acceleration的研究原型。 弗雷德(Fred)擁有超過25種經過同行評審的出版物和6項專利。
主題: TensorFlow community announcements
摘要: Kemal El Moujahid透露了TensorFlow社區令人興奮的發展。加入以了解TensorFlow團隊如何為開發人員和企業成功提供新的和改進的資源。
邀請嘉賓: Kemal El Moujahid,是Google TensorFlow的產品總監。他熱衷于解決AI的重大問題并建立充滿活力的開發者社區。此前,凱末爾(Kemal)領導了Facebook的虛擬助手M,Messenger Platform和Wit.ai。凱末爾(Kalal)擁有巴黎高等理工學院和巴黎電信的學位,以及斯坦福大學商學院的MBA學位。
報告主題:Natural language processing using transformer architectures
報告摘要:
無論是否需要自動判斷用戶評論的觀點、總結長文檔、翻譯文本還是構建聊天機器人,都需要最佳的語言模型。在2018年,幾乎每一個NLP基準都被新的基于變壓器的架構所擊垮,取代了長期存在的基于遞歸神經網絡的架構。簡而言之,如果你喜歡NLP,你需要變形金剛。但是要使用transformer,您需要知道它們是什么,基于transformer的架構是什么樣子的,以及如何在項目中實現它們。
Aurélien Géron深入復發性神經網絡及其限制,transformer的發明,注意力機制,transformer架構,subword標記使用SentencePiece, 自我監督預訓練-從巨大的corpor、語言模型,、BERT,、GPT學習和如何使用這些語言在你的項目中使用TensorFlow模型。
邀請嘉賓:
Aurélien Géron是Kiwisoft的機器學習顧問,也是暢銷書《與Scikit-Learn、Keras和TensorFlow一起進行機器學習》的作者。此前,他曾領導YouTube的視頻分類團隊,是Wifirst的創始人和首席技術官,并在多個領域擔任顧問:金融(摩根大樓和法國興業銀行)、國防(加拿大國防部)和醫療(輸血)。他還出版了一些技術書籍(關于c++、WiFi和互聯網架構),他是巴黎多芬大學的講師。
報告主題:Advanced model deployments with TensorFlow Serving
報告摘要:
TensorFlow服務是TensorFlow生態系統的基石之一。它極大地簡化了機器學習模型的部署,并加速了模型的部署。不幸的是,機器學習工程師不熟悉TensorFlow服務的細節,他們錯過了顯著的性能提升。Hannes Hapke簡要介紹了TensorFlow服務,然后深入介紹了高級設置和用例。他介紹了先進的概念和實施建議增加TensorFlow服務設置的性能,其中包括客戶如何請求服務器模型的元信息模型,選擇最優預測模型優化吞吐量的概述,批處理請求提高吞吐量性能,支持模型的一個示例實現A / B測試,和監控TensorFlow服務設置的概述。
邀請嘉賓:
Hannes Hapke是一位機器學習愛好者和谷歌開發專家。他將深度學習應用于各種計算機視覺和自然語言問題,主要興趣在于機器學習基礎設施和自動化模型工作流。Hannes是《自然語言處理在行動中的作用》一書的合著者,他正在為O 'Reilly使用TensorFlow構建機器學習管道。
報告主題:Building and deploying AI applications and systems at scale
報告摘要:Ben Lorica和Roger Chen回顧了當今公司如何構建AI應用程序。
邀請嘉賓:
Ben Lorica,是O'Reilly的首席數據科學家。Ben在各種環境中應用了商業智能,數據挖掘,機器學習和統計分析,包括直接營銷,消費者和市場研究,定向廣告,文本挖掘和金融工程。他的背景包括在一家投資管理公司,互聯網初創公司和金融服務公司任職。
羅杰·陳(Roger Chen),是Computable 聯合創始人兼首席執行官,還是O'Reilly人工智能會議的計劃主席。在此之前,他是O'Reilly AlphaTech Ventures(OATV)的負責人,在那里他投資于早期創業公司并與之合作,主要從事數據,機器學習和機器人技術領域。羅杰(Roger)具有深厚的動手技術歷史。在初創公司和風險投資之前,他是Oracle,EMC和Vicor 的工程師。他還開發了新型納米和量子光學技術為加州大學伯克利分校的博士研究員。羅杰擁有波士頓大學的學士學位和加州大學伯克利分校博士學位,無論是在電氣工程。
報告主題:Deploying machine learning models on the edge
報告摘要: 當物聯網遇到人工智能時,大數據,云計算和智能邊緣方面的新一輪創新開始。據估計,到2020年,個人或企業物聯網設備每天將產生250 PB的數據。邊緣計算非常適合處理此數據,因為邊緣計算提供了一種在本地計算設備而非云或遠程數據中心收集和處理數據的方法。它對物聯網應用具有兩個主要優勢:實時數據分析和減少向云的數據傳輸。因此,物聯網設備的延遲減少,并且對狀態變化的反應更快。作為邊緣計算的一部分,智能邊緣旨在將預測分析引入邊緣設備。 Yan Zhang和Mathew Salvaris探索了在邊緣部署機器學習模型的方法,實踐和工具,提供了使用Python創建預訓練的ML模型,將其打包在Docker容器中以及按以下方式部署的逐步指南。邊緣設備上的本地服務。他們概述了如何測試和驗證每個步驟以及發現您可能遇到的陷阱。
邀請嘉賓:Yan Zhang (Microsoft)、 Mathew Salvaris (Microsoft)
嘉賓簡介
Yan Zhang是Microsoft Cloud and Enterprise數據小組算法和數據科學團隊的高級數據科學家。她建立了預測分析模型,并在云機器學習平臺上推廣了機器學習解決方案。她最近的研究包括醫療領域的成本預測和欺詐索賠檢測,物聯網應用程序的預測性維護,客戶細分和文本挖掘。此前,她是錫拉丘茲大學(Syracuse University)的研究教員。Yan擁有佛蒙特大學計算機科學系的數據挖掘博士學位。她是23種出版物的作者,其中包括期刊文章,會議論文和博客文章。她的第一篇論文獲得了第17屆IEEE最佳論文獎人工智能工具國際會議。她是2015年9月出版的《使用Microsoft Azure機器學習進行預測性分析》(第二版)的審稿人之一。
Mathew Salvaris是Microsoft的數據科學家。以前,Mathew是一家小型創業公司的數據科學家,該公司為基金經理提供分析。UCL認知神經科學研究所的博士后研究員,在帕特里克·哈格德(Patrick Haggard)的自愿和自由意志領域工作,設計了模型,使用腦電圖(EEG)實時解碼運動皮層中的人類決策;他是埃塞克斯大學腦計算機接口小組的博士后,在那里他從事BCI的計算機鼠標控制工作。Mathew擁有腦機接口博士學位和分布式人工智能理學碩士學位。