報告主題:Deploying machine learning models on the edge
報告摘要: 當物聯網遇到人工智能時,大數據,云計算和智能邊緣方面的新一輪創新開始。據估計,到2020年,個人或企業物聯網設備每天將產生250 PB的數據。邊緣計算非常適合處理此數據,因為邊緣計算提供了一種在本地計算設備而非云或遠程數據中心收集和處理數據的方法。它對物聯網應用具有兩個主要優勢:實時數據分析和減少向云的數據傳輸。因此,物聯網設備的延遲減少,并且對狀態變化的反應更快。作為邊緣計算的一部分,智能邊緣旨在將預測分析引入邊緣設備。 Yan Zhang和Mathew Salvaris探索了在邊緣部署機器學習模型的方法,實踐和工具,提供了使用Python創建預訓練的ML模型,將其打包在Docker容器中以及按以下方式部署的逐步指南。邊緣設備上的本地服務。他們概述了如何測試和驗證每個步驟以及發現您可能遇到的陷阱。
邀請嘉賓:Yan Zhang (Microsoft)、 Mathew Salvaris (Microsoft)
嘉賓簡介
Yan Zhang是Microsoft Cloud and Enterprise數據小組算法和數據科學團隊的高級數據科學家。她建立了預測分析模型,并在云機器學習平臺上推廣了機器學習解決方案。她最近的研究包括醫療領域的成本預測和欺詐索賠檢測,物聯網應用程序的預測性維護,客戶細分和文本挖掘。此前,她是錫拉丘茲大學(Syracuse University)的研究教員。Yan擁有佛蒙特大學計算機科學系的數據挖掘博士學位。她是23種出版物的作者,其中包括期刊文章,會議論文和博客文章。她的第一篇論文獲得了第17屆IEEE最佳論文獎人工智能工具國際會議。她是2015年9月出版的《使用Microsoft Azure機器學習進行預測性分析》(第二版)的審稿人之一。
Mathew Salvaris是Microsoft的數據科學家。以前,Mathew是一家小型創業公司的數據科學家,該公司為基金經理提供分析。UCL認知神經科學研究所的博士后研究員,在帕特里克·哈格德(Patrick Haggard)的自愿和自由意志領域工作,設計了模型,使用腦電圖(EEG)實時解碼運動皮層中的人類決策;他是埃塞克斯大學腦計算機接口小組的博士后,在那里他從事BCI的計算機鼠標控制工作。Mathew擁有腦機接口博士學位和分布式人工智能理學碩士學位。
利用物聯網(IoT)將機器學習應用于農業、電信和能源領域的案例研究。本書首先介紹如何設置軟件和硬件組件,包括各種傳感器,以實現Python中的案例研究。
案例研究部分首先對電信行業的物聯網電話掉線進行了研究,然后對工業機器的能源審計和預測維護進行了案例研究,最后介紹了農業企業預測現金作物歉收的技術。最后一節討論在這些領域中實現機器學習和物聯網時要避免的陷阱。
閱讀本書后,您將了解物聯網和機器學習如何在示例領域中使用,并有實際的案例研究來使用和擴展。使用Python,您將能夠使用Raspberry pi3b +和Arduino Mega 2560創建企業級應用程序。
你會學到什么
這本書是給誰的
簡介:
與微軟的人工智能平臺并駕齊驅,學習創新和加速開放和強大的工具和服務,將人工智能帶到每個數據科學家和開發人員。人工智能(AI)是新常態,深度學習算法和硬件的創新正在快速發展。這本書由微軟的數據科學專家撰寫,微軟人工智能平臺的深度學習幫助你如何在Azure上進行深度學習,并利用深度學習來創建創新和智能的解決方案。
你將學習
作者:
Mathew Salvaris博士是微軟Azure CAT的高級數據科學家,他與一組數據科學家和工程師一起為微軟的云人工智能平臺的外部公司構建機器學習和人工智能解決方案。他列舉了機器學習和深度學習方面的最新創新,為現實世界的業務問題提供新穎的解決方案,并利用從這些項目中獲得的經驗來幫助改進微軟的云人工智能產品。在加入微軟之前,他曾在一家金融科技初創公司擔任數據科學家,專門提供機器學習解決方案。
Danielle Dean博士是微軟Azure CAT的首席數據科學主管,她領導著一個數據科學家和工程師團隊,與外部公司一起利用微軟的云人工智能平臺構建人工智能解決方案。在此之前,她是諾基亞的一名數據科學家,她通過數據挖掘和數據驅動項目的統計建模,從大數據中產生了商業價值和見解,這些數據驅動項目影響了一系列的業務、產品和計劃。
題目: Machine Learning Advanced Techniques and Emerging Applications
簡介:
跨不同的工業部門、業務單位和科研社區生成、存儲和通信的數據量正在迅速擴大。移動通信和分布式/并行計算技術的最新發展使跨不同部分的生成數據的實時收集和處理成為可能。一方面,移動通信行業所支持的物聯網(IoT)連接了能夠收集異構數據的各種類型的傳感器。另一方面,計算能力的最新進展,例如圖形處理單元(gpu)中的并行處理和云計算集群上的分布式處理,使處理大量數據成為可能。有必要從大量數據(所謂的大數據)中發現重要的模式并推斷出趨勢,以增強數據驅動的決策過程。機器學習中已經開發了工具和技術,以結構化和自動化的方式從可用數據中得出有洞察力的結論。機器學習算法基于多個領域開發的概念和工具,包括統計、人工智能、信息論、認知科學和控制理論。機器學習的最新進展在不同的科學領域有廣泛的應用。這本書涵蓋了機器學習技術在智能城市、自動化工業和新興企業的廣泛應用領域的最新進展。
章節:
作者簡介:
Hamed Farhadi是瑞典斯德哥爾摩愛立信研究所的研究員。2014年在瑞典斯德哥爾摩KTH皇家理工學院獲得博士學位。2016年,他是美國馬薩諸塞州劍橋市哈佛大學的博士后研究員,2015年,他是瑞典哥德堡查爾默斯理工大學的博士后研究員。他的研究興趣主要集中在統計信號處理和機器學習等廣泛的應用領域,包括無線醫療系統、微型機器人手術、臨床數據分析和無線信息網絡。他曾獲得多項學術獎項,包括ICASSP 2014最佳學生論文獎。Farhadi博士是2015年IEEE醫學信息與通信技術國際研討會(ISMICT)的聯合主席。
主題: Machine learning over real-time streaming data with TensorFlow
報告簡介: 在流數據上應用機器學習來發現有用的信息一直是人們感興趣的話題。在物聯網傳感器、網絡交易、全球定位系統位置或社交媒體更新等許多現實應用中,不斷產生大量數據。關鍵是要有一個能夠可靠和方便地接收、預處理和提供數據的數據管道,以便進行模型推理和訓練。Yong Tang使用TensorFlow開發了用于流數據處理的TensorFlow I/O包。TensorFlow I/O由TensorFlow項目的SIG IO開發,是一個軟件包,主要關注TensorFlow的數據I/O、流和文件格式。除了機器學習本身之外,它還支持各種各樣的開源軟件和框架。在流數據領域,TensorFlow I/O為Apache Kafka、AWS kinisis和Google Cloud PubSub提供支持,這是目前應用最廣泛的流框架。TensorFlow I/O構建在tf.data之上,與簡潔的tf.keras API完全兼容。這意味著使用Kafka、kinisis和PubSub對流式數據進行模型推斷可以像一行代碼一樣簡單。再加上tf.data中的數據轉換功能,還可以直接對成批流數據進行模型訓練。除了流輸入外,TensorFlow I/O還提供流輸出支持,使得機器學習算法實時生成的數據可以返回到Kafka,從而允許其他應用程序連續接收數據。有了輸入和輸出支持,就可以用最少的組件構建以TensorFlow為中心的流媒體管道,這從長遠來看大大減少了基礎設施的維護。您將看到一個演示,展示了TensorFlow I/O使用的便利性,以及使用完整的流數據管道輕松進行機器學習的能力。
嘉賓介紹: 唐勇是美孚電子的工程總監。他為開源社區的不同容器和機器學習項目做出了貢獻。他最近的研究重點是機器學習中的數據處理。他是TensorFlow項目的提交者和SIG I/O負責人,并因對TensorFlow的貢獻而獲得了谷歌的開源同行獎。除了TensorFlow,唐勇還為開源社區的許多其他項目做出了貢獻,并且是Docker和CoreDNS項目的提交者。
報告主題: TensorFlow.js: Bringing machine learning to JavaScript
報告摘要: Java是世界上使用最廣泛的編程語言,借助TensorFlow.js,可以將TensorFlow和機器學習的功能帶入JavaScript應用程序。 Sandeep Gupta和Joseph Paul Cohen介紹了TensorFlow.js庫,并展示了將機器學習與基于JavaScript的Web,移動和服務器端應用程序相結合的驚人可能性。
嘉賓介紹: Sandeep Gupta是Google的產品經理,他在其中幫助開發和推動TensorFlow(Google的開放源代碼庫和機器學習框架)的路線圖,以支持機器學習應用程序和研究。 他的重點是改善TensorFlow的可用性并推動社區和企業的采用。 Sandeep對機器學習和AI如何以多種方式改變生活感到興奮,他與Google團隊和外部合作伙伴一起為所有人創建了強大的可擴展解決方案。 此前,Sandeep曾是GE Global Research的高級成像和分析研究與開發的技術領導者,特別側重于醫學成像和醫療分析。
Joseph Paul Cohen是Mila和蒙特利爾大學的Yoshua Bengio的博士后。 約瑟夫(Joseph)領導Mila的醫學研究小組,致力于計算機視覺,基因組學和臨床數據。 他擁有波士頓馬薩諸塞大學的計算機科學和機器學習博士學位。 他的研究興趣包括醫療保健,生物信息學,機器學習,計算機視覺,臨時網絡和網絡安全。 約瑟夫獲得了美國國家科學基金會研究生獎學金和IVADO博士后獎學金。 他是the Institute for Reproducible Research的所長,該研究所致力于利用技術改善科學研究過程。
主題: Production ML pipelines with TensorFlow Extended (TFX)
摘要: AurélienGéron致力于使用TensorFlow Extended(TFX)創建生產ML管道,并使用TFX從ML編碼過渡到ML工程。在這里可以學習者可以遍歷基礎知識,將自己的第一個管道整合在一起,然后學習如何自定義TFX組件以及對模型性能進行深入分析。
課程大綱:
邀請嘉賓: AurélienGéron,是Kiwisoft的機器學習顧問,也是O'Reilly暢銷書*《 Scikit-Learn,Keras和TensorFlow的動手機器學習》的作者*。之前,他領導YouTube的視頻分類團隊,是Wifirst 的創始人兼CTO,并曾在以下多個領域擔任顧問:金融(摩根大通和法國興業銀行),國防(加拿大國防部)和醫療保健(輸血)。他還出版了幾本技術書籍(有關C ++,WiFi和Internet體系結構),并且是巴黎多芬大學的講師。
報告主題:Advanced model deployments with TensorFlow Serving
報告摘要:
TensorFlow服務是TensorFlow生態系統的基石之一。它極大地簡化了機器學習模型的部署,并加速了模型的部署。不幸的是,機器學習工程師不熟悉TensorFlow服務的細節,他們錯過了顯著的性能提升。Hannes Hapke簡要介紹了TensorFlow服務,然后深入介紹了高級設置和用例。他介紹了先進的概念和實施建議增加TensorFlow服務設置的性能,其中包括客戶如何請求服務器模型的元信息模型,選擇最優預測模型優化吞吐量的概述,批處理請求提高吞吐量性能,支持模型的一個示例實現A / B測試,和監控TensorFlow服務設置的概述。
邀請嘉賓:
Hannes Hapke是一位機器學習愛好者和谷歌開發專家。他將深度學習應用于各種計算機視覺和自然語言問題,主要興趣在于機器學習基礎設施和自動化模型工作流。Hannes是《自然語言處理在行動中的作用》一書的合著者,他正在為O 'Reilly使用TensorFlow構建機器學習管道。
報告主題:How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE)
報告摘要:
數據量和復雜性每天都在增加,因此,公司必須了解其業務需求才能保持競爭優勢。得益于AI,機器學習和深度學習(DL)項目(例如Apache Spark,H2O,TensorFlow和Horovod),這些組織不再需要鎖定特定的供應商技術或專有解決方案來維持這種競爭優勢。這些功能豐富的深度學習應用程序可直接從開源社區獲得,其中包含針對特定用例量身定制的許多不同算法和選項。 企業面臨的最大挑戰之一是如何以一種簡單且一致的方式部署這些開源工具(請記住,其中一些工具具有操作系統內核和軟件組件)。例如,TensorFlow可以利用NVIDIA GPU資源,但是在GPU上運行TensorFlow要求用戶在主機上設置NVIDIA CUDA庫,并安裝和配置TensorFlow應用程序以利用GPU計算工具。設備驅動程序,庫和軟件版本的組合可能令人望而生畏,并可能對許多用戶造成失敗。 此外,由于GPU是一種高級資源,因此組織希望最大限度地利用它們。使用這些資源的群集需要按需配置,并在計算完成后立即釋放。 Docker容器是啟用這種即時集群置備和取消置備的理想選擇。它們還確保可重復且一致的部署。 Thomas Phelan演示了如何在安全的多租戶環境中使用Docker容器上的GPU硬件加速功能來部署AI,ML和DL應用程序,包括Spark,TensorFlow和Horovod。在Docker容器中使用基于GPU的服務確實需要仔細考慮,因此他還將探索一些最佳實踐。
嘉賓簡介
Thomas Phelan是BlueData的聯合創始人兼首席架構師。 此前,Silicon Graphics原始團隊的成員設計并實現了XFS,這是第一個商業上可用的64位文件系統。 他是VMware的一名早期員工,一名高級工程師和ESX存儲體系結構團隊的關鍵成員,他在其中設計和開發了ESX存儲I / O負載平衡子系統和模塊化可插拔存儲體系結構,并領導了許多關鍵團隊 存儲計劃,例如云存儲網關和vFlash。
報告主題:Building and deploying AI applications and systems at scale
報告摘要:Ben Lorica和Roger Chen回顧了當今公司如何構建AI應用程序。
邀請嘉賓:
Ben Lorica,是O'Reilly的首席數據科學家。Ben在各種環境中應用了商業智能,數據挖掘,機器學習和統計分析,包括直接營銷,消費者和市場研究,定向廣告,文本挖掘和金融工程。他的背景包括在一家投資管理公司,互聯網初創公司和金融服務公司任職。
羅杰·陳(Roger Chen),是Computable 聯合創始人兼首席執行官,還是O'Reilly人工智能會議的計劃主席。在此之前,他是O'Reilly AlphaTech Ventures(OATV)的負責人,在那里他投資于早期創業公司并與之合作,主要從事數據,機器學習和機器人技術領域。羅杰(Roger)具有深厚的動手技術歷史。在初創公司和風險投資之前,他是Oracle,EMC和Vicor 的工程師。他還開發了新型納米和量子光學技術為加州大學伯克利分校的博士研究員。羅杰擁有波士頓大學的學士學位和加州大學伯克利分校博士學位,無論是在電氣工程。
主題: Safe and Fair Machine Learning
簡介:
在這個演講將討論一些我們的未來的工作在一個新的框架設計的機器學習算法,內容包括:1)使得算法的用戶更容易定義他們認為是不受歡迎的行為(例如,他們認為是不公平的,不安全,或者成本);2)提供了一個高信任度保證它不會產生一個解決方案,展示了用戶定義的不受歡迎的行為。
作者簡介:
Philip Thomas是馬薩諸塞大學安姆斯特分校信息與計算機科學學院助理教授,自主學習實驗室聯合主任。之前是卡內基·梅隆大學(CMU)的博士后,2015年,在馬薩諸塞州立大學阿默斯特分校(UMass Amherst)獲得了計算機科學博士學位。主要研究如何確保人工智能(AI)系統的安全性,重點是確保機器學習(ML)算法的安全性和公平性以及創建安全和實用的強化學習(RL)算法。