報告主題:Executive Briefing: Will you learn Chinese to advance in AI?
報告摘要:
中國計劃跨越式發展人工智能,并向世界宣布到2025年將成為世界領先者,從而明確表明了這種意圖。根據艾倫人工智能研究所(AI2)d的研究,中國正在順利前進到2025年,在美國AI研究論文中被引用率最高的1%上超過美國,這表明中國研究人員發表的論文質量有所提高。
隨著AI研究在中國日趨成熟,隨著語言問題創造出不對稱信息,它也成為了自己獨特的社區。世界其他地區必須對技術領導力的轉變持開放態度,同時提供合作機會,并始終圍繞隱私,偏見和自主武器等問題保持堅定立場,以便也能從這種技術進步中受益。
Charlotte Han探索了中國政府的資金,文化以及對海量數據池的訪問對AI發展的意義,以及世界如何從這種進步中受益。
邀請嘉賓:Charlotte Han
嘉賓簡介
Charlotte Han處理數據并計算品牌和數字策略。由于在亞洲長大,在硅谷成為美國人,現在生活在歐洲,她學會了不要將事情視為理所當然,并在看起來不明顯的地方建立聯系。她對技術的所有事物都非常感興趣,尤其是技術如何改善人們的生活,并享受與不適應,叛逆者和麻煩制造者的網絡,這些人不怕動搖一切并突破可能的極限。
題目: Learning@home: Crowdsourced Training of Large Neural Networks with Decentralized Mixture-of-Experts
摘要:
最近在深度學習方面的許多突破都是通過在海量數據集上訓練越來越大的模型實現的。然而,訓練這樣的模型可能會非常昂貴。例如,威震天在一個價值2500萬美元的GPU集群上訓練了83億參數的語言模型。因此,大多數研究人員無法負擔訓練最先進模型的費用并為其發展作出貢獻。假設,研究人員可以用志愿者提供的數千臺常規PC來眾包大型神經網絡的訓練。1萬臺價值2500美元的臺式機的原始計算能力使價值2500萬美元的服務器pod相形見絀,但是使用傳統的分布式訓練方法無法有效地利用這種能力。在這項工作中,我們提出了Learning@home:一種神經網絡訓練范式,用于處理數百萬連接不良的參與者。我們分析了該范例的性能、可靠性和架構約束,并將其與現有的分布式培訓技術進行了比較。
報告主題: TensorFlow, open source, and IBM
報告摘要: IBM長期致力于為客戶帶來最大利益的開源項目,并且公司多年來一直致力于為企業數據科學問題構建負責任的解決方案。本報告了解IBM在開源軟件TensorFlow,構建AI解決方案中的作用,以及IBM對最新版本(2.0)的興奮之處。
嘉賓介紹: Fred Reiss,加州大學伯克利分校博士,現在是位于舊金山的IBM Spark技術中心的首席架構師,并且是該中心的創始員工之一。 在此之前,他曾在IBM Research – Almaden工作,從事SystemML和SystemT項目以及DB2 with BLU Acceleration的研究原型。 弗雷德(Fred)擁有超過25種經過同行評審的出版物和6項專利。
主題: TensorFlow community announcements
摘要: Kemal El Moujahid透露了TensorFlow社區令人興奮的發展。加入以了解TensorFlow團隊如何為開發人員和企業成功提供新的和改進的資源。
邀請嘉賓: Kemal El Moujahid,是Google TensorFlow的產品總監。他熱衷于解決AI的重大問題并建立充滿活力的開發者社區。此前,凱末爾(Kemal)領導了Facebook的虛擬助手M,Messenger Platform和Wit.ai。凱末爾(Kalal)擁有巴黎高等理工學院和巴黎電信的學位,以及斯坦福大學商學院的MBA學位。
報告主題:How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE)
報告摘要:
數據量和復雜性每天都在增加,因此,公司必須了解其業務需求才能保持競爭優勢。得益于AI,機器學習和深度學習(DL)項目(例如Apache Spark,H2O,TensorFlow和Horovod),這些組織不再需要鎖定特定的供應商技術或專有解決方案來維持這種競爭優勢。這些功能豐富的深度學習應用程序可直接從開源社區獲得,其中包含針對特定用例量身定制的許多不同算法和選項。 企業面臨的最大挑戰之一是如何以一種簡單且一致的方式部署這些開源工具(請記住,其中一些工具具有操作系統內核和軟件組件)。例如,TensorFlow可以利用NVIDIA GPU資源,但是在GPU上運行TensorFlow要求用戶在主機上設置NVIDIA CUDA庫,并安裝和配置TensorFlow應用程序以利用GPU計算工具。設備驅動程序,庫和軟件版本的組合可能令人望而生畏,并可能對許多用戶造成失敗。 此外,由于GPU是一種高級資源,因此組織希望最大限度地利用它們。使用這些資源的群集需要按需配置,并在計算完成后立即釋放。 Docker容器是啟用這種即時集群置備和取消置備的理想選擇。它們還確保可重復且一致的部署。 Thomas Phelan演示了如何在安全的多租戶環境中使用Docker容器上的GPU硬件加速功能來部署AI,ML和DL應用程序,包括Spark,TensorFlow和Horovod。在Docker容器中使用基于GPU的服務確實需要仔細考慮,因此他還將探索一些最佳實踐。
嘉賓簡介
Thomas Phelan是BlueData的聯合創始人兼首席架構師。 此前,Silicon Graphics原始團隊的成員設計并實現了XFS,這是第一個商業上可用的64位文件系統。 他是VMware的一名早期員工,一名高級工程師和ESX存儲體系結構團隊的關鍵成員,他在其中設計和開發了ESX存儲I / O負載平衡子系統和模塊化可插拔存儲體系結構,并領導了許多關鍵團隊 存儲計劃,例如云存儲網關和vFlash。
報告主題:For AI to thrive, failure is necessary: A practical guide (sponsored by IBM Watson)
報告核心:
Ritika Gunnar通過研究分析為什么需要關注組織的文化并建立以數據為中心的方法來組建一個強大的,支持AI的組織。
嘉賓簡介
Ritika Gunnar ,IBM數據和AI專家服務與學習的副總裁。她和她的團隊一起通過數據優先和AI優先的方法與客戶合作,并使用基于知識的技能幫助實施數據和AI解決方案,以加快數據和AI企業功能的采用。之前,Ritika曾擔任IBM Watson產品副總裁,負責Watson的所有數據和AI產品組合,定義了產品組合戰略,產品執行和推動業務成果。她曾擔任IBM全球云和認知GTM組織的副總裁;曾擔任IBM數據和分析業務副總裁,負責制定IBM數據平臺,數據科學和分析實踐的戰略和執行;她領導并管理著IBM的主數據管理和信息集成與治理業務以及IBM的數據倉庫和分析業務。她于1999年以軟件工程師的身份加入IBM。Ritika擁有德克薩斯大學奧斯汀分校的計算機科學學士學位和商業管理碩士學位。
報告主題:Executive Briefing: From laggard to leader—Winning the AI race
報告摘要: 與落后組織相比,領先組織的分析價值已超過60%。盡管如此,只有8%的公司從其分析投資中獲得了可觀的價值,甚至更少的公司可以量化分析對其業務的影響。挑戰在于建立變革,并知道從哪里開始。Google分析影響指數可幫助組織了解分析對底線的影響以及從分析中獲取最大價值以及量化其計劃成熟步伐所需的能力。
Anastasia Kouvela和Bharath Thota會帶您了解去年的結果,在這些結果中,參與組織的基準分為四個階段:落后者,追隨者,探險者和領導者。價值的幾個關鍵驅動力推動了分析的成功,包括在最高領導層中將清晰定義的分析策略集成到業務中,促進知識共享和技能開發的組織結構以及鼓勵分析實驗的數據驅動文化,由數據倉庫支持,可以訪問維護良好的實時數據。
邀請嘉賓:Anastasia Kouvela、Bharath Thota
嘉賓簡介
Anastasia Kouvela是AT Kearney的負責人,在咨詢領域擁有超過10年的經驗。她領導著跨行業的國際大規模運營轉型,并以提供具有影響力的轉型計劃著稱,該計劃致力于解決合并后的運營整合,成本優化,復雜性降低以及供應鏈和物流優化問題。Anastasia對分析和AI充滿熱情。
Bharath Thota是AT Kearney分析業務部門的副總裁,在數據科學,高級分析和技術的應用方面擁有14年以上的深厚專業知識,可幫助客戶進行分析轉型,改善業務績效,推動卓越運營并變得更加洞察力。他為研究做出了貢獻,并撰寫了有關大數據的主題。
報告主題:Executive Briefing: Advances in privacy for machine learning systems
報告摘要: 我們在機器學習系統中實現隱私的程度是多少呢?Katharine Jarmul深入探討了隱私測量方面的最新進展,并解釋了這如何改變了機器學習中的隱私方法。那么將發現新的技術,包括差分私有數據收集,聯合學習和同態技術。并且還探討了自機器學習問世以來,為什么隱私變得越來越重要,以及像Apple這樣的公司為最終用戶保留隱私的努力。如果隱私變得更加重要,這將如何影響整個機器學習社區,以及與技術和理論討論交織在一起的其他更深層次的問題。
邀請嘉賓:Katharine Jarmul
嘉賓簡介
Katharine Jarmul是KIProtect的聯合創始人,是一位熱情高漲且享譽國際的數據科學家,程序員和講師。她的工作和研究專注于保護數據科學工作流的數據。在此之前,她曾在美國和德國的大型公司和初創公司中擔任過多個職務,負責實施數據處理和機器學習系統,重點是可靠性,可測試性和安全性。她是O'Reilly的作者,經常在國際軟件大會上作主題演講。
報告主題:Start your engines: Real-time AI for entity resolution
報告摘要: 實體解析(確定“誰是誰”和“誰與誰相關”)對于幾乎每個行業都至關重要,包括銀行,保險,醫療保健,市場營銷,電信,社會服務等。杰夫·喬納斯(Jeff Jonas)詳細介紹了如何使用為通用實體解析而創建的專用實時AI,以獲取新見解并更快地做出更好的決策。
邀請嘉賓:Jeff Jonas是Senzing 的創始人兼首席執行官,是一位備受贊譽的數據科學家,也是實體解析系統的主要創造者。他創立了Senzing,其目標是使實體解析技術適用于世界各地的所有人。在過去的三十多年中,他一直處于為公司和政府解決復雜的大數據問題的最前沿。他是一個三次創業者和出售他的最后公司IBM在2005年之前,他是一個IBM研究員和上下文計算的首席科學家在IBM,在那里他領導的團隊專注于為實體解析技術打造新一代AI。