報告主題:Executive Briefing: Advances in privacy for machine learning systems
報告摘要: 我們在機器學習系統中實現隱私的程度是多少呢?Katharine Jarmul深入探討了隱私測量方面的最新進展,并解釋了這如何改變了機器學習中的隱私方法。那么將發現新的技術,包括差分私有數據收集,聯合學習和同態技術。并且還探討了自機器學習問世以來,為什么隱私變得越來越重要,以及像Apple這樣的公司為最終用戶保留隱私的努力。如果隱私變得更加重要,這將如何影響整個機器學習社區,以及與技術和理論討論交織在一起的其他更深層次的問題。
邀請嘉賓:Katharine Jarmul
嘉賓簡介
Katharine Jarmul是KIProtect的聯合創始人,是一位熱情高漲且享譽國際的數據科學家,程序員和講師。她的工作和研究專注于保護數據科學工作流的數據。在此之前,她曾在美國和德國的大型公司和初創公司中擔任過多個職務,負責實施數據處理和機器學習系統,重點是可靠性,可測試性和安全性。她是O'Reilly的作者,經常在國際軟件大會上作主題演講。
題目: An Overview of Privacy in Machine Learning
序言: 在過去幾年中,谷歌、微軟和亞馬遜等供應商已經開始為客戶提供軟件接口,使他們能夠輕松地將機器學習任務嵌入到他們的應用程序中。總的來說,機構現在可以使用機器學習作為服務(MLaaS)引擎來外包復雜的任務,例如訓練分類器、執行預測、聚類等等。他們還可以讓其他人根據他們的數據查詢模型。當然,這種方法也可以在其他情況下使用(并且經常提倡使用),包括政府協作、公民科學項目和企業對企業的伙伴關系。然而,如果惡意用戶能夠恢復用于訓練這些模型的數據,那么由此導致的信息泄漏將會產生嚴重的問題。同樣,如果模型的內部參數被認為是專有信息,那么對模型的訪問不應該允許對手了解這些參數。在本文中,我們對這一領域的隱私挑戰進行了回顧,系統回顧了相關的研究文獻,并探討了可能的對策。具體地說,我們提供了大量關于機器學習和隱私相關概念的背景信息。然后,我們討論了可能的對抗模型和設置,涵蓋了與隱私和/或敏感信息泄漏有關的廣泛攻擊,并回顧了最近試圖防御此類攻擊的結果。最后,我們總結出一系列需要更多工作的開放問題,包括需要更好的評估、更有針對性的防御,以及研究與政策和數據保護工作的關系。
題目: Survey of Personalization Techniques for Federated Learning
簡介:
聯邦學習使機器學習模型可以從分散的數據中學習,而不會損害隱私。 聯邦學習的標準制定為所有客戶提供了一種共享模型。 由于跨設備的非IID數據分布造成的統計異質性通常導致以下情況:對于某些客戶,僅對自己的私有數據進行訓練的局部模型的性能要優于全局共享模型,從而喪失了參與該過程的動力。 已經提出了幾種技術來個性化全局模型,以更好地為單個客戶服務。 本文強調了個性化的必要性,并對有關該主題的最新研究進行了調查。
目錄:
題目
2019/2020之交的機器學習/深度學習技術概述
總覽
簡介
2020年已至!現在是時候迎接新的一年了,我們在全新的解決方案中注入了大量的機器學習知識。機器學習將繼續是我們做事和做事的核心。
那2019年呢?已經過了一年了!我們在自然語言處理(NLP)中看到的巨大發展震驚了我們。那一年是微調語言模型和框架的一年,例如Google的BERT和OpenAI的GPT-2(稍后將介紹所有這些!)。 我們最喜歡的2019年是社區對開源版本的擁抱。隨著越來越多的社區人士希望在2020年打入這一領域,他們進一步降低了機器學習的訪問障礙。這是您的全部志向和這一美妙的職業選擇!
因此,當我們準備迎接新的一年時,我們希望花些時間寫下這篇廣博而發人深省的文章。我們將以技術審查的方式審視2019年頂級的機器學習發展。我們還將研究2020年對不同機器學習領域的期望。
內容
題目: Machine learning and the physical sciences
摘要:
機器學習(ML)包含廣泛的算法和建模工具,用于大量的數據處理任務,這些任務近年來已經進入大多數科學學科。本文有選擇地回顧了機器學習與物理科學接口的最新研究進展。這包括由物理洞察力驅動的ML的概念發展,機器學習技術在物理中的幾個領域的應用以及這兩個領域之間的交叉。在介紹了機器學習方法和原理的基本概念之后,舉例說明了如何用統計物理來理解ML中的方法,然后介紹了ML方法在粒子物理和宇宙學、量子多體物理、量子計算、化學和材料物理中的應用。此外,還強調了針對加速ML的新型計算體系結構的研究和開發。每個部分都描述了最近的成功以及特定領域的方法和挑戰。
作者簡介:
Giuseppe Carleo于2018年加入了位于美國計算量子物理中心的Flatiron研究所。2007年,他在羅馬大學獲得物理學學士學位;2011年,他在意大利國際高等研究學院獲得凝聚態理論博士學位。他在法國光學研究所和瑞士蘇黎世聯邦理工學院獲得博士后。他也是蘇黎世聯邦理工學院計算量子物理學的講師。Carleo的主要研究方向是發展先進的數值算法來研究強相互作用量子系統的挑戰性問題。他的研究應用范圍包括凝聚態物質、超冷原子和量子計算。他對量子蒙特卡羅方法的發展做出了貢獻,包括平衡和動態特性,包括時變蒙特卡羅和神經網絡量子態。在CCQ,他正在開發和推廣基于人工智能的新技術來解決量子問題。他是開源項目NetKet的創始人和開發負責人。
報告主題: TensorFlow, open source, and IBM
報告摘要: IBM長期致力于為客戶帶來最大利益的開源項目,并且公司多年來一直致力于為企業數據科學問題構建負責任的解決方案。本報告了解IBM在開源軟件TensorFlow,構建AI解決方案中的作用,以及IBM對最新版本(2.0)的興奮之處。
嘉賓介紹: Fred Reiss,加州大學伯克利分校博士,現在是位于舊金山的IBM Spark技術中心的首席架構師,并且是該中心的創始員工之一。 在此之前,他曾在IBM Research – Almaden工作,從事SystemML和SystemT項目以及DB2 with BLU Acceleration的研究原型。 弗雷德(Fred)擁有超過25種經過同行評審的出版物和6項專利。
主題: TensorFlow community announcements
摘要: Kemal El Moujahid透露了TensorFlow社區令人興奮的發展。加入以了解TensorFlow團隊如何為開發人員和企業成功提供新的和改進的資源。
邀請嘉賓: Kemal El Moujahid,是Google TensorFlow的產品總監。他熱衷于解決AI的重大問題并建立充滿活力的開發者社區。此前,凱末爾(Kemal)領導了Facebook的虛擬助手M,Messenger Platform和Wit.ai。凱末爾(Kalal)擁有巴黎高等理工學院和巴黎電信的學位,以及斯坦福大學商學院的MBA學位。
報告主題: TensorFlow.js: Bringing machine learning to JavaScript
報告摘要: Java是世界上使用最廣泛的編程語言,借助TensorFlow.js,可以將TensorFlow和機器學習的功能帶入JavaScript應用程序。 Sandeep Gupta和Joseph Paul Cohen介紹了TensorFlow.js庫,并展示了將機器學習與基于JavaScript的Web,移動和服務器端應用程序相結合的驚人可能性。
嘉賓介紹: Sandeep Gupta是Google的產品經理,他在其中幫助開發和推動TensorFlow(Google的開放源代碼庫和機器學習框架)的路線圖,以支持機器學習應用程序和研究。 他的重點是改善TensorFlow的可用性并推動社區和企業的采用。 Sandeep對機器學習和AI如何以多種方式改變生活感到興奮,他與Google團隊和外部合作伙伴一起為所有人創建了強大的可擴展解決方案。 此前,Sandeep曾是GE Global Research的高級成像和分析研究與開發的技術領導者,特別側重于醫學成像和醫療分析。
Joseph Paul Cohen是Mila和蒙特利爾大學的Yoshua Bengio的博士后。 約瑟夫(Joseph)領導Mila的醫學研究小組,致力于計算機視覺,基因組學和臨床數據。 他擁有波士頓馬薩諸塞大學的計算機科學和機器學習博士學位。 他的研究興趣包括醫療保健,生物信息學,機器學習,計算機視覺,臨時網絡和網絡安全。 約瑟夫獲得了美國國家科學基金會研究生獎學金和IVADO博士后獎學金。 他是the Institute for Reproducible Research的所長,該研究所致力于利用技術改善科學研究過程。
報告主題:Executive Briefing: Will you learn Chinese to advance in AI?
報告摘要:
中國計劃跨越式發展人工智能,并向世界宣布到2025年將成為世界領先者,從而明確表明了這種意圖。根據艾倫人工智能研究所(AI2)d的研究,中國正在順利前進到2025年,在美國AI研究論文中被引用率最高的1%上超過美國,這表明中國研究人員發表的論文質量有所提高。
隨著AI研究在中國日趨成熟,隨著語言問題創造出不對稱信息,它也成為了自己獨特的社區。世界其他地區必須對技術領導力的轉變持開放態度,同時提供合作機會,并始終圍繞隱私,偏見和自主武器等問題保持堅定立場,以便也能從這種技術進步中受益。
Charlotte Han探索了中國政府的資金,文化以及對海量數據池的訪問對AI發展的意義,以及世界如何從這種進步中受益。
邀請嘉賓:Charlotte Han
嘉賓簡介
Charlotte Han處理數據并計算品牌和數字策略。由于在亞洲長大,在硅谷成為美國人,現在生活在歐洲,她學會了不要將事情視為理所當然,并在看起來不明顯的地方建立聯系。她對技術的所有事物都非常感興趣,尤其是技術如何改善人們的生活,并享受與不適應,叛逆者和麻煩制造者的網絡,這些人不怕動搖一切并突破可能的極限。
報告主題:For AI to thrive, failure is necessary: A practical guide (sponsored by IBM Watson)
報告核心:
Ritika Gunnar通過研究分析為什么需要關注組織的文化并建立以數據為中心的方法來組建一個強大的,支持AI的組織。
嘉賓簡介
Ritika Gunnar ,IBM數據和AI專家服務與學習的副總裁。她和她的團隊一起通過數據優先和AI優先的方法與客戶合作,并使用基于知識的技能幫助實施數據和AI解決方案,以加快數據和AI企業功能的采用。之前,Ritika曾擔任IBM Watson產品副總裁,負責Watson的所有數據和AI產品組合,定義了產品組合戰略,產品執行和推動業務成果。她曾擔任IBM全球云和認知GTM組織的副總裁;曾擔任IBM數據和分析業務副總裁,負責制定IBM數據平臺,數據科學和分析實踐的戰略和執行;她領導并管理著IBM的主數據管理和信息集成與治理業務以及IBM的數據倉庫和分析業務。她于1999年以軟件工程師的身份加入IBM。Ritika擁有德克薩斯大學奧斯汀分校的計算機科學學士學位和商業管理碩士學位。
報告主題:Executive Briefing: From laggard to leader—Winning the AI race
報告摘要: 與落后組織相比,領先組織的分析價值已超過60%。盡管如此,只有8%的公司從其分析投資中獲得了可觀的價值,甚至更少的公司可以量化分析對其業務的影響。挑戰在于建立變革,并知道從哪里開始。Google分析影響指數可幫助組織了解分析對底線的影響以及從分析中獲取最大價值以及量化其計劃成熟步伐所需的能力。
Anastasia Kouvela和Bharath Thota會帶您了解去年的結果,在這些結果中,參與組織的基準分為四個階段:落后者,追隨者,探險者和領導者。價值的幾個關鍵驅動力推動了分析的成功,包括在最高領導層中將清晰定義的分析策略集成到業務中,促進知識共享和技能開發的組織結構以及鼓勵分析實驗的數據驅動文化,由數據倉庫支持,可以訪問維護良好的實時數據。
邀請嘉賓:Anastasia Kouvela、Bharath Thota
嘉賓簡介
Anastasia Kouvela是AT Kearney的負責人,在咨詢領域擁有超過10年的經驗。她領導著跨行業的國際大規模運營轉型,并以提供具有影響力的轉型計劃著稱,該計劃致力于解決合并后的運營整合,成本優化,復雜性降低以及供應鏈和物流優化問題。Anastasia對分析和AI充滿熱情。
Bharath Thota是AT Kearney分析業務部門的副總裁,在數據科學,高級分析和技術的應用方面擁有14年以上的深厚專業知識,可幫助客戶進行分析轉型,改善業務績效,推動卓越運營并變得更加洞察力。他為研究做出了貢獻,并撰寫了有關大數據的主題。