論文題目
機器學習在固體材料科學中的最新進展和應用,Recent advances and applications of machine learning in solidstate materials science
論文簡介
近年來進入材料科學工具箱的最令人興奮的工具之一是機器學習。這些統計方法已經證明能夠大大加快基礎和應用研究的速度。目前,我們正在見證一個爆炸性的工作,開發和應用機器學習的固態系統。我們對本課題的最新研究進行了全面的綜述和分析。作為起點,我們介紹了材料科學中的機器學習原理、算法、描述符和數據庫。我們繼續描述不同的機器學習方法,以發現穩定的材料并預測其晶體結構。然后我們討論了大量的定量結構-性質關系的研究,以及用機器學習代替第一性原理方法的各種方法。我們回顧了如何應用主動學習和基于代理的優化來改進rational設計過程和相關的應用實例。兩個主要的問題總是機器學習模型的可解釋性和從中獲得的物理理解。因此,我們考慮可解釋性的不同方面及其在材料科學中的重要性。最后,針對計算材料科學面臨的各種挑戰,提出了解決方案和未來的研究路徑。
論文作者
Jonathan Schmidt,Mário R. G. Marques,來自馬丁路德大學 物理研究所
本文綜述了元學習在圖像分類、自然語言處理和機器人技術等領域的應用。與深度學習不同,元學習使用較少的樣本數據集,并考慮進一步改進模型泛化以獲得更高的預測精度。我們將元學習模型歸納為三類: 黑箱適應模型、基于相似度的方法模型和元學習過程模型。最近的應用集中在將元學習與貝葉斯深度學習和強化學習相結合,以提供可行的集成問題解決方案。介紹了元學習方法的性能比較,并討論了今后的研究方向。
主題: A Review on Deep Learning Techniques for Video Prediction
摘要: 預測,預期和推理未來結果的能力是智能決策系統的關鍵組成部分。鑒于深度學習在計算機視覺中的成功,基于深度學習的視頻預測已成為有前途的研究方向。視頻預測被定義為一種自我監督的學習任務,它代表了一個表示學習的合適框架,因為它展示了提取自然視頻中潛在模式的有意義的表示的潛在能力。視頻序列預測的深度學習方法。我們首先定義視頻預測的基礎知識,以及強制性的背景概念和最常用的數據集。接下來,我們會仔細分析根據擬議的分類法組織的現有視頻預測模型,突出顯示它們的貢獻及其在該領域的意義。數據集和方法的摘要均附有實驗結果,有助于在定量基礎上評估現有技術。通過得出一些一般性結論,確定開放研究挑戰并指出未來的研究方向來對本文進行總結。
題目: Data Science in Economics
摘要:
本文介紹了經濟學中數據科學的發展現狀,通過在數據科學中的一個新的分類應用和方法的研究進展。數據科學的研究進展分為三類:深度學習模型、集成模型和混合模型。應用領域包括股票市場、市場營銷、電子商務、企業銀行和加密貨幣。Prisma方法是一種系統的文獻綜述方法,用于保證調查的質量。結果表明,混合模型的發展趨勢為51%以上的文獻采用了混合模型。另一方面,我們發現基于RMSE精度度量的混合模型具有比其他算法更高的預測精度,然而這是預期的趨勢走向先進的深度學習模型。
題目: Exploring Benefits of Transfer Learning in Neural Machine Translation
摘要: 眾所周知,神經機器翻譯需要大量的并行訓練語句,這通常會妨礙它在低資源語言對上的優勢。本文探討了跨語言遷移學習在神經網絡中的應用,以解決資源匱乏的問題。我們提出了幾種轉移學習方法來重用預先訓練在高資源語言對上的模型。我們特別注意技術的簡單性。我們研究了兩種情形:(a)當我們重用高資源模型而不事先修改其訓練過程時;(b)當我們可以預先準備第一階段的高資源模型用于轉移學習時。對于前一個場景,我們通過重用其他研究人員訓練的模型,提出了一種概念證明方法。在后一種情況下,我們提出了一種在翻譯性能上得到更大改進的方法。除了提出的技術外,我們還著重于對遷移學習技術進行深入的分析,并試圖對遷移學習的改進有所啟發。我們展示了我們的技術如何解決低資源語言的特定問題,甚至在高資源轉移學習中也是適用的。我們通過研究轉移學習在各種情況下的潛在缺陷和行為,例如,在人為損壞的訓練語料庫下,或者在固定的模型部分下。
作者簡介: Tom Kocmi,查爾斯特大學,數學與物理學院,形式與應用語言學研究所博士,他的主要研究方向是基于神經網絡的機器翻譯。個人主頁://ufal.mff.cuni.cz/tom-kocmi
主題: Algorithmic Machine Learning and Data Science
介紹: 本課程數學嚴謹,需要以前的機器學習課程(例如CS-UY 4563、CS-GY 6923或ECE-GY 6143)和以前的算法設計和分析課程(例如CS-UY 2413、CS-GY 6033或CS-GY 6043)為基礎。
講師介紹: Christopher Musco,紐約大學坦頓工程學院計算機科學與工程的助理教授。他的研究是關于機器學習和數據科學的算法基礎。他在麻省理工學院完成了計算機科學博士學位。在麻省理工學院之前,他是Redfin的工程師。
論文題目
數據科學中有關矩陣方法的文獻綜述:A LITERATURE SURVEY OF MATRIX METHODS FOR DATASCIENCE
論文摘要
高效的數值線性代數是所有科學和工業學科中許多應用的核心組成部分。通過這項調查,我們想說明,隨著數據和計算資源的可用性推動了許多新的發展,數字線性代數在支持和改進數據科學計算方面已經發揮并正在發揮關鍵作用。從數據中提取信息的研究已成為業務,工程,基礎研究甚至文化的主要驅動力。 在這里,我們將數據科學視為借鑒了機器學習,數據挖掘和許多其他數學領域(例如優化或統計)的要素。 此外,我們要指出,為了從數據中獲取信息,不一定意味著數據很大,但通常它們是這樣的。
論文作者
MARTIN STOLL
題目: Machine learning and the physical sciences
摘要:
機器學習(ML)包含廣泛的算法和建模工具,用于大量的數據處理任務,這些任務近年來已經進入大多數科學學科。本文有選擇地回顧了機器學習與物理科學接口的最新研究進展。這包括由物理洞察力驅動的ML的概念發展,機器學習技術在物理中的幾個領域的應用以及這兩個領域之間的交叉。在介紹了機器學習方法和原理的基本概念之后,舉例說明了如何用統計物理來理解ML中的方法,然后介紹了ML方法在粒子物理和宇宙學、量子多體物理、量子計算、化學和材料物理中的應用。此外,還強調了針對加速ML的新型計算體系結構的研究和開發。每個部分都描述了最近的成功以及特定領域的方法和挑戰。
作者簡介:
Giuseppe Carleo于2018年加入了位于美國計算量子物理中心的Flatiron研究所。2007年,他在羅馬大學獲得物理學學士學位;2011年,他在意大利國際高等研究學院獲得凝聚態理論博士學位。他在法國光學研究所和瑞士蘇黎世聯邦理工學院獲得博士后。他也是蘇黎世聯邦理工學院計算量子物理學的講師。Carleo的主要研究方向是發展先進的數值算法來研究強相互作用量子系統的挑戰性問題。他的研究應用范圍包括凝聚態物質、超冷原子和量子計算。他對量子蒙特卡羅方法的發展做出了貢獻,包括平衡和動態特性,包括時變蒙特卡羅和神經網絡量子態。在CCQ,他正在開發和推廣基于人工智能的新技術來解決量子問題。他是開源項目NetKet的創始人和開發負責人。
講座題目
Recent Progress in Zeroth Order Optimization and Its Applications to Adversarial Robustness in Data Mining and Machine Learning
講座簡介
當梯度的顯式表達式很難或不可能獲得時,零階(ZO)優化越來越被用來解決大數據和機器學習問題。它通過有效梯度估計近似全梯度實現無梯度優化。最近的一些重要應用包括:a)產生對深度神經網絡的預測規避、黑箱對抗攻擊;b)計算能力有限的在線網絡管理;c)黑箱/復雜系統的參數推斷;d)根據損失函數部分反饋的bandit優化她的對手所揭示的價值觀。 本教程旨在全面介紹ZO優化方法在理論和應用方面的最新進展。在理論方面,我們將討論ZO算法的收斂速度和迭代復雜性分析,并與它們的一階對應進行比較。在應用方面,我們將重點介紹ZO優化在研究深層神經網絡魯棒性方面的一個很有吸引力的應用-從黑箱機器學習模型生成對抗性示例的實用有效的對抗性攻擊。我們還將總結有關ZO優化、大數據挑戰和一些開放式數據挖掘和機器學習問題的潛在研究方向。
講座嘉賓
Pin-Yu Chen 是麻省理工學院-IBM人工智能實驗室,IBM Thomas J.Watson研究中心,可信人工智能小組和PI的研究人員。最近的研究重點是對抗性機器學習和神經網絡的魯棒性,更廣泛地說,使機器學習值得信賴。我的研究興趣還包括圖形學習、網絡數據分析及其在數據挖掘、機器學習、信號處理和網絡安全中的應用。
論文主題: Recent Advances in Deep Learning for Object Detection
論文摘要: 目標檢測是計算機視覺中的基本視覺識別問題,并且在過去的幾十年中已得到廣泛研究。目標檢測指的是在給定圖像中找到具有精確定位的特定目標,并為每個目標分配一個對應的類標簽。由于基于深度學習的圖像分類取得了巨大的成功,因此近年來已經積極研究了使用深度學習的對象檢測技術。在本文中,我們對深度學習中視覺對象檢測的最新進展進行了全面的調查。通過復習文獻中最近的大量相關工作,我們系統地分析了現有的目標檢測框架并將調查分為三個主要部分:(i)檢測組件,(ii)學習策略(iii)應用程序和基準。在調查中,我們詳細介紹了影響檢測性能的各種因素,例如檢測器體系結構,功能學習,建議生成,采樣策略等。最后,我們討論了一些未來的方向,以促進和刺激未來的視覺對象檢測研究。與深度學習。
【北京郵電大學】機器學習在材料科學中的應用綜述,Machine learning in materials science //onlinelibrary.wiley.com/doi/pdf/10.1002/inf2.12028