【北京郵電大學】機器學習在材料科學中的應用綜述,Machine learning in materials science //onlinelibrary.wiley.com/doi/pdf/10.1002/inf2.12028
這本受歡迎的教科書的第一版,當代人工智能,提供了一個學生友好的人工智能介紹。這一版完全修訂和擴大更新,人工智能: 介紹機器學習,第二版,保留相同的可訪問性和解決問題的方法,同時提供新的材料和方法。
該書分為五個部分,重點介紹了人工智能中最有用的技術。書的第一部分涵蓋了基于邏輯的方法,而第二部分著重于基于概率的方法。第三部分是涌現智能的特點,探討了基于群體智能的進化計算和方法。接下來的最新部分將提供神經網絡和深度學習的詳細概述。書的最后一部分著重于自然語言的理解。
適合本科生和剛畢業的研究生,本課程測試教材為學生和其他讀者提供關鍵的人工智能方法和算法,以解決具有挑戰性的問題,涉及系統的智能行為在專門領域,如醫療和軟件診斷,金融決策,語音和文本識別,遺傳分析等。
這本書來自統計學習課程,這是一門統計機器學習的入門課程,面向具有一些微積分、線性代數和統計學背景的學生。這門課程的重點是監督學習:分類和回歸。本課程將涵蓋機器學習和數據科學中使用的一系列方法,包括:
這些方法將在整個課程中被研究并應用于來自各種應用的真實數據。課程還涵蓋了一些重要的實際問題,如交叉驗證、模型選擇和偏方差權衡。課程包括理論(例如,推導和證明)以及實踐(特別是實驗室和小型項目)。實際部分將使用Python實現。
在復雜的以人為中心的系統中,每天的決策都具有決策相關信息不完全的特點。現有決策理論的主要問題是,它們沒有能力處理概率和事件不精確的情況。在這本書中,我們描述了一個新的理論的決策與不完全的信息。其目的是將決策分析和經濟行為的基礎從領域二價邏輯轉向領域模糊邏輯和Z約束,從行為決策的外部建模轉向組合狀態的框架。
這本書將有助于在模糊邏輯,決策科學,人工智能,數學經濟學,和計算經濟學的專業人員,學者,經理和研究生。
讀者:專業人士,學者,管理者和研究生在模糊邏輯,決策科學,人工智能,數學經濟學,和計算經濟學。
機器學習是計算機科學中增長最快的領域之一,具有深遠的應用。本書的目的是介紹機器學習,以及它所提供的算法范例。本書對機器學習的基本原理和將這些原理轉化為實際算法的數學推導提供了理論解釋。在介紹了基礎知識之后,這本書涵蓋了以前教科書沒有涉及到的一系列廣泛的中心主題。這些包括討論學習的計算復雜性和凸性和穩定性的概念;重要的算法范例包括隨機梯度下降、神經網絡和結構化輸出學習;以及新興的理論概念,如PAC-Bayes方法和基于壓縮的界限。本文面向高級本科生或剛畢業的學生,使統計學、計算機科學、數學和工程學領域的學生和非專業讀者都能接觸到機器學習的基本原理和算法。
//www.cse.huji.ac.il/~shais/UnderstandingMachineLearning/index.html
概述
機器學習是指自動檢測數據中有意義的模式。在過去的幾十年里,它已經成為幾乎所有需要從大數據集中提取信息的任務的通用工具。我們被一種基于機器學習的技術包圍著:搜索引擎學習如何給我們帶來最好的結果(同時投放有利可圖的廣告),反垃圾郵件軟件學習如何過濾我們的電子郵件信息,信用卡交易被一種學習如何偵測欺詐的軟件保護著。數碼相機學會識別人臉,智能手機上的智能個人輔助應用學會識別語音指令。汽車配備了使用機器學習算法構建的事故預防系統。機器學習還廣泛應用于生物信息學、醫學和天文學等科學領域。
所有這些應用程序的一個共同特征是,與計算機的更傳統使用相比,在這些情況下,由于需要檢測的模式的復雜性,人類程序員無法提供關于這些任務應該如何執行的明確、詳細的規范。以智慧生物為例,我們的許多技能都是通過學習我們的經驗(而不是遵循給我們的明確指示)而獲得或改進的。機器學習工具關注的是賦予程序“學習”和適應的能力。
這本書的第一個目標是提供一個嚴格的,但易于遵循,介紹機器學習的主要概念: 什么是機器學習?
本書的第二個目標是介紹幾種關鍵的機器學習算法。我們選擇展示的算法一方面在實踐中得到了成功應用,另一方面提供了廣泛的不同的學習技術。此外,我們特別關注適合大規模學習的算法(又稱“大數據”),因為近年來,我們的世界變得越來越“數字化”,可用于學習的數據量也在急劇增加。因此,在許多應用中數據量大,計算時間是主要瓶頸。因此,我們明確地量化了學習給定概念所需的數據量和計算時間。
目錄:
Part I: Foundations
Part II: From Theory to Algorithms
Part III: Additional Learning Models
Part IV: Advanced Theory
Appendices
簡介: 近年來,生命科學和數據科學已經融合。機器人技術和自動化技術的進步使化學家和生物學家能夠生成大量數據。與20年前的整個職業生涯相比,如今的科學家每天能夠產生更多的數據。快速生成數據的能力也帶來了許多新的科學挑戰。我們不再處于可以通過將數據加載到電子表格中并制作幾個圖表來對其進行處理的時代。為了從這些數據集中提取科學知識,我們必須能夠識別和提取非顯而易見的關系。近年來,作為識別數據模式和關系的強大工具而出現的一種技術是深度學習,它是一類算法,它徹底改變了解決諸如圖像分析,語言翻譯和語音識別等問題的方法。深度學習算法擅長識別和利用大型數據集中的模式。由于這些原因,深度學習在生命科學學科中具有廣泛的應用。本書概述了深度學習如何應用于遺傳學,藥物發現和醫學診斷等多個領域。我們描述的許多示例都附帶有代碼示例,這些示例為方法提供了實用的介紹,并為讀者提供了以后進行研究和探索的起點。
該書中代碼地址://github.com/deepchem/DeepLearningLifeSciences
目錄:
論文題目
機器學習在固體材料科學中的最新進展和應用,Recent advances and applications of machine learning in solidstate materials science
論文簡介
近年來進入材料科學工具箱的最令人興奮的工具之一是機器學習。這些統計方法已經證明能夠大大加快基礎和應用研究的速度。目前,我們正在見證一個爆炸性的工作,開發和應用機器學習的固態系統。我們對本課題的最新研究進行了全面的綜述和分析。作為起點,我們介紹了材料科學中的機器學習原理、算法、描述符和數據庫。我們繼續描述不同的機器學習方法,以發現穩定的材料并預測其晶體結構。然后我們討論了大量的定量結構-性質關系的研究,以及用機器學習代替第一性原理方法的各種方法。我們回顧了如何應用主動學習和基于代理的優化來改進rational設計過程和相關的應用實例。兩個主要的問題總是機器學習模型的可解釋性和從中獲得的物理理解。因此,我們考慮可解釋性的不同方面及其在材料科學中的重要性。最后,針對計算材料科學面臨的各種挑戰,提出了解決方案和未來的研究路徑。
論文作者
Jonathan Schmidt,Mário R. G. Marques,來自馬丁路德大學 物理研究所
題目: Machine learning and the physical sciences
摘要:
機器學習(ML)包含廣泛的算法和建模工具,用于大量的數據處理任務,這些任務近年來已經進入大多數科學學科。本文有選擇地回顧了機器學習與物理科學接口的最新研究進展。這包括由物理洞察力驅動的ML的概念發展,機器學習技術在物理中的幾個領域的應用以及這兩個領域之間的交叉。在介紹了機器學習方法和原理的基本概念之后,舉例說明了如何用統計物理來理解ML中的方法,然后介紹了ML方法在粒子物理和宇宙學、量子多體物理、量子計算、化學和材料物理中的應用。此外,還強調了針對加速ML的新型計算體系結構的研究和開發。每個部分都描述了最近的成功以及特定領域的方法和挑戰。
作者簡介:
Giuseppe Carleo于2018年加入了位于美國計算量子物理中心的Flatiron研究所。2007年,他在羅馬大學獲得物理學學士學位;2011年,他在意大利國際高等研究學院獲得凝聚態理論博士學位。他在法國光學研究所和瑞士蘇黎世聯邦理工學院獲得博士后。他也是蘇黎世聯邦理工學院計算量子物理學的講師。Carleo的主要研究方向是發展先進的數值算法來研究強相互作用量子系統的挑戰性問題。他的研究應用范圍包括凝聚態物質、超冷原子和量子計算。他對量子蒙特卡羅方法的發展做出了貢獻,包括平衡和動態特性,包括時變蒙特卡羅和神經網絡量子態。在CCQ,他正在開發和推廣基于人工智能的新技術來解決量子問題。他是開源項目NetKet的創始人和開發負責人。
由Marc Peter Deisenroth,A Aldo Faisal和Cheng Soon Ong撰寫的《機器學習數學基礎》“Mathematics for Machine Learning” 最新版417頁pdf版本已經放出,作者表示撰寫這本書旨在激勵人們學習數學概念。這本書并不打算涵蓋前沿的機器學習技術,因為已經有很多書這樣做了。相反,作者的目標是通過該書提供閱讀其他書籍所需的數學基礎。這本書分為兩部分:數學基礎知識和使用數學基礎知識進行機器學習算法示例。值得初學者收藏和學習!
Fundamentals of Python Programming