這本書為醫學學生、研究人員和專業人員提供了機器學習和醫學深度學習的基礎介紹,他們不一定在高等數學入門,但渴望更好地理解這種顛覆性技術及其對醫學的影響。人工智能(AI)曾經是計算機科學和工程部門以外的少數人知道的深奧學科,今天是一項廣泛流行的技術,被學術界的所有學者使用。特別是,近年來,醫學和生命科學領域的研究人員對機器學習和深度學習這一人工智能子領域產生了極大的興趣,這可以從過去十年同行評審醫學期刊上發表的關于該主題的文章數量的快速增長中得到證明。這一領域對優質教育資源的需求從來沒有像今天這樣大,而且只會繼續快速增長。
專家作者采用一種敘事風格,強調直覺而不是抽象的數學形式主義,消除了機器學習和深度學習周圍不必要的復雜性的面紗,使他們能夠在實用性和理論的嚴謹性之間取得微妙的平衡,以促進讀者的學習體驗。書中涉及的主題包括:醫學數據的數學編碼,線性回歸和分類,非線性特征工程,深度學習,卷積和循環神經網絡,強化學習。每一章以練習集結束,供讀者練習和測試他們的知識。
對于有興趣了解更多關于機器學習和深度學習的醫學學生、專業人士和研究人員來說,這是一個理想的介紹。在本科階段至少學過一門數學導論課程的讀者(例如,生物統計學或微積分)將能夠很好地使用本書,而不需要任何額外的先決條件。
//link.springer.com/book/10.1007/978-3-031-19502-0
科學用實驗來驗證關于世界的假設。統計學提供了量化這一過程的工具,并提供了將數據(實驗)與概率模型(假設)聯系起來的方法。因為世界是復雜的,我們需要復雜的模型和復雜的數據,因此需要多元統計和機器學習。具體來說,多元統計(與單變量統計相反)涉及隨機向量和隨機矩陣的方法和模型,而不僅僅是隨機單變量(標量)變量。因此,在多元統計中,我們經常使用矩陣表示法。與多元統計(傳統統計學的一個分支)密切相關的是機器學習(ML),它傳統上是計算機科學的一個分支。過去機器學習主要集中在算法上,而不是概率建模,但現在大多數機器學習方法都完全基于統計多元方法,因此這兩個領域正在收斂。多變量模型提供了一種方法來學習隨機變量組成部分之間的依賴關系和相互作用,這反過來使我們能夠得出有關興趣的潛在機制的結論(如生物或醫學)。
兩個主要任務: 無監督學習(尋找結構,聚類) 監督學習(從標記數據進行訓練,然后進行預測)
挑戰: 模型的復雜性需要適合問題和可用數據, 高維使估計和推斷困難 計算問題。
人工智能和因果推理闡述了人工智能(AI)和因果推理之間關系的最新發展。盡管人工智能取得了重大進展,但我們仍然面臨著人工智能發展中的一個巨大挑戰,即理解智能背后的機制,包括推理、計劃和想象。理解、遷移和概括是提高智能的主要原則。因果推理是理解的一個關鍵組成部分。因果推理包括干預、領域轉移學習、時間結構和反事實思維等概念,是理解因果關系和推理的主要概念。不幸的是,這些因果關系的重要組成部分經常被機器學習忽略,這導致了深度學習的一些失敗。人工智能和因果推理包括:(1)將人工智能技術作為因果分析的主要工具;(2)將因果概念和因果分析方法應用于解決人工智能問題。這本書的目的是填補人工智能和現代因果分析之間的空白,進一步促進人工智能革命。這本書是理想的研究生和研究人員在人工智能,數據科學,因果推理,統計,基因組學,生物信息學和精準醫學。
//www.routledge.com/Artificial-Intelligence-and-Causal-Inference/Xiong/p/book/9780367859404
涵蓋三種類型的神經網絡,制定深度學習作為最優控制問題。 * 非線性中介的深度學習與工具變量因果分析。 * 因果網絡的構建是一個連續優化問題。 * Transformer和注意力用于圖的編碼解碼。RL用于推斷大型因果網絡。 * 使用VAE、GAN、神經微分方程、回歸神經網絡(RNN)和RL來估計反事實的結果。 * 網絡干擾下基于人工智能的個體化治療效果估計方法。
深度學習:全面指南提供了深度學習(DL)和機器學習(ML)的概念的全面覆蓋。DL和ML是最受歡迎的領域,需要深刻的理解。這本書使讀者能夠基于ML和DL構建創新和有用的應用。從神經網絡的基礎開始,并繼續通過各種類型的CNN, RNNs, LSTM的架構,以及更多,直到書的結尾,每一個主題都給予了最大的照顧和專業和全面的塑造。
關鍵特征: 包括從ML概念到DL概念的平穩過渡
對于所有基于代碼的示例,都提供了逐行解釋
包括許多實際的例子和面試問題
即使是非計算機科學背景的人也可以從這本書中受益,學習理論、例子、案例研究和代碼片段
每一章都以目標開始,并以一組測試讀者理解力的測試問題結束
包括對提供額外指導的相關YouTube視頻的引用
人工智能是每個人的領域。這本書面向所有人,不論他們的專業領域是什么。畢業生和研究人員在深度學習將發現這本書有用。
在過去的十年里,人們對人工智能和機器學習的興趣有了相當大的增長。從最廣泛的意義上說,這些領域旨在“學習一些有用的東西”,了解生物體所處的環境。如何處理收集到的信息導致了算法的發展——如何處理高維數據和處理不確定性。在機器學習和相關領域的早期研究階段,類似的技術在相對孤立的研究社區中被發現。雖然不是所有的技術都有概率論的自然描述,但許多都有,它是圖模型的框架(圖和概率論的結合),使從統計物理、統計、機器學習和信息理論的想法的理解和轉移。在這種程度上,現在有理由期待機器學習研究人員熟悉統計建模技術的基礎知識。這本書集中在信息處理和機器學習的概率方面。當然,沒有人說這種方法是正確的,也沒有人說這是唯一有用的方法。事實上,有人可能會反駁說,這是沒有必要的,因為“生物有機體不使用概率論”。無論情況是否如此,不可否認的是,圖模型和概率框架幫助機器學習領域出現了新算法和模型的爆炸式增長。我們還應該清楚,貝葉斯觀點并不是描述機器學習和信息處理的唯一方法。貝葉斯和概率技術在需要考慮不確定性的領域中發揮了自己的作用。
//www0.cs.ucl.ac.uk/staff/d.barber/brml/
本書結構
本書第一部分的目的之一是鼓勵計算機科學專業的學生進入這一領域。許多現代學生面臨的一個特別困難是有限的正規微積分和線性代數訓練,這意味著連續和高維分布的細節可能會讓他們離開。在以概率作為推理系統的一種形式開始時,我們希望向讀者展示他們可能更熟悉的邏輯推理和動態規劃的想法如何在概率環境中有自然的相似之處。特別是,計算機科學的學生熟悉的概念,算法為核心。然而,在機器學習中更常見的做法是將模型視為核心,而如何實現則是次要的。從這個角度來看,理解如何將一個數學模型轉換成一段計算機代碼是核心。
第二部分介紹了理解連續分布所需的統計背景,以及如何從概率框架來看待學習。第三部分討論機器學習的主題。當然,當一些讀者看到他們最喜歡的統計話題被列在機器學習下面時,他們會感到驚訝。統計學和機器學習之間的一個不同觀點是,我們最終希望構建什么樣的系統(能夠完成“人類/生物信息處理任務的機器),而不是某些技術。因此,我認為這本書的這一部分對機器學習者來說是有用的。第四部分討論了明確考慮時間的動態模型。特別是卡爾曼濾波器被視為圖模型的一種形式,這有助于強調模型是什么,而不是像工程文獻中更傳統的那樣把它作為一個“過濾器”。第五部分簡要介紹了近似推理技術,包括隨機(蒙特卡羅)和確定性(變分)技術。
機器學習中復雜的統計數據讓許多開發人員感到擔憂。了解統計學可以幫助你建立強大的機器學習模型,針對給定的問題陳述進行優化。這本書將教你所有需要執行復雜的統計計算所需的機器學習。您將獲得有關監督學習、非監督學習、強化學習等統計信息。了解真實世界的例子,討論機器學習的統計方面,并熟悉它。您還將設計用于執行諸如模型、參數擬合、回歸、分類、密度收集等任務的程序。
到本書結束時,你將掌握機器學習所需的統計數據,并能夠將你的新技能應用于任何類型的行業問題。
機器學習已經成為近年來最流行的話題之一。我們今天看到的機器學習的應用只是冰山一角。機器學習革命才剛剛開始。它正在成為所有現代電子設備不可分割的一部分。在自動化領域的應用,如汽車、安全和監視、增強現實、智能家居、零售自動化和醫療保健,還不多。機器人技術也正在崛起,主宰自動化世界。機器學習在機器人領域的未來應用仍未被普通讀者發現。因此,我們正在努力編寫這本關于機器學習在機器人技術上的未來應用的編輯書籍,其中幾個應用已經包含在單獨的章節中。這本書的內容是技術性的。它試圖覆蓋機器學習的所有可能的應用領域。這本書將提供未來的愿景在未探索的領域的應用機器人使用機器學習。本書中提出的觀點得到了原始研究結果的支持。本章在這里提供了所有必要的理論和數學計算的深入研究。對于外行人和開發人員來說,它將是完美的,因為它將結合高級材料和介紹性材料,形成一個論點,說明機器學習在未來可以實現什么。它將詳細介紹未來的應用領域及其方法。因此,本書將極大地有利于學術界、研究人員和行業項目管理者開發他們的新項目,從而造福人類。
當看到這些材料時,一個明顯的問題可能會出現:“為什么還要寫一本深度學習和自然語言處理的書呢?”一些優秀的論文已經出版,涵蓋了深度學習的理論和實踐方面,以及它在語言處理中的應用。然而,從我教授自然語言處理課程的經驗來看,我認為,盡管這些書的質量非常好,但大多數都不是針對最有可能的讀者。本書的目標讀者是那些在機器學習和自然語言處理之外的領域有經驗的人,并且他們的工作至少部分地依賴于對大量數據,特別是文本數據的自動化分析。這些專家可能包括社會科學家、政治科學家、生物醫學科學家,甚至是對機器學習接觸有限的計算機科學家和計算語言學家。
現有的深度學習和自然語言處理書籍通常分為兩大陣營。第一個陣營專注于深度學習的理論基礎。這對前面提到的讀者肯定是有用的,因為在使用工具之前應該了解它的理論方面。然而,這些書傾向于假設一個典型的機器學習研究者的背景,因此,我經常看到沒有這種背景的學生很快就迷失在這樣的材料中。為了緩解這個問題,目前存在的第二種類型的書集中在機器學習從業者;也就是說,如何使用深度學習軟件,而很少關注理論方面。我認為,關注實際方面同樣是必要的,但還不夠。考慮到深度學習框架和庫已經變得相當復雜,由于理論上的誤解而濫用它們的可能性很高。這個問題在我的課程中也很常見。
因此,本書旨在為自然語言處理的深度學習搭建理論和實踐的橋梁。我涵蓋了必要的理論背景,并假設讀者有最少的機器學習背景。我的目標是讓任何上過線性代數和微積分課程的人都能跟上理論材料。為了解決實際問題,本書包含了用于討論的較簡單算法的偽代碼,以及用于較復雜體系結構的實際Python代碼。任何上過Python編程課程的人都應該能夠理解這些代碼。讀完這本書后,我希望讀者能有必要的基礎,立即開始構建真實世界的、實用的自然語言處理系統,并通過閱讀有關這些主題的研究出版物來擴展他們的知識。
//clulab.cs.arizona.edu/gentlenlp/gentlenlp-book-05172020.pdf
有興趣的數據科學專業人士可以通過本書學習Scikit-Learn圖書館以及機器學習的基本知識。本書結合了Anaconda Python發行版和流行的Scikit-Learn庫,演示了廣泛的有監督和無監督機器學習算法。通過用Python編寫的清晰示例,您可以在家里自己的機器上試用和試驗機器學習的原理。
所有的應用數學和編程技能需要掌握的內容,在這本書中涵蓋。不需要深入的面向對象編程知識,因為工作和完整的例子被提供和解釋。必要時,編碼示例是深入和復雜的。它們也簡潔、準確、完整,補充了介紹的機器學習概念。使用示例有助于建立必要的技能,以理解和應用復雜的機器學習算法。
對于那些在機器學習方面追求職業生涯的人來說,Scikit-Learn機器學習應用手冊是一個很好的起點。學習這本書的學生將學習基本知識,這是勝任工作的先決條件。讀者將接觸到專門為數據科學專業人員設計的蟒蛇分布,并將在流行的Scikit-Learn庫中構建技能,該庫是Python世界中許多機器學習應用程序的基礎。
你將學習
這本書是給誰的
本備忘單是機器學習手冊的濃縮版,包含了許多關于機器學習的經典方程和圖表,旨在幫助您快速回憶起機器學習中的知識和思想。
這個備忘單有兩個顯著的優點:
清晰的符號。數學公式使用了許多令人困惑的符號。例如,X可以是一個集合,一個隨機變量,或者一個矩陣。這是非常混亂的,使讀者很難理解數學公式的意義。本備忘單試圖規范符號的使用,所有符號都有明確的預先定義,請參見小節。
更少的思維跳躍。在許多機器學習的書籍中,作者省略了數學證明過程中的一些中間步驟,這可能會節省一些空間,但是會給讀者理解這個公式帶來困難,讀者會在中間迷失。