這本書的第五版繼續講述如何運用概率論來深入了解真實日常的統計問題。這本書是為工程、計算機科學、數學、統計和自然科學的學生編寫的統計學、概率論和統計的入門課程。因此,它假定有基本的微積分知識。
第一章介紹了統計學的簡要介紹,介紹了它的兩個分支:描述統計學和推理統計學,以及這門學科的簡短歷史和一些人,他們的早期工作為今天的工作提供了基礎。
第二章將討論描述性統計的主題。本章展示了描述數據集的圖表和表格,以及用于總結數據集某些關鍵屬性的數量。
為了能夠從數據中得出結論,有必要了解數據的來源。例如,人們常常假定這些數據是來自某個總體的“隨機樣本”。為了確切地理解這意味著什么,以及它的結果對于將樣本數據的性質與整個總體的性質聯系起來有什么意義,有必要對概率有一些了解,這就是第三章的主題。本章介紹了概率實驗的思想,解釋了事件概率的概念,并給出了概率的公理。
我們在第四章繼續研究概率,它處理隨機變量和期望的重要概念,在第五章,考慮一些在應用中經常發生的特殊類型的隨機變量。給出了二項式、泊松、超幾何、正規、均勻、伽瑪、卡方、t和F等隨機變量。
這本書沒有假設讀者在統計方面有任何預先訓練,這本書的第一部分描述了基本的統計原理,從一個觀點,使他們的缺點直觀和容易理解。重點是用語言和圖形來描述概念。第二部分描述了解決第一部分所涵蓋問題的現代方法。使用來自實際研究的數據,包括許多例子來說明傳統程序的實際問題,以及更多的現代方法如何能對統計研究的許多領域中得出的結論產生實質性的影響。
這本書的第二版包括了自從第一版出現以來發生的一些進展和見解。包括與中位數相關的新結果,回歸,關聯的測量,比較依賴組的策略,處理異方差的方法,以及效應量的測量。
《圖像處理手冊》一直被評為計算機圖像處理的最佳整體介紹,涵蓋二維(2D)和三維(3D)成像技術、圖像打印和存儲方法、圖像處理算法、圖像和特征測量、定量圖像測量分析等等。
《圖像處理手冊》第七版提供一個可接近的和最新的圖像處理的處理,提供廣泛的覆蓋和算法的比較,方法,和結果。
本課程從數據科學的角度介紹概率論與統計的基本概念。目的是熟悉在數據分析中廣泛使用的概率模型和統計方法。
這本教科書通過提供實用的建議,使用直接的例子,并提供相關應用的引人入勝的討論,以一種容易理解的方式介紹了基本的機器學習概念。主要的主題包括貝葉斯分類器,最近鄰分類器,線性和多項式分類器,決策樹,神經網絡,和支持向量機。后面的章節展示了如何通過“推進”的方式結合這些簡單的工具,如何在更復雜的領域中利用它們,以及如何處理各種高級的實際問題。有一章專門介紹流行的遺傳算法。
這個修訂的版本包含關于工業中機器學習的實用應用的關鍵主題的三個全新的章節。這些章節研究了多標簽域,無監督學習和它在深度學習中的使用,以及歸納邏輯編程的邏輯方法。許多章節已經被擴展,并且材料的呈現已經被增強。這本書包含了許多新的練習,許多解決的例子,深入的實驗,和獨立工作的計算機作業。
//link.springer.com/book/10.1007/978-3-319-63913-0#about
本書涵蓋了這些領域中使用Python模塊演示的概率、統計和機器學習的關鍵思想。整本書包括所有的圖形和數值結果,都可以使用Python代碼及其相關的Jupyter/IPython Notebooks。作者通過使用多種分析方法和Python代碼的有意義的示例,開發了機器學習中的關鍵直覺,從而將理論概念與具體實現聯系起來。現代Python模塊(如panda、y和Scikit-learn)用于模擬和可視化重要的機器學習概念,如偏差/方差權衡、交叉驗證和正則化。許多抽象的數學思想,如概率論中的收斂性,都得到了發展,并用數值例子加以說明。本書適合任何具有概率、統計或機器學習的本科生,以及具有Python編程的基本知識的人。
《R之書》是一本全面的入門指南,介紹了世界上最流行的統計分析編程語言R。即使你沒有編程經驗,只具備一些基本的數學基礎,你也會發現開始有效地使用R進行統計分析所需要的一切。
您將從基礎知識開始,比如如何處理數據和編寫簡單的程序,然后再轉向更高級的主題,比如生成數據的統計摘要以及執行統計測試和建模。您還將學習如何使用R的基本圖形工具和貢獻的包(如ggplot2和ggvis)創建令人印象深刻的數據可視化,以及使用rgl包創建交互式3D可視化。
幾十個動手練習(可下載的解決方案)帶你從理論到實踐,你學習:
結合實際例子和練習的詳細解釋,這本書將為您提供一個堅實的統計和R的功能的深度理解。讓R這本書成為你進入日益增長的數據分析世界的大門。
高斯過程(GPs)為核機器的學習提供了一種有原則的、實用的、概率的方法。在過去的十年中,GPs在機器學習社區中得到了越來越多的關注,這本書提供了GPs在機器學習中理論和實踐方面長期需要的系統和統一的處理。該書是全面和獨立的,針對研究人員和學生在機器學習和應用統計學。
這本書處理監督學習問題的回歸和分類,并包括詳細的算法。提出了各種協方差(核)函數,并討論了它們的性質。從貝葉斯和經典的角度討論了模型選擇。討論了許多與其他著名技術的聯系,包括支持向量機、神經網絡、正則化網絡、相關向量機等。討論了包括學習曲線和PAC-Bayesian框架在內的理論問題,并討論了幾種用于大數據集學習的近似方法。這本書包含說明性的例子和練習,和代碼和數據集在網上是可得到的。附錄提供了數學背景和高斯馬爾可夫過程的討論。
貝葉斯數據分析第三版,這本經典的書被廣泛認為是關于貝葉斯方法的主要著作,用實用的方法來分析數據和解決研究問題。貝葉斯數據分析,第三版繼續采取一種實用的方法來分析使用最新的貝葉斯方法。作者——統計界權威——在介紹高級方法之前,先從數據分析的角度介紹基本概念。在整個文本中,大量的工作示例來自實際應用和研究,強調在實踐中使用貝葉斯推理。
第三版新增
這本書有三種不同的用法。對于本科生,它介紹了從第一原則開始的貝葉斯推理。針對研究生,本文提出了有效的方法,目前貝葉斯建模和計算的統計和相關領域。對于研究人員來說,它提供了應用統計學中的各種貝葉斯方法。其他的資料,包括例子中使用的數據集,所選練習的解決方案,以及軟件說明,都可以在本書的網頁上找到。
貝葉斯數據分析課程
在Python中獲得操作、處理、清理和處理數據集的完整說明。本實用指南的第二版針對Python 3.6進行了更新,其中包含了大量的實際案例研究,向您展示了如何有效地解決廣泛的數據分析問題。在這個過程中,您將學習最新版本的panda、NumPy、IPython和Jupyter。
本書由Python panda項目的創建者Wes McKinney編寫,是對Python中的數據科學工具的實用的、現代的介紹。對于剛接觸Python的分析人員和剛接觸數據科學和科學計算的Python程序員來說,它是理想的。數據文件和相關材料可以在GitHub上找到。