**這本關于統計建模和統計推斷的教科書將幫助高級本科生和研究生。統計建模和計算從經典和貝葉斯的角度提供了對現代統計學的獨特介紹。**它還提供了數學統計學和現代統計計算的綜合處理,強調統計建模,計算技術和應用。這三個部分的每一部分都將涵蓋大學課程的基本主題。第一部分介紹概率論的基本原理。在第二部分中,作者介紹了各種經典模型,其中包括線性回歸和方差分析模型。在第三部分中,作者介紹了各種高級模型的統計分析和計算,如廣義線性模型、狀態空間模型和高斯模型。特別注意的是快速蒙特卡羅技術的貝葉斯推斷這些模型。整本書作者包括了大量的說明性的例子和解決的問題。這本書還具有解決方案的部分,作為MATLAB入門的附錄,以及數學補充。
//link.springer.com/book/10.1007/978-1-4614-8775-3
本書旨在為數學、物理科學、工程和相關領域的學生介紹概率論和數理統計。它基于作者25年的概率教學經驗,旨在幫助學生克服學習該學科的常見困難。這本書的重點是對理論的解釋,主要是用了許多例子。在可能的情況下,提供所述結果的證明。所有章節都以一個簡短的問題列表結束。這本書還包括幾個可選的更高級的主題部分。這本教科書非常適合概率論的第一課。內容:概率、條件概率和獨立隨機變量及其分布、隨機變量的運算、期望值、方差和協方差、隨機分布向量、極限定理、數理統計附錄書目索引。
概率數值計算將機器學習和應用數學之間的聯系形式化。數值算法從可計算的量中逼近難以處理的量。他們通過被積函數的計算來估計積分,或者通過向量場的計算來估計微分方程所描述的動力系統的路徑。換句話說,他們從數據中推斷出潛在的數量。這本書表明,它是正式可能認為計算例程作為學習機,并使用貝葉斯推理的概念來構建更靈活,高效,或定制的算法的計算。文本迎合了碩士和博士學生,以及人工智能,計算機科學,統計和應用數學的研究生研究人員。提供了大量的背景材料以及大量的圖形、工作示例和練習(帶解決方案)。
我們的主要目標是研究不確定性在數值計算中的應用和作用,并利用這種不確定性來做出關于計算的最優決策。
//www.probabilistic-numerics.org/
OpenIntro Statistics涵蓋了統計的第一門課程,提供了應用統計的嚴格介紹,清晰,簡潔,可訪問。這本書是為本科水平而寫的,但它在高中和研究生課程中也很受歡迎。我們希望讀者能從本書中獲得三個觀點,除此之外,還能形成統計思維和方法的基礎。
本書各章節內容如下:
1. 介紹數據。數據結構、變量和基本的數據收集技術。
2. 總結數據。數據摘要、圖形和隨機化。
3.概率。概率的基本原理。
4. 隨機變量的分布。正態分布和其他關鍵分布。
5. 推理的基礎。在估計總體比例的情況下,統計推斷的一般思想。
6. 分類數據的推理。使用正態分布和卡方分布推斷比例和表。
7. 對數值數據的推斷。使用t分布推斷一個或兩個樣本平均值,比較兩組的統計力量,也使用方差分析的許多平均值的比較。
8. 線性回歸概論。回歸一個預測變量的數值結果。本章的大部分內容可以在第1章之后進行介紹。
9. 多元和邏輯回歸。使用多種預測器對數值和分類數據進行回歸。
《數據科學家的統計基礎:使用R和Python》是一本一學期或兩學期的數學統計入門教材,供培養成為數據科學家的學生使用。它深入介紹了任何數據科學家都應該熟悉的統計科學主題,包括概率分布、描述性和推理統計方法以及線性建模。這本書假設有基本的微積分知識,所以演示可以集中在“為什么它可以工作”以及“如何做它”上。然而,與傳統的“數理統計”教科書相比,這本書較少強調概率論,而更強調使用軟件來實現統計方法和進行模擬來說明關鍵概念。書中所有的統計分析都使用R軟件,還有一個附錄展示了用Python進行的相同分析。
這本書還介紹了現代主題,通常不出現在數理統計文本,但與數據科學家高度相關,如貝葉斯推理,非正態響應的廣義線性模型(例如,邏輯回歸和泊松loglinear模型),和正則模型擬合。將近500個練習被分為“數據分析與應用”和“方法與概念”。附錄介紹了R和Python,并包含了奇數號練習的解決方案。本書的網站擴展了R, Python和Matlab的附錄,以及來自示例和練習的所有數據集。
這本書是作為《統計與R專門化》課程貝葉斯統計的伴讀而寫的。我們開發這門課程的目標是在不需要微積分的情況下提供一個關于決策中的貝葉斯推理的介紹,書中提供了更多關于貝葉斯推理的細節和背景。在寫這篇文章的時候,我們希望它可以作為使用R的貝葉斯推理的開放入門,供任何有興趣學習貝葉斯統計的人使用。本課程將更廣泛地討論教材和范例,并提供額外的范例和練習。雖然我們不要求學習者有任何微積分或線性代數的背景,但對于那些有此背景并有興趣深入學習的人,我們在每一章中都包含了可選的子部分,以提供額外的數學細節和一些關鍵結果的推導。
//inferentialthinking.com/chapters/intro.html
數據科學是通過探索、預測和推理,從龐大而多樣的數據集中得出有用的結論。探索包括識別信息中的模式。預測是指利用我們已知的信息,對我們希望知道的值做出有根據的猜測。推論包括量化我們的確定性程度:我們發現的那些模式是否也會出現在新的觀察中?我們的預測有多準確?我們用于探索的主要工具是可視化和描述性統計,用于預測的是機器學習和優化,用于推斷的是統計測試和模型。統計學是數據科學的核心組成部分,因為統計學研究如何在不完整的信息下得出可靠的結論。計算是一個核心組件,因為編程允許我們將分析技術應用于現實世界中出現的大量和多樣化的數據集:不僅是數字,還有文本、圖像、視頻和傳感器讀數。數據科學包含了所有這些東西,但由于應用,它不僅僅是各部分的總和。通過理解一個特定的領域,數據科學家學會對他們的數據提出適當的問題,并正確解釋我們的推理和計算工具提供的答案。
通過本書一步一步地,您將學習如何利用算法思維和代碼的力量,獲得關于當前機器學習方法的力量和局限性的直覺,并有效地將它們應用到實際的業務問題。
這本書的目的是全面概述在算法的數學分析中使用的主要技術。涵蓋的材料從經典的數學主題,包括離散數學,基本的真實分析,和組合學,以及從經典的計算機科學主題,包括算法和數據結構。重點是“平均情況”或“概率”分析,但也涵蓋了“最壞情況”或“復雜性”分析所需的基本數學工具。我們假設讀者對計算機科學和實際分析的基本概念有一定的熟悉。簡而言之,讀者應該既能寫程序,又能證明定理。否則,這本書是自成一體的。
這本書是用來作為算法分析高級課程的教科書。它也可以用于計算機科學家的離散數學課程,因為它涵蓋了離散數學的基本技術,以及組合學和重要的離散結構的基本性質,在計算機科學學生熟悉的背景下。傳統的做法是在這類課程中有更廣泛的覆蓋面,但許多教師可能會發現,這里的方法是一種有用的方式,可以讓學生參與到大量的材料中。這本書也可以用來向數學和應用數學的學生介紹與算法和數據結構相關的計算機科學原理。
盡管有大量關于算法數學分析的文獻,但該領域的學生和研究人員尚未直接獲得廣泛使用的方法和模型的基本信息。本書旨在解決這種情況,匯集了大量的材料,旨在為讀者提供該領域的挑戰的欣賞和學習正在開發的先進工具以應對這些挑戰所需的背景知識。補充的論文從文獻,這本書可以作為基礎的介紹性研究生課程的算法分析,或作為一個參考或基礎的研究人員在數學或計算機科學誰想要獲得這個領域的文獻自學。
第 1 章:算法 分析考慮算法分析的一般動機以及研究算法性能特征的各種方法之間的關系。
第 2 章:遞歸關系 專注于各種類型的 遞歸關系的基本數學屬性,這些遞歸關系在通過從程序的遞歸表示到描述其屬性的函數的遞歸表示的直接映射來分析算法時經常出現。
第 3 章:生成函數 在算法的平均情況分析中介紹了一個核心概念:生成函數 ——作為我們研究對象的算法與發現其屬性所必需的分析方法之間的必要且自然的聯系。
第 4 章:漸近逼近 研究了推導問題的近似解或逼近精確解的方法,這使我們能夠 在分析算法時對感興趣的數量進行 簡潔而精確的估計。
第 5 章:分析組合 學介紹了一種研究組合結構的現代方法,其中生成函數是研究的中心對象。這種方法是通過本書其余部分研究特定結構的基礎。
第 6 章:樹 研究了許多不同類型的 樹的屬性,以及在許多實際算法中隱含和顯式出現的基本結構。我們的目標是提供對樹組合分析的廣泛文獻結果的訪問,同時為大量算法應用提供基礎。
第 7 章:排列 調查了排列的組合屬性(數字1到N的排序),并展示了它們如何以自然的方式與基本的和廣泛使用的排序算法相關聯。
第 8 章:字符串和嘗試 研究 字符串、字符序列或從固定字母表中提取的字母的基本組合屬性,并介紹處理字符串的算法,從計算理論核心的基本方法到實用的文本處理方法重要應用程序的主機。
第 9 章:單詞和映射 涵蓋單詞的全局屬性( 來自M 字母字母表的 N 字母字符串),這些屬性在經典組合學(因為它們模擬獨立伯努利試驗的序列)和經典應用算法(因為它們散列算法的模型輸入序列)。本章還涵蓋了隨機映射 ( N個字母表中的N個字母單詞),并討論了與樹和排列的關系。
矩陣代數是數據分析和統計理論中最重要的數學領域之一。這本書的第一部分為統計中的應用提出矩陣代數的理論的相關方面。本部分從向量和向量空間的基本概念開始,接著介紹矩陣的基本代數性質,然后描述向量和矩陣在多元演算中的解析性質,最后討論線性系統解和特征分析中矩陣的運算。這部分基本上是獨立的。
本書的第二部分開始考慮在統計中遇到的各種類型的矩陣,例如投影矩陣和正定矩陣,并描述這些矩陣的特殊性質。第二部分也介紹了矩陣理論在統計中的一些應用,包括線性模型、多元分析和隨機過程。本部分說明了在本書第一部分中發展的矩陣理論。書的前兩個部分可以作為為統計學生的矩陣代數課程的文本,或作為在線性模型或多元統計的各種課程的補充文本。
這本書的第三部分涵蓋了數值線性代數。它以數值計算的基礎討論開始,然后描述精確和有效的算法因式分解矩陣,求解線性方程組,并提取特征值和特征向量。雖然這本書沒有捆綁到任何特定的軟件系統,它描述并給出了使用數字線性代數的現代計算機軟件的例子。這部分基本上是自包含的,盡管它假設有一些能力用Fortran或C編程和/或使用R/S-Plus或Matlab的能力。書的這一部分可以作為在統計計算中的一門課程的文本使用,或者作為強調計算的各種課程的補充文本。
這本書包括大量的練習,并在附錄中提供了一些解決方案。
James E. Gentle是喬治梅森大學計算統計學教授。他是美國統計協會(ASA)和美國科學促進會的會員。他曾在美國標準局擔任過幾個國家職務并擔任過美國標準局期刊的副主編以及其他統計和計算期刊的副主編。他是隨機數生成和蒙特卡羅方法,第二版,和計算統計元素的作者。