這本書的目標讀者誰希望獲得一個工作知識的時間序列和預測方法,應用于經濟,工程和自然和社會科學。它只要求具備基本的微積分、矩陣代數和基本的統計學知識。第三版包含使用基于windows的計算機軟件包ITSM2000專業版的詳細說明,現在可以從Springer Extras網站免費下載。詳細介紹了時間序列建模的邏輯和工具。大量的練習包括在內,軟件可以用來分析和預測用戶自己選擇的數據集。本書還可以與R中包含的其他時間序列包一起使用。然而,ITSM2000中的程序是菜單驅動的,可以在計算細節中使用最少的時間投資。
本書的核心內容包括固定過程、ARMA和ARIMA過程、多變量時間序列和狀態空間模型,還有一個關于譜分析的可選章節。還包括許多其他特殊主題。
時間序列分析技術的理論和應用方面的相關書籍較少,特別是在水資源工程領域。因此,許多水文工作者和水文地質工作者難以將時間序列分析作為研究工具之一。這本書通過提供時間序列分析的理論和實踐方面的適當混合填補了這一空白。它涉及水文/水資源工程中時間序列特征的全面概述、分析時間序列數據的各種工具和技術、31種可用統計檢驗的理論細節以及將它們應用于真實時間序列數據的詳細程序、隨機建模的理論和方法,以及水文科學中時間序列分析的現狀。此外,它通過一個案例研究證明了大多數時間序列測試的應用,并對各種時間序列測試進行了比較性能評價,同時還邀請了印度和國外的四個案例研究。
本書不僅是學生和教師在水資源工程方面的教科書,而且將成為教育研究人員/科學家關于水文科學的時間序列分析的理論和實踐的最全面的參考。這本書將非常有用的學生,研究人員,教師和專業人員涉及水資源,水文,生態學,氣候變化,地球科學,和環境研究。
//link.springer.com/book/10.1007/978-94-007-1861-6
分析時間導向的數據和預測時間序列的未來價值是分析師在許多領域面臨的最重要的問題之一,從金融和經濟到生產運營管理,到政治和社會政策會議的分析,調查人類對環境的影響以及他們對環境做出的決策。因此,在金融、經濟、科學、工程、統計和公共政策等各個領域,有一大批人需要了解時間序列分析和預測的一些基本概念。不幸的是,大多數基本的統計和運營管理書籍很少(如果有的話)關注面向時間的數據,也很少提供預測方面的指導。有一些關于時間序列分析的高級書籍。這些書大多是為正在攻讀博士學位或在該領域做研究的技術專家而寫的。他們往往是非常理論化的,經常關注一些特定的主題或技術。我們寫這本書就是為了填補這兩個極端之間的空白。
《時間序列分析:預測與控制(原書第5版)》內容始終都是時間序列領域的權威。第5版仍然分為5個部分,相對第3版新增內容主要有非線性和長記憶模型、多元時間序列分析以及前饋控制,其余各章節根據現實和教學需要均有不同程度的更新。在本書中,幾位統計學大師用極其通俗的語言,結合大量的實例,闡明了時間序列分析的精髓。本書內容十分豐富,敘述簡明,強調實際應用。相信每一位研讀此書的讀者都會獲益匪淺。
《時間序列分析:預測與控制(原書第5版)》可作為統計和相關專業高年級本科生或研究生教材,也可以作為統計專業技術人員的參考書。
這本書描述了分析離散時間序列的統計模型和方法,并介紹了方法論的重要應用。所考慮的模型包括一類自回歸綜合移動平均(ARIMA)模型和這些模型的各種擴展。對模型的性質進行了檢驗,并提出了模型規范、參數估計和模型檢驗的統計方法。介紹了非季節性和季節性時間序列的預測方法。討論了傳遞函數建模兩個或多個時間序列之間的動態關系的方法的擴展,建模干預事件的影響,多元時間序列建模,和過程控制。主題,如狀態空間和結構建模,非線性模型,長記憶模型,和條件異方差模型也被涵蓋。目標一直是提供一個文本,是實用的和有價值的學術和實踐者。
//www.wiley.com/en-us/Time+Series+Analysis%3A+Forecasting+and+Control%2C+5th+Edition-p-9781118675021
//inferentialthinking.com/chapters/intro.html
數據科學是通過探索、預測和推理,從龐大而多樣的數據集中得出有用的結論。探索包括識別信息中的模式。預測是指利用我們已知的信息,對我們希望知道的值做出有根據的猜測。推論包括量化我們的確定性程度:我們發現的那些模式是否也會出現在新的觀察中?我們的預測有多準確?我們用于探索的主要工具是可視化和描述性統計,用于預測的是機器學習和優化,用于推斷的是統計測試和模型。統計學是數據科學的核心組成部分,因為統計學研究如何在不完整的信息下得出可靠的結論。計算是一個核心組件,因為編程允許我們將分析技術應用于現實世界中出現的大量和多樣化的數據集:不僅是數字,還有文本、圖像、視頻和傳感器讀數。數據科學包含了所有這些東西,但由于應用,它不僅僅是各部分的總和。通過理解一個特定的領域,數據科學家學會對他們的數據提出適當的問題,并正確解釋我們的推理和計算工具提供的答案。
通過本書一步一步地,您將學習如何利用算法思維和代碼的力量,獲得關于當前機器學習方法的力量和局限性的直覺,并有效地將它們應用到實際的業務問題。
這本書的第三版繼續演示如何應用概率論,以獲得洞察到真實的,日常統計問題和情況。這種方法最終導致了對統計程序和策略的直觀理解,最常用的是實踐工程師和科學家。這本書是為統計學或概率和統計的入門課程而寫的,為工程、計算機科學、數學、統計學和自然科學的學生而寫。因此,它假定你有初等微積分知識。
第一章簡要介紹統計學,介紹它的兩個分支,描述性統計和推理統計學,并簡要介紹該學科的歷史和一些人的早期工作為今天所做的工作奠定了基礎。描述性統計的主題將在第二章中討論。描述數據集的圖和表在本章中給出,以及用于總結數據集某些關鍵屬性的數量。要想從數據中得出結論,就必須了解數據的來源。例如,通常假設數據是來自某些總體的“隨機樣本”。為了準確理解這意味著什么,以及將樣本數據屬性與總體屬性相關聯的結果是什么,有必要對概率有一些了解,這是第三章的主題。本章介紹了概率實驗的思想,解釋了事件概率的概念,并給出了概率的公理。我們的概率研究將在第四章繼續,這一章涉及隨機變量和期望的重要概念,在第五章,考慮一些在應用中經常出現的特殊類型的隨機變量。給出了二項式、泊松、超幾何、正態、均勻、伽馬、卡方、t和F等隨機變量。在第6章中,我們研究了樣本均值和樣本方差等抽樣統計量的概率分布。我們將展示如何使用一個著名的概率理論結果,即中心極限定理,來近似樣本均值的概率分布。此外,我們還介紹了關節基礎數據來自正態分布總體的重要特殊情況下的樣本均值和樣本方差的概率分布。第7章展示了如何使用數據來估計感興趣的參數。第8章介紹了統計假設檢驗的重要主題,它涉及到使用數據來檢驗特定假設的可信性。第9章討論回歸的重要課題。簡單線性回歸(包括回歸到均值、殘差分析和加權最小二乘等子主題)和多元線性回歸都被考慮在內。第10章是方差分析。考慮了單向和雙向(有或沒有交互的可能性)問題。第11章是關于擬合優度檢驗,它可以用來檢驗所提出的模型是否與數據一致。文中給出了經典的卡方擬合優度檢驗,并將其應用于列聯表的獨立性檢驗。本章的最后一節介紹了Kolmogorov-Smirnov程序,用于測試數據是否來自特定的連續概率分布。第12章討論了非參數假設檢驗,當人們無法假設潛在的分布具有某些特定的參數形式(如正態分布)時,可以使用非參數假設檢驗。第13章考慮質量控制的主題,一個關鍵的統計技術在制造和生產過程。我們考慮了各種控制圖,不僅包括休哈特控制圖,還包括基于移動平均線和累積總和的更復雜的控制圖。第14章討論與壽命試驗有關的問題。在本章中,指數分布,而不是正態分布,起著關鍵作用。
數據挖掘和機器學習的基本算法構成了數據科學的基礎,利用自動化方法分析各種數據的模式和模型,應用范圍從科學發現到商業分析。本教材面向本科和研究生課程,全面深入地介紹了數據挖掘、機器學習和統計學,為學生、研究人員和實踐者提供了堅實的指導。這本書奠定了數據分析、模式挖掘、聚類、分類和回歸的基礎,集中在算法和潛在的代數、幾何和概率概念上。新的第二版是一個完整的部分致力于回歸方法,包括神經網絡和深度學習。
涵蓋核心方法和前沿研究,包括深度學習
提供了一種基于開源實現的算法方法
包含了經過類測試的例子和練習,允許課程設計的靈活性和現成的參考
數據挖掘和機器學習使人能夠從數據中獲得基本的見解和知識。它們允許發現深刻的、有趣的和新穎的模式,以及從大規模數據中描述的、可理解的和可預測的模型。在這個領域有幾本好書,但其中很多不是太高級就是太高級。這本書是一個介紹性的文本,奠定了機器學習和數據挖掘的基本概念和算法的基礎。重要的概念在第一次遇到時就會被解釋,并附有詳細的步驟和推導。本書的主要目標是通過對數據和方法的幾何、(線性)代數和概率解釋的相互作用,建立公式背后的直覺。這第二版在回歸上增加了一個完整的新部分,包括線性和邏輯回歸,神經網絡,和深度學習。其他章節的內容也進行了更新,已知的勘誤表也得到了修正。本書的主要部分包括數據分析基礎、頻繁模式挖掘、聚類、分類和回歸。這些課程涵蓋了核心方法以及尖端主題,如深度學習、核方法、高維數據分析和圖分析。
深度學習,核方法,高維數據分析,圖分析。這本書包括許多例子來說明概念和算法。它也有結束語練習,在課堂上使用過。書中所有的算法都是由作者實現的。為了幫助實際理解,我們建議讀者自己實現這些算法(例如,使用Python或R)。如幻燈片、數據集和視頻等補充資源可以在該書的同伴站點在線獲得:
目錄內容: Front Matter Contents Preface
PART I. DATA ANALYSIS FOUNDATIONS
1 Data Mining and Analysis 2 Numeric Attributes 3 Categorical Attributes 4 Graph Data 5 Kernel Methods 6 High-dimensional Data 7 Dimensionality Reduction
PART II. FREQUENT PATTERN MINING
8 Itemset Mining 9 Summarizing Itemsets 10 Sequence Mining 11 Graph Pattern Mining 12 Pattern and Rule Assessment
PART III. CLUSTERING
13 Representative-based Clustering 14 Hierarchical Clustering 15 Density-based Clustering 16 Spectral and Graph Clustering 17 Clustering Validation PART IV. CLASSIFICATION
18 Probabilistic Classification 19 Decision Tree Classifier 20 Linear Discriminant Analysis 21 Support Vector Machines 22 Classification Assessment
PART V. REGRESSION
23 Linear Regression 24 Logistic Regression 25 Neural Networks 26 Deep Learning 27 Regression Evaluation
Index
圖片