這本書介紹了使用Python進行時間序列分析。我們的目標是給您一個學科基本概念的清晰概述,并描述將適用于行業中常見的分析用例的有用技術。由于有太多項目需要基于過去數據的趨勢分析和預測,時間序列分析是任何現代數據科學家知識庫中的一個重要工具。本書將為您提供工具和技術,使您能夠自信地思考問題,并在時間序列預測中提出解決方案。為什么Python ?Python正迅速成為跨不同行業部門的數據科學項目的首選。大多數最先進的機器學習和深度學習庫都有一個Python API。因此,許多數據科學家更喜歡使用Python來實現由數據處理、模型構建和模型驗證組成的整個項目流程。此外,Python提供了易于使用的api來處理、建模和可視化時間序列數據。此外,Python已經成為web應用程序后端開發的流行語言,因此對更廣泛的軟件專業人員具有吸引力。現在,讓我們來看看你能從這本書的每一章中學到什么。
//www.packtpub.com/product/practical-time-series-analysis/9781788290227
第一章,時間序列的介紹,開始討論三種不同類型的數據集-橫斷面,時間序列和面板。討論了從橫斷面到時間序列的轉變以及數據分析的附加復雜性。描述了使時間序列數據具有特殊性的特殊數學性質。幾個示例演示了如何使用探索性數據分析來可視化這些屬性。
第二章,理解時間序列數據,涵蓋了三個主題,先進的預處理和可視化的時間序列數據,通過重采樣,分組,和移動平均線的計算;平穩性和統計假設檢驗來檢測時間序列的平穩性以及對非平穩時間序列進行平穩化的各種時間序列分解方法。
第三章,基于指數平滑的方法,涵蓋了基于平滑的模型使用Holt-Winters方法的一階捕獲水平,二階平滑水平和趨勢,并說明更高階平滑,捕捉水平,趨勢和季節的時間序列數據集。
第四章,自回歸模型,討論了預測的自回歸模型。本章詳細介紹了移動平均(MA)、自回歸(AR)、自回歸移動平均(ARMA)和自回歸綜合移動平均(ARIMA)的實現,以在預測過程中捕捉時間序列數據中不同程度的干擾。
第五章,時間序列預測的深度學習,討論了最近的深度學習算法,可以直接用于開發時間序列數據的預測模型。遞歸神經網絡(RNN)是對數據序列進行建模的一種自然選擇。在本章中,將介紹不同的RNN,如香草RNN、門控循環單元和長短期記憶單元,以開發時間序列數據的預測模型。在概念上討論了發展這些rnn所涉及的數學公式。使用Python的' keras '深度學習庫解決了案例研究。
學習時間序列的概念,從傳統的技術到最前沿的技術。這本書用全面的例子清楚地說明了時間序列數據的統計方法和分析方法及其在現實世界中的應用。所有的代碼都可以在Jupyter中找到。
您將從回顧時間序列的基礎知識、時間序列數據的結構、預處理以及如何通過數據爭論來構建這些特性開始。接下來,您將使用statmodels和pmdarima等趨勢框架來研究傳統的時間序列技術,如ARMA、SARIMAX、VAR和VARMA。
該書還解釋了使用sktime構建分類模型,并涵蓋了先進的基于深度學習的技術,如ANN, CNN, RNN, LSTM, GRU和Autoencoder,以解決使用Tensorflow的時間序列問題。最后介紹了時間序列分析建模的流行框架fbprophet。在使用Python閱讀了Hands -On Time Series Analysis之后,您將能夠在行業中應用這些新技術,如石油和天然氣、機器人、制造業、政府、銀行、零售、醫療保健等。
你將學習:
這本書是寫給誰的 數據科學家、數據分析師、金融分析師和股票市場研究員
這本書的目標讀者誰希望獲得一個工作知識的時間序列和預測方法,應用于經濟,工程和自然和社會科學。它只要求具備基本的微積分、矩陣代數和基本的統計學知識。第三版包含使用基于windows的計算機軟件包ITSM2000專業版的詳細說明,現在可以從Springer Extras網站免費下載。詳細介紹了時間序列建模的邏輯和工具。大量的練習包括在內,軟件可以用來分析和預測用戶自己選擇的數據集。本書還可以與R中包含的其他時間序列包一起使用。然而,ITSM2000中的程序是菜單驅動的,可以在計算細節中使用最少的時間投資。
本書的核心內容包括固定過程、ARMA和ARIMA過程、多變量時間序列和狀態空間模型,還有一個關于譜分析的可選章節。還包括許多其他特殊主題。
通過使用Python開發用例,全面了解監督學習算法您將學習監督學習概念、Python代碼、數據集、最佳實踐、常見問題和缺陷的解決方案,以及實現結構化、文本和圖像數據集算法的實踐知識。
你將從介紹機器學習開始,強調監督學習、半監督學習和非監督學習之間的區別。在接下來的章節中,你將學習回歸和分類問題,它們背后的數學,像線性回歸、邏輯回歸、決策樹、KNN、樸素貝葉斯等算法,以及像隨機森林、支持向量機、梯度增強和神經網絡等高級算法。提供了所有算法的Python實現。最后,您將得到一個端到端模型開發流程,包括模型的部署和維護。在閱讀了Python的監督學習之后,你將會對監督學習和它的實際實現有一個廣泛的理解,并且能夠以一種創新的方式運行代碼和擴展它。
你將學習:
這本書是給誰的
使用Python的高級數據科學和分析使數據科學家能夠繼續發展他們的技能,并將其應用于商業和學術設置中。這本書中討論的主題是補充和后續主題討論的數據科學和分析與Python。其目的是使用Python開發的工具,如SciKit-learn、Pandas、Numpy、Beautiful Soup、NLTK、NetworkX等,覆蓋數據科學中重要的高級領域。使用Keras、TensorFlow、Core ML等框架,以及用于iOS和MacOS應用開發的Swift來支持模型開發。
【導讀】 機器學習和圖像處理基礎實戰,可以使讀者深入了解圖像處理的基本知識以及各種圖像處理方法和算法,使用各種Python庫的應用程序以及使用機器學習方法的實時用例實現。
本書首先討論了不同操作系統的安裝環境,介紹了基本的圖像處理方法,它使用兩個庫Scikit Image和OpenCV深入研究各種圖像處理算法以及它們在Python中的實際實現。接下來,提出了用于圖像處理和分類的機器學習和深度學習方法。解釋了諸如Adaboost,XG Boost,卷積神經網絡等用于圖像特定應用的概念。并將所有概念均使用真實場景進行演示。
作者介紹: Santanu Pattanayak目前在GE Digital工作,是一名工作數據科學家,并且是《使用TensorFlow進行深度學習:Python中高級人工智能的數學方法》的作者。他擁有大約12年的工作經驗,在數據分析/數據科學領域有8年的經驗,并且具有開發和數據庫技術的背景。
內容大綱
內容簡介: chapter 1:
本章內容主要介紹了運行本書代碼中的環境設置,主要包括:
Anaconda
OpenCV
Keras
本書代碼大部分都以Anaconda為開發環境,分別介紹了windows系統、MacOS系統、Ubuntu系統的安裝方法。
chapter 2:
在本章中,我們將精確地介紹什么是圖像及其相關屬性。主要包括:
chapter 3:
本章的前半部分討論了Python的基本概念,這些概念對應用圖像處理技術很有用。 本章的后半部分介紹了Python的圖像處理庫:Scikit Learn。 在上一章中研究的所有概念以及其他一些概念都可以使用Scikit Learn在Python中應用。
chapter 4:
現在,我們已經了解了使用Scikit圖像庫的基本圖像處理技術,繼續介紹其更高級的方面。 在本章中,我們使用最全面的計算機視覺庫之一OpenCV,并研究以下概念:
我們通過研究一些最廣泛使用的圖像處理算法來開始本章的內容,然后繼續進行圖像處理中的機器學習實現。 本章概述如下:
使用比例不變特征變換(SIFT)算法的特征映射
使用隨機樣本共識(RANSAC)算法進行圖像配準
使用人工神經網絡進行圖像分類
使用卷積神經網絡(CNN)進行圖像分類
使用機器學習進行圖像分類
簡介: Google一直是引入突破性技術和產品的先驅。在效率和規模方面,TensorFlow也不例外,因此,編寫本書只是向讀者介紹TensorFlow核心團隊所做的這些重要更改。本書著重于機器學習方面的TensorFlow的不同應用,并更深入地探討了方法的最新變化。對于那些想要用TensorFlow進行機器學習的人來說,這本書是一個很好的參考點。本書分為三個部分。第一篇:使用TensorFlow 2.0進行數據處理。第二部分:使用TensorFlow 2.0構建機器學習和深度學習模型。它還包括使用TensorFlow 2.0的神經語言編程(NLP)。第三部分介紹了如何在環境中保存和部署TensorFlow 2.0模型。這本書對數據分析人員和數據工程師也很有用,因為它涵蓋了使用TensorFlow 2.0處理大數據的步驟。想要過渡到數據科學和機器學習領域的讀者也會發現,本書提供了實用的入門指南,以后可能會出現更復雜的方面。書中提供的案例研究和示例使您很容易理解和理解相關的基本概念。本書的優勢在于其簡單性以及將機器學習應用于有意義的數據集。
目錄: