分析時間導向的數據和預測時間序列的未來價值是分析師在許多領域面臨的最重要的問題之一,從金融和經濟到生產運營管理,到政治和社會政策會議的分析,調查人類對環境的影響以及他們對環境做出的決策。因此,在金融、經濟、科學、工程、統計和公共政策等各個領域,有一大批人需要了解時間序列分析和預測的一些基本概念。不幸的是,大多數基本的統計和運營管理書籍很少(如果有的話)關注面向時間的數據,也很少提供預測方面的指導。有一些關于時間序列分析的高級書籍。這些書大多是為正在攻讀博士學位或在該領域做研究的技術專家而寫的。他們往往是非常理論化的,經常關注一些特定的主題或技術。我們寫這本書就是為了填補這兩個極端之間的空白。
許多統計和機器學習的方法正在被定義。這些方法用于從系統的感知數據創建模型,幫助科學家生成或改進當前的模型。機器學習在科學領域得到了廣泛的研究,特別是在生物信息學、經濟學、社會科學、生態學和氣候科學等領域,但從數據中學習需要在復雜的情況下進行更多的研究。要為機器學習算法提供有意義的知識,就必須采用能夠捕獲結構和過程屬性的高級知識表示方法。它對理解困難的科學問題有重大影響。
這本《知識表示和機器學習的預測和分析》展示了各種知識表示和機器學習方法和體系結構,將在研究領域活躍。這些方法被回顧與現實生活的例子,從廣泛的研究主題。本書的網站提供了許多在機器學習知識表示中實現的技術和算法的理解。
特點:
檢查所需知識表示的表示充分性 掌握知識表示的推理充分性,以便從原始信息中產生新的知識 運用自動方法獲取新知識,提高推理和獲取效率 使用最新的技術,涵蓋知識表示和機器學習方面的主要挑戰、關注和突破 描述知識表示的思想和相關技術,以及它們的應用,以幫助人類變得更好、更智能 這本書作為研究人員和實踐者誰是在信息技術和計算機科學領域的知識表示和機器學習的基本和先進的概念的研究人員和實踐者的參考書。如今,開發自適應的、文件的、可擴展的和可靠的應用,以及為日常問題設計解決方案已經變得非常重要。這本書將有助于行業人士,也將幫助初學者和高級用戶學習最新的東西,其中包括基本和先進的概念。
這本書的第三版繼續演示如何應用概率論,以獲得洞察到真實的,日常統計問題和情況。這種方法最終導致了對統計程序和策略的直觀理解,最常用的是實踐工程師和科學家。這本書是為統計學或概率和統計的入門課程而寫的,為工程、計算機科學、數學、統計學和自然科學的學生而寫。因此,它假定你有初等微積分知識。
第一章簡要介紹統計學,介紹它的兩個分支,描述性統計和推理統計學,并簡要介紹該學科的歷史和一些人的早期工作為今天所做的工作奠定了基礎。描述性統計的主題將在第二章中討論。描述數據集的圖和表在本章中給出,以及用于總結數據集某些關鍵屬性的數量。要想從數據中得出結論,就必須了解數據的來源。例如,通常假設數據是來自某些總體的“隨機樣本”。為了準確理解這意味著什么,以及將樣本數據屬性與總體屬性相關聯的結果是什么,有必要對概率有一些了解,這是第三章的主題。本章介紹了概率實驗的思想,解釋了事件概率的概念,并給出了概率的公理。我們的概率研究將在第四章繼續,這一章涉及隨機變量和期望的重要概念,在第五章,考慮一些在應用中經常出現的特殊類型的隨機變量。給出了二項式、泊松、超幾何、正態、均勻、伽馬、卡方、t和F等隨機變量。在第6章中,我們研究了樣本均值和樣本方差等抽樣統計量的概率分布。我們將展示如何使用一個著名的概率理論結果,即中心極限定理,來近似樣本均值的概率分布。此外,我們還介紹了關節基礎數據來自正態分布總體的重要特殊情況下的樣本均值和樣本方差的概率分布。第7章展示了如何使用數據來估計感興趣的參數。第8章介紹了統計假設檢驗的重要主題,它涉及到使用數據來檢驗特定假設的可信性。第9章討論回歸的重要課題。簡單線性回歸(包括回歸到均值、殘差分析和加權最小二乘等子主題)和多元線性回歸都被考慮在內。第10章是方差分析。考慮了單向和雙向(有或沒有交互的可能性)問題。第11章是關于擬合優度檢驗,它可以用來檢驗所提出的模型是否與數據一致。文中給出了經典的卡方擬合優度檢驗,并將其應用于列聯表的獨立性檢驗。本章的最后一節介紹了Kolmogorov-Smirnov程序,用于測試數據是否來自特定的連續概率分布。第12章討論了非參數假設檢驗,當人們無法假設潛在的分布具有某些特定的參數形式(如正態分布)時,可以使用非參數假設檢驗。第13章考慮質量控制的主題,一個關鍵的統計技術在制造和生產過程。我們考慮了各種控制圖,不僅包括休哈特控制圖,還包括基于移動平均線和累積總和的更復雜的控制圖。第14章討論與壽命試驗有關的問題。在本章中,指數分布,而不是正態分布,起著關鍵作用。
這完全修訂第二版介紹統計模式識別。一般來說,模式識別涵蓋了廣泛的問題:它被應用于工程問題,如字符識別和波形分析,以及生物學和心理學的大腦建模。統計決策和估計,這是本書的主要主題,被認為是研究模式識別的基礎。這本書是適當的為模式識別的入門課程的文本,并作為在該領域的工作者的參考書。每一章包含計算機項目以及練習。
//www.elsevier.com/books/introduction-to-statistical-pattern-recognition/fukunaga/978-0-08-047865-4
這本書的目的是全面概述在算法的數學分析中使用的主要技術。涵蓋的材料從經典的數學主題,包括離散數學,基本的真實分析,和組合學,以及從經典的計算機科學主題,包括算法和數據結構。重點是“平均情況”或“概率”分析,但也涵蓋了“最壞情況”或“復雜性”分析所需的基本數學工具。我們假設讀者對計算機科學和實際分析的基本概念有一定的熟悉。簡而言之,讀者應該既能寫程序,又能證明定理。否則,這本書是自成一體的。
這本書是用來作為算法分析高級課程的教科書。它也可以用于計算機科學家的離散數學課程,因為它涵蓋了離散數學的基本技術,以及組合學和重要的離散結構的基本性質,在計算機科學學生熟悉的背景下。傳統的做法是在這類課程中有更廣泛的覆蓋面,但許多教師可能會發現,這里的方法是一種有用的方式,可以讓學生參與到大量的材料中。這本書也可以用來向數學和應用數學的學生介紹與算法和數據結構相關的計算機科學原理。
盡管有大量關于算法數學分析的文獻,但該領域的學生和研究人員尚未直接獲得廣泛使用的方法和模型的基本信息。本書旨在解決這種情況,匯集了大量的材料,旨在為讀者提供該領域的挑戰的欣賞和學習正在開發的先進工具以應對這些挑戰所需的背景知識。補充的論文從文獻,這本書可以作為基礎的介紹性研究生課程的算法分析,或作為一個參考或基礎的研究人員在數學或計算機科學誰想要獲得這個領域的文獻自學。
第 1 章:算法 分析考慮算法分析的一般動機以及研究算法性能特征的各種方法之間的關系。
第 2 章:遞歸關系 專注于各種類型的 遞歸關系的基本數學屬性,這些遞歸關系在通過從程序的遞歸表示到描述其屬性的函數的遞歸表示的直接映射來分析算法時經常出現。
第 3 章:生成函數 在算法的平均情況分析中介紹了一個核心概念:生成函數 ——作為我們研究對象的算法與發現其屬性所必需的分析方法之間的必要且自然的聯系。
第 4 章:漸近逼近 研究了推導問題的近似解或逼近精確解的方法,這使我們能夠 在分析算法時對感興趣的數量進行 簡潔而精確的估計。
第 5 章:分析組合 學介紹了一種研究組合結構的現代方法,其中生成函數是研究的中心對象。這種方法是通過本書其余部分研究特定結構的基礎。
第 6 章:樹 研究了許多不同類型的 樹的屬性,以及在許多實際算法中隱含和顯式出現的基本結構。我們的目標是提供對樹組合分析的廣泛文獻結果的訪問,同時為大量算法應用提供基礎。
第 7 章:排列 調查了排列的組合屬性(數字1到N的排序),并展示了它們如何以自然的方式與基本的和廣泛使用的排序算法相關聯。
第 8 章:字符串和嘗試 研究 字符串、字符序列或從固定字母表中提取的字母的基本組合屬性,并介紹處理字符串的算法,從計算理論核心的基本方法到實用的文本處理方法重要應用程序的主機。
第 9 章:單詞和映射 涵蓋單詞的全局屬性( 來自M 字母字母表的 N 字母字符串),這些屬性在經典組合學(因為它們模擬獨立伯努利試驗的序列)和經典應用算法(因為它們散列算法的模型輸入序列)。本章還涵蓋了隨機映射 ( N個字母表中的N個字母單詞),并討論了與樹和排列的關系。
機器學習中復雜的統計數據讓許多開發人員感到擔憂。了解統計學可以幫助你建立強大的機器學習模型,針對給定的問題陳述進行優化。這本書將教你所有需要執行復雜的統計計算所需的機器學習。您將獲得有關監督學習、非監督學習、強化學習等統計信息。了解真實世界的例子,討論機器學習的統計方面,并熟悉它。您還將設計用于執行諸如模型、參數擬合、回歸、分類、密度收集等任務的程序。
到本書結束時,你將掌握機器學習所需的統計數據,并能夠將你的新技能應用于任何類型的行業問題。
在過去的二十年里,機器學習已經成為信息技術的支柱之一,并因此成為我們生活中相當核心(盡管通常是隱藏的)的一部分。隨著可用數據量的不斷增加,我們有充分的理由相信,智能數據分析將變得更加普遍,成為技術進步的必要因素。本章的目的是為讀者提供一個廣泛的應用的概述,這些應用的核心是一個機器學習問題,并給這一大堆問題帶來一定程度的秩序。在那之后,我們將討論一些來自統計和概率論的基本工具,因為它們構成了許多機器學習問題必須被表述成易于解決的語言。最后,我們將概述一套相當基本但有效的算法來解決一個重要的問題,即分類。更復雜的工具,更普遍的問題的討論和詳細的分析將在本書后面的部分。