這新版本的教科書/參考提供了從工程的角度對概率圖模型(PGMs)的介紹。它提供了關于馬爾科夫決策過程、圖模型和深度學習的新材料,以及更多的練習。
這本書涵蓋了PGM的每個主要類的基礎知識,包括表示、推理和學習原理,并回顧了每種類型的模型的實際應用。這些應用來自廣泛的學科,突出了貝葉斯分類器、隱藏馬爾可夫模型、貝葉斯網絡、動態和時間貝葉斯網絡、馬爾可夫隨機場、影響圖和馬爾可夫決策過程的許多使用。
概率圖模型(PGMs)及其在不確定性下進行智能推理的應用出現于20世紀80年代的統計和人工智能推理領域。人工智能的不確定性(UAI)會議成為這一蓬勃發展的研究領域的首要論壇。20歲的時候,我在圣何塞的UAI-92大學第一次見到了恩里克·蘇卡——我們都是研究生——在那里,他展示了他關于高層次視覺推理的關系和時間模型的研究成果。在過去的25年里,Enrique對我們的領域做出了令人印象深刻的研究貢獻,從客觀概率的基礎工作,到開發時態和事件貝葉斯網絡等高級形式的PGMS,再到PGMS的學習,例如,他的最新研究成果是用于多維分類的貝葉斯鏈分類器。
概率圖模型作為一種強大而成熟的不確定性推理技術已被廣泛接受。與早期專家系統中采用的一些特殊方法不同,PGM基于圖和概率論的強大數學基礎。它們可用于廣泛的推理任務,包括預測、監測、診斷、風險評估和決策。在開源軟件和商業軟件中有許多有效的推理和學習算法。此外,它們的力量和功效已通過其成功應用于大量現實世界的問題領域而得到證明。Enrique Sucar是PGM作為實用和有用技術建立的主要貢獻者,他的工作跨越了廣泛的應用領域。這些領域包括醫學、康復和護理、機器人和視覺、教育、可靠性分析以及從石油生產到發電廠的工業應用。
機器學習已經成為近年來最流行的話題之一。我們今天看到的機器學習的應用只是冰山一角。機器學習革命才剛剛開始。它正在成為所有現代電子設備不可分割的一部分。在自動化領域的應用,如汽車、安全和監視、增強現實、智能家居、零售自動化和醫療保健,還不多。機器人技術也正在崛起,主宰自動化世界。機器學習在機器人領域的未來應用仍未被普通讀者發現。因此,我們正在努力編寫這本關于機器學習在機器人技術上的未來應用的編輯書籍,其中幾個應用已經包含在單獨的章節中。這本書的內容是技術性的。它試圖覆蓋機器學習的所有可能的應用領域。這本書將提供未來的愿景在未探索的領域的應用機器人使用機器學習。本書中提出的觀點得到了原始研究結果的支持。本章在這里提供了所有必要的理論和數學計算的深入研究。對于外行人和開發人員來說,它將是完美的,因為它將結合高級材料和介紹性材料,形成一個論點,說明機器學習在未來可以實現什么。它將詳細介紹未來的應用領域及其方法。因此,本書將極大地有利于學術界、研究人員和行業項目管理者開發他們的新項目,從而造福人類。
PyTorch是Facebook于2017年初在機器學習和科學計算工具Torch的基礎上,針對Python語言發布的一個全新的機器學習工具包,一經推出便受到了業界的廣泛關注和討論,目前已經成為機器學習從業人員的研發工具。
《PyTorch深度學習》是使用PyTorch構建神經網絡模型的實用指南,內容分為9章,包括PyTorch與深度學習的基礎知識、神經網絡的構成、神經網絡的知識、機器學習基礎知識、深度學習在電腦視覺中的應用、深度學習在序列數據和文本中的應用、生成網絡、現代網絡架構,以及PyTorch與深度學習的未來走向。
《PyTorch深度學習》適合對深度學習領域感興趣且希望一探PyTorch的業內人員閱讀;具備其他深度學習框架使用經驗的讀者,也可以通過本書掌握PyTorch的用法。
Vishnu Subramanian在領導、設計和實施大數據分析項目(人工智能、機器學習和深度學習)方面富有經驗。
擅長機器學習、深度學習、分布式機器學習和可視化等。 在零售、金融和旅行等行業頗具經驗,還善于理解和協調企業、人工智能和工程團隊之間的關系。
文本無處不在,對社會科學家來說,它是一個極好的資源。然而,由于信息非常豐富,而且語言又是千變萬化的,通常很難提取出我們想要的信息。人工智能的整個子領域與文本分析(自然語言處理)有關。開發的許多基本分析方法現在都可以作為Python實現使用。這本書將告訴您何時使用哪個方法、它如何工作的數學背景以及實現它的Python代碼。
概述:
今天,文本是我們生活中不可或缺的一部分,也是最豐富的信息來源之一。平均每天,我們閱讀約9000字,包括電子郵件、短信、新聞、博客文章、報告、推特,以及街道名稱和廣告。在你一生的閱讀過程中,這會讓你有大約2億字。這聽起來令人印象深刻(事實也的確如此),然而,我們可以在不到0.5 g的空間里存儲這些信息:我們可以在u盤上隨身攜帶一生都值得閱讀的信息。在我寫這篇文章的時候,互聯網上估計至少有超過1200 TB的文本,或250萬人的閱讀價值。現在,大部分文本都以社交媒體的形式存在:微博、推特、Facebook狀態、Instagram帖子、在線評論、LinkedIn個人資料、YouTube評論等等。然而,文本即使在線下也是豐富的——季度收益報告、專利申請、問卷答復、書面信函、歌詞、詩歌、日記、小說、議會會議記錄、會議記錄,以及成千上萬的其他形式,可以(也正在)用于社會科學研究和數據挖掘。
文本是一個極好的信息來源,不僅僅是因為它的規模和可用性。它(相對)是永久性的,而且——最重要的是——它對語言進行編碼。這一人類能力(間接地,有時甚至直接地)反映了廣泛的社會文化和心理結構:信任、權力、信仰、恐懼。因此,文本分析被用于衡量社會文化結構,如信任(Niculae, Kumar, Boyd-Graber, & danescul - niculescul - mizil, 2015)和權力(Prabhakaran, Rambow, & Diab, 2012)。語言編碼了作者的年齡、性別、出身和許多其他人口統計因素(Labov, 1972;Pennebaker, 2011;Trudgill, 2000)。因此,文本可以用來衡量社會隨著時間推移對這些目標概念的態度(見Garg, Schiebinger, Jurafsky, & Zou, 2018;Hamilton, Leskovec, & Jurafsky, 2016;Kulkarni, Al-Rfou, Perozzi, & Skiena, 2015)。
然而,這種海量數據可能很快就會讓人喘不過氣來,處理這些數據可能會讓人望而生畏。文本通常被稱為非結構化數據,這意味著它不是以電子表格的形式出現,而是整齊地按類別排列。它有不同的長度,如果不首先對其進行格式化,就不能很容易地將其送入您喜歡的統計分析工具。然而,正如我們將看到的,“非結構化”是一個有點用詞不當。文本絕不是沒有任何結構的——它遵循非常規則的結構,受語法規則的控制。如果你知道這些,理解文本就會變得容易得多。
這本書分成兩部分。在前半部分,我們將學習文本和語言的一些基本屬性——語言分析的層次、語法和語義成分,以及如何描述它們。我們還將討論為我們的分析刪除哪些內容,保留哪些內容,以及如何計算簡單、有用的統計數據。在下半部分,我們將著眼于探索,發現數據中的潛在結構。我們將從簡單的統計學習到更復雜的機器學習方法,如主題模型、詞嵌入和降維。
概率論起源于17世紀的法國,當時兩位偉大的法國數學家,布萊斯·帕斯卡和皮埃爾·德·費馬,對兩個來自機會博弈的問題進行了通信。帕斯卡和費馬解決的問題繼續影響著惠更斯、伯努利和DeMoivre等早期研究者建立數學概率論。今天,概率論是一個建立良好的數學分支,應用于從音樂到物理的學術活動的每一個領域,也應用于日常經驗,從天氣預報到預測新的醫療方法的風險。
本文是為數學、物理和社會科學、工程和計算機科學的二、三、四年級學生開設的概率論入門課程而設計的。它提出了一個徹底的處理概率的想法和技術為一個牢固的理解的主題必要。文本可以用于各種課程長度、水平和重點領域。
在標準的一學期課程中,離散概率和連續概率都包括在內,學生必須先修兩個學期的微積分,包括多重積分的介紹。第11章包含了關于馬爾可夫鏈的材料,為了涵蓋這一章,一些矩陣理論的知識是必要的。
文本也可以用于離散概率課程。材料被組織在這樣一種方式,離散和連續的概率討論是在一個獨立的,但平行的方式,呈現。這種組織驅散了對概率過于嚴格或正式的觀點,并提供了一些強大的教學價值,因為離散的討論有時可以激發更抽象的連續的概率討論。在離散概率課程中,學生應該先修一學期的微積分。
為了充分利用文中的計算材料和例子,假設或必要的計算背景很少。所有在文本中使用的程序都是用TrueBASIC、Maple和Mathematica語言編寫的。
這本書是關于運用機器和深度學習來解決石油和天然氣行業的一些挑戰。這本書開篇簡要討論石油和天然氣勘探和生產生命周期中不同階段的數據流工業操作。這導致了對一些有趣問題的調查,這些問題很適合應用機器和深度學習方法。最初的章節提供了Python編程語言的基礎知識,該語言用于實現算法;接下來是監督和非監督機器學習概念的概述。作者提供了使用開源數據集的行業示例以及對算法的實際解釋,但沒有深入研究所使用算法的理論方面。石油和天然氣行業中的機器學習涵蓋了包括地球物理(地震解釋)、地質建模、油藏工程和生產工程在內的各種行業主題。
在本書中,重點在于提供一種實用的方法,提供用于實現機器的逐步解釋和代碼示例,以及用于解決油氣行業現實問題的深度學習算法。
你將學到什么
這本書是給誰的
這個可訪問的文本/參考提供了從工程角度對概率圖模型(PGMs)的一般介紹。這本書涵蓋了每一個PGMs的主要類的基礎知識,包括表示、推理和學習原則,并回顧了每種類型模型的實際應用。這些應用來自廣泛的學科領域,突出了貝葉斯分類器、隱馬爾可夫模型、貝葉斯網絡、動態和時態貝葉斯網絡、馬爾可夫隨機域、影響圖和馬爾可夫決策過程的多種用途。
提出了一個統一的框架,包括所有的主要類別的PGMs;描述不同技術的實際應用;檢視該領域的最新發展,包括多維貝葉斯分類器、相關圖模型和因果模型;在每一章的結尾提供練習,進一步閱讀的建議,和研究或編程項目的想法。
概率圖模型是機器學習中的一種技術,它使用圖論的概念來簡明地表示和最佳地預測數據問題中的值。
圖模型為我們提供了在數據中發現復雜模式的技術,廣泛應用于語音識別、信息提取、圖像分割和基因調控網絡建模等領域。
這本書從概率論和圖論的基礎開始,然后繼續討論各種模型和推理算法。所有不同類型的模型都將與代碼示例一起討論,以創建和修改它們,并在它們上運行不同的推理算法。有一整章是關于樸素貝葉斯模型和隱馬爾可夫模型的。這些模型已經通過實際例子進行了詳細的討論。
你會學到什么
圖模型中的示例算法 通過真實的例子來掌握樸素貝葉斯的細節 使用Python中的各種庫部署PGMs 獲得隱馬爾可夫模型的工作細節與現實世界的例子
詳細 概率圖模型是機器學習中的一種技術,它使用圖論的概念來簡潔地表示和最佳地預測數據問題中的值。在現實問題中,往往很難選擇合適的圖模型和合適的推理算法,這對計算時間和精度有很大的影響。因此,了解這些算法的工作細節是至關重要的。
這本書從概率論和圖論的基礎開始,然后繼續討論各種模型和推理算法。所有不同類型的模型都將與代碼示例一起討論,以創建和修改它們,并在它們上運行不同的推理算法。有一個完整的章節專門討論最廣泛使用的網絡樸素貝葉斯模型和隱馬爾可夫模型(HMMs)。這些模型已經通過實際例子進行了詳細的討論。
風格和方法 一個易于遵循的指南,幫助您理解概率圖模型使用簡單的例子和大量的代碼例子,重點放在更廣泛使用的模型。