使用Python進行自然語言處理(NLP),學習如何設置健壯環境來執行文本分析。這第二版經歷了一個重大的修改,并介紹了幾個重要的變化和基于NLP的最新趨勢的新主題。
您將了解如何在NLP中使用最新的、最先進的框架,以及機器學習和深度學習模型,用于Python支持的監督情感分析,以解決實際的案例研究。首先回顧Python中關于字符串和文本數據的NLP基礎知識,然后討論文本數據的工程表示方法,包括傳統的統計模型和新的基于深度學習的嵌入模型。本文還討論了解析和處理文本的改進技術和新方法。
文本摘要和主題模型已經全面修訂,因此本書展示了如何在NIPS會議論文的興趣數據集上下文中構建、調整和解釋主題模型。此外,這本書涵蓋了文本相似性技術與現實世界的電影推薦人的例子,以及情緒分析使用監督和非監督的技術。還有一章專門討論語義分析,您將了解如何從頭構建自己的命名實體識別(NER)系統。雖然該書的整體結構保持不變,但整個代碼庫、模塊和章節都已更新到最新的Python 3。x版本。
你將學習
這本書是給誰的
通過這個緊湊的實用指南,開始使用Python進行數據分析。這本書包括三個練習和一個用正確的格式從Python代碼中獲取數據的案例研究。使用Python學習數據分析還可以幫助您使用分析發現數據中的意義,并展示如何可視化數據。
每一節課都盡可能是獨立的,允許您根據需要插入和退出示例。如果您已經在使用Python進行數據分析,那么您會發現您希望知道如何使用Python來完成許多事情。然后,您可以將這些技術直接應用到您自己的項目中。
如果您不使用Python進行數據分析,那么本書從一開始就帶您了解基礎知識,為您在該主題中打下堅實的基礎。當你閱讀完這本書的時候,你會對如何使用Python進行數據分析有更好的理解。
你將學到什么
這本書是給誰的
想學習使用Python進行數據分析的同學。建議您具有Python方面的經驗,但不是必需的,因為您需要具有數據分析或數據科學方面的經驗。
?介紹
這本書在保持非常務實的教導和結果導向付出很大的精力。構建聊天機器人不只是完成一個教程或遵循幾個步驟,它本身就是一種技能。這本書肯定不會用大量的文本和過程讓你感到無聊;相反,它采用的是邊做邊學的方法。到目前為止,在你的生活中,你肯定至少使用過一個聊天機器人。無論你是不是一個程序員,一旦你瀏覽這本書,你會發現構建模塊的聊天機器人,所有的奧秘將被揭開。建立聊天機器人可能看起來很困難,但這本書將讓你使它如此容易。我們的大腦不是用來直接處理復雜概念的;相反,我們一步一步地學習。當你讀這本書的時候,從第一章到最后一章,你會發現事情的進展是多么的清晰。雖然你可以直接翻到任何一章,但我強烈建議你從第一章開始,因為它肯定會支持你的想法。這本書就像一個網絡系列,你在讀完一章之后就無法抗拒下一章的誘惑。在閱讀完這本書后,你所接觸到的任何聊天機器人都會在你的腦海中形成一幅關于聊天機器人內部是如何設計和構建的畫面。
這本書適合誰?
這本書將作為學習與聊天機器人相關的概念和學習如何建立他們的一個完整的資源。那些將會發現這本書有用的包括: Python web開發人員希望擴大他們的知識或職業到聊天機器人開發。 學生和有抱負的程序員想獲得一種新的技能通過親身體驗展示的東西,自然語言愛好者希望從頭開始學習。 企業家如何構建一個聊天機器人的偉大的想法,但沒有足夠的技術關于如何制作聊天機器人的可行性信息。 產品/工程經理計劃與聊天機器人相關項目。
如何使用這本書?
請記住,這本書的寫作風格和其他書不一樣。讀這本書的時候要記住,一旦你完成了這本書,你就可以自己建造一個聊天機器人,或者教會別人如何建造一個聊天機器人。在像閱讀其他書籍一樣閱讀這本書之前,務必記住以下幾點:
內容概要
有興趣的數據科學專業人士可以通過本書學習Scikit-Learn圖書館以及機器學習的基本知識。本書結合了Anaconda Python發行版和流行的Scikit-Learn庫,演示了廣泛的有監督和無監督機器學習算法。通過用Python編寫的清晰示例,您可以在家里自己的機器上試用和試驗機器學習的原理。
所有的應用數學和編程技能需要掌握的內容,在這本書中涵蓋。不需要深入的面向對象編程知識,因為工作和完整的例子被提供和解釋。必要時,編碼示例是深入和復雜的。它們也簡潔、準確、完整,補充了介紹的機器學習概念。使用示例有助于建立必要的技能,以理解和應用復雜的機器學習算法。
對于那些在機器學習方面追求職業生涯的人來說,Scikit-Learn機器學習應用手冊是一個很好的起點。學習這本書的學生將學習基本知識,這是勝任工作的先決條件。讀者將接觸到專門為數據科學專業人員設計的蟒蛇分布,并將在流行的Scikit-Learn庫中構建技能,該庫是Python世界中許多機器學習應用程序的基礎。
你將學習
這本書是給誰的
從設計和原型設計到測試、部署和維護,Python在許多方面都很有用,它一直是當今最流行的編程語言之一。這本實用的書的第三版提供了對語言的快速參考——包括Python 3.5、2.7和3.6的突出部分——它龐大的標準庫中常用的區域,以及一些最有用的第三方模塊和包。
本書非常適合具有一些Python經驗的程序員,以及來自其他編程語言的程序員,它涵蓋了廣泛的應用領域,包括web和網絡編程、XML處理、數據庫交互和高速數字計算。了解Python如何提供優雅、簡單、實用和強大功能的獨特組合。
這個版本包括:
Python算法,第二版解釋了Python方法的算法分析和設計。本書由《初級Python》的作者Magnus Lie Hetland撰寫,主要關注經典算法,但也對基本的算法解決問題技術有了深入的理解。
這本書涉及一些最重要和最具挑戰性的領域的編程和計算機科學在一個高度可讀的方式。它涵蓋了算法理論和編程實踐,演示了理論是如何反映在真實的Python程序中的。介紹了Python語言中內置的著名算法和數據結構,并向用戶展示了如何實現和評估其他算法和數據結構
獲得高級數據分析概念的廣泛基礎,并發現數據庫中的最新革命,如Neo4j、Elasticsearch和MongoDB。這本書討論了如何實現ETL技術,包括主題爬行,這是應用在諸如高頻算法交易和面向目標的對話系統等領域。您還將看到機器學習概念的示例,如半監督學習、深度學習和NLP。使用Python的高級數據分析還包括時間序列和主成分分析等重要的傳統數據分析技術。
讀完這本書,你將對分析項目的每個技術方面都有了經驗。您將了解使用Python代碼的概念,并提供在您自己的項目中使用的示例。
你會學到什么
這本書是給誰看的
對數據分析領域感興趣的數據科學家和軟件開發人員。
本書通過提供真實的案例研究和示例,為使用Python庫進行機器學習提供了堅實的基礎。它涵蓋了諸如機器學習基礎、Python入門、描述性分析和預測分析等主題。包括高級機器學習概念,如決策樹學習、隨機森林、增強、推薦系統和文本分析。這本書在理論理解和實際應用之間采取了一種平衡的方法。所有的主題都包括真實世界的例子,并提供如何探索、構建、評估和優化機器學習模型的逐步方法。
在六個步驟中學習高級Python 3主題的基礎知識,所有這些都是為了讓您成為一個有價值的實踐者而設計的。這個更新版本的方法基于“六度分離”理論,該理論指出每個人和每件事都是最多六步之遙,并將每個主題分為兩部分: 理論概念和使用適當的Python 3包的實際實現。
您將從Python 3編程語言基礎、機器學習歷史、發展和系統開發框架開始。本文還介紹了一些關鍵的數據挖掘/分析概念,如探索性分析、特征降維、回歸、時間序列預測及其在Scikit-learn中的有效實現。您還將學習常用的模型診斷和調優技術。其中包括最優的類創建概率截止點、方差、偏差、裝袋、提升、集成投票、網格搜索、隨機搜索、貝葉斯優化和物聯網數據降噪技術。
最后,您將回顧先進的文本挖掘技術,推薦系統,神經網絡,深度學習,強化學習技術及其實現。本書中提供的所有代碼都將以iPython筆記本的形式提供,使您能夠嘗試這些示例并將其擴展到您的優勢。
你將學習
這本書是給誰看的
Python開發人員、數據工程師和機器學習工程師希望將他們的知識或職業擴展到機器學習領域。
簡介:
科學專業人員可以通過本書學習Scikit-Learn庫以及機器學習的基礎知識。該書將Anaconda Python發行版與流行的Scikit-Learn庫結合在一起,展示了各種有監督和無監督的機器學習算法。通過Python編寫的清晰示例向讀者介紹機器學習的原理,以及相關代碼。
本書涵蓋了掌握這些內容所需的所有應用數學和編程技能。不需要深入的面向對象編程知識,因為可以提供并說明完整的示例。必要時,編碼示例很深入且很復雜。它們也簡潔,準確,完整,是對引入的機器學習概念的補充。處理示例有助于建立理解和應用復雜機器學習算法所需的技能。
本書的學生將學習作為勝任力前提的基礎知識。讀者將了解專門為數據科學專業人員設計的Python Anaconda發行版,并將在流行的Scikit-Learn庫中構建技能,該庫是Python領域許多機器學習應用程序的基礎。
本書內容包括:
內容介紹:
這本書分為八章。 第1章介紹了機器學習,Anaconda和Scikit-Learn的主題。 第2章和第3章介紹算法分類。 第2章對簡單數據集進行分類,第3章對復雜數據集進行分類。 第4章介紹了回歸預測模型。 第5章和第6章介紹分類調整。 第5章調整簡單數據集,第6章調整復雜數據集。 第7章介紹了預測模型回歸調整。 第8章將所有知識匯總在一起,以整體方式審查和提出發現。
作者介紹:
David Paper博士是猶他州立大學管理信息系統系的教授。他寫了兩本書-商業網絡編程:Oracle的PHP面向對象編程和Python和MongoDB的數據科學基礎。他在諸如組織研究方法,ACM通訊,信息與管理,信息資源管理期刊,AIS通訊,信息技術案例與應用研究期刊以及遠程計劃等參考期刊上發表了70余篇論文。他還曾在多個編輯委員會擔任過各種職務,包括副編輯。Paper博士還曾在德州儀器(TI),DLS,Inc.和鳳凰城小型企業管理局工作。他曾為IBM,AT&T,Octel,猶他州交通運輸部和空間動力實驗室執行過IS咨詢工作。 Paper博士的教學和研究興趣包括數據科學,機器學習,面向對象的程序設計和變更管理。
目錄: