介紹使用spaCy使用Python進行自然語言處理,spaCy是一個領先的Python自然語言處理庫。
使用Python和spaCy進行自然語言處理將向您展示如何快速輕松地創建聊天機器人、文本壓縮腳本和訂單處理工具等NLP應用程序。您將了解如何利用spaCy庫智能地從文本中提取含義;如何確定句子中詞語之間的關系(句法依賴分析);識別名詞、動詞和其他詞類(詞性標注);并將專有名詞分類,如人員、組織和地點(識別命名實體)。你甚至會學到如何將陳述轉換成問題來保持對話的進行。您還將學習如何:
每一章的“嘗試這個”部分鼓勵您通過擴展該書的示例腳本來處理更廣泛的輸入、添加錯誤處理和構建專業質量的應用程序,從而實踐您所學到的知識。在本書的最后,您將使用Python和spaCy創建自己的NLP應用程序。
Yuli Vasiliev是一名程序員、自由撰稿人和顧問,專門從事開源開發、Oracle數據庫技術和自然語言處理。
Introduction
Chapter 1: How Natural Language Processing Works Chapter 2: The Text-Processing Pipeline Chapter 3: Working with Container Objects and Customizing spaCy Chapter 4: Extracting and Using Linguistic Features Chapter 5: Working with Word Vectors Chapter 6: Finding Patterns and Walking Dependency Trees Chapter 7: Visualizations Chapter 8: Intent Recognition Chapter 9: Storing User Input in a Database Chapter 10: Training Models Chapter 11: Deploying Your Own Chatbot Chapter 12: Implementing Web Data and Processing Images Linguistic Primer
?介紹
這本書在保持非常務實的教導和結果導向付出很大的精力。構建聊天機器人不只是完成一個教程或遵循幾個步驟,它本身就是一種技能。這本書肯定不會用大量的文本和過程讓你感到無聊;相反,它采用的是邊做邊學的方法。到目前為止,在你的生活中,你肯定至少使用過一個聊天機器人。無論你是不是一個程序員,一旦你瀏覽這本書,你會發現構建模塊的聊天機器人,所有的奧秘將被揭開。建立聊天機器人可能看起來很困難,但這本書將讓你使它如此容易。我們的大腦不是用來直接處理復雜概念的;相反,我們一步一步地學習。當你讀這本書的時候,從第一章到最后一章,你會發現事情的進展是多么的清晰。雖然你可以直接翻到任何一章,但我強烈建議你從第一章開始,因為它肯定會支持你的想法。這本書就像一個網絡系列,你在讀完一章之后就無法抗拒下一章的誘惑。在閱讀完這本書后,你所接觸到的任何聊天機器人都會在你的腦海中形成一幅關于聊天機器人內部是如何設計和構建的畫面。
這本書適合誰?
這本書將作為學習與聊天機器人相關的概念和學習如何建立他們的一個完整的資源。那些將會發現這本書有用的包括: Python web開發人員希望擴大他們的知識或職業到聊天機器人開發。 學生和有抱負的程序員想獲得一種新的技能通過親身體驗展示的東西,自然語言愛好者希望從頭開始學習。 企業家如何構建一個聊天機器人的偉大的想法,但沒有足夠的技術關于如何制作聊天機器人的可行性信息。 產品/工程經理計劃與聊天機器人相關項目。
如何使用這本書?
請記住,這本書的寫作風格和其他書不一樣。讀這本書的時候要記住,一旦你完成了這本書,你就可以自己建造一個聊天機器人,或者教會別人如何建造一個聊天機器人。在像閱讀其他書籍一樣閱讀這本書之前,務必記住以下幾點:
內容概要
關于本書
我編寫了《Geoprocessing for Python》 來幫助您學習處理地理空間數據的基礎知識,主要使用GDAL/OGR。當然,還有其他的選擇,但是其中一些是在GDAL之上構建的,所以如果您理解了這本書中的內容,您就可以很容易地獲得它們。這不是一本關于地理信息系統或遙感的書,盡管會解釋一些背景理論。相反,本書將教您如何編寫用于操作和創建空間數據的Python代碼,以及一些簡單的分析。您可以使用這些構建塊來簡化您自己設計的更復雜的分析。
關于作者
Chris Garrard是在猶他州立大學昆尼自然資源學院的遙感/地理信息系統實驗室做了近15年的開發人員。在那段時間里,她一直在教授一門關于Python的GIS課程,她還在校園和會議上教授研討會。她喜歡向人們展示處理數據的開源方法,但是她最喜歡的教學方法是“Aha!”,當某人意識到編碼的能力對他們的工作有多大幫助的時候。
面向人群
這本書是為任何想學習使用地理空間數據的人準備的。本文解釋了GIS和遙感的一些基礎知識,以便初次接觸地理空間分析的讀者了解他們為什么要學習某些內容,但是代碼開始時非常簡單,因此具有地理空間背景但沒有太多編碼經驗的人也會從中受益。
內容介紹
本書共分13章。它首先介紹了地理空間數據和Python,然后介紹了矢量數據、空間參考系統、光柵數據和可視化。
第1章是空間數據和分析的介紹。它描述了您可以對不同類型的數據執行的分析類型,以及向量和柵格數據之間的差異以及它們各自的用途。
第2章是Python的快速入門。
第3章解釋了什么是OGR庫,并教你如何讀、寫和編輯向量數據源。
第4章深入探討向量格式之間的差異。雖然在許多情況下可以對各種格式進行相同的處理,但是在這里您將了解特定的功能。
第5章教你如何過濾和選擇基于空間和attri- bute關系的數據。
第6章描述了創建和編輯點、線和多邊形幾何圖形的細節。
第7章向您展示了如何查看幾何圖形之間的空間關系,以及如何使用這些概念進行簡單的分析。
第8章包括空間參考系統的介紹,然后教你如何使用它們并在它們之間轉換數據。
第9章解釋了什么是GDAL庫,并教你如何讀寫光柵數據集。它還向您展示了如何在實際坐標和像素偏移量之間進行轉換。
第10章向您介紹如何處理光柵數據的各個方面,如地面控制點、顏色表、直方圖和屬性表。它還包括回調函數和錯誤處理程序的使用。
第11章描述了如何在映射代數中使用NumPy和SciPy,包括局部、焦點、區域和全局分析,并介紹了重新采樣數據的一些方法。
第12章向您展示了一些用于有監督和無監督地圖分類的技術。
第13章教你如何使用matplotlib和Mapnik來可視化你的數據。
掌握通過機器學習和深度學習識別和解決復雜問題的基本技能。使用真實世界的例子,利用流行的Python機器學習生態系統,這本書是你學習機器學習的藝術和科學成為一個成功的實踐者的完美伴侶。本書中使用的概念、技術、工具、框架和方法將教會您如何成功地思考、設計、構建和執行機器學習系統和項目。
使用Python進行的實際機器學習遵循結構化和全面的三層方法,其中包含了實踐示例和代碼。
第1部分側重于理解機器學習的概念和工具。這包括機器學習基礎,對算法、技術、概念和應用程序的廣泛概述,然后介紹整個Python機器學習生態系統。還包括有用的機器學習工具、庫和框架的簡要指南。
第2部分詳細介紹了標準的機器學習流程,重點介紹了數據處理分析、特征工程和建模。您將學習如何處理、總結和可視化各種形式的數據。特性工程和選擇方法將詳細介紹真實數據集,然后是模型構建、調優、解釋和部署。
第3部分探討了多個真實世界的案例研究,涵蓋了零售、交通、電影、音樂、營銷、計算機視覺和金融等不同領域和行業。對于每個案例研究,您將學習各種機器學習技術和方法的應用。動手的例子將幫助您熟悉最先進的機器學習工具和技術,并了解什么算法最適合任何問題。
實用的機器學習與Python將授權您開始解決您自己的問題與機器學習今天!
你將學習:
這本書是給誰看的 IT專業人士、分析師、開發人員、數據科學家、工程師、研究生
目錄:
Part I: Understanding Machine Learning
Chapter 12: Deep Learning for Computer Vision
Manning2020新書《Practices of the Python Pro》,250頁pdf
專業開發人員知道編寫干凈、組織良好、易于維護的應用程序代碼的許多好處。通過學習和遵循已建立的模式和最佳實踐,您可以將您的代碼和您的職業生涯提升到一個新的水平。
通過Python Pro的實踐,您將學習如何使用非常流行的編程語言Python來設計專業級別的、干凈的、易于維護的軟件。您會發現一些容易理解的示例,它們使用偽代碼和Python來介紹軟件開發的最佳實踐,以及許多即時有用的技術,可以幫助您像專業人員一樣編寫代碼。
Python Pro的實踐教會您設計和編寫可理解、可維護和可擴展的專業質量的軟件。Dane Hillard是一名Python專業人員,他幫助許多開發人員完成了這一步,并且他知道這需要什么。通過一些有用的示例和練習,他可以告訴您何時、為什么以及如何模塊化代碼,如何通過減少復雜性來提高質量,等等。接受這些核心原則,您的代碼將變得更容易閱讀、維護和重用。