用科學的分析方法從數據中挖掘出更多的信息
圖分析和可視化將圖論從實驗室帶到了現實世界。使用跨越分析功能的復雜方法和工具,本指南向您展示了如何利用圖和網絡分析技術來發現新的業務見解和機會。全彩出版,這本書描述了創建強大的可視化的過程中使用了豐富和迷人的一組例子,從體育,金融,營銷,安全,社會媒體,等等。您將找到模式識別和使用各種數據源(包括大數據)的實用指南,以及關于軟件和編程的清晰說明。這個配套的網站提供了數據集、Python中的完整代碼示例以及到書中涉及的所有工具的鏈接。
科學已經從網絡和圖論中獲益,這為物理學、經濟學、遺傳學等領域的突破提供了動力。本書將這些經過驗證的技術引入商業、金融、戰略和設計領域,幫助從數據中提取更多的信息,并更好地將結果傳達給決策者。
在網絡和圖論方面有大量的科學工作,但很少直接應用于核心科學之外的分析功能——直到現在。對于那些尋求經驗為基礎的,系統的分析方法和強大的工具,適用于實驗室之外,圖形分析和可視化是一個徹底的,權威的資源。
通過技術例子從業務角度發現深度學習的潛在應用、挑戰和機會。這些應用包括圖像識別、分割和注釋、視頻處理和注釋、語音識別、智能個人助理、自動翻譯和自動車輛。
面向開發者的深度學習業務應用介紹涵蓋了一些常見的DL算法,比如基于內容的推薦算法和自然語言處理。您將探索一些示例,例如使用全卷積神經網絡(FCNN)和剩余神經網絡(ResNets)進行視頻預測。您還將看到DL用于控制機器人的應用程序,使用蒙特卡羅樹搜索(用于在圍棋游戲中擊敗人類)探索DeepQ學習算法,以及為財務風險評估建模。這里還將提到一組被稱為生成對抗神經網絡(GANs)的強大算法,它可用于圖像著色、圖像補全和樣式轉換。
讀完這本書,你將對深度神經網絡這一令人興奮的領域有一個概述,并對深度學習的大部分主要應用有一個理解。這本書包含了一些代碼示例、技巧和如何使用Keras框架訓練深度學習模型的見解。
你將學到什么
這本書是給誰的
通過這個緊湊的實用指南,開始使用Python進行數據分析。這本書包括三個練習和一個用正確的格式從Python代碼中獲取數據的案例研究。使用Python學習數據分析還可以幫助您使用分析發現數據中的意義,并展示如何可視化數據。
每一節課都盡可能是獨立的,允許您根據需要插入和退出示例。如果您已經在使用Python進行數據分析,那么您會發現您希望知道如何使用Python來完成許多事情。然后,您可以將這些技術直接應用到您自己的項目中。
如果您不使用Python進行數據分析,那么本書從一開始就帶您了解基礎知識,為您在該主題中打下堅實的基礎。當你閱讀完這本書的時候,你會對如何使用Python進行數據分析有更好的理解。
你將學到什么
這本書是給誰的
想學習使用Python進行數據分析的同學。建議您具有Python方面的經驗,但不是必需的,因為您需要具有數據分析或數據科學方面的經驗。
有興趣的數據科學專業人士可以通過本書學習Scikit-Learn圖書館以及機器學習的基本知識。本書結合了Anaconda Python發行版和流行的Scikit-Learn庫,演示了廣泛的有監督和無監督機器學習算法。通過用Python編寫的清晰示例,您可以在家里自己的機器上試用和試驗機器學習的原理。
所有的應用數學和編程技能需要掌握的內容,在這本書中涵蓋。不需要深入的面向對象編程知識,因為工作和完整的例子被提供和解釋。必要時,編碼示例是深入和復雜的。它們也簡潔、準確、完整,補充了介紹的機器學習概念。使用示例有助于建立必要的技能,以理解和應用復雜的機器學習算法。
對于那些在機器學習方面追求職業生涯的人來說,Scikit-Learn機器學習應用手冊是一個很好的起點。學習這本書的學生將學習基本知識,這是勝任工作的先決條件。讀者將接觸到專門為數據科學專業人員設計的蟒蛇分布,并將在流行的Scikit-Learn庫中構建技能,該庫是Python世界中許多機器學習應用程序的基礎。
你將學習
這本書是給誰的
從設計和原型設計到測試、部署和維護,Python在許多方面都很有用,它一直是當今最流行的編程語言之一。這本實用的書的第三版提供了對語言的快速參考——包括Python 3.5、2.7和3.6的突出部分——它龐大的標準庫中常用的區域,以及一些最有用的第三方模塊和包。
本書非常適合具有一些Python經驗的程序員,以及來自其他編程語言的程序員,它涵蓋了廣泛的應用領域,包括web和網絡編程、XML處理、數據庫交互和高速數字計算。了解Python如何提供優雅、簡單、實用和強大功能的獨特組合。
這個版本包括:
數據科學庫、框架、模塊和工具包非常適合進行數據科學研究,但它們也是深入研究這一學科的好方法,不需要真正理解數據科學。在本書中,您將了解到許多最基本的數據科學工具和算法都是通過從頭實現來實現的。
如果你有數學天賦和一些編程技能,作者Joel Grus將幫助你熟悉作為數據科學核心的數學和統計,以及作為數據科學家的入門技能。如今,這些雜亂的、充斥著海量數據的數據,為一些甚至沒人想過要問的問題提供了答案。這本書為你提供了挖掘這些答案的訣竅。
參加Python速成班
本書主要內容包括:數據清洗在數據科學領域中的重要作用,文件格式、數據類型、字符編碼的基本概念,組織和處理數據的電子表格與文本編輯器,各種格式數據的轉換方法,解析和清洗網頁上的HTML 文件的三種策略,提取和清洗PDF 文件中數據的方法,檢測和清除RDBMS 中的壞數據的解決方案,以及使用書中介紹的方法清洗來自Twitter 和Stack Overflow 的數據。
本書適合任何水平的數據科學家以及對數據清理感興趣的讀者閱讀。
數據清洗是數據挖掘與分析過程中不可缺少的一個環節,但因為數據類型極其復雜,傳統的清洗臟數據工作單調乏味且異常辛苦。如果能利用正確的工具和方法,就可以讓數據清洗工作事半功倍。
本書從文件格式、數據類型、字符編碼等基本概念講起,通過真實的示例,探討如何提取和清洗關系型數據庫、網頁文件和PDF文檔中的數據。最后提供了兩個真實的項目,讓讀者將所有數據清洗技術付諸實踐,完成整個數據科學過程。
如果你是一位數據科學家,或者從事數據科學工作,哪怕是位新手,只要對數據清洗有興趣,那么本書就適合你閱讀!
如果編程是一種魔法,那么web抓取無疑是一種魔術。通過編寫一個簡單的自動化程序,您可以查詢web服務器、請求數據并解析它以提取所需的信息。這本實用書籍的擴展版不僅介紹了web抓取,而且還提供了從現代web中抓取幾乎所有類型數據的全面指南。
第1部分側重于web抓取機制:使用Python從web服務器請求信息,執行服務器響應的基本處理,并以自動方式與站點交互。第2部分探索了各種更具體的工具和應用程序,以適應您可能遇到的任何web抓取場景。
BuzzFeed News高級記者Lam Thuy Vo解釋了如何使用Python編程語言以有意義的方式挖掘、處理和分析社交網站上的數據。
虛假的推特賬號影響了總統選舉嗎?關于人類行為,Facebook和Reddit的檔案能告訴我們什么?在《挖掘社交媒體》中,BuzzFeed資深記者Lam Thuy Vo向你展示了如何使用Python和關鍵數據分析工具來挖掘隱藏在社交媒體中的故事。
無論您是專業記者、學術研究者還是公民調查員,您都將學習如何使用技術工具來收集和分析來自社交媒體的數據,從而構建引人注目的、數據驅動的故事。
學習如何:
社交媒體上充斥著成千上萬個隱藏的故事,等著被人講述。學習使用專業人士用來編寫自己的數據驅動的故事的數據偵探工具。
通過機器學習的實際操作指南深入挖掘數據
機器學習: 為開發人員和技術專業人員提供實踐指導和全編碼的工作示例,用于開發人員和技術專業人員使用的最常見的機器學習技術。這本書包含了每一個ML變體的詳細分析,解釋了它是如何工作的,以及如何在特定的行業中使用它,允許讀者在閱讀過程中將所介紹的技術融入到他們自己的工作中。機器學習的一個核心內容是對數據準備的強烈關注,對各種類型的學習算法的全面探索說明了適當的工具如何能夠幫助任何開發人員從現有數據中提取信息和見解。這本書包括一個完整的補充教師的材料,以方便在課堂上使用,使這一資源有用的學生和作為一個專業的參考。
機器學習的核心是一種基于數學和算法的技術,它是歷史數據挖掘和現代大數據科學的基礎。對大數據的科學分析需要機器學習的工作知識,它根據從訓練數據中獲得的已知屬性形成預測。機器學習是一個容易理解的,全面的指導,為非數學家,提供明確的指導,讓讀者:
通過學習構建一個可以從數據中學習的系統,讀者可以在各個行業中增加他們的效用。機器學習是深度數據分析和可視化的核心,隨著企業發現隱藏在現有數據中的金礦,這一領域的需求越來越大。對于涉及數據科學的技術專業人員,機器學習:為開發人員和技術專業人員提供深入挖掘所需的技能和技術。
從數據科學的角度研究Python,并學習用于做出關鍵業務決策的數據可視化的成熟技術。從介紹Python的數據科學開始,您將進一步了解Python環境,并熟悉Jupyter Notebook和Spyder等編輯器。通過Python編程入門之后,您將掌握數據科學中使用的基本Python編程技術。接下來是數據可視化,您將看到它如何滿足現代業務需求并形成決策的關鍵因素。您還將了解Python中一些流行的數據可視化庫。
將重點轉移到數據結構,您將從數據科學的角度了解數據結構的各個方面。然后使用Python處理文件I/O和正則表達式,然后收集和清理數據。繼續探索和分析數據,您將看到Python中的高級數據結構。然后,您將深入研究數據可視化技術,了解Python中的許多繪圖系統。
最后,您將完成一個詳細的案例研究,您將有機會重溫到目前為止介紹的概念。
你會學到什么
這本書是給誰看的
具有基本Python編程知識的開發人員希望采用使用Python進行數據分析和可視化的關鍵策略。