學習使用技術進行數據科學并在實踐中利用物聯網(IoT)。這本書介紹了現代數據科學的核心概念。您將從可以在BBC micro:bit上進行的簡單應用程序開始,然后使用其他硬件進行更復雜的實驗。
在教育領域,數據科學是最令人興奮和增長最快的主題之一。理解數據是如何工作的,以及如何使用數據,是21世紀的一項關鍵生活技能。在一個由信息驅動的世界里,學生們必須配備他們需要的工具來理解這一切。例如,考慮一下數據科學是如何成為識別氣候變化危險的關鍵因素,并繼續幫助我們識別和應對它帶來的威脅。這本書探討了數據的威力,以及如何使用手邊的硬件來應用數據。
您將學習數據科學的核心概念,如何在現實世界中應用它們,以及如何利用物聯網的巨大潛力。到最后,你將能夠執行復雜而有意義的數據科學實驗——為什么不成為一名公民科學家,為對抗氣候變化做出真正的貢獻呢?
你將學習
如果您是用Python編程的新手,并且正在尋找可靠的介紹,那么這本書就是為您準備的。由計算機科學教師開發,在“為絕對初學者”系列叢書通過簡單的游戲創造教授編程的原則。您將獲得實際的Python編程應用程序所需的技能,并將了解如何在真實場景中使用這些技能。在整個章節中,你會發現一些代碼示例來說明所提出的概念。在每一章的結尾,你會發現一個完整的游戲,展示了這一章的關鍵思想,一章的總結,以及一系列的挑戰來測試你的新知識。當你讀完這本書的時候,你將非常精通Python,并且能夠將你所學到的基本編程原理應用到你要處理的下一種編程語言。
探索多年來用戶研究如何受到一系列學科的影響,如人機交互、可用性、人類學、認知心理學、人體工程學等。本書旨在為用戶研究社區做出貢獻,涵蓋的主題將幫助用戶體驗專業人士、學生和利益相關者更好地理解什么是用戶研究。
通過這本書,你將獲得一套實用的技能,范圍從如何進行研究,以建立一個案例,以獲得所需的預算和資源。它將為你提供一個如何組織你的研究,如何計劃它,以及如何在整個項目中管理利益相關者的期望的清晰的說明。您將看到如何將用戶研究融入到您的組織中,并在不同的產品開發階段(發現、Alpha、Beta直到上線)將其結合起來,以及如何發展一個用戶研究團隊。
《實用用戶研究》回顧了用于用戶研究的方法論,著眼于如何招募參與者,如何收集和分析數據,最后關注如何解釋和展示你的發現。跨文化研究、可及性和輔助數字研究也將在本書中討論。最后一章給你10個項目概要,你將能夠應用你的新技能集,并將你所學到的付諸實踐。
你將學習:
這本書是給誰的:
使用Microsoft Excel中流行的數據挖掘技術,更好地理解機器學習方法。
軟件工具和編程語言包接受數據輸入并直接交付數據挖掘結果,對工作機制沒有任何見解,并在輸入和輸出之間造成了鴻溝。這就是Excel可以提供幫助的地方。
Excel允許您以透明的方式處理數據。當您打開一個Excel文件時,數據立即可見,您可以直接使用它。在執行挖掘任務時,可以檢查中間結果,從而更深入地理解如何操作數據和獲得結果。這些是隱藏在軟件工具和編程語言包中的模型構建過程的關鍵方面。
這本書教你通過Excel進行數據挖掘。您將了解當數據集不是很大時Excel在數據挖掘方面的優勢。它可以為您提供數據挖掘的可視化表示,在結果中建立信心。您將手動完成每一個步驟,這不僅提供了一個主動學習體驗,而且還告訴您挖掘過程是如何工作的,以及如何發現數據內部隱藏的模式。
你將學到什么
這本書是給誰的
【導讀】來自蘇黎世聯邦理工學院的Afonso S. Bandeira教授撰寫了《數據科學數學基礎》新書書稿,共170頁pdf。現今在許多科學領域的實驗、觀察和數值模擬產生了大量的數據。這種快速增長預示著“以數據為中心的科學”時代的到來,這需要新的范式來處理如何獲取、處理、分布和分析數據。與此同時,人工智能的發展將給技術、科學和工業的許多領域帶來革命。本課程將涵蓋用于開發算法的數學模型和概念,這些算法可以處理數據科學、機器學習和人工智能帶來的一些挑戰。
關于大數據技術的信息很多,但將這些技術拼接到端到端企業數據平臺是一項艱巨的任務,沒有得到廣泛的討論。通過這本實用的書,您將學習如何在本地和云中構建大數據基礎設施,并成功地構建一個現代數據平臺。
本書非常適合企業架構師、IT經理、應用程序架構師和數據工程師,它向您展示了如何克服Hadoop項目期間出現的許多挑戰。在深入了解以下內容之前,您將在一個徹底的技術入門中探索Hadoop和大數據領域中可用的大量工具:
-平臺: 了解部署、操作、安全性、高可用性和災難恢復的各個方面,以及將平臺與企業IT的其他部分集成在一起所需了解的所有內容
機器學習是計算機科學中增長最快的領域之一,具有深遠的應用。本書的目的是介紹機器學習,以及它所提供的算法范例。本書對機器學習的基本原理和將這些原理轉化為實際算法的數學推導提供了理論解釋。在介紹了基礎知識之后,這本書涵蓋了以前教科書沒有涉及到的一系列廣泛的中心主題。這些包括討論學習的計算復雜性和凸性和穩定性的概念;重要的算法范例包括隨機梯度下降、神經網絡和結構化輸出學習;以及新興的理論概念,如PAC-Bayes方法和基于壓縮的界限。本文面向高級本科生或剛畢業的學生,使統計學、計算機科學、數學和工程學領域的學生和非專業讀者都能接觸到機器學習的基本原理和算法。
//www.cse.huji.ac.il/~shais/UnderstandingMachineLearning/index.html
概述
機器學習是指自動檢測數據中有意義的模式。在過去的幾十年里,它已經成為幾乎所有需要從大數據集中提取信息的任務的通用工具。我們被一種基于機器學習的技術包圍著:搜索引擎學習如何給我們帶來最好的結果(同時投放有利可圖的廣告),反垃圾郵件軟件學習如何過濾我們的電子郵件信息,信用卡交易被一種學習如何偵測欺詐的軟件保護著。數碼相機學會識別人臉,智能手機上的智能個人輔助應用學會識別語音指令。汽車配備了使用機器學習算法構建的事故預防系統。機器學習還廣泛應用于生物信息學、醫學和天文學等科學領域。
所有這些應用程序的一個共同特征是,與計算機的更傳統使用相比,在這些情況下,由于需要檢測的模式的復雜性,人類程序員無法提供關于這些任務應該如何執行的明確、詳細的規范。以智慧生物為例,我們的許多技能都是通過學習我們的經驗(而不是遵循給我們的明確指示)而獲得或改進的。機器學習工具關注的是賦予程序“學習”和適應的能力。
這本書的第一個目標是提供一個嚴格的,但易于遵循,介紹機器學習的主要概念: 什么是機器學習?
本書的第二個目標是介紹幾種關鍵的機器學習算法。我們選擇展示的算法一方面在實踐中得到了成功應用,另一方面提供了廣泛的不同的學習技術。此外,我們特別關注適合大規模學習的算法(又稱“大數據”),因為近年來,我們的世界變得越來越“數字化”,可用于學習的數據量也在急劇增加。因此,在許多應用中數據量大,計算時間是主要瓶頸。因此,我們明確地量化了學習給定概念所需的數據量和計算時間。
目錄:
Part I: Foundations
Part II: From Theory to Algorithms
Part III: Additional Learning Models
Part IV: Advanced Theory
Appendices
簡單易懂,讀起來很有趣,介紹Python對于初學者和語言新手都是理想的。作者Bill Lubanovic帶您從基礎知識到更復雜和更多樣的主題,混合教程和烹飪書風格的代碼配方來解釋Python 3中的概念。章節結尾的練習可以幫助你練習所學的內容。
您將獲得該語言的堅實基礎,包括測試、調試、代碼重用和其他開發技巧的最佳實踐。本書還向您展示了如何使用各種Python工具和開放源碼包將Python用于商業、科學和藝術領域的應用程序。
本書主要內容包括:數據清洗在數據科學領域中的重要作用,文件格式、數據類型、字符編碼的基本概念,組織和處理數據的電子表格與文本編輯器,各種格式數據的轉換方法,解析和清洗網頁上的HTML 文件的三種策略,提取和清洗PDF 文件中數據的方法,檢測和清除RDBMS 中的壞數據的解決方案,以及使用書中介紹的方法清洗來自Twitter 和Stack Overflow 的數據。
本書適合任何水平的數據科學家以及對數據清理感興趣的讀者閱讀。
數據清洗是數據挖掘與分析過程中不可缺少的一個環節,但因為數據類型極其復雜,傳統的清洗臟數據工作單調乏味且異常辛苦。如果能利用正確的工具和方法,就可以讓數據清洗工作事半功倍。
本書從文件格式、數據類型、字符編碼等基本概念講起,通過真實的示例,探討如何提取和清洗關系型數據庫、網頁文件和PDF文檔中的數據。最后提供了兩個真實的項目,讓讀者將所有數據清洗技術付諸實踐,完成整個數據科學過程。
如果你是一位數據科學家,或者從事數據科學工作,哪怕是位新手,只要對數據清洗有興趣,那么本書就適合你閱讀!
這本書向你展示了如何建立實時圖像處理系統,一直到家庭自動化。了解如何開發一個基于32位ARM處理器的系統,通過語音命令實現完全控制
實時圖像處理系統被廣泛應用于各種應用中,如交通監控系統、醫學圖像處理和生物特征安全系統。在使用深度神經網絡的實時物聯網成像中,您將學習如何使用Java和OpenCV的包裝器來利用最佳的DNN模型來檢測圖像中的對象。在為遠程編程準備Visual Studio代碼時,仔細看看Java腳本是如何在Raspberry Pi上工作的。您還將獲得有關圖像和視頻腳本的見解。作者Nicolas Modrzyk向您展示了如何使用Rhasspy語音平臺來添加一個強大的語音助手,并從您的計算機上完全運行和控制您的Raspberry Pi。
為了讓您的語音意圖為家庭自動化做好準備,您將探索Java如何連接到MQTT并處理參數化的Rhasspy語音命令。有了語音控制系統,您就可以在選定的環境中執行簡單的任務,比如檢測貓、人和咖啡壺。隱私和自由是至關重要的,因此優先考慮使用開源軟件和設備上的語音環境,在這種環境中,您可以完全控制您的數據和視頻流。你的語音指令是你自己的,而且只是你自己的。
隨著物聯網和機器學習的發展,前沿的圖像處理系統提供了完整的過程自動化。這本實用的書教你建立這樣一個系統,給你完全的控制與最小的努力。
你會學到什么:
這本書是寫給誰的: 工程師和愛好者希望使用他們喜歡的JVM在Raspberry Pi上運行對象檢測和網絡
簡介: 深度學習無處不在。例如,當在線使用許多應用程序甚至在購物時,都會看到它。我們被深度學習所包圍,甚至根本沒有意識到這一點,這使學習深度學習變得至關重要,因為可以利用它做很多事情,這遠遠超出了您的想象。當您學習本書時,您可以在Mac,Linux或Windows系統上運行的許多示例代碼。您也可以使用Google Colab之類的工具在線運行代碼。 本書的第一部分為您提供了一些入門信息,除了安裝一些必備軟件,還會了解一些基本數學知識。
目錄:
說明
Chapter 1:深度學習介紹
Chapter 2:機器學習介紹
Chapter 3:使用python
chapter 4:利用深度學習看框架
chapter 5:回顧數學與優化
chapter 6:線性回歸基礎
chapter 7:神經網絡
Chapter 8:構建基礎神經網絡
Chapter 9:深度學習
Chapter 10:解釋卷積神經網絡
Chapter 11:循環神經網絡
Chapter 12:圖片分類
Chapter 13:循環神經網絡
Chapter 14:語言處理
Chapter 15:生成音樂和虛擬藝術
Chapter 16:生成對抗網絡
Chapter 17:深度強化學習
Chapter 18:深度學習的應用
Chapter 19:十個必備的深度學習工具
Chapter 20:十個使用深度學習的場景