為AI開發人員的集成學習從歷史概述開始,并解釋關鍵的集成技術和為什么需要它們。然后,您將學習如何使用bagging、bootstrap聚合、隨機森林模型和交叉驗證方法更改訓練數據。作者Kumar和Jain提供了最佳實踐來指導您結合模型和使用工具來提高機器學習項目的性能。它們會教你如何有效地實現集成概念,如堆疊和推進,以及如何利用流行庫,如Keras、Scikit Learn、TensorFlow、PyTorch和Microsoft LightGBM。在不同的數據科學問題,包括時間序列數據、成像數據和NLP中,提出了集成學習的一些技巧。討論了近年來在集成學習方面的研究進展。示例代碼以腳本和IPython筆記本的形式提供。
探索多年來用戶研究如何受到一系列學科的影響,如人機交互、可用性、人類學、認知心理學、人體工程學等。本書旨在為用戶研究社區做出貢獻,涵蓋的主題將幫助用戶體驗專業人士、學生和利益相關者更好地理解什么是用戶研究。
通過這本書,你將獲得一套實用的技能,范圍從如何進行研究,以建立一個案例,以獲得所需的預算和資源。它將為你提供一個如何組織你的研究,如何計劃它,以及如何在整個項目中管理利益相關者的期望的清晰的說明。您將看到如何將用戶研究融入到您的組織中,并在不同的產品開發階段(發現、Alpha、Beta直到上線)將其結合起來,以及如何發展一個用戶研究團隊。
《實用用戶研究》回顧了用于用戶研究的方法論,著眼于如何招募參與者,如何收集和分析數據,最后關注如何解釋和展示你的發現。跨文化研究、可及性和輔助數字研究也將在本書中討論。最后一章給你10個項目概要,你將能夠應用你的新技能集,并將你所學到的付諸實踐。
你將學習:
這本書是給誰的:
學習使用技術進行數據科學并在實踐中利用物聯網(IoT)。這本書介紹了現代數據科學的核心概念。您將從可以在BBC micro:bit上進行的簡單應用程序開始,然后使用其他硬件進行更復雜的實驗。
在教育領域,數據科學是最令人興奮和增長最快的主題之一。理解數據是如何工作的,以及如何使用數據,是21世紀的一項關鍵生活技能。在一個由信息驅動的世界里,學生們必須配備他們需要的工具來理解這一切。例如,考慮一下數據科學是如何成為識別氣候變化危險的關鍵因素,并繼續幫助我們識別和應對它帶來的威脅。這本書探討了數據的威力,以及如何使用手邊的硬件來應用數據。
您將學習數據科學的核心概念,如何在現實世界中應用它們,以及如何利用物聯網的巨大潛力。到最后,你將能夠執行復雜而有意義的數據科學實驗——為什么不成為一名公民科學家,為對抗氣候變化做出真正的貢獻呢?
你將學習
通過技術例子從業務角度發現深度學習的潛在應用、挑戰和機會。這些應用包括圖像識別、分割和注釋、視頻處理和注釋、語音識別、智能個人助理、自動翻譯和自動車輛。
面向開發者的深度學習業務應用介紹涵蓋了一些常見的DL算法,比如基于內容的推薦算法和自然語言處理。您將探索一些示例,例如使用全卷積神經網絡(FCNN)和剩余神經網絡(ResNets)進行視頻預測。您還將看到DL用于控制機器人的應用程序,使用蒙特卡羅樹搜索(用于在圍棋游戲中擊敗人類)探索DeepQ學習算法,以及為財務風險評估建模。這里還將提到一組被稱為生成對抗神經網絡(GANs)的強大算法,它可用于圖像著色、圖像補全和樣式轉換。
讀完這本書,你將對深度神經網絡這一令人興奮的領域有一個概述,并對深度學習的大部分主要應用有一個理解。這本書包含了一些代碼示例、技巧和如何使用Keras框架訓練深度學習模型的見解。
你將學到什么
這本書是給誰的
使用Microsoft Excel中流行的數據挖掘技術,更好地理解機器學習方法。
軟件工具和編程語言包接受數據輸入并直接交付數據挖掘結果,對工作機制沒有任何見解,并在輸入和輸出之間造成了鴻溝。這就是Excel可以提供幫助的地方。
Excel允許您以透明的方式處理數據。當您打開一個Excel文件時,數據立即可見,您可以直接使用它。在執行挖掘任務時,可以檢查中間結果,從而更深入地理解如何操作數據和獲得結果。這些是隱藏在軟件工具和編程語言包中的模型構建過程的關鍵方面。
這本書教你通過Excel進行數據挖掘。您將了解當數據集不是很大時Excel在數據挖掘方面的優勢。它可以為您提供數據挖掘的可視化表示,在結果中建立信心。您將手動完成每一個步驟,這不僅提供了一個主動學習體驗,而且還告訴您挖掘過程是如何工作的,以及如何發現數據內部隱藏的模式。
你將學到什么
這本書是給誰的
本書通過提供真實的案例研究和示例,為使用Python庫進行機器學習提供了堅實的基礎。它涵蓋了諸如機器學習基礎、Python入門、描述性分析和預測分析等主題。包括高級機器學習概念,如決策樹學習、隨機森林、增強、推薦系統和文本分析。這本書在理論理解和實際應用之間采取了一種平衡的方法。所有的主題都包括真實世界的例子,并提供如何探索、構建、評估和優化機器學習模型的逐步方法。
這本書提供 訪問Spark平臺的真實文檔和示例,以構建大型企業級機器學習應用程序。
在過去的十年里,機器學習取得了一系列驚人的進步。這些突破正在影響我們的日常生活,并對每個行業產生影響。下一代機器學習Spark提供了Spark和Spark MLlib的介紹,并在標準Spark MLlib庫之外,向更強大的第三方機器學習算法和庫邁進。在這本書的結尾,你將能夠通過許多實際的例子和有洞察力的解釋將你的知識應用到現實世界的用例中
這本書是給誰的
數據科學家和機器學習工程師,他們希望將自己的知識提升到一個新的水平,使用Spark和更強大的下一代算法和庫,而不是標準Spark MLlib庫中提供的;同時也是有抱負的數據科學家和工程師的入門書,他們需要機器學習的入門知識,Spark,SparkMLlib。
簡介: Google一直是引入突破性技術和產品的先驅。在效率和規模方面,TensorFlow也不例外,因此,編寫本書只是向讀者介紹TensorFlow核心團隊所做的這些重要更改。本書著重于機器學習方面的TensorFlow的不同應用,并更深入地探討了方法的最新變化。對于那些想要用TensorFlow進行機器學習的人來說,這本書是一個很好的參考點。本書分為三個部分。第一篇:使用TensorFlow 2.0進行數據處理。第二部分:使用TensorFlow 2.0構建機器學習和深度學習模型。它還包括使用TensorFlow 2.0的神經語言編程(NLP)。第三部分介紹了如何在環境中保存和部署TensorFlow 2.0模型。這本書對數據分析人員和數據工程師也很有用,因為它涵蓋了使用TensorFlow 2.0處理大數據的步驟。想要過渡到數據科學和機器學習領域的讀者也會發現,本書提供了實用的入門指南,以后可能會出現更復雜的方面。書中提供的案例研究和示例使您很容易理解和理解相關的基本概念。本書的優勢在于其簡單性以及將機器學習應用于有意義的數據集。
目錄:
時間序列分析一直是研究的熱點,在很多場景都有應用。近期,IntechOpen發布一本由Chun-Kit Ngan編輯眾多領域專家撰寫的新書《Time Series Analysis:Data, Methods, and Applications》,總共六章,110頁pdf,提供了時間序列分析的當前信息、發展和趨勢,特別是在時間序列數據模式、技術方法和實際應用方面,是值的關注的一本書。
本書旨在為讀者提供時間序列分析的當前信息、發展和趨勢,特別是在時間序列數據模式、技術方法和實際應用方面。本書分為三節,每節包括兩章。第一部分討論了多元時間序列和模糊時間序列的分析。第2節著重于開發用于時間序列預測和分類的深度神經網絡。第3節描述了如何使用時間序列技術解決實際領域的特定問題。本書包含的概念和技術涵蓋了時間序列研究的主題,學生、研究人員、實踐者和教授將對時間序列預測和分類、數據分析、機器學習、深度學習和人工智能感興趣。
目錄: