這本實用指南作者Sev Leonard提供了一種在云中設計可擴展數據管道的整體方法,以解決低成本入門后可能演變成重要開銷的問題。對于開發數據管道的團隊,特別是在技術和工作負載快速變化的情況下,需要不斷進行重新設計,這是一個挑戰。本書將幫助中級數據工程師、軟件開發人員和架構師學習如何在成本和性能之間進行權衡,并選擇和配置計算和存儲。同時,您還將掌握代碼開發、測試和監控的最佳實踐。通過關注整個設計過程,您將能夠提供成本效益高、質量高的產品。本書可以幫助您:- 通過選擇成本較低的云服務和智能設計策略,減少云服務支出- 通過合理配置計算資源,最大程度地減少浪費而不損失性能- 通過有效的監控,推動管道的發展,防止性能問題并快速調試- 設置開發和測試環境,盡量減少對云服務的依賴- 創建可測試和可擴展的數據管道代碼庫,促進快速開發和演進- 通過驗證和測試提高數據質量和管道操作效率。通過本書,您將學習如何在云上交付可擴展且高度可用的產品,同時保持成本可控。這對于在不斷變化的技術和工作負載下開發數據管道的團隊非常有用。
隨著圖數據庫的快速崛起,各大組織現在開始實施先進的分析和機器學習解決方案,以幫助推動業務成果。本實用指南向數據科學家、數據工程師、架構師和業務分析師展示如何使用TigerGraph入門圖數據庫,這是目前可用的領先圖數據庫模型之一。 您將探索從連接數據中獲取價值的三個階段方法:連接、分析和學習。Victor Lee、Phuc Kien Nguyen 和 Alexander Thomas 提供了涵蓋多個現代業務需求的真實用例。通過深入TigerGraph Cloud的實踐練習,您將迅速熟練于為您的組織設計和管理先進的分析和機器學習解決方案。
使用圖思維來連接、分析并從數據中學習,以進行高級分析和機器學習 了解圖分析和機器學習如何提供關鍵的業務見解和成果 使用五個核心類別的圖算法來推動高級分析和機器學習 提供核心業務實體的實時360度視圖,包括客戶、產品、服務、供應商和公民 通過機器學習和先進的分析從連接數據中發現見解。
本書介紹了一個負責任的AI框架,并指導您在機器學習(ML)生命周期的每個階段,從問題定義到部署,應用相應的流程,以減少和緩解人工智能(AI)技術中存在的風險和危害。如果正確并負責任地實施,AI現在有能力解決許多問題。本書幫助您避免負面影響 —— 在某些情況下已經導致了生命損失 —— 并開發公平、透明、安全、穩健的模型。 本書的方法提高了您對可能導致AI技術產生負面結果的錯誤步驟的認識,并提供了一個負責任的AI框架,以在ML中實現負責任和道德的結果。它從對責任、原則和數據的基本元素的檢查開始。接下來是關于公平、透明、安全、隱私和穩健性等問題的實施指導。本書幫助您在構建AI和ML模型時負責任地思考,并指導您通過實踐步驟,旨在為您的最終用戶和客戶提供負責任的ML模型、數據集和產品。
您將學到什么:
這本書適合誰: 尋求關于構建公平、透明和道德模型的指導的AI和ML從業者;那些尋求認識可能導致AI算法中無意的偏見和傷害的錯誤步驟的人;計劃制定促進自動算法中公平和平等的法律、政策和法規的政策制定者。
各家公司都在爭先恐后地將人工智能整合到自己的系統和運營中。但是要構建真正成功的解決方案,您需要牢牢掌握基本的數學知識。這本通俗易懂的指南將帶領你了解在人工智能領域蓬勃發展所必需的數學,例如專注于現實世界的應用,而不是密集的學術理論。
工程師、數據科學家和學生都將通過計算機視覺、自然語言處理和自動化系統等流行應用,研究對人工智能至關重要的數學主題,包括回歸、神經網絡、優化、反向傳播、卷積、馬爾可夫鏈等。補充的Jupyter筆記本提供了Python代碼和可視化的示例。無論你是剛剛開始你的職業生涯,還是已經有多年的經驗,這本書都為你提供了深入研究該領域所必需的基礎。
了解驅動AI系統的底層數學,包括生成對抗網絡、隨機圖、大型隨機矩陣、數學邏輯、最優控制等 學習如何將數學方法應用于完全不同領域的不同應用
獲得數學流利性,以解釋和解釋人工智能系統是如何做出決定的 //www.oreilly.com/library/view/essential-math-for/9781098107628/
本書提供了分布式優化、博弈和學習的基本理論。它包括那些直接從事優化工作的人,以及許多其他問題,如時變拓撲、通信延遲、等式或不等式約束,以及隨機投影。本書適用于在動態經濟調度、需求響應管理和智能電網插電式混合動力汽車路由等領域使用分布式優化、博弈和學習理論的研究人員和工程師。
無線技術和計算能力的進步使得理論、模型和工具的發展成為必要,以應對網絡上大規模控制和優化問題帶來的新挑戰。經典的優化方法是在所有問題數據都可用于集中式服務器的前提下工作的。然而,這一前提不適用于由電力系統、傳感器網絡、智能建筑和智能制造等應用驅動的分布式環境中的大型網絡系統。在這樣的環境中,每個節點(agent)根據自己的數據(信息)以及通過底層通信網絡從相鄰的agent接收到的信息進行本地計算,從而分布式地解決大規模控制和優化問題。最終,集中式優化方法必然會走向衰落,從而產生一種新的分布式優化類型,它考慮了多個agent之間的有效協調,即所有agent共同協作,使一個局部目標函數之和的全局函數最小化。
本書研究了近年來分布式優化問題中的幾個標準熱點問題,如無約束優化、有約束優化、分布式博弈和分布式/分散學習等。為了強調分布式優化在這些主題中的作用,我們將重點放在一個簡單的原始(次)梯度方法上,但我們也提供了網絡中其他分布式優化方法的概述。介紹了分布式優化框架在電力系統控制中的應用。這本書自然主要包括三個部分。第一部分討論了分布式優化算法理論,共分為四章:(1)多智能體時滯網絡中的協同分布式優化;(2)時變拓撲多智能體系統的約束一致性;(3)不等式約束和隨機投影下的分布式優化;(4)隨機矩陣有向圖上的加速分布優化。第二部分作為過渡,研究了分布式優化算法理論及其在智能電網動態經濟調度問題中的應用,包括兩章:(5)時變有向圖約束優化的線性收斂性;(6)時變有向圖上經濟調度的隨機梯度推動。第三部分對分布式優化、博弈和學習算法理論進行了分析和綜合,本部分所有算法都是針對智能電網系統內的特定案例場景設計的。本部分共分三章:(7)智能微電網能源交易博弈中的強化學習;(8)不完全信息約束博弈的強化學習;(9)基于擁塞博弈的插電式混合動力汽車路徑選擇強化學習。其中,給出了仿真結果和實際應用實例,以說明前面提出的優化算法、博弈算法和學習算法的有效性和實用性。
關于大數據技術的信息很多,但將這些技術拼接到端到端企業數據平臺是一項艱巨的任務,沒有得到廣泛的討論。通過這本實用的書,您將學習如何在本地和云中構建大數據基礎設施,并成功地構建一個現代數據平臺。
本書非常適合企業架構師、IT經理、應用程序架構師和數據工程師,它向您展示了如何克服Hadoop項目期間出現的許多挑戰。在深入了解以下內容之前,您將在一個徹底的技術入門中探索Hadoop和大數據領域中可用的大量工具:
-平臺: 了解部署、操作、安全性、高可用性和災難恢復的各個方面,以及將平臺與企業IT的其他部分集成在一起所需了解的所有內容
數據科學庫、框架、模塊和工具包非常適合進行數據科學研究,但它們也是深入研究這一學科的好方法,不需要真正理解數據科學。在本書中,您將了解到許多最基本的數據科學工具和算法都是通過從頭實現來實現的。
如果你有數學天賦和一些編程技能,作者Joel Grus將幫助你熟悉作為數據科學核心的數學和統計,以及作為數據科學家的入門技能。如今,這些雜亂的、充斥著海量數據的數據,為一些甚至沒人想過要問的問題提供了答案。這本書為你提供了挖掘這些答案的訣竅。
參加Python速成班