黄片一级在线视频播放,日韩一区二区视频,国产精品无码久久一线

Kafka是什么?它是如何運作的?在這本全面的電子書，你將得到Apache Kafka?的全面介紹，分發，出版-訂閱隊列處理實時數據feed。了解Kafka是如何工作的，內部架構，它的用途，以及如何充分利用Kafka流處理技術。

作者Neha Narkhede、Gwen Shapira和Todd Palino向您展示了如何部署生產Kafka集群;保護、調優和監視它們;使用Kafka編寫魯棒的應用程序;并構建流處理應用程序，以幫助您利用實時數據的強大功能。

了解Apache Kafka如何與其他發布/訂閱消息隊列進行比較
Kafka如何融入大數據生態系統
深入內部架構和設計(Kafka生產者、消費者、主題、代理、日志等等)
學習開發使用Kafka的應用程序的最佳實踐
了解在生產監控、調優和維護任務中部署Kafka的最佳方式
學習如何保護Kafka集群
學習最重要的指標
Kafka的原因嗎?獲得詳細的好處和流處理用例
構建實時數據管道:注意事項和使用Kafka連接
帶示例和用例的Kafka流指南

付費5元查看完整內容

相關內容

Kafka是一種高吞吐量的分布式發布訂閱消息系統，它可以處理消費者規模的網站中的所有動作流數據。這種動作（網頁瀏覽，搜索和其他用戶的行動）是在現代網絡上的許多社會功能的一個關鍵因素。這些數據通常是由于吞吐量的要求而通過處理日志和日志聚合來解決。對于像Hadoop的一樣的日志數據和離線分析系統，但又要求實時處理的限制，這是一個可行的解決方案。Kafka的目的是通過Hadoop的并行加載機制來統一線上和離線的消息處理，也是為了通過集群來提供實時的消費。

數據工程師 · Microsoft Azure · 流媒體 ·

2020 年 10 月 31 日

[付費5元查看完整內容]【2020新書】數據工程師的指南：Azure存儲、流媒體和批處理分析，450頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

微軟Azure云是數據密集型應用程序的理想平臺。Azure是為提高生產力而設計的，它提供了預構建的服務，使收集、存儲和分析的實現和管理更加容易。Azure存儲、流和批處理分析通過逐步構建一個完整的工作分析系統，教你如何在Azure中設計一個可靠的、高性能的和經濟的數據基礎設施。

付費5元查看完整內容

Kubernetes ·

2020 年 9 月 19 日

[付費5元查看完整內容]【2020新書】使用Kubernetes開發高級平臺，519頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

利用Kubernetes快速采用新興技術。Kubernetes是企業平臺開發的未來，它已經成為當今最流行的、通常被認為是最健壯的容器編配系統。這本書集中在平臺技術的力量的物聯網，區塊鏈，機器學習，和許多層的數據和應用管理支持他們。

付費5元查看完整內容

C / C++ ·

2020 年 7 月 24 日

[付費5元查看完整內容]【2020新書】現代C++初學者指南，301頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

這本書以一種結構化的、直觀的、友好的方式學習c++編程語言。這本書教授現代c++編程語言、c++標準庫和現代c++標準的基礎知識。不需要以前的編程經驗。

c++是一種不同于其他語言的語言，它的復雜性令人驚訝，但在許多方面都非常優美和優雅。它也是一種不能通過猜測來學習的語言，是一種很容易出錯的語言。為了克服這一點，每個部分都充滿了現實世界中逐漸增加復雜性的例子。面向絕對初學者的現代c++教的不僅僅是用c++ 20編程。它提供了一個可在其上進行構建的堅實的c++基礎。

作者帶您了解c++編程語言、標準庫和c++ 11到c++ 20標準基礎知識。每一章都附有適量的理論和大量的源代碼示例。

您將使用c++ 20個特性和標準，同時還將比較和查看以前的c++版本。您將使用大量相關的源代碼示例來實現此目的。

你將學到什么

使用c++的基礎:類型、操作符、變量、常量、表達式、引用、函數、類、I/O、智能指針、多態性等等
在Windows上設置Visual Studio環境，在Linux上設置GCC環境，這樣就可以編寫自己的代碼
聲明和定義函數、類和對象，并將代碼組織到名稱空間中
發現面向對象編程:類和對象，封裝，繼承，多態性，以及更多使用最先進的c++特性
在組織源代碼和控制程序工作流方面采用最佳實踐
熟悉c++語言的dos和donts等等
掌握基本的lambdas、繼承、多態性、智能指針、模板、模塊、契約、概念等等

這本書是給誰的

希望學習c++編程的初學者或程序員新手。不需要有編程經驗。

付費5元查看完整內容

R語言 ·

2020 年 7 月 1 日

[付費5元查看完整內容]【2020新書】實戰R語言4，323頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

首先加速介紹R生態系統、編程語言和工具，包括R腳本和RStudio。通過使用許多例子和項目，這本書教你如何將數據導入R，以及如何使用R處理這些數據。一旦基礎扎實，《實用R 4》的其余部分將深入具體的項目和例子，從使用R和LimeSurvey運行和分析調查開始。接下來，您將使用R和MouselabWeb執行高級統計分析。然后，您將看到在沒有統計信息的情況下R如何工作，包括如何使用R自動化數據格式化、操作、報告和自定義函數。

本書的最后一部分討論了在服務器上使用R;您將使用R構建一個腳本，該腳本可以運行RStudio服務器并監視報表源的更改，以便在發生更改時向用戶發出警報。這個項目包括定期電子郵件提醒和推送通知。最后，您將使用R創建一個定制的個人最重要信息的每日綱要報告，例如天氣報告、每日日歷、待辦事項等等。這演示了如何自動化這樣一個過程，以便用戶每天早上導航到相同的web頁面并獲得更新的報告。

你將學到什么

設置并運行R腳本，包括在新機器上的安裝以及下載和配置R
使用RStudio Server將任何機器變成可從任何地方訪問的強大數據分析平臺
編寫基本的腳本并修改現有的腳本以滿足自己的需要。
在R中創建基本的HTML報告，根據需要插入信息
構建一個基本的R包并發布它

這本書是給誰的

建議您之前接觸過統計學、編程和SAS，但不是必需的。

付費5元查看完整內容

流數據處理 ·

2020 年 4 月 24 日

[付費5元查看完整內容]【實用書】流數據處理，Streaming Data，219頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

流式數據介紹了流式和實時數據系統的概念和要求。這本書是一個思想豐富的教程，教你如何有效地與快速流動的數據交互。

對這項技術

作為人類，我們不斷地過濾和解密流向我們的信息。以同樣的方式，流數據應用程序可以完成一些驚人的任務，比如讀取實時位置數據以推薦附近的服務，實時跟蹤機器故障，以及在客戶離開商店之前發送數字收據。流數據技術和技術的最新進展使任何開發人員都有可能構建這些應用程序，如果他們有正確的心態。這本書會讓你加入他們。

關于這本書

流式數據是一個思想豐富的教程，教你如何有效地與快速流動的數據交互。通過相關的示例和演示用例，您將探索讀取、分析、共享和存儲流數據的應用程序的設計。在此過程中，您將發現關鍵技術的角色，如Spark、Storm、Kafka、Flink、RabbitMQ等。這本書在宏觀思維和實現細節之間提供了完美的平衡。

里面有什么

收集實時數據的正確方法構建流管道分析數據何時使用何種技術

//www.manning.com/books/streaming-data

付費5元查看完整內容

ElasticSearch ·

2020 年 4 月 15 日

[付費5元查看完整內容]【干貨書】Elasticsearch入門學習權威指南，719頁pdf教您構建分布式實時搜索和分析引擎

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

無論您需要全文搜索還是結構化數據的實時分析，還是兩者都需要，Elasticsearch分布式搜索引擎都是使您的數據發揮作用的理想方法。本實用指南不僅向您展示了如何使用Elasticsearch搜索、分析和探索數據，還幫助您處理人類語言、地理位置和關系的復雜性。

如果您是搜索和分布式系統的新手，您將很快學會如何將Elasticsearch集成到您的應用程序中。更有經驗的用戶將獲得許多高級技術。在整本書中，您將遵循基于問題的方法來學習為什么、何時以及如何使用Elasticsearch特性。

理解Elasticsearch如何解釋文檔中的數據
索引和查詢您的數據，以利用搜索概念，如相關性和單詞接近度
通過有效地使用分析程序和查詢來處理人類語言
通過匯總和分析數據來顯示總體趨勢
使用地理點和地理形狀-彈性搜索的方法進行地理定位
對數據建模，以利用Elasticsearch的水平可伸縮性
了解如何在生產環境中配置和監視集群

付費5元查看完整內容

Kafka · 大數據 ·

2020 年 3 月 9 日

[付費5元查看完整內容]【2020新書】Kafka實戰：Kafka in Action，209頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

Kafka in Action是構建基于Kafka的數據管道的實用指南。充滿了真實的用例和場景，這本書探討了Kafka最常見的用例，從簡單的日志記錄到管理用于消息路由、分析等的流數據系統。

在處理大數據、流數據或快速數據的系統中，確保數據管道正確是非常重要的。Apache Kafka是一個非常快的分布式流平臺，它不僅僅作為一個持久的日志或靈活的消息隊列來運行。

付費5元查看完整內容

Python · 大數據處理 ·

2020 年 2 月 1 日

[付費5元查看完整內容]【2020新書】Python大數據處理，Mastering Large Datasets with Python，311頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

//www.manning.com/books/mastering-large-datasets-with-python

現代數據科學解決方案需要簡潔、易于閱讀和可伸縮。在《用Python掌握大型數據集》一書中，作者J.T. Wolohan向您介紹了如何使用Python編碼的功能影響方法來處理小型項目并對其進行擴展。您將探索有助于清晰性和可伸縮性的方法和內置Python工具，比如高性能并行方法，以及支持高數據吞吐量的分布式技術。本實用教程中豐富的實踐練習將為任何大型數據科學項目鎖定這些基本技能。

對這項技術

當應用于大量文件或分布式數據集時，在筆記本大小的數據上運行良好的編程技術可能會變慢，甚至完全失敗。通過掌握強大的map和reduce范型，以及支持它的基于python的工具，您可以編寫以數據為中心的應用程序，這些應用程序可以有效地擴展，而不需要在需求發生變化時重寫代碼庫。

關于這本書

使用Python掌握大型數據集教會您編寫可以處理任何大小的數據集的代碼。您將從筆記本大小的數據集開始，這些數據集通過將大任務分解為可以同時運行的小任務來教會您并行化數據分析。然后將這些程序擴展到云服務器集群上的工業級數據集。有了map和reduce范型，您將探索像Hadoop和PySpark這樣的工具來有效地處理大量的分布式數據集，使用機器學習加速決策制定，并使用AWS S3簡化數據存儲。

里面有什么