用微信扫描二维码

企业大数据处理:Spark、Druid、Flume与Kafka应用实践

企业大数据处理:Spark、Druid、Flume与Kafka应用实践

作者:肖冠宇

2017.9.1 出版

可语音朗读

开通电子书VIP
36.42得到贝

主编推荐语

为企业大数据技术选型和大数据平台构建提供成熟的解决方案,包含大量实用案例。

内容简介

本书分为三大部分,共九章。第壹部分(第1章)主要介绍了企业大数据系统的前期准备工作,包括如何构建企业大数据处理系统的软件环境和集群环境。第二部分(第2~7章)首先介绍了Spark的基本原理,Spark2.0版本的SparkSQL、StructuredStreaming原理和使用方法,以及Spark的多种优化方式;然后,介绍了Druid的基本原理、集群的搭建过程、数据摄入过程,以及在查询过程中如何实现Druid查询API;接着介绍了日志收集系统Flume的基本架构和关键组件,以及分层日志收集架构的设计与实践;后介绍了分布式消息队列Kafka的基本架构和集群搭建过程,以及使用Java语言实现客户端API的详细过程。第三部分(第8~9章)主要介绍了企业大数据处理的两个实际应用案例,分别是基于Druid构建多维数据分析平台和基于JMX指标的监控系统。

出版方

机械工业出版社有限公司