用微信扫描二维码

湖仓架构:大规模数据平台的设计和实现

湖仓架构:大规模数据平台的设计和实现

作者:[印] 高拉夫·阿肖克·塔尔帕提

2025.7.1 出版

可语音朗读

开通电子书VIP
59.00得到贝

主编推荐语

破解数据仓库与数据湖痛点的实战指南。

内容简介

本书首先介绍数据架构及其在构建数据平台中的作用,剖析湖仓架构的概念、特征和优势。接着对比传统架构(数据湖与数据仓库)和现代数据平台,明确湖仓架构在未来数据平台的重要地位。然后讲解行存储与列存储等概念,以及云对象存储、文件格式和表格式等组件,还给出设计存储时的考量因素。 接着阐述数据目录、计算引擎在湖仓架构中的功能、类型选择和设计要点。在数据治理与安全方面,强调在湖仓架构中的统一治理和安全流程。之后提供了湖仓平台从前期准备到具体设计和实施的详细指南。最后探讨湖仓架构的未来发展趋势,如数据网格、混合事务与分析处理等。 通过学习本书,读者可系统掌握湖仓架构知识,为相关实践提供有力支持。

出版方

机械工业出版社