Kudu：构建高性能实时数据分析存储系统（Word+PDF+ePub+PPT）

作者：常冰琳(作者) 出版：电子工业出版社图书简介经过多年的发展，大数据处理技术逐步成熟。作为业界大数据计算的事实标准，Apache Spark系统已经广泛应用于各大企业与研究机构，并形成完整的生态系统。Spark系统包含了SQL、GraphX和R等各个子系统以支持不同业务领域的需求。作为传统关系数据库/数据仓库在大数据场景下的解决方案，Spark SQL已经成为了业界的重要选择方案，同时也成为了Spark开源社区中最为活跃的部分。本书聚焦于Spark SQL系统，对其整体架构、内部各个模块的技术实现机制进行源码级别的剖析，涉及到SQL编译、逻辑计划、物理执行计划、重要查询(如Aggregation与Join等)的技术细节。此外，本书内容上还会结合生产环境的海量应用，分享大量真实开发案例与实践优化经验。作者段落 "朱锋 (作者), 张韶全 (作者), 等 (作者) & 0 更多" 图片名 41NCn0yk-fL 结束标题 Kudu：构建高性能实时数据分析存储系统纸质书价格￥56.85 电子书价格￥45.48 专题文件大小 33512 KB 纸书页数出版社电子工业出版社; 第1版 (2019年4月1日) 服务：人工校对0错代录+录完后精校排版 此为收费服务：会收取文档代录之人工费预估录入后页数：（带目录书签跳转）请支持正版图书，莫将本服务所得用于非法目的 ✅文档录入及格式制作人工服务，非骗流量 ❤️ 录入后格式：PDF、Word、PPT、ePub、TXT

Kudu：构建高性能实时数据分析存储系统（ePub+AZW3+PDF+高清）电子书下载常冰琳(作者)

要在Hadoop生态系统中实现快速的数据输入、服务和分析，一直以来只有几个可用但是不够完美的解决方案，要么以缓慢的数据输入为代价实现快速分析，要么以缓慢的分析为代价实现快速的数据输入。这个问题现在有了解决办法，使用Apache Kudu基于列的数据存储，你可以很容易地对快速输入的数据进行快速的分析。这就是本书的内容。在这本书中，你将学习Kudu设计中的关键概念，以及如何用它构建快速、可扩展和可靠的应用程序。通过实际的示例，你将了解Kudu如何与其他Hadoop生态系统组件（如Apache Spark、SparkSQL和Impala）集成。