作者:常冰琳(作者) 出版:电子工业出版社 图书简介 经过多年的发展,大数据处理技术逐步成熟。作为业界大数据计算的事实标准,Apache Spark系统已经广泛应用于各大企业与研究机构,并形成完整的生态系统。Spark系统包含了SQL、GraphX和R等各个子系统以支持不同业务领域的需求。作为传统关系数据库/数据仓库在大数据场景下的解决方案,Spark SQL已经成为了业界的重要选择方案,同时也成为了Spark开源社区中最为活跃的部分。本书聚焦于Spark SQL系统,对其整体架构、内部各个模块的技术实现机制进行源码级别的剖析,涉及到SQL编译、逻辑计划、物理执行计划、重要查询(如Aggregation与Join等)的技术细节。此外,本书内容上还会结合生产环境的海量应用,分享大量真实开发案例与实践优化经验。 作者段落 "朱锋 (作者), 张韶全 (作者), 等 (作者) & 0 更多" 图片名 41NCn0yk-fL 结束 标题 Kudu:构建高性能实时数据分析存储系统 纸质书价格 ¥56.85 电子书价格 ¥45.48 专题 文件大小 33512 KB 纸书页数 出版社 电子工业出版社; 第1版 (2019年4月1日) 服务:人工校对0错代录+录完后精校排版 此为收费服务:会收取文档代录之人工费 预估录入后页数:(带目录书签跳转) 请支持正版图书,莫将本服务所得用于非法目的 ✅文档录入及格式制作人工服务,非骗流量 ❤️ 录入后格式:PDF、Word、PPT、ePub、TXT

Kudu:构建高性能实时数据分析存储系统(ePub+AZW3+PDF+高清)电子书下载 常冰琳(作者)

要在Hadoop生态系统中实现快速的数据输入、服务和分析,一直以来只有几个可用但是不够完美的解决方案,要么以缓慢的数据输入为代价实现快速分析,要么以缓慢的分析为代价实现快速的数据输入。这个问题现在有了解决办法,使用Apache Kudu基于列的数据存储,你可以很容易地对快速输入的数据进行快速的分析。这就是本书的内容。 在这本书中,你将学习Kudu设计中的关键概念,以及如何用它构建快速、可扩展和可靠的应用程序。通过实际的示例,你将了解Kudu如何与其他Hadoop生态系统组件(如Apache Spark、SparkSQL和Impala)集成。