作者:刘军(作者) 出版:图灵社区 图书简介 本书是使用Spark进行大规模数据分析的实战宝典,由大数据公司Cloudera的数据科学家撰写。四位作者首先结合数据科学和大数据分析的广阔背景讲解了Spark,然后介绍了用Spark和Scala进行数据处理的基础知识,接着讨论了如何将Spark用于机器学习,同时介绍了常见应用中几个常用的算法。此外还收集了一些更加新颖的应用,比如通过文本隐含语义关系来查询Wikipedia或分析基因数据。 作者段落 "里扎(Sandy Ryza)莱瑟森(Uri Laserson) 欧文(Sean Owen)威尔斯(Josh Wills) (作者), 龚少成 (译者)" 图片名 51y5cS5VVkL 结束 标题 Hadoop大数据处理 纸质书价格 ¥53.12 电子书价格 ¥35.99 专题 文件大小 25202 KB 纸书页数 289 出版社 人民邮电出版社; 第1版 (2013年9月1日) 服务:人工校对0错代录+录完后精校排版 此为收费服务:会收取文档代录之人工费 预估录入后页数:289(带目录书签跳转) 请支持正版图书,莫将本服务所得用于非法目的 ✅文档录入及格式制作人工服务,非骗流量 ❤️ 录入后格式:PDF、Word、PPT、ePub、TXT

Hadoop大数据处理(ePub+AZW3+PDF+高清)电子书下载 刘军(作者)

《Hadoop大数据处理》以大数据处理系统的三大关键要素——“存储”、“计算”与“容错”为起点,深入浅出地介绍了如何使用Hadoop这一高性能分布式技术完成大数据处理任务。本书不仅包含了使用Hadoop进行大数据处理的实践性知识和示例,还以图文并茂的形式系统性地揭示了Hadoop技术族中关键组件的运行原理和优化手段,为读者进一步提升Hadoop使用技巧和运行效率提供了颇具价值的参考。

  《Hadoop大数据处理》共10章,涉及的主题包括大数据处理概论、基于Hadoop的大数据处理框架、MapReduce计算模式、使用HDFS存储大数据、HBase大数据库、大数据的分析处理、Hadoop环境下的数据整合、Hadoop集群的管理与维护、基于MapReduce的数据挖掘实践及面向未来的大数据处理技术。最后附有一个在Windows环境下搭建Hadoop开发及调试环境的参考手册。

  《Hadoop大数据处理》适合需要使用Hadoop处理大数据的程序员、架构师和产品经理作为技术参考和培训资料,也可作为高校研究生和本科生教材。