Hadoop与大数据挖掘 (大数据技术丛书)(Word+PDF+ePub+PPT)
内容简介:
本书提供了大数据相关技术的简介、原理、实践、企业应用等,针对大数据相关技术,如Hadoop、HBase、Hive、Spark等,都有专业章节进行介绍,并且针对每一模块都有相应的动手实践,能有效加深读者对大数据相关技术原理、技术实践的理解。书中的挖掘实践篇涉及企业在大数据应用中的所有环节,如数据采集、数据预处理、数据挖掘等,通过案例对整个系统的架构进行了详细分析,对读者有一定实践指导作用。对于学习大数据相关技术的高校师生来说,本书不仅提供了大数据相关技术的基础讲解及原理、架构分析,还针对这些原理,配备有对应的动手实践章节,帮助读者加深对原理、架构的认识。同时,在每个模块结束后,书中会有一个相对独立的企业应用案例,帮助读者巩固学到的大数据技术相关知识。
目录:
前言
第一篇 基础篇
第1章 浅谈大数据
1.1 大数据概述
1.2 大数据平台
1.3 本章小结
第2章 大数据存储与运算利器—Hadoop
2.1 Hadoop概述
2.2 Hadoop配置及IDE配置
2.3 Hadoop集群命令
2.4 Hadoop编程开发
2.5 K-Means算法原理及Hadoop MapReduce实现
2.6 TF-IDF算法原理及Hadoop MapReduce实现
2.7 本章小结
第3章 大数据查询—Hive
3.1 Hive概述
3.2 HiveQL语句
3.3 动手实践:基于Hive的学生信息查询
3.4 基于Hive的航空公司客户价值数据预处理及分析
3.5 本章小结
第4章 大数据快速读写—HBase
4.1 HBase概述
4.2 配置HBase集群
4.3 HBase原理与架构组件
4.4 HBase Shell操作
4.5 Java API&MapReduce与HBase交互
4.6 基于HBase的冠字号查询系统
4.7 本章小结
第5章 大数据处理—Pig
5.1 Pig概述
5.2 配置运行Pig
5.3 常用Pig Latin操作
5.4 综合实践
5.5 本章小结
第6章 大数据快速运算与挖掘—Spark
6.1 Spark概述
6.2 Spark安装集群
6.3 Spark架构与核心原理
6.4 Spark编程技巧
6.5 如何学习Spark MLlib
6.6 动手实践:基于Spark ALS电影推荐系统
6.7 本章小结
第7章 大数据工作流—Oozie
7.1 Oozie简介
7.2 编译配置并运行Oozie
7.3 Oozie WorkFlow实践
7.4 Oozie Coordinator实践
7.5 本章小结
第二篇 挖掘实战篇
第8章 法律服务大数据智能推荐
8.1 背景
8.2 目标
8.3 系统架构及流程
8.4 分析过程及实现
8.5 构建法律服务大数据智能推荐系统
8.6 本章小结