R语言与数据挖掘 (大数据技术丛书)(Word+PDF+ePub+PPT)
内容简介:
R是一种适用于统计分析计算和图像处理的语言,受S语言和Scheme语言影响发展而来。早期R是基于S语言的一个GNU项目,所以也可以当作S语言的一种实现,通常用S语言编写的代码都可以不做任何修改地在R环境下运行。R的语法来自Scheme,作为一款诞生于20世纪90年代的语言,R已经成为S统计编程语言的一类实现方式。本书从实际应用出发,结合实例及应用场景,深入浅出地介绍了R语言应用的相关知识:R语言的安装及使用、数据对象与数据读写、常用数据管理、图形探索、高级绘图工具及常用的建模算法在R语言中的实现方式。书中以R语言的函数应用为主,先介绍了函数的应用场景及使用格式,再给出函数的应用实例,最后对函数的运行结果做出了解释,将掌握函数应用的所需知识点按照实际使用的流程展示出来。
目录:
前言
第一部分 基础篇
第1章 R语言的安装与使用
1.1 R安装与升级
1.2 R使用入门
1.3 R数据分析包
1.4 配套资源使用说明
1.5 小结
1.6 上机实验
第2章 数据对象与数据读写
2.1 数据类型
2.2 数据结构
2.3 数据文件的读写
2.4 小结
2.5 上机实验
第3章 R语言常用数据管理
3.1 变量的重命名
3.2 缺失值分析
3.3 数据排序
3.4 随机抽样
3.5 数值运算函数
3.6 字符串处理
3.7 文本分词
3.8 apply函数族
3.9 数据整合
3.10 控制流
3.11 函数的编写
3.12 小结
3.13 上机实验
第4章 图形探索
4.1 图形元素
4.2 图形组合
4.3 图形保存
4.4 图形函数
4.5 小结
4.6 上机实验
第5章 高级绘图工具
5.1 lattice包绘图工具
5.2 ggplot2包绘图工具
5.3 交互式绘图工具简介
5.4 小结
5.5 上机实验
第二部分 建模应用篇
第6章 分类与预测
6.1 回归分析
6.2 决策树
6.3 人工神经网络
6.4 KNN算法
6.5 朴素贝叶斯分类
6.6 其他分类与预测算法函数
6.7 分类与预测算法评价
6.8 小结
6.9 上机实验
第7章 聚类分析
7.1 K-Means聚类分析函数
7.2 层次聚类算法
7.3 其他聚类分析函数
7.4 小结
7.5 上机实验
第8章 关联规则
8.1 Apriori关联规则
8.2 小结
8.3 上机实验
第9章 智能推荐
9.1 智能推荐模型构建
9.2 智能推荐模型评价
9.3 小结
9.4 上机实验
第10章 时间序列
10.1 ARIMA模型
10.2 其他时间序列模型
10.3 小结
10.4 上机实验
第三部分 Rattle篇
第11章 可视化数据挖掘工具Rattle
11.1 Rattle简介及其安装
11.2 功能预览
11.3 数据导入
11.4 数据探索
11.5 数据建模
11.6 模型评估
11.7 小结
11.8 上机实验
参考资料