R语言
图书信息
| 作者 | 程显毅,朱倩,刘鹏,张燕,刘颖 |
| 出版社 | 清华大学出版社 |
| ISBN | 9787302494324 |
| 出版时间 | 2019-01-01 |
| 字数 | 10.7万 |
| 分类 | 刘鹏,张燕,刘颖,清华大学出版社,科技,计算机,网络,程序设计 |
读书简介
近年来,R语言可谓是数据分析的热门语言,相关的资料五花八门,让读者难以抉择。本书力求用简洁、精练,以理论与实践相结合的方式让大家快速掌握R语言。 全书共14章,第1章为绪论,从数学、统计学和逻辑学3个方面探讨了树立正确数据思维的一些原则;其余各章分为基础篇(第2~10章)、应用篇(第11、12章)和阶篇(第13、14章)。
目录
内容简介
总主编简介
本书主编简介
总 序
前 言
第1章 绪 论
1.1 为什么学习R语言
1.2 正确的数据思维观
习题
基础篇
第2章 R语言入门
2.1 新手上路
2.2 R语言开发环境部署
2.3 获取帮助
2.4 工作空间
2.5 脚本
2.6 R包
习题
第3章 数据类型
3.1 变量与常量
3.2 结构类型
3.3 字符串操作
3.4 用于数据处理和转换的常用函数
习题
第4章 数据准备
4.1 数据导入
4.2 数据导出
习题
第5章 数据可视化
5.1 低水平绘图命令
5.2 高水平绘图命令
5.3 交互式绘图命令
习题
第6章 数据探索
6.1 缺失值分析
6.2 异常值分析
6.3 不一致值分析
6.4 数据的统计特征分析
习题
第7章 数据变换
7.1 数据清洗
7.2 数据选择
7.3 数据集成
习题
第8章 高级编程
8.1 控制结构
8.2 用户自定义函数
习题
第9章 数据建模
9.1 Rattle包
9.2 聚类模型
9.3 关联分析模型
9.4 传统决策树模型
9.5 随机森林决策树模型
9.6 自适应选择决策树模型
9.7 SVM
9.8 线性回归模型
9.9 神经网络模型
习题
第10章 模型评估
10.1 数据集
10.2 混淆矩阵
10.3 风险图
10.4 ROC曲线
习题
应用篇
第11章 影响大学平均录取分数线因素分析
11.1 背景与目标
11.2 数据说明
11.3 描述性分析
11.4 总结与建议
第12章 收视率分析
12.1 背景介绍
12.2 数据说明
12.3 描述性分析
12.4 总结与建议
进阶篇
第13章 RHadoop
13.1 认识RHadoop
13.2 RHadoop安装
13.3 综合练习
习题
第14章 SparkR
14.1 认识SparkR
14.2 SparkDataFrame
14.3 SparkR支持的机器学习算法
14.4 综合练习
习题
参考文献
附录 大数据和人工智能实验环境
- 纸上王国(邓安庆)
- 中国企业家成长30年:企业家精神引领企业迈向高质量发展(李兰)
- 足够遥远(张尺)
- 有趣的语文:一个语文教师的“另类”行走(凌宗伟)
- 第11集 趋势定位:如何从消费市场往创业市场和资本市场转型(此商品为视频课程)(周导)
- 第7集 制度的起点是小人思维(俞凌雄)
- 文治帝国:大宋300年的世运与人物【畅销书《一看就停不下来的中国史》作者重磅新书!】(艾公子)
- 区块链编程((美)吉米·宋(Jimmy Song))
