当前位置:网站首页>图书 > 正文 >>

R语言

图书信息

作者程显毅,朱倩,刘鹏,张燕,刘颖
出版社清华大学出版社
ISBN9787302494324
出版时间2019-01-01
字数10.7万
分类刘鹏,张燕,刘颖,清华大学出版社,科技,计算机,网络,程序设计

读书简介

近年来,R语言可谓是数据分析的热门语言,相关的资料五花八门,让读者难以抉择。本书力求用简洁、精练,以理论与实践相结合的方式让大家快速掌握R语言。 全书共14章,第1章为绪论,从数学、统计学和逻辑学3个方面探讨了树立正确数据思维的一些原则;其余各章分为基础篇(第2~10章)、应用篇(第11、12章)和阶篇(第13、14章)。

目录

内容简介

总主编简介

本书主编简介

总 序

前 言

第1章 绪 论

1.1 为什么学习R语言

1.2 正确的数据思维观

习题

基础篇

第2章 R语言入门

2.1 新手上路

2.2 R语言开发环境部署

2.3 获取帮助

2.4 工作空间

2.5 脚本

2.6 R包

习题

第3章 数据类型

3.1 变量与常量

3.2 结构类型

3.3 字符串操作

3.4 用于数据处理和转换的常用函数

习题

第4章 数据准备

4.1 数据导入

4.2 数据导出

习题

第5章 数据可视化

5.1 低水平绘图命令

5.2 高水平绘图命令

5.3 交互式绘图命令

习题

第6章 数据探索

6.1 缺失值分析

6.2 异常值分析

6.3 不一致值分析

6.4 数据的统计特征分析

习题

第7章 数据变换

7.1 数据清洗

7.2 数据选择

7.3 数据集成

习题

第8章 高级编程

8.1 控制结构

8.2 用户自定义函数

习题

第9章 数据建模

9.1 Rattle包

9.2 聚类模型

9.3 关联分析模型

9.4 传统决策树模型

9.5 随机森林决策树模型

9.6 自适应选择决策树模型

9.7 SVM

9.8 线性回归模型

9.9 神经网络模型

习题

第10章 模型评估

10.1 数据集

10.2 混淆矩阵

10.3 风险图

10.4 ROC曲线

习题

应用篇

第11章 影响大学平均录取分数线因素分析

11.1 背景与目标

11.2 数据说明

11.3 描述性分析

11.4 总结与建议

第12章 收视率分析

12.1 背景介绍

12.2 数据说明

12.3 描述性分析

12.4 总结与建议

进阶篇

第13章 RHadoop

13.1 认识RHadoop

13.2 RHadoop安装

13.3 综合练习

习题

第14章 SparkR

14.1 认识SparkR

14.2 SparkDataFrame

14.3 SparkR支持的机器学习算法

14.4 综合练习

习题

参考文献

附录 大数据和人工智能实验环境