2018年用R语言做好五件事
当前位置:以往代写 > R语言教程 >2018年用R语言做好五件事
2019-06-13

2018年用R语言做好五件事

2018年用R语言做好五件事

> – 1 R语言开源,免费,跨平台。
– 2 R语言可以做[**数据科学工作流**](http://shujuren.org/article/490.html "数据科学工作流")各个环节的任务。
– 3 R语言深受数据科学工作者的喜欢。

学习R语言,需要**学以致用,活学活用**。

> 博学之,审问之,慎思之,明辨之,笃行之。(《礼记》)

![](http://img.shujuren.org/pictures/D8/5a521fea0962f.jpg)

2018年,玩数据和用数据的朋友可以考虑用**R语言**做好这五件事。

### 事一:数据可视化
> – 1 清楚每种图形所适合的应用场景
– 2 熟悉R语言ggplot2包的使用
– 3 思考利用可视化做探索性分析和数据结果表示

#### 思维训练

1 折线图,条形图,散点图分别有什么作用?
2 ggplot2包画图的原理是什么?如何利用ggplot2设计和生成可以出版的高质量图片?

### 事二:数据处理

> – 1 掌握数据集的导入和导出
– 2 熟悉数据的选择,变量的衍生,数据的聚合和连接
– 3 掌握数据格式的转换
– 4 熟悉readr包,dplyr包和tidy包的使用

#### 思维训练
1 如何读取json格式数据和数据库的表数据?
2 如何把宽数据转换为长数据?

### 事三:统计分析
> – 1 R语言是统计编程语言,适合做统计分析
– 2 R语言对统计学知识有着全面的实现和解读
– 3 熟悉描述性统计和推断性统计

#### 思维训练
1 描述性统计和推断性统计的异同?
2 常用的统计模型有哪些?可以解决什么问题?

### 事四:机器学习
> – 1 掌握经典的机器学习算法
– 2 掌握从**小数据**中学习,实现数据到商业价值的转换
– 3 熟悉一系列机器学习包的使用,例如:caret,e1071,gbm,randomForest,glmnet,xgboost等。

#### 思维训练
1 机器学习算法如何选择?参数如何调整?
2 如何提高机器学习算法的精度?
3 如何做特征工程?

### 事五:数据自动化报告
> – 1 掌握数据自动报告的生成和传播
– 2 掌握R语言做自动化报告的流程

#### 思维训练
1 数据自动化报告的好处是什么?

您在阅读中有什么见解,请留言。
想加入**数据人网R语言**,请加微信:luqin360。

————

    关键字:

在线提交作业