练习R:单个连续数据的探索性统计可视化函数EDA

原创 数据小兵  2021-01-18 14:20  阅读 286 次
数据小兵成长记

 

针对连续型数值变量的描述统计,除了给出集中、离散指标外,我们还可以选择统计图形可视化进行展示。

今天要练习的是,方匡南老师《R数据分析》一书中提供的自定义探索性数据分析函数EDA,用EDA直接给出单个连续变量数据的四张统计图形,可视化效果较好,能快速观察该组数据的基本状况。

EDA配合描述统计指标,效果会更佳。

案例数据:雇员数据

分析任务:考察当前工资salary的分布情况。

自定义EDA函数:

EDA <- function (x)

{ par(mfrow=c(2,2)) # 同时做4个图

hist(x) # 直方图

dotchart(x) # 点图

boxplot(x,horizontal=T) # 箱式图

qqnorm(x);qqline(x) # 正态概率图

par(mfrow=c(1,1)) # 恢复单图

}

使用EDA:

EDA(employee$salary)

结果展示:

直方图:右侧有长尾,当前工资数据有一定程度的右偏态现象;

散点图:大多数人处于低中工资水平,有一小部分人工资较高;

箱线图:右偏状态,伴有可疑异常值;

Q-Q图:提示偏态。

本文完
文/图=数据小兵

 

参考资料:

方匡南, 朱建平, 姜叶飞. R数据分析[M]. 电子工业出版社, 2015.

本文地址:http://www.datasoldier.net/archives/2781
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
视频课程《SPSS统计分析:从入门到实践提高》
欢迎订阅SPSS训练营微信公众号

评论已关闭!