用shapiro.test()与ggqqplot()做正态分布检验

原创 数据小兵  2020-12-11 09:34  阅读 2,398 次
数据小兵成长记

案例数据

雇员数据employee,公众号后台回复【雇员】下载数据,尝试对当前薪金数据做正态分布检验。

图形法辅助观察正态分布

利用ggpubr包ggqqplot()绘制QQ图,辅助观察一组数据的正态性。

ggqqplot(employee,x = "salary")

解读:多数点偏离直线,所以认为当前薪金数据为非正态分布数据。

统计检验正态性

利用shapiro.test()函数对小样本数据(3~5000)做正态分布检验。原假设数据服从正态分布,当伴随概率P值大于0.05时,认为数据服从正态分布。

shapiro.test(employee$salary)

Shapiro-Wilk normality test

data:  employee$salary
W = 0.77061, p-value < 2.2e-16

解读:当前薪金数不服从正态分布(W=0.771,P<0.001)

本文完
文/图=数据小兵

 

更多R统计文章
 
R语言单一样本t检验案例实现
R语言的正态密度曲线很美
R自带pairs函数矩阵散点图
car包spm函数矩阵散点图
用R语言pie函数做饼图
ggplot2统计图形:常见的4种箱线图
ggplot2统计图形:常见的4种直方图
按列索引按列名称删除指定的列数据
R语言Levene方差齐次检验
table函数:分类数据的频数与频率统计
jiebaR包中文分词及词云制作
R语言带文字标签的散点图
如何获取R自带数据集与R包数据集说明文档?
如何修改R数据框的列名称?
二元正态分布及双变量相关分析简单案例演示
R语言相关系数、显著性检验及可视化的尝试
ggplot2统计图形:常见的4种散点图
R语言scale()函数实现数据标准化
用R语言做单因素方差分析及多重比较
用R语言自动智能化创建时间序列ARIMA模型
用R对连续数据做描述统计
R语言主成分分析
本文地址:http://www.datasoldier.net/archives/2653
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
视频课程《SPSS统计分析:从入门到实践提高》
欢迎订阅SPSS训练营微信公众号

评论已关闭!