SPSS实践笔记:将非正态分布数据转换为正态分布

原创 数据小兵  2020-03-19 20:13  阅读 482 次
视频课程《SPSS统计分析:从入门到实践提高》

遇到非正态分布数据怎么办?一种建议是选用合适的非参数检验方法,另一种是对原始进行转换使得其满足正态分布特性。今天小兵用SPSS示范一个数据转换的案例。

来看案例

现在有一批汽车的价格数据,通过SPSS的探索性描述统计方法来考察它的分布情况。

主要结果如下:

Shapiro-Wilk正态分布检验,其P值小于0.05,说明该组数据不是正态分布。

函数转换

接下来我们得考虑一下如何去转换它?采取什么函数转换更合适?

咱们说得通俗易懂一些,我们可以先从sqrt函数开始,然后是自然对数ln函数,再下来是10为底的对数函数lg10函数,总结一句,sqrt函数呢针对轻度的偏态,ln函数针对中度偏态,lg10函数针对较为严重的偏态情况。

本组数据偏度系数0.829,不算偏的严重。我想sqrt或者ln函数就可以搞定了。不能一上来就lg10函数。

在SPSS计算新变量菜单下,我们输入sqrt(价格)、ln(价格),依次输出sqrt转换与ln转换两个新变量。

重新使用探索描述统计输出Shapiro-Wilk正态分布检验的结果,如下:

哇哦,大家看到了吗,该检验的P值从原来的0.000一路提升至0.232,大于0.05,价格数据经ln函数转换后已经满足正态分布了。

我们对比一下原始数据和ln转换数据的正态PP图,如下:

LN转换后之后,更多的点落在或者靠近直线,从图形检验的角度,认为LN转换后的数据服从正态分布。

以上案例展示将非正态数据转换为正态分布数据。

全文完
文/图=数据小兵

好文推荐阅读

本文地址:http://www.datasoldier.net/archives/1906
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
SPSS在线视频学习
欢迎订阅SPSS训练营微信公众号

评论已关闭!