SPSS做线性回归是否要对原始数据进行标准化处理?

原创 数据小兵  2019-01-29 08:49  阅读 5,531 次
视频课程《SPSS统计分析:从入门到实践提高》

我们用SPSS做多元线性回归时,有多个自变量X,它们单位不同,大小有异,所以就会有人问在回归前是否要对原始数据进行标准化处理?

答案是:不需要

我们简单看一个例子。比如下方这个多元线性回归方程式,

其他条件不变时,自变量X3每增加一个单位,Y的预测值随之增加10.3个单位,这是对回归系数的解释。要注意的是,这个线性回归是在原始变量基础上进行拟合所得的结果,这个式子是含带物理单位的,自变量X和因变量Y在变化中都是携带实际意义的。

在这种情况下,我们很轻松的带入自变量X的具体取值,即可得到相应的Y值,预测效果直截了当,这是采取原始数据进行线性拟合的好处。

如果我们对原始数据采取了标准化处理,情况就不同了。

标准化处理后自变量、因变量的物理单位没有了,我们拿此时的线性回归方程做预测时就会十分麻烦,要对新的自变量取值进行标准化,得到的Y还是一个标准化后的数据,一眼看不到它的实际大小和物理意义。

除了要解决预测的问题,线性回归还要输出自变量X的重要性排序,现在有三个对Y有显著影响的自变量X,那么我们想知道X1、X2和X3谁更重要。

此时我们需要对比标准化后的回归系数,如何得到呢?对原始数据进行标准化处理并进行线性拟合,用SPSS做线性回归时,这一步也是没有必要的。

因为SPSS线性回归输出的结果中,已经自动帮我们进行相应的计算,大家看SPSS线性回归的结果,(实际上其他统计软件也是同样的道理,也会相应的给出标准化回归系数,便于比较自变量X的重要性。)

看到【标准化系数】一栏的结果了吗,我们读取【未标准化系数】写出线性回归方程式,而读取【标准化系数】比较自变量的重要性。

统计软件已经做出了精密的考虑和相应的结果,我们自然也就没必要自己再去做一个标准化处理。

(全文完)

「数据小兵」博客推出的《SPSS统计分析:从入门到案例实践》在线视频课程,目前已经有300+读者加入学习了,2019年课程将会在内在品质上下功夫打磨,更多案例,更多讨论,正在学习和使用SPSS的读者朋友,欢迎加入。

课程地址:网易云课堂
https://study.163.com/course/introduction/1003945001.htm

本文地址:http://www.datasoldier.net/archives/929
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
SPSS在线视频学习
欢迎订阅SPSS训练营微信公众号

评论已关闭!