SPSS案例实践:控制变量与分层线性回归

原创 数据小兵  2021-05-09 18:02  阅读 2,680 次
数据小兵成长记

有读者觉得分层回归很神秘,哪怕是做过多元线性回归,也不知道分层回归是做什么,怎么做。

小兵练习一个小案例,写出来供参考。

01

案例背景介绍

咱们《问卷数据分析》课程一直在用的案例数据,SPSS训练营公众号满意度调查问卷。(以下是我编的故事)本来我是要研究有用性、易用性、趣味性对总体满意度的影响,但是我阅读论文发现,再加上我做显著性检验提示,不同年龄、不同职业读者对公号的满意度有统计学差异。

所以,我想控制年龄、职业,来考察一下有用性、易用性、趣味性对总体满意度的影响。

02

分层线性回归

打开SPSS线性回归对话框,因变量是总体满意度,第一层就安排控制变量,包括年龄和职业,是分类的,咱们便于理解,统一不转哑变量。

按【下一个】按钮,第二层自变量咱们一次把三个重点关注自变量有用性、易用性、趣味性一把扔进去。

在统计学上,控制变量也是自变量。控制变量仅是从研究层面出发的一种对自变量的称呼。

自变量按照不同层来安排,层在这里不好理解,字面的感觉是第一层是第一层,第二层是第二层,但其实不然。

实际回归过程只有一个桶,人为把桶划分为几个层,比如本例就是划分为两层,先把年龄+职业放最底下一层,马上做一次回归,得到第一层的回归模型1,然后接着(叠加)继续往这个桶里面装自变量有用性,易用性、趣味性,这是第二层,但此时整个桶里面已经有2+3=5个自变量了,再做第二层回归得到模型2。

模型1到模型2的变化是,在(年龄+职业)基础上多了(有用+易用+有趣)。

有一个关键之处提示一下:分层回归时,自变量进入模型的方式应该为enter法,不能是其他方式,软件默认就是enter法。

03

输出R方变化量

打开【统计】对话框,务必勾选上【R方变化量】,这是关键输出的结果,也是体现做分层回归之意义所在的结果。

R方就是自变量对因变量变异的解释比例,所谓“变化量”就是代尔塔Δ,第二层与第一层的自变量们,他们对Y的影响之R方改变的情况。

其他回归的参数选项,就按软件默认或按照普通线性回归来安排即可。

04

结果的解读

前后两个模型的偏回归系数及显著性检验结果。

前后两个模型R方及R方变化量,还有变化量的显著性检验。

这结果怎么看?

首先模型1和模型2都是有统计学意义的(F1=3.757,F2=60.123,P1=0.025,P2<0.001)。(表格略)

然后就看这个R方变化吧。(年龄+职业)为自变量时,R方=0.029,虽然与没有自变量的模型相比有统计学意义(P=0.025),但R方不怎么高,模型1解释能力偏低。

(年龄+职业+有用+易用+有趣)为自变量时,R方=0.549,0.549之于0.029,增加了多少呢?Δ=0.52,增加了五成的解释能力,是谁带来的呢,是(有用+易用+有趣)的共同作用。这种增加量有没有统计学意义呢?答案是有意义(F=94.878,P<0.001)。

说明啥?说明我们重点关注的(有用+易用+有趣)真的是找对方向了,对其的关注是明智的,他们对Y的影响很不少。

05

结果的展示

分层回归的结果,不要直接搬用SPSS默认输出的几个表格,分散且不好安排排版。我们需要将几个表格编辑整理为一个表格。常见的形式如下:

欢迎大家拿这个表格,对照上面的文字解读,再次取理解分层回归。

动手做个小案例,帮助快速了解统计方法。你也要动起手来。

总结一句:分层回归,自变量是一层一层叠加上去的,为的就是看每增加一个或多个自变量后模型的改变有没有统计学意义,本质上是专门研究后来居上的新增自变量的重要性。

本文完
文/图=数据小兵

《SPSS统计分析:快速入门与实践提高》

视频地址:

https://study.163.com/course/introduction/1003945001.htm?share=1&shareId=1149679450

本文地址:http://www.datasoldier.net/archives/2980
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
视频课程《SPSS统计分析:从入门到实践提高》
欢迎订阅SPSS训练营微信公众号

评论已关闭!