SPSS案例练习:混合线性模型

原创 数据小兵  2021-11-08 08:45  阅读 350 次
数据小兵成长记

现有来自65所初级学校共4059名学生的数据,我想考察不同学校类型对16岁成绩有无影响。学校类型包括混和、男校、女校3种。

我可能立马会想到单因素方差分析,看看3种不同类型学校学生的成绩有无统计学差异。执行一个one way ANOVA,结果如下:

结果显示,不同类型学校学生的16岁成绩差异有统计学意义(P<0.001)。3种类型两两比较也是两两之间成绩差异显著(均P<0.05,结果略)。

可能的指导意义是,按性别上男或女校呢还是直接上混合学校是值得家长们认真考虑的一件事情。

如果是按一般线性模型考虑,这个分析到此已经结束了。

但注意,我们默认假设65所学校的教学水平是一致的。或者说我们忽略了不同学校教学水平的差异,再上升到另外一个统计学问题,则是我们忽略了学生成绩的变异在65所学校上的聚集性。

也许同样入学成绩的两个学生,一个前往好学校另一个去了差学校,那么他们16岁成绩好学校的更高一些,为什么?现实生活中这种事情太多了。

因此,65所高校学生成绩的聚集性问题是应当被考虑进去的。但是一般线性模型做不到。

要用什么模型呢?混合线性模型可以尝试。

菜单:【分析】→【混合模型】→【线性】,打开预定义对话框,

首先明确告诉软件,这项研究的独立的被试/主体是谁呢,是学校。

然后会自动进入混合线性模型的主对话框,这里和线性回归参数设置是类似的。我们告诉软件“16岁成绩”是因变量,重点考察一下“学校类型”对成绩的影响。

点开【固定】按钮对话框,移入“学校类型”作为固定因子,打开【随机】,勾选【包括截距】,这个参数很重要,是检验聚集性的命令。另外需要将主体学校移入到组合框内。其他参数默认。

接下来点开【统计】按钮对话框,

勾选固定和随机效应参数的估计选项。做显著性检验同时估计他们的效应值(系数)。

本例是入门学习,暂时不去管其他参数,统一按SPSS软件默认设定。执行。

学校类型的固定效应检验,其显著性P=0.106>0.05,说明该固定效应变量对16岁成绩的影响没有统计学意义。

注意,有意思的事情出现了。这个结果和前面one way ANOVA结论是相反的!前面单因素方差分析说不同类型学校的学生16岁成绩差异有统计学意义,学校的类型对成绩有一些影响。而现在混合线性模型告诉我们学校类型固定效应是无统计学意义的。

我们到底应该相信谁?

再看其他结果。看随机效应检验的结果:协方差参数估算表格。

学校主体的截距项检验结果显示,效应估算为0.164,P<0.001,有统计学意义。说明16岁成绩的变异在学校水平上的确存在聚集性。可以理解为,不同学校间的教学水平的确有差别。

65所学校间,他们16岁学生成绩的变异存在聚集性。这种聚集性特征在一般线性模型里是无法分解或考察的。

由于变异的聚集性有统计学意义,那么一般单因素方差分析就不是最合适的统计方法。所以我们选择信任混合线性模型的结果。

结论是,65岁学校学生成绩的变异存在聚集性,不同的学校类型对成绩的固定效应无统计学意义(P>0.05)。

(以上分析和结论仅用于案例学习,请勿外推或其他条件的假设,如果您有不同意见欢迎文末评论去指正和讨论)。

本文完
文/图=数据小兵

参考资料:
张文彤, 董伟. SPSS统计分析高级教程[M]. 高等教育出版社, 2013.

 

数据小兵坚持写博客已经13年

坚持写微信公号文章7年
坚持更新SPSS视频课程3年
坚持一对一答疑讨论3年
绝对超值:一对一答疑

欢迎加入SPSS视频课程
竭诚服务

 

《SPSS统计分析:快速入门与实践提高》

视频地址:

https://study.163.com/course/introduction/1003945001.htm?share=1&shareId=1149679450

本文地址:http://www.datasoldier.net/archives/3379
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
视频课程《SPSS统计分析:从入门到实践提高》
欢迎订阅SPSS训练营微信公众号

评论已关闭!