SPSS做logistic回归分析时如何进行多重共线性检验?

原创 数据小兵  2020-06-23 10:03  阅读 213 次
视频课程《SPSS统计分析:从入门到实践提高》

我们很容易发现一个问题,就是SPSS在做logistic回归时并没有直接提供多重共线性的诊断参数选项,这令人很苦恼,难道说logistic回归就不用考虑自变量共线性问题了?这肯定不对。

那么在具体SPSS统计分析实践中,如何在logistic回归中考虑多重共线性问题呢?

利用线性回归菜单

答案是,我们可以借助线性回归菜单中的【共线性诊断】参数选项来完成。

具体来说,原logistic回归的二分变量作为因变量,因素因子变量作为自变量,进行线性回归,然后命令软件执行【共线性诊断】即可。

菜单操作

【分析】→【回归】→【线性】。

结果中将出现以下多重共线性的诊断依据:

1.容忍度Tol
2.方差膨胀因子VIF

3.条件指数
4.方差比例

最好用和易于理解的是前两个,一般地,如果容忍度(Tol)小于0.1或方差膨胀因子(VIF)大于10,则表示有共线性存在。

具体来说:

容忍度(Tolerance)

Norusis于1982年提到,TOL=1-R2i,Ri为以自变量Xi为因变量,其他变量为自变量得到的线性回归模型的决定系数,容忍度较小,提示可能存在共线性,小于0.1说明多重共线性很严重。

方差膨胀因子(Variance inflation factor,VIF)

由Marquardt于1906年引入的,容忍度的倒数,当自变量间存在共线关系时,用最小二乘法所估计的回归系数的方差比自变量间无共线关系时所估计的回归系数的方差的增大倍数, VIF值愈大,说明变量间的多重共线性程度愈强。同自变量的相关系数指标一样,利用来诊断多重共线性的问题,其临界值不易确定。有学者建议当VIF≥5或VIF≥10时,可认为自变量间存在严重共线性但不同的具体情况的临界值将有所不同。

在本例中,我们看到所有自变量的VIF指标均小于10,可初步认为共线性问题可忽略。

本文完
文/图=数据小兵

小兵推荐文章给你

常见logistic回归模型有哪几种?
logistic回归样本量多少合适?
SPSS分析案例logistic回归建模
SPSS分析案例多项logistic回归分析
SPSS做有序多分类logistic回归分析
如何选择有序logistic回归连接函数?
输入、向前、向后与条件、LR、Wald如何选择
深入解读logistic回归系数与OR值结果
如何判断Logistic回归中哪个自变量更重要?
本文地址:http://www.datasoldier.net/archives/2225
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
SPSS在线视频学习
欢迎订阅SPSS训练营微信公众号

评论已关闭!