我们很容易发现一个问题,就是JASP在做logistic回归时并没有直接提供多重共线性的诊断参数选项,这令人很苦恼,难道说logistic回归就不用考虑自变量共线性问题了?这肯定不对。
与JASP同类的另外一款免费新统计软件jamovi则直接提供了输出共线性诊断指标。
那么在具体JASP统计分析实践中,如何在logistic回归中考虑多重共线性问题呢?
利用线性回归菜单
答案是,我们可以借助线性回归菜单中的【共线性诊断】参数选项来完成。
具体来说,原logistic回归的二分变量作为因变量,因素因子变量作为自变量,进行线性回归,然后命令软件执行【共线性诊断】即可。
菜单操作
【Regression】→【Linear Regression】→【Statistics】。
结果中将出现以下多重共线性的诊断依据:
1.容忍度Tol
2.方差膨胀因子VIF
3.条件指数
4.方差比例
最好用和易于理解的是前两个,一般地,如果容忍度(Tol)小于0.1或方差膨胀因子(VIF)大于10,则表示有共线性存在。
具体来说:
容忍度(Tol)
Norusis于1982年提到,TOL=1-R2i,Ri为以自变量Xi为因变量,其他变量为自变量得到的线性回归模型的决定系数,容忍度较小,提示可能存在共线性,小于0.1说明多重共线性很严重。
方差膨胀因子(VIF)
由Marquardt于1906年引入的,容忍度的倒数,当自变量间存在共线关系时,用最小二乘法所估计的回归系数的方差比自变量间无共线关系时所估计的回归系数的方差的增大倍数, VIF值愈大,说明变量间的多重共线性程度愈强。同自变量的相关系数指标一样,利用来诊断多重共线性的问题,其临界值不易确定。有学者建议当VIF≥5或VIF≥10时,可认为自变量间存在严重共线性但不同的具体情况的临界值将有所不同。
在本例中,我们看到所有自变量的VIF指标均小于10,可初步认为共线性问题可忽略。
本文完
文/图=数据小兵
号内已发文章推荐
JASP连续数据之相关分析
JASP可视化建模:简单一元线性回归
欢迎订阅本公众号,持续关注和学习JASP。
《比SPSS更好用的JASP-统计分析教程》
心理、社科、医学高校学生、研究生,专业从业者,以及经常使用SPSS统计软件的人。
▌探索与使用免费开放好用的全新统计软件:JASP。课程作者:数据小兵,数据/统计分析工具领域博主。课程暂不涉及贝叶斯统计方法。