SPSS答疑解惑15:如何判断Logistic回归中哪个自变量更重要?

原创 数据小兵  2018-12-07 08:52  阅读 83 次
视频课程《SPSS统计分析:从入门到案例实践》

在线性回归中,SPSS软件直接给出了各自变量的回归系数以及对应的标准化回归系数,可根据后者比较各自变量对因变量的重要性,十分方便。

但是我们发现在logistic回归中,SPSS软件只给出了回归系数而没有提供标准化后的回归系数,那么此时应该如何判断自变量的重要性呢?

事实上不止SPSS,还有其他一些统计软件在logistic回归的结果输出中也没有给出标准化回归系数。

软件没有给,那我们自己计算不就行了吗?道理讲得通,合情合理,人家不给提供了,难道我们就不能计算吗?所以你会看到有部分文章讲解如何根据特定的公式来求解出标准化回归系数。

我是半路出家学的统计,缺乏统计底子,我不太清楚自己计算的是不是准确。在logistic回归中,自变量可能是分类型的可能是连续数值型的,分类型的变量在logistic回归建模时通常还要虚拟化处理,直接把分类变量和连续变量统统扔进固定公式去计算标准化系数,我总觉得很奇怪。

所以,我放弃计算。

还有没有其他办法来比较自变量的重要性了呢?说说我通常的做法。

如上图,这是某案例数据二项logistic回归模型方程中的变量。

logistic回归中有一个非常重要的概念,叫做OR,通俗理解为解释变量的危险程度。我在比较各自变量(解释变量)重要性时,首选使用OR值的大小对自变量进行排序,OR值越大说明对应的自变量越是重要。

比如上面的例子。Exp(B)即OR值,用Exp(B)对3个自变量进行排序,很显然它们对目标变量的影响重要性依次为“动物脂肪摄入”> "高血脂史" > "A型性格" 。

这个办法简单有效,我认为最好是加个前提,logistic回归模型对数据变异的拟合足够优秀,模型能通过统计检验,样本量的数量足够多能支持这个结论的稳定性。

此外,也可以考虑使用自变量wald检验的显著性p值来对自变量重要性进行排序,经验上它的结果和OR排序是一致的。

欢迎读者朋友拍砖讨论,如您有更好的更有科学说服力的方法,不妨留言或投稿给我。

(全文完)

本文地址:http://www.datasoldier.net/archives/781
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
欢迎订阅SPSS训练营微信公众号
SPSS上机训练作业

评论已关闭!