多分类自变量的logistic回归:哑变量结果的解读

原创 数据小兵  2021-09-01 10:36  阅读 233 次
数据小兵成长记

分类自变量在logistic回归中是常见的,从统计方面认为,分类的自变量应当考虑以哑变量的形式创建logistic回归模型。

因变量:是否违约(1=违约)
自变量:雇佣年级别(5个水平)

菜单【分析】→【回归】→【二元logistic回归】,是否违约作为因变量,受雇年级别作为协变量(协变量也是自变量)。然后点开【分类】对话框,

常用的哑变量方式,即指示符法,用0或1数据转换成哑变量。这里我们以最后一个水平作为参照水平,关于哑变量如何理解,看下文。

用SPSS创建虚拟变量/哑变量

来看执行后的结果:

关于因变量编码和分类自变量哑变量编码,这两个表格一定要看一下,这样你就知道谁作为参照,和谁作为比较的对象,这样才能把结果解释清楚。

上表即回归系数表格。关于logistic回归,我们建议着重解读OR值,即最后一列Exp(B),不建议线性回归的习惯去解读回归系数。

OR我们用优势比来理解,狭义上通俗上理解为几率或风险(不完全对),关于OR值的理解,大家看下面这篇文章。

logistic回归的OR值如何解读,我收藏的这篇文章分享给你

OR=1,该因素对阳性事件发生不起作用;
OR>1,该因素是危险/促进因素;
OR<1,该因素是保护/抑制因素;

这里确实是从利己角度出发的,就是为了结果解读更方便一些。

我来尝试解读一下:

与雇佣超过27年相比,受雇3年以内职员产生贷款违约的几率风险是参照水平的3.577倍;

与雇佣超过27年相比,受雇4~11年职员产生贷款违约的几率风险是参照水平的1.175倍;

言下之意是,(11年以内的)新入职的职工比老员工(12年以上)更容易产生不良贷款的违约记录。

与雇佣超过27年相比,受雇12~18年职员产生贷款违约的几率风险是参照水平的0.658倍;

与雇佣超过27年相比,受雇19~26年职员产生贷款违约的几率风险是参照水平的0.167倍;

OR值小于1,说明相对应的受雇年限级别是抑制了违约发生,受雇年越久,越不太可能发生违约问题。

以上解读如有问题,欢迎批评指正、交流讨论。

本文完
文/图=数据小兵

本文地址:http://www.datasoldier.net/archives/3241
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
视频课程《SPSS统计分析:从入门到实践提高》
欢迎订阅SPSS训练营微信公众号

评论已关闭!