logistic回归如何判断连续自变量与logit(P)存在线性关系?

原创 数据小兵  2020-10-14 10:23  阅读 8,964 次
数据小兵成长记

二项logistic回归有一条基本假设/使用条件:连续型自变量与因变量的logit(P)转换值之间存在线性关系

如何对此条件做判断和检验呢?小兵一直向大家推荐的医咖会给出了一个可操作的解决方案,今天小兵就给大家分享一下具体如何实现。

01
案例数据

收集到某公司各个商户id,以及他们的注册时长、营业收入、成本数据,以及合作续约的情况,现在我们想尝试基于这样的数据创建商户续约预测模型。

我们来看一下,因变量是是否续约(0或1),可能的因素包括注册时长、营业收入、成本数据,这三个因素均是连续型自变量。

现在尝试检验三个连续型自变量与logit(P)之间是否存在线性关系

02
判断方法

医咖会给出的解决方案是采用Box-Tidwell方法做出判断,即将连续自变量与其自然对数值的交互项纳入回归方程,然后具体看交互项是否显著。

如果交互作用有统计学意义(P<0.05,还应进行Bonferroni法校正),则说明对应的连续自变量与因变量logit转换值间没有线性关系(即不符合假设条件)。

03
SPSS具体过程示范

接下来的具体操作呢,小兵是借鉴医咖会的案例步骤,在文末有提供医咖会原文链接。

3.1) 计算连续自变量的自然对数值

以营业收入自变量为例,计算收入数据的自然对数值ln收入。

点菜单【转换】→【计算变量】,新的目标变量命名为ln收入,表达式中从函数区域引入自然对数LN()函数,然后将营业收入移入LN()函数的参数,这些是SPSS【计算变量】的基础操作。

新的ln收入变量出现在数据视图,我这里把三个自变量均转换为ln形式。如上。

3.2) 执行Box-Tidwell

打开二项logistic回归菜单,因变量为是否续约,自变量框先移入原始数据即注册时长、营业收入、成本。回归方法这里要注意一下,必须使用Enter/输入法,不要使用逐步回归方式。

接下来是重头戏。以注册时长自变量为例,用鼠标按ctrl键同时选中注册时长和ln时长,点【>a*b>】交互项按钮,以交互作用的形式考察注册时长*ln时长对因变量的影响。按此操作完成三个交互项的准备工作。

其他参数均按照SPSS默认设置,直接执行logistic回归。

3.3) 结果解读

输出的结果很多,我们的目标仅是观察和判断连续自变量与logit(P)有无线性关系,此时只看一个结果。就是回归系数表,看交互项的wald检验是否显著。

通俗地讲,我们可以直接只看【显著性】这一列结果。如果交互作用有统计学意义(P<0.05),则说明对应的连续自变量与因变量logit转换值间没有线性关系(即不符合假设条件)。尽管解释回归结果时通常不进行多重校正,但在检验线性假设时建议对纳入分析的所有项(包括截距项)进行Bonferroni法校正。(引自医咖会)。

当前模型,我们一共引入的项目包括三个原始自变量,截距项,还有三个交互项,共7项因素。所以进行Bonferroni法校正时,我们用显著性a=0.05除以模型总项数7,即显著性的临界值是0.05/7=0.00714。

本例中,我们来看结果。只有注册时长*ln时长交互其瓦尔德检验的显著性P值大于0.00714(P=0.443),说明营业时长这个自变量与logit(P)之间存在线性关系。

而营业收入*ln收入交互项,成本*ln成本交互项显著性P值均小于0.00714,则说明对应的连续自变量与因变量logit转换值间没有线性关系(即不符合假设条件)。

问题又来了,当连续自变量不满足logit(P)线性关系条件时,又该怎么办呢?医咖会文中指出可以考虑将连续型数据转换为离散的分组分类变量进行建模。

本文完
文/图=数据小兵

参考资料:医咖会
二分类logistic回归,更新几个常见问题的解决方法
https://mp.weixin.qq.com/s/b1Y1vNorNJHQWlmd05w1Ww

案例来源:
狄松等著《谁说菜鸟不会数据分析SPSS篇》

 

◢ 为你推荐以下文章 ◣

logistic回归几个常见问题
logistic回归的OR值如何解读
logistic回归分析8个知识点整理
二项logistic回归分析案例实践
logistic回归如何进行多重共线性检验?

 

数据小兵坚持写博客已经13年
坚持写微信公号文章7年
坚持更新SPSS视频课程3年
坚持一对一答疑讨论3年
绝对超值:一对一答疑

欢迎加入SPSS视频课程
竭诚服务

《SPSS统计分析:快速入门与实践提高》

视频地址:

https://study.163.com/course/introduction/1003945001.htm?share=1&shareId=1149679450

 

本文地址:http://www.datasoldier.net/archives/2510
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
视频课程《SPSS统计分析:从入门到实践提高》
欢迎订阅SPSS训练营微信公众号

评论已关闭!