用SPSS做logistic回归分析,如何判断logit(p)与自变量间存在线性关系?

原创 数据小兵  2019-04-16 09:29  阅读 1,439 次
视频课程《SPSS统计分析:从入门到实践提高》

二项logistic回归分析的适用条件里头,有一条规定自变量与logit(p)间应是线性关系,但是我们在学习SPSS进行logistic回归分析时,却很难对此作出检验和判断。

办法总是有的。今天我分享一下娜娜melisa博主的一篇文章,通过制作散点图来解决这个问题。


以下为娜娜melisa博主的原文:

最近在看冯老师出书《医学研究中的logistic回归分析及SAS实现》,对其中的说法“可先利用散点图大致了解自变量与logit(p)”的关系,据此判断从哪一点分类、分几类、是否需要转化为虚拟变量”百思不得其解,怎么做这个散点图呢?经思考最后我终于得出答案。。。

以P14的例2.1并结合P16页散点图中的孕次与logit(p)的关系为例:

1、将yc孕次与Y巨大儿数据做个透视如下:

2、再将上表转换为概率表,如y=1|yc=1的概率p1为19/50=0.38,y=0|yc=1的概率p2=1-p1=0.62,其它以此类推。

3、求yc孕次各logit(p),如yc=1次的时候,logit(p)=ln(p1/1-p1)=ln(0.38/0.62)=-0.49,做散点图如下:

4、可以看出孕次2次与3次的logit(p)值非常接近,可以考虑将2次和3次合并为一组。

原文标题:医学研究中的logistic回归分析及SAS实现补充

原文地址:http://blog.sina.com.cn/s/blog_4b9acb5201015m6r.html


注意啊,原文表达的是关于分类变量与logit(p)的关系,主旨是在说关于分类变量如何做到最佳分箱,至于连续自变量如何去判断是另外一回事了,我看了许多实践经验,大家也是更喜欢先把连续变量离散化,做分箱处理,那么问题就来了,分箱处理有没有标准呢?比如年龄,如何取划分年龄段才是最好的呢?娜娜melisa博主写的这篇文章就是一个可参考的办法。

本文地址:http://www.datasoldier.net/archives/1066
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
SPSS在线视频学习
欢迎订阅SPSS训练营微信公众号

评论已关闭!