SPSS实践笔记:Kaplan-Meier生存分析

原创 数据小兵  2020-05-07 17:02  阅读 597 次
视频课程《SPSS统计分析:从入门到实践提高》

Kaplan-Meier生存分析统计方法,是一种可考察单个因素及分层控制混杂因素的的生存分析法,适用于大样本或者小样本(尤其是小样本常用)。

SPSS统计软件中,Kaplan-Meier生存分析的数据文件主要包含以下几个变量数据:

1.生存时间(连续数据)
2.生存状态(分类或连续数据)
3.影响因素(允许1个分类变量)
4.分层控制因素(允许1个分类变量)

如果考察分层控制因素的话,基本要求是分层的各组数据组间均衡。另外,KM分析中生存时间、生存状态这两个变量是必须要有的,可以不考虑分组变量(单个因素)与分层控制因素(分层变量)。

案例数据

给大家分享一个非常简单的案例,先看数据文件,部分数据如下:

就3个变量,生存时间(周数据)、生存状态(结局:0表示删失,1表示死亡)和单因素变量(是否化疗,1表示化疗,2表示未化疗)。数据的研究任务是考察是否化疗对患者生存时间的影响。

这是很典型的生存时间数据,随访的记录应该按照这样的格式来录入数据。

生存分析

【分析】→【生存分析】→【Kaplan-Meier】,打开主对话框:

SPSS并不知道哪些是因变量,哪些是因素变量,所以需要用户指定,具体来说就是把对应的变量拖拽到相应的边框框内。

注意要定义事件,明确的告诉软件工具,本数据研究的目标事件是谁。打开【定义事件】按钮,输入数字1,明确指定“死亡”是事件的结果。

现在打开【比较因子】对话框。

为什么要有这个对话框参数呢?大家想一下,前面我们是不是希望考察单个因素对生存的影响?这个因素是【是否化疗】,一个二分类变量,即它将所有随访者一分为二,划出了两个分组,我们就是想比较这两组病例生存状态的差异。

怎么比较?如何检验这种差异是不是存在?

SPSS软件给大家提供了三种检验方法,对数秩(Log rank)、Breslow、Tarone-Ware。三种?怎么选择?

这里先简单介绍一下(深层应用在视频课程中详述):

Log rank:
所有时点均赋予相同权重,该法对于生存分布的早期差别敏感。

Breslow:
用每个时点的历险数(暴露数)对时点加权,该法对于生存分布的后期差别敏感。

Tarone-Ware:
用每个时点的历险数平方根对时点加权,当生存曲线或危险函数曲线有交叉时可选择此项。

咱们不是专家对吧,咱们先给它全部选上,看看再说。

这个对话框的另外一批参数是关于两两比较的,什么意思呢?如果组间有差异,这是总体概括性的结论,那么我们好还想知道到底是哪些组间有差异,这个方差分析中的两两比较是一个概念。

本例就不需要两两比较了,为啥呢,因为只有两个组嘛。(三组及以上才需要的),好,这些参数不管了,跳过。

然后打开【选项】对话框,SPSS默认会计算并输出生存分析表、中位数生存时间、生存时间百分位数等统计量。

这个对话框中,必须要勾选上【生存分析函数】,它就是生存曲线图,最是让使用者关注的结果,反而没有默认选上,那就用户自己来选定。

还提供了另外3个图形,并不是很重要的结果,看自己的研究是否需要再选。

有以上的参数设置就足够了,执行,输出结果。

结果解读

(1)个案处理概要表:

各组生存情况总结,显示总例数、事件数及删失比例。

本例化疗组11例,发生失效事件(死亡)7例,删失4例;用未化疗组12例,发生失效事件(死亡)11例,删失1例。

两组数据中,删失率最高为36.4%,低于50%,可正常估计半数生存期。

(2)生存分析表:

给出生存时间、生存结局、积累生存比例、累积事件数和剩余个案数等信息。本案例有需要考察是否化疗的生存的影响,作为分组数据,将所有病例分为两组,分别输出各自的生存表格。

假设我想知道化疗组31周的生存率,它是多少呢?看上表。在化疗组找到31周这个时间点的这一行数据,估算的生存率为49.1%。

(3)生存表的平均值和中位值:

给出了各组生存时间均值和中位值,及其相应的标准误和95%CI。此表可观测各组生存时间的集中趋势和离散程度。

该表考虑了删失情况后校正值。此处要强调,由于生存时间数据不符合正态分布,所以平均值的相关估算结果并不是最重要的,主要以中位数(即中位生存时间)为准。

本案例中,化疗组生存时间的中位数31(周),未化疗组的生存时间中位数23(周),总体中位数(27周)。

(4)总体比较:

通过统计学检验给出了生存函数(指生存率)的组间比较。本案例中2种处理方法生存时间无统计学意义(三种检验的P值均大于0.05),表明化疗和不化疗组生存时间分布无统计学差异。

(5)生存曲线图:

大名鼎鼎的生存率曲线图。以生存时间为横轴,生存率为纵轴绘制而成的阶梯形曲线,用于说明生存时间与生存率之间的关系。

从图形上看:两条生存曲线没有交叉,两组病例在前50个周的累积生存率迅速下降,化疗组曲线在上方,说明化疗组患者的存活状况要比未化疗组好一些。

这种差异是抽样误差造成的还是不同的治疗方式造成的呢,刚才有三个统计检验方法的结果已经明确告知了我们,P>0.05,治疗方法间生存分布无统计学差异。

全文完
文/图=数据小兵

 

好文推荐阅读

 


课程网址:https://study.163.com/course/introduction/1003945001.htm?share=1&shareId=1149679450

本文地址:http://www.datasoldier.net/archives/2124
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
SPSS在线视频学习
欢迎订阅SPSS训练营微信公众号

评论已关闭!