交叉表卡方检验两种数据录入格式:频数表与原始表

原创 数据小兵  2020-02-21 09:58  阅读 9,239 次
数据小兵成长记

交叉表卡方检验用于两个分类变量间的关系考察,具体分析时数据的录入有两种方式。第一种是汇总后的频数表,属于二手数据,第二种是原始数据记录构成的个案变量二维表,属于一手数据。

汇总的频数表

举例:对26例冠心病病人和28例对照者进行病例对照研究,探讨冠心病发生的有关危险因素。这54人是否吸烟的频数统计汇总如下,请考察冠心病与是否吸烟有无关系。

此类数据是汇总之后的频数统计,录入SPSS时,我们需要创建3个变量,是否吸烟可作为行变量,是否病例可作为列变量,最后一个变量是频数。数据文件只有4行。

在做交叉表卡方前,需独立完成加权操作,将频数加权给分组数据。

原始数据记录

举例:对26例冠心病病人和28例对照者进行病例对照研究,探讨冠心病发生的有关危险因素。收集到这54人吸烟与否的原始数据记录,具体如下,请考察冠心病与是否吸烟有无关系。

这数据文件的每一行就是一个独立的个案,共有54行。比如序号为25的个案,记录了这个人不吸烟,没有患冠心病,比如序号为30的个案,记录了这个人吸烟,并且患有冠心病。

原始数据记录中并没有频数。(频数实际上是在原始数据记录上汇总后的结果)。

我们只需要将吸烟与否作为行变量,是否冠心病作为列变量,不用加权处理,直接开始做交叉表卡方检验即可。软件会自动对其进行频数的汇总。

本例结果

对于同一案例的【频数表】格式,或者【原始记录】格式,这两种录入方式所得交叉表卡方检验结果是一致的。

结论:吸烟与否和冠心病并不是独立的,这次研究数据显示吸烟患病率为56.1%,高于不吸烟(23.1%),这种差异有统计学意义(χ²=4.311,P=0.038)。

全文完
文/图=数据小兵

好文推荐

本文地址:http://www.datasoldier.net/archives/1808
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
视频课程《SPSS统计分析:从入门到实践提高》
欢迎订阅SPSS训练营微信公众号

评论已关闭!