列联系数用作Pearson卡方检验的效应量

原创 数据小兵  2021-08-27 11:25  阅读 212 次
数据小兵成长记

Pearson卡方检验有一个缺点,对样本量比较敏感,样本量越大越容易导致P值显著,样本量巨大时容易获得显著的结论。

但是两个分类变量间的关联性可能并不一定很强,因此大样本时建议在报告pearson卡方结果同时报告列联系数(表示为r或c)。

官方文档对关联系数的解释:

列联系数。基于卡方统计的相关性测量。值的范围在 0 到 1 之间,其中 0 表示行变量和列变量之间不相关,而接近 1 的值表示变量之间的相关度很高。可能的极大值取决于表中的行数和列数。

一句话,列联系数反映两个分类变量关联的强度。

来看一个案例,

△来源:百度文库

这是一个频数资料,把数据录入到SPSS后,先做加权,然后执行交叉表卡方检验。

SPSS实现交叉表卡方检验的案例文章:
SPSS案例实践:2*2四格表皮尔逊卡方检验

这里咱们直接来看结果:

大家来看这个结果,总样本量N=82,不算是大样本,所有交叉的单元格理论频数均大于5,适用于皮尔逊卡方统计检验。

不同喂养方式的婴儿腹泻差异显著,有统计学意义。或,婴儿腹泻与喂养方式之间存在关联性 (χ² =9.981,P=0.002<0.01)。

我们建议继续报告列联系数r,即喂养方式与腹泻这两个分类变量间的相关性系数。上图中的第二个表格即列联系数的结果。

列联系数r=0.329,P<0.01,说明喂养方式与婴儿腹泻之间存在一定的弱相关性。

综合皮尔逊卡方与列联系数两个结果来报告结论:

不同喂养方式的婴儿腹泻差异显著,有统计学意义 (χ² =9.981,P=0.002<0.01)。婴儿腹泻与喂养方式之间存在关联性,但二者的关联程度一般(列联系数r=0.329,P<0.01)。

(以上内容与结果结论仅用于统计方法学习,不涉及医学专业知识论证)

本文完
文/图=数据小兵

本文地址:http://www.datasoldier.net/archives/3220
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
视频课程《SPSS统计分析:从入门到实践提高》
欢迎订阅SPSS训练营微信公众号

评论已关闭!