SPSS学习笔记12:如何选用Pearson、Spearman、Kendall三大相关系数

原创 数据小兵  2018-11-26 12:35  阅读 166 次
视频课程《SPSS统计分析:从入门到案例实践》

说到相关分析,很多人会马上拿出皮尔逊Pearson相关系数,从不论数据是不是符合适用条件,甚至完全不了解Pearson相关系数还有假设条件这回事。

常见的相关系数有三种,它们分别是Pearson、Spearman、Kendall系数,世人兼知pearson系数,冷淡了另外两个。

非常重要的一个知识点是:Pearson系数不是万能的,不满足适用条件时我们需要使用另外两个。

三大相关系数如何选用呢,小兵给大家作个小结。

一、变量类型

考察两个变量的相关关系,首先得看清楚两个变量都是什么类型的。统计分析中常见的变量类型有连续型数值变量,无序分类变量、有序分类变量。

连续型数值变量:如销售额、气温、工资收入、考试成绩;

无序分类变量:如性别男和女,血型种类;

有序分类变量:如学历水平小学、初中、高中、大学、研究生;

二、两个连续数值变量相关关系

X1和X2都是连续型数值变量,比如考察某班学生体重和肺活量之间的关系,如果数据具有正态性,此时首选Pearson相关系数,如果数据不服从正态分布,此时可选择Spearman和Kendall系数。

三、两个有序分类变量相关关系

X1和X2都是有序分类变量,比如SPSS学堂微号发布的“某10个品牌的知名度和售后服务质量”相关分析案例,运用Spearman相关系数进行检验变量品牌知名度和变量售后服务质量之间的相关性。

本例的样本n=10,参照Spearman等级相关系数检验临界值表,得到的结果相关系数为0.879>0.648,表明拒绝零假设,Spearman等级相关显著,说明提高售后服务质量,有利于增加品牌知名度。显著性水平为0.001<0.05,表明两变量之间的正向关系很显著。

四、一个分类变量和一个连续数值变量

比如我们想考察一下职员们的工资(salary)和受教育程度(educ)、职务等级(jabcat)之间的关系。其中educ和jabcat均为有序分类变量,而工资是连续性数值变量。

kendall相关系数表如上。工资与教育程度、职务等级的kendall系数分别为0.554和0.53(中等相关的一个水平),不相关的概率几乎为0(通过显著性检验),说明工资与教育程度和职务等级有关。

五、小结

就适用性来说,kendall > spearman > pearson ,在考察两两变量间相关关系时,应了解两变量的变量类型以及是否有正态性,然后决定使用哪个系数。

本文地址:http://www.datasoldier.net/archives/716
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
欢迎订阅SPSS训练营微信公众号
SPSS上机训练作业

评论已关闭!