方差分析中当因素效应有统计学意义时,需要进一步做两两比较考察因素各水平间的差异。LSD、Bonferroni、Duncan、Tukey等都是国内比较喜欢的用的方法。
其中对概率P值有调整校正的方法中,Bonferroni法使用率最高。
案例背景分析
为了对几个行业的服务质量进行评价,消费者协会在四个行业分别抽取了不同的企业作为样本,最近一年中消费者对总共23家企业投诉的次数如下表,试分析四个行业之间的服务质量是否有显著差异。
四个行业23家企业样本得到23个投诉数据,把这个数据定义为一个名叫“投诉量”的变量,再定义一个“行业”的分类变量,4个水平,从1到4编码分别代表零售业、旅游业、航空业、家电业。
很明显,简单描述统计可以发现,航空业的平均投诉量最低,家电业的平均投诉量则最高,另外两个居中。从投诉量的绝对值来看,四个行业投诉量不完全相同,存在一些差异。
那么如何用统计方法来检验这种差异呢?单因素方差分析适合。
单因素方差分析
以投诉量作为因变量,行业作为自变量进行方差分析,得如下结果:
F=3.407,P=0.039<0.05,说明行业差异是有统计学意义的,四个行业的投诉量不完全一致,那么到底是哪些行业存在显著差异呢?需要两两比较,本例我们选择LSD和Bonferroni法。
Bonferroni法结果解读
4个行业两两之间比较差异,则共需要比较6次。我们将Bonferroni的结果整理一下,如下表:
Bonferroni校正从原理来说,指的是需要将两两比较统计检验小概率显著性水平a,除以比较的次数,降低统计检验显著性水平的临界值。
以本例说明一下,一般是我们取显著性水平a=0.05,只要统计检验的概率P值小于0.05,即可说明差异是有统计学意义的。犯一型错误的概率不超过5%。
但现在我们要连续比较6次差异才能完成本次分析,本次分析犯一型错误的概率累积起来就是1-(0.95)^6 = 0.265,这不符合统计学的要求。
因此在bonferroni校正中,将小概率0.05或0.01除以要比较的次数k,作为判断显著性的小概率,这样做多重比较总的一型错误发生的概率不会超过0.05或0.01。
在本例中,校正后的a' =a/6=0.05/6=0.00833,即两两比较是否有统计学意义,判断的标准调整为计算所得概率P值是否小于0.00833。这是Bonferroni校正的原理。
但在SPSS统计软件里面,大家一定要注意,软件输出的是计算所得概率P乘以比较的次数k,然后继续与0.05比较,是顺着用户的习惯(多数用户习惯直接拿P和0.05进行比较),也方便大家,不需要自己做个除法。
在本例中,以家电和航空业投诉量两两比较结果为例,概率P=0.03,P<0.05,说明家电业和航空业投诉量差异有统计学意义。
与此等价的是:0.03除以6等于0.005,然后0.005小于0.00833,说明家电业和航空业投诉量差异有统计学意义。
直接读取SPSS方差分析输出的Bonferroni校正概率P值与0.05比较,其结论和概率P除以比较次数k与0.05/k比较是一致的,等价的。
如果发表论文是要求给出校正概率P值,那么就告知P/k即可。
还有一点需要说明,大家看旅游业和零售业差异比较,Bonferroni给出的概率P=1.000,此处要注意,这是软件强制命令其等于1,如果大家用LSD输出的0.882*6=5.3,概率P值怎么能大于1呢?它的范围只能控制在0到1之间,所以软件直接命其为1,这也是Bonferroni校正的一部分。
本文/图:由数据小兵最终编辑
评论已关闭!