我们在阅读论文时,经常看到(方差分析)F检验的结果,比如F(3,19)=3.4,这是什么意思?我们自己对照描述统计结果时,如何根据SPSS输出的方差分析表,写出F括号中的两个数字?
这是本篇文章要解决的问题。
方差分析的思想
方差分析从名字上看强调“方差”,实际上它分析的是“均值”是否相等,而不是“方差”是否相等。它的思想是将Y的总变异分解为系统误差和随机误差。所以方差分析是通过对数据误差来源的分析从而判断不同总体的均值是否相等。
数据的误差用平方和来表示,总的平方和可以称为是总方差。那么总方差依据系统误差和随机误差分解为组间方差与组内方差。
以最简单的单因素方差分析为例,大家看看方差分析中涉及到的统计计算:
(via:百度文库)
我在另外一篇文章中,也做了简要的解释,文章如下:
简单理解起来,就是一句话,F统计量的计算是相应平方和除以对应的自由度。以前计算能力弱的时候(统计软件没有出现前),在F分布表上查找显著性水平0.05和0.01的F统计量临界值,从而判断假设检验的结论。
F统计量结果的表达方式,即F(组间自由度,组内自由度)=具体数值。单因素方差分析中,(见上表)组间自由度为 r-1 ,组内自由度为 n-r ,其中r为因素的分组水平数,n为总样本数。
单因素解读举例
上表为某单因素方差分析表结果,研究不同行业的投诉量有无差别(行业是否影响投诉量),行业因素有4个分类水平,数据的总样本例23个。
表头以下两行数据分别代表组间方差(hy)和组内方差(Residuals)的计算结果。组间自由度 r-1 =4-1=3,组内自由度 n-r =23-4=19。F统计量不用查表了,统计软件已经帮我搞定,F=3.407。
结果描述为:经方差分析,结果显示F(3,19)=3.407,P=0.039<0.05,四个行业对消费者投诉量的影响差异具有统计学意义。
双因素解读举例
上表为某双因素方差分析表结果,研究工人和机器对产品产量的影响,工人因素分类水平4个,机器因素分类水平3个,数据的总样本例12个。
工人因素的组间自由度为3,机器因素的组间自由度为2,两个因素的组内误差自由度为3*2=6。两个因素的F统计量软件已经计算到位,分别是6.985和29.102。
结果描述为:不同的工人对产量的影响有统计学意义,F(3,6)=6.985,P<0.05;不同的机器对产量的影响有统计学意义,F(2,6)=29.102,P<0.01。
以上为小兵给大家做出的解读,欢迎读者朋友阅读和指正,有疑问请在文末留言评论。
全文完
文/图=数据小兵
文中方差分析图有JASP统计分析软件输出。
评论已关闭!