SPSS描述统计指标Bootstrap自助抽样置信区间

原创 数据小兵  2021-04-01 15:58  阅读 128 次
数据小兵成长记

我们平常多提及平均值的95%置信区间,假设现在要求你报告中位数、标准差,甚至是偏度峰度这些指标的置信区间,你该怎么办呢?

在SPSS操作中,我们经常可见的是对均值置信区间的估计,很少能看到有参数选项可以直接计算其他统计指标的置信区间。

此时,我们可以利用bootstrap自抽样法来估计。

【分析】→【描述统计】→【探索】,我们现在想了解一下“当前薪金”这个数据的描述统计指标。

将“当前薪金”放入【因变量列表】中即可,SPSS默认是只针对均值计算其95%置信区间。来看默认输出的结果:

当前薪金的平均值为34419,95%CI(32878,35960)。这个区间是基于当前薪金在正态分布前提下,通过均值、样本量、标准差,利用现有/标准公式计算得到的(公式略)。

然而,当前薪金这列数据的其他描述统计指标,比如标准差、偏度、中位数等软件是不会直接给你提供置信区间的。另外,一般人也不会知道和了解这些统计指标置信区间的计算公式。

还有一点,如果数据不是正态分布呢?

bootstrap自抽样法的特点是,它对数据总体的分布没有要求,通过自助差抽样获得多组样本数据,并产生某个统计指标的经验分布,利用这个经验分布,以p2.5和p97.5分为点为截断点最终帮我们估算一个置信区间。

在SPSS中,你只需要这样点击勾选相应的参数选项,马上就可以给其他描述统计指标(也包括均值)估算置信区间(应注明是bootstrap法)。

在【探索】分析菜单中,点开【自助抽样】按钮,勾选【执行自助抽样】,默认自抽样1000次一般就可以了,勾选【95%】置信区间。其他参数不用管。最后确定即可。

来看结果(可能需要花一点世间):

如你所见,平均值、中位数、方差、标准差、偏度、峰度这些统计指标现在都有95%置信区间了,但是这里注意一定要注明是bootstrap法估算。

而且,我们也发现在现有公式下计算的均值置信区间和boot法置信区间的结果有微小差异,这是计算方式导致的。

bootstrap法更适用于分布状态不明确,样本量偏小,个别指标(统计量)置信区间计算公式没有的情形下,来估算置信区间。

本文完
文/图=数据小兵

本文地址:http://www.datasoldier.net/archives/2911
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
NEXT:已经是最新一篇了
视频课程《SPSS统计分析:从入门到实践提高》
欢迎订阅SPSS训练营微信公众号

评论已关闭!