SPSS问卷分析:根据填写时长删减无效问卷

原创 数据小兵  2020-03-26 09:21  阅读 234 次
视频课程《SPSS统计分析:从入门到实践提高》

在线网络问卷调查已经是问卷数据获取的重要手段,它有一个很有价值的数据,可以记录下每一个受访者填写问卷所用的时长。比如受访者A用时160秒,B用时300秒。

问卷填写用时的价值在于能一定程度上判断受访者是不是经过认真思考客观答题。

我们的假设是,如果一个受访者填问卷用时过短,可能存在胡乱填写,导致数据失真;另外如果用时过长,可能存在被其他事情干扰打乱思考,从而给出不客观的数据。

用问卷课程的案例数据来测试一下

这份数据是从问卷星平台导出的,自带了填写用时数据,类型是连续数值。拿到问卷数据后,对于单个连续数据,我们马上想到画一个直方图,看看分布情况。

这么丑?仔细观察发现有人超长用时,根据描述统计的最大值,竟然有人花了4950秒(83分钟)来填问卷,这显然令人担忧数据是否客观,那我们可以考虑首先把它剔除。

这里说的剔除不是直接删掉,在SPSS里面可以指定4950为缺失值,这样一来,该受访者的数据将不会参与后续的统计分析。

然后重新做直方图来看看看:

现在看起来终于是“直方图”了。异常值对数据呈现的影响可见一斑。

作为问卷的设计者,数据质量的把关者,我们自己要对问卷填写用时有所估量,拿出一个相对规范的要求,比如课程中的这个问卷,我认为不能少于90秒,不要超过500秒(可放宽),不在这个范围内的问卷可以视作是无效问卷,应予以剔除。

也没有必要到处找人问说这有没有标准,你是标准的制定者。

当然也有一些值得参考的经验,有的老师认为问卷填写时长数据的下25%(1/4分位数)数据应剔除,尽可能保障问卷数据客观。

小兵给大家测试一下

首先看填写用时这个变量数据的1/4分位数是多少,SPSS描述统计中的【频率】菜单可以轻松输出四分位数指标。

1/4分位数是151.75(秒),大概2分半用时,然后我还想马上知道一下用时低于152秒的有多少个样本,如果定义为无效问卷的话,我要减掉多少样本。

SPSS筛选个案菜单可以完成这个任务,然后描述统计一下:

25个,很不少。删除须谨慎。假设我们不顾及问卷的实际情况,直接将这部分问卷视为无效问卷。

继续使用个案筛选操作,只保留用时152秒以上的数据,然后直方图。

这真的是一刀切了?好好的正态分布给切成不伦不类了。

以上是演示了将1/4分位数以下的数据剔除,这只是一个参考,收集问卷较多时可以考虑一下。但是一定要结合自己问卷的实际情况来定,不能随意一刀切。

打个比方,问卷课程中的满意度预调查问卷,普通题目8个,量表题目32个,题目总量并不多,在2分钟以内客观填写不是不可能。

所以利用问卷填写用时来审查问卷质量,应该来说没有绝对的金标准,研究者可结合一般经验,结合自身问卷题目数量、问卷题目编排形式,反复测试估算,设定一个可信的范围,谨慎剔除问卷。

毕竟除了用时这个可考量的指标外,还有其他一些用来审查问卷质量的措施、方案。

多措并举,最终决策。

全文完

文/图=数据小兵

本文地址:http://www.datasoldier.net/archives/1955
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
SPSS在线视频学习
欢迎订阅SPSS训练营微信公众号

评论已关闭!