如何对多分类变量重新赋值?SPSS重新编码为不同变量

原创 数据小兵  2021-05-22 20:05  阅读 2,484 次
数据小兵成长记

现有的数据未必能全部满足分析需求,我们经常要在现有数据基础上进行衍生计算,以及重新赋值。

比如下面这个案例:按年限收集的教育水平变量,现在有10个分类水平,在后续的统计分析中不利于分组差异的研究,所以我希望将其10个分类水平压缩一下,重新赋值为4个分类水平。

任务:原10个分类水平→编码为新的4个分类水平。

这项任务,对于SPSS来说,推荐使用【重新编码为不同变量】菜单完成。

菜单【转换】→【重新编码为不同变量】,将原“教育水平”变量移入目标框内。

1)给未来新的变量起个名字,比如本例命名为“学历”;

2)一定要点一下【变化量】按钮,这翻译不妥当,变化量?不明所以是吧,我觉得可以翻译为“确认转换”或“确认重编码”;

3)点开【旧值和新值】对话框;

本例这样安排,8年的赋值为1水平,12年的赋值为2水平,14~16年赋值为3水平,17年以上的赋值为4水平。

你的数据要如何赋值呢?如何重新划分分类水平呢?大家跟根据自己的业务分析需要和专业知识来判定。

SPSS的这个对话框,都是字面意思,大家多看看它旧值的划分办法,可以指定某个旧值为新值,也可以按一定范围指定为新的赋值等。

执行此次分析。

做个频率分析,看新的四个分类水平分布状况如下:

最后,善始善终,可以再给新变量做一个水平编码说明。

本文完
文/图=数据小兵

本文地址:http://www.datasoldier.net/archives/3003
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
视频课程《SPSS统计分析:从入门到实践提高》
欢迎订阅SPSS训练营微信公众号

评论已关闭!