SPSS数据清洗一般用什么方法?

原创 数据小兵  2019-10-16 10:30  阅读 220 次
视频课程《SPSS统计分析:从入门到实践提高》

数据的质量直接决定统计建模的结果,对数据集的整合、变量的增删、变量衍生计算、变量值转换、缺失值、错误值处理等工作贯穿数据统计分析的全过程,这些工作就是数据清洗,常见的说法是正式分析之前进行,但实践当中整个分析流程中是要随时按需进行。

对于SPSS来说,它专门有一个菜单来完成具体工作。大家来看【转换】菜单:

【计算变量】:可通过输入数字表达式来在现有变量基础之上计算新的变量,使用率非常高。

操作案例如下:

【重新编码】:有具体两种形式,一种是重新编码为不同的变量,另一个是重新编码为相同的变量,主要用来对连续数值变量进行分箱分组处理,对分类变量进行水平值的调整修改处理。

操作案例如下:

【可视分箱】:让你看着直方图数据分布,来对原数据进行离散分箱分组处理,功能上和重新编码略有重合,但是操作效果更佳。

操作案例如下:

【创建虚变量】:如果要将分类变量参与回归分析,那么需要进行哑变量处理,这个菜单呢就是创建虚拟变量,完成哑变量转置的。

操作案例如下:

【替换缺失值】:遇到数据有缺失没办法手工补齐怎么办?难不成直接把缺失所在个案都删去了吗?不着急删除,先考虑使用一下软件替换缺失值的技术,可以帮助我们科学补齐缺失数据。

操作案例如下:
菜鸟也爱SPSS——替换缺失值

【生成随机数】:有时候为了抽样,或数据分区,我们有需要产生一系列随机数,没关系SPSS可以搞定。

操作案例如下:
SPSS统计分析案例:生成随机数

通知:

本号出品的《SPSS从入门到实践提高》视频课程,长期维护更新,由最初12课时已增加至166课时,近期新增【变量管理】章节,内容主要介绍SPSS数据清洗相关操作和案例详解。

课程地址:

https://study.163.com/course/introduction/1003945001.htm?share=1&shareId=1149679450

本文地址:http://www.datasoldier.net/archives/1558
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
SPSS在线视频学习
欢迎订阅SPSS训练营微信公众号

评论已关闭!