学习R:识别缺失值与将指定数据编码为缺失值

原创 数据小兵  2021-03-12 09:38  阅读 186 次
数据小兵成长记

基础不牢,大厦将倒。今天再来练习一个基础操作,在数据框中发现缺失值,以及将指定数据重编码为缺失值

雇员数据原本是SPSS格式,其中以往经验这个变量有一小部分取值为0的,即无经验,假设我们现在要将其认定为缺失值,需要重新将数字0认定为缺失值。

第一,查看当前数据有无缺失值

summary(is.na(data))

或者

sum(is.na(data))# [1] 0

该数据总共474case,结果显示,整个data没有系统缺失值。

但实际需求是,我们要将prevexp变量中的数字0设定为缺失值,应该强行定义。

第二,指定值冲编码为缺失值

data$prevexp[data$prevexp == 0] <- NA

data$prevexp[which(is.na(data$prevexp))]<-0

此时0经验已经被我们强行编码为系统缺失值NA。

第三,识别缺失值

summary(is.na(data))

来看现在的结果:

有24个0被我们强行定义为NA即缺失值。

本文完

文/图=数据小兵

本文地址:http://www.datasoldier.net/archives/2873
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
视频课程《SPSS统计分析:从入门到实践提高》
欢迎订阅SPSS训练营微信公众号

评论已关闭!