一、缺失值显示
缺失值符号 NA
data()——查看内置数据集
my_data <- edit(my_data)——编辑数据集
my_data[-(1:5),1] <- NA——第一列除了前5行都为缺失值
a <- is.na(mydata)——查看哪些位置上是缺失值
sum(a[,1])——查看第一列缺失值个数
mean(a[,1])——查看第一列缺失值比列,或用上一个除以nrow(my_data)
apply(a,2,mean)——查看每列缺失值比列,1是行,2是列 返回的是向量,可以通过元素的名字访问元素
which(a,arr.ind =T)——返回a中对应T所在位置
complete.cases(mydata)——True表示相应的行是完整的数据
mean(!complete.cases(mydata))——返回缺失行的比列,记得前面加!T和F对调一下
二、mice包
md.pattern(mydata)——最后一列是几个变量有缺失值,第一列这种缺失模式有几个观测值,最后一行是总的情况,图形可视化,红色表示相应缺失模式
三、缺失值处理
删除缺失值多的变量——缺失值太多才能删变量
na.omit(mydata 或者用complete。cases函数——删除缺失值的行
mean(mydata[,1],na.rm=T)——对第一列去掉缺失值取平均数
缺失值插补