R语言-均值填充缺失值

在基因芯片数据或其他类型数据中,采用计算所有样本的平均值从而进行填充,如果需要用中位数或其他统计量填充时只需修改相应的方法即可

#1. 检查是否有缺失值

which(is.na(mRNA),arr.ind = T)

#2. 计算行均值并填充

#该数据中探针(基因)为行(名),样本为列(名),(数据框内容为表达量数据值型数据数据)格式可见文章最后

row_mean <- apply(mRNA,1,mean,na.rm =T) #1是行,2是列,若用其他方法修改mean即可

mRNA$MEAN <- row_mean

ncol = 样本数

for (i in 1:nrow(mRNA)) {

  mRNA[i,is.na(mRNA[i,])] <- mRNA[i,ncol]

}


©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • R语言与数据挖掘:公式;数据;方法 R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还...
    __一蓑烟雨__阅读 1,688评论 0 5
  • 我们会根据业务的要求做各种复杂的报表,包括了分组、排序、过滤、转置、差分、填充、移动、合并、分裂、分布、去重、找重...
    fhhhfssfhh阅读 1,524评论 0 6
  • par(family="Sarasa Gothic CL")#这个命令运行后就可以使用中文字体了 a<-3+7 b...
    woaishangxue阅读 693评论 0 0
  • Day1(2020.9.12) 1.向量赋值 X1<-c(1,2,5,7,9) X1 运行结果[1] 1 2 5 ...
    kaobiguo阅读 1,582评论 0 1
  • r文件下载链接[https://pan.baidu.com/s/1JCqFXY1X7XXU8s57xlRD7Q] ...
    woaishangxue阅读 331评论 0 0