生信星球下载tidyr(百度盘已存)下载到Rdata,然而并不能看得懂。
安装
1.下载(网盘)
- 下载到Rdata,安装代码install.packages("tidyr")
安装完成后这样应该成功了吧
该安装包是数据框相关,作用是(1)数据框的变形(2)处理数据框中的空值(3)根据一个表格衍生出其他表格(4)实现行或列的分割和合并,总之是处理成处理成标准而统一的数据框。
新建数据框
代码*a<-data.frame(GeneId=rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))
得到的数据框是
解释一下:<- 赋值;data.frame数据框;rep,重复,括号中填要重复的字符和重复次数;paste,连接两个字符串,括号要填两个代连接字符并指定分隔符(sep),没有分隔符就填sep=“”;行 raw,列 column,简化写法为col;
输入后找不到数据框,右上角enviroment/data,点击出现。或者输入a。
Tide data
统一数据,即把数据变成单一观察指标,原33表格化成29,化平面为线性。
现在小炒看懂一点了,在经历了大小写错误,标点错误,单词拼写错误后终于实现。
然后看小抄:gather( data, key, value, ..., na.rm = FALSE,convert = FALSE, factor_key = FALSE )
gather() moves column names into a key column, gathering the column values into asingle value column.
gather的实现过称中出现以下问题。两行代码差别在哪为何第一行实现不了?
gather(a,year,cases,-country) #-country的意思就是合并除country外剩下的列。
处理丢失数据
三种处理方式:
(1).删除整行
(2).根据上下文(瞎)蒙一个
drop_na():有空值的,整行删除掉 / fill(),根据上一行的数值填充上(好应付的感觉)
(3).同一列的空值填上同一个数。 //replace_na(),空值填进去特定的一个数值(还是在应付)
complete(data, ..., fill = list())
Adds to the data missing combinations of the
values of the variables listed in …
complete(mtcars, cyl, gear, carb)
pin2<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))