一、思维导图
二、准备工作
获取R包小抄(cheatsheet)
去百度/谷歌XX小抄
找Rstudio的cheatsheet网站
教程里用到的包都可以到生信星球公众号回复相应的包名来获取初步了解tidyr
- 安装R包
- 新建数据框(这里直接把新建的数据框赋值给了a)
a<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))
- 认识Tidy Data
每个变量(variable)占一列,每个情况(case,姑且这么翻译)和观测值(observation)占一行。 - 1.Reshape Data
gather
spread - 2.Handle Missing Values
三种处理方式:
(1).删除整行
(2).根据上下文(瞎)蒙一个
(3).同一列的空值填上同一个数。
X<-read.csv('doudou.txt')
导入:X<-read.csv('doudou.csv')
导出:write.csv(X,'doudou.csv')
drop_na():有空值的,整行删除掉
括号里填数据框名,依据的列名(有空值那一列的列名)
fill(),根据上一行的数值填充上
replace_na(),空值填进去特定的一个数值
complete(把空值的位置补全)
expand(列出每列值所有可能的组合)
separate:按列分割
separate_rows:按行分割
unite:分割完了再合并回去