R语言的参考网站
RStudio Cheat Sheets (https://www.rstudio.com/resources/cheatsheets/)
安装R包 (tidyr)
- 设置国内镜像
tools-global tools-packages-CRNA mirror-China (beijing)[https] - TUNA Team, Tsinghua University - 安装包
install.packages('安装包的名字')
- 运行包
library(tidyr)
数据框的构建与整理(推荐文件格式为csv)
a <- data.frame(GeneID=rep("gene3",times=3),
samplename=paste("sample",1:3,sep = ""),
expression=c(14,19,18)
)
#paste,连接2个字符串,括号要填2个连接字符并指定分隔符(sep),没有分隔符就填sep = ""
View(a)
使用tidyr包将数据处理成Tidy data(标准而统一的数据框)
数据框的构建
数据框列名的合并
#方法1
gather(数据框名,key="合并后的key列名",value="合并后的value列名",需要合并的列名1,需要合并的列名2)
#方法2
gather(数据框名,key="合并后的key列名",value="合并后的value列名",-列名1)
#-列名1的意思就是合并除列名1外剩下的列
- 数据框的读取及导出
#导入
s<-read.csv("文件名.csv")
#导出
write.csv(变量名,"文件名.csv")
- 处理数据框中缺失的数据
- 整行删掉
drop_na(数据框名,打算删除的行名)
- 根据上一行的数值填充
fill(数据框名,打算填充的行名)
- 在缺失处填入特定的数值
replace_na(数据框名,list(打算填充的行名=要填的数值))