1 tydir包的作用
总之就是可以整理数据,然后在此基础上进行数据处理和作图。
key-value--“键值对”,二者均是列名,像“样品名”和“表达量”这种关系。
2 使用data.frame新建数据框
a<-data.frame(geneid=rep("gene1",times=3),samplename=paste("sample",1:3,sep=""),expression=c(10,20,30))
3 reshape data
reshape data
data.frame
gather
需要合并的两列:year1999&year2000,合并后的key行名“year”&value行名"cases"
gather
gather默认
gather简洁
4 Handle Missing Values
依据的表格
原始表格
缺失数据处理方法:把整行删掉、根据上下文的数值填补和在一列填上同一数值。
drop_na(h,X2) # 括号里填数据框名h,有缺失数据的那一行X2
drop_na
fill(h,X2) # 根据上一行的数值填充上
fill
replace_na(h,list(X2=2)),空值填进去特定的一个数值2
replace_na
5 split cells 把一列拆成两列
先合并
unite
再拆分
加上分隔符“,”
将新文件赋值给变量w
w
按列分
按列分
按行分
按行分