数据框

1. 数据框的属性

nrow行,rownames()行名
ncol列, colnames()列名

2. 数据框取子集

① 数据框$列名

按列取子集
df$Gene

②按坐标取子集

df[2,2]#第二行第二列
df[2,]#取第二行
df[,2]#取第二列
df[c(1,3),1:2]#取第一行和第三行的第1-2列

③按名字

df[,"gene]
df[,c("gene","change")]

④按条件

df[df$score>0,]
df$gene[df$score>0]#只要括号里的和括号外的可以对应起来就行了

3. 数据框修改

df$score <- c(10,20,30,40)#给列名为score这一列修改数值
df$P.value <- c(0.01,0.02,0.03,0.05)#新加入一列P.value
#现有列名就是修改,新出现的列名就是新增

4.去除含有缺失值的行

na.omit(df)

5.两个表格连接

cbind按列连接
rbind按行连接

思考Q

图片来自生信技能书.png

回答A

load("matchtest.Rdata")
table(x$file_name%in%colnames(y))#x的列名都存在于y中
z=x$file_name[match(colnames(y),x$file_name)]#将序列排成一致的
identical(z,colnames(y))#判断两个变量是否完全一致,TRUE是完全一致,反之则不是
#一句代码分析完成的版本
colnames(y)=x$ID[match(colnames(y),x$file_name)]
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容