biomart是一个R package,能够完成基因注释的工作。在我得到差异表达基因之后,可以直接使用该包直接注释。
网络上许多代码已经过时,特此更新用法。
1 安装
# Windows10, R 4.0.5
install.packages("BiocManager")
BiocManager::install("biomaRt")
2 pipeline
首先要选择数据库合dataset
先强迫自己看文档学习,help("useMart")
看文档
useMart()文档
意思是自己输入biomart database的名字,需要选择dataset,host选项填上需要连接的网站,OK尝试一下
# 用连接ensembl数据库作为例子
library("biomaRt")
mart <- useMart(biomart="ensembl")
#查看有什么dataset可以选择
listDatasets(mart)
#选择一个人的基因注释,加上host连接,不加host需要选择国外mirror
mart <- useMart(biomart="ensembl",dataset="hsapiens_gene_ensembl",host="www.ensembl.org")
接下来就可以做基因注释了
# getBM 获取注释
hg_symbols<-getBM(attributes=c('ensembl_gene_id','hgnc_symbol',"chromosome_name", "start_position","end_position", "band"), filters= 'ensembl_gene_id', values = my_ensembl_gene_id, mart)
NOTE:
- attributers()里面的值为我们输出的ID类型
- filters()里面的值为我们输入的ID类型
- gene= 这个值就是我们要输入的数据
- mart= 这个值是我们所选定的数据库的基因组
-
listFilters(mart)
用于查看可用于输入的数据 -
listAttributes(mart)
用于查看可选的输出数据