方法一
在R中如何利用ENSEMBL ID获得Gene ID(ENTREZID), 又或者转换为Gene Symbol,以人为例:
预先安装AnnotationDbi 和 org.Hs.eg.db
加载org.Hs.eg.db
> library(org.Hs.eg.db)
获取所有的ENSEMBL ID,并查看前五个ID
> k=keys(org.Hs.eg.db,keytype = "ENSEMBL")
> head(k,5)
[1] "ENSG00000121410" "ENSG00000175899" "ENSG00000256069" "ENSG00000171428" "ENSG00000156006"
基于提取的ENSEMBL ID,提取对应的所有Gene ID(ENTREZID),(以及Symbol),并查看一下提取的内容。
> list=select(org.Hs.eg.db,keys=k,columns = c("ENTREZID","SYMBOL"), keytype="ENSEMBL")
#'select()' returned 1:many mapping between keys and columns
> dim(list)
[1] 29140 3
> head(list,5)
ENSEMBL ENTREZID SYMBOL
1 ENSG00000121410 1 A1BG
2 ENSG00000175899 2 A2M
3 ENSG00000256069 3 A2MP1
4 ENSG00000171428 9 NAT1
5 ENSG00000156006 10 NAT2
预先准备的ENSEMBL ID,如何找到他们对应的Gene ID(ENTREZID)和Symbol,例如ID 中的,获得的对应关系:ID_list
> ID
[1] "ENSG00000256069" "ENSG00000127837" "ENSG00000129673" "ENSG00000276016" "ENSG00000075624" "ENSG00000204262"
[7] "ENSG00000149294" "ENSG00000069943" "ENSG00000173992" "ENSG00000166171" "ENSG00000177201"
> ID_list=list[match(ID,list[,"ENSEMBL"]),]
> ID_list
ENSEMBL ENTREZID SYMBOL
3 ENSG00000256069 3 A2MP1
8 ENSG00000127837 14 AAMP
9 ENSG00000129673 15 AANAT
30 ENSG00000276016 29 ABR
59 ENSG00000075624 60 ACTB
1017 ENSG00000204262 1290 COL5A2
3856 ENSG00000149294 4684 NCAM1
7605 ENSG00000069943 9488 PIGB
8058 ENSG00000173992 9973 CCS
10155 ENSG00000166171 25911 DPCD
17531 ENSG00000177201 127064 OR2T12</pre>
方法二
ID转换,ENTREZID是进行GO分析最好的ID类型(针对clusterProfiler)
ID转换用到的是bitr()函数,bitr()的使用方法:
>bitr(geneID, fromType, toType, OrgDb, drop = TRUE)
geneID:一个含有gene_name的矢量
orgDb:人类的注释包是 org.Hs.eg.db
fromType:输入的gene_name的类型
toType:需要转换成的gene_name的类型,可以是多种类型,用大写character类型向量表示
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------I am a line !Thanks !--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------