如何获取kegg通路的基因列表

如何获取kegg通路的基因列表?相信很多人都有这个疑惑。

哪些时候需要知道通路的基因列表?举两个例子:

  • 在找差异基因这一步,只想针对特定通路的基因去找。可以在找完差异基因后,和通路的基因列表取个交集。
  • 单细胞分析中,经常会用到基因集打分,除了看文献收集,基因集还能怎么找?可以根据kegg等数据库去找。

今天介绍的这种方法,非常简单,就几行代码:

# BiocManager::install("KEGGREST")
# BiocManager::install("EnrichmentBrowser")
library("KEGGREST")
library("EnrichmentBrowser") #这个包里面的一些函数会调用KEGGREST里面的函数


### download the pathways
hsapathway <- downloadPathways("hsa") #只有在第一次运行这句代码时,耗时较长

### retrieve gene sets
hsa <- getGenesets(org = "hsa", db = "kegg", gene.id.type = "SYMBOL",cache = TRUE, return.type="list") ##只有在第一次运行这句代码时,耗时较长

writeGMT(hsa, gmt.file = "20230205_kegg_hsa.gmt")

之后就能得到gmt格式的基因列表了。

image

gmt格式也可以很容易地转换为我们熟悉的数据框格式,方便我们做别的分析。

keggdf=clusterProfiler::read.gmt("20230205_kegg_hsa.gmt")
head(keggdf)
image

代码很简单,应该很容易实现。

往期相关教程

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容