看到了jimmy老师的下述文章,才发现之前写的RNAseq实战还漏了个转录因子富集分析:
常规转录差异建议都加上一个转录因子数据 (qq.com)
基因集的转录因子富集分析 (qq.com)
为什么是AUC值而不是GSEA来挑选转录因子呢 - 知乎 (zhihu.com)
记一下,之后RNA-seq实战学习一下使用RcisTarget包进行转录因子富集分析,补上这个内容
RcisTarget:
Bioconductor:Bioconductor - RcisTarget
使用说明书:RcisTarget: Transcription factor binding motif enrichment (bioconductor.org)
数据下载:Index of /cistarget/databases (aertslab.org)
一些中文教程:
常规转录差异建议都加上一个转录因子数据 (qq.com)
基因集的转录因子富集分析 (qq.com)
RcisTarget || 从基因列表到调控网络 - 简书 (jianshu.com)
RcisTarget||转录因子结合基序富集 - 云+社区 - 腾讯云 (tencent.com)
顺便再记一下常用的转录因子数据库:最强攻略5:史上最全转录因子数据库汇总解读 - 知乎 (zhihu.com)
人和小鼠常用TRRUST,这是一个人工注释的转录调控网络数据库,包含转录因子对应的靶基因、转录因子间调控关系,页面简洁明了,很不错:
TRRUST - Transcriptional Regulatory Relationships Unraveled by Sentence-based Text mining (grnpedia.org)
RcisTarget基本介绍
文章:SCENIC: single-cell regulatory network inference and clustering | Nature Methods
RcisTarget是SCENIC方法发表文章时所用的三大依赖包之一,在SCENIC workflow中的第二步
介绍
Rcis Target可识别基因列表中过表达(富集)的转录因子结合基序 (TFBS)。
在第一步中,Rcis Target 选择在基因集中基因的转录起始位点 (TSS) 周围显过表达的 DNA 基序。这是通过使用包含每个基序的全基因组跨物种排名的数据库来实现的。
然后,注释到 TF 、具有高的标准化富集得分 (NES) 的基序将被保留。
最后,对于每个基序和基因集,Rcis Target 预测候选目标基因(即基因集中排名位于前沿的基因)
输入数据
Rcis Target的主要输入是要分析的基因集。基因集可以作为一个“命名列表”提供,其中每个元素都是一个基因集(包含基因名称的字符向量)或作为GSEABase:: gene Set。
输出结果
Rcis Target 的最终输出是一个 data.table,其中包含富集基序的信息及其注释: