转录因子及其下游靶基因形成的基因调控网络( Gene Regulatory Network, GRN)在基因表达调控中起着重要作用。此外,GRNs可以在不同的条件下动态变化,这对于理解疾病发病机制至关重要。然而,目前还没有一个数据库在单细胞水平上为人类和小鼠的各种正常组织和疾病提供全面的GRN信息。
来自华东师范大学联合多家机构的科研团队开发了GRNdb,一个免费的人类和小鼠数据库,旨在方便搜索和分析转录因子(TFs)和下游靶基因(称为调控子)在各种组织/条件下形成的调控网络。
基于已知的TF-target关系和从公共数据库收集的大规模单细胞转录组数据,以及TCGA和GTEx数据,研究人员系统地预测了184种不同生理和病理条件下的人和小鼠的GRNs,涉及超过633000个细胞和超过27700个样本。GRNdb可搜索、比较、浏览、可视化和下载77746个GRN、19687841个TF-target以及相关结合基序的预测信息。
GRNdb有哪些功能?
GRNdb可提供搜索、浏览、数据统计、数据下载等功能,同时还允许用户探索不同癌症的基因表达谱、相关性以及表达水平与患者生存率之间的关联。
搜索
快速搜索
用户可通过首页快速搜索框输入想要检索的转录因子或者目标基因来进行基本的搜索。
得到搜索结果表:包括数据来源的物种、数据类型、转录因子和靶标情况、两个基因相关性分析、转录因子motif等。
精准搜索
用户可以在Search页面通过gene symbol、Entrez ID和Ensembl gene ID进行精准搜索。返回的结果包括基于特定条件下确定的所有重要调控子的t-SNE图,不同细胞类型/簇的maker表达热图和注释,查询TF和下游靶基因形成的调控网络,每个细胞/样本中该TF的调节子活性,TF表达谱的t-SNE图,每个细胞类型/簇的TF表达的小提琴图,以及相关TF-target的详细信息表。
此外,搜索页面上的“comparison”功能可以让用户方便地比较人和鼠的任意两种情况下的GRN,这可能有助于用户对基因调控有更多的了解。
浏览
在“Browse”页面上,用户可以浏览184种不同条件下人类和小鼠中TF–target的详细信息。浏览结果包括基于在所选条件中检测到的所有重要调控子的t-SNE图,细胞/样本、调控子、TF、靶基因和TF-target的数量的统计条形图,以及所有已识别的TF-target的详细表格。
分析功能
多基因同时表达及相关性分析
为了促进基因表达的探索,GRNdb允许用户在“Expression”页面上同时查询一系列基因的表达谱。查询基因的数量没有限制,输入的格式可以是gene symbol、Entrez ID和Ensembl gene ID。将返回每个细胞/样本中基因表达的t-SNE图和每个细胞类型/簇中基因表达的小提琴图。
基因表达与癌症患者生存期的相关性分析
在“Survival”页面上开发了33种不同TCGA癌症的生存分析功能。查询基因的数量没有限制,输入的格式可以是gene symbol、Entrez ID和Ensembl gene ID。
上述功能中涉及的图都可以点击右上角的下载图标直接下载。
在GRNdb的“Download”页面,用户可以获得不同条件下人类和小鼠中TF–target的详细信息矩阵。
GRNdb访问地址:http://www.grndb.com/.
首发公号:国家基因库大数据平台
参考文献
Fang L, Li Y, Ma L, et al. GRNdb: decoding the gene regulatory networks in diverse human and mouse conditions[J]. Nucleic acids research, 2021, 49(D1): D97-D103.
图片来源于GRNdb和参考文献,如有侵权请联系删除。