03单细胞数据库合集
如何快速找到单细胞数据?有没有可以在线分析单细胞数据的工具?...其实,这些需求单细胞数据库都可以实现。这篇大集合汇总了之前小编亲测的10个单细胞数据库,可以帮助您进行细胞注释和分析,也可以用作研究前期的数据探索。
CDCP
单细胞组学平台(CDCP)是国家基因库生命大数据平台(CNGBdb)去年上线的一个数据库,非常适合0代码基础小白入门单细胞数据分析。
平台数据/功能:CDCP集成了CNGBdb平台的单细胞数据资源(包括6302个样本和321782个细胞),为用户提供单细胞数据分析、可视化、下载和递交功能。
数据库地址:https://db.cngb.org/cdcp/
Human Cell Landscape
2020年3月25日,由浙江大学基础医学院郭国骥团队与浙江大学附属医院张丹团队、王伟林团队、陈江华团队、梁廷波团队和黄河团队等紧密合作完成的人类细胞图谱相关研究成果于《Nature》在线发表。研究团队利用人类细胞图谱相关分析数据资源搭建了人类细胞蓝图(Human Cell Landscape,HCL)数据库:http://bis.zju.edu.cn/HCL/,并在国家基因库生命大数据平台(CNGBdb)设立镜像站。
平台数据/功能:HCL数据库包含来源于702,968个单细胞转录组数据鉴定的人体102种细胞大类和843种细胞亚类的可视化数据资源,同时scHCL单细胞比对系统可用于人体细胞类型的鉴定。
数据库地址:https://db.cngb.org/HCL/
SpatialDB
2019年11月,来自中国科学院生物物理研究所高通量测序中心的研究人员发布第一个单细胞空间转录组数据库及数据在线可视化平台:SpatialDB,为研究组织的空间细胞结构提供了一个资源库,并可能为理解疾病中的细胞微环境带来新的见解。
平台数据/功能:SpatialDB系统收录了来自5个物种由8种空间转录组技术产生的数据,建立了空间转录组数据分析处理流程,实现了空间转录组数据的在线可视化,同时提供了空间差异表达基因及其功能富集分析的注释。
数据库地址:https://www.spatialomics.org/SpatialDB
CancerSEA
CancerSEA是由哈尔滨医科大学的研究人员开发的一个用于破译癌症单细胞功能状态的数据库。其提供了一个癌症单细胞功能状态的图谱,并在单细胞水平上将这些功能状态与蛋白编码基因(PCGs)和lncRNA联系起来,以促进对癌细胞功能差异的机制性理解。
平台数据/功能:CancerSEA包含25种癌症的41900个肿瘤细胞,14种癌症相关功能状态,提供了一个癌症单细胞状态图谱,允许用户查询基因(包括PCGs和lncrna)与14种功能状态之间的关系。Easy-to-use接口提供搜索、浏览、可视化和下载数据功能。
数据库地址:http://biocc.hrbmu.edu.cn/CancerSEA/
PanglaoDB
PanglaoDB是由瑞典和美国的研究人员开发的一个用于探索小鼠和人类scRNA-seq数据的网站,为单细胞组学研究提供最新的公共scRNA-seq数据资源。
平台数据/功能:PanglaoDB包含了超过1054个单细胞实验的预处理和预计算分析,涵盖了大多数主要的单细胞平台和分析流程,基于来自各种组织和器官的超过400万个细胞。在线界面允许用户查询和探索细胞类型、遗传途径和调控网络。
数据库地址:https://panglaodb.se/
scRNASeqDB
scRNASeqDB是由美国的研究人员开发的第一个人类单细胞转录组数据库。
平台数据/功能:scRNASeqDB包含了目前几乎所有可用的人类单细胞转录组数据集(n=38),覆盖200个人类细胞系或细胞类型和13440个样本。用户可根据基因或细胞类型搜索基因表达的信息,同时scRNASeqDB还提供可查询和可视化工具,包括基因、细胞类型或群体间差异表达基因的注释信息,另外用户还可以通过Dataset View功能浏览数据库的数据信息。
数据库地址:https://bioinfo.uth.edu/scrnaseqdb/
SCPortalen
SCPortalen是由日本的研究人员开发的以人类和小鼠为中心的单细胞数据库。
平台数据/功能:SCPortalen涵盖了人类和小鼠单细胞转录组学全面的元数据和转录组数据以及细胞图像信息。通过SCPortalen的web界面,用户可以轻松地搜索、浏览和下载感兴趣的单细胞数据集。
数据库地址:http://single-cell.clst.riken.jp/
SC2disease
来自西北工业大学、西安交通大学、哈尔滨工业大学、复旦大学和天津大学的研究团队共同开发了一个人工整理的人类疾病单细胞转录组数据库:SC2disease,旨在为不同疾病的不同细胞类型的基因表达谱提供全面准确的资源。
平台数据/功能:SC2disease记录了946481个条目,对应341种细胞类型、29种组织和25种疾病。数据库中的每个条目都包含了不同细胞类型、组织和疾病相关健康状况之间差异表达基因的比较。用户可以通过SC2disease浏览感兴趣的基因的表达、搜索细胞型标志物、搜索多种疾病的生物标志物和比较疾病和非疾病状态下各类细胞的表达谱。
数据库地址:http://easybioai.com/sc2disease/
ColorCells
来自中山大学的研究团队开发了ColorCells:一个用于比较分析单细胞RNA-Seq数据中lncRNAs表达、分类和功能的数据库。研究人员还将ColorCells应用于6个物种的167913个公开的scRNA-Seq数据集,发现了一批细胞特异性lncRNAs。
平台数据/功能:ColorCells是lncRNA表达分类和功能预测的综合资源。ColorCells提供了一系列新颖的工具和友好的可视化界面,包括:1)应用PCA和t-SNE算法在2D和3D显示细胞簇;2)开发了一个tissue map工具来显示人类和小鼠的各种组织和细胞类型;3)建立了超几何分布的统计测试方法来自动分配细胞对细胞簇进行类型标记;4)基于SNN和pearson相关分析估计细胞间的相似性;5)构建共表达网络预测lncRNAs功能。
数据库地址:http://rna.sysu.edu.cn/colorcells/index.php
GRNdb
来自华东师范大学联合多家机构的科研团队开发了GRNdb,一个免费的人类和小鼠数据库,旨在方便搜索和分析转录因子(TFs)和下游靶基因(称为调控子)在各种组织/条件下形成的调控网络。
平台数据/功能:基于已知的TF-target关系和从公共数据库收集的大规模单细胞转录组数据,以及TCGA和GTEx数据,研究人员系统地预测了184种不同生理和病理条件下的人和小鼠的GRNs,涉及超过633000个细胞和超过27700个样本。GRNdb可搜索、比较、浏览、可视化和下载77746个GRN、19687841个TF-target以及相关结合基序的预测信息。
数据库地址:http://www.grndb.com/
首发公号:国家基因库大数据平台
参考文献
[1] Han, X. et al. Construction of a human cell landscape at singlecell level. Nature https://doi.org/10.1038/s41586-020-2157-4 (2020).
[2] Fan Z, Chen R, Chen X. SpatialDB: a database for spatially resolved transcriptomes[J]. Nucleic Acids Research, 2020, 48(D1): D233-D237.
[3] Yuan H, Yan M, Zhang G, et al. CancerSEA: a cancer single-cell state atlas[J]. Nucleic acids research, 2019, 47(D1): D900-D908.
[4] Franzén O, Gan L M, Björkegren J L M. PanglaoDB: a web server for exploration of mouse and human single-cell RNA sequencing data[J]. Database, 2019.
[5] Cao Y, Zhu J, Jia P, et al. scRNASeqDB: a database for RNA-Seq based gene expression profiles in human single cells[J]. Genes, 2017, 8(12): 368.
[6] Abugessaisa I, Noguchi S, Böttcher M, et al. SCPortalen: human and mouse single-cell centric database[J]. Nucleic acids research, 2018, 46(D1): D781-D787.
[7] Zhao T, Lyu S, Lu G, et al. SC2disease: a manually curated database of single-cell transcriptome for human diseases[J]. Nucleic Acids Research, 2020.
[8] Zheng L L, Xiong J H, Zheng W J, et al. ColorCells: a database of expression, classification and functions of lncRNAs in single cells[J]. Briefings in Bioinformatics, 2020.
[9] Fang L, Li Y, Ma L, et al. GRNdb: decoding the gene regulatory networks in diverse human and mouse conditions[J]. Nucleic acids research, 2021, 49(D1): D97-D103.
图片均来源于参考文献,如有侵权请联系删除。