在生命科学研究中,解析基因差异表达、获取癌症相关数据支持实验,常依赖于经典的高通量测序和 TCGA 等数据库。而单细胞测序技术的发展,催生了海量精细数据,也引发出新的研究思路和迫切需求:
首先,面对丰富的公共单细胞资源,能否便捷、快速地查询目标基因在不同细胞类型中的表达信息?
其次,在自己样本的测序尚未完成时,能否直接利用现有数据库,获取特定实验样本内各类细胞的占比情况?
更关键的是,当我们观察到某个基因的表达变化时,这种变化是广泛存在于所有细胞类型,还是由特定某一群细胞(如关键细胞亚群)的异常表达所驱动?
此外,能否基于公共单细胞数据,快速进行功能富集、细胞间通讯分析或代谢比较,来揭示不同细胞类型或状态间的核心差异?
为了帮助大家高效应对这些具体问题,在本文中,特别整理了多个功能强大的在线数据库和分析平台。这些工具集成了数据检索与基础分析功能,能够满足研究者进行单细胞数据查询、初步挖掘及可视化的核心需求。
鉴于单细胞数据库种类众多、各有侧重,本期我们将重点介绍和解读适用于肿瘤研究的工具。
希望这份聚焦实用性的整理,能为您的单细胞研究提供便利。欢迎各位老师收藏本文,随时查阅利用。
CancerSCEM

数据库定位与功能
CancerSCEM(Cancer Single-cell Expression Map)堪称单细胞层面泛癌研究的 “利器”。它专注于对人类泛癌单细胞 RNA - seq 数据进行深度整合、系统分析与直观可视化。目前涵盖1351个单细胞数据集,覆盖了74个癌症的类型,是最大的单细胞癌症数据库。而其凭借多维分析手段,如同拿着一把精准的 “解剖刀”,深入探寻不同类型人类癌症中复杂的肿瘤微环境,为研究者揭开肿瘤微环境的神秘面纱提供了强有力的支撑。
在线分析平台与工具
其在线分析平台功能堪称 “全能选手”,涵盖四大模块及 14 种实用功能,像CNV 评估、TF 富集、生物特征评分、代谢相关分析等均在其列,为单细胞层面的肿瘤研究注入了强大动力。更值得一提的是,其可视化界面如同清晰的 “显微镜镜头”,能将单细胞层面的基因表达异质性等关键信息精准呈现,让研究者一目了然。
此外,该数据库还配备了一系列在线分析工具。研究者无需借助复杂的本地软件,直接在在线网站上就能轻松完成基因表达差异分析、细胞相互作用网络构建、基因表达关联等分析工作,极大地提升了研究效率。官方也贴心地提供了一些说明文档,只需点进 document 页面即可进行阅读。而分析工具只要点进主页面下的 Analysis 板块就可以使用。
CancerSCEM兼具强大的检索和在线分析功能,可以用使用者提供多角度多维度的基因单细胞表达信息。

scCancerExplorer
平台定位与核心价值
随在肿瘤单细胞研究中,研究者常面临两大痛点:一是单细胞数据分散在不同文献和平台,整合难度大;二是单一转录组数据难以揭示肿瘤发生的多层面机制(如表观调控、免疫微环境互作)。为此,南京医科大学等团队联合打造了 scCancerExplorer,作为聚焦肿瘤单细胞多组学的 “综合分析枢纽”,专门解决上述难题。

其独特价值体现在三方面:
1.数据规模领先:覆盖 50 余种人类癌症(含常见肿瘤与罕见癌种),整合超过600 万个单细胞数据,来源均为高质量研究或标准化临床样本,确保数据的代表性与可靠性;
2.多组学深度整合:突破传统数据库的单一维度限制,不仅包含转录组(基因表达谱),还整合了DNA 甲基化组、染色质可及性数据,部分数据集更纳入 TCR/BCR 测序信息(解析免疫细胞受体多样性),让研究者能同时从基因表达、表观调控、染色质状态等多维度解析肿瘤特征;
3.简化分析流程:无需跨平台拼接数据,直接提供多组学关联的基础框架,大幅降低了单细胞多组学研究的技术门槛。
使用方法与功能展示
scCancerExplorer 的操作简洁直观,研究者无需复杂编程,通过网页即可完成从基础查询到深度分析的全流程:
基因与细胞特征查询:输入目标基因,可查看其在不同癌症、不同细胞亚群中的表达模式;同时提供标准化的细胞类型注释,支持查询特定癌症中各细胞类型的比例、标记基因及功能特征。
多组学关联分析:内置工具支持解析表观遗传调控与癌症的关联(如 m6A 修饰对基因表达的影响),还能联动转录组与染色质可及性数据,挖掘 “基因表达 - 表观调控” 的潜在规律,极大简化了跨组学分析的繁琐流程,让科研效率大幅提升。其 TCGA 生存分析模块支持用户对 TCGA 33 种癌症类型进行生存分析,并且不仅可以根据基因表达水平对患者分组,还可以联合突变状态和肿瘤分期对患者进行分组比较。启动子区 DNA 甲基化模块可在线比较 TCGA 正常组织和肿瘤中基因启动子区域的 DNA 甲基化水平,覆盖 33 种癌症类型。
scCancerExplorer的设计以基因为中心,访问者需要以目标基因为起点进行检索,而不能获得一个具有概括性的归纳总结,比如直接获得细胞比例之间的差异信息等。

SCAR:Single-cell and Spatially-resolved CancerResources
数据涵盖与特色
SCAR 是首个将单细胞数据和空间转录组数据相结合的癌症数据库,在数据覆盖面上极具优势。其目前已包含 395 种癌症亚型的信息,涉及 21 个器官的空间转录组数据以及 34 种单细胞组学技术产出的数据,数据来源广泛,包括多种组织、类器官和细胞系等。如此庞大而多元的数据集合,为从不同角度、不同层面深入研究癌症提供了丰富素材。

可视化与分析工具
该数据库有着优秀的可视化界面,用户通过选取癌症的部位和亚型,就能快速定位到相关的癌症数据,操作简便直观,几乎不需要任何教程即可上手使用。此外,数据库内部还提供了一系列实用小工具,可用于肿瘤细胞类型分类、生物标志物选择、生存曲线预测等分析工作。例如,SCAR_Survival 模块能够绘制 31 种癌症类型中每个测试基因的生存曲线,用户只需从表中选择相应的基因符号,就可按癌症类型分为八个系统类别进行查看。这些工具大大增强了用户对数据的挖掘和分析能力,为科研工作提供了诸多便利。
该数据库的侧重点在于数据的在线检索而不是在线作图,适合需要快速获得总结信息的老师。

CanCellVar

数据规模与类型
CanCellVar 是一个十分强大的单细胞数据库,目前涵盖 37 种癌症类型,涉及 461 个样本,共计2,754,531 个细胞的 scRNA - seq 原始数据。该数据库对数据进行了精细处理,重新注释了 5 种主要细胞类别的所有细胞,包括恶性细胞、免疫细胞、内皮细胞、上皮细胞和基质细胞。基于这些数据,在单细胞水平鉴定出了 2,896,201 个变异,其中包含 1,429,113 个单核苷酸变异(SNV)和 1,436,356 个 A>G RNA 编辑,构建起了泛癌变异图谱,为研究癌症相关变异提供了丰富的数据基础。
功能优势
在功能方面,CanCellVar 表现出色。除了常规的查找功能外,还提供细胞通讯、拟时序、表达干预、基因定位等总计八种实用功能。其可视化界面清晰简洁,结果展示直观,用户能够轻松查看各类分析结果。同时,该数据库还提供了基本的注释信息以及变体的细胞和分子功能属性和临床相关性,如肿瘤分级、治疗、转移等。研究者利用这些功能,可以深入探究肿瘤微环境中单细胞变异的特征、机制及其与临床的关联,挖掘出潜在的癌症诊断、治疗靶点及预后标志物。
该数据库功能十分强大,能满足单细胞的几乎所有基础分析,是癌症单细胞分析的重要在线工具!

TISCH2

数据收录情况
TISCH2 是一个以 “大规模数据整合” 为核心优势的肿瘤单细胞数据库,目前收录了 190 个数据集,涉及 6,297,320 个细胞,数据来源涵盖多项高质量研究,覆盖多种癌症类型,具有极高的权威性和代表性。通过对这些数据的系统整合,该数据库为肿瘤研究提供了全面的单细胞水平信息资源,满足不同研究者对特定癌种、特定细胞亚群数据的查询需求。
检索功能特色
TISCH2 的核心优势在于其“高效检索体系”。科研者可以通过身体部位、癌症类型、细胞亚群等多维度快速定位到相关数据,极大地提升了数据查找的效率,为科研工作者节省了大量时间。该数据库凭借数据的权威性和整合性,成为科研人员下载高质量单细胞数据的重要来源 —— 研究者可将下载的数据结合自身分析工具,开展个性化的深度研究,助力肿瘤微环境、细胞异质性等领域的探索。
该数据库查找数据十分的轻松,和SCAR一样,提供的都是静态数据,给研究者一个数据集的大致印象,提供对细胞的简单分群和注释,更多的就要靠自己下载数据来进行分析了。
该数据库比起在线分析,其优势还是在于高效检索,更适合需要快速下载数据的老师们使用。

希望这篇公众号能够帮助到各位老师哦!如果觉得有用的话,点一个收藏吧!未来,本系列还将陆续推出其他疾病或组织类型的单细胞数据库精选,敬请期待。祝各位老师能够顺利科研,文章多多!
微生信助力高分文章,用户320000+,谷歌学术7100+