之前小编已经分享过很多空间转录组的分析工具(👉 都可以在空间组专辑里找到哟)。为了方便大家查找,小编将空间转录组常用的去卷积工具和聚类工具做了汇总!
# 去卷积工具合辑 #
空间分辨转录组学实验分析的关键步骤之一是确定细胞类型。细胞类型去卷积,是用于估计混合物(数据点)中每种细胞类型的比例以及每个细胞的基因表达水平(在同一数据点内)的算法。
SPOTlight
SPOTlight能够将空间转录组与scRNA-seq数据集成,从而推断复杂组织中细胞类型和状态的位置。其基于一个种子的非负矩阵因子分解回归(Seeded NMF regression ),使用细胞类型标记基因和非负最小二乘(NNLS)初始化,随后去卷积空间转录组数据捕获位置(spot)。
性能评估:通过模拟不同的参考数量和质量数据证实SPOTlight在低深度测序或小规模的scRNA-seq参考数据集中也具有较高的预测精度;小鼠大脑的SPOTlight去卷积正确地映射了皮质层的细微神经元细胞状态和海马的特定结构;作为概念验证,开发团队将SPOTlight应用于胰腺癌(PDAC)数据,并确定了肿瘤微环境中临床相关的免疫细胞状态的空间组织。
工具获取:
https://github.com/MarcElosua/SPOTlight
SpatialDWLS
SpatialDWLS可以概括为两个步骤,第一个步骤使用细胞类型富集分析方法来确定哪些类型的细胞在每个位置具有较高的概率,第二个步骤使用阻尼加权最小二乘法(DWLS)的扩展来确定指定位置的细胞类型的精确组成。与现有的去卷积方法相比,关键区别在于SpatialDWLS包含额外的过滤步骤,以去除不相关的细胞类型,从而增强特异性。
性能评估:对一个模拟的空间转录组学数据集进行评估时,SpatialDWLS在具有较低的均方根误差(RMSE)和计算时间方面优于RCTD和stereoscope;开发团队应用SpatialDWLS分析了10X Genomics Visium数据集,该数据集映射了小鼠大脑中的空间转录组谱;此外,SpatialDWLS还被应用于确定在整个胚胎心脏发育过程中细胞类型组织在空间和时间上的变化。
工具获取:在Giotto中可以轻松访问SpatialDWLS方法,这是一个用户友好的软件包,包含大量用于空间转录组数据分析和可视化的计算工具。
https://github.com/RubD/Giotto
RCTD
RCTD利用注释的scRNA-Seq数据创建数据中预期细胞群的细胞类型概况,然后使用监督学习方法用细胞类型标记空间转录组pixels。由于这一分析的主要障碍之一是目前的空间转录组学数据集可能在一个pixel内包含多种细胞类型,RCTD还可以拟合一个统计模型,以确定一个pixel内存在的多种细胞类型,并将scRNA-Seq和SRT数据集之间的平台效应归一化。使用这种方法,RCTD能够跨平台对细胞进行分类,准确率接近90%。与其他监督学习方法一样,使用该工具可以检测的细胞类型受限于参考数据集的准确和完整注释。
性能评估:RCTD可以准确地发现模拟和真实空间转录组数据中细胞类型的定位。此外,RCTD还可以检测细微的转录组差异,从而在空间上映射细胞亚型。最后,开发团队使用RCTD计算预期的细胞类型特异性基因表达,从而能够根据细胞的空间环境检测基因表达的变化。
工具获取:
https://github.com/dmcable/RCTD
DSTG
DSTG是一种新的基于图形的人工智能方法,其通过基于图形的卷积网络对空间转录组数据(ST)进行去卷积,可利用scRNA-seq数据揭示ST数据中的细胞混合物。首先,DSTG从scRNA-seq数据构建合成pseudo-ST数据。DSTG使用共享邻近算法学习pseudo-ST数据和real-ST数据的spot映射链接图,链接图捕获spot之间的内在拓扑相似性,并将pseudo-ST和real-ST数据合并到同一个图中进行学习。然后,基于链接图,使用半监督图卷积网络(GCN)学习局部图结构和基因表达模式的潜在表示,以解释spot的各种细胞组成。
性能评估:DSTG不仅在不同技术生成的合成空间数据上表现出优异的性能,而且还有效地识别了小鼠皮层、海马切片和胰腺肿瘤组织中细胞的空间组成:通过对从外周血单核细胞(PBMC)和其他组织生成的合成数据进行基准评估,DSTG在预测的细胞混合和实际的细胞组成之间显示了良好的准确性;同时,DSTG在复杂组织(包括小鼠皮层、海马和人胰腺肿瘤切片)的ST数据上也显示出与H&E染色观察高度一致的结果。
工具获取:
https://github.com/Su-informatics-lab/DSTG
stereoscope
stereoscope首先使用单细胞数据来描述每个细胞类型的表达谱,然后在每个捕获位置内找到这些类型的组合,以最好地解释空间数据。该模型框架利用单细胞数据推断空间数据中每个捕获位置的每个细胞类型的比例估计,从而消除了对空间数据分析时对要素或簇等抽象实体的任何解释或注释的必要性。
性能评估:为了证明stereoscope的实用性,研究团队使用来自不同实验平台的数据,并对来自小鼠大脑和发育期心脏的细胞类型进行了空间映射,其排列方式与预期一致;为了说明stereoscope如何与其他空间技术结合使用,研究团队分析了海马和小脑的Slide-seq数据,这些数据成功地再现了该技术最初发表的结果;此外,研究团队设计了一个程序从真实的单细胞数据中收集类似于从空间技术获得的合成数据,将stereoscope与两种最近发表的方法(DWLS和deconvSeq)进行比较,结果证实stereoscope的实现优于其他两种方法。
工具获取:
https://github.com/almaan/stereoscope
此外,还有预印发表的工具:Cell2location,一个原则性和通用的贝叶斯模型,其集成了单细胞和空间转录组学,以全面的方式在原位绘制细胞类型;SpatialDecon,一种在空间分辨率的基因表达研究区域内,通过scRNA-seq定义的细胞群的量化算法。其获得的细胞丰度估计值是空间分辨的、颗粒状的,并与高度复用的基因表达数据相匹配...
首发公号:国家基因库大数据平台
参考文献
[1] Elosua-Bayes M, Nieto P, Mereu E, et al. SPOTlight: seeded NMF regression to deconvolute spatial transcriptomics spots with single-cell transcriptomes[J]. Nucleic acids research, 2021, 49(9): e50-e50.
[2] Dong R, Yuan G C. SpatialDWLS: accurate deconvolution of spatial transcriptomic data[J]. Genome biology, 2021, 22(1): 1-10.
[3] Cable D M, Murray E, Zou L S, et al. Robust decomposition of cell type mixtures in spatial transcriptomics[J]. Nature Biotechnology, 2021: 1-10.
[4] Song Q, Su J. DSTG: deconvoluting spatial transcriptomics data through graph-based artificial intelligence[J]. Briefings in Bioinformatics, 2021.
[5] Andersson A, Bergenstråhle J, Asp M, et al. Single-cell and spatial transcriptomics enables probabilistic inference of cell type topography[J]. Communications biology, 2020, 3(1): 1-8.
[6] Kleshchevnikov V, Shmatko A, Dann E, et al. Comprehensive mapping of tissue cell architecture via integrated single cell and spatial transcriptomics[J]. bioRxiv, 2020.
[7] Danaher P, Kim Y, Nelson B, et al. Advances in mixed cell deconvolution enable quantification of cell types in spatially-resolved gene expression data[J]. bioRxiv, 2020.
图片均来源于参考文献,如有侵权请联系删除。