Wang, C., Sun, D., Huang, X. et al. Integrative analyses of single-cell transcriptome and regulome using MAESTRO. Genome Biol 21, 198 (2020). https://doi.org/10.1186/s13059-020-02116-x
随着单细胞技术的发展,在同一个细胞内同时测量多种模态数据逐渐成为可能。我们知道在Seurat V4 提供了基于WNN的scRNA与scATAC的整合分析方法,其核心是两种模态数据会在高维空间有一定的相似性,整合之后可以用来识别不同细胞类型和状态的调节因子。
MAESTRO提供预处理、比对、质量控制、定量和染色质可及性量化、聚类、差异分析和注释等功能。通过在单细胞水平上从染色质可及性解释基因调控潜力,MAESTRO在整合scRNA-seq和scATAC-seq之间的细胞簇方面优于现有的方法。此外,MAESTRO支持使用预定义的细胞类型标记基因进行自动细胞类型注释,并从不同的scRNA-seq基因和scATAC-seq峰中识别驱动调节因子。
为了整合来自scRNA-seq和scATAC-seq的细胞,MAESTRO首先计算每个细胞中每个基因的调控潜力,从而测量基因附近的scATAC-seq reads量,以基因TSS读取距离的指数衰减为加权。然后,MAESTRO执行典型相关分析(CCA),CCA捕获两个数据集之间的共同方差,并将其投影到相同的低维空间中,本质上是将两个数据平台视为来自同一平台的两批数据。一对细胞,一个来自scRNA-seq,另一个来自scATAC-seq,可以在降维后使用相互最近邻进行锚定。然后,MAESTRO使用锚定的细胞对将细胞类型标签从scRNA-seq转移到scATAC-seq。可以在整合后大致保留原有的聚类结构,允许在scRNA-seq和scATAC-seq聚类之间匹配细胞类型标签。
MAESTRO和Seurat在思想上还是有些相似的。