基于图链嵌入的多组学单细胞数据集成与调控推理
尽管出现了同时测量单细胞多种组学模式的实验方法,但大多数单细胞数据集只包括一种模式。综合来自多种方式的组学数据的一个主要障碍是,不同的组学层通常具有不同的特征空间。在这里,我们提出了一个名为 GLUE (图形链接的统一嵌入)的计算框架,它通过显式地建模组学层之间的监管交互来弥补这一差距。系统性基准测试表明,GLUE 对于异构的单单元多组学数据比最先进的工具更准确、更健壮和更可伸缩。我们将 GLUE 应用于各种具有挑战性的任务,包括三组学整合、整合调控推理和数百万细胞的多组学人类细胞图谱构建,GLUE 能够纠正以前的注释。GLUE 采用了模块化设计,可以灵活地扩展和增强以适应新的分析任务。完整的软件包可以在 https://github.com/gao-lab/glue 网站上找到。
单细胞测序技术的最新进展使得通过多组学层次探索调控图谱成为可能,如染色质可达性(单细胞 atac-seq 测序(scATAC-seq)1,2)、 DNA 甲基化(snmC-seq3,sci-MET4)和转录组(scRNA-seq5,6) ,为揭示不同细胞类型功能的基础调控基础提供了一个独特的机会。虽然最近出现了同时测定8、9、10、11,但不同的组学通常是独立测定的,并产生不成对的数据,这要求在多组学整合中有效和高效。
Integrative spatial analysis of cell morphologies and transcriptional states with MUSE
空间转录组学能够同时测量组织中相同细胞或区域的形态特征和转录情况。在这里,我们提出了多模态结构化嵌入(缪斯) ,一种通过整合形态学和空间分辨的转录数据来表征细胞和组织区域的方法。我们证明,缪斯可以发现组织亚群遗漏任何形态以及补偿形态特异性噪声。我们将 MUSE 应用于包含空间转录组学(seqFISH + 、 STARmap 或 Visium)和成像(苏木精和曙红或荧光显微镜)模式的不同数据集。鉴定了健康大脑皮层和肠道组织中具有生物学意义的组织亚群和刻板的空间模式。在患病组织中,MUSE 揭示了与肿瘤区域接近的基因生物标志物,以及整个阿尔茨海默病脑区淀粉样前体蛋白加工的异质性。MUSE 使多模态数据的集成,提供了对复杂生物组织中细胞的状态、功能和组织的深入了解。