2020年被Nature Methods评为年度技术的空间转录组,时至今日,陪伴我们科研人员已经快2年了,在这期间,涌现了很多别具一格的分析角度,不断刷新着我们对组织空间理解。对于生物学组织而言,细胞空间位置分布的重要性不言而喻,对于细胞空间分布的研究,也是我们研究发育、疾病等等生物学问题最为重要的课题之一,其中最为关键的是,对于空间位置信息的认知,如何深入挖掘空间上的生物学内容,逐渐成为我们倚重的分析点。
目前对空间转录组位置信息的分析严重不足,典型如Seurat,更多的基于每个spot的基因表达信息进行降维聚类等下游分析,几乎完全缺乏对空间信息的处理;也包括一些寻找空间高变基因的软件如SpatialDE、SPARK等,也仅仅是简单利用空间位置寻找基因在空间上的区域变化,完全无法满足科研人员对于组织有序性和不同细胞类型在空间位置上“协作”的研究;尤其对于细胞在空间上聚集的原因与作用,细胞在不同层面的“等级”变化等等,都在不断强调对空间位置信息的挖掘。前人栽树,后人乘凉,就让我们带着对空间位置信息的分析角度,目睹其带给我们的生物学认知。
分析点1、CCI
空间转录组学技术和空间注释的scRNA-seq数据集为分析细胞间通讯 (CCC) 提供了前所未有的机会。然而,整合CCC重建所需的空间信息和复杂的生化过程仍然是一个重大挑战。近日《Nature Methods 》发表了一种处理复杂分子相互作用和空间约束的最优运输方法:COMMOT,推断空间转录组学中的CCC。
COMMOT(最佳传输的通讯分析)通过同时考虑空间转录组学数据或空间注释scRNA-seq数据的大量配体-受体对来推断CCC,这些数据配备了根据成对空间成像数据估计的细胞之间的空间距离;总结和比较空间信号的方向;使用树模型识别CCC对基因表达的下游影响;并为各种分析提供可视化工具。
COMMOT概述
COMMOT具有三个重要特征:首先,使用非概率质量分布来控制运输计划的边缘,以保持物种之间的可比性;第二,对CCC实施空间距离约束,以避免连接空间上相距较远的部分;最后,将多物种分布(配体)传输到多物种分布(受体)以解释多物种相互作用。
分析点2、空间位置上的细胞“网络”
什么是细胞“网络”?细胞在空间位置上不是随机出现的,细胞在空间上的定位受到了周围环境以及自身状态的影响,而这种影响的结果,就是每种细胞类型在空间上形成了具有区域偏好性的细胞“网络”,在文章Spatial mapping reveals human adipocyte subpopulations with distinct sensitivities to insulin中,为了系统的确定白色脂肪组织(WAT)的细胞区域“网络”,计算了每种细胞类别中的空间位置彼此相邻的倾向,这里我们称之为同型细胞“网络”。文章的分析结果表明,所有免疫细胞、脂肪细胞祖细胞和血管细胞以及成熟脂肪细胞的同型细胞“网络”中都表现出很大的跨度,一些细胞类型几乎横跨整合组织区域,如图:
同型细胞“网络”是为了确定单一细胞类型在空间上的分布特点,但为了确定不同细胞类别之间的空间关系,作者利用软件STUtility来执行成对的异型邻域分析,我们称之为异型细胞“网络”,用来衡量不同细胞类型之间的空间临近关系。如图:
作者的研究发现,代表较大血管结构的Spot在血管样组织学特征上彼此靠近;并且发现特定祖细胞位于巨噬细胞附近并形成用于组织修复和重塑的脂肪生成生态位。
分析点3、探索细胞“单元”
什么是细胞“单元”?一个细胞“单元”的组成包括目标细胞类型和围绕在其周围的细胞类型,这几种细胞类型关系密切,相互合作行使一种重要的生物学功能,也就是说,细胞“单元”指行使某项特殊的生物学功能的细胞“团队”,在文章Identification of HSC/MPP expansion units in fetal liver by single-cell spatiotemporal transcriptomics中,作者在研究细胞共定位的时候发现,多能祖细胞的周围显著富集巨噬细胞和内皮细胞,如图:
文章通过分析空间位置的临近细胞通讯,证明了多能祖细胞和周围富集的细胞类型之间形成频繁的“互动”,鉴于多能祖细胞点间的特征在于细胞之间的空间接近性和丰富的交互信号,由此将多能祖细胞与周围显著富集的细胞类型定义为细胞“单元”,其中多能祖细胞位于点的核心并与周围的生态位细胞细胞类相互作用,支持并促进了多能祖细胞的扩增。
分析点4、CNV事件的空间图谱
我们在研究肿瘤样本的单细胞数据,CNV分析是必不可少的一环,基因表达现在广泛运用于推断单细胞中的 CNV,识别染色体 (chr) gain和loss的区域。但是对于研究而言,仅仅知道发生的CNV事件远远无法满足我们对肿瘤组织的认知,肿瘤内部空间异质性的信息随着组织解离也无法重现,所以,文章The spatial landscape of clonal somatic mutations in benign and malignant tissue通过特有的计算方法--iCNV分析空间转录组数据,构建CNV事件的空间图谱,如图:
空间CNV的图谱,主要基于一下考虑:(1)基因组不稳定性如何在组织学上的良性组织中出现,这可能代表癌症进化的早期事件;(2)CNV事件和频率的空间分布;(3)空间CNV事件的分布与活性,组织区域的CNV事件分布与活性差异很大,CNV事件的空间图谱有利于我们对疾病的认知和诊断,甚至治疗。空间 iCNV 分析可以提供基因组完整性的CNV图谱,确定某些具有增加 iCNV 活性的区域,文中的分析结果发现大部分组织区域的随即拷贝数(stochastic copy number,CN)是中性的,这表明 iCNV 可以识别感兴趣的组织区域,尤其是肿瘤趋向恶性组织区域,弥补形态学和表达分析上的分析不足。
分析点5、空间轨迹向量场
下图告诉我们的是随着组织部位的不同,基因的演化关系,这跟发育其实完全没关系,但是我又回头翻看了一下最基础的概念,对轨迹的定义,一个点在空间移动,它所通过的全部路径叫做这个点的轨迹。那么我们在分析单细胞的时候,细胞就假设为时间上的动点,随着时间的发生,细胞的发育方向和演化,我们先入为主地将这样的概念套用到了空间,难道空间轨迹回归到最开始的地方,是为了告诉我们组织不同部位的基因转变
分析点6、空间高变基因
空间转录组研究中的一项关键任务是识别跨空间位置具有不同空间表达模式的空间变异基因(SVG)。识别SVG为系统分析特定位置的细胞状态、推断细胞间的通讯以及确定生物体中重要的表型和功能提供了机会。
分析点7、空间轨迹基因
identified genes specifically upregulated in each region based on their dynamic expression patterns.对于空间轨迹基因的变化,高度特异的区域基因在调节生态位program起到至关重要的作用。
说了这么多,其实都还是空间转录组技术带给我们的冰山一角,对于空间信息和转录组信息的挖掘远没有停止,随着研究的不断深入,相信一定会有更多、更加一阵见血的分析角度来加快对生物学问题的认知,更加有效的手段解决我们的生物学问题。
2023年补全单细胞空间分析全系列课程已经进行了好几节课了,这次打算在5月12号晚上7点开始直播课,空间数据分析之空间注释篇,主要讲空间注释细胞的方式和原理,如果有兴趣,欢迎来参加。
生活很好,有你更好