近日,《Nature Communications》发表了一篇关于空间转录组肿瘤微环境研究的创新性的算法(形态增强型空间转录组分析集成器(METI)),非常值得学习。
目录
[TOC]
文章信息:
- 杂志,Nature Communications,IF 14.7
- 标题:METI: deep profiling of tumor ecosystems by integrating cell morphology and spatial transcriptomics
摘要
最新的空间转录组学(ST)技术在肿瘤微环境(TME)内的细胞相互作用方面提供了宝贵的见解。然而,大多数分析工具没有考虑组织学特征,依赖于匹配的单细胞RNA测序数据,这限制了它们在TME研究中的有效性。为了解决这个问题,文章介绍了形态增强型空间转录组分析集成器(METI),这是一个端到端的框架,用于映射癌细胞和TME组分,分层细胞类型和状态,并分析细胞共定位。通过整合空间转录组学、细胞形态学和经过筛选的基因签名,METI增强了我们对组织内分子景观和细胞相互作用的理解。文章在各种肿瘤组织生成的ST数据上评估了METI的性能,包括胃、肺和膀胱癌,以及癌前组织,还对METI与现有的聚类和细胞反卷积工具进行了定量比较,展示了METI的稳健性和一致性。
创新点
METI的创新之处在于其能够通过以知识驱动的方式将组织形态学与转录组表达谱坚固地整合,以补偿某一模态中的低质量数据。
问题导读
- 组织形态学数据指什么?文章是如何利用的?
- 如果有高质量的基因表达数据,METI还有必要用吗?
算法概述
METI以系统化、逐步的方式分析肿瘤微环境(TME),专注于细胞从正常到癌前再到恶性的演变过程,同时检查每个组织切片中的淋巴细胞。METI输入标准的空间转录组(ST)数据,包括spot-基因矩阵、相应组织切片的H&E图像,以及将每个spot的位置映射到图像上的X、Y坐标。METI的目标是在TME中精确识别各种细胞类型及其各自的状态。
METI的两个主要功能:
- 使用TESLA进行分辨率增强,基于细胞类型Meta基因的表达进行细胞类型富集区域鉴定。
- 基于图像进行细胞核分割,根据细胞类型的形态学特点进行细胞类型富集区域鉴定。
METI的工作流程分为五个模块:
- 正常和癌前细胞映射:利用特定的基因标记和形态学特征来识别和注释正常及癌前细胞,例如胃中的杯状细胞。
- 癌细胞域和异质性识别:通过癌症细胞标记来识别肿瘤区域,并进一步表征癌细胞状态的异质性,例如增殖性癌细胞和干细胞样癌细胞。
- T细胞映射和表型分析:识别T细胞富集区域及其不同状态,如CD4+ T细胞、CD8+ T细胞、调节性T细胞(Treg)和耗竭T细胞(Tex)。
- 其他免疫细胞的深入分析:检测肿瘤微环境中除了T细胞之外的其他免疫细胞类型,包括中性粒细胞、巨噬细胞、B细胞和浆细胞。
- 癌症相关成纤维细胞(CAFs)分析:分析肿瘤微环境中的基质细胞成分,包括CAFs及其亚型,如肌成纤维细胞(myCAFs)、炎症成纤维细胞(iCAFs)和抗原呈递成纤维细胞(apCAFs)。
主要结果
以文章结果第一章节为例说明整个算法的工作流程,文章其余部分结果相似。
章节标题:绘制正常细胞和癌前细胞
该部分主要内容为对胃腺癌(STAD)样本中goblet cell富集区域的鉴定。那为什么聚焦goblet cell细胞呢?首先在疾病背景下,肠道中杯状细胞的异常存在是被称为肠上皮化生的一种癌前状况的关键特征,对应了标题中提到的癌前细胞。其次,goblet cell在H&E染色图像中表现出独特的形态特征,形状像酒杯,顶部有淡色、几乎白色的囊泡,底部有椭圆形的细胞核。
关于goblet cell富集区域的鉴定分为两部分,第一部分基于基因表达,第二部分基于形态学特征。首先基于已发表达文献,整理goblet cell元基因signature(MS4A10, MGAM, CYP4F2, XPNPEP2, SLC5A9, SLC13A2, SLC28A1, MEP1A,ABCG2, ACE2)。使用TESLA进行分辨率增强,生成接近单细胞分辨率的表达矩阵,基于元基因的表达,利用METI进行区域注释。但是因为在切片中region4的UMI分布较低,导致本来存在goblet cell富集的区域没有被鉴定出来。
这时候,第二部分登场,METI基于H&E图像进行细胞核分割,利用K-means聚类首先识别不同的形态学成分,如背景、细胞核、纤维、腺体和坏死。然后通过颜色、形状、大小等过滤(元素的面积>40、固体度>0.5和长宽比<3的过滤器),METI识别到了region4区域的goblet cell。
通过整合基因表达和图像分析的结果,METI成功地识别了所有四个富含杯状细胞的区域,如图2g所示。这种综合方法用于杯状细胞的检测,克服了UMI计数低所带来的限制,为分析样本中的杯状细胞提供了更为准确的特征描述。
其它章节:
文章依据基因的表达对癌细胞区域进行注释,如EPCAM。此外,在生物组织内空间量化细胞的分布和密度对于多种应用至关重要,特别是在病理学和肿瘤学领域。文章通过核分割方法生成了癌细胞3D密度图。
文章其余部分提到的对细胞状态和异质性的分析,就只能依据marker基因表达进行了。比如对CD4 Treg和CD8 Tex亚型分布的鉴定,以及增生性癌细胞、干细胞样癌细胞的鉴定。
文章最后对METI算法针对低质量图片的鲁棒性进行了说明。相机聚焦失误导致的模糊不清掩盖了细胞边界,应用METI进行B细胞的注释。B细胞和其它淋巴细胞一样,可以通过它们在H&E图像中的小而深紫色的细胞核来区分。因此,使用METI的第一步是在H&E图像上识别淋巴细胞。图像的模糊导致了大量假阳性的淋巴细胞检测,这些细胞特别分散在组织边缘周围。METI的后续步骤是使用特定的基因标记,包括MS4A1和CD19,来识别B细胞。METI通过将B细胞数据与图像分析中识别的淋巴细胞区域叠加来进一步完善检测,证明了METI的鲁棒性。
应用前景
METI的框架内集成了一组预定义的细胞类型marker和模型参数,而且为更高级的用户提供灵活性。研究人员可以通过输入自己感兴趣的marker来定制METI,以适应正在研究的特定组织或疾病。
文章中提到的细胞类型,如杯状细胞、淋巴细胞、中性粒细胞、成纤维细胞可能属于在形态学上容易区分的类型,但是文章也没有给出针对每种细胞类型的形状、颜色、大小、面积等过滤器参数,可见这一部分的内容针对不同的样本存在非常大的调整空间,也昭示着实际分析过程中的不断调参调整的过程。
研究团队也指出了METI对转录组数据的依赖,这些数据可能容易受到技术波动、受限的样本质量、丢失事件以及对用户提供的基因签名的依赖,可能导致产生假阴性结果。此外,METI分割功能的性能可能会因所分析图像的质量和分辨率而异。
一句话评价
高端玩家的精细化之作。