生信算法||新算法,soScope结合多模态数据进行空间分辨率增强

空间转录组结合多模态数据进行空间数据分析正在成为热点,包括昨天刚介绍的METI和今天的文章。

近日,《Nature Communications》又发表了一篇关于空间转录组分辨率增强的创新性的算法soScope(spatial omics scope),结合了多模态数据来增强不同分子类别的组学剖面。以往的方法主要增强单一组织模态的组学剖面,例如空间位置(BayesSpace)或者图像(XFuse和iStar),忽视了大多数空间平台可用的丰富的多模态组织信息,此外,这些方法主要针对转录组学数据,其统计假设不适用于其他空间组学类别。那么soScope有哪些特点呢?

image.png

文章信息:

  • 杂志,Nature Communications,IF 14.7
  • 标题:Tissue characterization at an enhanced resolution across spatial omics platforms with deep generative model

摘要

近期空间组学领域的进展已经将分析的分子类别扩展到转录组学之外。然而,许多这些技术受到空间分辨率的限制,阻碍了我们深入表征复杂组织结构的能力。现有的计算方法主要关注转录组数据的分辨率增强,缺乏适应性来解决新兴的空间组学技术。文章介绍了soScope,这是一个统一的生成框架,旨在提高从多种空间技术获得的分子剖面数据的质量和空间分辨率。soScope通过分布先验,结合组学、空间关系和图像的多模态组织信息,并联合推断具有组学特异性建模的增强分辨率的组学剖面。通过在多种空间组学平台上进行全面评估,包括Visium、Xenium、spatial-CUT&Tag和slide-DNA/RNA-seq,soScope提高了识别生物学意义重大的肠道和肾脏结构的性能,揭示了原始分辨率下无法解析的胚胎心脏结构,并纠正了由测序和样本处理引起的样本和技术偏差。此外,soScope扩展到空间多组学技术空间-CITE-seq和空间ATAC-RNA-seq,利用跨组学参考同时增强多组学。soScope提供了一个多功能工具,以提高不断扩展的空间组学技术和资源的利用。

创新点

soScope 同时考虑了分子剖面、空间近邻、H&E图像用于空间分辨率增强,而且适用于非常多的空间技术平台,以及多组学数据。

问题导读

  • 空间多模态数据有哪些?
  • 如何评估分辨率增强的效果?

算法概述

soScope 是一个统一的生成模型,它整合了来自多种空间组学平台的分子剖面(X)、空间邻接关系(A)和形态图像特征(Y),旨在将每个spot分割成多个subspot(bX)(图1a、b)。该模型包括三个步骤(图1c):(1)spot-level特征学习;(2)subspot-level图像特征学习:与subspot区域对应的图像块从高分辨率组织图像中分割出来,并转化为subspot的形态特征;(3)subspot-level组学剖面推断。soScope有效地生成了数据噪声减少和空间分辨率增强的组学剖面,以更精细地表征组织结构。

image 1.png

主要结果

soScope outperforms enhancement approaches developed for spatial transcriptomics

现有的提高空间组学分辨率的计算方法主要关注转录组学。因此,文章最初在由多种平台生成的空间转录组学(ST)数据集上评估了soScope。将soScope与三种已建立的方法进行了比较:iStar和XFuse,它们利用图像信息来增强转录剖面,以及BayesSpace,它使用空间坐标来推断高分辨率表达数据。此外,还包括了一个只使用图像输入的soScope变体,称为图像soScope,作为参考。由于没有高分辨率的真实数据用于评估,文章提出了通过合并邻近斑点的转录数据来模拟“低分辨率”表达剖面。然后,文章通过将恢复的表达与原始剖面进行比较,评估了分辨率增强方法的性能(图2a)。

首先,考虑了一个使用Visium平台生成的人类肠道数据集,包含2,649个spot,以及高分辨率的苏木精和伊红(H&E)染色图像。肠道样本中的层状结构使其成为展示分辨率增强益处的一个很好的例子(图2b,H&E图像放大区域)。按照基准设计,将2,649个斑点合并为369个“低分辨率”斑点,这些斑点聚合了相应邻近斑点的基因表达。所有方法都使用了相同的处理过的组学数据作为输入。对于soScope,图像特征是从预训练的Inception-v3模型在对应子斑点区域的H&E图像块中获得的,并且在增强基因表达的生成建模中使用了负二项(NB)分布。文章检查了肠道组织中的三个功能区域:上皮层、肌层和免疫区域,并选择了9个在先前研究中报告的区域marker用于分辨率增强评估。与原始表达相比,区域“合并”剖面大大降低了基因marker的层状空间模式(图2c,第二列)。从增强分析(图2c和补充图2b)来看,仅使用图像信息的iStar在免疫区域表现良好;然而,它未能恢复上皮层和肌层区域的精细结构。另一种基于图像的方法,XFuse,在肌层区域表现良好;然而,它被区域间强烈的形态相似性所误导,并没有很好地保留上皮层和免疫区域的组织结构。仅依赖空间信息的BayesSpace在增强剖面中并没有显著细化区域边界。图像soScope由于缺乏转录组学的信息,未能恢复大多数模式。相比之下,soScope在所有三个区域都取得了合理的性能。通过使用皮尔逊相关性和均方误差(MSE)对增强表达进行定量评估,soScope始终展现出最高一致性和最低重建误差(图2d)。接下来,我们使用Kolmogorov–Smirnov(KS)距离检查了每个marker基因在其相应组织区域内外表达分布的差异。soScope和iStar为大多数测试基因产生了最明显的分离(图2e),并实现了与原始剖面(红色虚线)类似的可区分性

image 2.png

其次,文章评估了来自Xenium平台的小鼠头部数据集。所有379个测量基因都包括在分析中,我们将2,619个斑点合并为291个“低分辨率”斑点,以进行分辨率增强分析。相应的H&E图像区域被转换为深度特征,如前所述,以帮助增强。从增强结果(图2f、g和补充图3b)来看,观察到iStar和soScope在保留高分辨率表达剖面方面都表现良好。然而,通过检查基于它们的变化性(图2h)或丰度的基因,我们发现soScope在不同变化中表现出更稳定的性能。此外,调查了分辨率增强是否会影响基因相关性。发现大多数方法在分辨率增强后都能保持基因间的相关性模式,除了XFuse(图2i),无论生物学变异性差异如何。值得注意的是,soScope通过MSE或皮尔逊相关性展示了最高性能(补充图3d)。

image 3.png

第三,文章评估了soScope在增强单细胞分辨率方面的能力。使用了Xenium分析的小鼠肾脏数据集(图2j),涵盖了1538个细胞。将组织划分为小正方形区域,并聚合了每个区域内细胞的基因表达,目的是恢复它们的细胞表达。在分析中,使用了原始研究中鉴定的前5个丰度最高的和前5个标记基因以及每个单细胞的深度特征。从结果来看,观察到iStar倾向于高估高细胞密度和高表达区域的表达水平(图2k和补充图3e)。相反,soScope展示了与真实情况更一致的表达模式(图2l)。

image 4.png

这些发现证明了soScope在提高不同技术平台、分辨率要求和基因统计特征的转录数据空间分辨率方面的能力,从而能够详细地表征组织结构。

soScope achieves consistent performance in tissue structure recovery from extremely low-resolution profiles simulated from slide-DNA/RNA-seq data

在先前的实验中展示了 soScope 在具有固定分辨率增强比例的空间组学数据集上的性能。然而,不同的空间组学技术具有不同的空间分辨率,这一点很重要。例如,在最初的空间转录组学技术中,每个测序斑点可能覆盖约 10-200 个细胞,而在较新的 Visium 平台上,一个斑点包括 6-10 个细胞。这些原始数据的变化要求分辨率增强方法能够在不同空间分辨率下对组织进行稳健的剖面恢复。在这里,文章设计了一个多尺度压力测试,以评估和校准不同方法在增强不同原始分辨率的组学数据时的性能。

为了进行多尺度测试,使用了 slide-seq 技术对小鼠肝脏肿瘤组织进行剖面分析的数据集,该技术使用带条码的磁珠在组织中编码空间信息,实现了接近单细胞分辨率的空间测序。slide-seq 原始数据的高分辨率允许我们以不同尺度生成低分辨率数据,并测试从这些数据中恢复原始剖面的能力。该肝脏肿瘤组织包括两个转移克隆区域,并使用 slide-DNA-seq 和 slide-RNA-seq 进行了剖面分析,包括 24,679 个 DNA 磁珠和 31,286 个 RNA 磁珠(图 4a)。为了进行测试,将整个组织划分为 60×60 分辨率的小正方形区域,并逐渐合并不同大小的邻近区域,形成一个低分辨率斑点。使用所有测试方法,目标是从降低分辨率的数据中恢复原始剖面(图 4b)。

image 5.png

首先关注了 slide-DNA-seq 中前两个 DNA 主成分(PCs)的增强测试,如原始工作中所用(图 4a,右侧)。采用高斯分布来模拟 soScope 模型中的 DNA PCs。在原始数据中,DNA PC1 在克隆 A 区域(Clone-A PC)表现出高富集,而 PC2 富集在克隆 B 区域(Clone-B PC)。随着分辨率的降低,DNA 区域模式急剧恶化(图 4c,第一行)。在分辨率增强之后,发现仅考虑斑点之间空间关系的方法能够捕获对应于两个癌症克隆的正确区域;然而,这些方法倾向于过度平滑表达模式,特别是在从极低分辨率(10×10)的数据中恢复时。相比之下,基于图像或联合预测方法(Image linear, Image GP, Image MLP, 和 Joint MLP)更好地保留了局部表达模式。然而,正如原始出版物中提到的,由于组织处理,H&E 图像和 DNA 剖面之间存在轻微的空间坐标不匹配。这些方法被 H&E 数据所误导,并重建了与 H&E 图像定义的克隆区域更相似的高分辨率 DNA PCs(图 4a),而不是原始 DNA 数据(图 4c,左侧;与虚线区域轮廓比较)。相比之下,soScope 成功地保留了局部表达模式,同时准确地重建了原始克隆区域,即使是从极低分辨率的数据中也是如此。这突出了 soScope 能够使用生成框架整合空间和跨模态信息以实现稳健分辨率增强的重要性。

image 6.png

从定量评估(图 4d)来看,大多数方法随着分辨率的降低而准确性下降。soScope 在不同分辨率下始终显示出稳定的性能,准确性的下降相对较小。为了进一步验证重建的 DNA 特征是否能够反映组织结构,对增强剖面进行了 k-means 聚类。当将聚类数(k)设置为 3 时,所有方法都成功地识别了之前定义的三个区域(图 4e,顶部和补充图 7,左侧)。为了探索更详细的结构,将聚类数增加到 4,揭示了克隆 A 内部的一个亚区域,其 PC1 的表达极高(图 4e,底部)。在各种方法中,只有 soScope 和 Spatial GP 重建的 DNA PCs 能够一致地捕获所有降低分辨率下的这种亚结构(图 4e,底部和补充图 7,右侧)。除了 DNA 分析,我们还对使用 slide-RNA-seq 从同一组织获得的转录数据进行了压力测试。

image 7.png

其它章节

文章展示了soScope在其它组学上的表现,展示了除空间转录组外的其它应用。如soScope 能够降低测序噪声并在通过spatial-CUT&Tag分析的小鼠胚胎上揭示详细结构,soScope通过利用空间CITE -seq和空间ATAC-RNAseq数据的交叉组参考来纠正技术偏差。

应用前景

soScope 在多种分子类型和不同空间技术剖面的健康和疾病组织上展示出了 有效性和通用性,包括 Visium、Xenium、空间-CUT&Tag、slide-DNA-seq、slide-RNA-seq、空间-CITE-seq 和空间 ATAC-RNA-seq,在细化组织领域识别、提高已知marker的区分度以及校正数据和技术偏差方面表现很好,相比于当前只依赖单一模态的分辨率增强工具更值得尝试。

虽然 soScope 提供了预指定的subspot或细胞位置的增强剖面,但它可能无法达到亚细胞分辨率。通过修改 soScope,以纳入来自相同组织的配对单细胞组学数据,可以进一步提高分辨率。此外,soScope 将 H&E 图像作为输入,这些图像可以在某些临床研究中由专家轻松注释。通过修改 soScope,以纳入人工标签并以半监督的方式指导后验推断,可以改进潜在表征和剖面学习。这些扩展性可能增加soScope的应用场景。

一句话评价

多一种选择。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,524评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,869评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,813评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,210评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,085评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,117评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,533评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,219评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,487评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,582评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,362评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,218评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,589评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,899评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,176评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,503评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,707评论 2 335

推荐阅读更多精彩内容