空转工具比较----Benchmarking spatial

测试单转+空转联合分析工具的文章

  • Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution
  • 2022年6月发表于nature method
背景:
  • 原位杂交,荧光显微镜(图像基础)
    1. 优点:高分辨率、高精确性,
    2. 缺点:低通量
    3. 方法:seqFISH, osmFISH, MERFISH
  • 高通量测序
    1. 优点:高通量、
    2. 缺点低分辨率
    3. 方法:ST, 10X Visium, and Slide-seq
  • 综上所述,需要能够同时具有高通量、高分辨率的工具,所以出现了单转+空转联合分析的各种工具。本文通过45组真实数据和32组模拟数据来测试16个工具。
工具简介
  • gimVI 深度生成模型

  • SpaGE K邻近回归

  • Tangram 非凸优化、深度学习框架

  • seuart 典型关联分析,把单细胞数据映射到空转的spot里面

  • LIGER 非负矩阵分解、shared factor neighborhood graphs (共享因子邻接图)

  • novoSpaRc and SpaOTsc 最优运输,基于单转数据建立空间矩阵

  • stPlus 自编码、加权K邻近算法

  • Seurat, Tangram, novoSpaRc和SpaOTsc 可以把单转数据分配到组织切片位置中

  • Cell2location 评估每个spot的细胞类型丰度

  • RCTD 通过单转的细胞类型文件和监督学习来分解细胞混杂物

  • SpatialDWLS 加权最小二乘

  • Stereoscope 基于模型的概率方法和单转数据,反卷积细胞混杂物

  • SPOTlight 非负矩阵分解,反卷积spot

  • DSTG 图卷积神经网络,反卷积空转数据

  • STRIDE 由单转数据训练的文件,分解细胞混杂物

  • DestVI 变分推理、隐变量模型,描述细胞类型比例

评分标准
  1. 精确度评分
  2. 稳健性
  3. 计算机资源消耗
测试的数据
  • 45组数据(单转+空转)
  • 32组模拟数据,低分辨率,和10X Visium或ST相似。


    image.png
工具作用
  1. Tangram, gimVI, SpaGE, Seurat, SpaOTsc, novoSpaRc,LIGER,stPlus 预测RNA转录本的空间分布

  2. Tangram, Seurat, SpaOTsc, novoSpaRc 把单转数据对应到空转的位置中

  3. Cell2location, SpatialDWLS, RCTD, Stereoscope, DestVI, STRIDE, SPOTlight, and DSTG 结合单转和空转,预测spot的细胞组成

  • 2 和3的12种方法可以对spot中的细胞类型进行反卷积
预测RNA转录本空间分布的方法
  • 十折交叉验证,预测的基因表达量和真实的表达量之间的皮尔逊相关系数(PCC),PCC越高,则工具表现越好。

  • 首先验证已发表的标记基因的空转结果,例如Igsf21、Rprm 在皮层L5/L6中高表达。

  • 选取dataset 4 (seqFISH+; Smart-seq; mouse cortex),
    Igsf21

    1. Tangram PCC=0.79
    2. gimVI PCC=0.77
    3. SpaGE PCC=0.71
    4. Seurat PCC=0.70


      image.png

    Rprm

    1. SpaGE 0.79
    2. Seurat 0.79
    3. SpaOTsc, gimVI, Tangram, and LIGER (PCC=0.78, 0.71, 0.66, 0.65)


      image.png
  • dataset 42 (ST; 10X Chromium; human squamous carcinoma).
    COL17A1是鳞状癌基底细胞的标记基因

    1. PCC 0.86 (Tangram), 0.84 (gimVI), 0.76 (novoSpaRc), and 0.70 (SpaGE),PCC值明显高于另外四个工具

为了进一步量化预测精度

  1. SSIM(它结合了平均值、方差和协方差来衡量预测结果与实际情况之间的相似性)
  2. RMSE(真实值和预测分布的绝对误差)
  3. JS(相对信息熵衡量两个分布之间的差异)
  • 对于一个基因,PCC/SSIM 越大;RMSE/JS越低,则预测精度越高,综合上述四种指标,用AS来评价精确性评分

  • 对于data4,Tangram、gimVI AS分数最高,高于其他工具

  • 对于45组数据 + 32组模拟数据,Tangram仍然是表现最好的集成方法,其次是gimVI和SpaGE


  • 10X Visium, seqFISH, MERFISH, and Slide-seq 四种平台的数据
    Tangram、gimVI,SpaGE优于其他方法
    Tangram和gimVI 对于Slide-seq 数据集的处理优于其他方法

归一化对性能的影响

  • Seurat, LIGER, SpaGE, stPlus 默认归一化数据
  • 原始空转数据R、原始单转数据R、归一化空转数据N、归一化单转数据N
    1. 四种组合中,对于各种工具R-R的组合有更高的PCC值
    2. 无论是哪种组合,Tangram 都比其他工具强

稀疏矩阵的影响

  • 对于数据集12、13、40和44,所有8种集成方法在预测转录本空间分布方面的准确性都很低(即平均PCC/SSIM<0.3)

  • 8种方法的JS值都随着表达矩阵稀疏度的增大呈线性增加

  • 为了评估稀疏矩阵的影响,用marker gene : Cplx1 在皮层L5中高表达

  • Tangram,gimVI,SpaGE PCC>0.7 表现很好

稳健性

  • 稳健性得分:PCC阈值0.5的原始数据和下采样数据的转录本比例
  • RS值随着下采样率的增加而降低,Tangram和gimVI,SpaGE表现优于其他工具
反卷积的测试
  • 为了确定空转中spot的细胞类型占比,模拟了数据集
    RCTD and Stereoscope (0.87), Tangram (0.85)

  • spot中细胞类型组成,RCTD AS score (0.94) Stereoscope (0.92).

  • dataset 4 (seqFISH+; Smart-seq; mouse cortex)

    1. SpatialDWLS, Tangram, RCTD 位居第一、第二、第三
  • 为了进一步量化12个工具在模拟数据集中的性能(novoSpaRc and SpaOTsc 需要空间位置信息,但是模拟数据中没有,所以排除他俩)剩下10个工具

  • Cell2location, SpatialDWLS, RCTD, STRIDE 表现最佳, spot中的细胞类型组成

计算机资源消耗

  • gimVI and Tangram 支持显卡,但是对于data40 19,522 spots and 26,252 cells ,NVIDIA Tesla K80 with 12 GB 内存不够报错

  • Seurat和LIGER处理每个数据集的CPU时间不到10分钟,而Tangram和LIGER 总共占用了不到32gb的内存

  • 总的来说Seurat的计算效率最高

用下面的数据测试

  • number of cells in scRNA-seq data, the number of spots in spatial data, and the number of cell types
  • Tangram and Seurat是效率最高的两个
综上所述
  • Tangram, gimVI, and SpaGE 在转录本的空间分布中表现优秀
  • Cell2location, SpatialDWLS, RCTD 在spots的细胞类型组成中表现优秀
  • Tangram 、Seurat 对于计算机资源消耗相对较少
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,752评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,100评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,244评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,099评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,210评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,307评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,346评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,133评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,546评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,849评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,019评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,702评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,331评论 3 319
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,030评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,260评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,871评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,898评论 2 351

推荐阅读更多精彩内容