空转分析代码备忘录：seurat可视化代码雕琢

作者：ahworld
链接：空转分析代码备忘录：seurat可视化代码雕琢
来源：微信公众号seqyuan
著作权归作者所有，任何形式的转载都请联系作者。

简介

目前常见的空间转录组数据技术平台有：

10X Visium
10X Visium CytAssist
stereo-seq

seurat软件以其简单易用性，通过特定的矩阵格式转换，能够兼容大多数平台的数据格式。为了发表文章，图片美化的需要，在做项目过程中经常用到一些优化的代码，在这里做个备忘。

1. 可视化图片保持空转切片长宽比

有时候我们做空转分析采用SpatialFeaturePlot或SpatialDimPlot画图，经常发现图片的长宽比例与原始切片相比有压缩或者拉伸，下面的代码能够帮助我们解决这个问题。

数据来源：华大sterero-seq公开数据
数据网址：http://116.6.21.110:8090/share/dd965cba-7c1f-40b2-a275-0150890e005f
芯片：SS200000135TL_D1.tissue.gem.gz

下面图是这个芯片采用stereropy软件可视化的效果（让我们对这个切片有一个感官的了解）。

我们下载处理了这个STO切片的数据，设置bin50转换成了seurat能够读取的rds对象。

SS200000135TL_D1.tissue.gem.gz转换成bin50分辨率seurat rds的过程不是这篇文章的内容。

suppressPackageStartupMessages({
    library(Seurat)
    library(ggplot2)
    library(viridis)
    library(patchwork)
    library(RColorBrewer)
})

# 读取数据
rds <- readRDS('./mouse_brain_sto.rds')

图片长宽比修正

下面左图为正常可视化结果，正常的可视化会使图片的长宽比失真，我们加一些修饰代码使可视化的结果保持切片的长宽比。

options(repr.plot.width=7, repr.plot.height=4)

p1 <- SpatialFeaturePlot(rds, features = "nCount_Spatial")
p2 <- p1 + theme_gray()+xlab("")+ylab("")+theme(axis.text = element_blank(),axis.ticks=element_blank())

p1+p2

[图片上传失败...(image-4974cd-1706604409823)]

去除point黑色边圈

默认的可视化会把spot加上黑边，当spot点很密集的时候整个图片会显示的比较暗，可以设置stroke=NA来使图片变得明亮。

p1 <- SpatialDimPlot(rds)
p2 <- SpatialDimPlot(rds, stroke=NA) 
p2 <- p2 + guides(color=guide_legend(override.aes = list(size=8), ncol=2))
p2 <- p2 + theme_gray()+xlab("")+ylab("")
p2 <- p2 + theme(axis.text = element_blank(),axis.ticks=element_blank())

p1+p2

2. 用seurat单细胞的函数实现空转spot分布

在seurat中FeaturePlot, DimPlot是单细胞数据可视化的函数
SpatialDimPlot, SpatialFeaturePlot是空转数据可视化的函数

下面的操作可以使空转的数据能够用单细胞的函数(FeaturePlot, DimPlot)进行可视化，以达到高度定制图片的目的。

有这个想法，是因为前一阵做数据探索时，发现下载的一篇宫颈癌STO的文章数据就这这种结构，能够非常方便的进行定制化修改。

spatial_corr <- rds@images$slice1@coordinates[,c('col', 'row')]
colnames(spatial_corr) <- c('s_1', 's_2')
spatial_corr <- as.matrix(spatial_corr)
rds[["spatial"]] <- CreateDimReducObject(embeddings=spatial_corr, key = "s_", assay = "Spatial")

options(repr.plot.width=10.5, repr.plot.height=4)

p1 <- FeaturePlot(rds, features = "nCount_Spatial", reduction='spatial') + 
    scale_y_reverse() + 
    scale_colour_viridis(option="inferno") + theme_void()
p2 <- FeaturePlot(rds, features = "Neurod6", reduction='spatial') +
    scale_y_reverse() + 
    scale_colour_viridis(option="D") + theme_void()

mycolor <- colorRampPalette(brewer.pal(8,'Set2'))(18)

p3 <- DimPlot(rds, reduction='spatial', cols=mycolor) + 
    guides(color=guide_legend(override.aes = list(size=6), ncol=2)) +
    theme_void() + scale_y_reverse()

p1+p2+p3+plot_layout(ncol=3, nrow=1)

Nature Genetics 文章图风格复现

前面提到的宫颈癌STO数据就是来源于下面要复现的文章，文章在2023年3月发表在Nature Genetics杂志，切片数据为sterero-seq平台产生，作者提供的是seurat的rds对象格式供研究者使用。文章doi: 10.1038/s41588-023-01570-0

下面图是文章中的原图截图

这个对象的空间信息并没有保存在images里而是像我们前面一样保存在了reductions里面，关键字是spatial。所以我们能用seurat中单细胞的可视化函数对这个数据进行可视化。

suppressPackageStartupMessages({
    library(Seurat)
    library(ggplot2)
    library(viridis)
    library(patchwork)
    library(RColorBrewer)
    library(paletteer)
})

Newf <- function(RDS, feature, ad=1, limits=1){
    viridis_plasma_light_high <- as.vector(x = paletteer_c(palette = "viridis::inferno", n = 250, direction = 1))
    viridis_plasma_light_high <- c( rep("black", ad), viridis_plasma_light_high)

    p <- FeaturePlot(RDS, features = feature, reduction='spatial')
    p <- p + theme_void()+ theme(
                axis.ticks=element_blank(),
                axis.text.x = element_blank(),
                axis.text.y = element_blank(),
                axis.line = element_blank(),
                panel.border = element_rect(color = "white", fill = NA, size =2),
            ) + 
        DarkTheme() +
        xlab(NULL) + 
        ylab(NULL)
    if (length(limits)==1){
        p <- p + scale_colour_gradientn(colours=viridis_plasma_light_high, na.value = "black") 
    }else{
        p <- p + scale_colour_gradientn(colours=viridis_plasma_light_high, na.value = "black",limits=limits)
    }

    return (p)
}

# 读取下载的数据
ca <- readRDS('spatial.rds')

p1 <- Newf(ca, "CD4 T")
p2 <- Newf(ca, "CD8 T")
p3 <- Newf(ca, "B")
p4 <- Newf(ca, "DC")
p5 <- Newf(ca, "Macro")
p6 <- Newf(ca, "Endothelial")
p7 <- Newf(ca, "Fibroblast")
p8 <- Newf(ca, "Program_C6")
p9 <- Newf(ca, "Program_C7")

options(repr.plot.width=8.5, repr.plot.height=10)
p <- p1+p2+p3+p4+p5+p6+p7+p8+p9 + plot_layout(ncol=3, nrow=3)
p
#ggsave("out.pdf", p, w=8.5, h=10)

trick: 和文章图还有一点差别，这个差别就是为什么我们定义的Newf函数有一个ad参数和背景用黑色原因，设置ad参数能够在colorbar系列的小值增加黑色，这样一些低表达的spot就被隐藏在黑色背景里了，当我们要突出切片轮廓时，可以设置ad=0。

总结以上用到的备忘知识点：

还原图片的长宽比
黑圈消失术
legend点放大术
rds对象根据自定义坐标增加reduction
低表达spot隐藏术

空转分析代码备忘录：seurat可视化代码雕琢

简介

1. 可视化图片保持空转切片长宽比

2. 用seurat单细胞的函数实现空转spot分布

Nature Genetics 文章图风格复现

推荐阅读更多精彩内容