作者:ahworld
链接:空转分析代码备忘录:seurat可视化代码雕琢
来源:微信公众号seqyuan
著作权归作者所有,任何形式的转载都请联系作者。
简介
目前常见的空间转录组数据技术平台有:
- 10X Visium
- 10X Visium CytAssist
- stereo-seq
seurat软件以其简单易用性,通过特定的矩阵格式转换,能够兼容大多数平台的数据格式。为了发表文章,图片美化的需要,在做项目过程中经常用到一些优化的代码,在这里做个备忘。
1. 可视化图片保持空转切片长宽比
有时候我们做空转分析采用SpatialFeaturePlot
或SpatialDimPlot
画图,经常发现图片的长宽比例与原始切片相比有压缩或者拉伸,下面的代码能够帮助我们解决这个问题。
- 数据来源:华大sterero-seq公开数据
- 数据网址:http://116.6.21.110:8090/share/dd965cba-7c1f-40b2-a275-0150890e005f
- 芯片:SS200000135TL_D1.tissue.gem.gz
下面图是这个芯片采用stereropy软件可视化的效果(让我们对这个切片有一个感官的了解)。
我们下载处理了这个STO切片的数据,设置bin50
转换成了seurat能够读取的rds
对象。
SS200000135TL_D1.tissue.gem.gz转换成bin50分辨率seurat rds的过程不是这篇文章的内容。
suppressPackageStartupMessages({
library(Seurat)
library(ggplot2)
library(viridis)
library(patchwork)
library(RColorBrewer)
})
# 读取数据
rds <- readRDS('./mouse_brain_sto.rds')
图片长宽比修正
下面左图为正常可视化结果,正常的可视化会使图片的长宽比失真,我们加一些修饰代码使可视化的结果保持切片的长宽比。
options(repr.plot.width=7, repr.plot.height=4)
p1 <- SpatialFeaturePlot(rds, features = "nCount_Spatial")
p2 <- p1 + theme_gray()+xlab("")+ylab("")+theme(axis.text = element_blank(),axis.ticks=element_blank())
p1+p2
[图片上传失败...(image-4974cd-1706604409823)]
去除point黑色边圈
默认的可视化会把spot加上黑边,当spot点很密集的时候整个图片会显示的比较暗,可以设置stroke=NA
来使图片变得明亮。
p1 <- SpatialDimPlot(rds)
p2 <- SpatialDimPlot(rds, stroke=NA)
p2 <- p2 + guides(color=guide_legend(override.aes = list(size=8), ncol=2))
p2 <- p2 + theme_gray()+xlab("")+ylab("")
p2 <- p2 + theme(axis.text = element_blank(),axis.ticks=element_blank())
p1+p2
2. 用seurat单细胞的函数实现空转spot分布
- 在seurat中
FeaturePlot
,DimPlot
是单细胞数据可视化的函数 -
SpatialDimPlot
,SpatialFeaturePlot
是空转数据可视化的函数
下面的操作可以使空转的数据能够用单细胞的函数(FeaturePlot
, DimPlot
)进行可视化,以达到高度定制图片的目的。
有这个想法,是因为前一阵做数据探索时,发现下载的一篇宫颈癌STO的文章数据就这这种结构,能够非常方便的进行定制化修改。
spatial_corr <- rds@images$slice1@coordinates[,c('col', 'row')]
colnames(spatial_corr) <- c('s_1', 's_2')
spatial_corr <- as.matrix(spatial_corr)
rds[["spatial"]] <- CreateDimReducObject(embeddings=spatial_corr, key = "s_", assay = "Spatial")
options(repr.plot.width=10.5, repr.plot.height=4)
p1 <- FeaturePlot(rds, features = "nCount_Spatial", reduction='spatial') +
scale_y_reverse() +
scale_colour_viridis(option="inferno") + theme_void()
p2 <- FeaturePlot(rds, features = "Neurod6", reduction='spatial') +
scale_y_reverse() +
scale_colour_viridis(option="D") + theme_void()
mycolor <- colorRampPalette(brewer.pal(8,'Set2'))(18)
p3 <- DimPlot(rds, reduction='spatial', cols=mycolor) +
guides(color=guide_legend(override.aes = list(size=6), ncol=2)) +
theme_void() + scale_y_reverse()
p1+p2+p3+plot_layout(ncol=3, nrow=1)
Nature Genetics 文章图风格复现
前面提到的宫颈癌STO数据就是来源于下面要复现的文章,文章在2023年3月发表在Nature Genetics杂志,切片数据为sterero-seq平台产生,作者提供的是seurat的rds对象格式供研究者使用。文章doi: 10.1038/s41588-023-01570-0
下面图是文章中的原图截图
这个对象的空间信息并没有保存在images
里而是像我们前面一样保存在了reductions
里面,关键字是spatial
。所以我们能用seurat中单细胞的可视化函数对这个数据进行可视化。
suppressPackageStartupMessages({
library(Seurat)
library(ggplot2)
library(viridis)
library(patchwork)
library(RColorBrewer)
library(paletteer)
})
Newf <- function(RDS, feature, ad=1, limits=1){
viridis_plasma_light_high <- as.vector(x = paletteer_c(palette = "viridis::inferno", n = 250, direction = 1))
viridis_plasma_light_high <- c( rep("black", ad), viridis_plasma_light_high)
p <- FeaturePlot(RDS, features = feature, reduction='spatial')
p <- p + theme_void()+ theme(
axis.ticks=element_blank(),
axis.text.x = element_blank(),
axis.text.y = element_blank(),
axis.line = element_blank(),
panel.border = element_rect(color = "white", fill = NA, size =2),
) +
DarkTheme() +
xlab(NULL) +
ylab(NULL)
if (length(limits)==1){
p <- p + scale_colour_gradientn(colours=viridis_plasma_light_high, na.value = "black")
}else{
p <- p + scale_colour_gradientn(colours=viridis_plasma_light_high, na.value = "black",limits=limits)
}
return (p)
}
# 读取下载的数据
ca <- readRDS('spatial.rds')
p1 <- Newf(ca, "CD4 T")
p2 <- Newf(ca, "CD8 T")
p3 <- Newf(ca, "B")
p4 <- Newf(ca, "DC")
p5 <- Newf(ca, "Macro")
p6 <- Newf(ca, "Endothelial")
p7 <- Newf(ca, "Fibroblast")
p8 <- Newf(ca, "Program_C6")
p9 <- Newf(ca, "Program_C7")
options(repr.plot.width=8.5, repr.plot.height=10)
p <- p1+p2+p3+p4+p5+p6+p7+p8+p9 + plot_layout(ncol=3, nrow=3)
p
#ggsave("out.pdf", p, w=8.5, h=10)
trick: 和文章图还有一点差别,这个差别就是为什么我们定义的Newf
函数有一个ad
参数和背景用黑色原因,设置ad参数能够在colorbar系列的小值增加黑色,这样一些低表达的spot就被隐藏在黑色背景里了,当我们要突出切片轮廓时,可以设置ad=0
。
总结以上用到的备忘知识点:
- 还原图片的长宽比
- 黑圈消失术
- legend点放大术
- rds对象根据自定义坐标增加reduction
- 低表达spot隐藏术