作者,Evil Genius
应该是政策的要求吧,很多客户采用了华大的空间转录组,支持一下国产很有必要。
最近也收到了很多项目,一看都是华大的,所以华大空间的数据分析,也要慢慢梳理梳理了。
很有客户只做了华大的空间转录组,分析起来就有点麻烦,注释成了老大难,这种情况下, 图像识别(分割)获取单细胞级别的空间数据,成了最优解。
首先我们来看一下华大数据的矩阵格式,其中的一些基础内容大家自己多多查阅,这里就不多介绍了。
同时我们还需要拿到tiff的图片文件,一般都有很多张
那么拥有这两者,就可以实现获取单细胞级别的空间数据了。
今日参考文献
知识积累
在空间分辨率转录组学中,Stereo-seq有助于在单细胞水平上分析大组织,提供亚细胞分辨率和厘米级视野。
利用细胞核染色图像,将cell membrane/wall染色图像与空间基因表达图谱进行比对。先进的细胞分割确保了准确的细胞边界检测,从而获得更可靠的单细胞空间基因表达谱。
分辨率和分析区域是空间转录组学的关键参数。具体来说,高分辨率提供了单细胞水平的详细分子信息,大视野有助于创建完整的3D地图,捕捉器官水平的生物功能。Stereo-seq同时实现了亚细胞分辨率和厘米级视野,为获得单细胞水平全组织的全面空间基因表达谱提供了技术基础。
由于细胞膜/细胞壁染色图像缺少“轨迹线”信息,利用细胞核染色图像将细胞膜/细胞壁染色图像与空间基因表达图谱对齐,从而在细胞分割步骤中获得细胞边界信息。
直接将分子分配到相应的细胞上,获得单细胞空间基因表达谱。
成果一、STCellbin概述
STCellbin的过程包括图像拼接、图像配准、细胞分割和分子标记。STCellbin输入包括Stereo-seq空间基因表达数据,以及细胞核和细胞膜/细胞壁染色图像块。采用MFWS算法获得缝合后的细胞核和细胞膜/细胞壁染色图像。使用快速傅里叶变换(FFT)算法对这两幅拼接的染色图像进行配准。空间基因表达数据被转换成地图,然后与基于“轨迹线”信息的缝合细胞核染色图像进行分析。从而实现基因表达图谱与细胞膜/细胞壁染色图像的配准。使用调整后的Cellpose 2.0工具对细胞膜/细胞壁染色图像进行细胞分割,获得细胞mask。然后根据细胞mask将分子分配到相应的细胞中,从而生成单细胞空间基因表达谱。将基于双向ConvLSTM U-Net的组织分割步骤设置为可选步骤,可用于生成组织mask,以辅助滤除组织外的杂质。
第一步、图像拼接
STCellbin中的图像拼接步骤与StereoCell中的步骤一致。MFWS算法利用FFT来计算具有重叠区域的相邻图片之间的偏移量。这样就可以拼接这些tiles,并且迭代地扩展该过程以包含数据集中的所有tiles。
第二步、图像配准,包括三个阶段
1、第一阶段是对整合后的细胞核和整合后的细胞膜/细胞壁染色图像进行配准。
2、第二阶段是整合细胞核染色图像与空间基因表达图谱的配准。
3、第三阶段是整合后的细胞膜/细胞壁染色图像与空间基因表达图谱的配准。
第三步、细胞分割
STCellbin的细胞分割步骤使用Cellpose 2.0(这个之前文章分享过,课程上也讲过).
第四步、分子标记
STCellbin根据细胞mask直接将分子分配给细胞,而将细胞外的分子分配给细胞是可选的。这个决定是由于观察到细胞膜/细胞壁通常是紧密堆积的,有一些分子出现在细胞外,这些分子的分配可能需要很长时间。
结果2、分割效果
STCellbin基于细胞膜/细胞壁染色图像更准确地分割细胞
结果3、STCellbin生成更可靠的单细胞空间基因表达谱,用于下游分析
STCellbin是一种更可靠的方法,特别是用于分析高分辨率和大视场的空间转录组数据。
最后看看示例代码
软件安装
wget https://github.com/STOmics/CellBin/archive/refs/heads/dev.zip
unzip dev.zip
# python3.8 in conda env
conda create --name=CellBin python=3.8
conda activate CellBin
cd CellBin-dev
pip install -r requirements.txt # install
conda install --channel conda-forge pyvips==2.2.1
准备好我们的矩阵和图像文件
cd scripts
# CellBin
python pipeline.py
--tiles_path /data/SS200000135TL_D1
--gene_exp_data /data/SS200000135TL_D1.gem.gz
--output_path /data/result
--chip_no SS200000135TL_D1
生活很好,有你更好