作者,Evil Genius
我们马上就要开始培训单细胞空间相关的内容了,课表我已经初步做好,中间我再斟酌一下,过一两天发布,25节课上下。
初步预计2节课讲单细胞(单细胞我们就聊聊核心的分析思路以及大家分析中常见的错误)、8节课讲visium(Stereo-seq bin > 50)、7节课讲HD(Stereo-seq bin < 50)、7节课讲高精度平台(Xenium、CosMx、IMC等)、2-3节课聊聊CODEX(空间蛋白组),正常的话,我们6月21号开始上第一课。
课程很近了,我需要把手上所有的资料,脚本,文献等进行详细的整理以供上课使用,课程上完都要发给学员的,不管怎么说,我自己先全部整理好。
今天我们需要更新一下关于HD细胞分割的内容。
其实对于空间转录组来讲,最核心的目标是:以单细胞分辨率描述体内所有细胞类型的分子特征。
然而,如果不考虑细胞在其微环境中的存在方式,就无法完全理解细胞的功能。
目前高精度技术平台细胞分割的现实挑战:检测到的基因表达与覆盖其上的细胞之间不存在天然对应关系。许多spots并未与细胞对齐,因此不包含或仅含极少转录本。其次,单个细胞的转录本可能分散在多个相邻spot上;反之,单个spot也可能包含来自多个相邻细胞的转录本。现有的高分辨率分割算法通常基于一个前提假设:每个spot仅包含单个细胞的mRNA。
那么实际中spatial HD的细胞分割策略应该是如何的?(Stardist)
目前HD数据分析仍然处于早期的开发阶段,很多内容需要我们摸索,当然了,不成熟就代表了有很多机会。
核心的思路总结就是:将图像分为多个部分。loop表示每个segment的大小。将segmentation循环处理为loop,一次处理一个segmentation,每个相邻segmentation之间留有重叠的间隔大小,以便于校正。
我们来借助tiff图片的力量实现一下。
首先将tiff图片转化成数据文件(即图像格式转变成矩阵格式,一般都很大,需要的时间也比较长)
import tifffile
import numpy as np
image = tifffile.imread('HD.tif')
np.save(''image_to_segmentation.npy', image)
###linux命令 gzip image_to_segmentation.npy
再来分析我们自己的数据