作者,Evil Genius
慢慢的也要把空间的分析升级到高精度平台了。
群里有人分享自己发表的文章,说实话,我真心的羡慕,做科研这条路,文章是硬通货,把自己说的天花乱坠,什么都会,都不如说一声,自己是cell/nature期刊选手来的有说服力。而且前者像一个小丑😄。
大家基本上都是科研人员,还有机会,专心做一个课题,我希望大家有条件读个好博士,我工作了以后,真的发现,博士学历非常重要,发表文章的质量,更加重要。
今天我们分享一个简单的流程升级,对于高精度平台,无论是HD、Stereo-seq、Xenium、CosMx(前提是做了细胞分割,拿到单细胞级别的空间矩阵)等都有一个共同的特点,如下图:
各个区域的细胞密度不同,如果是visium,邻域一般考虑周围6个spot,这个低精度平台的做法, 到了高精度,这种做法就不合适了,需要调整了。
之前分享过一篇文章,分析优化----关于空间原位数据的邻域分析优化,提出了对于高精度平台邻域分析的见解,当然了,很多文章也都在运用,那就是一定范围内的细胞都算为邻域,这要最直观的结果就是不同细胞的邻域不仅细胞种类不同,细胞数量也有差异。
我们需要实现的是,一定范围内(200um),拿到高精度平台的空间邻域矩阵(包括分子矩阵和细胞矩阵)。
基础分析大家自己做,做好细胞定义,拿到h5ad格式的数据
接下来我们来分析一下,首先是邻域分子矩阵
import numpy as np
import pandas as pd
import scanpy as sc
import matplotlib.pyplot as plt
from sklearn.metrics.pairwise import euclidean_distances
# 加载空间转录组数据 (.h5ad文件)
adata = sc.read('your_data_file.h5ad') # 替换为你的 h5ad 文件路径
# 查看数据的基本信息
print(adata)
获取细胞坐标和基因表达数据