今天试了一下在jupyter看pseudotime
在用Palantir和Cellrank的时候都出现了一个问题,就是批次效应非常明显,明明已经用bbknn去批次了,但是拟时序图仍然分成两个大亚群
后来在仔细看Palantir时,发现他们基于了pca的数据进行后续处理,但是bbknn不能对pca和tsne去批次
见https://mp.weixin.qq.com/s/YhyhSqIn8stXcHHGjk9skQ
因此,采用了harmony进行去批次:https://zhuanlan.zhihu.com/p/564697543
然后ad.obsm['X_pca']=ad.obsm['X_pca_harmony']
作为矫正后的pca值进行后续分析
其实这也可以解释了为什么我们做diffusion map的时候,为什么总是做出来独立线,因为
sc.pp.neighbors(adata, n_neighbors=20, n_pcs=50, use_rep='X_pca', method='gauss')
sc.tl.diffmap(adata)
本质上也是基于pca的
顺带说一句,其实很多时候,diffusion map的DC1包含的分化信息很少,可以删掉
adata.obsm['X_diffmap_'] = adata.obsm['X_diffmap'][:,1:]
sc.pl.embedding(adata,'diffmap_',color=['cluster'])