CytoTRACE是 2020 年发表在Science 上的一个trajectory 推断工具,其原理是基于一个经验性的观察,即基因表达数目和发育阶段的相关性,differentiated后期的细胞表达的基因会较发育初期的减少,如下图C
基于这一观察,作者又在若干数据集上进行了验证,发现这个关联性靠谱,于是开发了工具CytoTRACE。
照葫芦画瓢将该工具应用于自己的数据后,发现其推断的结果刚好是和理论方向是相反的。那么是为什么呢?
为了便于用于单细胞分析,作者使用了 gene counts signature (GCS)来进行比较,文中说 by simply averaging the expression levels of genes that were most highly correlated with gene counts in each dataset, the resulting dataset-specific gene counts signature (GCS) became the top-performing measure in the screen。 简略翻译就是利用表达水平和基因数目的比值来计算。所以结果就是,如果表达量相当,基因数目越多,比值越小,就可以推断处于发育早期。所以一旦出现基因数目的变化远远小于细胞表达量的差异时,比如基因数量减少了5%,但是表达量减少了15%,结果依然是变小的,虽然细胞还在分化,那么此时,这个比例就不能客观反映细胞的分化状态了,反而颠倒过来了,这可能就是我的结果为什么会反过来的原因, 由此观之,这个工具对于分化差异小于表达水平波动的样品不太适用。反之,对于分化差异大于表达水平波动的样品,该工具会进一步放大分化的差异水平。