Seurat24节气之20小雪---ScaleData可以加快速度吗

小雪:开始下雪。

缩放数据

接下来,我们应用线性变换(“缩放”),这是像PCA这样的降维技术之前的标准预处理步骤。该[ScaleData()](https://satijalab.org/seurat/reference/ScaleData.html)函数:

  • 移动每个基因的表达,以使整个细胞的平均表达为0
  • 缩放每个基因的表达,从而使细胞之间的方差为1
    • 此步骤在下游分析中具有相等的权重,因此高表达的基因不会占主导地位
  • 结果存储在 pbmc[["RNA"]]@scale.data
all.genes <- rownames(pbmc)
pbmc <- ScaleData(pbmc, features = all.genes)

此步骤耗时太长!我可以加快速度吗?

缩放是Seurat工作流程中必不可少的步骤,但仅限于将用作PCA输入的基因。因此,默认设置[ScaleData()](https://satijalab.org/seurat/reference/ScaleData.html)是仅对先前标识的可变特征执行缩放(默认为2,000)。为此,请忽略features上一个函数调用中的参数,即

pbmc <- ScaleData(pbmc)

您的PCA和群集结果将不受影响。但是,Seurat热图(如下所示产生[DoHeatmap()](https://satijalab.org/seurat/reference/DoHeatmap.html))要求对热图中的基因进行缩放,以确保高度表达的基因不会在热图中占主导地位。为确保以后不再将任何基因排除在热图之外,我们在本教程中缩放所有基因。</details>

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容