小雪:开始下雪。
缩放数据
接下来,我们应用线性变换(“缩放”),这是像PCA这样的降维技术之前的标准预处理步骤。该[ScaleData()](https://satijalab.org/seurat/reference/ScaleData.html)
函数:
- 移动每个基因的表达,以使整个细胞的平均表达为0
- 缩放每个基因的表达,从而使细胞之间的方差为1
- 此步骤在下游分析中具有相等的权重,因此高表达的基因不会占主导地位
- 结果存储在
pbmc[["RNA"]]@scale.data
all.genes <- rownames(pbmc)
pbmc <- ScaleData(pbmc, features = all.genes)
此步骤耗时太长!我可以加快速度吗?
缩放是Seurat工作流程中必不可少的步骤,但仅限于将用作PCA输入的基因。因此,默认设置[ScaleData()](https://satijalab.org/seurat/reference/ScaleData.html)
是仅对先前标识的可变特征执行缩放(默认为2,000)。为此,请忽略features
上一个函数调用中的参数,即
pbmc <- ScaleData(pbmc)
您的PCA和群集结果将不受影响。但是,Seurat热图(如下所示产生[DoHeatmap()](https://satijalab.org/seurat/reference/DoHeatmap.html)
)要求对热图中的基因进行缩放,以确保高度表达的基因不会在热图中占主导地位。为确保以后不再将任何基因排除在热图之外,我们在本教程中缩放所有基因。</details>