- Seurat Weekly NO.0 || 开刊词
- Seurat Weekly NO.1 || 到底分多少个群是合适的?!
- Seurat Weekly NO.2 || 我该如何取子集
- Seurat Weekly NO.3 || 直接用Seurat画fig2
- Seurat Weekly NO.4 || 高效数据管理
- Seurat Weekly NO.5 pseudocell该如何计算||或谈Seurat的扩展
- Seurat Weekly NO.06 || 数据对象转化之Scanpy2Seurat
最近(202101)安装Seurat(3.2.3)的话可能会收到一条提示信息:
Seurat v4 will be going to CRAN in the near future;
for more details, please visit https://satijalab.org/seurat/v4_changes
我们介绍过的Seurat V4版就要通过CRAN的规范,可以在CRAN上直接安装了,这意味着V4走出了内侧和版,以更成熟的方式提供给广大单细胞研究的科学家。我们在Seurat4.0|| 单细胞多模态数据分析启示录系列笔记中学习了V4整合多模态数据的过程,我们应该记得V4在预印的文章:Integrated analysis of multimodal single-cell data。
Seurat 4.0 ||单细胞数据分析工具箱有更新
Seurat 4.0 ||单细胞多模态数据整合算法WNN
Seurat 4.0 || 分析scRNA和表面抗体数据
Seurat 4.0 || WNN整合scRNA和scATAC数据
Seurat 4.0 || 单细胞PBMC多模态参考数据集
Seurat 4.0 || 单细胞BMNC多模态参考数据集
除了以上新功能的集成,Seurat还做了已有函数的小改动,大部分只是性能的提升,尽可能地保证了与Seurat V3 的兼容性。这些修改包括对默认参数设置的微小更改以及为相同任务使用性能更好的包,例如标识k最近的邻居和基于图的聚类。这些变化不会对下游结果产生负面影响。
默认参数的改变
这当然是值得注意的,在不少时候会困惑:为什么同样的代码,同样的数据,在小明那里是这样的,而我是另一个样!默认参数,随机种子都是可能的原因,或者没有仔细检查数据和代码(也就是你说的一样,其实并不一样,坏了啦)。
- FindNeighbors
用于识别k近邻的默认方法被设置为annoy。这是一种近似最近邻方法,广泛应用于高维分析,包括单细胞分析。广泛的社区基准测试表明,annoy极大地提高了邻居发现的速度并减少了内存需求,对下游结果的影响可以忽略不计(当然会有些许不同),这与我们的分析和测试是一致的。用户可以使用nn.method="rann"切换回原来的默认设置。
?FindNeighbors
## Default S3 method:
FindNeighbors(
object,
distance.matrix = FALSE,
k.param = 20,
compute.SNN = TRUE,
prune.SNN = 1/15,
nn.method = "rann", # V3 的默认
annoy.metric = "euclidean",
nn.eps = 0,
verbose = TRUE,
force.recalc = FALSE,
...
)
- FindMarkers
我们重新构造了FindMarkers()函数的代码,使其更易于理解、解释和调试。差异表达的结果保持不变。然而,在默认情况下,我们现在使用的FC(fold change )则基于log2,这在其他差异表达包中是常见的,而不是V3之前的自然对数。如果设置了默认选项,FindMarkers()的输出将包括列avg_log2FC,而不是avg_logFC。用户可以通过指定base = exp(1)来恢复以前的行为(以自然对数味为底的FC)。
- IntegrateData/TransferData
我们对锚点加权矩阵(anchor weight matrix)的精确计算做了微小的改变。这些更改反映了改进的工作流,但不会对下游分析产生有意义的差异(例如,您可以使用Seurat v3和Seurat v4来比较)
- SCTransform
在SCTransform()中,我们稍微修改了默认参数,以提高大型数据集参数估计的可伸缩性(scalability )。例如,在估计mu和theta之间的正则关系时,我们通过将ncells参数设置为5000来计算数据子集。sctransform v0.3中的vst()函数(可在CRAN上获得)还对正则化过程进行了微小的更改。我们对这些更改进行了广泛的测试,发现在速度和内存方面有了实质性的改进,特别是对于大型数据集,而且没有对结果产生不利影响。用户可以比较使用Seurat v3和Seurat v4计算的SCTransform vignette的结果,或者在更大的数据集中设置ncells=NULL来比较结果。
移除的函数
The following functions have been removed in Seurat v4:
-
CreateGeneActivityMatrix
replaced byGeneActivity
in Signac -
RunLSI
replaced byRunTFIDF
andRunSVD
in Signac -
ReadAlevin
andReadAlevinCsv
moved to SeuratWrappers, see details here -
ExportToCellbrowser
andStopCellbrowser
moved to SeuratWrappers, see details here
英国哲学家弗朗西斯·培根在1620年出版了《新工具》一书,原名《新工具或解释自然的一些指导》,并作为《伟大的复兴》的第二部分。我们相信任何一个学科门类,工具既是技术发展的缩影也是科学发展的推手,随着Seurat的迭代,我们也感受到了单细胞基因组学的发展轨迹。