单细胞聚类评估框架(Single-Cell Clustering Assessment Framework, SCCAF)
尽管有多种基于参考数据集的自动化注释工具(SingleR、CHETAH、ACTINN、scClassify 等),它们通常难以发现新的细胞类型。
基于上述问题,作者提出了一种基于 python 的自动化方法——SCCAF,用以辅助发现新的、尚未被注释的细胞类型。
SCCAF基于机器学习和自映射对聚类的迭代,先从一个“过度聚类”的细胞聚类开始,逐步合并被机器学习认为是相同细胞的细胞簇。最终,得到一个能被机器学习很好区分的聚类结果,机器学习学到的每种细胞中的特征基因就是用于识别该细胞类型的特征,机器学习模型也可以作为一种新的定义细胞类型的方式。
我们的习惯通常是先做大聚类,再细分。而这个方法则推荐先高分辨聚类,再整合(we suggest to use resolution 1.5 result as the start clustering.)。
用了一下,感觉比较鸡肋