细胞类型鉴定
细胞类型鉴定分两种思路
一种是基于Marker gene, 看某个亚群的差异基因(one to others)与数据库中哪种细胞类型的 marker gene 比较一致,结合其表达量来鉴定细胞类型。常见 marker gene 数据库有:CellMarker、Mouse Cell Atlas、cd_marker_handbook、PanglaoDB等。
另外一种是基于表达谱,用未知细胞类型的表达谱与已知细胞类型的表达谱做相关性分析,相关性高即鉴定为这类细胞。或者基于使用模型预测,常见的随机森林,支持向量机。
CellMarker
使用CellMarker网站http://biocc.hrbmu.edu.cn/CellMarker/index.jsp查询某类型细胞标志基因,也可以查询基因所标志的细胞类型。统计各聚类marker gene在CellMarker网址细胞类型中出现的频次,在频次较高几个细胞类型中进一步确定。
singleR
使用singleR包对细胞类型预测,singleR能够与seurat包完美结合,使用比较方便。
CHETAH
使用CHETAH包,使用自带参考数据预测细胞类型。也可以下载文献中数据,整合成CHETAH包需要的数据结构,seurat包处理的数据也可以预测。其准确率与singleR不相上下,甚至高一点。
Celaref
通过与已知细胞类型的参考数据集的相似度进行比较。输入每个细胞中每个基因的reads counts数和每个细胞所属的簇信息,和每个查询组中最明显富集的基因的参考样本比较,通过排名来匹配细胞类型
链接:https://www.jianshu.com/p/9c4bb79db292
结合文献以及先验知识
结合一些文献里面各预测类群的marker gene在目标类群里面的表达情况进行分类
总结
目前并没有统一的细胞类型鉴定方法,我们不要太纠结与算法工具。需要结合文献以及先验知识,辅助工具包验证细胞类型。