在单细胞研究中,最重要的一个环节就是细胞类型注释,这是一个极其考验研究者研究背景和精力的工作,但随着单细胞的研究越来越多,可提供给我们的细胞类型的marker信息也越来越丰富,基于这些marker信息开发的细胞注释算法使得我们的细胞注释工作越来越省力,今天就跟随小编的脚步来盘点一下最常用的细胞类型注释工具吧!
1.SingleR:
目前SingleR内置的数据库有7个,5个人的数据库HumanPrimaryCellAtlasData、BlueprintEncodeData、DatabaseImmuneCellExpressionData、MonacoImmuneData、NovershternHematopoieticData;2个小鼠的数据库ImmGenData、MouseRNAseqData,可应用于相应物种及组织的单细胞结果注释。
图1.SingleR单细胞注释工作原理
代码链接
https://www.bioconductor.org/packages/release/bioc/vignettes/SingleR/inst/doc/SingleR.html
2.Cellassign:
图2.Cellassign单细胞注释工作原理
代码链接
https://irrationone.github.io/cellassign/introduction-to-cellassign.html
3.Celaref:
图3.Celaref单细胞注释工作流程
代码链接
https://bioconductor.org/packages/release/bioc/vignettes/celaref/inst/doc/celaref_doco.html
4.Garnett:
图4.Garnett单细胞注释工作原理
代码链接
https://cole-trapnell-lab.github.io/garnett/docs/
5.scTPA:
图5.scTPA单细胞注释工作原理
网页链接
http://sctpa.bio-data.cn/sctpa
6.Cell Blast:
图6.Cell Blast单细胞注释工作原理
代码链接
https://github.com/gao-lab/Cell_BLAST
7.scCATCH:
图7.scCATCH单细胞注释工作原理
代码链接
https://github.com/ZJUFanLab/scCATCH
以上只是汇总了常见的几种细胞类型注释生信工具,但值得注意的是,生信注释方法依赖于转录组数据库或者cell marker数据库,而这些库中包含的样本类型和疾病状态也不完全和研究者的情况相同,因此导致注释出来的结果会有不准确的情况,这时是需要我们手动利用已知的marker信息进一步对结果进行确认,我们可以使用R的seurat包将marker信息输入后确定表达的细胞群进而对生信注释结果进行矫正,获得最终的单细胞注释结果。
参考文献:
[1] Reference-based analysis of lungsingle-cell sequencing reveals a transitional profibrotic macrophage. *NatureImmunology, *2019.
[2] Probabilistic cell-type assignmentof single-cell RNA-seq for tumor microenvironment profiling. *Nature Methods, *2019.
[3] Celaref: Single-cell RNAseq cellcluster labelling by reference. R package version 1.0.1.Sarah Williams, 2019.
[4] Supervised classification enablesrapid annotation of cell atlases.Nature Methods, 2019.
[5] Searching large-scale scRNA-seqdatabases via unbiased cell embedding with Cell BLAST.*Nature Communications, *2020.
[6] scCATCH: Automatic Annotation onCell Types of Clusters from Single-Cell RNA Sequencing Data. iScience, 2020.