Automatic cell type identification methods for single-cell RNA sequencing - ScienceDirect
细胞群的鉴定通常依赖于使用已建立的标记基因对细胞群进行人工注释。然而,标记基因的选择是一个耗时的过程,可能导致次优的注释,因为标记必须是信息的个别细胞群和各种细胞类型存在于样品中。在这里,我们开发了一个计算平台 ScType,它能够完全基于给定的 scRNA-seq 数据进行全自动和超快速的细胞类型鉴定,以及作为背景信息的全面的细胞标记数据库。使用来自各种人类和小鼠组织的六个 scRNA-seq 数据集,我们显示 ScType 如何通过保证跨细胞簇和细胞类型的阳性和阴性标记基因的特异性来提供无偏和准确的细胞类型注释。我们还展示了 ScType 如何区分健康和恶性细胞群,基于单核苷酸变体的单细胞调用,使其成为抗癌应用的通用工具。这种广泛应用的方法既可以作为一种交互式 web 工具( https://sctype.app ) ,也可以作为一种开源的 R-package。
由于 ScType 如何区分健康和恶性细胞群,所以这里@ 论文日鉴19--鉴别单细胞肿瘤和非肿瘤 - 简书 (jianshu.com)
CellTypist
Mapping the developing human immune system across organs | Science
CellTypist | automated cell type annotation for scRNA-seq datasets
Teichlab/celltypist: A tool for semi-automatic cell type annotation (github.com)
其他的单细胞注释软件@ 论文日鉴16:综合生信工具网站 - 简书 (jianshu.com) 在第二个工具文章里面会有惊喜
手动注释
手动注释可以看这个
单细胞测序细胞类型注释辅助数据库大全 - 简书 (jianshu.com)
【单细胞转录组】人类T细胞亚群分析Marker基因汇总 - 简书 (jianshu.com)
推荐几个细胞注释网站 (qq.com)
PanglaoDB
网址:https://panglaodb.se/search.html
一些重要marker
来自生信技能树
DefaultAssay(pbmc) <- "RNA"
markerGenes <- c("CD3D", # 定位T细胞
"CD3E", # 定位T细胞
"TRAC", # 定位T细胞
"IL7R", # CD4 T cells
"GZMA", # NK T /效应T
"NKG7", # NK T cells
"CD8B", # CD8 T cells
"FCGR3A", # CD16(FCGR3A)+ Mono / NK / 效应 CD8+ T
"CD14", # CD14+ monocyte
"LYZ", #Mono
"MS4A1", #B细胞
"FCER1A","LILRA4","TPM2", #DC
"PPBP","GP1BB"# platelets
)
p1 = VlnPlot(pbmc, features = markerGenes)
p2 = DotPlot(pbmc, features = markerGenes, dot.scale = 8) + RotatedAxis()
p3 = FeaturePlot(pbmc,
features = markerGenes,
label.size = 4,
repel = T,label = T)&
theme(plot.title = element_text(size=10))&
scale_colour_gradientn(colours = rev(brewer.pal(n = 11, name = "Spectral")))
# T Cells (CD3D, CD3E, CD8A),
# B cells (CD19, CD79A, MS4A1 [CD20]),
# Plasma cells (IGHG1, MZB1, SDC1, CD79A),
# Monocytes and macrophages (CD68, CD163, CD14),
# NK Cells (FGFBP2, FCG3RA, CX3CR1),
# Photoreceptor cells (RCVRN),
# Fibroblasts (FGF7, MME),
# Endothelial cells (PECAM1, VWF).
# epi or tumor (EPCAM, KRT19, PROM1, ALDH1A1, CD24).
# immune (CD45+,PTPRC), epithelial/cancer (EpCAM+,EPCAM),
# stromal (CD10+,MME,fibo or CD31+,PECAM1,endo)
T 细胞(全部):CD3+
Naive T cell:
CD3, CD4, CCR7, CD62L+, IL-7R (CD127), THPOK
Tef(效应T细胞):
辅助T细胞(Helper T):CD3+CD4+CD8-T细胞
Th1: CD3+CD4+CD30-, IL-12R, CXCR3, T-bet, STAT4, STAT1,IFNγ, IL-2,, IL-18、—
Th2:CD3+CD4+CD30+, CCR4,IL-2, IL-4
Th9: CD3, CD4, PU.1, IL-9, IL-10
Th17: CD3, CD4, IL23-R, CCR6, IL-1R, CD161, STAT3
Th22: CD3, CD4, CCR10
Tfh: CD3, CD4, CCR5, SLAM, OX40L, CD40L(CD154), ICOS, IL-21R, PD1, STAT3, IL-21
Treg(调节T细胞):CD4+CD25+Foxp3+ ,CD127+, CD152+,TGFβ, IL-10, IL-12, STAT5+ (ps:只通过CD4+CD25+双阳性来定义的Treg细胞并不完全准确)
TR1(IL-10):CD3, CD4
Natural Treg: CD3,CD4, CD25, CTLA4, GITR, FOXP3, STAT5, FOXO1, FOXO3, IL-35, IL-10
Inducible Treg: CD3,CD4, CD25, CTLA4, GITR, FOXP3, STAT5, FOXO1, FOXO3, SMAD2, SMAD3, SMAD4, IL-10
细胞毒性T细胞 Cytotoxic T(杀伤性T细胞):CD3+CD4-CD8+T细胞
Tc1(IFN-γ):CD3+CD8+CD30-
Tc2(IL-4、IL-5、IL-10):CD3+CD8+CD30-
Tex(耗竭T细胞Exhausted T):CD3+,CD8+,PD1, TIM3, 1B11, LAG3, BLIMP1
无能/失能T(Anergic T):CD3, BTLA, GRAIL, CBL-B, ITCH, NEDD4
记忆T(Memory T):
中央记忆T: CD3, CCR7+, CD44, CD62L+, CD3, IL-7R(CD127), IL-15R, MBD2
效应记忆T: CD3, CCR7-, CD62L-, CD44, IL-7R(CD127), IL-15R, BLIMP1
NKT: SLAMF1, SLAMF6, TGFBR, VA24, JA18
γδ T:CD3,IFNγ, IL-17A, IL-17F, IL-22
CD8αα T :CD3,CD8αα, B220,IL-10, TGFβ
另外根据S100A4、CCR7、IL32和ISG15,明确分离3个CD4 T细胞群体(幼稚型、记忆型、ifn激活型)
HSC造血干细胞:CYTL1 GATA2,CD34,CD117
T细胞:CD3D,CD3E,CD3G,CD4,CD8
B细胞:CD79A,CD79B,CD19,MS4A1
Naïve B cell:CD19,MS4A1,IGHD,IGHM,IL4R,TCL1A
Memory B cell:CD27,CD38,IGHG
B浆细胞Plasma_B:MZB1,SDC1,JCHAIN,XBP1
NK细胞:
KLRF1,NCAM1,NCR1,GNLY,NKG7,FCGR3A
NK1(CD56+ CD16-):NCAM1,GNLY,NKG7
NK2(CD56- CD16+):FCGR3A KLRF1
髓系细胞Myeloid:
LYZ,CD68,MS4A6A,CD1E,IL3RA,LAMP3
巨噬细胞Macrophages:CSF1R,CD68,CD163,CD14
单核细胞Monocytes:S100A8,S100A9,CD68,LYZ
CD14单核细胞CD14_Mono:CD14,LYZ
CD16单核细胞CD16_Mono:LYZ,FCGR3A
树突状细胞Dendritic:
IL3RA,THBD,CD1C,CD68,CD83,FCER1A,CST3
髓源树突状细胞mDC:CD1C,FCER1A
浆样树突状细胞pDC:KLRD1,LILRA4,CLEC4C,IL3RA
中性粒细胞Neutrophil:FCGR3B,CXCR2
肥大细胞Mast:TPSAB1,KIT,CPA3,ENPP3
血小板Platelets:PPBP,GP9
血红细胞Erythrocyte:HBA1,HBD,GYPA