单细胞注释

单细胞-注释 - 简书

2022-01-17 多个样本单细胞分析流程 - 简书 (jianshu.com)

一、人工注释

人工注释需要借助文献检索marker或者结合常用的注释数据库,例如两个常用的数据库:

CellMarker(http://bio-bigdata.hrbmu.edu.cn/CellMarker/);

panglaoDB(A Single Cell Sequencing Resource ForGene Expression Data,https://panglaodb.se/)。

手动注释的话,用小提琴图、热图展示

1、计算每一类细胞中的Marker基因

all.markers <- FindALLMarkers(esperiment.aggregate, only.pos = TRUE, min.pct = 0.25, logfc.threshold = 0.25)

head(markers)

dim(all.markers)

2、计算特定亚群之间的marker基因

cluster1.markers <- FindMarkers(experiment.aggregate, ident.1 = 1, min.pct = 0.25)

head(x = cluster1.markers, n = 5)

FeaturePlot(experiment.aggregate, features = rownames(cluster1.markers)[1:6])

3、细筛

序号3在自己的亚群中至少50%的细胞表达,也可以PCT2<0.5;4.5按情况选择要不要做

4、计算特定两组细胞之间的差异基因,决定要不要把两个亚群合并

计算特定两组细胞之间的差异基因

sub.markers <- FindMarkers(experiment.aggregate, ident.1 = "0", ident.2 = "3")

View(sub.markers)

发现0和3差异大的都是线粒体基因,说明本身差异不大,那就可以合并

再看看0,3和1的差异

sub.markers <- FindMarkers(experiment.aggregate, ident.1 =( "0","3"), ident.2 = "1")

View(sub.markers)


如果这些差异是有意义的,那么1可以不合并

new.cluster.ids <- c("Memory CD4+", "Naive CD4+ T", "...")

names(new,cluster,ids) <- levels(pbmc)

pbmc <- RenameIdents(pbmc, new,cluster,ids)  #修改Idents

pbmc$celltype <- Idents(pbmc)  #在metadata中,添加Celltype信息

二、SingleR

使用内置参考进行注释(最简便的)

使用SingleR的最简单方法是使用内置参考对细胞进行注释。通过专用的检索功能提供了7个参考数据集(主要来自大量RNA-seq或微阵列数据)。

singleR自带的7个参考数据集,需要联网才能下载,其中5个是人类数据,2个是小鼠的数据:

BlueprintEncodeData Blueprint (Martens and Stunnenberg 2013) and Encode (The ENCODE Project Consortium 2012) (人)

DatabaseImmuneCellExpressionData The Database for Immune Cell Expression(/eQTLs/Epigenomics)(Schmiedel et al. 2018)(人)

HumanPrimaryCellAtlasData the Human Primary Cell Atlas (Mabbott et al. 2013)(人)

MonacoImmuneData, Monaco Immune Cell Data - GSE107011 (Monaco et al. 2019)(人)

NovershternHematopoieticData Novershtern Hematopoietic Cell Data - GSE24759(人)

ImmGenData the murine ImmGen (Heng et al. 2008) (鼠)

MouseRNAseqData a collection of mouse data sets downloaded from GEO (Benayoun et al. 2019).鼠)

SingleR包的工具包括:

SingleR()函数,用于注释

plotScoreHeatmap()使用热图比较label score

pruneScores() 对低质量的注释进行“修剪”(即注释为NA)

plotScoreDistribution()观察修剪是否合适,默认为偏离中值3个MAD(评价数据离散程度的统计学指标)


操作步骤:

1、SingleR的安装

# 使用devtools包进行安装

devtools::install_github('dviraran/SingleR') # this might take long, though mostly because of the installation of Seurat.

# 安装celldex 

if(!require("BiocManager",quietly=TRUE)) install.packages("BiocManager") BiocManager::install("celldex")

或者

if(!require("BiocManager",quietly=TRUE)) install.packages("BiocManager") 

BiocManager::install("SingleR")

install.packages("remotes")

remotes :: install_github("LTLA/celldex")

SingleR这个包本身并不会自带数据库,而是专门的把数据库文件丢给了celldex包。所以还需要安装celldex包

2、加载R包和所需的数据集

library(SingleR)

library(celldex)

mouseRNA <- MouseRNAseqData() #小鼠数据集为例

3、读取上一节保存的RDS文件,并将seurat对象转换为SingleR分析所需的SingleCellExpriment对象。

sce_for_SingleR <- GetAssayData(seurat_tutorial, slot="data")

clusters=seurat_tutorial@meta.data$seurat_clusters

4、注释细胞

pred.mouseRNA <- SingleR(test=sce_for_SingleR, ref = mouseRNA, labels = mouseRNA$label.main, method = "clusters", clusters = clusters, assay.type.test = "logcounts", assay.type.ref ="logcounts")

注释时labels一般选择main labels, 大的细胞类型相对准确度要高一些。

5、提取并保存注释信息

cellType = data.frame(ClusterID=levels(seurat_tutoria@meta.data$seurat_clusters), celltype = pred.mouseRNA$labels)

6、将细胞注释信息添加到seurat对象中

seurat_tutoria@meta.data$singleR = cellType[match(clusters, cellType$ClusterID), 'celltype']

三、基于已发表的文献

除了参考细胞注释数据库外,也可以从已发表的单细胞文章中查找marker基因,一般通过PubMed或者GeenMedical等数据库网站来进行文献的查找和检索。

1)首先明确样本的物种和组织类型信息,比如研究的是人肝内胆管癌,可在PubMed搜索框中输入“Single-cell transcriptomic intrahepatic cholangiocarcinoma”关键词进行搜索,左边也可以通过拖动时间条来选择文章的发表时间,选择排名比较靠前的文章,比如这里选择第一篇文章《Single-cell transcriptomic architecture and intercellular crosstalk of human intrahepatic cholangiocarcinoma》进行下载查看。

2)单细胞文献中首先会针对研究样本绘制单细胞图谱,通过文献中的单细胞图谱可以看到该研究检测到的细胞类型,以及定义这些细胞类型所用的maker基因,通常会利用热图、小提琴图、气泡图、t-SNE/UMAP聚类分布图等对marker基因进行可视化展示。例如在这篇文章中通过已知的marker基因及CNV分析共注释到了10种细胞类型,分别为:B cells、Cholangiocytes、Dendritic cells、Endothelial cells、Fibroblasts、Hepatocytes、Macrophages、Malignant cells、NK cells、T cells,同时也对各细胞类型的marker基因进行了可视化展示,如果您研究的物种和组织类型信息和该文献一致,就可以参考该文献中的marker基因来进行细胞注释。

#### 除可视化图片注释外,还可以基于表格注释

细胞注释需要对细胞聚类结果中的每个cluster依次进行,以百迈客结题报告结果文件夹中的cluster0为例,进行该cluster的细胞类型注释:

1)首先依照路径biomarker_Web_Report\BMK_3_seurat_analysis\BMK_3_Integrated\BMK_4_MarkerGene\BMK_1_Statistics,找到All.cluster0.diff_featuregene这个表格;

2)然后基于数据库/文献查找到的已知marker基因列表,在All.cluster0.diff_featuregene表中对已有marker基因进行检索,将能够检索到的marker基因在cluster0中的log2FC值、pct.1值、pct.2值进行记录(log2FC代表对应基因在cluster0中的差异表达水平,pct.1值代表cluster0中表达该基因的细胞比例,pct.2值代表除cluster0外其他cluster表达该基因的细胞比例);3)将所有marker基因全部比对结束后,对比各个细胞类型的marker基因的log2FC值,pct.1和pct.2,该细胞类型表达的marker基因越多、log2FC值越大、pct.1值越大、pct.2值越小,证明cluster0注释为该细胞类型的可能性越大;如下图所示,基于列表中高表达的基因和T细胞的marker基因基本吻合,故将cluster0注释成T细胞;

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,922评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,591评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,546评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,467评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,553评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,580评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,588评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,334评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,780评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,092评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,270评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,925评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,573评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,194评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,437评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,154评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,127评论 2 352

推荐阅读更多精彩内容