10X单细胞(10X空间转录组)整合分析批次处理之细节(harmony)

hello,下半年开始,我们也要开始新的工作了,今天我们需要解决的问题有两个。

(1)细胞亚群细分的时候仍然要分开样本去除批次效应???harmony

(2)harmony算法是不是刚才是整合分析就用,还是说再分群再用???

其实就是涉及到harmony整合分析的问题。

首先第一个问题,再分群批次去除的问题。

我们做肿瘤研究的单细胞数据,一般来说会选择初步很粗狂的定义大的细胞亚群,比如我常用的 第一次分群是通用规则是:

  • immune (CD45+,PTPRC),
  • epithelial/cancer (EpCAM+,EPCAM),
  • stromal (CD10+,MME,fibo or CD31+,PECAM1,endo)

然后绝大部分文章都是抓住免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群。说起来很简单,但是实际上每次做到单细胞数据集的细分亚群就非常的头疼,尤其是myeloid的髓系,(单核,树突,巨噬,粒细胞)有时候根本就分不清楚,而且分完之后仍然是可以继续细分。

我尝试对它这个数据集进行数据分析图表复现,比如单独把髓系拿出来进行重新降维聚类分群,然后可视化如下所示:

load(file = 'sce_recluster.Rdata')
p1=DimPlot(sce,reduction = "umap",label=T
        ,group.by = 'Cell_type') 
p2=DimPlot(sce,reduction = "umap",label=T
        ,group.by = 'orig.ident') 
table(sce$orig.ident,sce$seurat_clusters)
p3=DimPlot(sce,reduction = "umap",label=T) 
library(patchwork)
p1/p2/p3

可以看到pDC这个细胞亚群,由 4和8群组成,而且包含多个病人!

但是p07这个病人就非常的诡异,这个样品里面的多种髓系细胞居然是与其它病人样品的髓系细胞距离超级远!

图片

但是如果你harmony处理一下,然后再降维聚类分群,代码如下所示:

load(file = 'main_sce_recluster.Rdata')

sce.all.filt=sce
library(harmony) 
sce.all.int <- RunHarmony(sce.all.filt,
                          c( "orig.ident" ))
names(sce.all.int@reductions)
harmony_embeddings <- Embeddings(sce.all.int, 'harmony')
harmony_embeddings[1:5, 1:5]

sce.all.int=RunTSNE(sce.all.int,reduction = "harmony", dims = 1:30)
sce.all.int=RunUMAP(sce.all.int,reduction = "harmony",dims = 1:10)

sce=sce.all.int
sce <- FindNeighbors(sce, reduction = "harmony",dims = 1:15)
sce <- FindClusters(sce, resolution = 0.8)

load(file = 'after_harmony/main_sce_recluster.Rdata')
p1=DimPlot(sce,reduction = "umap",label=T
           ,group.by = 'Cell_type') 
p2=DimPlot(sce,reduction = "umap",label=T
           ,group.by = 'orig.ident') 
table(sce$orig.ident,sce$seurat_clusters)
p3=DimPlot(sce,reduction = "umap",label=T) 
library(patchwork)
p1/p2/p3

出图如下:

图片

可以看到这个时候的p07这个病人不会在独立成为一个亚群啦,而且呢,pDC这个细胞亚群也比较纯粹一点了,说明再分群的时候,需要去除批次效应。

第二个问题:harmony是不是一开始就用。

我们以这个单细胞转录组文献,《Single-cell transcriptomics reveals regulators underlying immune cell diversity and immune subtypes associated with prognosis in nasopharyngeal carcinoma》为例子,15个鼻咽癌样品,加上1个正常人样品。全部的样品的单细胞转录组数据整合后,如果不使用harmony等算法去除样品差异,默认的降维聚类分群,如下所示:

图片

我们根据左边的标记基因以及生物学背景知识,可以进行如下所示的命名:

图片

<figcaption style="margin-top: 5px;text-align: center;color: #888;font-size: 14px;"> </figcaption>

可以看到,效果还不错,很有意思, 给大家的感觉是 harmony等算法去除样品差异并不是必须的。但是如果我们具体到每个样品,有如下所示的现象:

图片

可以看到,首先上皮细胞大的亚群里面,每个病人独立成为小亚群,泾渭分明,这个符合预期,因为每个肿瘤病人都有自己的特异性。但是免疫细胞各个亚群里面,病人之间的界限就模糊很多。值得注意的是P07这个病人的样品,它主要是T细胞和髓系细胞,而且是独立成为一个亚群了,这就是单细胞转录组的样品差异,理论上是需要去除的!

有意思的事情就来了

如果我们在样品层面就开始使用harmony等算法去除样品差异,又会导致另外一个可怕的事情发生,如下所示:

图片

<figcaption style="margin-top: 5px;text-align: center;color: #888;font-size: 14px;"> </figcaption>

就是本来是应该是具备病人特异性的上皮细胞,这个时候被抹除了样品差异。

好好的上皮细胞,被拆分的七零八落,如下所示:

图片.png

我们也可以以病人样品视角来看:

图片

这个算法真的是太可怕了,样品差异被抹除的干干净净了!这不是最可怕的,真正的问题是,这个上皮细胞被打散到了其它免疫细胞里面,因为这个harmony算法!我们可以对上皮细胞的最重要的marker基因EPCAM进行如下所示可视化,并且使用harmony等算法去除样品差异前后可以对比看看。

harmony虽好,但也不要贪杯啊

©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,616评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,020评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,078评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,040评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,154评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,265评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,298评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,072评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,491评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,795评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,970评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,654评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,272评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,985评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,815评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,852评论 2 351

推荐阅读更多精彩内容