一文解决单细胞亚群注释的所有问题

好久没更新了,上来小编得写一个有分量的推文暖暖场。其实细想一下,不能全归因于平时太忙(还是太懒了),因为最近看到其它很多小伙伴做的很好且都在不断更新。其实抽出时间写一写推文对个人整理知识和练习写作能力都是很有帮助的!

Immugent

Immugent最近一直在做单细胞的课题,期间收集了各种细胞注释的marker基因,本次分享主要就针对这个主题展开。

单细胞测序技术是近十年最火爆的生物学技术之一,它赋予我们在单个细胞水平研究科学问题的能力。虽然单细胞技术目前已经发展的很成熟,商业化的10X平台让很多科研团队有自己做单细胞测序的能力,但是并不是每一项通过单细胞测序得到的结果都能成功发表。小编身边就有很多认识的朋友做了单细胞测序,但是没有分析出任何可用的结果,最终砸手里了。


10X平台

单细胞测序既然是在单个细胞研究科学问题,那就引出了其分析流程中很关键一步--细胞亚群的注释。别小看这简单的一步,它可以说是单细胞测序研究成败的最关键因素之一,因为后续的分析都是基于这一步开展的,如果开头都是错的,那后续分析出的任何结果都是没有意义的。

理论上来说,每一类细胞都有自己独特的标志基因,就像我们做流式一样,根据表达的蛋白来对细胞进行定义,而且既然是单个细胞水平的测序结果,这应该没有什么难度。但和其它技术一样都会有自己的不足,而单细胞测序(10X)同样也有自身解决不了的问题:

  1. 基因转录组水平的表达代表不了蛋白水平的情况
    最明显的就是对用流式分选出的细胞进行单细胞测序后发现注释出的细胞群比例和起初不同;

  2. 测序深度不够,导致很多droupout的现象
    最明显的反应是CD4这个分子的表达,跑流式时我们可以清楚的将T细胞分为CD4+和CD8+的两群细胞,而在单细胞测序中我们发现CD4阳性的细胞明显减少;

  3. 单细胞测序技术具有基因的偏好性
    目前主流的10X单细胞测序平台主要是对具有polyA尾的基因进行捕获并进行测序,这样也就抓取不到没有polyA的基因,而且对于一些分泌性蛋白基因的捕获效果也不尽如人意,如具有免疫抑制功能的细胞因子IL10,在小编分析的很多单细胞数据都没有检测到它的表达。

    这样看来有一部分人可能就会对单细胞测序技术产生质疑,觉得它不能代表真实情况,但是试问一下,现在有哪一项生物技术真正做到毫无瑕疵呢?出现问题肯定就会有解决的办法,上面也说了只是对一部分基因具有偏好性,那么只要能够找到足够多的细胞标志基因,综合多个基因一同考虑,那这些也就不再是问题了。

如下图是一篇做正常肾组织单细胞文献中用到的标志基因:

肾组织标志基因

如下图是对肿瘤组织中常用的标志基因进行的总结:

肿瘤组织标志基因

这两个表已经总结的相当全面了,但是在实际进行细胞亚群注释时应当遵循一定原则,小编提供以下思路来进行参考:1. 首先应根据免疫细胞的marker(PTPRC)在全局上定义出免疫细胞和非免疫细胞,因为相对于非免疫细胞,免疫细胞的种类不仅多而且功能各异;2. 其次就是对这两类再细分群,非免疫细胞可分为上皮细胞(EPCAM),内分泌细胞(PECAM1),纤维细胞(FAP)等;免疫细胞可首先区分为天然免疫细胞:NK(NCAM1),Mac(CD68),DC(XCR1),中性粒(MNDA)和肥大细胞(TPSAB1)等;适应性免疫细胞:B细胞(CD19,CD79A)和T细胞(CD3D,CD3E),到这非免疫细胞和天然免疫细胞差不多说完了,下面进一步说下更为复杂的适应性免疫细胞亚群;3. 适应性细胞中的B细胞相对好区分,就是在B细胞群基础上再多区分一群浆细胞(IGKC,MZB1); 最后就说一下这个T细胞,T细胞群的注释可谓是最复杂的,第一步可以简单在大群上区分出3种:CD4 Tconv(CD40LG,MAF), Treg(FOXP3,IL2RA)和CD8 T(GZMB,NKG7)细胞;接下来就需要根据功能状态把CD4 Tconv和CD8 T分为Naive(SELL,CCR7), Effector(PRF1,CCL5),Effector-memory(IL7R,EOMES), Exhausted(LAG3,TIGIT)了。

在对各种细胞亚群进行注释的过程中T细胞的注释是最复杂的,而最最复杂的是对各种CD4 T细胞的注释。正如上面抛出的一个问题所介绍的,因为CD4基因的表达不太容易像CD8A/B那样容易被捕捉到(最新的解释可能是因为CD4分子在实验过程中有内吞现象),因此对CD4 T细胞的亚群注释是难上加难的。但是小编这里根据自己免疫学知识来给大家介绍另一种比较靠谱的解决方式,那就是通过各种CD4 T细胞的转录因子来注释。

首先原始的CD4 T细胞在受到TCR信号刺激的情况下会朝着各种CD4 T细胞亚群的方向分化,而这每一种不同亚群的命运是由各种转录因子来决定的,其中最重要的就是Signal transducer and activator of transcription (STAT)。从下图我们也可以看到,正是由不同的STAT来诱导CD4 T细胞朝着不同的方向发育,并且相对于其它种类的基因,转录因子的表达更加稳定保守,所以就比较容易被单细胞测序平台所捕获,因此,利用各种CD4 T细胞亚群的表面蛋白联合关键转录因子就能对CD4 T细胞亚群进行更准确的注释。

CD4 T细胞分化轨迹

好了,本次的分享到这就结束了,下次小编将继续这篇推文的内容,介绍一下如何利用生信软件,同时利用多种标志基因的综合评分对细胞亚群进行注释,敬请期待!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,699评论 6 513
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,124评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 167,127评论 0 358
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,342评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,356评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,057评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,654评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,572评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,095评论 1 318
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,205评论 3 339
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,343评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,015评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,704评论 3 332
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,196评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,320评论 1 271
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,690评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,348评论 2 358

推荐阅读更多精彩内容