2024-05-30 文献阅读记录--《秀丽隐杆线虫全身的单细胞精度转录因子表达图谱》

文献阅读记录

标题:秀丽隐杆线虫全身的单细胞精度转录因子表达图谱

英文标题:A full-body transcription factor expression atlas with completely resolved cell identities in C. elegans

一句话简介:作者开发了一种自动注释秀丽隐杆线虫L1期幼虫三维图像堆栈中细胞类型的方法,并分析了每个细胞中620种转录因子的报告基因表达。
原文链接:https://www.nature.com/articles/s41467-023-42677-6

背景:

(1)细胞分型依赖于细胞表型(如分子、形态、功能、生理或者发育),但细胞RNA测序采用无监督或者Marker 基因引导聚类讲细胞组织成具有生物学意义的组正在改变我们对细胞类型的定义和看法。基于分子特征定义的细胞类型的意义有赖于其转录程序和细胞表型相关性的建立和验证。
(2)秀丽隐杆线虫的表型已经在单细胞分辨率下得到了很好的表征:包括整个发育过程中不变的细胞谱系、基于功能和形态的细胞类型的完整图谱。然而通过转录谱准确、全面的确定全身单个细胞的身份是一项长期的挑战。
(3)然而,从另一个角度出发,有望利用图像分析工具和报告基因表达技术,开发出在3D图像堆栈中准确识别秀丽隐杆线虫给定细胞类型和分析感兴趣基因表达的方法。
因此,作者在这项工作中,开发了一种应用拓扑保留匹配模型来自动注释L1期幼虫3D图像堆栈中所有558个细胞的方法,并使用图像分析解析了620个转录因子的报告基因表达。

结果

1. L1期幼虫3D图像栈中的自动细胞注释

为了开发一种自动化注释3D图像中细胞类型的方法,作者首先收集了100张使用confocal 显微镜拍摄的L1期幼虫DAPI染色的3D图像(S1A),并且手动注释了每个图像中所有细胞核的细胞身份作为训练集(S1B,C)。然后利用这些数据创建了一个最佳的数字模板。

image.png

然后,他们开发了基于稳健点匹配和分段仿射的细胞注释(RAPCAT),自动将新3D图像中的558个细胞与最佳数字模板进行匹配,并完成细胞类型注释和注释度打分。在手动整理标记细胞之后,RAPCAT 重新分配细胞身份的平均准确率是 97%。
总之,作者开发了RAPCAT工具,可以高精度,自动注释L1期幼虫3D图像栈中所有细胞的身份。

image.png
  • Fig 1. RAPCAT算法自动进行细胞注释

2. 具有单细胞分辨率的原位TF表达谱

作者获得了涵盖秀丽隐杆线虫657个转录因子的荧光蛋白报告株(234来自馈赠 + 452 自行构建),其中620个TF的报告基因在刚孵化的L1幼虫中表现出了可检测的荧光活性。这些报告基因株采用不同的技术构建,包括864个由微粒轰击法产生的品系,14个由mos1介导的单拷贝整合法产生的品系,以及41个fosmid转基因TF融合蛋白报告株和23个Cas9介导的TF敲入株。这些品系通过DAPI染色和共聚焦扫描,共生成了1055个3D图像,他们结合手动注释和RAPCAT注释了所有图像中的细胞。然后使用VANO 软件生成了每个图像中报告基因的表达信号数据,最后整合生成所有 558个细胞中每个TF的表达谱(Fig2A)(对于有多个类型报告基因株的TF,则选择忠实度更高的报告基因类型)。

image.png
  • Fig 2. 单细胞分辨率的全身TF表达谱

作者接下来比较了相同品系和不同品系间报告基因表达的相关性,发现同一品系间报告基因的表达模式是高度正相关的,R>0.81,说明细胞核注释准确,并且报告基因表达是可重复的。然而,不同品系间同一TF的报告基因表达的相关性要略低于品系内的相关性,说明不同线虫品系之间转基因整合位点的差异可能导致基因表达模式的差异(Fig 2B)。由于启动子融合报告基因可能并不总是能完全重现其相应基因的表达模式,因此作者通过与此前发表的成虫数据中共有的84个TF的表达谱进行比较,来分析它们的影响程度。这些数据中包括了58个启动子融合报告基因、22个基于fosmid的报告基因和4个敲入报告基因,其中fosmid和敲入报告基因作为黄金标准。
然后他们将靶基因分为四类:(1)上游基因间序列>7kb, 上游基因间序列 < 1kb, 含有 > 1kb 内含子基因和所有其他基因(无明显长度特征,但被认为包含驱动其表达所需的必要和充分的调控元件,称为高上下文启动子报告基因)。 分析结果显示:高上下文启动子报告基因的表达与成虫TF谱中的表达具有很强的相关性(ROCAUC=0.92),类似于金标准fosmid/knock in 报告基因与成虫TF谱之间观察到的相关性(Fig 2C)。在他们整个的研究中,296个TF是高上下文启动子报告基因,263个TF为与成虫TF谱相关性较弱的低语境启动子报告基因。

接下来作者他们将报告基因表达谱与之前发表的晚期胚胎和L2幼虫的scRNA-seq数据集进行了比较,表明胚胎scRNA-seq谱与新孵化的L1期幼虫的报告基因表达谱的相关性高于与L2期幼虫scRNA-seq谱的相关性(Fig2D)。在他们的报告基因筛选中,发现了16个在体壁肌束前后方向呈现差异表达的TF, 其中75%(12个) 在scRNA-seq数据中也显示出前后表达模式,两者保持一致(Fig2E-H)。这些结果说明原位报告基因表达谱与相邻发育阶段的scRNA-seq数据非常匹配,但细胞身份完全确定。-- 疑问:为什么不进行相应的 L1期幼虫的scRNA-seq 来比较与原位报告表达的异同 ?

3. 细胞分类中的表型与TF分析

为了进一步分析细胞表型分类和TF之间的关系,作者通过将上一部分获得的转录因子报告基因表达谱对556个体细胞进行了层次聚类,并将聚类结果与基于表型的细胞分类结果进行了比较(Fig3)。

image.png
  • Fig3. 根据报告基因表达对556个体细胞进行层次聚类
  • 上图从内往外总共分为五层,最内圈是TF表达谱的层次聚类树状图,往外又可以分为两部分,第二三层代表基于表型粗的细胞类型分类注释,第四五层代表精细的细胞类型分类注释。

如果基于分子的聚类可以完全区分不同表型的细胞类型,那么不同表型的细胞类型应该是在聚类图中呈现单独的进化枝。然而结果显示,在144种精细表型细胞类型中,有76%是分布为单个进化枝,Fig3 图中最外圈标注出了这些细胞类型,这说明表型和分子模式之间是存在高度一致性的。同时,我们在第四层可以看到同一进化枝中包含多种表型细胞类型的情况存在,这也说明基于表型的分类与分子聚类之间存在差异。
为了研究转录分化细胞如何共享相似的表型,作者他们在多进化枝细胞类型中进行了分子亚型分析,他们使用TF表达谱计算不同亚型之间的JSD值,以量化它们之间的转录差异。结果显示,神经元,神经胶质细胞、皮下组织、咽肌和神经母细胞中JSD评分最高,即转录差异较大。

4. 神经元和神经胶质细胞亚型表达不同数量的TF

为了对不同细胞类型的TF表达进行更深入的研究,作者首先对神经元和神经胶质细胞进行了亚型分析。首先,他们发现在整个细胞聚类树中,在排除HSN,头感器和尾感器神经元之后,所有的的神经元形成一个总体的神经元亚型(Fig 4A),同样,神经胶质细胞也是除头感器和尾感器神经胶质细胞以外,能够分为总体神经胶质亚型(Fig 4B)。

Fig 4.基于TF表达谱的神经细胞亚型分析

作者分析了这几类神经元和神经胶质细胞中TF的表达情况,发现感受器类神经元中表达的TF数目显著多于其他神经元,而且头感器和尾感器中鞘细胞表达的转录因子数目也远比其他部位的鞘细胞中的多(Fig 4C)。并且之前发表的胚胎期和L2期的scRNA-seq数据也支持这一观察现象,即在头感器和尾感器中表达的TF明显多于其他神经元或神经胶质细胞中表达的TF。而在另一种HSN(雌雄同体特异性神经元)中,作者发现在所有分析的TF中,有86%的TF在HSN中的表达都处于最低水平(Z2/3为生殖细胞,存在转基因沉默现象)。他们提出一种可能的解释是:HSN静止状态特有的TF广泛下调。
为此,他们挑选一些在成虫期HSN和邻近细胞中表达量相近的TF来进行研究,并详细分析了两个报告基因sage-2和sma-9 在不同虫期的表达情况。在L1期幼虫的DAPI染色图中(Fig 4G,4H)可以看到,这两个报告基因在HSN中的表达明显弱于邻近细胞PHB中的表达。从表达量时期变化图中(Fig 4I)可以看到HSN中的TF的表达抑制现象从胚胎分化后持续到L2

5. TF 表达谱与形态学之间的一致性

在前期基于TF表达谱的聚类分析中,作者确定了四种神经母细胞亚型,即K, G1/G2/W, V5/Q/T和K(Fig 5A)。尽管在进化枝上,这些细胞亚型的邻近位置是不同的细胞类型,但它们具有非常相似的形态。例如,L1期幼虫的神经母细胞具有各种上皮细胞形态,尽管它们在发育过程中增殖产生神经细胞子代。另外,JSD距离分数热图显示(Fig 5B),K和G1/G2/W型神经母细胞基因表达差异最小,这也与它们相似的上皮形态相一致。
因此,作者推测亚型内的分子异质性可能有助于不同神经母细胞亚型间相似的TF调控程序的发现。

Fig 5.G2/W神经母细胞胚胎后细胞谱系的调节程序

作者通过计算四种神经母细胞之间的标准化JSD得分,发现在P和G1/G2/W神经母细胞之间具有最小的标准化JSD得分(Fig 5C)。为了分析G1/G2/W和P神经母细胞之间是否存在共享的TF调控程序,作者分析了已知的四种P神经母细胞调节子中的三种在G2/W神经母细胞中表达的TF(ref-2、vab-15和tlp-1)的功能。在ref-2 敲低的线虫中,G2(Fig 5E,L)和W神经母细胞(Fig 5H,M)产生的后代都比野生型少。然而,在tlp无效突变株中没有在G2(Fig 5I)和W(Fig 5L,M)中观察到明显的表型。当敲低vab-15时,ref2在G2中显著下调但是在W几乎不变。然而,在tlp-1 无效突变中敲低vab-15,会导致W细胞中ref-2的显著下调。但是vab-15和 tlp-1之间的协同作用没有在G2中被观察到。

总之,这部分结果显示基于TF分类的G2/W和P神经母细胞亚型之间共享TF(ref2,vab15和tlp-1)转录调控程序。

6. 胚胎后TF与胚胎谱系表达的相关性

由于作者在前面的分析中发现TF表达在不同细胞表型的亚型之间可能存在显著差异,因此他们接下来研究了表型同质细胞类中TF表达的变化。在Fig 3的TF聚类图中,作者发现 47%的簇仅与一种表型细胞部分重叠,因此可以被指定为TF定义的亚类。因此作者进一步分析了在表型细胞类别中,亚类本身和亚类之间的胚胎细胞谱系距离,结果显示亚类内的胚胎细胞谱系距离明显短于亚类之间的胚胎细胞谱系距离。

image.png
  • Fig 6. 细胞谱系与胚胎后TF表达模式的关联

由于密切相关谱系中的细胞,通常占据相同或者相近的位置,空间表达模式可能会影响谱系判定。因此,作者重点研究了TF表达变化与任何空间模式均不一致的细胞,例如腹侧体壁肌束,其中插入了MS衍生和C-/D衍生的细胞,并检测到了18种谱系依赖性TF(Fig 6B)。其中有两个(hmg-11和unc-130)即使在幼虫发育完成后仍在前体壁肌肉中保留其谱系依赖性表达模式。

在L1阶段,有159个双边细胞对可以观察到相同的形态和功能,并且这159个细胞对中有97个在细胞谱系上是对称的,而另外62对是聚合细胞对,它们的左右的细胞配偶具有不对称的细胞谱系历史。
在L1阶段的TF 谱中,不对称TF表达明显比来自对称谱系的TF表达丰富。在成虫中,大多数TF都失去了表达不对称性,尽管如此,三种TF(nhr-67, ceh-27和ref-1) 保留了它们的表达不对称性。总之,这些数据支持了胚胎细胞谱系对胚胎后基因表达的显著影响,而且这种谱系依赖性可能在整个胚胎后生命中持续存在。

7. 趋同进化中的谱系特异性TF

在整个报告基因谱中,肠道肌肉细胞具有数量最多的不对称TF(Fig 6D)。其中Six/SO 家族同源框TF unc-39 呈现典型的谱系特异性表达模式,并在MS.(a/p)pa的所有胚胎子代细胞的L1阶段表达,包括五种细胞类型。其中两种细胞类型(M成肌细胞和体腔细胞)仅由MS.(a/p)pa谱系产生,另外三种ent.m,BWM,GLR是融合细胞。其中M成肌细胞和体腔细胞均表达unc-39,在融合细胞中,如ent.m(绿色,它有多个来源MS,ABplp,ABprp),这些ent.m细胞中只有MS谱系来源的子代细胞表达unc-39. 同样b.w.m(蓝色)中只有部分MS来源的细胞才表达unc-39(Fig 6F)。
为了进一步研究unc-39在肌肉类型趋同分化中的作用,作者构建了unc-39(gk798)突变体,前面提到肠道肌肉细胞来源于两个谱系,即MS.lineage和AB.lineage,当unc-39突变后,作者发现L侧ABlinage来源的imL/AB.plpppppaa细胞仍然表达marker基因arg-1和非横纹肌特异基因msl-1, 而R侧MS来源的imR/MS.ppaapp则不表达这些基因(Fig 7A,B)。由此可见,unc-39是一种谱系特异性TF,参与肠道肌肉类别的趋同分化。

Fig 7.肠道肌肉对发育过程中谱系特异性TF unc-39和hnd-1的不对称需求

接下来,作者开始寻找调节左侧 imL/AB.plpppppaa细胞的调节因子,他们关注到了一个在左侧imL/AB.plpppppa 肠道肌肉细胞中表达明显强于imR/MS细胞的转录因子 hnd-1(Fig 6G,H),这种不对称表达可以一直持续到2天期成虫。接着,他们就构建了hnd-1突变株来探究hnd-1基因的功能,在突变株中,肠道肌肉仍然表达marker基因Arg-1,但是L侧细胞的形态是异常的(Fig 7D,E)。为了进一步研究,hnd-1在胚胎后的作用,他们生成了一个hnd-1体细胞敲除株,其中Cas9由热休克启动子驱动,当热休克条件刺激时会激活Cas-9启动子从而条件敲除hnd-1基因。他们首先在刚孵化的L1期幼虫进行了热休克处理,发现imL/AB.plpppppaa细胞的指状突起明显少于imR/MS.ppaapp(Fig 7F,J)。同样在成虫中,条件敲除hnd-1基因时,也可以观察到imL/AB.plpppppaa细胞的形态异常(Fig 7G,J)。
总之,上述结果表明谱系依赖性转录因子TF, unc-39和hnd-1 以镜像模式表达,并在肠道肌肉融合中发挥不对称作用。并且hnd-1的不对称表达和作用在幼虫发育结束后仍然存在。

讨论与总结

(1)开发了RAPCAT算法,可以自动注释L1幼虫3D图像中的所有细胞身份;
(2)构建了多个TF的报告基因株,并分析和量化了单细胞分辨率下TF的原位表达;
(3)使用TF谱重新对表型类型进行了分类,并根据TF表达变化的将异质分子簇的表型细胞类型进一步划分为亚型。
(4)通过实验验证了谱系发育中的TF协同调控程序,以及在不同谱系细胞融合为相同表型细胞过程中,多个谱系特异性转录因子不对称作用,加深了我们对细胞分化和分型的理解。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,222评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,455评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,720评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,568评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,696评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,879评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,028评论 3 409
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,773评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,220评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,550评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,697评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,360评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,002评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,782评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,010评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,433评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,587评论 2 350

推荐阅读更多精彩内容