文献
2022
Developmental Cell
Dynamic chromatin state profiling reveals regulatory roles of auxin and cytokinin in shoot regeneration
主要作者介绍
本文的通讯作者王佳伟老师,现在是中科院植物生理生态 研究所的研究员,他的研究方向主要是利用基因编辑和组学技术研究植物时序性发育和生命周期。
研究背景
随着基因编辑技术的快速发展,植物再生效率低 逐渐成为未来作物设计和改造 的瓶颈。植物的芽再生一般分为两个步骤:首先,离体植物组织或者说外植体在 愈伤组织诱导培养基(CIM)上 诱导愈伤组织的形成,接下来在 芽诱导培养基(SIM)上诱导芽的发生。CIM富含生长素,生长素和细胞分裂素比例高;SIM富含细胞分裂素,细胞分裂素和生长素比例高。
过去十几年的研究表明,芽的再生过程经历了转录水平的大规模重塑,然而生长素和细胞分裂素 如何在染色质水平 依次调控 外植体细胞 的命运 转变仍不清楚。
结论1 染色质状态图谱
Fig 1a
文章的第一部分,作者用两种测序方式去构建 芽再生过程中 染色质状态的图谱。
如图1a,作者选定了7个时期,按时间顺序分别是处理0天,移到CIM培养基处理3天、5天、7天,然后移到SIM培养基上继续处理3天、6天和8天。对这七个时期,作者都做了RNA-seq和ATAC-seq,然后对图中标记橘黄色的三个时期做了这7种组蛋白的ChIP-seq。
简单介绍下这7种组蛋白:
H3K9me2和H3K27me3在植物中往往定位于异染色质区域;
H3K9me3和H3K4me3在植物中分布在常染色质和转录基因区域;
H3K36me3修饰与愈伤组织形成和创伤诱导的根再生有关,通常与转录激活有关;
H3K4me1和H3K27ac在哺乳动物基因组往往分布在增强子区域。还利用两种抗体做了RNA聚合酶Ⅱ的ChIP-seq,用来检测RNA聚合酶Ⅱ的位置。
为了利用这些组学数据定义和区分染色质状态,作者用到了ChromHMM软件,ChromHMM可以根据ChIP-seq数据来定义和区分不同的染色质状态,默认可以将染色质分为15种状态。
Fig 1b
根据这个软件的预测,可以分成15种染色质状态。图1b横向看每一行就是对应了每一种染色质状态。
纵向看第一个表明这批数据是哪个时期的,这个图用的是在SIM处理3天的数据,第二个热图表示ATAC-seq信号强度以及7种组蛋白 和两种抗体拉的RNA聚合酶Ⅱ的信号强度,第三个柱状图是coverage,由于ChromHMM软件定义染色质状态时按照一定大小的bin划分然后统计的,所以这里的coverage就是这一类染色质状态的bin占全基因组长度的比例。第四个热图是对这些bin对基因组不同特征进行了注释,第五个boxplot代表这些bin的序列在所有十字花科物种中的保守性,一般而言那些更重要的bin更保守,第六个和第七个boxplot分别是RNA-seq和ATAC-seq的boxplot表示转录和可及性的FPKM
整体上看红色框标记的是那些转录活跃,染色质开放的区域,黑色框标记的是转录被抑制,染色质致密的区域。没有被标记的S10染色质高度开放,但是看到了较低的转录活性。
这15种染色质状态又可以对应6大功能类。
1.S1-S4与转录区域高度共定位,可以认为是转录状态,但是S1仅仅高度富集H3K4me1,生物学功能还不是很清楚,作者暂且称它为H3K4me1 island 2.S5是下游调控区,因为它在3’ UTR和TES的侧翼区域中过度表示,并且可及性较高 3.S6-S9可以认为是启动子区域或者说TSS侧翼区域,H3K9me3、H3K27ac、H3K4me3和H3K36me3这些激活型组蛋白标记均高度富集 4.S11-S14是异染色质状态,更富集H3K9me2 和 H3K27me3 5.S15可以算是一个背景状态
Fig 1c
S10被认为是增强子区域,因为它有较高的染色质可及性以及最丰富的转录因子结合位点。
总体而言,作者提供的数据集绘制了芽再生过程中表观遗传、染色质可及性以及转录活性的全局视图。
Fig 2a-b
Fig 2c
然后作者选定了在CIM培养7天和在SIM培养3天两个时间,用圈图之间的连线表示不同染色质状态的转变,b图表示从CIM上培养七天到SIM上培养三天的每个染色质状态的过渡事件的百分比。例如,CIM7中20.8%的S1区域经历染色质转变。可以发现整体上有大量的染色质状态在这两个时期发生了转变。并且在异染色质区域,发生了非常多的S13-S14的转变。
因为S10标志着结合转录因子的染色质开放区域,所以作者仔细研究了S10状态的转换,在S10的转变分为两种,一种是从其他状态转入S10,一种是从S10转到其他状态。有65.7%的区域从S10转入了S15,根据GO富集,这部分基因主要参与生长素反应,侧根发育和根形态发生。
50.23%的区域从S15转入了S10,根据GO富集,这部分基因与表皮细胞分化、细胞分裂素反应以及次生代谢相关。
结论2 CIM-SIM过程染色质可及性的改变
Fig 3a
为了更好的描述在这七个时期可及性的动态变化,作者把七个时期call到的peak merge起来,然后利用k-means聚类把可及性的动态变化分成了十个cluster,在Fig 3a上分别是C1-C10,右边显示了每一个cluster中具有代表性的基因,折线图代表的每一个cluster可及性的变化趋势。
Fig 3b
C1表示在CIM上逐渐失去可及性,转到SIM后逐渐获得可及性,这部分涉及的基因主要与细胞的伸长和分化相关,作者还发现了几个与光合作用相关的基因。并且用转录组数据看了可及性的降低和升高对应了转录的降低和升高。
C4中的位点在CIM上显示出可及性逐渐增加,一旦转移到SIM上,这些地方就关闭了,GO富集分析显示这些基因与全能性相关。
C5和C9在CIM上培养时也是可及性逐渐增加,当转移到SIM时,没有像C4那样直接关闭,而是仍保留一定的可及性。这部分涉及的基因与芽发育相关。所以作者认为 高浓度的 生长素 可以通过 提高芽再生相关基因 的可及性来启动芽再生。作者在这里还发现CUC2/REV和KAN1 这几个与芽再生密切相关的基因 直到在CIM培养第五天 才表现出开放并表达,这可以部分解释 为什么 现在的芽再生方案 要求至少在CIM上培养五天。
C2在CIM中可及性较低,表达量较低,转到到SIM后可及性逐渐上升 并表达。这一类基因与响应细胞分裂素和芽发育相关。并且在这里还发现了ARR基因,这是一类响应细胞分裂素的反应调节因子。目前在拟南芥基因组中共发现了10个A型的ARR基因和11个B型ARR基因。B型ARRs基因可分为3个亚家族, 它们都具有一个保守的信号接收域和一个大的C端延伸结构域, 在C端延伸结构域中有保守的GARP结构域, B型ARR 可以通过GARP结构域 直接和靶基因结合 并激活其转录。
Fig S6b–S6d
Fig 4a
在SIM中细胞分裂素 一般是通过诱导芽发育相关的基因促进芽再生。然而,目前尚不清楚细胞分裂素是否也在CIM中发挥重编程功能。为了研究这个问题,作者比较了野生型和B型ARR基因的突变体之间的染色质可及性差异。作者重点研究了ARR1-ARR10-ARR12三个基因,发现三者存在一定的冗余性,单突、双突的表型没有非常明显,直到三突才有了非常明显的变化 (Fig S6b–S6d)。并且利用它们的可及性数据做PCA,表现出了一致且明显的趋势(Fig 4a)。
Fig 4b-c
BP、PHV和REV等芽识别基因以及PLT3、PLT5和PLT7等多能基因在野生型和三突幼苗中的可及性相似,基本没有变化,但是培养在CIM和SIM上培养会发现这些基因的可及性在三突中下调。刚刚提到了ARR是响应细胞分裂素的下游调节因子,在没有外缘细胞分裂素的时候,这个调节因子无论在还是不在,基本没什么影响,但是一旦有了外缘细胞分裂素的进入,缺乏ARR会导致许多基因可及性下调(Fig 4b-c)。
Fig 4f
作者由此构建了一个模型,如图,粉红线条代表前面的cluster1,可及性逐渐关闭,这部分涉及的基因主要与细胞的伸长和分化相关,紫色线条代表前面的cluster4,在CIM中培养过程中可及性增大,转到SIM后可及性关闭,这部分基因与全能性相关,橘黄色线条代表前面的cluster2,当转到SIM后,可及性逐渐升高,这部分基因与芽发育密切相关。在缺乏B型ARR的时候,通过细胞分裂素的作用,全能性基因以及芽发育相关基因的可及性无法建立,即推测细胞分裂素也可以在CIM中发挥重编程功能。
结论3 鉴定芽再生过程的转录因子
Fig 5a
Fig 5b
Fig 5d
作者根据TOBIAS软件的计算找到了七个时期中发挥功能的转录因子,并计算了平均得分,得分越高说明这种转录因子在芽再生过程中出现的次数越多,可能就越重要。
图a是按照得分从高到底排序,可以看到最重要的几种转录因子是bHLH, bZIP, TCP, BES1, 说明这些转录因子主要参与各个时期的芽再生。有趣的是,bZIP和TCP都与植物三维染色质结构的形成有关。
B图展示了在这七个时期,具体的转录因子的表达的活跃程度。可以发现ARF,bZIP, LBD, PLT几个转录因子家族在CIM阶段最活跃。B型的ARR、WUS、还有MYB、PIF以及IDD家族在SIM阶段更活跃,表明这些转录因子对芽形成至关重要。
D图又进一步结合热图展示了几种转录因子的活跃阶段。
Fig 5e-f
行文至此,作者要开始用 实验去验证 找到的这些转录因子 是否真的对芽再生 有影响。作者确定了四个标准去确定待验证的转录因子。
第一个标准是在TOBIAS里得分最高的转录因子家族。
第二个标准是在芽再生的某些阶段活跃的转录因子家族,这两条标准都是基于ATAC-seq数据预测的转录因子足迹。
第三个标准是利用转录组数据检测这些转录因子的表达情况,并且作者分成了两类,一类是之前已经发现被研究过的,就是左边这个热图,一类是在本文中刚发现的,就是右边这个热图。
Fig 6
第四个标准是选择那些在可及性上有明显变化的转录因子。
符合上述条件三条或者四条的被优先选择。这里需要注意下最后选出的转录因子可能对芽再生有正向作用,也可能有负向作用。
作者用到了两个指标去衡量芽再生能力,一个是再生能力,它表示每个外植体再生芽的数量,另一个是再生率,它用能够再生芽的外植体的百分率来表示。上面这个图是再生能力,下面这个图是再生率。
作者首先选择了TCP家族去验证,这个家族在芽再生过程中的功能在2020年的一篇文章中已经进行过研究。MIM319是TCP的过表达植株,JAW-D是下调TCP表达的植株,可以看到当过表TCP时,芽再生能力和芽再生率都极显著降低,当TCP表达下调时,芽再生能力有所提高。这些结果表明,TCP限制了芽的再生。
然后作者验证了BB家族,转录组测序表明,这些基因在CIM0中高表达,此后略有下降,一旦愈伤组织转移到SIM中,这些基因的表达逐渐增加。作者对BB家族中的BES1做了RNAi,与野生型相比,BES1 RNAi植株的再生芽数量增加了近4倍。之前的研究发现,BES1与三个bHLH家族的转录因子bim1-bim2-bim3有明显互作。当把bim1/2/3都突掉之后,可以看到与BES1 RNAi植株类似的表型。
转录组测序表明,BES1可能通过抑制这几个 芽识别基因 和降低内源细胞分裂素水平来抑制芽再生。
拟南芥中IDD转录因子家族一共有16个成员,属于植物特有的转录因子家族,这个家族含有ID结构域。当过表时再生的芽的 数量明显增加,idd3突变体和idd5突变体的再生率没有受到影响,但是每个愈伤组织的芽数明显低于野生型。
MYC和PIF都属于bHLH家族,myc的三突和pif的四突都表现出再生能力的显著下降。
最后,作者验证了MYB家族的MYB93和B3家族的NGA这个基因,这两个家族的启动子中观察到了SIM阶段特异性的可及峰,它们的突变体均表现出再生能力的下降。
以上结果表明,转录因子足迹分析、染色质状态、转录因子转录水平分析 以及发育遗传学使我们能够高精度地揭示与芽再生有关的转录因子。
总结
最后,总结一下这篇文章,首先亮点很明确,作者构建并描述了迄今为止在芽再生过程中最完整的组蛋白、可及性以及转录组图谱,并把染色质可及性 与芽再生关联起来。利用这些数据作者 大范围的鉴定了芽再生过程中涉及的转录因子,并进行了相应的实验验证以说明这种鉴定方法的准确性。
在最后的讨论部分,作者对这篇文章的局限性也进行了说明,由于作者用的是bulk cell 测序,而非单细胞测序,这导致在这一堆细胞中 或者说在这个细胞群体中 只有一部分 是比较重要的多能细胞和 芽的前体细胞,有一些生物学现象可能因为 被稀释而没有发现,因此构建单细胞的相应图谱 在未来是有必要的。
本文使用 文章同步助手 同步