文献
2020
Developmental Cell
Chromatin Accessibility Dynamics and a Hierarchical Transcriptional Regulatory Network Structure for Plant Somatic Embryogenesis
研究背景
植物在整个生命周期都保持细胞的多能性或全能性。植物的再生有两种方式:芽再生和体细胞胚胎发生。
植物体细胞能够在化学或机械刺激下自我再生或通过体细胞胚发生(Somatic embryogenesis, SE)再生整个植物。体细胞胚发生是指在没有受精的情况下,由体细胞或营养细胞发育成胚胎,是诱导植物细胞全能性的一种 形式。体胚发生在种质资源保存、种苗生产、分子育种和植物基础研究等方面都有着广泛的应用。因此,阐明SE的分子和细胞基础对了解植物胚胎模式和去遗传重编程的基本原理具有重要意义。
将未成熟的合子胚胎或雄配子体暴露于合成的生长素或非生物胁迫下可以诱导体细胞胚胎。在体胚形成过程中,生长素的局部生物合成和极性运输对生长素梯度的建立至关重要。生长素如何诱导细胞的全能性以及生长素如何促进胚胎发生仍不清楚。
拟南芥中的SE可以通过过表达WUS、PLT4/BBM、PLT5/EMK、AGL15、LEC1、FUS3、RKD4/GRD等基因实现。通过全基因组靶标鉴定揭示了这些不同tf之间的转录串扰,值得注意的是,BBM、LEC2、AGL15和PLT5被发现调节共同的途径,尤其是生长素。然而,来自不同家族的个别转录因子的过表达如何能够诱导SE尚不清楚,这些转录因子是否通过共同的发育途径促进胚胎发生尚不清楚。
与动物一样,表观遗传重编程在全能性和SE的获得中也起着重要作用。POLYCOMB抑制性复合物2 (PRC2)是一种染色质调控因子,通过组蛋白H3赖氨酸27三甲基化(H3K27me3)标记的沉积来维持基因抑制,它是激素介导的拟南芥成熟体细胞胚胎发育能力建立的主要障碍。有人提出,PRC2的化学扰动或遗传破坏可能通过去抑制TF基因(如AGL15、BBM、LEC1、LEC2和PLT5)来诱导体细胞胚胎发生。然而,我们对生长素、转录因子和表观遗传调控如何协同调节体细胞命运转变的理解仍然有限。
结论1 SE过程的染色质可及性及基因表达图谱
Fig 1a-b
SE可以从不同来源的外植体中直接或间接地通过胚胎愈伤组织阶段诱导。本实验中,在E5培养基上培养未成熟拟南芥胚诱导体胚形成(Fig 1a)。对7个时间点测了RNA-seq和ATAC-seq,生物学重复之间具有很好的重复性(Fig 1b)。
Fig S2a-b
与之前的发现一致,ATAC-seq信号在TSS明显富集。对这些数据一共鉴定到25,530个高可信度的可及性峰。作者将每个ATAC-seq峰根据其注释的TSS分配给最近的基因。但是需要注意的是,由于增强子经常通过远距离的染色质互作与其靶基因发生物理接触,这种基于最接近峰-基因的简单的峰-基因关联规则可能并不适用于所有情况。
所以根据峰的位置,作者进一步将所有的峰分为四组:
(1)转录起始位点上游2kb以内的峰(TTS-proximal)
(2)TTS下游1kb内的峰(TTS-proximal)
(3)编码区内的峰
(4)其他峰(distal intergenic)
超过87%(75.17/(75.17+3.12+7.73))的基因间峰属于TSS proximal(Fig S2b),因此使用该数据集进行后续分析(除了使用chromVAR进行TF motif分析)。
Fig 1c-d
PCA结果显示,48和72 HAI之间的ATAC-seq峰谱相似(Fig 1b),表明生长素诱导的染色质可及性重编程大部分在72 HAI完成。采用基于染色质可及性水平的K-means聚类方法对所有差异峰进行排序,得到9个聚类,分别命名为C1至C9(Fig 1c)。C5和C7集群在0 HAI时开放,4 HAI后失去可及性。集群C6、C8和C9表现出相似的可及性动态,在4或8 HAI时暂时可达,但随着时间延长逐渐关闭。有趣的是,在C6中发现了损伤应答基因,包括WIND1、RAP2.6和JAV1。C1和C3集群在0 ~ 8 HAI时处于封闭状态,在24或48 HAI后逐渐开放。在这两个簇中发现了PLT1、CDKB2;1、pin - formmed3 (PIN3)和PIN7等参与植物再生、生长素运输和细胞周期的基因。相比之下,属于C1、C3和C4的基因已知在分生组织维持和细胞生长中起重要作用(Fig 1d)。因此,上述结果表明,体细胞基因组可及性景观在72 h内经历了快速而大规模的转变。
Fig 1e-f
对转录组数据进行聚类,分成了7个簇(K1-K7,Fig 1e)。K5在4HAI后降低,富集分析显示这些基因主要参与种子的成熟和休眠过程,表明在上培养基后胚胎发育停止。K4的基因在4HAI时瞬间被诱导。K3在4HAI时表达增加,其中有已知的在SE过程起关键作用的基因,如BBM、LEC2和FUS3等。K2和K6在24或38HAI时高度激活,它们优先参与与细胞周期和核糖体生物发生的基因相关,这意味着外植体在这些阶段经历了广泛的细胞分裂(Fig 1f)。
Fig 1g
染色质可及性是增强子或启动子活性的必要条件,但不是充分条件,基因表达也由DNA甲基化水平和启动子的组蛋白修饰类型决定,因此基因的染色质可及性并不总是与基因表达相关。但是在大多数情况下,染色质可及性与基因表达水平是正相关的(Fig 1g)。例如,PLT1在簇C1中的表达随着近端染色质可及性的增加而逐渐增加。同样,在4次HAI后,簇C7中CAT3的表达也大大降低,并伴有近端调控元件的可达性丧失。
结论2 染色质可及性和转录组揭示层级调控的转录因子网络
Fig 2a
时间序列的ATAC-seq可以根据转录因子足迹揭示TF的层级调控。作者使用HOMER和chromVAR两款软件来鉴定TF的动态活性。bHLH和BES1的结合motif在所有簇中都高度富集(Fig 2a),C1也显著富集B3的motif,支持生长素快速诱导LEC2并在SE过程起重要作用的观点。WRKY和CAMTA的结合motif在C7和C6中显著富集,有研究表明,WRKY编码植物中关键的免疫调节因子,CAMTA1/2/3SHI 是水杨酸生物合成的主要转录因子。
众所周知,生长素通过生长素反应因子ARF转录因子家族诱导下游信号事件,但是ARF的结合motif仅在C1中发现,而在早期阶段起作用的簇中没有发现,这表明在24HAI之前,ARF不参与染色质重塑。
Fig 2d-e
此外,尽管生长素处理能快速诱导LEC2和BBM,但随着时间的推移,它们含有假定的arf结合基序的调控序列是不断可及的(Fig 2d-e),因此,高生长素水平可能在24 HAI之前发挥两个独立的作用:通过ARF诱导全能基因,并以不依赖ARF的方式引发快速染色质重塑。
Fig 2b
接下来,我们将chromVAR应用于由ATAC-seq数据集识别的所有可访问峰值。简单地说,chromVAR首先对所有具有相同的TF结合基序的可访问区域进行分组。
然后,它比较了所有含有该TF结合基序的峰的观察可及性与使用已知技术混杂物进行归一化的背景峰集。因此,尽管chromVAR不能确定由homer完成的TF结合基序的位置,但它确实提供了给定样品中TF基序活性的测量。作者使用从JASPAR数据库下载的一组拟南芥TF位置频率矩阵作为染色质特征的输入。
总体而言,chromVAR算法得到的结果与HOMER相似。例如在确定的最可变的TF基序中,在0或8 HAI时CAMTA1和WRKY是重要的TF结合基序(Fig 2b)。
bZIP转录因子家族的ABI5通过一个晚期胚胎发生丰富基因子集调控种子成熟,bZIP 转录因子结合基序在0-4 HAI的富集表明,参与胚胎成熟的基因位点发生了重编程。bHLH和BES1 TFs在SE早期起作用,WRKY和CAMTA1(后称为早作用TF)在0 - 8 HAI起作用,ARF、AP2、B3和TCP(后称为晚作用TF)在24 HAI后起关键作用。
Fig 2c
Fig 2c展示了转录因子结合motif之间的相关性,早作用TF与晚作用TF之间的相关性较低,表明这是一个顺序的、独立的基因组重塑过程。有趣的是,B3个TCP的结合motif具有高度的相关性和协同性,这意味着这两个TF家族在染色质可及性重塑中具有协同作用。
结论3 体细胞的胚胎性质是生长素诱导的染色质可及性和转录组改变的先决条件
Fig 3a-b
一般认为,只有未成熟的合子胚胎才能作为SE的外植体,然而这背后的分子机制尚不明确。为了解决这个问题,我们比较了未成熟胚胎(Em)、3日龄幼苗(G3)和3日龄幼苗在E5培养基上培养1天(G3E1)和3天(G3E3)的染色质可及性和转录组。与之前的观察一致,3天大的幼苗不能再生(Fig 3a)。ATAC-seq和RNA-seq数据生物学重复之间具有很好的重复性(Fig 3b)。
Fig 3c-d
G3和Em相比,3355个峰关闭,而527个峰变得更容易接近(Fig 3c),关闭基因与种子成熟相关的生物学过程有关(Fig 3d)。例如,脂质储存基因(OLEOSIN3,OLE3)和赤霉素代谢基因(赤霉素20-氧化酶e3, GA20ox3)倾向于被关闭。而与开放峰相关的基因则富含调控生长素信号和茎系形态发生的基因。Em和G3之间的ATAC-seq和RNA-seq数据的比较显示,染色质可及性的改变与表达水平的变化并不密切相关(Fig 3d)。这种差异可能是由于不同发育阶段基因激活的可及性需求的变化。对于一个给定的基因,在胚胎阶段基因表达所需的区域的可及性降低可能不会导致幼苗中表达水平的变化。同样,可接近性的增加可能代表基因激活的启动状态,因此不一定会导致转录水平的增加。
Fig 3e-f
特别有趣的是,我们发现ABI3、BBM、FUS3、LEC1和LEC2的调控元件在种子萌发后关闭(Fig 3c, d, f),更重要的是,这些基因座对生长素诱导的染色质可及性改变具有抗性(Fig 3d)。这些结果表明,外植体的发育阶段主导着SE的层次网络,而B3 TF基因位点在种子萌发时不能激活全能性。事实上,FUS3在G3E1和G3E3样品中没有被诱导,而LEC2转录本仅在G3E1中短暂积累(Fig 3f)。
组蛋白修饰在基因表达中起着重要作用。特别是高水平的H3K27me3是植物基因沉默的标志。然而,H3K27me3的ChIP-seq数据显示,种子萌发后可及性水平降低的大多数峰与高水平的H3K27me3无关(Fig 3e,Type_II)。
综上所述,上述结果揭示了SE过程中细胞重编程的层次机制:
(1)外植体的发育阶段处于层次结构的顶端,外植体的胚胎性质是体细胞重编程的先决条件。此外,种子萌发时SE能力的丧失与AP2、B3和NF-Y 的可及性降低有关。
(2)生长素作用于层次网络的第二层,通过诱导染色质可及性的大量变化和伴随的基因表达的变化。特别是,生长素直接激活AP2和B3 TF的表达,并参与胚胎成熟过程的终止。
(3) AP2、B3和NF-Y 等转录因子,包括BBM、LEC1和LEC2,依次作为第三层调控因子启动体胚形成。
结论4 WOX2和WOX3是LEC2的直接靶点
Fig 4a-b
先前的研究将BBM置于LEC1和LEC2的上游,因为BBM诱导的胚胎发生依赖于LEC1或LEC2的转录激活。因此,假设LEC2在细胞全能基因的输出节点起作用是合理的。然而,LEC2如何与早期胚胎发育途径相关联仍然是一个谜。为了回答这个问题,作者生成了两个LEC2诱导系(p35S::LEC2-GR和p35S::LEC2-GR-3xFLAG)。嵌合的LEC2-GR/LEC2-GR- 3xflag基因是功能性的,因为用DEX处理导致细胞质与细胞核的LEC2-GR/LEC2-GR- 3xflag融合蛋白易位,在外植体上诱导了胚胎样突起(Fig 4a)。
表达p35S::LEC2-GR-3xFLAG的外植体在DEX或二甲基亚砜(DMSO, mock)处理4小时后收获,并进行ChIP-seq分析。作者在基因组中确定了4009个LEC2结合峰(Fig 4b)。
Fig S4a-b
与早期报道一致,生长素生物合成基因YUC4、LEC1和AGL15被鉴定为LEC2的直接靶点(Fig S4a-b)。
Fig 4c-d
此外,GO项分析显示生长素反应基因高度富集(Fig 4c)。
研究表明,LEC2与一种称为RY基序(TGCATG)的DNA元件结合。HOMER算法显示,RY基序在LEC2结合基因中被过度表达(Fig 4d)。
Fig 4e-f
为了进一步验证LEC2的直接靶点,我们使用p35S::LEC2- gr进行了RNAseq。DEX处理4小时后,LEC2快速诱导1034个基因,抑制107个基因(Fig 4e)。根据GO分析,生长素生物合成和信号传导基因YUC2、YUC4、IAA17和IAA30的表达随着LEC2的诱导而上调(Fig 4f)。
Fig 4g-i
整合ChIP-seq数据进一步发现,与LEC2结合的536个基因被LEC2诱导(Fig 4g)。其中,鉴定出两个WOX基因,分别命名为WOX2和WOX3(Fig 4h)。
对我们的ATAC-seq数据的调查显示,在0 ~ 72 HAI范围内,WOX2和WOX3的调控区域是可及的。在WOX2的启动子区域预测了两个RY基序(Fig 4h)。EMSA实验表明,LEC2与这两个顺式元件结合。此外,在拟南芥原生质体中的瞬时激活实验表明,LEC2能够通过结合这两个RY基序激活WOX2报告基因(Fig 4i)。因此,我们认为WOX2和WOX3是LEC2的直接靶点。
结论5 WOX2和WOX3对SE是必需的但不是充分的
Fig 5a-c
接下来,作者用wox1/2/3突变体的未成熟胚作为外植体进行再生实验。与野生型相比,wox2的外植体胚形成率降低,而wox1、wox1/wox3外植体的再生与野生型没有明显区别,wox2/wox3双突变几乎破坏了体细胞胚的形成(Fig 5a-c)。wox1的突变使wox2/wox3外植体在再生过程中的缺陷略有增强(Fig 5b-c),说明wox1可能在SE中与wox2和wox3发生冗余作用。
Fig S5e-f
为了了解WOX2是否足以触发SE,作者构建了WOX2的诱导系。然而,与LEC2-GR不同的是,DEX处理对WOX2-GR的诱导并没有在MS培养基上的幼苗上引发体胚形成(Fig S5e-f)。
相反,我们偶尔观察到根部形成绿色杆状结构。因此,这些结果表明,WOX2和WOX3是诱导体细胞胚形成的必要条件,但不是充分条件。
Fig 5d-e
最后,为了探究LEC2是否通过WOX2和WOX3促进SE,作者构建了一个转基因植株(pUBQ1::LEC2- GR),其中LEC2- GR由UBIQUITIN1 (UBQ1, At3g52590)启动子表达。
在WOX2和WOX3的T-DNA插入突变体中,UBQ1启动子的使用阻止了35s启动子引起的基因沉默。如图5D和5E所示,经DEX处理后,pUBQ1::LEC2-GR在幼苗上出现了胚状突起。
相比之下,在pUBQ1::LEC2-GR wox2 wox3外植体中很少观察到这些组织(Fig 5d-e)。
结论6 SE过程WOX2、WOX3和LEC2的表达模式
Fig 6
在正常胚胎发生过程中,WOX2在顶端谱系中表达,在子叶后期发育的未成熟胚胎中几乎检测不到。为了准确分析SE期间WOX2的表达模式,作者进行了原位杂交分析。
如Fig 6a,c所示,在处理后第4天和第6天,在外植体茎尖分生组织和子叶之间的边界区域可以检测到WOX2转录本。该结构域与体细胞胚胎最终形成的区域重叠,表明WOX2是SE祖细胞的早期标记。WOX3的表达模式与WOX2相似。
值得注意的是,这两个基因的表达域与LEC2的表达域一致,这与LEC2直接激活WOX2和WOX3是一致的。一旦外植体转移到MS培养基上,WOX2的表达量大大降低(Fig 6a, c)。
为了证实上述结果,作者检测了WOX2启动子驱动的核黄色荧光蛋白(3xVENUS-N7)的表达。与原位杂交实验显示的表达模式相反,在4HAI前,在下胚轴基底区以及子叶细胞中可以检测到VENUS信号(Fig 6b)。从4HAI开始,在茎尖分生组织的边界区域观察到强烈的VENUS信号,在发育中的体细胞胚的顶端区域持续检测到,并且在体细胞胚转化为植株后减弱。
总结
作者展示了SE早期的染色质可及性图谱,发现生长素通过改变染色质可及性而快速诱导细胞潜能的获得。染色质可及性和转录组动力学分析进一步揭示了生长素诱导SE的转录因子级联。
最重要的是作者揭示了细胞全能性基因与早期胚胎发育途径之间的分子联系。