文献分享17:DNA甲基化对番茄驯化和代谢物多样性的贡献

文献

2023

Science China Life Sciences

Population analysis reveals the roles of DNA methylation in tomato domestication and metabolic diversity

课题背景

(1)群体水平的DNA甲基化分析有助于揭示性状的遗传基础和调控机制。

一些研究表明,DNA甲基化变异可以导致一系列复杂性状的变化,例如影响开花时间、对干旱胁迫的耐受性和对气候变化的适应性。DNA甲基化变异可以通过影响顺式作用元件和基因组的三维结构从而产生性状变异。

(2)植物产生的各种代谢物对植物生长以及环境适应起至关重要的作用。

通过代谢物进行全基因组关联分析(mGWAS)为水稻、玉米、青稞和番茄等作物代谢物的自然变异和调控提供了重要见解。然而之前的研究主要集中在DNA变异上,对于DNA甲基化的贡献在很大程度上未知。因此通过表观遗传进行全基因组关联分析(EWAS)很有必要。

亮点

作者收集了来自世界不同区域的番茄材料的DNA甲基化组、转录组和代谢组。通过检测全基因组的差异甲基化区域 (DMRs),研究了DMR与选择清除以及SNP的关系。

并且通过mGWAS和EWAS验证了13个基因,发现SNP和DMRs不仅独立而且协同影响候选基因的表达。这些发现表明DNA甲基化变异可能是人类选择的结果,并且大部分DMRs不被SNP标记,这暗示了DNA甲基化变异的对未来育种的重要指导意义。

结论1 番茄群体水平的DNA甲基化图谱

Fig 1a-b

作者收集了96份材料 (PIM),包括18份野生种 (CER),41份地方种和37份栽培种 (BIG)进行DNA甲基化测序,平均测序深度32×. 比对到伪参考基因组后,平均比对率为79.9%(Fig 1a)。CG-CHG-CHH的平均甲基化均高于拟南芥。由于CHH类型的平均甲基化小于0.1,所以后续分析排除了CHH类型。圈图的1-5分别为染色体、基因密度、TE密度、Dos-DMRs 和 Imp-DMRs密度,可以看到DMR主要集中在基因富集区(Fig 1b)。

Fig 1c-d

在番茄驯化过程中,共发现了6801个PIM和CER之间的DMRs (Dos-DMR)。在6801个DMRs中,4636个是CG类型, 2165个为CHG类型。

在CER和BIG之间的品种改良过程中发现的DMRs(Imp-DMR)远少于驯化过程中发现的DMR。只有1164个CG-DMRs和410个CHG-DMRs。

Dos-DMR和Imp-DMR均hypo-DMR为主 (Dos-DMR为PIM>CER, Imp-DMR为CER>BIG),而非hyper-DMR(Fig 1c)。此外,Dos-DMR比Imp-DMR普遍更长(Fig 1d)。

Fig 1e

作者比较了驯化和改良过程DMR的甲基化水平,发现驯化过程中,无论是CG还是CHG都观察到甲基化的降低,对于改良过程,CG甲基化有降低,CHG没有明显的降低(Fig 1e)。

以上结果表明在番茄的驯化和改良过程,DMR的数量、长度和甲基化水平都逐渐降低,表明番茄育种过程DNA甲基化发生了很大变化。

结论2 DMR与选择清除区域的重叠导致了表型的多样化

Fig 2a

利用之前发表的重测序数据,作者分析了DMR和受选择区域的重叠,20.5%的驯化过程的DMR与受选择区域重叠,20.4%的改良区域的DMR与受选择区域重叠(Fig 2a)。受选择区域与DMR显著富集 (Fisher’s exact test, P<2.2×10-16 )

Fig 2b

在受选择和差异甲基化重叠的邻近区域,发现了许多调控代谢途径的转录因子,例如SlMYB12、SlMYB75和SlERF.G3-like。

SlMYB12是黄酮类生物合成途径的关键调控因子,在驯化和改良过程中经历了广泛的选择。SlMYB12下游23 kb处存在DMR,该区域在PIM和CER中为低甲基化,在BIG中为高甲基化(Fig 2b)。

Fig 2c-d

为了进一步研究DMR对基因表达的影响,作者对用于WGBS的35份材料进行了转录组测序,包括5份PIM,12份CER和18份BIG。相关性分析表明,SIMYB12的转录与该DMR的甲基化水平负相关(Fig 2c)。进一步作者通过荧光素酶互补实验证明了这段115bp的DMR真的调控基因表达(Fig 2d)。这些结果说明这段DMR可能是激活LUC表达的顺式作用元件。

结论3 基于meQTL解释DMRs与SNP的关系

Fig 3a-c

之前的研究已经表明遗传变异可以影响DNA甲基化。为了研究DMR的遗传基础,作者使用混合线性模型将1,819,237个SNP与DMR进行了meQTL分析,共鉴定到1304个DMR被SNP标记。独立于遗传的DMR被称为pure-DMRs (None,Fig3a)。大多数的DMR被多个SNP标记,大多数的SNP只标记单个DMR(Fig 3b-c)。

Fig 3d-e

此外,作者还算了DMR与SNPs在不同距离上的连锁不平衡(LD),表明随着距离的增加,LD逐渐下降(Fig 3d)。包含15个以上的meQTL的区域被称为meQTL热点,全基因组上共鉴定到110个潜在的meQTL热点(Fig 3e),主要分布在chr3-6-8,包含多个DNA甲基化酶和去甲基化酶。

Fig 3f-g

对pure-DMRs邻近的基因进行了KEGG富集分析(Fig 3f-g)。该分析揭示了苯丙烷生物合成是最显著富集的通路,CG和CHG环境中的大多数苯丙烷生物合成和植物激素信号转导基因附近的DNA甲基化变异对于植物的发育和环境应激至关重要。

这些结果表明,DMRs影响了番茄次生代谢和植物激素信号转导的调节,从而可能导致番茄代谢的差异。

结论4 构建代谢组-变异组-甲基化组网络

Fig 4a-b

为了揭示番茄叶片代谢性状的遗传和表观遗传调控,作者测定了364份番茄叶片(其中的96份是甲基化测序的样本)的339种代谢物水平,其中92种事类黄酮及其衍生物。有超过60%的类黄酮及其衍生物的代谢水平变异系数大于1,这是所有代谢物种最高的,表明类黄酮及其衍生物种在番茄叶片种具有广泛的自然变异。

364份材料的1,852,946个SNPs用于进行mGWAS,96份甲基化数据的DMRs用于mEWAS,共检测到971个显著的mGWAS位点(Fig 4a)和711个显著的mEWAS位点(Fig 4b)。

Fig 4c 

通过整合meQTL、mGWAS和mEWAS的结果,作者构建了番茄的代谢组-变异组-甲基化组三重网络,包含265个代谢物、853个SNP和546个DMRs(Fig 4c)。

在该网络中,与5-O-Caffeoylshikimic acid有关的基因CCoAOMT在mGWAS和mEWAS中显示出一致的关联结果。cg1g95300094 基因与多个SNP显著相关。通过mEWAS检测到与kaempferol相关的基因UGT82E2,然而在它邻近并没有显著的SNP。此外,已知的基因GAME2仅通过mGWAS鉴定到,没有通过mEWAS鉴定到。这些结果表明,一些候选基因受到遗传变异和表观遗传变异组合的影响,而某些候选基因可能只受到一种因素影响。

结论5 SNPs和DMRs揭示了番茄代谢的多样性

Fig 5a

多组学关联分析发现了多个与苯丙素代谢相关的基因,且DMRs也富集到苯丙素的生物合成(Fig 3f、3g、4),因此作者重点关注了苯丙素的代谢过程。结合先验知识,作者确定了13个候选基因,并构建了苯丙素的合成通路以表明遗传变异与表观遗传变异的共同或独立作用(Fig 5a)。

Fig 5b-c

研究结果显示,90.07%的代谢物与不同的基因座存在显著的关联,一些代谢物没有通过mGWAS鉴定到候选基因,但是通过mEWAS可以进行补充,如与kaempferol 3-O-glucoside有关的UGT71AV3基因(Fig 5b)。

UGT71AV3、AtUGT71B1和FaGT6在重建的系统发育树中被分为一个支系(Fig 5c),表明它们可能具有类似的活性位点,用于催化3-OH上黄酮的糖基化修饰。

Fig 5d-f

UGT71AV3的表达量与DMR的甲基化水平以及3-O-glucoside负相关(Fig 5d)。为了验证DNA甲基化对代谢水平的影响,用DNA甲基化抑制剂处理番茄叶片,发现处理后降低了该基因的表达,并增加了3-O-glucoside的含量(Fig 5e)。此外,将重组蛋白(BL21)在大肠杆菌中表达并通过亲和层析纯化的结果表明,该蛋白能够将luteolin转化为kaempferol 3-O-glucoside,从而在代谢多样性中发挥了关键作用,并通过DNA甲基的调控化实现这一过程(Fig 5f)。

Fig 6a-c

UGT73L8是一种UDP糖基转移酶,与luteolin 7-O-glucosidem的mGWAS和mEWAS都有显著关联。

在mGWAS中最显著的SNP (rs0757317315)位于该基因ATG上游277bp的位置,而在启动子区域存在27个显著的SNP显示出高度的连锁(Fig 6a-b)。mEWAS的结果显示,最显著的DMR (cg07g57323266)位于该基因下游3.9kb处(Fig 6a)。单倍型分析表明与7-O-glucoside存在显著关联(Fig 6c)。

Fig 6d-f

此外,作者发现在高甲基化水平下,与cg07g57323266的两种单倍型(Ref和Alt)对应的7-O-glucoside含量明显高于低甲基化水平,但在高甲基化水平下它们之间没有显著差异(Fig 6d)。这些发现表明,SNP和DMR都可以影响该代谢产物的生物合成,而DMR的影响更为强烈。

作者对番茄叶片进行了DNA甲基化抑制剂处理。结果显示,UGT73L8的甲基化水平、表达量以及7-O-glucoside的相对含量都显著降低(Fig 6e)。在大肠杆菌中表达并通过亲和色谱纯化的重组蛋白BL21的表达表明,该蛋白将 luteolin 转化为luteolin 7-O-glucoside,进一步确认了其功能(Fig 6f)。

总体而言,这些结果表明,SNP和DMR都可以用作marker以识别候选基因,并且DMR可以在解释代谢产物多样性方面补充SNP的作用。

本文使用 文章同步助手 同步

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容