8月14日,江西农业大学猪遗传改良与种质创新全国重点实验室黄路生院士团队联合四川农业大学李明洲教授团队,在Nature Communications杂志上在线发表题为“Mechanism of Parent-of-origin Effects revealed by Multi-omic data in Euro-Chinese Hybrid Pigs”的研究论文。该研究构建了全球首个同时含染色质构象、DNA甲基化及多种组蛋白修饰的杂交猪父母相高分辨率表观图谱,系统揭示了其在亲本效应(Parent-of-origin effects, POE)中的协同调控机制。

PART.01研究背景
在哺乳动物中,绝大多数基因通常被认为在父母两套染色体之间等效表达。然而,越来越多的研究表明,部分基因的表达受其遗传来源影响,即存在亲本效应(POE)。该现象不仅参与早期胚胎发育过程,也与多种疾病的发生和动物性状的形成密切相关,是揭示复杂性状遗传机制的关键突破口之一。在畜牧遗传育种中,亲本效应与杂交优势(heterosis)密切相关。研究表明,不同亲本来源的等位基因在杂交子代中常常呈现表达偏好,这种表达偏好可直接影响诸如脂肪沉积、肌肉生长、繁殖性能等经济性状的表达。因此,阐明亲本效应的调控机制不仅有助于揭示杂交优势的分子基础,也为定向育种和分子设计育种提供理论支撑和精准工具。
PART.02研究结果
1、数据集的实验设计与质量控制
研究团队通过三组欧洲商品猪与中国地方猪的杂交组合(大白×二花脸,杜洛克×两广,巴克夏×赣西),构建特殊父亲-母亲-孩子三元核心家系,并整合短读长测序、长读长测序(ONT)、全长转录组(PacBio)、甲基化测序(TAPS)、CUT&Tag(5种组蛋白标记)、Hi-C等多组学数据(图1a)。为保证研究结果的可靠性,作者对所有数据集进行了严格质控。RNA测序显示BF与LD基因表达谱有明显差异(图1b);背膘(BF)甲基化水平整体高于背最长肌(LD),两种组织中转录起始位点(TSS)均呈现显著低甲基化特征(图1c);不同组蛋白修饰和CTCF在转录起始位点周围富集(图1e);Hi-C数据捕获到高分辨率基因组空间互作(图1f)。

2、杂交基因组的单倍型解析与溯源
基于三重家系基因组测序数据,开发了一种名为"phase-tag"的单倍型分型策略,用于在全基因组水平探究等位基因特异性表达及其表观遗传调控机制(图2a)。作者对分型流程的准确性与效率进行了系统评估,亲本等位基因间相位分配错误的比例在所有杂交后代中介于0.19%至0.25%之间,处于正常范围内(图2b),全基因组中成功标记父源和母源reads的比例为48.93%-63.02%(图2c)。由于单倍型分型流程高度依赖于SNP密度与分布的均匀性,该研究检测了全基因组SNP的分布情况以评估可分型reads的基因组覆盖度(图2d)。变异位点的平均间隔约为250bp/SNP,但仍存在部分区域SNP间隔大于10kb,这些区域阻碍了reads亲本来源的准确区分。phase-tag策略与传统reads分型方法trio binning产生的k-mer存在高度重叠(共有率达86%),但phase-tag策略在等位基因特异性k-mer的识别方面表现出更强能力:当trio binning策略仍存在部分亲-子代杂合位点无法区分时,phase-tag能通过相邻已分型变异位点的"搭车"效应实现有效分型(图2e,附图2c)

3、父源与母源单倍型在基因表达、DNA甲基化、组蛋白修饰及染色质构象方面的差异图谱
共计在BF和LD中分别鉴定出7,466和6,544个相位特异性表达基因(PSEs),其中3,848个基因在两种组织中共同存在(图3a)。BF和LD高甲基化区域呈现相似分布规律:高甲基化区域主要富集于3'UTR和5'UTR(图3b)。在LD和BF中分别共有465个和310个相位特异性组蛋白修饰(PSHMs)与相位特异性CTCF结合(PSCTCFs)在超过半数样本中稳定存在(图3c)。通过分型 Hi-C 图谱,鉴定出了相位特异性三维染色质结构。结果显示,有 672 个染色质区室表现为 “父本相位为 A 区室、母本相位为 B 区室” 的转换模式,另有 679 个染色质区室呈现相反的转换模式(父本阶段为 B 区室、母本阶段为 A 区室),这些相位特异性区室在父本和母本相位的分布无显著差异(图 3d)。鉴定出7,884个相位特异性TAD边界(PSTAD边界),其中65.6%呈现典型差异模式,表明在某一相位中出现了新的 TAD 边界,且形成了相位特异性亚 TAD(图3e)。多组学整合分析进一步探究了BF和LD中PSEs与相位特异性表观遗传修饰之间的关联。两种组织内均发现相似比例的关联模式:BF中32.87%的PSEs与单一表观遗传标记相关联, LD中该比例为31.41%。此外, BF中35.53%及LD中52.15%的PSEs受到多于一种表观遗传标记的协同调控(图3f)。

4、DNA甲基化调控的亲本效应
系统分析了PSEs与相位特异性甲基化区域(PSMRs)的位置关系。结果显示PSEs的分布与PSMRs高度相似,其中包含31个已知印记基因(占印记基因数据库收录量的70%)(图4a)。以类印记基因为模型,分析了亲本相位间启动子甲基化差异与基因表达差异的相关性。在BF(p = 0.0079)和LD(p = 3e-5)中,都观察到启动子甲基化水平与基因表达水平之间存在显著的负相关(图4b)。在组织间共有的类印记基因中,53.71%的基因启动子区域受到 PSMRs 的负调控。典型的是四个已知的印记基因:PEG3、SNRPN、NDN 和 MAGEL2(图4c)。
ADH1C基因启动子区的PSMR与其偏好表达呈负相关,且在脂肪组织和背最长肌中高度保守(图4d,e)。在父源相位中该启动子高度甲基化导致低表达,而母源相位则呈现低甲基化与高表达特征,提示ADH1C可能是一个受DNA甲基化调控的新型印记基因。对ADH1C转录本的进一步分析显示,BF中转录本多样性更高,但两种组织主要转录本均呈现相似的母源表达模式。此外,母源相位所有转录本的启动子和第一外显子区域均呈现DNA甲基化水平降低,这进一步揭示了相位特异性表达的形成机制(图4f,g)。

5、相位特异性组蛋白修饰与相位特异性染色质结构调控的亲本效应
在BF和LD中,差异H3K27ac、H3K4me3、H3K4me1和CTCF转录因子水平与PSEs均呈显著正相关(差异H3K27me3除外),支持了相位特异性组蛋白修饰(PSHM)在调控亲本效应中的潜在作用(图5a)。在启动子区域,BF和LD中共鉴定到1643个与PSHM相关的PSEs,其中196个为组织共享基因,639个为BF特异性基因,808个为LD特异性基因(图5b,c)。
研究发现组织间保守的PSEs受相似PSHM模式调控,在BF和LD中呈现相同的相位偏好性。THYN1和PLAC8在两个组织中均显示较高的父源表达,这与它们启动子区域父源H3K27ac和H3K4me3信号增强相关(图5d,e)。组织特异性PSEs受相应的组织特异性PSHM调控。与小鼠体重增加相关的BF特异性PSE——IMMP2L基因,在其启动子区域显示较高的母源表达及母源H3K27ac信号增强,而在LD中父母源间的表达与组蛋白修饰信号则保持平衡(图5f,g)。

MTSS1 基因表现出更高的父源表达,这与上游调控区域中 H3K27ac 和 H3K4me1 信号的增强相关,该上游调控区域通过一个阶段平衡的环与启动子相连(图 6a)。为验证增强子-启动子互作(EPI)关系,在猪成纤维细胞中进行荧光素酶报告基因检测。将包含 MTSS1 基因上游调控区域的元件进行克隆并导入细胞。与对照组相比,实验组产生了显著更高的荧光素酶信号(图 6b) 。
在LD中,3C-qPCR结果证实了启动子与调控元件间的互作关系(图6c,补充数据9)。为进一步证实该互作的功能相关性,在猪成纤维细胞中进行了CRISPR/Cas9介导的增强子区域敲除实验。增强子敲除导致MTSS1表达显著下调(图6d,e),这些结果表明PSHM可作为调控元件控制PSE。

6、多组学分析揭示亲本效应的复杂调控机制
作者在两种组织中,对PSEs内的PSMR进行共定位分析,结果显示H3K27ac、H3K4me3、H3K4me1和CTCF主要与低甲基化相位共定位,而H3K27me3则主要与高甲基化相位共定位(图7a)。
利用猪的多组学数据,对在人类和小鼠中已被充分研究的印记基因 IGF2 和 H19 进行了研究。母本 印记控制区(ICR) 的未甲基化则会促进 CTCF 结合。CTCF 与 ICR 结合后,会在 IGF2 和 H19 之间形成绝缘子,既阻止增强子激活 IGF2,又促进 H19 表达(图 7b);而父本ICR 的甲基化会阻碍 CTCF 结合,导致 IGF2 与 H19 之间无法形成绝缘子,增强子得以激活 IGF2 表达(图 7b、c)。
该研究还发现,SGCE–PEG10基因座呈现出与H19–IGF2相似的调控模式,受相位特异性表观修饰组合的协同调控。SGCE和PEG10的启动子区域存在相位特异性甲基化(PSMR),表现为母本等位基因高甲基化,父本等位基因低甲基化。CTCF特异性结合于未甲基化的等位基因,并伴随较高的H3K27ac和H3K4me3信号(图7d)。进一步对等位基因间染色质互作频率的分析显示,在PSMR上游100-250 kb区域存在显著的父本特异性差异(图7e),强化了该边界的绝缘功能。这些结果都证明,SGCE和PEG10启动子区的PSMR作为印记控制区发挥作用,通过调控CTCF结合形成PSTAD边界,并实现相位特异性增强子-启动子互作(EPI),最终导致SGCE-PEG10的印记表达(图7f)。

PART.03研究总结
1.研究系统解析了DNA甲基化、组蛋白修饰和三维染色质结构如何共同调控肌肉和脂肪组织中的亲本效应(POE)。
2.研究拓展了猪中H19–IGF2和SGCE–PEG10这两个经典印记基因的调控模型,为理解复杂性状遗传中等位基因特异性表观遗传调控提供了理论框架。