Science|完整人类基因组的表观遗传模式
原创 风不止步 图灵基因 2022-04-10 20:25
收录于话题#前沿生物大数据分析
撰文:风不止步
IF=47.728
推荐度:⭐⭐⭐⭐⭐
亮点:
文章提出人类基因组的表观遗传注释,并在其中探索了以前未解决的区域,包括近端染色体短臂、节段重复的基因,以及包括人类着丝粒在内的各种重复类别的集合。
2022年4月1日,美国约翰霍普金斯大学的Winston Timp博士等人在《Science》上发表了一篇“Epigenetic patterns in a complete human genome”的文章,文章提出对未解决序列的高分辨率进行表观遗传研究,代表整个近端染色体短臂、基因家族扩展和重复类别的多样化集合。
二十多年来,构建完整表观基因组一直受到不完整参考基因组的阻碍。随着技术进步,我们现在可以在完整的端粒到端粒人类基因组组装T2T-CHM13中全面研究基因组结构和功能。现在可以扩展人类表观基因组,使其包含 2.25 亿个碱基对 (Mbp) 的附加序列。完成人类表观基因组需要开发方法来分析以前未解决的区域。使用带有现有短读长表观遗传数据的 T2T-CHM13参考,确定了3%到19%的表观遗传标记富集位点。然而,即使有完整的参考,这些短读长的表观遗传方法也无法正确解析基因组中高度相似的区域,包括片段重复、基因旁系同源物或大型重复阵列。另一方面,长读长表观遗传方法可以通过锚定到侧翼或不常见的独特区域来解决这些区域内的单分子表观遗传模式,从而为这些区域提供基础评估。
在以前未解决的基因中,发现57个具有活性启动子存在于一种以上的细胞类型中。发现82个具有支持活性启动子的单一细胞类型的基因,表明这些以前未解决的基因注释在组织中具有功能活性。随着来自不同组织类型的更多数据,可识别出更多的功能基因。进化上较老的基因旁系同源物在表观遗传上受到抑制(类似于转座子的表观遗传沉默),赋予基因组稳定性,从而影响基因组进化。
通过检查卫星DNA整合短读长和长读长数据集来研究完整的卫星阵列,揭示尽管序列同一性高,区域表观遗传和转录活性有所不同,并强调局部染色体环境作为表观遗传学调节剂的重要性。已知近端短臂上的重复DNA在核仁形成中起作用。然而,之前的参考区域的缺失阻碍了研究。结果表明,这些个体近端着丝粒染色体上的重复家族都具有自己的表观遗传特性,而不是一致行动,这可能有助于它们在基因组完整性和组织中的独特功能作用。
单分子表观遗传学数据的特点之一是能够研究表观遗传学的单分子模式。单独使用甲基化来聚集没有杂合多态性的重复区域中的读取。随着分辨率的提高,结果显示集群群体之间的甲基化变异性和同一阵列中相邻单体内的阵列内表观遗传变异。由于已知卫星阵列在人群中具有高变异性并与多种人类疾病相关,因此这些结果突出长读长单分子表观遗传学研究对于了解疾病病理学的重要性。
最后,T2T-CHM13基因组组装开启对人类着丝粒的探索,能够探索定义着丝粒染色质的表观遗传元件。将最初在8号染色体和X号染色体中发现的CDR扩展到所有染色体,并发现CDR表示分化细胞中与中心粒相关的蛋白位置。这提供早期发育CHM之外CDR的证据,并强调它们在染色体分离的动粒定位和表观遗传调控中的重要性。CDR是跨脊椎动物和植物谱系的复杂着丝粒的一个保守的功能上重要的特征。适当的动粒形成是真核细胞分裂的必要过程,人类每天要发生3300亿次以维持生命的过程。结果得出关于CDR的两个主要结论:(i)给定阵列上的 CDR 位置在早期发育中是固定的,并在分化时保持不变;(ii)每个着丝粒中都有一个稳定的CDR初步。该结论为未来的研究提供了多种途径,包括CDR位置如何影响减数分裂和有丝分裂稳定性、疾病和非整倍性。
该基础研究通过使用完整的参考扩展对人类基因组的研究。在更大和更多样化的样本中进一步探索表观基因组,以实现最佳的序列比对,特别是在结构多变的重复区域中。目前正在快速发展的长读长表观遗传方法可以补充独特区域中短读长测序的局限性。我们正处于探索基因组重复和重复部分的边缘。跨不同人群和疾病状态的长读长表观遗传分析的进一步发展将揭示更多关于基因组最难以捉摸的区域内的调控。
教授介绍
Winston Timp博士,副教授
研究重点领域:生物医学数据科学、基因组学和系统生物学;
研究兴趣:测序技术的开发与应用,探索生物学和诊断疾病;
Winston Timp博士专注于测序技术的开发和应用,以更深入地了解生物学和更准确的人类疾病临床工具集。在约翰霍普金斯大学医学院的分子生物学和遗传学系以及传染病学部担任联合职务。
研究整合了生物物理学、分子生物学和计算生物学的原理,以创造新的工具来探索不同生命形式的表观基因组和基因组,这些生命形式从流感病毒到蜂鸟再到加州红杉。基于从这些研究中获得的知识,Timp博士和他的团队将工具集应用于临床样本,以诊断、监测和治疗人类疾病。
项目包括使用纳米孔测序诊断传染病、表征结肠癌的表观基因组、读取蜂鸟的转录组以及组装巨型红杉的基因组。Timp拥有两项许可专利,并在2017年获得了200万美元的赠款,并在2019年获得了另外300万美元的赠款,这是由国家人类基因组研究所资助的“新型核酸测序技术开发”项目的一部分。他还是关于蜂鸟极端新陈代谢的人类前沿科学计划资助的成员,以及关于中国仓鼠卵巢 (CHO) 细胞基因组学和表观基因组学的美国国家科学基金会产学合作研究中心 (IUCRC) 联盟资助的成员。
参考文献
Ariel Gershman, Michael E. G. Sauria etal.Epigenetic patterns in a complete human genome.(2022)