该篇文献是2018年发表的综述,详细整理了加速进化区的概念、研究历程、目前的研究成果。虽然是比较早的文献,但是可作为了解加速进化区的良好工具。
该领域关注的问题:智人作为智人属中唯一留存的物种,具有非常发达的前额叶皮层,这是大脑中与高级认知功能(如决策制定、规划和社会行为)密切相关的部分。哪些进化上的新序列变异决定了大脑发育的新模式?与我们现存的近亲黑猩猩相比,人类的大脑确实要复杂得多,我们与黑猩猩的区别有8Ma,并且我们与黑猩猩共享99%的基因组,人类蛋白质编码基因与黑猩猩基因非常相似,并且只构成人类基因组的1.5%。因此,人类和黑猩猩形态差异的遗传基础必须主要来自非编码调控序列。通过研究加速进化区域,科学家可以更好地理解人类大脑和认知能力的发展,以及这些特征如何使人类在进化过程中与其他物种区别开来。
重要概念:
人类加速进化区(human accelerated regions,HARs):是指在人类基因组中相比其他物种表现出较快进化速率的基因或基因组区域。这些区域在人类进化过程中可能发生了显著的变化,这些变化被认为是人类独有的生物学特征,如大脑发育、认知能力和其他复杂行为的基础。
HARs的特点:
•高度保守性:HARs在多个物种中保持高度保守。
•人类特异性的快速变化:尽管这些区域在多数物种中保持高度保守,但在人类中它们显示出显著的变化,即“加速进化”。
•位于非编码区域:这些区域通常位于基因组的非编码区,尤其是调控区域,如增强子或者其他调节基因表达的序列。这意味着它们可能影响基因的表达模式,而不是改变蛋白质的结构。
•与人类特有特征相关:人类大脑发育、认知能力、语言能力等
•进化压力:这些区域的快速变化可能是由正选择驱动的,这意味着某些变异在进化过程中为人类提供了优势,因此被保留下来。
•演化学和功能研究的重点:可能揭示了人类与其他物种相比在演化上的独特适应。
文献内容:
人类加速进化区(HARs)的研究主要集中在探索那些在人类演化过程中发生显著变化的基因组区域,特别是那些影响人类大脑发展的区域。
HARs的首次发现标志着对人类基因组独特进化过程的重要理解。在2006年,Pollard等人进行的两项开创性研究首次描述了HARs。这些研究使用了生物统计方法来检测人类基因组中核苷酸替换速率的显著加速。他们首先比较了黑猩猩、小鼠和大鼠的基因组,以确定至少96%保守的区域,然后比较了包括人类在内的17种脊椎动物的保守序列。使用的软件包括MultiZ和PhastCons。这种方法与仅基于理论中性期望的物种基因组替换率比较的方法不同。Pollard等人(2006a)在人类基因组中发现了202个HARs,其中前五个HARs的替换率是黑猩猩与小鼠相比的26倍。这些替换中的大多数都固定在人类中。大部分HARs位于端粒附近,高重组率区域,以及高GC含量区域。新变异主要包括从较弱的AT对变为较强的GC对。Pollard等人(2006a)提出的一种可能的解释机制是GC偏向基因转换(gBGC)。这个机制发生在染色体重组期间,优先修复含有鸟嘌呤和胞嘧啶的等位基因。但后续研究表明,这种机制并不能完全解释HARs中观察到的高GC含量(Kostka等人,2012)。实际上,大多数HARs(76%)似乎是由正选择驱动的。同时,Pollard等人(2006a)排除了HARs中进化约束的放松。202个HARs中有201个显示出了比中性替换率更高的替换率,这表明正选择的存在。如果考虑到前五个HARs中替换的固定性,可以假设在过去800万年的人类进化中,正选择在某个时点回归到负选择。接下来的研究(Prabhakar等人,2006;Bird等人,2007)发现了更多的人类加速保守非编码序列(HACNSs和ANCs)。这些研究使用了不同的统计方法,探索了人类特有的替换在保守非编码序列中的分布。特别是Bird等人(2007)的研究,他们通过分析HapMap项目中的SNP与基因表达水平的关联,发现ANC序列中的许多变异可能导致了人类大脑区域的扩张。这些研究揭示了人类基因组中非编码调节区域的重要性,尤其是在人类大脑发展和功能方面。HARs的发现和随后的研究强调了非编码区域在人类进化中的重要作用,尤其是在调控基因表达方面。这些区域的变化可能是人类与其他物种相比在认知能力和大脑结构上显著不同的关键因素之一。
HARs大多位于基因间区域和内含子中,这意味着它们很可能是调节性序列,如增强子。Capra等人(2013)的后续研究估计这些序列中约30%可能实际上是增强子,但仍有62%的HARs可能属于其他类型的调节序列,如绝缘子或沉默子。
总之,人类加速区域的研究揭示了人类基因组中非编码区域在人类特有特征发展中的重要作用,尤其是在人类大脑的发展和功能方面。这些发现不仅对理解人类与其他物种的差异至关重要,也为未来研究人类遗传疾病和神经发育疾病提供了新的视角。
※有关HARs的几项重要研究及其发现。以下是这些研究的主要内容和结论的总结:
Bush和Lahn(2008):这项研究使用似然比测试来发现仅限于非编码区域的加速区域。研究者从六种哺乳动物物种(包括人类)中提取保守元素,并将它们与附近的重复序列进行比较,从而识别出63个在人类中极速变化的区域。这些HARs通常位于端粒附近,但没有显著的AT到GC替换偏向。
Lindblad-Toh等人(2011):研究者使用29种哺乳动物基因组数据来评估人类基因组中受进化约束影响的区域。他们发现了563个2倍HARs(2xHARs)和1930个在五种灵长类物种中保守但在人类中加速的2xHARs。这些研究表明,加速替换主要发生在进化上较浅的调节区域中。
Gittelman等人(2015):这项最新的研究以人类DNA酶I高敏感位点(DHS)为出发点,这些位点可能是活跃的调节区域。通过比较六种灵长类物种(包括人类)的DHS,研究者发现了524个人类加速的DHS(haDHSs)。这些区域的进化速率比中性速率快4倍,大多数haDHSs位于大脑组织样本中,且70%的替换可以通过正选择来解释。
HAR数据集的比较分析:不同研究之间对HAR数据集的比较揭示了相当大的差异。例如,Pollard等人(2006a)和Lindblad-Toh等人(2011)的研究显示了最高的重叠度(7%)。这些差异可能由于使用的统计和生物信息学方法不同,以及对保守区域定义的不同(例如,有的研究关注脊椎动物保守区域,而有的则专注于灵长类保守区域)。
HARs大多位于基因间区域和内含子中,这意味着它们很可能是调节性序列,如增强子。Capra等人(2013)的后续研究估计这些序列中约30%可能实际上是增强子,但仍有62%的HARs可能属于其他类型的调节序列,如绝缘子或沉默子。
这些研究共同强调了人类基因组中非编码调节区域在人类大脑发展和功能中的重要作用。它们还突出了在不同物种间保守的调节序列中可能存在的功能性转换,以及这些区域对进化过程中新的表型特征的适应性意义。尽管这些研究使用了不同的方法和数据集,但它们共同揭示了人类基因组中HARs的多样性和复杂性。这些HARs可能与人类大脑的独特发展和复杂功能有关,展示了正选择在人类进化中的重要作用。此外,Gittelman等人的研究通过实验验证了一些haDHSs作为增强子的功能,特别是在大脑发育相关区域的活跃。综上所述,这些研究不仅增强了我们对人类基因组特异性进化的理解,而且为未来研究人类特有生物学特征,尤其是大脑发展和认知功能的遗传基础提供了重要的线索。
※对已发现的 HAR 数据集的进一步研究:
从2012年到2016年间,出现了四项进一步研究人类加速区域(HARs)的研究,旨在整合现有的HAR数据集,以探索这些区域的额外方面。以下是这些研究的主要发现和结论的总结:
HARs在古人类中的研究(Burbano等,2012):这项研究评估了之前四项研究(Pollard等2006a;Prabhakar等,2006;Bird等,2007;Bush和Lahn,2008)确定的HARs在尼安德特人和丹尼索瓦人中的共享程度。结果显示,8.3%的HARs中的核苷酸替换是现代人特有的,其余的替换在与这些古人类分离的50万年前就已出现。
HARs作为增强子的功能(Capra等,2013):第二项研究整合了五项先前的研究数据,目的是测试HARs作为增强子的假设。结果产生了一个包含2,649个非编码HARs的列表。这些区域主要位于基因间或内含子中,平均长度为257bp,且多数与大脑发育相关的基因相邻。机器学习算法EnhancerFinder表明,近30%的非编码HARs是与发育相关的增强子。
精神分裂症相关基因与HARs的交互(Xu等,2015):第三项综合研究调查了HARs和与精神分裂症(SCZ)显著相关的全基因组关联研究(GWAS)SNPs之间的重叠。结果表明,SCZ相关区域富集在与pHARs相关的基因中,并且这些基因在灵长类动物的进化中高度保守。
自闭症与HARs的关联(Doan等,2016):最后一项研究揭示了在数个包含增强子的HARs中的罕见同型单核苷酸变异和插入缺失与自闭症的关联。此外,Doan等人还发现,与其他类型的变异相比,更多的自闭症病例中的变异影响到了HARs。
这些研究共同强调了HARs在人类大脑发展和功能中的重要性,特别是它们作为调节性序列(如增强子)的作用。这些研究还揭示了HARs与一些重要神经发育疾病(如精神分裂症和自闭症)之间的潜在联系,表明这些基因组区域可能在这些疾病的发生中发挥关键作用。具体来说,Capra等人的研究通过将HARs与增强子活性相关联,揭示了这些区域在人类大脑和身体发育中的潜在作用。此外,Xu等人的研究通过将HARs与精神分裂症相关基因的相互作用关联起来,进一步揭示了这些基因组区域在人类高级认知功能中的作用。而Doan等人的研究则揭示了HARs与自闭症之间的关联,尤其是在大脑的调节网络中。
※该文献中提到的关于人类加速进化区(HARs)的研究涉及到多个与大脑发育和功能相关的基因。以下是文献中提及的一些关键基因:
FOXP2:这是一种广泛研究的转录因子,它在人类中含有两个特异性的非同义替换。FOXP2与语言和认知能力的发展密切相关。
ASPM:这个基因在人类中有多个特异性的同义和非同义替换,与大脑的大小和微脑症有关。
AHI1:在人类中经历了正选择,与Joubert综合征和其他神经发育障碍有关。
GADD45G:这个基因的增强子区域的删除与人类大脑某些区域的扩张有关。
SOX2:这是一种转录因子,调节神经祖细胞的更新,防止这些干细胞过早分化成成熟神经元。
HAR1A:与HAR1B一起是首批与HARs相关联的基因,编码功能性RNA,主要在大脑皮层的Cajal-Retzius神经元中表达,参与大脑新皮层的发育。
AUTS2:包含三个HARs,与精神疾病和神经发育障碍有关。AUTS2蛋白可能作为转录因子,在大脑发育中发挥作用。
NPAS3:含有14个HARs,对大脑发育和维持正常的神经信号传导至关重要。与精神分裂症和双相情感障碍有关。
FZD8:其增强子包含HAR,参与WNT信号通路,对大脑神经祖细胞的增殖和大脑大小有重要影响。
CUX1, PTBP2, GPC4:这些基因通过与HARs中的增强子相互作用,在大脑发育和功能中发挥作用。CUX1与神经元的树突发育有关,PTBP2调节神经元发育中的剪接,GPC4作为一种信号分子,诱导突触形成。
这些研究揭示了HARs在人类大脑特殊性质的形成中的关键作用,特别是在调节基因表达和大脑结构的发育方面。这些基因的功能和调节机制的研究有助于更深入地理解人类大脑的复杂性和与其他物种的区别,以及与神经发育障碍之间的关联。研究发现HARs与许多涉及大脑发育和功能的基因相邻,包括那些参与发育、脑部和神经元发育的基因。这些基因通常与转录因子、DNA结合蛋白和核酸代谢调节器相关联。
总的来说,这些基因的研究表明HARs可能在人类大脑的复杂性和功能性发展中扮演着重要角色,尤其是在调节基因表达方面。这些发现为理解人类与其他物种的神经生物学差异以及人类特有的认知能力提供了重要线索。
注:该综述文献文献收集只包含2017年及以前的。关于加速进化区后续还有很多研究进展,关于动物加速进化区的特征,加速进化区与增强子/转录因子结合位点的联系、加速进化区形成的机制等等。
文献信息:
Anastasia Levchenko, Alexander Kanapin, Anastasia Samsonova, Raul R
Gainetdinov, Human Accelerated Regions and Other Human-Specific
Sequence Variations in the Context of Evolution and Their Relevance for
Brain Development, Genome Biology and Evolution, Volume 10, Issue 1,
January 2018, Pages 166–188, https://doi.org/10.1093/gbe/evx240