在讲述这一节的内容之前,先要说点理论知识。人类有文字记述的历史,大概不超过五千年。上一节所述的内容,是通过考古发现、DNA分析结合推理得出的,并非史料记载。近年来,随着科技的进步,分子生物学迅速兴起,对研究古人类的迁徙提供了巨大的帮助。而本节的内容,就大量应用了分子生物学的成果。
我们都知道,人类的细胞中有23对合计46条染色体,其中22对为常染色体,另外一对为性染色体。人类的遗传物质来自父母双方,其中父系贡献XY两条性染色体,母系贡献XX两条性染色体。如果父系的X与母系的X结合,后代为女性;如果父系的Y与母系的X结合,后代为男性,这点相信大家都了解。
然而在结合过程中,父母双方的染色体会被打断重新拼接,即为重组。其中,有的区段会重组,没有继承性,所以对于研究遗传关系没有太大意义。有些区段则不会重组,也就是代代相传。在这段非重组区,有一种基因(DNA为基因的英文简写),叫线粒体基因(mtDNA)。在人体内,除成熟的红细胞外,所有细胞内都有线粒体基因。也就是说,X、Y染色体中均有线粒体基因,在遗传过程中可以传给下一代。然而,在精子生成的过程中,绝大多数的线粒体都被去除了,只保留极少数的线粒体提供精子的能量。在受精时,精子细胞进入卵子,与卵细胞融合,而精子中残余的线粒体则被挡在外头,不能进入卵子。也就是说,父系的线粒体基因(mtDNA)无法传给后代。因此,虽然下一代子女的细胞核基因,一半来自精子,一半来自卵子,但线粒体基因却全部来自卵子,也就是源自母系。这相当于一个女性特有的logo,只能通过母亲传给女儿,女儿再传给她的女儿,不断遗传下去。这就为我们研究人类的起源、迁徙提供了很大的帮助,因为根据不同人群中同种logo的分布、延续,可以推测出他们的母系起源。
知道了这一点,我们再来看一个分子生物学的研究成果。1987年,三位分子生物学家卡恩、斯通金和威尔逊,通过选择祖先来自非洲、欧洲、亚洲、中东、巴布亚新几内亚和澳大利亚土著的127位妇女,从他们生产后的婴儿胎盘细胞中成功地提取出线粒体基因,并对其序列进行了统计和分析。根据他们的研究,所测定的婴儿的mtDNA,可以将所有现代人的起源追溯到大约29万年-12万年前生活在东非的一个女性。她就是今天生活在地球上各个角落的人的共同“女祖先”,并将其命名为“夏娃”。
以上成果是基于线粒体基因的母系遗传特征,原理就是线粒体基因不会重组,因而线粒体基因的传递是很可靠的。但是可靠归可靠,在线粒体基因的传递过程中,还是会发生比较罕见的基因突变,改变了基因序列。突变后的基因会被后代保留下来,并继续传给下一代。随着千百人不断繁衍,更晚的后代线粒体基因积累的突变数量会变得更多,后代个体之间线粒体基因序列的差异也随之越来越大。一般说来,两位个体之间线粒体基因序列差别越大,表明他们与共同祖先分离的时间越长,亲缘越疏,反之则越近。
以上,就是基于母系线粒体基因(mtDNA)遗传的研究成果。同样,科学家们对基于父系的Y染色体遗传也有类似的研究。2000年,斯坦福大学的昂德希尔教授等利用变性高效液相层析技术,分析得到218个Y染色体单核苷酸多态位点,构成的131个单倍型,对全球1062个具有代表性的男性个体进行研究,同样根据分析结果绘制出一个系统树。
Y染色体系统树所展示的结果与mtDNA系统树的结果非常相似。通过统计Y染色体上的基因突变速率,可以追溯到一个来自非洲的共同起源,并将其命名为“亚当”。这再一次说明,欧洲和亚州等世界其他现代人群都起源于非洲,而美洲和澳洲现代人群又起源于亚洲人群。这就是与“夏娃假说”相呼应的“亚当假说”。
“亚当假说”是基于Y染色体DNA的父系遗传特性。Y染色体上的基因,完全来自于父亲这边,通过爷爷传给父亲,父亲传给儿子。通俗来说,就是你爷爷有这个logo,你爹也有,再传给你,当然,你得是男的,就这样代代相传。
和线粒体类似,Y染色体上非重组区的Y-SNP也有一定几率会发生突变。但这种突变更稳定,而且概率比线粒体高,所以每一个突变节点都更容易被记录和找到。这种突变也会通过单倍遗传,一代代积累下来。这里有点专业,打个比方来解释一下。就以刚刚的用作比方的logo来说。假设你爷爷传给你的logo是个红色的奔驰标志(奔驰汽车商标,应该都知道),传到你这里的时候,这个标志发生了一些变化。logo中向上的一条变了一点颜色,变成了橘红色。但由于结构没有变化,只是颜色变了些,所以还是可以看出这是你爷爷传给你的那一条,这就是前文所说的叫多态性。因为多态性是代代积累的,也就是说,多态性越多的人群,相当于他们的传递代数也越多,就证明他们越古老。这种非重组区段上的突变是紧密相连的,每一个突变都代表着整个区段的特性。先后发生的突变,有上下游的继承关系,而相关联的突变构成的组合称之为“单倍群”。
通俗点讲,就是父母双方体内各会有一个logo,如果后代是男性,父系的logo就会传给他,也就是Y染色体父系遗传;如果后代是女性,母系的logo就会传给她,也就是线粒体基因母系遗传。同时,这个logo在传了很多代之后,可能会发生变化。颜色、图形与上代稍有不同,这种不同叫多态性,而产生不同的时间点,我们称之为基因突变节点。
科学家们为了方面记录,按照突变时间的先后顺序,给每一个重大的突变标注上字母,按照英文字母A、B、C、D等这样排序。同时,每个重大突变后还会有一些小的突变,同样以英文字母标注,还加上了阿拉伯数字,例如著名的“O3-M168”。以上的结论,都是基于分子生物学和其下分支分子人类学的研究成果。