由于基因组太大,我们不得不分散测序,然后将分散的顺序按照原来位置进行组装,而基因组存在大量重复顺序,会干扰排序,因此我们需要高密度基因组图。而遗传图和物理图就是为了帮助我们测序组装所绘制两种图谱。
遗传图(Genetic Map):通过遗传学方法,以遗传图距(cM)为单位绘制的染色体上基因或标记之间相对位置的连锁图。
物理图(Physical Map):通过DNA克隆,细胞原位杂交或DNA测序等方法将DNA克隆或DNA分子标记锚定在染色体的确定空间上而绘制的连锁图。物理图是一种实物图,有确定的物理距离,如碱基对数目。
为了确保分散的DNA片段正确归位,我们需要找一些合适的标记,要求它们在染色体上的位置是已知的、唯一的、确定的,并位于不同的测序片段之中,以提供作图的依据。
分子标记:基因组路标(landmarker):染色体上的基因和DNA顺序均可作为路标,路标具有物理属性,它们由特定的DNA顺序组成。路标位于染色体上的位置是固定的、唯一的、不会更改的。
同时,我们在经典遗传学中关于作图还有两个概念就是‘座位’和‘位点’,它们的定义与差别如下:
座位(locus):座位是经典遗传学中常用的概念, 系指染 色体上经遗传分析确定的某个位置, 它们 可以是基因、DNA顺序或分子标记,但具 体物理位置不确定。因此locus系指遗传单 元在染色体所占据的相对位置。
位点(site):位点是指基因组物理图上某一确定的DNA 顺序。
随着生物技术的发展,遗传作图标记有以下三代:
1) 第一代分子标记, 单一顺序多态性:
RFLP, AFLP, RAPD
2) 第二代分子标记, 重复顺序多态性:
Simple sequence length polymorphisrns, SSLPs
Variable number of tandem repeats, VNTR
Simple tandem repeats, STR
Single sequence repeats, SSR
3) 第三代分子标记, 单核苷酸多态性:
Single nucleotide polymorphisms, SNP
具体的每一代遗传图谱标记的特点如下:
第一代:
RELP(Restriction Fragment Length Polymorphism)特点:
1)处于染色体上的位置相对固定;
2)同一亲本及其子代相同位点上的多态性片段特征不变;
3)同一凝胶电泳可显示等位区段不同多态性片段, 表现为共显性.
4)需要用Southern杂交检测显示.
第二代:
SSR多态性标记的优点:
1)在基因组中分布均匀;
2)可用DNA测序凝胶直接显示、检测、方便;
3)杂合子DNA多态性表现共显性;
4)群体中SSR标记的多态性信息量高。
第三代:
SNP标记及其特点:
1)DNA单链的每个碱基位置可有4种选择:A, T, C, G,即4种可能的多态性。因此SNP可由核苷酸代换产生;
2)人类基因组平均600bp含一个SNP,密度高,分布均一;
3)人类基因组SNP总量大于500万;
4)紧密连锁的SNP可组成单倍型(Haplotype),便于构建进化树 ;
5)SNP的缺点:需要DNA测序或芯片杂交确定,费用较高。