一、概念
连锁不平衡是指,在某一群体中,分属两个或两个以上基因座的等位基因同时出现在一条染色体上的几率,高于随机出现的频率。连锁不平衡是等位基因或者遗传标记在一个种群中表现出高于或低于由等位基因的随机频率而预测的单模样本的频率。(百度百科)
二、举例说明
现有两个基因座控制不同的性状。基因座1控制双眼皮单眼皮性状;基因座2控制高个子矮个子性状。每个基因座各有两个等位基因,分别用Aa,Bb表示
对于不同表型有如下四种基因型的组合方式,同时给出不同表型出现的频率:
表型 | 基因型 | 频率 |
---|---|---|
双眼皮高个子 | AB | |
双眼皮矮个子 | Ab | |
单眼皮高个子 | aB | |
单眼皮矮个子 | ab |
通过上面的信息,我们也可以简单计算出各个等位基因的频率:
等位基因 | 频率 |
---|---|
A | =+ |
a | =+ |
B | =+ |
b | =+ |
如果控制这两个性状的基因座互相独立不相关,那么各个基因型的频率就可以直接算出:=,=,=,=。这就是处于连锁平衡(Linkage equilibrium) 的状态。
而在实际情况中理论值和实际值会产生偏离,这个偏离的原因则是连锁不平衡(Linkage disequilibrium) ,这个偏离的程度通常记为D,称为连锁不平衡系数,=-
A | a | 求和 | |
---|---|---|---|
B | =+ | =- | |
b | =- | =+ | |
求和 | 1 |
然而用D来衡量连锁不平衡程度并不严谨,因为D值会受到等位基因频率的影响,因此对于不同频率的等位基因对之间无法比较连锁不平衡程度的大小。
三、连锁不平衡程度
为了找到更适合衡量连锁不平衡程度的量,对D值进行一些处理,有以下两种方法:
-
是由Lewontin提出的通过标准化D值得到D',D’反映了群体的重组历史,适用于研究群体的连锁不平衡程度,D'的取值范围是-1到1。
其中:
-
更多时候则使用相关系数来衡量连锁不平衡程度:
反映等位基因相关程度,适用于GWAS分析,的取值范围为0到1
当D’=0,=0时,处于完全连锁平衡状态
当D’=1,=1时,处于完全连锁不平衡状态
【参考链接】
连锁不平衡(LD)分析https://www.jianshu.com/p/4393d1b79924
连锁不平衡 linkage disequilibrium LDhttps://gwaslab.com/2021/04/04/%E8%BF%9E%E9%94%81%E4%B8%8D%E5%B9%B3%E8%A1%A1-linkage-disequilibrium-ld/