群体遗传分析—LD连锁不平衡

本文转载于百迈克云(https://www.sohu.com/a/234594093_761120)

在群体遗传学研究中,LD连锁不平衡分析是最常见的分析内容,也是关联分析的基础。在很多的遗传进化GWAS的文章中都会出现LD衰减及单体型block图,如果你还不是很了解的话,是时候补补课了哦~~

LD概念

当位于某一座位的特定等位基因与另一座位的某一等位基因同时出现的概率大于群体中因随机分布的两个等位基因同时出现的概率时,就称这两个座位处于连锁不平衡状态(linkage disequilibrium)。

LD计算方法

D 是 LD(连锁不平衡) 的基本单位,度量观察到的单倍型频率与平衡状态下期望频率的偏差。虽然D能够很好的表达LD的基本含义,但是由于其严格依赖于等位基因频率(allele frequency),故不适合应用于表述实际的LD强度,尤其是进行不同研究的LD值的相互比较。几个常用于度量LD的符号中,最重要的是D'和r2,两者都是基于D,各有各的特点及用途。

LD计算方法如下:
1、设有两个位点(A、B),等位基因分别是A、a、B、b,在群体中对应频率f(A)、f(a)、f(B)和f(b)

2、两个位点共有四种单倍型AB、Ab、aB、ab,对应频率f(AB)、f(Ab)、f(aB)和f(ab)

3、计算:Dab=f(AB)-f(A)*f(B)

当Dab=0时,处于连锁平衡状态;

当Dab≠0时,处于连锁不平衡状态。

LD度量:

当Dab>0,|D'|=(Dab)2/min(f(AB), f(ab));

当Dab<0,|D'|=(Dab)2/min(f(Ab), f(aB));

r2=(Dab)2/(f(A)f(a)f(B)*f(b));

D'=0, r2=0时处于完全连锁平衡状态;

D'=1,r2=1时处于完全连锁不平衡状态;

从0-1度量越高,LD越高,如果两个位点连锁,连锁程度也越强。

r2 和D'的比较

r2和D'反映了LD的不同方面。r2包括了重组和突变,而D'只包括重组史。D'能更准确地估测重组差异,但样本较小时,低频率等位基因组合可能无法观测到,导致LD强度被高估,所以D'不适合小样本群体研究;

LD衰减作图中通常采用r2来表示群体的LD水平;Haplotype Block中通常采用D'来定义Block;迁移、突变、选择、有限的群体大小以及其他引起等位基因频率改变的因素,这些都会引起LD的改变。

计算LD的主流软件与方法

plink2 :

(https://www.cog-genomics.org/plink2)

haploview :

(https://www.broadinstitute.org/haploview/haploview)

plink计算R2值的命令行(基于vcf):

plink --vcf vcf_file --allow-no-sex --maf 0.05 --geno 0.2 --r2 --ld-window 999999 --ld-window-r2 0.2 --out out_file_prefix

--vcf 指定输入的文件为vcf格式,如果是bed格式文件,使用--bfile接文件前缀,如果数据是ped 、map格式,使用 --map接.map文件,--ped接.ped文件

--allow-no-sex 表示允许没有性别信息

--maf 指定maf阈值

--geno 指定缺失率阈值,与我们的完整度意思相反,0.2对应的完整度为0.8

--r2表示计算r2值

--ld-window 表示计算LD的区间,表示距离小于这个值的标记对都要进行LD的计算

--ld-window-r2

这个参数只能和--r2参数搭配使用,默认值为0.2, 对输出结果进行过滤,只输出R2大于该参数值的LD分析结果。

haploview 计算R2值的命令行:

java -jar Haploview.jar -nogui -memory 10240 -info test.hapmap.info -pedfile test.hapmap.ped -out test -maxdistance 500 -minGeno 0.5 -minMAF 0.05 -missingCutoff 0.5 -hwcutoff 0 -dprime

LD衰减(LD Decay)

LD的衰减指位点间由连锁不平衡到连锁平衡的演变过程;LD衰减的速度在不同物种间或同物种的不同亚群间,往往差异非常大。所以,通常会使用1个标准——“LD衰减距离”来描述LD衰减速度的快慢。

LD衰减距离通常指的是:当平均LD系数r2 衰减到一定大小的时候,对应的物理距离。“一定大小”是这个定义的关键点,但没有特别统一的标准,在不同文章中标准不同。常见的标准包括:

a)LD系数降低到最大值的一半;

b)LD系数降低到0.5以下;

c)LD系数降低到0.1以下;

d)LD系数降低到基线水平(注意,不同物种的基线值是不同的)。

所以,下次你在文章中看到“LDdecay distance is XXkb”的时候,不要忘了看看文章使用的标准是什么。

Nature Biotechnology 30, 105–111 (2012) doi:10.1038/nbt.2050

值的获取:成对计算指定距离范围内的所有SNP的r2 值,按区间取平均

LD衰减距离的应用

1、判断GWAS所需标记量,决定GWAS的检测效力以及精度;

GWAS标记量 = 基因组大小/LD衰减距离

2、辅助分析进化与选择

在同一个连锁群上,LD衰减的慢说明该群体受到选择。一般来说,野生群体比驯化改良群体LD衰减快,异花授粉植物比自花授粉植物LD衰减快。比如玉米:地方品种1kb,自交系2kb,商用自交系100kb。

Haplotype Block(单体型块)

单体型块,即连锁不平衡区域,是指同一条染色体上处于连锁不平衡状态的一段连续的区域。单体型块分析可以用于筛选tag SNP、确定候选基因的范围等。

如果GWAS检测到显著关联的区间,可以通过进一步绘制局部的LD单体型块图,来进一步判断显著相关的SNP和目标基因间是否存在强LD关系。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342