在做GWAS时,曼哈顿图和qq图是两种必不可少的图片,现就qq图进行一简要说明
先上图:
我们在进行GWAS分析时,都是基于连锁不平衡,某些SNP位点与某性状紧密连锁,所以这些位点与性状显著相关,通常这些突变来源与两个方面
- 自然选择; 物竞天择,适者生存,或者是人为的驯化选择,这是我们分析GWAS时需要的突变;
- 遗传漂变; 它是一种随机的突变且数量并不少,一般情况并不会和某一性状有显著相关性,这种位点是我们需要排除的。
所以,在分析GWAS时,我们如何确定找到的SNP位点是和我们关心的性状显著相关,而不是遗传漂变呢,从QQ-plot可以得到这一信息。
Q-Q plot 即Quantile-Quantile Plot。它在各类研究中经常用到,主要是直观的表示观测值与预测值之间的差异。
其中纵坐标为实际观测值P,以-log10(P)表示,横坐标为期望值,也用-log10(exp)表示。
实际为均匀分布的分位数,譬如,我们共鉴定到100个SNPs,则第一个期望值为-log((1/100)+1),第二个为-log((2/100)+1)......-log((100/100)+1),所以会呈现一条直线,这也近似描述了基因组上的随机遗传漂变。
如果我们鉴定的SNP是遗传漂变引起的,那么实际的p值和期望值均称一条直线,比如刚开始p值较高时,两条会在一条线上,而当p值变小时,即观测值与期望值迅速分离,这表明,这时的SNP是收到选择的,最后看到一个高高翘起的QQ-plot。这时基本就可以断定,我们所研究的表型和基因型之间是存在着显著相关的自然选择作用的。