全基因组关联分析(GWAS)-群体结构与亲缘关系

1、群体结构及其对 GWAS 的影响

群体结构的来源

image.png

群体结构对GWAS的影响--混淆变量
Ancestry可以导致混淆变量(confounding variable)
混淆变量: 统计学中,混淆变量是指既与因变量相关又与自变量相关的无关变量。混淆变量其实就是群体结构变量,是潜在的第三者每个亚群的样本共享一种生长习惯和生活方式,导致许多感兴趣的性状直接与亚群或世系相关。

群体结构对GWAS的影响--假阳性

image.png

image.png

image.png

2、群体结构的推断方法

群体结构评估三宝刃

image.png

系统发育树
image.png

model-base的群体结构分析
分析的大致原理:将大群体分成K个服从Hardy-Weinberger平衡的亚群,将各材料归到每个亚群,计算第i个材料其基因组变异源于第k个亚群的可能性(Pritchard et al. 2000),用Q值表示,Q值越大,表明该材料来自这个亚群的可能性越大
image.png

image.png

image.png

用于GWAS的主要结果
image.png

PCA(数学上的计算)
image.png

EIGENSOFT-smartPCA主要结果图示
image.png

基因型与群体结构关联
image.png

3、亲缘关系及其对GWAS的影响

image.png

Kinship的主要来源
① 血缘( Blood relationship) :
家庭关系( Family ties)
血亲关系( Blood ties)
② 共同祖先( Common Ancestry)
③ Sharing of characteristics or origins.
度量方式
• 亲缘系数( Coefficient of Kinship)
• 共祖率( Coancestry)
• 血缘一致性 ( Identical By Decent (IBD))
Kinship的主要方法
计算方法--根据系谱推断
image.png

image.png

根据标记基因型推断
image.png

标记基因型欧式距离
image.png

Nel's Distance
image.png

SPAGeDi(我钟爱的方法)
image.png

VanRaden方法
image.png

image.png

Zhang方法
image.png

各种方法均可使用
image.png

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容