群体分层校正,该选用多少个PCA

前言

关于选用多少个PCA做群体分层校正,各大期刊并没有一个统一的说法。 故做了如下综述。

1 随心所欲型,想选多少就选多少

PCA想选多少就选多少,这个真的不是开玩笑。有文献有真相!

比如下面文献直接选用10个PCA校正群体分层。

Largest GWAS of PTSD (N=20070) yields genetic overlap with schizophrenia and sex differences in heritability

比如选用前5个主成分校正群体分层。

Accounting for Population Stratification in Practice: A Comparison of the Main Strategies Dedicated to Genome-Wide Association Studies

比如选用前3个主成分校正群体分层。

GWAS identifies novel SLE susceptibility genes and explains the association of the HLA region

比如选用前2个主成分校正群体分层。

GWAS analysis of suicide attempt in schizophrenia: Main genetic effect and interaction with early life trauma

2 通过EIGENSTRAT软件确定显著的主成分

通过EIGENSTRAT软件确定显著的主成分的思路是这样的:

2.1通过EIGENSTRAT软件计算主成分

2.2计算各个主成分是否有显著的统计学意义

2.3将P值小于0.05的主成分纳入群体分层校正中。

如下图所示,主成分1和2是显著影响群体结构的(P<0.05),做关联分析时则被纳入协变量中。

此类做法参考文献:

GWAS Identifies Novel Susceptibility Loci on 6p21.32 and 21q21.3 for Hepatocellular Carcinoma in Chronic Hepatitis B Virus Carriers

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容