确定阈值分为了不同的流派。
第一种方法,Bonferroni矫正
这种方法应用最多,一般是N表示参与分析的SNP的个数,阈值可以是:
* 1/N
* 0.05/N
* 0.01/N
文章中前两种用得较多,这种方法比较严格,有时候1/N也没有显著性位点,这时候,可以考虑降低N的个数。
第二种方法,降低N的个数
由于SNP之间有连锁,可以通过LD筛选,用剩余SNP作为N,从而达到降低阈值的目的,比如使用plink命令 --indep-pairwise 50 10 0.2筛选LD,用剩余的位点作为N,来计算阈值。
第三种方法,置换检验(permutation)
该方法通过置换检验,比如1000次置换检验,然后将最小值排序,选择5%的值作为阈值,该方法从数学角度应该是更合理的方法,具体操作:
a1 正常进行GWAS分析,得到P值结果
a2 将表型数据随机排列,比如排列1000次,得到1000个数据集
a3 对1000个数据集进行gwas分析,得到P值
a4 对P值提取最小的值,得到1000个值,选择5%的值作为阈值
所以,可以通过第二种解决问题,也是比较简单的方法。
参考:https://mp.weixin.qq.com/s/rcZHgFQ-WcYjnuKfvSf48Q