混合线性模型MLM:GLM模型中,如果两个表型差异很大,但群体本身还含有其他的遗传差异(如地域等),则那些与该表型无关的遗传差异也会影响到相关性。MLM模型可以把群体结构的影响设为协方差,把这种位点校正掉。此外,材料间的公共祖先关系也会导致非连锁相关,可加入亲缘关系矩阵作为随机效应来矫正。
数据准备
表型数据:sample.table
Q矩阵:snp.3.Q
vcf文件:all_snp.vcf
参考脚本
计算亲缘关系矩阵
run_pipeline.pl -Xms512m -Xmx50g \ #设置内存大小
-importGuess ./all_snp.vcf \ #输入文件
-KinshipPlugin -method Centered_IBS -endPlugin \#计算亲缘关系矩阵
-export kinship.txt \#输出文件id
-exportType SqrMatrix #输出文件的格式
基于mlm模型进行GWAS分析
run_pipeline.pl -Xms512m -Xmx50g \ #设置内存大小
-fork1 -vcf ./all_snp.vcf \#vcf文件
-fork2 -t sample.table \#表型数据
-fork3 -q snp.3.Q -excludeLastTrait \ #Q矩阵
-fork4 -k kinship.txt \ #亲缘关系矩阵
-combine5 -input1 -input2 -input3 -intersect \#整合输入文件
-combine6 -input5 -input4 -mlm \#mlm分析
-mlmVarCompEst P3D -mlmCompressionLevel None\ #标准模型分析
-export mlm_output #输出结果
结果文件
mlm_output1.txt
mlm_output2.txt
mlm_output3.txt
mlm_output4.txt
画图
画图脚本与上篇gwas模型一致