软件选择

emmax
plink
qqman
CMplot

数据准备

vcf文件：all_snp.vcf
表型数据文件：sample.table

sample.table

参考脚本

vcf格式转tped格式

plink --vcf ./all_snp.vcf   \  # 输入文件
--maf 0.05 --geno 0.1  \ #过滤
--recode12   \#输出格式
--output-missing-genotype 0  \ #指定缺失数据用0表示
--transpose   \ #指定输出的tped格式
--out snp_filter  \  #输出文件前缀
--set-missing-var-ids @:#  \
--allow-extra-chr

结果文件

表型数据准备
表型数据的样品id要求有两列，且id的排列顺序与tfam文件的id排列顺序一致

计算亲缘关系矩阵

/home/software/emmax/emmax-kin-intel64 -v  \#打开日志模式
-d 10  \#指定精度
-o ./pop.kinship  \#指定输出文件名称
snp_filter   #指定输入SNP数据前缀

gwas分析

/home/software/emmax/emmax-intel64 -v -d 10  \ #
-t snp_filter  \ # 输出snp数据的前缀
-p sample.table  \ # 表型数据
-k pop.kinship   \ # 亲缘关系矩阵
-o emmax.out  \ # 输出文件前缀
1> emmax.log 2>emmax.error

结果文件为emmax.out.ps，最后一列为pvalue

emmax.out.ps

gwas结果绘图

#生成绘图的输入文件
paste  snp_filter.map  emmax.out.ps | awk  'BEGIN{print "SNP\tCHR\tBP\tP"}{if($2==$5){print $2"\t"$1"\t"$4"\t"$NF}}'  > emmax.out.ps.manht_input

输入文件需要有4列，snp名称、染色体、位置、pvalue

emmax.out.ps.manht_input

Rscript ./manhattan_cmplot.R  emmax.out.ps.manht_input  emmax.out.ps.manht_figure

曼哈顿图

QQ图

欢迎关注Bioinfor生信云！

最后编辑于：2022.11.22 22:19:35

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

重测序分析（15）GWAS分析实操（1）gwas_emmax