1.下载安装:
官网上直接免费下载:https://ctg.cncr.nl/software/magma。可以基于Linux系统,也可以基于Windows系统。
在linux 系统下测试:
软件不需要安装,已编译好,运行 ./magma 遇到报错,信息如下:
/lib64/libstdc++.so.6:version 'GLIBCXX_3.4.20' not found
经过搜索,发现是/usr/lib64下的库版本不够新,最简单的方法可以更新libstdc++.so.6:version版本,下面附方法,因为我没有root权限,在自己的目录下查找到新版libstdc++.so,更改bash_profile 环境变量LD_PRELOAD 解决!
更新版本可以参考:https://blog.csdn.net/libaineu2004/article/details/77100132
更改LD_PRELOAD :
vi .bash_profile
添加环境变量:
export LD_LIBRARY_PATH=/lib:/lib64:/usr/lib:/usr/lib64:/usr/local/lib:/usr/local/lib64export LD_LIBRARY_PATH=/home/software/gcc/6.4.0/lib64:$LD_LIBRARY_PATH
source .bash_profile
2.使用
2.1 map SNPS onto gene(基于bim)
命令行:./MAGMA/magma --annotate --snp-loc /target/TEST.QC.bim --gene-loc /MAGMA/NCBI38.gene.loc --out ./MAGMA/test_data/TEST
2.2 gene analysis step
source .bash_profile
命令行:MAGMA/magma --bfile /target/TEST.QC --gene-annot ./MAGMA/test_data/TEST.genes.annot --out ./MAGMA/test_data/TEST_gene_anno
因为没有分组信息,报错,86 individuals read phenotype is binary, values of -9 and 0 will be considered missing values,remaining sample is too small (minimum = 50 individuals)
更改fam文件第六列,及表型信息,注意0,-9为缺失值,测试用了1,2作为标签,注意最小样本量是50个。
生成文件有两个 :
默认的分析模型:
主成分回归,有其他多种模型备选,详细可以看软件manual文档。
2.3 Gene-set analysis
根据研究目的,提供相应的基因集可以进行GSA分析;
命令行:MAGMA/magma --gene-results /MAGMA/test_data/TEST_gene_anno.genes.raw --set-annot/MAGMA/test_data/gene_set_test.txt --out /MAGMA/test_data/TEST_gene_anno.genes-set.txt
/gene_set_test.txt
生成文件:
1.genes-set.txt.gsa.sets.genes.out 2.genes-set.txt.gsa.out 3.genes-set.txt.gsa.genes.out
set1,set2 可用于后续分析。
默认的分析模型:linear regression model
发展:
该工具可以结合Hi-C数据对非编码区位点进行定位,详情可以参考:
https://mp.weixin.qq.com/s/jW6zNaay1kp5qdciMogcGQ
“来自北卡罗来纳大学医学院的研究人员成功开发了一种名为“H-MAGMA”的新型计算工具。该工具通过整合染色质相互作用图谱,改进了现有技术MAGMA,能够基于全基因组关联研究将非编码基因变异与与疾病相关基因进行关联。” ---------------------截取自该公众号