使用VEGAS2(Versatile Gene-based Association Study)进行gene based的关联分析研究

gene-based关联分析研究是SNP-based关联分析研究的一个补充。

目前有很多工具支持gene-based关联分析研究,比如GCTA,VEGAS2等。

下面主要介绍一下怎么用VEGAS2做gene-based的关联分析研究。

先说VEGAS2的优点,输入特别简单,不需要准备太多输入文件。

缺点,我后面再提。

VEGAS2提供了两种方式跑gene based的关联分析。

一种是在线的,一种是离线的。

下面分别介绍这两种。

1、基于在线跑VEGAS2的方式

在线网址https://vegas2.qimrberghofer.edu.au/

这种输入方式很简单,准备一个文件,文件包含两列,分别为SNP的rs编号和P值,如下所示:

rs1004739 0.00341

rs2898687 0.005083

rs7162781 0.6343

rs2905794 0.9469

rs1801052 0.9469

rs1013948 0.2093

准备好后,按如下图所示提交分析

2、基于Linux跑VEGAS2的方式

这种方式优点是不需要像在线那种方式需要等对方返回结果。直接就能在服务器上跑。

缺点也很明显。

第一、

配置麻烦。安装很不友好。不适合生信小白拿来练手。

会让你越练越挫,越练越生气。最后从入门到放弃。

第二、

即便你安装成功了,能跑了。你会发现,特别占CPU。

我相信等你跑完所有染色体后,早被课题组的人骂惨了。

所以,真心建议,放弃这个软件,或者直接选用在线版本。

如果你坚持要在Linux下用这个软件,请看下面的教程。

2.1 VEGAS2下载、安装

wget https://vegas2.qimrberghofer.edu.au/VEGAS2offline.tgz

tar -zxvf zVEGAS2offline.tgz

解压后,会看到以下两个可执行文件:

  1. VEGAS2.pl
  1. VEGAS2.config

以及两个文件夹:

a. VEGAS2database

b. VEGAS2scripts

2.2 config VEGAS2

sh vegas2.config VEGAS2database VEGAS2scripts

2.3 确保服务器安装了perl,plink和R

which perl

which plink

which R

如果安装了perl,plink和R,在输入上面命令后,会返回perl,plink和R的地址。没有返回哪个软件的地址,则需要自己手动export进去。

例如,假如没有返回plink软件,但是你又明确知道plink安装在/usr/bin下,则用以下命令:

export PATH=/usr/bin/:$PATH

2.3 安装R的依赖包

install.packages("mvtnorm")

install.packages("corpcor")

2.4 开始跑gene-based关联分析研究。

默认参数:

vegas2 test_vegas2input.txt -pop 1000GEURO -subpop EURO -genesize 0kbloc -top 100 -sex BothMnF -max 1000000 -out genebased.V2out

注意:

–chr 和 –genelist参数不要同时使用,同样,–top 和 –bestsnp参数也不要同时使用。不然没法工作。
-pop是指研究样本的群体来源,默认是欧洲( 1000GEURO );

-subpop是指子群体,比如芬兰,北方汉族等;

-genesize To specify which gene definition to use. There are five options available viz. 0kbloc(default), 10kbloc, 20kbloc, 50kbloc and 0kbldbin

-chr To run vegas2 on specific chromosome. It could be in between 1 to 23.

-genelist To run vegas2 on specific list of genes.

-top It tell vegas2 to perform top percentage test where it consider specified percentage of top SNPs

-bestsnp It tell vegas2 to perform best SNP test.

-sex This option is provided for X-chromosome analysis. It tells vegas2 to consider either male (Default) of female 1000G individuals to make ld matrix for simulations.

-max It tells VEGAS2 the maximum number of simulation to perform. It must be above 1e6.

-adjust To get genomic inflation corrected p-values. It will create one more file “<outfile>.corrected”

-out It tells VEGAS2 the output file name.

如果幸运的话,在这个阶段就能跑成功了。

这个时候,能得到如下示例结果:

但如果不幸。报错了。

下面我再推荐一个备份的跑法。

2.5 备份跑法:gene-based关联分析研究。

跑之前,需要先修改vegas2.pl的代码。

修改vegas2.pl

vi vegas2.pl

进入vegas2.pl文件以后,改动的代码如下:

1)第209行

将原始代码:

my $path_sub_population = "/scratch/aniketM/VEGAS2/$reference_population/1000G$sub_population.extract";

修改为:

my $path_sub_population = "/VEGAS2/VEGAS2offline2/VEGAS2database/$reference_population/1000G$sub_population.extract";

其中,/VEGAS2/VEGAS2offline2/VEGAS2database/指的是你服务器VEGAS2database绝对路径

也就是说,如果你的VEGAS2database文件夹放在/usr/VEGAS2/VEGAS2offline2/VEGAS2database/这个路径上,

那么这里应该修改为:

my $path_sub_population = "/usr/VEGAS2/VEGAS2offline2/VEGAS2database/$reference_population/1000G$sub_population.extract";

2)第212行

将原始代码:

my $path_merge_database = "/scratch/aniketM/VEGAS2/$reference_population/$definition_gene";

修改为:

my $path_merge_database = "/VEGAS2/VEGAS2offline2/VEGAS2database/$reference_population/$definition_gene";

修改的路径同209行的修改方式,这里不多做解释。

3)第215行

修改方式同209行,

/scratch/aniketM/VEGAS2/

改为

/VEGAS2/VEGAS2offline2/VEGAS2database/

4)第218行

修改方式同209行,

/scratch/aniketM/VEGAS2/

改为

/VEGAS2/VEGAS2offline2/VEGAS2database/

5)第340行

将原始代码:

system("cp /home/aniketM/bin/VEGAS2scripts/genemerge.sh genemerge.sh");

修改为:

system("cp /VEGAS2/VEGAS2offline2/VEGAS2scripts/genemerge.sh genemerge.sh");

其中,/VEGAS2/VEGAS2offline2/VEGAS2scripts/指的是你服务器VEGAS2scripts绝对路径

也就是说,如果你的VEGAS2scripts文件夹放在/usr/VEGAS2/VEGAS2offline2/VEGAS2scripts/这个路径上,

那么这里应该修改为:

system("cp /usr/VEGAS2/VEGAS2offline2/VEGAS2scripts/genemerge.sh genemerge.sh");

6)第341-346行

修改方式同340行,

/home/aniketM/bin/VEGAS2scripts/

改为

/VEGAS2/VEGAS2offline2/VEGAS2scripts/

保存vegas2.pl

完成以上1)-6)的工作后,输入:wq 保存vegas2.pl

开始运行gene-based关联分析研究

输入以下代码:

/path/to/perl vegas2.pl test_vegas2input.txt -pop 1000GEURO -subpop EURO -genesize 0kbloc -top 100 -sex BothMnF -max 1000000 -out genebased.V2out

其中,/path/to/perl是指服务器放perl的路径;

vegas2.pl是VEGAS2跑gene-based的perl脚本,与test_vegas2input.txt放在同一个路径里

3、内容补充:

运行这个软件,可能会遇到以下报错:

3.1 报错1

Can't locate Data/UUID.pm in @INC (@INC contains: /home/chenwenyan/perl5/lib/perl5 /usr/local/lib64/perl5 /usr/local/share/perl5 /usr/lib64/perl5/vendor_perl /usr/share/perl5/vendor_perl /usr/lib64/perl5 /usr/share/perl5 .) at /software/VEGAS2/VEGAS2offline2/vegas4.pl line 4.

解决方案是:安装Data::GUID模块。

具体解决方式:

1)下载、解压Data::GUID模块

wget https://cpan.metacpan.org/authors/id/R/RJ/RJBS/Data-UUID-1.224.tar.gz

tar -xzvf Data-UUID-1.224.tar.gz

2)安装Data::GUID模块

cd Data-UUID-1.224/

perl Makefile.PL

make

make test

make install

完成以上测试后,如果没有报任何的错误,说明Data::GUID模块已经正确安装。

3.2 报错2

gcc:error:unrecognized command line option ‘-fstack-protector-strong’

这个报错说明需要升级GCC的版本。

-fstack-protector-strong要求GCC 4.9版本以上

可以通过命令gcc -v查看服务器GCC的版本。

如果没有达到4.9,则需要升级。

gcc各种版本在这:http://ftp.gnu.org/gnu/gcc/

关于升级GCC,有写的比我更详细的教程,推荐看这篇:
https://www.cnblogs.com/julie-yang/p/4695845.html

这里我就不再赘述。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,509评论 6 504
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,806评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,875评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,441评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,488评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,365评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,190评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,062评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,500评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,706评论 3 335
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,834评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,559评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,167评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,779评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,912评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,958评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,779评论 2 354

推荐阅读更多精彩内容