接昨天pvactools 安装,今天测试的目的是软件跑通。
VEP install 可以直接下载cache files , FASTA files and plugins . 昨天由于下载过慢,转为手动下载。
注意:cache 文件 分为VEP 和 VEP_indexed ,官方解释,这两个文件都可以使用,indexed cache 包注释速度非常快。 #需要重新下载indexed版本
#indexed_Vep
curl -O https://ftp.ensembl.org/pub/release-110/variation/indexed_vep_cache/homo_sapiens_vep_110_GRCh38.tar.gz
#vep
wget -c https://ftp.ensembl.org/pub/release-110/variation/vep/homo_sapiens_merged_vep_110_GRCh38.tar.gz
wget -c https://ftp.ensembl.org/pub/release-110/variation/vep/homo_sapiens_refseq_vep_110_GRCh38.tar.gz
wget -c https://ftp.ensembl.org/pub/release-110/variation/vep/homo_sapiens_vep_110_GRCh38.tar.gz
今天分析的时候遇到了新问题。
#启动griffithlab/pvactools 容器
docker run -it -v /share/home/test/00test/neoantigens_test/pvacseq_test:/test_data griffithlab/pvactools
#下载vep plugin
#pvactools 镜像中已经包含VEP plugins
pvacseq install_vep_plugin /test_data/vep_plugin
###vep 测试 ok
docker run -it \
-v /share/home/test/00test/neoantigens_test/pvacseq_test:/test_data \
-v /share/home//scripts/datas/ensembl-vep:/ensembl-vep \
ensemblorg/ensembl-vep vep \
--input_file /test_data/sample1_gDNA.vardict.vcf \
--output_file /test_data/sample1_gDNA.vep3.vcf \
--format vcf --vcf --symbol --terms SO --tsl --biotype --hgvs \
--fasta /ensembl-vep/hg38/hg38.fa \
--offline --cache /ensembl-vep/ --plugin Frameshift --plugin Wildtype \
--dir_plugins /test_data/vep_plugin \
--pick --transcript_version
##
### pvacseq 测试可以跑通
docker run -it \
-v /share/home/dujl/test/00test/neoantigens_test/pvacseq_test:/test_data \
griffithlab/pvactools pvacseq run \
/test_data/sample1_gDNA.vep3.vcf \
sample1_gDNA \
HLA-A*29:02,HLA-B*45:01,DRB1*04:05 \
all \
/test_data/outer2 \
-e1 8,9,10 \
-e2 15 \
--iedb-install-directory /opt/iedb
位点多,分析速度较慢;
多线程后,速度超级加倍~
pvacseq 使用过滤后的vcf ,HLA分型结果对计算结果影响?