centos7下CNVnator 安装和使用

CNVnator
服务器:centos7

  1. CNVnator 安装过程
    GitHub - abyzovlab/CNVnator: a tool for CNV discovery and genotyping from depth-of-coverage by mapped reads
    从git 上下载源码安装过程中出现各种错误
    samtools 链接整个文件夹,如果缺少sam.h 或者sam.c ,直接去其他路径下拷贝过来,都是能够使用的
    root 下载和安装,这个不容易错
    hstlib 安装后,hstlib文件夹内还有一个htslib文件夹,需要的*.h 文件基本上都在的,可以全部复制过来

因为后续还是报了找不到各种文件的错误,就放弃用源码安装了。

conda可以一步安装成功的
conda install -c bioconda cnvnator
但是执行过程中ROOT会报错,root导入包报错,修改root 安装包里的<ROOT::Math::FitResult>,依然报错
在后续的时候了解到是root版本的不匹配,或者多个版本,导致错误

root各种文件下载:
ROOT: math/mathcore/inc/Fit/FitResult.h Source File (cern.ch)

例如错误:

[dujl@master cnvnator]$ cnvnator -root file.root -call 1000 
Error in <ROOT::Math::FitResult>: FitConfiguration and Minimizer result are not consistent
Number of free parameters from FitConfig = 3
Number of free parameters from Minimizer = 2
Error in <ROOT::Math::FitResult>: FitConfiguration and Minimizer result are not consistent
Number of free parameters from FitConfig = 3
Number of free parameters from Minimizer = 2
[dujl@master cnvnator]$ 

conda 创建虚拟环境,重新下载cnvator,注意root版本为6.20,按照以下顺序安装(测试已经成功)

安装命令行
conda create -n cnvnator python=3.8    #创建cnvnator 虚拟环境
conda install -c conda-forge root_base=6.20   #安装root 指定版本
conda install -c conda-forge -c bioconda cnvnator   #安装cnvnator
source activate cnvnator     #进入cnvnator 虚拟环境

  1. cnvnator分析命令行
命令行
cnvnator -root file.root -tree BPX21-023026FFPED750GT1_P750_gDNA.rmdup.sort.bam  -chrom 1  #选择1号染色体测试
cnvnator -root file.root -his 1000 -fasta 1.fa
cnvnator -root file.root -stat 1000
cnvnator -root file.root -partition 1000
cnvnator -root file.root -call 1000  > cnv.call.txt
~/Biosoftware/CNVnator/cnvnator2VCF.pl  cnv.call.txt genome >cnv.call.vcf   #转为vcf格式,这个perl脚本从GitHub上CNVnator下载

分析完成后的文件夹
(cnvnator) [dujl@master cnvnator]$ ll 
total 1153448
-rw-r--r--. 1 dujl samba 253105755 Oct  9 10:00 1.fa
-rw-r--r--. 1 dujl samba 916953397 Oct  4 16:51 BPX21-023026FFPED750GT1_P750_gDNA.rmdup.sort.bam
-rw-r--r--. 1 dujl samba   4818872 Oct  4 16:51 BPX21-023026FFPED750GT1_P750_gDNA.rmdup.sort.bam.bai
-rw-r--r--. 1 dujl samba     41512 Oct 11 11:18 cnv.call.txt
-rw-r--r--. 1 dujl samba     95360 Oct 11 12:35 cnv.call.vcf
-rw-r--r--. 1 dujl samba       984 Oct 11 12:18 cnvnator.sh

cnv.call.txt文件没有表名,每列依次为:
CNV_type coordinates CNV_size normalized_RD e-val1 e-val2 e-val3 e-val4 q0

cnv.call.txt 部分展示
CNV_type    coordinates CNV_size    normalized_RD   e-val1  e-val2  e-val3  e-val4  q0
duplication     chr1:5184001-6958000    1.774e+06       1.67425e+06     2.28272e-05     0       2.55988e-05     0       0.0128315
deletion        chr1:6958001-7068000    110000  990512  0.0356524       2.21302e-24     0.121439        8.85199e-24     0
duplication     chr1:7134001-7708000    574000  1.09496e+06     0       4.65726e-164    0       1.86289e-163    0.0283401
deletion        chr1:7769001-7779000    10000   2.09421e+06     9991.85 2.80386e+06     26600.6 1.12153e+07     0
duplication     chr1:7779001-7800000    21000   1.57455e+06     1399.46 1369.15 3056.16 5476.55 0
deletion        chr1:7800001-7858000    58000   711020  528.686 9.96383e-09     1745.55 3.98549e-08     0
duplication     chr1:7858001-7860000    2000    1.48479e+06     281234  7.17758e+08     1       1       0
deletion        chr1:7860001-8002000    142000  998181  0.0397676       5.15346e-34     0.0833459       2.06136e-33     0
duplication     chr1:8013001-14379000   6.366e+06       7.05773e+07     1.09653e-11     0       1.3423e-11      0       0.00126562
deletion        chr1:14379001-14381000  2000    6.99059e+06     125017  0       1       1       0
duplication     chr1:14381001-14384000  3000    2.17001e+06     165248  3.58881e+08     1       1       0

  1. 对于结果文件的一些思考
    如上第四列normalize_RD(矫正后的RD)感觉偏大很多
    Samtools depth 计算了chr1:5184001-6958000,平均深度约100左右

cnvnator 矫正公式:


image.png

当样本是panel测序,以及测序深度不高时,normalize_RD异常的离谱。
这种情况应该如何矫正?

参考:
conda三行cmd line极简装cnvnator攻略 – 小花花大世界 (floret.world)

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,542评论 6 504
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,822评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,912评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,449评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,500评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,370评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,193评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,074评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,505评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,722评论 3 335
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,841评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,569评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,168评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,783评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,918评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,962评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,781评论 2 354

推荐阅读更多精彩内容