除了WGS,Manta能分析target区域的结构变异吗?


照片来自花粉 在旁边

写在前面:

Manta作为一款结构变异检测的软件,它最显著的特点就是快,官方声称其分析用时不到其他软件的十分之一,一般的WGS分析能够在2个小时内分析完成。Manta利用成对的read和截断的read信息进行SV检测,支持germline和somatic (tumor-nomal sample pairs) 结构变异的检出。除了可以广泛应用于WGS分析,Manta多加几个参数就可以方便的用于target区域的SV检测了。


检测target区域所需参数:

--callRegions  该参数后接BED.gz压缩文件  

BED文件在使用 bgzip 命令压缩后,还需要用 tabix 命令创建索引,放在BED.gz文件的同一路径下,这点跟Strelka很像。准备方法如下:

                bgzip BED > BED.gz     生成bed.gz用于tabix构建索引

                tabix -p bed BED.gz       tabix 构建索引,生成bed.gz.tai

--exome

这个flag可以取消为WGS设计的高深度过滤(high depth filters), 该过滤是为了改善中心粒周围reads堆积而设计的,对于target区域和全外显子检测是不适用的。

--config 该参数后接修改后的config文件

Manta的默认参数文件是为WGS设计的,在检测target区域的情况下,可以通过修改参数文件提高敏感性。参数文件的默认位置:${MANTA_INSTALL_PATH}/bin/configManta.py.ini 。不建议直接修改该文件,因为这里面的参数是每次运行都要调取的,建议将该文件备份后,修改备份文件,并将备份文件加在--config后面。需要修改的参数如下:

# Remove all edges from the graph unless they're supported by this many 'observations'.

# Note that one supporting read pair or split read usually equals one observation, but evidence is sometimes downweighted.

minEdgeObservations = 2

# Run discovery and candidate reporting for all SVs/indels with at least this many spanning support observations

minCandidateSpanningCount = 2

增加了以上参数设置,target区域的检测基本就大功告成了。Manta的速度果然快的感人,CREST一天都没有跑完的流程,它只用了几十分钟。。。当然检出的结构变异数量也相差比较大,待比较完结果再更。

参考:

https://github.com/Illumina/manta/blob/master/docs/userGuide/README.md#exometargeted

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 一、Python简介和环境搭建以及pip的安装 4课时实验课主要内容 【Python简介】: Python 是一个...
    _小老虎_阅读 5,818评论 0 10
  • ORA-00001: 违反唯一约束条件 (.) 错误说明:当在唯一索引所对应的列上键入重复值时,会触发此异常。 O...
    我想起个好名字阅读 5,446评论 0 9
  • feisky云计算、虚拟化与Linux技术笔记posts - 1014, comments - 298, trac...
    不排版阅读 3,921评论 0 5
  • 好久没有写了,冬天冷了就有点懒,今天写日期还写了2018年,回头一想不对哦!时间过得真快,忙忙碌碌的又是一年。...
    斌鹏老妈阅读 198评论 0 0
  • 环保政策的收紧,国家产业布局的宏观调控,我在北京从事的家具生产行业顺应相关政策,从北京迁移到了全国不同地区。我在政...
    砾行阅读 627评论 0 0