Nanopore数据分析软件tomobo

Nanopore数据分析软件tomobo


image.png

Tombo is a suite of tools primarily for the identification of modified nucleotides from nanopore sequencing data. Tombo also provides tools for the analysis and visualization of raw nanopore signal.

The first step in any Tombo analysis is to re-squiggle (raw signal to reference sequence alignment) raw nanopore reads
这一步创建了index,并且储存了raw signal alignments,这是对下游分析必要的。

作者利用大肠杆菌的例子去检测了dam和dac的甲基化(CpG model 也可以用于人类的分析;利用这些结果发现,原始信号在最显著修饰的dcm位置绘制,dam的修饰的基础预测输出到一个wiggle文件,用于下游处理或基因组浏览器中的可视化。

tombo resquiggle path/to/fast5s/ genome.fasta --processes 4 --num-most-common-errors 5

tombo detect_modifications alternative_model --fast5-basedirs path/to/fast5s/ \
    --statistics-file-basename native.e_coli_sample \
    --alternate-bases dam dcm --processes 4

在最显著的dcm位置绘制原始信号

tombo plot most_significant --fast5-basedirs path/to/fast5s/ \
    --statistics-filename native.e_coli_sample.dcm.tombo.stats \
    --plot-standard-model --plot-alternate-model dcm \
    --pdf-filename sample.most_significant_dcm_sites.pdf

生成wig文件,其中包含每个有效ref sites 序列修饰的估计分数

tombo text_output browser_files --statistics-filename native.e_coli_sample.dam.tombo.stats \
    --file-types dampened_fraction --browser-file-basename native.e_coli_sample.dam

for reference 生成成功处理的reads coverage文件

tombo text_output browser_files --fast5-basedirs path/to/fast5s/ \
    --file-types coverage --browser-file-basename native.e_coli_sample

虽然motif模型(CpG、dcm和dam;most accurate)和所有上下文特定的备用base model(5mC和6mA;more accurate)是首选,但Tombo还允许用户研究其他甚至未知的base modifications。

下面是两个示例命令,它们运行de_novo方法(检测与预期cannonical信号水平的偏差)和level_sample_compare方法(检测两个感兴趣的样本之间的信号水平偏差;在高覆盖率下效果最佳)。

tombo detect_modifications de_novo --fast5-basedirs path/to/fast5s/ \
    --statistics-file-basename sample.de_novo_detect --processes 4
tombo text_output browser_files --statistics-filename sample.de_novo_detect.tombo.stats \
    --browser-file-basename sample.de_novo_detect --file-types dampened_fraction

tombo detect_modifications level_sample_compare --fast5-basedirs path/to/fast5s/ \
    --control-fast5-basedirs path/to/control/fast5s/ --minimum-test-reads 50 \
    --processes 4 --statistics-file-basename sample.level_samp_comp_detect
tombo text_output browser_files --statistics-filename sample.level_samp_comp_detect.tombo.stats \
    --browser-file-basename sample.level_samp_comp_detect --file-types statistic

github:https://github.com/nanoporetech/tombo

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 16宿命:用概率思维提高你的胜算 以前的我是风险厌恶者,不喜欢去冒险,但是人生放弃了冒险,也就放弃了无数的可能。 ...
    yichen大刀阅读 6,099评论 0 4
  • 公元:2019年11月28日19时42分农历:二零一九年 十一月 初三日 戌时干支:己亥乙亥己巳甲戌当月节气:立冬...
    石放阅读 6,913评论 0 2
  • 今天上午陪老妈看病,下午健身房跑步,晚上想想今天还没有断舍离,马上做,衣架和旁边的的布衣架,一看乱乱,又想想自己是...
    影子3623253阅读 2,927评论 3 8