前言:nanopolish是开源的综合性分析软件,集成了非常多的三代测序数据分析小工具。
1.软件安装:
通过Github源码安装:
git clone --recursive https://github.com/jts/nanopolish.git
cd nanopolish
make
或者,通过conda安装:
conda install nanopolish
2.主要功能:
call-methylation:识别甲基化信号
eventalign:序列比对
extract:碱基识别
index:建立索引
phase-reads:相位分析,定位序列来自二倍体父本还是母本
polya:估计RNA直接测序polyA尾巴长度
variants:检测SNP等突变
vcf2fasta:生成一致性序列
3.使用方法
首先,下载测试数据
wget http://s3.climb.ac.uk/nanopolish_tutorial/methylation_example.tar.gz
tar -xvf methylation_example.tar.gz
cd methylation_example
构建索引
nanopolish index -d fast5_files/ output.fastq
与参考基因组比对
minimap2 -a -x map-ont reference.fasta output.fastq | samtools sort -T tmp -o output.sorted.bam
samtools index output.sorted.bam
利用nanopolish检测甲基化位点
nanopolish call-methylation -t 8 -r output.fastq -b output.sorted.bam -g reference.fasta -w "chr20:5,000,000-10,000,000" > methylation_calls.tsv
对结果进行过滤
scripts/calculate_methylation_frequency.py methylation_calls.tsv > methylation_frequency.tsv