bismark 使用文档说明:mannual
1 快速了解
使用 bismark,需要安装perl,比对软件(Bowtie2或HISAT2)。
在 0.14.0 及其以上的版本,在比对和methylation extraction步骤可以多线程运行,使用参数 --parallel/--multicore 。
首先要下载基因组,将其放置在基因组文件夹下,支持 fastA格式,后缀可以是 .fa 或 .fasta。
1)运行 bismark_genome_preparation
USAGE:
bismark_genome_preparation [options] <path_to_genome_folder>
应用实例:
/bismark/bismark_genome_preparation --path_to_aligner /usr/bin/bowtie2/ --verbose /data/genomes/homo_sapiens/GRCh37/
2) 运行 bismark
USAGE:
bismark [options] --genome <genome_folder> {-1 <mates1> -2 <mates2> | <singles>}
应用实例:
bismark --genome /data/genomes/homo_sapiens/GRCh37/ test_dataset.fastq
该步骤会生成两个文件:
- test_dataset_bismark_bt2.bam (包含比对结果和甲基化水平)
- test_dataset_bismark_SE_report.txt (包含比对和甲基化水平的统计结果)
3)运行 deduplicate_bismark
deduplicate_bismark --bam [options] <filenames>
对 Bismark 的比对结果去重,去除以相同方向比对到相同位置的 reads。建议应用于 WGBS 数据,不适用与 RRBS ,amplicon,以及 target 富集文库的数据。
4)运行 bismark_methylation_extractor
USAGE:
bismark_methylation_extractor [options] <filenames>
A typical command to extract context-dependent (CpG/CHG/CHH) methylation could look like this:
bismark_methylation_extractor --gzip --bedGraph test_dataset_bismark_bt2.bam
生成三个甲基化文件:
CpG_context_test_dataset_bismark_bt2.txt.gz
CHG_context_test_dataset_bismark_bt2.txt.gz
CHH_context_test_dataset_bismark_bt2.txt.gz
以及一个 bedGraph 和一个 Bismark coverag文件。后续会对这些文件进行说明。
5)运行 bismark2report
USAGE:
bismark2summary [options]
# 总结 report 结果,可以在运行完 bam2nuc 之后
bams=`ls */*_bismark_bt2_pe.bam|tr '\n' ' '`
bismark2summary $bams
6) Running bismark2summary
USAGE: ** `bismark2summary [options]`
This command scans the current working directory for different Bismark alignment, deduplication and methylation extraction (splitting) reports to produce a graphical summary HTML report, as well as a data table, for all files in a directory. Here is a sample Bismark Summary Report.
2. Bismark -一般说明
Bismark 的工作原理
首先,再与基因组(分别进行 C->T,G->A转换)进行比对之前,对测序reads转换,正链(C->T),负链(G->A)。
reads 与基因组的四个比对过程中,得到的unique比对结果。与正常基因组进行比较,推测出每个C的甲基化状态。
当一个reads有一个最佳匹配时,会有一个最佳比对分值 AS:i 标记,若有多个相同分值的最佳比对结果,则删除这个reads-pair。
bismark 比对和methylation call 报告
这里的比值只是粗略的计算甲基化水平,真是的甲基化水平需要后续步骤重新计算。
3. 运行 bismark
- 首先构建基因组,BS转换,比对index,注意 Bowtie2 和 HISAT2 不同。
- 比对。
- 提取甲基化值。
2) 运行 bismark 进行比对
该步骤需要提供:
1)基因组目录:包括 genome.fa 文件和 bismark 生成的子目录。
2)测序文件:FastQ 或 FastA 格式
3) Bismark Deduplication Step
USAGE: ./deduplicate_bismark [options] filename(s)
4)Bismark methylation extractor
5)
7) Bismark Nucleotide Coverage report (bam2nuc)
bam2nuc [options] --genome_folder <path> [input.(bam|cram)]