Bismark使用 2020-04-03

bismark 使用文档说明:mannual

1 快速了解

使用 bismark,需要安装perl,比对软件(Bowtie2或HISAT2)。
在 0.14.0 及其以上的版本,在比对和methylation extraction步骤可以多线程运行,使用参数 --parallel/--multicore 。
首先要下载基因组,将其放置在基因组文件夹下,支持 fastA格式,后缀可以是 .fa 或 .fasta。

1)运行 bismark_genome_preparation

USAGE: 
bismark_genome_preparation [options] <path_to_genome_folder>

应用实例:
/bismark/bismark_genome_preparation --path_to_aligner /usr/bin/bowtie2/ --verbose /data/genomes/homo_sapiens/GRCh37/

2) 运行 bismark

USAGE: 
bismark [options] --genome <genome_folder> {-1 <mates1> -2 <mates2> | <singles>}

应用实例: 
bismark --genome /data/genomes/homo_sapiens/GRCh37/ test_dataset.fastq

该步骤会生成两个文件:

  1. test_dataset_bismark_bt2.bam (包含比对结果和甲基化水平)
  2. test_dataset_bismark_SE_report.txt (包含比对和甲基化水平的统计结果)

3)运行 deduplicate_bismark

deduplicate_bismark --bam [options] <filenames>

对 Bismark 的比对结果去重,去除以相同方向比对到相同位置的 reads。建议应用于 WGBS 数据,不适用与 RRBS ,amplicon,以及 target 富集文库的数据。

4)运行 bismark_methylation_extractor

USAGE: 
bismark_methylation_extractor [options] <filenames>

A typical command to extract context-dependent (CpG/CHG/CHH) methylation could look like this: 
bismark_methylation_extractor --gzip --bedGraph test_dataset_bismark_bt2.bam

生成三个甲基化文件:
CpG_context_test_dataset_bismark_bt2.txt.gz
CHG_context_test_dataset_bismark_bt2.txt.gz
CHH_context_test_dataset_bismark_bt2.txt.gz
以及一个 bedGraph 和一个 Bismark coverag文件。后续会对这些文件进行说明。

5)运行 bismark2report

USAGE: 
bismark2summary [options]

# 总结 report 结果,可以在运行完 bam2nuc 之后
bams=`ls */*_bismark_bt2_pe.bam|tr '\n' ' '`
bismark2summary $bams

6) Running bismark2summary

USAGE: **  `bismark2summary [options]`

This command scans the current working directory for different Bismark alignment, deduplication and methylation extraction (splitting) reports to produce a graphical summary HTML report, as well as a data table, for all files in a directory. Here is a sample Bismark Summary Report.

2. Bismark -一般说明

Bismark 的工作原理

首先,再与基因组(分别进行 C->T,G->A转换)进行比对之前,对测序reads转换,正链(C->T),负链(G->A)。
reads 与基因组的四个比对过程中,得到的unique比对结果。与正常基因组进行比较,推测出每个C的甲基化状态。
当一个reads有一个最佳匹配时,会有一个最佳比对分值 AS:i 标记,若有多个相同分值的最佳比对结果,则删除这个reads-pair。


image.png

bismark 比对和methylation call 报告

这里的比值只是粗略的计算甲基化水平,真是的甲基化水平需要后续步骤重新计算。

3. 运行 bismark

  1. 首先构建基因组,BS转换,比对index,注意 Bowtie2 和 HISAT2 不同。
  2. 比对。
  3. 提取甲基化值。

2) 运行 bismark 进行比对

该步骤需要提供:
1)基因组目录:包括 genome.fa 文件和 bismark 生成的子目录。
2)测序文件:FastQ 或 FastA 格式

3) Bismark Deduplication Step

USAGE: ./deduplicate_bismark [options] filename(s)

4)Bismark methylation extractor

5)

7) Bismark Nucleotide Coverage report (bam2nuc)

bam2nuc [options] --genome_folder <path> [input.(bam|cram)]

8)Filtering out non-bisulfite converted reads (filter_non_conversion)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容