2022-05-25甲基化转化率统计

Bisulfitesequencing,实验 BS 处理 C->U(T) 转化效率并不是 100% 的,转化失败的部分 C 会成为假阳性信号,所以 BS 转化率也是很重要的指标。计算转化率需要建库实验掺入已知不含甲基化的 DNA(由于线粒体 DNA 可以认为是无甲基化修饰的 DNA,也可使用线粒体 DNA 来评估),理论上所有该 DNA 的C 都会被转化为 U(T),通过比对和甲基化计算分析,会得到该 DNA 的甲基化率为 0. 实际肯定不为 0,这部分甲基化就是转化失败的,所以 1 减去甲基化率就是转化率。BS 转化率,我们一般要求要在 99%以上。掺入已知不含甲基化的 DNA 一般常用是 Enterobacteria phage lambda (lambda DNA)。参考基因组序列 NC_001416.1 可以在 NCBI 下载:https://www.ncbi.nlm.nih.gov/nuccore/NC_001416.1如果使用样本本身的线粒体 DNA 来评估,建议使用线粒体 DNA 上非 CG 位点/或者 CC 位点的甲基化水平来评估。

1.比对

bsmap -a 1.fq -b 2.fq -d lambda.fa/chrMt.fa -o BSconvert.sam -p 8 -z 33 -r 1 -m 50 -x 1000

2.sam2bam

samtools view -Sb BSconvert.sam > BSconvert.bam

3.提取甲基化位点

python methratio.py -d lambda.fa/chrMt.fa -m 1 -o BSconvert.met.txt BSconvert.bam

4.统计甲基化转化率

perl -alne 'next if $.==1; next if $F[3] eq "CG"; $m+=$F[6]; $n+=$F[7]; END{ print "“BS_convert_ratio\t".sprintf("%.5f", $n/($m+$n));}' BSconvert.met.txt

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容