deeptools可视化

ref1:deeptools辅助CHIP-seq数据分析-可视化 | 生信菜鸟团

ref2:如何使用deeptools处理BAM数据 - 生信技能树

ref3:The tools — deepTools 3.1.3 documentation

第一个功能,把bam文件转换为bw格式文件:

bamCoverage -b tmp.sorted.bam -o tmp.bw

peak分布可视化

为了统计全基因组范围的peak在基因特征的分布情况,需要用到computeMatrix计算,用plotHeatmap以热图的方式对覆盖进行可视化,用plotProfile以折线图的方式展示覆盖情况。

computeMatrix具有两个模式:scale-region和reference-point。前者用来信号在一个区域内分布,后者查看信号相对于某一个点的分布情况。

computeMatrix scale-regions -b 3000 -a 3000 --regionBodyLength 5000-p 25 \

-R mm10_Gencode_VM18.bed \

-S *.bw \

--skipZeros \

--outFileName matrix.gz

结果可视化

可视化的方法有两种,一种是轮廓图,一种是热图。两则都提供了足够多的参数对结果进行细节上的修改。

plotProfile -m matrix.gz \              

-out plotProfile.png \              

--numPlotsPerRow 2 \              

--plotTitle "profile"

--numPlotsPerRow NUMPLOTSPERROW :  Number of plots per row (default: 8)

##########################################################

plotHeatmap \

-m matrix.gz \      

-out plotHeatmap.png \

--plotTitle "Heatmap"


构建bed:

安装:

sudo apt install bedops

命令:

1.先下载TAIR10_GFF3_genes.gff3, 

2. 然后convert2bed --input=gff [--output=bed] <TAIR10_GFF3_genes.gff> TAIR10_GFF3_genes.bed

3. 但是,computeMatrix 识别的bed文件只要前三列

cut -f 1-3 TAIR10_GFF3_genes.bed > ref.bed

4. 再跑computeMatrix就可以了

我用的Rseqc的bed

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容