导读
用Metabat2分箱的方法见:宏基因组分箱(二)Metabat2分箱实战。本篇将展示用Metawrap的quant_bins模块计算每个样品中每个Bin的丰度的方法。quant_bins模块利用salmon软件的算法估计丰度。
一、查看输入文件
- 原始数据,即每个样品的质控后的fastq序列。
ls -alh Clean_data/
总用量 105G
drwxrwxr-x 2 cheng WST 4.0K 10月 15 16:45 .
drwxrwxr-x 14 cheng WST 4.0K 10月 23 19:46 ..
-rw-rw-r-- 1 cheng WST 11G 10月 15 16:13 H1_1.fastq
-rw-rw-r-- 1 cheng WST 11G 10月 15 16:14 H1_2.fastq
-rw-rw-r-- 1 cheng WST 13G 10月 15 16:14 H2_1.fastq
-rw-rw-r-- 1 cheng WST 13G 10月 15 16:15 H2_2.fastq
-rw-rw-r-- 1 cheng WST 5.0G 10月 15 16:15 H3_1.fastq
-rw-rw-r-- 1 cheng WST 5.0G 10月 15 16:15 H3_2.fastq
-rw-rw-r-- 1 cheng WST 13G 10月 15 16:15 H4_1.fastq
-rw-rw-r-- 1 cheng WST 13G 10月 15 16:16 H4_2.fastq
-rw-rw-r-- 1 cheng WST 12G 10月 15 16:16 H5_1.fastq
-rw-rw-r-- 1 cheng WST 12G 10月 15 16:16 H5_2.fastq
- 由Megahit共组装得到的contig文件。
-rw-rw-r-- 1 cheng WST 261391061 10月 15 10:42 final.contigs.fa
- 有Metabat2分箱得到的bIn文件(分装好的contig文件)。
ls -alh Bin/
总用量 159M
drwxrwxr-x 2 cheng WST 4.0K 10月 24 10:38 .
drwxrwxr-x 14 cheng WST 4.0K 10月 23 19:46 ..
-rw-rw-r-- 1 cheng WST 1.5M 10月 15 15:00 bin.10.fa
-rw-rw-r-- 1 cheng WST 1.1M 10月 15 15:00 bin.11.fa
-rw-rw-r-- 1 cheng WST 1.2M 10月 15 15:00 bin.12.fa
-rw-rw-r-- 1 cheng WST 1.2M 10月 15 15:00 bin.13.fa
-rw-rw-r-- 1 cheng WST 767K 10月 15 15:00 bin.14.fa
-rw-rw-r-- 1 cheng WST 229K 10月 15 15:00 bin.15.fa
...
二、Metawrap计算Bin丰度
source activate metawrap-env
# 进入metawrap工作环境
metawrap quant_bins -t 32 -o Bin_quant/ -b Bin/ -a final.contigs.fa Clean_data/H*.fastq
参数:
-t # 线程
-o # 输出文件夹(自动创建)
-b # Bin所在文件夹
-a # contig组装结果
最后是fastq/a(初始数据)文件所在文件夹
三、丰度计算结果
metawrap quant_bins结果:
ls -alh Bin_quant/
总用量 296K
drwxrwxr-x 4 cheng WST 4.0K 10月 26 15:26 .
drwxrwxr-x 14 cheng WST 4.0K 10月 23 19:46 ..
drwxrwxr-x 2 cheng WST 4.0K 10月 15 17:00 assembly_index
-rw-rw-r-- 1 cheng WST 259K 10月 15 17:23 bin_abundance_heatmap.png
-rw-rw-r-- 1 cheng WST 9.8K 10月 26 15:26 bin_abundance.pdf
-rw-rw-r-- 1 cheng WST 5.0K 10月 15 17:22 bin_abundance_table.tab
drwxrwxr-x 2 cheng WST 4.0K 10月 15 17:22 quant_files
查看每个样品每个Bin的丰度:
less Bin_quant/bin_abundance_table.tab
# 如下:
Genomic bins H2 H3 H1 H4 H5
bin.89 2.134105 0.893291 0.0 0.028242 0.0
bin.20 41.204144 19.519443 23.791852 36.713749 37.634001
bin.4 0.169901 0.218777 0.120826 0.9935795000000001 0.513861
bin.25 0.0 0.027746 2.670033 0.008831 0.0
bin.22 2.421549 7.251491 12.911376 0.775966 0.826068
bin.6 0.364747 0.120078 3.01643 0.607021 0.401539
bin.59 33.633947500000005 18.263084 20.202049 30.182607 30.293537
bin.68 0.884554 0.7562530000000001 0.036951 0.12255150000000001 0.437777
...
打开bin_abundance_heatmap.png,如下图所示。颜色和纵坐标设置都不好,可以自己用bin_abundance_table.tab文件重新画热图。
相关阅读:
宏基因组分箱(一)Megahit组装和QUAST质量评价
宏基因组分箱(二)Metabat2分箱实战
宏基因组分箱(三)Blobology可视化Bin