# 导入Phred33格式单端测序结果
qiime tools import \
--type 'SampleData[SequencesWithQuality]' \
--input-path sample.txt \
--output-path single-end-demux.qza \
--input-format SingleEndFastqManifestPhred33V2
# 测序结果质量可视化
qiime demux summarize \
--i-data single-end-demux.qza \
--o-visualization demux.qzv
在选择trunc-len时,我们选择最小的值194,以保留更多的序列数。
#使用dada2进行序列去燥
qiime dada2 denoise-single \
--i-demultiplexed-seqs single-end-demux.qza \
--p-trunc-len 194 \
--o-representative-sequences rep-seqs-dada2.qza \
--o-table table.qza \
--o-denoising-stats dada2-stats.qza
#可视化去燥过程
qiime metadata tabulate \
--m-input-file dada2-stats.qza \
--o-visualization dada2-stats.qzv
可以发现即使我们使用了序列质量可视化文件中占比最低的length=194作为截取参数,仍然去除了80-90%的序列数,这就比较诡异。
事实上,我共测序了10批样品,只有这批样品出现了这个问题,猜测可能是测序公司的测序质量除了问题,或者拼接出现了问题。因为我是使用的公司返回的拼接好的CleanData进行的分析。