1.双端数据
1.1 原始数据样品路径清单(file path)文件的准备
该文件包含首行、每个样本的 ID、rawreads文件路径、forward或reverse信息。
首行必须是:sample-id,absolute-filepath,direction
#absolute filepaths “Fastq manifest” formats *file name: manifest.txt
sample-id,absolute-filepath,direction
SRR6025627,/media/luozhixin/0000678400004823/Qiime2/20190601/SRR6025627.1.fastq.gz,forward
SRR6025627,/media/luozhixin/0000678400004823/Qiime2/20190601/SRR6025627.2.fastq.gz,reverse
SRR6025635,/media/luozhixin/0000678400004823/Qiime2/20190601/SRR6025635.1.fastq.gz,forward
SRR6025635,/media/luozhixin/0000678400004823/Qiime2/20190601/SRR6025635.2.fastq.gz,reverse
通过脚本生成file path文件
echo 'sample-id','absolute-filepath','direction' > manifest_pe.txt
ls *_1.fastq.gz|while read id;
do
echo "${id%%_*},$PWD/$id,forward">> manifest_pe.txt;
echo "${id%%_*},$PWD/${id%%_*}_2.fastq.gz,reverse">> manifest_pe.txt;
done
1.2 导入QIIME2
激活环境
source activate qiime2-2020.6
conda activate qiime2-2020.6
输入:样品路径清单(file path)文件
输出:demux-summary.qza
双端数据使用命令:
qiime tools import \
--type 'SampleData[PairedEndSequencesWithQuality]' \
--input-path manifest_pe.txt \
--output-path summary_pe.qza \
--input-format PairedEndFastqManifestPhred33
将上步生成的qza文件生成qzv可视化文件:
qiime demux summarize \
--i-data summary_pe.qza \
--o-visualization summary_pe.qzv
将生成的demux-summary.qzv拖入https://view.qiime2.org/
1.3 切除引物
文章给的引物序列
>forward
GTGCCAGCMGCCGCGGTAA
>reverse
CCGTCAATTCMTTTRAGTTT
M=A/C
R=A/G
查看引物序列
less SRR10097305_1.fastq.gz | grep GCCGCGGTAA
less SRR10097305_2.fastq.gz |grep CCGTCAATTC
time qiime cutadapt trim-paired \
--i-demultiplexed-sequences demux-summary.qza \
--p-front-f GTGCCAGCMGCCGCGGTAA \
--p-front-r CCGTCAATTCMTTTRAGTTT \
--o-trimmed-sequences demux-summary2.qza \
--verbose \
&> primer_trimming.log
创建可视化文件查看质量
time qiime demux summarize \
--i-data demux-summary2.qza \
--o-visualization demux.qzv
2. 单端数据
通过脚本生成file path文件
echo 'sample-id','absolute-filepath','direction' > manifest_se.txt
ls *.fastq.gz|while read id;
do
echo "${id%%_*},$PWD/$id,forward">> manifest_se.txt;
done
单端数据使用命令:
qiime tools import \
--type 'SampleData[SequencesWithQuality]' \
--input-path manifest_se.txt \
--output-path demux_se.qza \
--input-format SingleEndFastqManifestPhred33