1.上Genome Announcements网站(https://mra.asm.org/)找一篇细菌基因组文章;找到文章记载的SRA号
这里找了一篇文章:
https://mra.asm.org/content/8/39/e01033-19
2.从SRA数据库上用prefetch下载该文件
prefetch SRR8869227
3.Fastq-dump解压
fastq-dump --split-files SRR8869227.sra
4.Fastqc质控
fastqc SRR8869227_1.fastq
fastqc SRR8869227_2.fastq
5.trimmomatic去接头
java -jar ~/Biosofts/Trimmomatic038/Trimmomatic-0.38/trimmomatic-0.38.jar PE -phred33 SRR8869227_1.fastq SRR8869227_2.fastq ./trim_out/output_forward_paired.fq.gz ./trim_out/output_forward_unpaired.fq.gz ./trim_out/output_reverse_paired.fq.gz ./trim_out/output_reverse_unpaired.fq.gz ILLUMINACLIP:/home/sunzhe/Biosofts/Trimmomatic038/Trimmomatic-0.38/adapters/TruSeq2-PE.fa:2:30:10 SLIDINGWINDOW:5:20 LEADING:20 TRAILING:20 MINLEN:75
5.Spades组装基因组草图
spades.py --careful --pe1-1 SRR8869227_1.fastq --pe1-2 SRR8869227_2.fastq -o ./output
6.Quast评价组装的基因组效果
quast.py ~/Seqs/test/output/contigs.fasta -o ~/Seqs/test/quast_out
结果: