上Genome Announcements网站(https://mra.asm.org/)找一篇细菌基因组文章;找到文章记载的SRA号;
- 从SRA数据库上用prefetch下载该文件;
语法如下:
mkdir bacterial_genome
cd bacterial_genome
prefetch SRX6871076
运行结果:
- Fastq-dump解压;
语法如下:
fastq-dump ---gzip -split-files ~/ncbi/public/sra/SRX6871076.sra
运行结果:
- Fastqc质控;去接头;
语法如下:
fastqc SRX6871076_1.fastq.gz
fastqc SRX6871076_2.fastq.gz
mkdir trim
java -jar ~/Biosofts/Trimmomatic-0.38/Trimmomatic-0.38/trimmomatic-0.38.jar PE -phred33 SRX6871076_1.fastq.gz SRX6871076_2.fastq.gz ./trim/output_forward_paired.fq.gz ./trim/output_forward_unpaired.fq.gz ./trim/output_reverse_paired.fq.gz ./trim/output_reverse_unpaired.fq.gz ILLUMINACLIP:/home/Biosofts/Trimmomatic-0.38/Trimmomatic-0.38/adapters/TruSeq2-PE.fa:2:30:10 SLIDINGWINDOW:5:20 LEADING:20 TRAILING:20 MINLEN:75
运行结果:
对匹配上正向反向的序列再次用fastqc,语法如下:
fastqc output_forward_paired.fq.gz
fastqc output_reverse_paired.fq.gz
- Spades组装基因组草图;
语法如下:
spades.py --careful --pe1-1 SRX6871076_1.fastq.gz --pe1-2 SRX6871076_2.fastq.gz -o ./SPAdesout_9209170_new
结果如下:
- Quast评价组装的基因组效果
quast.py ~/bacterial_genome/SPAdes_out_SRX6871076/contigs.fasta -o ~/SPAdes_out_SRX6871076/quast_out
出现以下问题
尝试了更改虚拟机设置内存重新开机后,结果如下: