1.
1-1 在Genome Announcements网站上搜索葡萄球菌的文章,选择一篇进入。
我选择的是肠球菌的一篇研究文献
1-2 找到文章记载的SRA号
我只找到了SRX号,然后再去NCBI里搜索得到的SRA号
image.png
2. 用prefetch下载该文件
prefetch SRR031626
image.png
2-1 Fastq-dump解压SRA文件为fastq格式
fastq-dump --split-files SRR031626.sra
3. 数据过滤软件Trimmomatic切除接头
作业要求的这步我不会
java -jar ~/Biosofts/Trimmomatic-0.38/trimmomatic-0.38.jar PE -phred33 ~/SRR031626/SRR031626_1.fastq ~/SRR031626/SRR031626_2.stq ./zuoye_out/output_forward_paired.fq.gz ./zuoye_out/output_forward_unpaired.fq.gz ./zuoye_out/output_reverse_paired.fq.gz ./zuoye_out/output_reverse_unpaired.fq.gz ILLUMINACLIP:Biosofts/Trimmomatic-0.38/adapters/TruSeq2-PE.fa:2:30:10 SLIDINGWINDOW:5:20 LEADING:20 TRAILING:20 MINLEN:75
4.fastqc评价测试数据质量
fastqc ~/SRR031626/SRR031626_1.fastq -o ~
image.png
打开结果
5.Spades组装基因组
spades.py --careful --pe1-1 ~/SRR031626/SRR031626_1.fastq --pe1-2 ~/SRR031626/SRR031626_2.fastq -o ./zuoye_out
spades组装后的结果文件
6.Quast评价组装的基因组效果
quast.py Spades_out/contigs.fasta -o quast_out2
结果文件
PDF结果