2019-12-12

一、下载短序列
在Genome Announcements网站(https://mra.asm.org/)上任意找一篇细菌基因组文章;记载SRA号:SRR10028728,用prefetch下载该文件

prefetch SRR10028728

结果如下,序列自动保存在ncbi中


yi.PNG

二、Fastq-dump解压

fastq-dump --gzip --split-3 SRR10028728.sra

结果如图


解压.PNG

三、Fastqc质控,去接头

fastqc SRR10028728_1.fastq.gz
fastqc SRR10028728_2.fastq.gz

结果如图


去接头.PNG

将质量控制后的结果文件下载下来,并打开查看
SRR10028728_1_fastqc


heml.PNG

SRR10028728_2_fastqc
heml2.PNG

可以看到短序列几乎都位于绿色区域,说明数据质量良好
四、Spades组装基因组草图

~/ncbi/public/sra$ spades.py --only-assembler --phred-offset 33 -k 55 --s1 SRR10028728_1.fastq.gz -o ./SPAdes1
~/ncbi/public/sra$ spades.py --only-assembler --phred-offset 33 -k 55 --s1 SRR10028728_2.fastq.gz -o ./SPAdes2

结果如图


1.PNG

2.PNG

五、Quast评价组装结果

~/Biosofts/quast-5.0.0$ quast.py ~/ncbi/public/sra/SPAdes1/contigs.fasta
~/Biosofts/quast-5.0.0$ quast.py ~/ncbi/public/sra/SPAdes2/contigs.fasta

结果如图
SPAdes1


结果1.PNG

SPAdes2


结果2.PNG
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容