下载二代测序，单细胞测序数据SRA，fastq文件等

SRA数据库是用于存储二代测序的原始数据，包括 454，Illumina，SOLiD，IonTorrent，Helicos 和 Complete Genomics。除了原始序列数据外，SRA现在也存在raw reads在参考基因的比对信息。

很多课题组有进行二代测序的需求，但苦于经费问题最后都退而求其次选择从数据库中挖掘已有数据，今天我们就来一波十分钟入门之如何从SRA数据库下载测序原始数据。此处我以下载一个小RNA测序数据为例，简单介绍测序数据下载。

1）登入NCBI的SRA数据库https://www.ncbi.nlm.nih.gov/sra/点选SRA Toolkit Documentation。

image

2）在SRA Toolkit Documentation页面点选SRA Toolkit Installation and Configuration Guide。

image

3）通过链接或命令行方式下载SRA Toolkit（推荐使用红框中链接下载，下载后解压就可以使用了，亲测很方便）。解压后可以看到里面有一个bin文件夹，该文件夹中存有各种测序下载和数据格式转换工具。此处展示了bin文件夹中的部分工具，红框中的prefetch和fasterq-dump工具稍后会用到，prefetch用来下载数据，fasterq-dump将数据转换为fastq格式，方便后续分析。

4）下载工具准备完毕，现在可以来搜索一下感兴趣的研究内容。此处我挑选了一个人类肺癌样本的小RNA测序数据SRR7189582。

image

6）打开命令行界面，在存储有SraAccList.txt文件的路径下调用SRA Toolkit中的prefetch命令按照下图中设置参数下载数据。数据下载需要一定的时间，下载过程中没有进度提示（我也很绝望），下载成功后会提示成功

7）下载完成后，调用fastq-dump命令处理下载好的数据，参数设置如图示。格式转换过程较快，处理完成后会在现有路径下找到文件fastq格式（FASTQ是一种存储了生物序列（通常是核酸序列）以及相应的质量评价的文本格式）的测序数据文件。

到这里为止，我们就成功的从SRA数据库下载到了一个测序数据。小伙伴们可以赶快尝试起来。有兴趣的同学还可以用fastqc等质控软件分析一下下载数据的质量，做些初步的处理，帮助后续的分析和挖掘。

如果想要了解更多数据下载的细节可以登入NCBI的SRA数据库https://www.ncbi.nlm.nih.gov/sra/ 点选Download Guide页面查看。

image

如果你下载数据有困难，可以简信联系我提供数据代下载服务。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

下载二代测序，单细胞测序数据SRA，fastq文件等

下载二代测序，单细胞测序数据SRA，fastq文件等

如果你下载数据有困难，可以简信联系我提供数据代下载服务。

相关阅读更多精彩内容

友情链接更多精彩内容