在阅读文献时,会得到一些转录组的数据。那么我们如何下载这些转录组数据呢?以SRR1039510为例
一般转录组分析都会在服务器上进行,所以在下载之前,需要配置好环境,下载好相关软件(以后会详细的列出来)
#####方法一:使用prefetch 下载。
prefetch SRR1039510
####此方法非常慢,经常失败
#####方法二:wget + link
####link 可以在SRA Explorer 网站中找到 (https://sra-explorer.info/)
wget ftp://ftp.sra.ebi.ac.uk/vol1/srr/SRR103/000/SRR1039510
#####也非常慢可能需要一个小时
#####方法三: 使用ascp 命令下载 (速度快)
#####安装Aspera包:
conda install -c hcc aspera-cli
#####在SRA Explorer网站中找到下载命令并运行 (在Aspera commands for downloading FastQ files下)
#!/usr/bin/env bash
ascp -QT -l 300m -P33001 -i $HOME/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR103/000/SRR1039510/SRR1039510_1.fastq.gz . && mv SRR1039510_1.fastq.gz SRR1039510_GSM1275864_N61311_Alb_Homo_sapiens_RNA-Seq_1.fastq.gz
ascp -QT -l 300m -P33001 -i $HOME/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR103/000/SRR1039510/SRR1039510_2.fastq.gz . && mv SRR1039510_2.fastq.gz SRR1039510_GSM1275864_N61311_Alb_Homo_sapiens_RNA-Seq_2.fastq.gz
######方法四: 直接下载
#####进入网站:https://www.ebi.ac.uk/ena/browser/home,找到基因并进行下载(可选fastq文件或sra文件)
一般我们在下载sra文件后,都需要使用fastq-dump命令将其转化为fastq文件,所以在下载过程中如果有fastq文件,可以直接下载fastq文件。