近期在NCBI SRA中下载的FastQ数据不再提供质量值信息(图1和图2),据说是为了后期便于敛财收费提供质量值,鄙人对这种万恶的资本主义行径大为不齿,NCBI这是自绝于世界人民之举,FastQ中没有质量值将严重影响reads组装等分析,从而严重影响科研进程,拖慢了医疗、工业等领域的发展。

图1 NCBI下载的FastQ数据质量信息全部变成”?"

图2 NCBI下载的FastQ数据质量信息全部变成30
好在,经研究测试,可使用替代方案从EBI数据库下载有质量值的FastQ数据。替代方案的具体操作步骤如下:
- 进入EBI数据库,搜索目标SRA数据。
- 获取数据下载链接,例如,vol1/fastq/SRR203/072/SRR20318972/SRR20318972_1.fastq.gz和vol1/fastq/SRR203/072/SRR20318972/SRR20318972_2.fastq.gz
- 采用ascp下载:
ascp -QT -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -l 300M -P 33001 -k 1 -T era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR203/067/SRR20318967/SRR20318967_1.fastq.gz .
ascp -QT -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -l 300M -P 33001 -k 1 -T era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR203/067/SRR20318967/SRR20318967_2.fastq.gz .
下载完毕后即可获得有质量值的SRA FastQ文件。
其中ascp相关软件的配置方法详见应用Aspera高速下载NCBI和EBI数据 - 简书 (jianshu.com)。
终于,在2026年2月11日,我发现ENA也不靠谱了,用上述方法在ENA上下载的FastQ文件也是没有质量值的。
另觅他法,发现NCBI又可以下载带质量值的文件了,解决方式如下:
wget -c https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR25655907/SRR25655907 && fasterq-dump --split-files ./SRR25655907
布莱特杨
2026年2月11日编辑
2023年1月16日编辑
2023年5月31日 15:02发布