关于NCBI-SRA数据不再提供质量值的解决方案

近期在NCBI SRA中下载的FastQ数据不再提供质量值信息(图1和图2),据说是为了后期便于敛财收费提供质量值,鄙人对这种万恶的资本主义行径大为不齿,NCBI这是自绝于世界人民之举,FastQ中没有质量值将严重影响reads组装等分析,从而严重影响科研进程,拖慢了医疗、工业等领域的发展。

图1 NCBI下载的FastQ数据质量信息全部变成”?"

图2 NCBI下载的FastQ数据质量信息全部变成30

好在,经研究测试,可使用替代方案从EBI数据库下载有质量值的FastQ数据。替代方案的具体操作步骤如下:

  1. 进入EBI数据库,搜索目标SRA数据。
  2. 获取数据下载链接,例如,vol1/fastq/SRR203/072/SRR20318972/SRR20318972_1.fastq.gz和vol1/fastq/SRR203/072/SRR20318972/SRR20318972_2.fastq.gz
  3. 采用ascp下载:
ascp -QT -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -l 300M -P 33001 -k 1 -T era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR203/067/SRR20318967/SRR20318967_1.fastq.gz .
ascp -QT -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -l 300M -P 33001 -k 1 -T era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR203/067/SRR20318967/SRR20318967_2.fastq.gz .

下载完毕后即可获得有质量值的SRA FastQ文件。

其中ascp相关软件的配置方法详见应用Aspera高速下载NCBI和EBI数据 - 简书 (jianshu.com)

终于,在2026年2月11日,我发现ENA也不靠谱了,用上述方法在ENA上下载的FastQ文件也是没有质量值的。
另觅他法,发现NCBI又可以下载带质量值的文件了,解决方式如下:

wget -c https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR25655907/SRR25655907 && fasterq-dump --split-files ./SRR25655907

布莱特杨
2026年2月11日编辑
2023年1月16日编辑
2023年5月31日 15:02发布

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容