批量下载基因组fna文件

可以先试一下entrez-direct,但是好像有很多esearch不到链接的基因组:

conda install -c bioconda entrez-direct

nohup sh -c 'for i in $(<prefetch_fna.list);do esearch -db genome -query ${i} |elink -target assembly|esummary|xtract -pattern FtpPath_RefSeq -element FtpPath_RefSeq>>fna.link;done' &

not working
所以使用了下面这个:

先从下面这个地址下载ASSEMBLY_REPORTS文件,然后在本地用grep提取信息,能够得到ftp基因组信息文件夹的地址,再人工加上(paste)后缀,比如_genomics.fna.gz或者_genomics.gff.gz等等。然后wget。
https://ftp.ncbi.nlm.nih.gov/genomes/ASSEMBLY_REPORTS/

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容