可以先试一下entrez-direct,但是好像有很多esearch不到链接的基因组:
conda install -c bioconda entrez-direct
nohup sh -c 'for i in $(<prefetch_fna.list);do esearch -db genome -query ${i} |elink -target assembly|esummary|xtract -pattern FtpPath_RefSeq -element FtpPath_RefSeq>>fna.link;done' &
not working
所以使用了下面这个:
先从下面这个地址下载ASSEMBLY_REPORTS文件,然后在本地用grep提取信息,能够得到ftp基因组信息文件夹的地址,再人工加上(paste)后缀,比如_genomics.fna.gz或者_genomics.gff.gz等等。然后wget。
https://ftp.ncbi.nlm.nih.gov/genomes/ASSEMBLY_REPORTS/