批量下载NCBI基因组

批量下载NCBI基因组(mamba安装)

mamba create -n ncbidownload
conda activate ncbidownload
mamba install -c bioconda -n ncbi-genome-download
ncbi-genome-download --assembly-accessions list.csv --output-folder $PWD --section genbank --formats fasta bacteria

ncbi-genome-download参数详解:

命令 参数详解
-h 显示帮助
--assembly-accessions 将你要下载的基因组信息整理成每列单独一个的ID文件
--output-folder $PWD 保存的文件路径,这里是当前路径
--section refseq 选择数据库,两个参数一个是genebank一个是refseq,默认genebank
--formats fasta 下载形成的格式,这里是fasta格式
bacteria 必须参数,设置下载相关基因组的域,空格的形式放在命令最后,也可以换成all

附录

#搜索目录下所有gz文件复制到现在目录
find . -type f -name "*.gz" -exec cp {} $PWD \;
#统计个数
find . -type f -name "*.gz" | wc -l
#修改名字
for file in *.gz; do
    new_name=$(echo "$file" | cut -d '_' -f 1-2)
    mv "$file" "$new_name.gz"
done
#将下载的文件导出到一个统计文件中
ls *.gz > check.txt
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容