第一步 从genome数据库中下载对应信息
1. 打开NCBI,进入genome数据库
2. 从Custom resources下进入Microbes,再进入Browse microbial genomes
3. 输入需要的物种,可以进一步筛选(filter),然后download
第二步 提取csv结果文件中的biosmple列的biosample号和replicon列的chromesome号
1. replicon,有一些是空的,需要筛选;chromesome号有CP、NZ、NC三种,按需提取
2. 分别将biosample号、chromesome号存为文件
下为下载的文件截图:
第三步 batch entrez下载数据
1. nucleotide数据库下载chromesome号的文件,已经就是fasta文件了
2. biosample数据库下载biosample的summary文件;如需更多信息,可以选择full下载样本的所有信息,包括environment等;下图为选择full之后的下载结果,可能存在部分样本不含SRA文件的情况,可以进一步筛选(也可以直接在搜索页面进行筛选)【如下图所示】
3. 提取上一步下载的文件的sra号,再去选择sra数据库下载SRA文件