下载Synechococcus elongatus UTEX 2973(accession no.为GCA_000817325.1 )的基因组注释文件,生成一个locus_tag和Name对应关系的表格?要求:只能使用一行shell命令,生成的表格以制表符分隔;并将shell命令和基因数目写在答案处。
打开网址,进入NCBI网站
https://www.ncbi.nlm.nih.gov/
按genomes/all/GCA/000/817/325目录进入
wget https://ftp.ncbi.nlm.nih.gov/genomes/all/GCA/000/817/325/GCA_000817325.1_ASM81732v1/GCA_000817325.1_ASM81732v1_genomic.gff.gz #通过复制的链接下载基因注释文件
gunzip GCA_000817325.1_ASM81732v1_genomic.gff.gz
grep $'RefSeq\t' GCA_000817325.1_ASM81732v1_genomic.gff> test.tsv
less test.tsv
查看的结果
grep $'RefSeq\t' GCA_000817325.1_ASM81732v1_genomic.gff|less #查看抓取文件,无,失败
less GCA_000817325.1_ASM81732v1_genomic.gff #查看文件内容
grep $'\tProtein' GCA_000817325.1_ASM81732v1_genomic.gff |head
grep $'\tProtein' GCA_000817325.1_ASM81732v1_genomic.gff |sed 's/^.*;Name=//g'|sed 's/;.*;locus_tag=/\t/g'|sed 's/;.*$//g'|head