压缩文件的使用

1. 压缩文件的分类:

ZIP:扩展名为.zip,用于压缩/解压缩的程序是zip/unzip;

GZIP:扩展名为.gz,用于压缩/解压缩的程序是gzip/gunzip,UNIX系统最常用的压缩文件形式;

BZIP2:扩展名为.bz/.bz2,用于压缩/解压缩的程序是bzip2/bunzip2;

XZ:扩展名为.xz

BGZIP:生信专用的一种压缩文件形式,可以认为是GZIP的变种,BGZIP文件可以用gzip解压,但BGZIP文件只能由bgzip压缩产生。

    BGZIP用法示例:

efetch -db=nuccore -format=fasta -id=AF086833 > AF086833.fa

bgzip AF086833.fa

更多的bgzip教程见:http://www.htslib.org/doc/tabix.html


2. 压缩和解压缩:

#下载测序文件:

efetch -db=nuccore -format=fasta -id=AF086833 > AF086833.fa

#用gzip压缩为一个名为AF086833.fa.gz的文件:

gzip AF086833.fa

#预览AF086833.fa.gz:

gzcat AF086833.fa.gz | head

#解压缩AF086833.fa.gz:

gunzip AF086833.fa.gz


3. 压缩多个文件:

#下载测序文件并存储为两个名为AF086833.fa和AF086833.gb的文件:

efetch -db=nuccore -format=fasta -id=AF086833 > AF086833.fa

efetch -db=nuccore -format=gb -id=AF086833 > AF086833.gb

#将AF086833.fa和AF086833.gb压缩为一个名为sequences.tar.gz的文件:

tar czfv sequences.tar.gz AF086833.fa AF086833.gb

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容