归档和压缩
归档,也称为打包,指的是一个文件或目录的集合,而这个集合被存储在一个文件中,因此它占用的空间是其中所有文件和目录的总和。
压缩是指利用算法将文件进行处理,已达到保留最大文件信息,而让文件体积变小的目的。由于计算机处理的信息是以二进制的形式表示的,因此,压缩软件就是把二进制信息中相同的字符串以特殊字符标记,把一个或者多个文件用压缩软件进行压缩,形成一个文件压缩包。
- 有损压缩:丢失个别的数据,对文件不会造成太大的影响。有损压缩广泛应用于动画、声音和图像文件中,典型代表就是影碟文件格式 mpeg、音乐文件格式 mp3 以及图像文件格式 jpg
- 无损压缩:压缩文件数据准确无误
- 解压缩:压缩包中的数据无法直接使用,使用前需要利用压缩工具将文件数据还原
常见的归档命令有tar
和dd
,而常见的压缩命令有gzip
、zip
、bzip2
。
注意:tar
命令也可以作为压缩命令
tar 命令
tar
命令可以用于归档和解归档,使用此命令生成的归档包通常称作为tar包,以tar结尾。
tar 打包(文件或目录)命令
常见格式为tar [选项] 源文件或目录
选项:
- -c:将多个文件或目录进行打包
- -A:追加 tar 文件到归档文件
- -f 包名:指定包的文件名
- -v:显示打包文件过程
通常使用
-cvf
作为tar
命令打包的常见写法,该命令在使用时也可以不加-
作为选项前缀
[panjianqiao@localhost ~]$ touch demo1
[panjianqiao@localhost ~]$ touch demo2
[panjianqiao@localhost ~]$ touch demo3
[panjianqiao@localhost ~]$ tar -cvf test.tar demo1 demo2 demo3
demo1
demo2
demo3
[panjianqiao@localhost ~]$ ls
demo1 demo3 Documents Music Public test.tar
demo2 Desktop Downloads Pictures Templates Videos
[panjianqiao@localhost ~]$ ls -l test.tar
-rw-rw-r--. 1 panjianqiao panjianqiao 10240 Jul 17 10:06 test.tar
tar 解打包(文件或目录)命令
常见格式为tar [选项] 源文件或目录
选项:
- -x:对 tar 包做解打包操作
- -f:指定要解压的 tar 包的包名
- -t:只查看 tar 包中有哪些文件或目录,不对 tar 包做解打包操作
- -C 目录:指定解打包位置
- -v:显示解打包的具体过程
通常使用
-xvf
作为tar
命令解打包到当前文件夹下,也可使用-C 目录
解打包到指定目录文件夹下
[panjianqiao@localhost ~]$ tar -xvf test.tar #解打包到当前文件夹下
demo1
demo2
demo3
[panjianqiao@localhost ~]$ tar -xvf test.tar -C /tmp #解打包到tmp文件夹下
demo1
demo2
demo3
[panjianqiao@localhost ~]$ ls /tmp #由于篇幅限制,只显示相关信息
demo1
demo2
demo3
...
tar 打包压缩(解打包压缩)(文件或目录)命令
常见格式为tar [选项] 压缩包 源文件或目录
、tar [选项] 压缩包
选项:
- -z:压缩或解压缩 ".tar.gz" 格式的文件
- -j:压缩或解压缩 ".tar.bz2"格式的文件
- -J:压缩或解压缩 ".tar.xz" 格式的文件
[panjianqiao@localhost ~]$ mkdir test1 test2 test3
[panjianqiao@localhost ~]$ ls -l
total 0
drwxr-xr-x. 2 panjianqiao panjianqiao 40 Jul 11 13:17 Desktop
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Documents
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Downloads
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Music
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Pictures
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Public
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Templates
drwxrwxr-x. 2 panjianqiao panjianqiao 6 Jul 17 11:03 test1
drwxrwxr-x. 2 panjianqiao panjianqiao 6 Jul 17 11:03 test2
drwxrwxr-x. 2 panjianqiao panjianqiao 6 Jul 17 11:03 test3
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Videos
[panjianqiao@localhost ~]$ tar -zcvf test.tar.gz test1 test2 test3 #打包并压缩三个目录为gz格式
test1/
test2/
test3/
[panjianqiao@localhost ~]$ ls
Desktop Downloads Pictures Templates test2 test.tar.gz
Documents Music Public test1 test3 Videos
[panjianqiao@localhost ~]$ tar -zxvf test.tar.gz -C /tmp #在tmp文件夹下解打包压缩
test1/
test2/
test3/
[panjianqiao@localhost ~]$ ls /tmp
...
test1
test2
test3
...
zip 命令
zip格式文件是windows和linux系统都通用的文件格式,属于几种主流压缩格式(zip、rar)之一
常见格式为zip [选项] 压缩包名 源文件或源目录列表
选项:
-r:递归压缩目录,及将制定目录下的所有文件以及子目录全部压缩。
-m:将文件压缩之后,删除原始文件,相当于把文件移到压缩文件中
-v:显示详细的压缩过程信息
-q:在压缩的时候不显示命令的执行过程
-压缩级别:压缩级别是从 1~9 的数字,-1 代表压缩速度更快,-9 代表压缩效果更好
-u:更新压缩文件,即往压缩文件中添加新文件
压缩文件
[panjianqiao@localhost ~]$ touch demo1 demo2 demo3
[panjianqiao@localhost ~]$ ls
demo1 demo3 Documents Music Public Videos
demo2 Desktop Downloads Pictures Templates
[panjianqiao@localhost ~]$ zip -v demo.zip demo1 demo2 demo3 #显示压缩文件过程信息
adding: demo1 (in=0) (out=0) (stored 0%)
adding: demo2 (in=0) (out=0) (stored 0%)
adding: demo3 (in=0) (out=0) (stored 0%)
total bytes=0, compressed=0 -> 0% savings
[panjianqiao@localhost ~]$ ls
demo1 demo3 Desktop Downloads Pictures Templates
demo2 demo.zip Documents Music Public Videos
压缩目录
[panjianqiao@localhost ~]$ mkdir test1 test2 test3
[panjianqiao@localhost ~]$ zip -vm test.zip test1 test2 test3 #显示压缩目录信息的同时删除源文件
adding: test1/ (in=0) (out=0) (stored 0%)
adding: test2/ (in=0) (out=0) (stored 0%)
adding: test3/ (in=0) (out=0) (stored 0%)
total bytes=0, compressed=0 -> 0% savings
deleting directory test3 (if empty)
deleting directory test2 (if empty)
deleting directory test1 (if empty)
[panjianqiao@localhost ~]$ ls
demo1 demo3 Desktop Downloads Pictures Templates Videos
demo2 demo.zip Documents Music Public test.zip
unzip 命令
此命令可以解压缩zip文件,常见格式为unzip [选项] 压缩包名
选项:
- -d 目录名:将压缩文件解压到指定目录下
- -n:解压时并不覆盖已经存在的文件
- -o:解压时覆盖已经存在的文件,并且无需用户确认
- -v:查看压缩文件的详细信息,包括压缩文件中包含的文件大小、文件名以及压缩比等,但并不做解压操作
- -t:测试压缩文件有无损坏,但并不解压
- -x 文件列表:解压文件,但不包含文件列表中指定的文件
[panjianqiao@localhost ~]$ unzip test.zip
Archive: test.zip
creating: test1/
creating: test2/
creating: test3/
[panjianqiao@localhost ~]$ ls
demo1 demo3 Desktop Downloads Pictures Templates test2 test.zip
demo2 demo.zip Documents Music Public test1 test3 Videos
gzip 命令
gzip
是面向压缩和解压缩文件的命令,此命令只能用于(单个)文件的压缩和解压,在对目录进行压缩时只会把目录文件夹下的子文件分别压缩,常见格式为gzip [选项] 源文件
。
选项:
-c:将压缩数据输出到标准输出中,并保留源文件
-d:对压缩文件进行解压缩
-r:递归压缩指定目录下以及子目录下的所有文件
-v:对于每个压缩和解压缩的文件,显示相应的文件名和压缩比
-l:对每一个压缩文件,显示以下字段:压缩文件的大小;未压缩文件的大小;压缩比;未压缩文件的名称
-数字:用于指定压缩等级,-1 压缩等级最低,压缩比最差;-9 压缩比最高。默认压缩比是 -6
压缩及解压缩文件
[panjianqiao@localhost ~]$ touch demo1
[panjianqiao@localhost ~]$ touch demo2
[panjianqiao@localhost ~]$ touch demo3
[panjianqiao@localhost ~]$ gzip demo1 demo2 demo3 #分别压缩三个文件,压缩完成之后,原文件不保留
[panjianqiao@localhost ~]$ ls
demo1.gz demo2.gz demo3.gz Desktop Documents Downloads Music Pictures Public Templates Videos
[panjianqiao@localhost ~]$ gzip -d demo1.gz demo2.gz demo3.gz #分别对三个文件进行解压缩
[panjianqiao@localhost ~]$ ls
demo1 demo2 demo3 Desktop Documents Downloads Music Pictures Public Templates Videos
[panjianqiao@localhost ~]$ tar -cvf demo.tar demo1 demo2 demo3 # 对三个文件归档
demo1
demo2
demo3
[panjianqiao@localhost ~]$ ls
demo1 demo2 demo3 demo.tar Desktop Documents Downloads Music Pictures Public Templates Videos
[panjianqiao@localhost ~]$ gzip demo.tar # 对归档后文件进行压缩
[panjianqiao@localhost ~]$ ls
demo1 demo2 demo3 demo.tar.gz Desktop Documents Downloads Music Pictures Public Templates Videos
压缩目录
[panjianqiao@localhost ~]$ mkdir -p test/test_in #创建目录
[panjianqiao@localhost ~]$ touch ./test/test_in/demo #在最次级目录下创建文件
[panjianqiao@localhost ~]$ ls -l
total 0
drwxr-xr-x. 2 panjianqiao panjianqiao 40 Jul 11 13:17 Desktop
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Documents
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Downloads
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Music
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Pictures
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Public
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Templates
drwxrwxr-x. 3 panjianqiao panjianqiao 21 Jul 17 20:10 test
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Videos
[panjianqiao@localhost ~]$ ls -l ./test/test_in
total 0
-rw-rw-r--. 1 panjianqiao panjianqiao 0 Jul 17 20:11 demo
[panjianqiao@localhost ~]$ gzip -rv test #压缩目录
test/test_in/demo: 0.0% -- replaced with test/test_in/demo.gz #只能压缩目录下文件
gunzip 命令
此命令用于解压缩被gzip
命令压缩过的文件,相当于gzip -d
bzip2 命令
bzip2
命令和gzip
命令相似,只能对(单个)文件进行压缩或解压缩,压缩过的文件以.bz2
为后缀。从理论上来讲bz2的算法更先进、压缩比更好,而gz的压缩时间更快。常见格式为bzip2 [选项] 源文件
。
选项:
- -d:执行解压缩,此时该选项后的源文件应为标记有 .bz2 后缀的压缩包文件
- -k:bzip2 在压缩或解压缩任务完成后,会删除原始文件,若要保留原始文件,可使用此选项
- -f:bzip2 在压缩或解压缩时,若输出文件与现有文件同名,默认不会覆盖现有文件,若使用此选项,则会强制覆盖现有文件
- -t:测试压缩包文件的完整性
- -v:压缩或解压缩文件时,显示详细信息
- -数字:用于指定压缩等级,-1 压缩等级最低,压缩比最差;-9 压缩比最高
[panjianqiao@localhost ~]$ touch demo1 demo2
[panjianqiao@localhost ~]$ bzip2 demo1 demo2
[panjianqiao@localhost ~]$ ls -l
total 8
-rw-rw-r--. 1 panjianqiao panjianqiao 14 Jul 17 22:04 demo1.bz2
-rw-rw-r--. 1 panjianqiao panjianqiao 14 Jul 17 22:04 demo2.bz2
drwxr-xr-x. 2 panjianqiao panjianqiao 40 Jul 11 13:17 Desktop
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Documents
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Downloads
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Music
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Pictures
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Public
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Templates
drwxr-xr-x. 2 panjianqiao panjianqiao 6 Jun 30 23:22 Videos
bunzip2 命令
此命令用于解压缩被bzip2
命令压缩过的文件,相当于bzip2 -d
文件格式总结
- .tar
- zip
- .tar.gz
- .tar.bz2
- .tar.xz