Ubuntu文件的压缩、打包

当一个文件过大时,不仅占用大量的存储空间,而且会对文件的传输造成障碍,增加文件传输所需的时间,所以人们发明了文件压缩技术。文件压缩技术通过一定的算法,将文件内容进行可恢复的压缩,减小文件体积,多个文档压缩到一起还可以起到归档的作用。也可以将一个大文件在压缩时分割成一定大小的压缩包,解压时再合并为一个压缩包进行解压,方便光盘刻录等。
文件压缩可以大体分为有损压缩和无损压缩,算法有几十种,人们根据不同的应用场景发明了不同的压缩算法,比如,图像文件jpeg、视频文件H.264、音频文件MP3等,都是常见的压缩算法。下面简单介绍下最简单的压缩算法实现。
众所周知,计算机中所有的文件都以“0”、“1”两个数字进行存储,1 Byte数据中有8位,每一位(Bit)可以是“0”或“1”。当一个文件中有96个“0”时,该文件占用了12 Byte的硬盘空间。
在这里讲述一种压缩算法,可以计算连续的“0”或“1”的个数,并将该个数储存在1 Byte数据中。1 Byte数据中,前7 Bit用来保存个数,最后1 Bit用来保存该 Byte数据代表的是“0”或“1”。共可以保存0-127个“0”或“1”。


一种简单的压缩算法

上述示例中96个“0”压缩后保存为“11000000”,只需要1 Byte就可以保存原本需要占用12 Byte空间的文件内容。解压缩时,只需要创建一个文件并写入96个“0”即可完成文件解压还原。


压缩结果

在进行文件压缩之前,我们可以先创建一个比较大的文件,之后对该文件进行压缩演示;使用dd命令创建一个大小为1M的文件,内容全为0

os@DESKTOP-2DHQBVS:~$ dd if=/dev/zero of=test.data bs=1M count=1
1+0 records in
1+0 records out
1048576 bytes (1.0 MB, 1.0 MiB) copied, 0.00997 s, 105 MB/s

gzip压缩命令

gzip是GNU计划中的一部分,一般认为是 GNU zip的缩写,gzip是一个应用较广的命令,其可以实现文件的压缩与解压,常用的命令选项有如下几个。

  • -c:将压缩的内容输出到屏幕上,源文件保持不变,可以通过重定向处理输出的内容;
  • -d:解压缩文件;
  • -l:输出压缩包内存储的原始文件信息,如解压缩后的文件名、压缩率等;
  • -#:指定压缩等级,从1-9,压缩率以此增大,速度以此减慢,默认压缩等级为6。
#使用gzip命令进行文件压缩
#查看tedu_cat.txt文件的属性信息,文件大小为443 Byte
os@tedu:~$ ls -l | grep tedu_cat
-rw-r--r-- 1 os os  443 8月   4 11:23 tedu_cat.txt

#执行压缩命令
os@tedu:~$ gzip tedu_cat.txt
#重新输出文件的属性信息,可以看到该文件大小已经变成342 Byte,且文件名后缀变为“.gz”
os@tedu:~$ ls -l | grep tedu_cat
-rw-r--r-- 1 os os  342 8月   4 11:23 tedu_cat.txt.gz
【示例】使用gzip命令对压缩文件解压

#解压缩文件
os@tedu:~$ gzip -d tedu_cat.txt.gz 
os@tedu:~$ ls -l | grep tedu_cat
-rw-r--r-- 1 os os  443 8月   4 11:23 tedu_cat.txt

需要注意的是,gzip将文件压缩后会自动删除源文件,同样解压缩后,压缩包也会被自动删除。

bzip2压缩命令

bzip2是Julian Seward按照自由软件/开源软件协议发布的数据压缩算法开发的压缩程序。Seward在1996年7月第一次公开发布了bzip2 0.15版,在随后几年中这个压缩工具稳定性得到改善并且日渐流行,目前的版本是在2010年发布的1.0.6版本。
bzip2的使用方法上与gzip基本保持一致,命令选项基本一致,此处不再一一列出,示例代码如下所示。

#使用bzip2命令进行文件压缩
#直接执行命令压缩文件
os@tedu:~$ bzip2 tedu_cat.txt 
os@tedu:~$ ls -l | grep tedu_cat
-rw-r--r-- 1 os os  373 8月   4 11:23 tedu_cat.txt.bz2
【示例】使用bzip2命令对压缩文件解压

#使用-d选项解压缩文件
os@tedu:~$ bzip2 -d tedu_cat.txt.bz2
os@tedu:~$ ls -l | grep tedu_cat
-rw-r--r-- 1 os os  443 8月   4 11:23 tedu_cat.txt
【示例】使用bzip2命令进行文件压缩并保留源文件

#使用-k选项压缩文件并保留源文件
os@tedu:~$ bzip2 -k tedu_cat.txt 
os@tedu:~$ ls -l | grep tedu_cat
-rw-r--r-- 1 os os  443 8月   4 11:23 tedu_cat.txt
-rw-r--r-- 1 os os  373 8月   4 11:23 tedu_cat.txt.bz2

tar命令

前面介绍的gzip和bzip2两个命令只能对单文件进行压缩,并不能将多个文件压缩为一个压缩包,很显然这样的压缩有很大的局限性。

tar命令可以将多个文件合并为一个压缩包,但是该命令并没有压缩功能,需要与gzip或bzip2一同使用,来实现文件的压缩和打包。tar命令也提供了很多有用的选项,如下所示。

  • -c:新建打包文件;
  • -t:查看打包文件中包含哪些文件名;
  • -x:解包或解压缩;
  • -j:通过bzip2的支持进行压缩/解压缩;
  • -z:通过gzip的支持进行压缩/解压缩;
  • -C(大写C):指定特定目录解压;
  • -p:打包过程中保留源文件的属性和权限;
  • -v:输出打包过程中正在处理的文件名。

下面以“tedu”目录为例演示tar命令的使用。

os@tedu:~$ tar  -zcv -f  tedu_tar.tar.gz  tedu
# 命令  选项   输出的文件名   要打包的目录
#选项的意义是通过gzip对文件进行压缩、创建压缩包、输出信息、输入文件名
#输出需要打包的目录与文件
tedu/
tedu/tedu_mv.txt
tedu/tedu_mv.txt~
tedu/test/
tedu/test/test1/
#输出打包后的文件信息

os@tedu:~$ ls -lh | grep -w tedu_tar
-rw-r--r-- 1 os os 1988月 6 16:26 tedu_tar.tar.gz
#使用tar命令查看打包后的压缩包的内容
#查看打包文件中的文件名,可以看到和上述打包过程中输出的文件名相同,目录结构也相同
os@tedu:~$ tar -ztv -f tedu_tar.tar.gz
drwxr-xr-x os/os 0 2018-08-04 14:20 tedu/
-rw-r--r-- os/os 0 2018-08-04 14:20 tedu/tedu_mv.txt
-rw-r--r-- os/os 0 2018-08-04 14:14 tedu/tedu_mv.txt~
drwxr-xr-x os/os 0 2018-08-03 14:53 tedu/test/
drwxr-xr-x os/os 0 2018-08-03 14:53 tedu/test/test1/
#使用tar命令对打包文件进行解包和解压缩
#解压缩打包文件到指定文件夹,此处将刚打包的文件解压缩到“文档”路径下
os@tedu:~$ tar -zxvf test.tar.gz -C 文档
tedu/
tedu/tedu_mv.txt
tedu/tedu_mv.txt~
tedu/test/
tedu/test/test1/
#查看解压之后的文件
os@tedu:~$ ls -lh 文档
总用量 4.0K
os@tedu:~$ ls -lhR 文档
文档:
总用量 4.0K
drwxr-xr-x 3 os os 4.0K 8月 4 14:20 tedu
文档*/tedu:
总用量 4.0K
-rw-r--r-- 1 os os 0 8月 4 14:20 tedu_mv.txt
-rw-r--r-- 1 os os 0 8月 4 14:14 tedu_mv.txt~
drwxr-xr-x 3 os os 4.0K 8月 3 14:53 test
文档/tedu/test:
总用量 4.0K
drwxr-xr-x 2 os os 4.0K 8月 3 14:53 test1
文档/tedu/test/test1:
总用量 0

经常使用tar命令备份系统“/etc”目录是一个很好的习惯,使用方法如下所示。

#使用tar命令备份/etc目录
# sudo的作用以root权限执行tar命令对etc文件夹进行备份
os@tedu:~$ sudo tar -zpvcf etc.tar.gz /etc
[sudo] os 的密码:
#输出的信息中第一行提示删除“/”
tar: 从成员名中删除开头的“/”
#输出添加到打包文件中的文件
/etc/
/etc/securetty
/etc/presage.xml
/etc/ppp/
......省略
os@tedu:~$ ls -lh | grep etc
-rw-r--r-- 1 root root 1.8M 8月 6 17:12 etc.tar.gz
#查看打包文件中的文件名
os@tedu:~$ tar -ztv -f etc.tar.gz
#文件名均以“etc”开头,而不是“/etc”
drwxr-xr-x root/root 0 2018-08-06 08:48 etc/
-rw-r--r-- root/root 4141 2018-01-25 23:09 etc/securetty
-rw-r--r-- root/root 5877 2016-12-08 17:54 etc/presage.xml
drwxr-xr-x root/dip 0 2018-04-27 02:23 etc/ppp/
......省略

使用tar命令备份文件时,默认采用的相对路径进行文件的保存,如果需要采用绝对路径可以使用“-P”选项,但是一般不推荐使用绝对路径保存,因为当解压该文件时可能会造成解压出的文件直接覆盖掉相应位置的文件,可能会造成系统崩溃等信息。所以如上示例中,在对绝对路径进行打包且没有使用“-P”选项时,tar命令会默认去掉“/”,将绝对路径变为相对路径,这样在解压时,便会将解压出来的文件放置到指定的目录中。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,172评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,346评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,788评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,299评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,409评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,467评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,476评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,262评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,699评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,994评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,167评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,827评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,499评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,149评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,387评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,028评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,055评论 2 352

推荐阅读更多精彩内容