15《Python 办公自动化教程》文件压缩与解压缩

压缩包也是我们平时工作中经常要接触到的文件格式,压缩文件后缀名通常有 .zip、.rar、.7z 等等。Python 中也有专门用来操作压缩包文件的第三方模块 zipfile。听这个名字就知道是用来操作压缩包文件的了,这个第三方模块也是我们本节课的重点,下面我们就一起来看一下。

1. zipfile 模块介绍

zip 文件格式是通用的文档压缩标准,在 ziplib 模块中,提供 ZipFile 类操作 zip 文件,如创建、读取、写入、附加、显示压缩文件等操作。

1.1 安装

zipfile 是 Python 的第三方库,使用前需要通过以下命令进行安装:

pip install zipfile

1.2 使用步骤

步骤 1:导入 zipfile 模块

import zipfile

步骤 2:实例化 zipfile 对象

z = zipfile.ZipFile(file, mode='r')

打开或者新建一个 zip 文件对象,第一个参数为 file 文件地址,第二个参数为打开模式,当模式参数是 ‘r’ 表示读取现有的文件,为 ‘w’ 表示覆盖或写入一个新的文件,为 ‘a’ 表示将追加到现有文件。

步骤 3:进行压缩文件操作

通过 zipfile 模块提供的方法对压缩文件进行创建、读取、解压等操作。

步骤 4:关闭压缩文件

z = zipfile.ZipFile(file, mode='r')
...省略部分代码
z.close()

注意:zipfile 在使用后,必须在退出程序之前调用 close () 方法否则将不会写入关键记录数据。

2. 使用 zipfile 模块进行压缩与解压缩

现在 D:\code 目录已有 code.zip,内容如下图所示。

5fd4f395096a715c05970385.jpg

接下来通过 zipfile 模块对压缩文件进行操作,zipfile 模块操作压缩文件常用方法见下表。

方法名 描述
namelist() 返回 ZIP 文件内所有成员名字列表
write() 添加文件到压缩包内
extract(member[, path[, pwd]]) 解压单个文件,参数 members 表示 zipfile 对象中某个文件名,path 为解压到的目的路径,默认是压缩包所在路径,pwd 为压缩包密码,默认无密码
extractall([path[, members[, pwd]]]) 解压所有文件,参数 path 为解压到的目的路径,默认是压缩包所在路径,members 默认值是压缩包文件中所有文件名称列表,也可以另外指定,pwd 为压缩包密码,默认无密码

下面来具体看下每个方法的使用:

  1. namelist () 使用:
import zipfile, os
zipFile = zipfile.ZipFile(os.path.join(os.getcwd(), 'code.zip'))
print(zipFile.namelist())
#输出: ['code/', 'code/index.py', 'code/newimage/', 'code/writeppt.py', 'code/writeword.py']

代码解释:namelist () 方法获取压缩包中所有文件的名字,并组成列表返回。首先通过 ZipFile 实例化 zip 文件对象,其中压缩文件这里通过 OS 模块的 join 方法进行拼接,返回一个绝对路径。通过 namelist () 方法打印输出:

['code/', 'code/index.py', 'code/newimage/', 'code/writeppt.py', 'code/writeword.py']

  1. write () 使用:
import zipfile, os
zipFile = zipfile.ZipFile(os.path.join(os.getcwd(), 'code.zip'),'a')
zipFile.write("test.txt")
print(zipFile.namelist())
#输出: ['code/', 'code/index.py', 'code/newimage/', 'code/writeppt.py', 'code/writeword.py','code/test.txt']

代码解释:write () 方法为添加文件到压缩文件,在 D:\code 目录下,创建 test.txt 文件,通过 wirte () 方法添加到现有压缩文件 code.zip 中,执行完成后,通过 namelist () 方法重写打印压缩文件中所有成员名字列表,输出 ['code/', 'code/index.py', 'code/newimage/', 'code/writeppt.py', 'code/writeword.py','code/test.txt']。上述代码中需要注意:

向压缩文件中写入内容时,注意修改 zipFile 实例化处的模式,默认为 “r”,表示只读,不可以写入,设置为 “w” 后可以写入,但会覆盖原有压缩文件中内容,如果想要追加,设置为 “a” 即可。

  1. extract () 使用:
import zipfile, os
zipFile = zipfile.ZipFile(os.path.join(os.getcwd(), 'code.zip'))
for file in zipFile.namelist():
    zipFile.extract(file)
zipFile.close()

代码解释:extract () 方法为单个压缩文件解压,代码中结合 namelist () 方法将 D:\code\code.zip 进行解压缩操作,解压后效果如下图所示。

5fd4f08e098a8c2e067101169.jpg
  1. extractall () 使用:
import zipfile, os
zipFile = zipfile.ZipFile(os.path.join(os.getcwd(), 'code.zip'))
zipFile.extractall()
zipFile.close()

代码解释:extractall () 方法为解压 zip 文档中的所有文件到指定目录,默认为压缩包所在路径,即当前目录。代码执行完成后,效果同 extract () 结合 namelist () 方法进行解压操作一样。

3. zipfile 模块实战

在上一小节中,使用 os 模块封装了程序遇到异常情况时记录错误日志文件的方法,本小节 zipfile 模块实战在上一小节代码的基础上进行实现。

在服务器上存储的错误日志文件,一定周期需要进行下载,为了防止下载过程中出现文件丢失或乱码的情况,通常采用创建压缩包的形式。但手动创建无疑是费时费力且容易出现错误的,这时可以使用 zipfile 模块结合 os 模块,实现将 2020 年下,每个月份的错误日志记录文件夹,创建相对的压缩文件,如 1 月,对应 1.zip,2 月对应 2.zip。目前服务器上 1-11 月的错误日志文件存储结构如下图所示。

以 1 月为例,1 月文件夹下的文件存储结构如下图所示。


5fd4f3d70904cda208260464.jpg
5fd4f3e3090ecf8708270466.jpg

根据上述需求背景,封装后的代码如下:

import zipfile
import os
# 制定要生成压缩文件的路径
filepath = "./2020"
# 创建压缩文件
def createzipfile(month):
    # 压缩包文件名称
    zipName = month + '.zip'
    f = zipfile.ZipFile(zipName, 'a')
    # 遍历当前文件夹
    for dirpath, dirnames, filenames in os.walk(filepath+"/"+month):
        for filename in filenames:
            f.write(os.path.join(dirpath, filename))
    f.close()
# 遍历当前目录下的文件夹
for item in os.listdir(filepath):
    # 调用创建压缩文件方法
    createzipfile(str(item))


代码解释:通过 os.listdir () 方法获取到要压缩的目录下所有的文件夹,即获取到 1,2,3,4…,在遍历中调用 createzipfile () 方法,将文件夹名称传入。在 createzipfile () 方法中,使用 zipfile.ZipFile 创建压缩文件,在向压缩文件写入内容时,通过 os.walk () 方法对当前月的目录进行遍历,嵌套 for…in 循环中,将文件写入到压缩文件。代码执行完成后,创建好的压缩文件如下图所示。

5fd4f6cd099df88108280466.jpg
5fd4f6d809f3557605970383.jpg

4. 小结

本节课程我们主要学习了 zipfile 模块的使用。本节课程的重点如下:

  • 了解 zipfile 模块作用及使用步骤;
  • 掌握 zipfile 模块中压缩与解压缩操作的使用方法;
5fe5c677095f60e107880652.jpg
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,524评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,869评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,813评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,210评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,085评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,117评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,533评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,219评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,487评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,582评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,362评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,218评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,589评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,899评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,176评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,503评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,707评论 2 335

推荐阅读更多精彩内容