zip的使用

在python中使用zip文件

本文解释如何使用一个简单的python程序在zip文件上执行各种操作

什么是zip文件

ZIP是一种支持无损数据压缩的归档文件格式。通过无损压缩,我们的意思是压缩算法可以从压缩数据中完美地重构原始数据。因此,ZIP文件是包含一个或多个压缩文件的单个文件,它提供了一种理想的方法使大文件变小,并将相关文件放在一起。

因为对zip操作的模块是内建的,所以我们不需要下载第三方库

1、提取zip文件

#导入zip库
from zipfile import ZipFile

#要提取的zip文件名
file_name = "my_python_files.zip"

#以读的方式打开zip文件
with ZipFile(file_name,'r') as zip:
    #打印zip文件内的目录
    zip.printdir()

    #提取所有文件
    print('Extracting all the files now...')
    zip.extractall()
    print('Done!!')

上面这段脚本将本目录下的名为"my_python_files.zip"中的文件进行了提取

执行后,输出就像这样:

File Name                                             Modified             Size
OperatingSystemsImportSample.csv               2011-07-22 10:17:16         1155
OperatingSystemsNotInstalledSample.csv         2011-07-22 10:17:16         1738
UsersImportCompleteSample.csv                  2011-07-22 10:17:16         1339
UsersImportMinimumSample.csv                   2011-07-22 10:17:16          172
UsersImportSimpleSample.csv                    2011-07-22 10:17:18          694
AssetsImportCompleteSample.csv                 2011-10-04 10:00:10         8650
AssetsImportExtendedSample.csv                 2011-10-04 10:00:12         1549
AssetsImportMinimumSample.csv                  2011-07-22 10:17:12           79
AssetsImportSimpleSample.csv                   2011-07-22 10:17:12          701
CIsImportMinimumSample.csv                     2011-07-22 10:17:12          126
ComputerSystemsImportSample.csv                2011-07-22 10:17:14         1243
Extracting all the files now...
Done!!

我们来仔细分析一下上面的代码

from zipfile import ZipFile

ZipFile 是zipfile模块中用来写入和读取zip文件的一个类,在这里我们只是导入了zipfile模块中的ZipFile类

with ZipFile(file_name, 'r') as zip:

在这里,ZipFile对象是通过调用ZipFile构造函数生成的的,该函数接受zip文件名和模式参数。我们在读的模式下创建一个ZipFile对象,并将其命名为zip。

zip.printdir()

print方法打印存档文件的目录

zip.extractall()

extractall()方法会将当前zip工作目录内的所有文件提取出来。你也可以使用extract()方法提取当前zip目录内给定详细路径的任意文件。

比如:

zip.extract('python_files/python_wiki.txt')

这仅会提取具体的文件

如果你想读取具体的文件,可以使用:

data = zip.read(name_of_file_to_read)

2、写zip文件

在这里,我们需要遍历整个目录及其子目录,以便在将所有文件路径写入zip文件之前获得它们的列表。

from zipfile import ZipFile
import os
def get_all_file_paths(directory):
    #初始化一个空的路径列表
    file_paths = []

    #遍历所有的目录和子目录
    for root,directories,files in os.walk(directory):
        for filename in files:
            #连接这两个字符串以形成完整的文件路径。
            filepath = os.path.join(root,filename)
            file_paths.append(filepath)


    #返回所有的目录路径
    return file_paths


def main():
    #需要压缩的文件夹的路径
    directory = './python'

    #调用函数获得所有文件的完整路径
    file_path = get_all_file_paths(diretory)

    #打印出要被压缩的文件列表
    print('Following files will be zipped:')
    for file_name in file_paths:
        print(file_name)

    #压缩文件
    with ZipFile('my_python_files.zip','w') as zip:
        #逐个压缩
        for file in file_paths:
            zip.write(file)

    print('All files zipped successfully!')

if __name__ == '__main__':
    main()

在我的机子上,执行程序后,输出为:

Following files will be zipped:
./python\csv.py
./python\csvexample.py
./python\djx.mp3
./python\douban.py
./python\downpic.py
./python\merge.py
./python\pdfreader.py
./python\pychrm.py
./python\PyPdf.py
./python\watermark.py
./python\zip.py
./python\zipwrite.py
./python\.idea\.name
./python\.idea\codeStyleSettings.xml
./python\.idea\encodings.xml
./python\.idea\misc.xml
./python\.idea\modules.xml
./python\.idea\python.iml
./python\.idea\workspace.xml
All files zipped successfully!
[Finished in 0.4s]

代码分析:

def get_all_file_paths(directory):
file_paths = []

for root, directories, files in os.walk(directory):
    for filename in files:
        filepath = os.path.join(root, filename)
        file_paths.append(filepath)

return file_paths

首先,为了获得目录中的所有文件路径,我们创建了这个函数,它使用os.walk()方法。在每次迭代中,该目录中的所有文件都被追加到名字为file_paths的列表中。最后,我们返回所有文件路径。

file_paths = get_all_file_paths(directory)

在这里,我们将要压缩的目录传递给get_all_file_paths()函数,并获得一个包含所有文件路径的列表。

with ZipFile('my_python_files.zip','w') as zip:

这里,我们在写模式下创建一个ZipFile对象。

for file in file_paths:
        zip.write(file)

在这里,我们使用write方法将所有文件逐个写入zip文件。

3、获取zip文件的所有信息

from zipfile import ZipFile
import datetime

#zip文件名称
file_name = 'example.zip'

#以读的模式打开一个zip文件
with ZipFile(file_name,'r') as zip:
    for info in zip.infolist():
        print(info.filename)
        print('\nModified:\t' + str(datetime.datetime(*info.date_time)))
        print('\tSystem:\t\t' + str(info.create_system) + '(0 = Windows, 3 = Unix)') 
        print('\tZIP version:\t' + str(info.create_version)) 
        print('\tCompressed:\t' + str(info.compress_size) + ' bytes') 
        print('\tUncompressed:\t' + str(info.file_size) + ' bytes') 

输出结果:

python/csv.py
Modified:   2018-11-30 14:33:42
System:     0(0 = Windows, 3 = Unix)
ZIP version:    20
Compressed: 1121 bytes
Uncompressed:   1121 bytes
python/csvexample.py
Modified:   2018-12-02 11:43:26
System:     0(0 = Windows, 3 = Unix)
ZIP version:    20
Compressed: 830 bytes
Uncompressed:   830 bytes

分析代码:

for info in zip.infolist():

在这里,infolist()方法创建一个ZipInfo类的实例,该实例包含关于zip文件的所有信息。

我们可以访问文件的最后修改日期、文件名、创建文件的系统、Zip版本、压缩和未压缩格式文件的大小等所有信息。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342

推荐阅读更多精彩内容

  • WinRAR - 最新版本的更新 版本 5.50 1. WinRAR 和命令行 RAR 默认使用 RAR ...
    王舒璇阅读 2,369评论 0 2
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,594评论 18 139
  • Ubuntu的发音 Ubuntu,源于非洲祖鲁人和科萨人的语言,发作 oo-boon-too 的音。了解发音是有意...
    萤火虫de梦阅读 99,126评论 9 467
  • 我们的绝世中国好媳妇儿终于向我可以倾诉下自己,说她有时心好累!哈哈哈,还有时?我们看着一直就好累!哈哈哈哈,...
    幸福的李慧阅读 562评论 0 2
  • 任意给定两个素数p和q,p!= q,记 N = p * q ,构造Zn*,问:1、是否每个元素都有inverse?...
    kuangyl阅读 170评论 1 1