Python 尝试解压缩需要密码的zip格式压缩文件

使用zipfile库,python自带的,不需要另外安装
zip压缩格式是开源的,rar格式是商业的,这里只说解压缩zip格式
程序是通过密码字典,暴力破解zip压缩文件

解压缩zip文件的核心代码如下:

# 打开Zip文件
zFile = zipfile.ZipFile(filepath, mode='r')

# 解压到软件所在目录
# 此处无论密码是否正确都会创建目录
# 如果密码错误则会报异常
# 此方法中文乱码
zFile.extractall(pwd=bytes(password, 'utf-8'), path=folder)

代码解释:
filepath,zip压缩文件
password,密码
folder,目标目录

遇到的问题

1,中文乱码

网上找到的思路都是使用 extract() 逐个文件解压,这样就可以在此过程中逐个文件修正中文乱码问题。
亲测无效。

有效的思路是:
先用 extractall() 一次性解压全部;
再遍历文件夹和文件名,处理中文乱码问题

处理中文乱码的核心代码如下:

# 处理中文乱码
# os.walk() 是一个深度优先遍历算法
# topdown = False 优先遍历最底层的子目录
for dirpath, dirnames, filenames in os.walk(folder, topdown=False):
    # 遍历目录中所有文件,并重命名
    # 必须先重命名文件名,如果先重命名文件夹,则文件名路径错误
    for filename in filenames:
        newFilename = filename.encode('cp437').decode('gbk')
        os.rename(os.path.join(dirpath, filename), os.path.join(dirpath, newFilename))
    # 遍历目录中所有文件夹,并重命名
    for dirname in dirnames:
        newDirname = dirname.encode('cp437').decode('gbk')
        os.rename(os.path.join(dirpath, 

2,密码错误也会创建目标文件夹

处理方法就是,如果密码错误,未能正确解压zip文件,则删除空的目标文件夹

删除目录的核心代码如下:

# 删除无效目录(解压失败也会产生目录)
if os.path.exists(folder):
    # 删除目录
    shutil.rmtree(folde)
3,使用线程时出的问题

如果压缩包中第一个文件名无后缀名,例如:.DS_Store
则采用多线程尝试密码时会报错:
FileExistsError(17, '当文件已存在时,无法创建该文件。')

不使用多线程则不会报错
所以可做成手动选择多线程单线程

手动选择多线程或单线程的核心代码如下:

for line in passFile.readlines():
    password = line.strip('\n')
    if isMultithreading:
        # 多线程
        t = Thread(target=extractZipFile, args=(zFile, password, folder))
        t.start()
    else:
        # 单线程
        extractZipFile(zFile, pass

代码解释:
passFile,是密码文件,通过for循环逐个尝试密码
isMultithreading,是否使用多线程的标记

程序界面图


界面.JPG

累死了~~~

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容