2023-04-14 使用pypdf模块提取PDF中的全部图片

使用pypdf模块提取PDF中的全部图片，效果不次于pymupdf。代码如下：

from pypdf import PdfReader, PdfWriter

reader = PdfReader("example.pdf")
writer = PdfWriter()
count = 0
for i in range(len(reader.pages)):
    page = reader.pages[i]
    for img_fiel in page.images:
        with open(f"{count}-{img_fiel.name}",'wb') as fp:
            fp.write(img_fiel.data)
            count += 1

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Python操作PDF-文本和图片提取（使用PyPDF2和PyMuPDF）
PDF文件格式如今，可移植文档格式（PDF）属于最常用的数据格式。在1990年，PDF文档的结构由Adobe定义...
__豆约翰__阅读 13,777评论 0赞 10
各种 Python 库/模块/工具
1 算法 1.1 字符串处理 re 正则表达式的标准库。 StringIO / cStringIO 以读写文件的方...
modingfa阅读 3,688评论 0赞 1

实用脚本！Python 提取 PDF 指定内容生成新文件！
很多时候，我们并不会预知希望提取的页号，而是希望将包含指定内容的页面提取合并为新PDF，本文就以两个真实需求为例进...
程序员小西阅读 2,849评论 0赞 1
上干货！教你用Python GUI框架生成图片提取器！WORD、PDF都能用上它！
前言：大家好，今天教大家做一个综合性较强的Python实战练习：用Python提取PDF与Word中的图片要想...
朱朱Python阅读 3,342评论 0赞 4
[Python] 自动化办公多种提取PDF图片的方法
转载请注明：陈熹 chenx6542@foxmail.com[mailto:chenx6542@foxmail.c...
半为花间酒阅读 4,014评论 0赞 5

赞1赞

赞赏

手机看全文