使用PyPDF2删除PDF水印的探索

  • PDF文件分析
image

通过DC的分析,发现水印是通过/Artifact容器的形式添加,通过PyPDF2打印PDF的结构,对比5468发现位置。编写代码


from PyPDF2 import PdfFileReader, PdfFileWriter

def remove_watermark(input_file, output_file):

    with open(input_file, "rb") as f:

        source = PdfFileReader(f, "rb")

        output = PdfFileWriter()

        for page in range(source.getNumPages()):

            page = source.getPage(page)

            #print(type(page))

            #print(type(page['/Resources']['/XObject']['/Fm0']))

            page['/Resources']['/XObject']['/Fm0'].setData(b'')

            output.addPage(page)

        # 输入新的pdf文件

     with open(output_file, "wb") as outputStream:

            output.write(outputStream)

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容