python处理PDF

安装pypdf2:

pip install pypdf2

常见使用:

from PyPDF2 import PdfFileReader

def get_info(pdf_path):
    with open(pdf_path, 'rb') as f:
        pdf = PdfFileReader(f)
        information = pdf.getDocumentInfo()
        number_of_pages = pdf.getNumPages()

    txt = """
    Information about {}:
    Author: {}
    Creator: {}
    Producer: {}
    Subject: {}
    Title: {}
    Number of pages: {}
    """.format(pdf_path, information.author, information.creator, information.producer, information.subject, information.title, number_of_pages)

    print(txt)
    return information

if __name__ == '__main__':
    # 要注意的是如果路径有中文字符,一般是不行的,会报错
    path = 'xxxx.pdf'
    get_info(path)
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容