Word的生成与转为PDF

背景:

服务器: Ubuntu22.04

Python: 3.10.12

0. 目录

  1. word的生成或编辑

1. Word的生成与编辑

安装:

pip3 install python-docx==0.8.11

使用:

# 生成新word
doc = docx.Document()
# 编辑已有word
doc = docx.Document("../../1.docx")
# 具体操作这个文档, 操作方式列在下面
...
# 保存
doc.save()
# 替换原有文档的关键字
def find_replace_text(__doc, __replacement_dict):
    # data ={search_text: replace_text, search_text: replace_text}
    # 如 data = {"username": "王二小", "number": "T001"}
    for p in __doc.paragraphs:
        for run in p.runs:  # 遍历段落的字块
            for search_text, replace_text in __replacement_dict.items():
                run.text = run.text.replace(search_text, replace_text if replace_text else "")  # 替换字块的文字,然后赋值给字块
    for table in __doc.tables:
        for row in table.rows:
            for cell in row.cells:
                if "all_page" in cell.text:
                    print(cell.text)
                    cell.paragraphs[0].paragraph_format.alignment = docx.enum.text.WD_ALIGN_PARAGRAPH.RIGHT
                for search_text, replace_text in __replacement_dict.items():
                    cell.text = cell.text.replace(search_text, replace_text if replace_text else "")
# 插入文字
paragraph = doc.add_paragraph()
run = paragraph.add_run("王二小")  # 插入字 
run.bold = True  # 粗体
run.font.name = '宋体'  # 宋体
run.font.size = docx.shared.Pt(12)  # 字体大小
paragraph.paragraph_format.alignment = docx.enum.text.WD_ALIGN_PARAGRAPH.CENTER  # 居中
# 插入表格
table = doc.add_table(rows=3, cols=6)  # 插入一个 3行 8列 的 表格
table.style = 'Table Grid'  # 表格添加边框
# 添加第一行数据
__count = -1
for i in ["ID", "编号", "姓名", "性别", "手机号", "身份证号"]:
    __count += 1
    table.cell(0, __count).text = i

table.cell(1, 2).text="王二小"  # 添加第二行 第三列数据
table.cell(3, 1).paragraphs[0].paragraph_format.alignment = docx.enum.text.WD_ALIGN_PARAGRAPH.LEFT # 居左
th = table.cell(4, 0).paragraphs[0].runs[0]
th.font.size = docx.shared.Pt(14)  # 字体大小
th.font.name = '宋体'  # 字体
th.bold = True  # 加粗
# 添加 分页符(下一页)
doc.add_section()
# 添加一个横向页面
doc.add_section()
# 这一页是横向的
section = doc.sections[-1]
new_width, new_height = section.page_height, section.page_width
section.orientation = docx.enum.section.WD_ORIENT.LANDSCAPE
section.page_width = new_width
section.page_height = new_height

2. Word转PDF

方式: 通过直接调用命令行的方式使用 libreoffice 软件来转换1.

2.1 软件安装

  1. 安装 libreoffice

    apt isntall libreoffice

  2. 为操作系统安装中文字体

    将C:\Windows\Fonts 下的字体全部复制到 /usr/share/fonts/ 下面
    apt install xfonts-utils -y
    mkfontscale
    mkfontdir
    fc-cache -fv
    # 验证是否安装成功
    fc-list :lang=zh
    
  3. 为 libreoffice 安装中文字体

    cp /usr/share/fonts/*.TTF /usr/lib/libreoffice/share/fonts

  4. 重启libreoffice

    ps -ef |grep office
    kill掉
    nohup /usr/lib/libreoffice/program/soffice.bin & >/dev/null 2>&1 &
    
  5. 验证:

    libreoffice --headless --convert-to pdf 1.docx

2.2 python调用

from subprocess import Popen
import subprocess


def doc2pdf(word_file, pdf_path):
    stdout, stderr = Popen(['libreoffice', '--headless','--convert-to', 'pdf', word_file, '--outdir', pdf_path]).communicate()
    if stderr:
        raise subprocess.SubprocessError(stderr)

if __name__ == '__main__':
    word_file = "/opt/test/1.docx"
    pdf_path = "/opt/test"
    doc2pdf(word_file, pdf_path)

生成的 pdf 文件名会与doc文件名一样

如 user.docx ==> user.pdf

查看 /opt/test 是否有生产的pdf文件

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,080评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,422评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,630评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,554评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,662评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,856评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,014评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,752评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,212评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,541评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,687评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,347评论 4 331
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,973评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,777评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,006评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,406评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,576评论 2 349

推荐阅读更多精彩内容