用Python实现Word多文档合并

通过手动的方式可以很方便的把多个Word文档合并为一个。但如何通过代码实现批量Word的合并呢?操作步骤来了。

1、使用python-docx和docxcompose扩展库

安装扩展库

pip install python-docx docxompose

合并Docx

from docx import Document
from docxcompose.composer import Composer

def combine_docx(master, sub):
    if not os.path.exists(sub):#待合并文件必须存在
        return False

    if not master.endswith('.docx'):#主文件必须是docx格式(可以不存在)
        return False

    sub_docx = sub
    if not sub.endswith('.docx'):
        sub_docx = saveAsDocx(sub)

    if os.path.exists(master):
        doc_master = Document(master)
        doc_master.add_page_break()
        cp = Composer(doc_master)
        cp.append(Document(sub_docx))
    else:
        #master不存在,则sub直接给master
        doc_master = Document(sub_docx)

    doc_master.save(master)
    return True

2、doc另存为docx

因为python-docx只能合并docx,对于rtf和doc无能为力,因此需要把doc另存为docx

。需要使用win32com。

安装扩展库

pip install pywin32

另存为docx

import win32com.client as wc
word = wc.gencache.EnsureDispatch('Word.Application')

#Doc另存为Docx
def saveAsDocx(file):
    word.Visible = False
    word.DisplayAlerts = False
    doc = word.Documents.Open(file, False)#打开文档,不提示转换确认框
    new_file = file.split('.')[0] + '.docx'
    doc.SaveAs(new_file, 12)
    doc.Close()
    
    return new_file

3、发布EXE

pyinstaller

pyinstaller -D DocMergeTool.py

在dist目录下生成 DocMergeTool文件夹,测试运行没有问题,打包独立exe

pyinstaller -Fw DocMergeTool.py

-F 独立exe

-w 不显示黑窗

生成DocMergeTool.exe,完美运行。唯一不满意的一点是exe太大了,居然有225mb。在网上查了一下,是因为Anconda环境里面包含了太多不需要的依赖。

网上有两个方案:1)创建一个干净的Python环境,只安装需要的扩展库,在该环境下打包;2)在anconda里创建一个新的虚拟环境,安装需要的扩展库,重新打包。

先试了第二种方案,发现大小不变,还是200多mb。所以选了第一种方案,在虚拟机上安装了干净的python环境,重新打包,最终exe文件大小控制到15mb,初步接受。

过程碰到几个问题:生成的exe运行时提示win32com库找不到;doccompose模板文件找不到。解决办法见爬坑章节。

4、爬坑

爬坑1:打开rtf或doc时避免弹出

虽然设置了word.Visible = False和word.DisplayAlerts = False,但是通过word.Documents.Open(file)打开rtf时还是会弹转换类型确认框。


1591881020072.png

该选项在这里:

1591883400852.png

可以手动关掉,但是用户未必知道,所以还是要从代码上解决。win32com实际调用的是以com方式调用office接口,所以祭出MSDN:https://docs.microsoft.com/en-us/dotnet/api/microsoft.office.interop.word.documents.open?view=word-pia

1591884523625.png

ConfirmConversions就是我们要找的,给它传False,就不会弹转换类型确认框了。

爬坑2:另存为docx

https://docs.microsoft.com/en-us/dotnet/api/microsoft.office.interop.word._document.saveas?view=word-pia

1591885135306.png

FileFormat对应值在该链接可以找到:https://docs.microsoft.com/en-us/dotnet/api/microsoft.office.interop.word.wdsaveformat?view=word-pia

爬坑3:doccompose模板文件找不到

提示如下:

FileNotFoundError: [Errno 2] No such file or directory: 'C:\Users\Administrator\dist\xxx\docxcompose\templates\custom.xml'

解决办法:

找到docxcompose\templates\custom.xml文件所在的位置,通过--add-data 参数添加到打包文件中。另外也可以使用spec文件,更强大,更灵活。可以参考 传送门

pyinstaller
-Fw --add-data C:\work\docxcompose\templates\*.*;docxcompose\templates\.
C:\work\DocMergeTool.py

也可以直接下载使用:百度网盘 提取码:zpr1

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,076评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,658评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,732评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,493评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,591评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,598评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,601评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,348评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,797评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,114评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,278评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,953评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,585评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,202评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,442评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,180评论 2 367
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,139评论 2 352