实例7:用Python操作Word批量生成合同

我们在实例5中演示了如何用Python批量生成word版邀请函。我们是简单粗暴地找到需要填写受邀者信息所在位置(即run),然后将这个run直接替换成受邀者的公司名及姓名。因为只有一处需要替换,所以这个方法行得通,但遇到合同,一般有十来处需要修改,如果也逐个去找其位置所在的run,那就反而会降低我们的工作效率,背离办公自动化的初衷了。实例5可以作为入门python-docx模块的练手项目。

对于合同的批量处理,我们将使用更聪明的办法。我们的思路是,先建立一个word模板,在合同里面需要变动信息的地方用“【....】”来代替,比如“【合同编号】”等。然后再建一个Excel文档,将“【合同编号】”等信息作为标题,将不同的合同信息放入这个Excel的每一行。然后用python-docx去读取word模板中的所有内容,凡是遇到“【....】”的字符,就用Excel中的对应标题下的信息去进行替换。Excel中从第二行开始每一行代表一个合同内需要填入的信息。

我们建立的模板和合同信息如下图所示:

image

这里有几个注意事项:

  1. Excel文档中数字需要改成文本格式,不然像合同编号20190401在写入到word时会变成20190401.0。至于怎么转格式,请参考度娘:http://jingyan.baidu.com/artic
  2. Excel中的公式需要去除,不然填到word中的信息是公式,而不是值。
  3. Word模板中的“【....】”和Excel中的标题必须一一对应,且必须是全中文或全英文字符,因为python-docx会将中英混合的内容视为两个及以上的格式(run),导致在替换的时候无法正确识别。
  4. Word模板做好后,要用python-docx读取一下,看看“【....】”是不是一个独立的run,若不是,则需要从Excel标题栏中重新复制,覆盖word模板中的“【....】”信息,已保证这一串字符是一个run。
import docx #导入docx库
doc = Document("data/合同模板.docx") #打开word文件
for para in doc.paragraphs: #读取word中的每个段落
    for run in para.runs: #读取每个段落中的不同格式(run)
        print(run.text)
>>
合同编号:
【合同编号】

【货物名称】
采购
合同
甲方
:
【采购方】

乙方
-------省略----------

通过以上程序,我们打印显示了合同里面的所有的格式(其中每一行代表一个格式(run))对应的文本(text),我们可以看到“【....】”都是在一行里面的,这样就没问题。由于word版合同里还有一些是在表格里面的,通过doc.paragraphs是无法抓取出来的,此时需要用doc.tables,表格(tables)里面又包含行(rows),行还包含单元格(cell),所以需要读取所有的表格,然后读取所有的行,再读取单元格,并打印显示出来。可见 “【....】” 也是在一行里面的,这样可保证后续替换时可查找到,不会导致遗漏。

for table in doc.tables:
        for row in table.rows:
            for cell in row.cells:
                print(cell.text)
>>
甲方(盖章):【采购方】 

法人代表:
或委托代理人:

开户行: 【开户行】
账  号:【账号】
联系人:【联系人】
电  话:【电话】
住  所:【住所】

乙方(盖章):ABC商贸有限公司

法人代表:
或委托代理人:

开户行:中国建设银行
账  号:989898989898
联系人:张三丰
电  话:999-99999
住  所: 桃花源

Word模板做好后,“【....】”内的信息就不可随意变动了,即便我们将“【合同编号】”里面的“遍”字删掉重新输入,结果还是“【合同编号】”,但此时“【合同编号】”已经不是一个格式了,会变成2个格式。如下示例显示了这个结果,“【合同编号】”已经不在同一行了。所以这个格式非常小气,不可轻易得罪啊!此时需要重新去Excel标题栏复制【合同编号】,再粘贴过去,保存,即可恢复同一格式(也可以在word中复制“【合同编号】”,覆盖粘贴成文本)。

doc = Document("data\合同模板 - 需填入部分格式错误.docx") #打开word文件
for para in doc.paragraphs: #读取word中的每个段落
    for run in para.runs: #读取每个段落中的不同格式(run)
        print(run.text)
>>合同编号:
【合同编
号】

【货物名称】
采购
合同
甲方
:
【采购方】

此实例虽然是采购合同,其处理方法适用于所有合同的批量生成,只需要准备好合同的模板,和需要填入合同的信息,剩下的就放心地交给Python吧。合同信息和模板准备好之后,就可开始批量替换,生成合同了。现在跟我出发。

import docx
def info_update(doc,old_info, new_info):
    '''此函数用于批量替换合同中需要替换的信息
    doc:合同模板
    old_info和new_info:原文字和需要替换的新文字
    '''
    #读取段落中的所有run,找到需替换的信息进行替换
    for para in doc.paragraphs: #
        for run in para.runs:
            run.text = run.text.replace(old_info, new_info) #替换信息
    #读取表格中的所有单元格,找到需替换的信息进行替换
    for table in doc.tables:
        for row in table.rows:
            for cell in row.cells:
                cell.text = cell.text.replace(old_info, new_info) #替换信息

为方便后续重复调用,以上我们定义了一个函数info_update(),它包含三个参数doc,old_info, new_info,分别代表word模板,原文本,和新文本。逐个读取word模板中的所有信息,只要遇到原文本,就替换成新文本。然后再读取word中的表格中的信息,也是遇到原文本,就替换成新文本。

from openpyxl import load_workbook #用于读取Excel中的信息
wb = load_workbook('data/合同信息.xlsx')
ws = wb.active
doc = docx.Document("data/合同模板.docx")
for row in range(2, ws.max_row+1):
    for col in range(1, ws.max_column+1):
        #调用上面建立的函数,替换信息
        info_update(doc,str(ws.cell(row=1,column=col).value), str(ws.cell(row=row,column=col).value))
    doc.save("data/{}合同.docx".format(str(ws.cell(row=row,column=3).value)))
    print("{}合同完成".format(str(ws.cell(row=row,column=3).value)))
>>
公司001合同完成
公司002合同完成
公司003合同完成
公司004合同完成
公司005合同完成
公司006合同完成
公司007合同完成
公司008合同完成
公司009合同完成
公司010合同完成

然后使用“openpyxl”库的“load_workbook”模块,读物Excel档的合同信息,遍历每一行,每一列,调用替换信息的函数“info_update”完成合同信息替换,随后保存。

我们以第一份合同为例,逐个看这些步骤是如何完成的。因为Excel中第一行是标题,合同信息是从第二行开始的,所以我们行是从2开始row in range(2, ws.max_row+1),最大行加1结束(因为range函数是取不到最后一个数的,此例中最大行是11,如果不加1,则只能取到10,这样最后一份合同就会被漏掉了)。列也类似,不过是从第一列开始的col in range(1, ws.max_column+1)

第一份合同对应的row值为2,col值为1。原信息是Excel中的标题,对应也就是word中的“【....】”部分。次数原信息先取ws.cell(row=1,column=1).value,即如下所示,为'【合同编号】'。因为Excel表中有一些数字,加上str()是为了转换为字符串。

image

新信息为ws.cell(row=2,column=2).value,如下所示。然后就将word中'【合同编号】'替换为'手机',再替换第二列,第三列.....直到替换完所有的列,于是第一份合同生成完成,我们使用doc.save保存。我们给保存的文件名加上公司名称,以便于区分,公司名是Excel中第三列的值ws.cell(row=row,column=3).value

image

第一份合同完成后,回到for循环,开始第二份合同的替换和保存,直到搞定所有合同。最终成果如下:

image

所有源代码和说明都在Jupyter notebook上完成,所用到的Excel 资料已上传GitHub, 欢迎Fork或下载到本地随意玩。。。转载请注明出处,谢谢。
GitHub链接:https://github.com/weidylan/Office_Automation_by_Using_Python
微信公众号:Python操作Office软件高效工作

image
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,558评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,002评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,024评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,144评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,255评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,295评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,068评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,478评论 1 305
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,789评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,965评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,649评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,267评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,982评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,800评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,847评论 2 351

推荐阅读更多精彩内容

  • 家族的姐妹中,晶儿是大家公认的好,待人和善,认亲,热情明事理,无论长辈晚辈,都很喜欢她。 晶儿真的是一个优雅的女子...
    似曾相识a阅读 210评论 4 3
  • 行走日记【21】 清晨,还是旅店前的街道,可景观已今非昔比。 长长地高架桥下已空无一人,往日里在桥下野宿的人被清理...
    树伟阅读 701评论 27 42
  • 不认识多好 你谈天我可以礼貌 刻在嘴角的谜会很有腔调 不是小小姑娘 低头会笑 这些年好与不好 谁想知道 过渡段要怎...
    不当诗人阅读 714评论 7 13