058 Python语法之office办公自动化

python-docx的安装

  1. pip install python-docx

读取word文本

import docx  #只能处理docx文件
def  getText(filepath):
    doc=docx.Document(filepath)#打开文档
    fulltext=[]
    for  para in doc.paragraphs: #遍历每一个段落
        fulltext.append(para.text)
    return fulltext

data=getText(r"C:\Users\ts\Desktop\Python正则表达式七种兵器.docx")
for line in data:
    print(line)
import win32com
import win32com.client

word = win32com.client.Dispatch("Word.Application")
path = r"F:\school\graduation\xxx.docx"
doc = word.Documents.Open(path)
doc.SaveAs(r"F:\school\graduation\1.txt",2) 必须绝对路径 2代表txt
doc.Close()
word.Quit()

PyPDF2的安装

  1. pip install PyPDF2
  2. pip install PDFMiner3K

读取PDF文件

import PyPDF2

pdffile=open(r"C:\Users\Tsinghua-yincheng\Desktop\doc\2.pdf","rb")
pdfreader=PyPDF2.PdfFileReader(pdffile)#读取pdf文件
print(pdfreader.numPages) #显示8页
for i in range(pdfreader.numPages):
    page=pdfreader.getPage(i)#抓取第i页
    print(page.extractText())
读取网络PDF
#pip  install   PDFMiner3K

import urllib.request  #打开网页
import pdfminer.pdfinterp  #管理PDF资源
import  pdfminer.converter #文本转换
import  pdfminer.layout #处理pdf布局
import io  #输入输出


def readpdf(pdffile):
    rsmgr=pdfminer.pdfinterp.PDFResourceManager()#资源管理器
    retstr=io.StringIO()#文本输出
    lap=pdfminer.layout.LAParams()#处理布局
    device= pdfminer.converter.TextConverter( rsmgr,retstr,laparams=lap)#文本提取工具
    pdfminer.pdfinterp.process_pdf(rsmgr, device,pdffile)#根据文件进行解析
    device.close()#关闭设备
    content=retstr.getvalue()#抓取文本
    retstr.close() #关闭文本输出
    return content #返回文本


#打开一个网络文件
pdffile=urllib.request.urlopen("http://pythonscraping.com/pages/warandpeace/chapter1.pdf")
outputstring=readpdf(pdffile)#处理文本
print(outputstring) #输出文本
读取中文PDF
import urllib.request  #打开网页
import pdfminer.pdfinterp  #管理PDF资源
import  pdfminer.converter #文本转换
import  pdfminer.layout #处理pdf布局
import pdfminer.pdfparser
import io  #输入输出


path=r"C:\Users\Tsinghua-yincheng\Desktop\day24down\xxx.pdf"
file=open(path,"rb")#打开文件
pdffile= pdfminer.pdfparser.PDFParser(file)#解析pdf文本
doc=pdfminer.pdfparser.PDFDocument()#创建pdf文档
pdffile.set_document(doc) #解析工具链接pdf文档
doc.set_parser(pdffile)
doc.initialize()#初始化  为空没有密码, 有密码"12233"
rsmgr=pdfminer.pdfinterp.PDFResourceManager()#资源管理器
lap = pdfminer.layout.LAParams()  # 处理布局
device = pdfminer.converter.PDFPageAggregator(rsmgr,  laparams=lap)#转换
interpreter=pdfminer.pdfinterp.PDFPageInterpreter(rsmgr,device)#抓页数
if not doc.is_extractable:
    pass
else:
    for page  in doc.get_pages():#遍历每一个页面
        interpreter.process_page(page)#抓取每一页
        layout=device.get_result()
        for x in layout:
            text=x.get_text()
            print(text)

openpyxl的安装

  1. pip install openpyxl
  2. pip install pyexcel_xls

读取Excel

# Author:Luo
from openpyxl.reader.excel import load_workbook

wb = load_workbook(filename=r"F:\school\graduation\副本.xlsx")
print(wb.get_sheet_names())  # 获取每个表格的名称
print(len(wb.get_sheet_names()))  # 获取表格的长度

sheetNames = wb.get_sheet_names()  # list,所有的表格,左下角的sheet
ws = wb.get_sheet_by_name(sheetNames[0])  # 第一个表格

print(ws.title)  # 开头
print(ws.max_row)  # 最大的行数
print(ws.max_column)  # 列数

for rline in range(1, ws.max_row + 1):
    for column in range(1,ws.max_column+1):
        w1 = ws.cell(row=rline,column=column).value
        print(w1,end=" ")
    print()
from collections import OrderedDict  # 不可变字典
from pyexcel_xls import get_data
from pyexcel_xls import save_data


def readxls():
    path = r"F:\school\graduation 副本.xlsx"
    xlsdata = get_data(path)  # 抓取数据
    print(xlsdata)
    print(type(xlsdata))  # 数据类型
    for sheet in xlsdata:  # 读取每一个key对应的value
        print(sheet, ":", xlsdata[sheet])


def writexls():
    path = "myself.xls"
    data = OrderedDict()  # 字典

    sheet_1 = []
    row1 = ["A", "B", "C"]
    row2 = [1, 2, 3]
    sheet_1.append(row1)
    sheet_1.append(row2)
    data.update({"ABC": sheet_1})   # ABC为sheet名,sheet_1为数据

    save_data(path, data)


# readxls()
writexls()

word自动化

# Author:Luo
import  win32com
import win32com.client
def makeword(name):
    print(name)
    #操作word,
    word=win32com.client.Dispatch("Word.Application")
    doc=word.Documents.Add() #插入文档
    word.Visible=True #可见

    rng=doc.Range(0,0)#开始位置
    rng.InsertAfter(u"尊敬的%s先生\n"%name)#匹配字符串
    rng.InsertAfter(u"    我是xxx,定于2017.10.1与ccc大婚,诚邀来参加婚礼,先准备好分子钱")

    filename="C:\\Users\\Administrator\\Desktop\\"+name+".doc"
    doc.SaveAs(filename)#保存
    doc.Close(True)#关闭


    word.Application.Quit()#退出


names=["李鑫","申羚锐","何丰城","孙雨"]
for name in names:
    makeword(name)

Excel自动化

import  win32com
import win32com.client
def makeexcel(name):
    print(name)
    #操作word,
    ex=win32com.client.Dispatch("Excel.Application")
    wk=ex.Workbooks.Add()#加一张表格
    nowwk=wk.ActiveSheet #当前的焦点表格
    ex.Visible=True#显示
    for i in range(1,10):
        nowwk.Cells(i,i).value=name+str(i)#插入数据Cells方法参数为横坐标和纵坐标

    filename = "C:\\Users\\Administrator\\Desktop\\" + name + ".xls"
    wk.SaveAs(filename) #保存
    wk.Close(True)#关闭
    ex.Application.Quit()#退出


names=["xxx","ccc","vvv","bbb"]
for name in names:
    makeexcel(name)

Outlook自动化(管理邮箱的,自己配置一下安全)

import  win32com
import win32com.client

def makemail(name):
    outlook=win32com.client.Dispatch("Outlook.Application")
    mail=outlook.createItem(0)#第一封邮件
    mail.Recipients.Add("%s@microsoft.com"%name)    # 发送的
    mail.Subject=u"尊敬的亲爱的伟大的%s"%name   # 标题
    mailtext= (u"尊敬的亲爱的伟大的%s"%name)
    # 营销文本
    mailtext+=u"我公司有硅胶娃娃,价格便宜,长的好看,欢迎真人一般的体验"
    # 写入到正文中
    mail.Body=mailtext #正文
    mail.Send()#发送
    outlook.Quit()


names=["xxx","ccc","vvv","bbb"]
for name in names:
    makemail(name)

PPT自动化()

import  win32com
import win32com.client
def makeppt(name):
    try:
        ppt=win32com.client.Dispatch("PowerPoint.Application")
        pres=ppt.Presentations.Add()#增加一个页面
        ppt.Visible=True

        s1=pres.Slides.Add(1,1) #增加一个页面
        s1_0=s1.Shapes[0].TextFrame.TextRange #找到第一个文本
        s1_0.Text="尊敬的%s"%name

        s1_1 = s1.Shapes[1].TextFrame.TextRange  # 找到第2个文本
        s1_1.Text = "hello world"

        filename = "C:\\Users\\ts\\Desktop\\" + name + ".ppt"
        pres.SaveAs(filename)  # 保存
        pres.Close()  # 关闭
        ppt.Application.Quit()  # 退出
    except AttributeError:
        pass



names=["xxx","ccc","vvv","bbb"]
for name in names:
    makeppt(name)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,686评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,668评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,160评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,736评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,847评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,043评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,129评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,872评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,318评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,645评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,777评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,470评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,126评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,861评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,095评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,589评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,687评论 2 351

推荐阅读更多精彩内容

  • GitHub 上有一个 Awesome - XXX 系列的资源整理,资源非常丰富,涉及面非常广。awesome-p...
    若与阅读 18,630评论 4 418
  • # Python 资源大全中文版 我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列...
    aimaile阅读 26,454评论 6 428
  • 环境管理管理Python版本和环境的工具。p–非常简单的交互式python版本管理工具。pyenv–简单的Pyth...
    MrHamster阅读 3,791评论 1 61
  • python学习笔记 声明:学习笔记主要是根据廖雪峰官方网站python学习学习的,另外根据自己平时的积累进行修正...
    renyangfar阅读 3,027评论 0 10
  • 当我是一个人的时候, 我觉得我是世界上最好的人、 理应遇到一个和我一样好的人、 我们在一起、写一段世界上最美丽的爱...
    cyyier阅读 186评论 0 2