利用Python实现数据匹配(vlookup)

平时我们经常会制作周报、月报这种Excel操作相同的报表,我们可以使用python的pandas库对其进行自动化。这篇文章就演示了利用python实现使用Excel中的vlookup函数,并将其脚本封装成exe可执行程序。
写这段脚本的原因是因为我们部门的一个做渠道的同事不太会用vlookup函数,所以我琢磨着将他要用到vlookup的工作需求写成脚本供他使用。
需求:要将B表中的“收入”字段的数据匹配到A表中去:
表A:


表A

表B


表B

结果:
结果

脚本内容如下:

import pandas as pd

table_a_name = input("请输入A表文件名:")
table_a_path = table_a_name + '.xlsx'
sheet_a_name = input("请输入A表中的sheet名称:")
table_a = pd.read_excel(table_a_path,sheet_name = sheet_a_name,converters={'订单号':str}).dropna(axis=1,how='all')
table_b_name = input("请输入B表文件名:")
table_b_path = table_b_name + ".xlsx"
sheet_b_name = input("请输入B表中的sheet名称:")
table_b = pd.read_excel(table_b_path,sheet_name=sheet_b_name,converters={'交易ID':str})
table_b_2 = table_b.groupby("交易ID").收入.sum().reset_index()
table_c = table_a.merge(right=table_b_2,how='left',left_on='订单号',right_on='交易ID')
table_c.to_excel('c.xlsx',index=False)

考虑到同事不会使用python,故将这段脚本封装成可执行exe文件,关于怎样将Python代码封装打包成可执行的exe文件以及可能碰见的报错解决详见我之前的文章:将python脚本打包封装成exe程序

过程演示.gif

但是上面的exe使用起来并不够直观、方便,故又利用tkinter制作了一个GUI界面:
GUI界面.gif

制作GUI界面的脚本如下:

#!/usr/bin/python
# -*- coding:utf-8 -*-

from tkinter import *
import pandas as pd
import os
import re
window = Tk()
window.title('数据匹配')
window.geometry('300x400')
var1 = StringVar()
var2 = StringVar()
var3 = StringVar()
var4 = StringVar()
var5 = StringVar()
var6 = StringVar()
var7 = StringVar()
L1 = Label( text="请输入表A的名称:")
L1.pack()
e1 = Entry(window,show=None,textvariable=var1)
e1.pack()
L2 = Label( text="请输入表A中sheet名称:")
L2.pack()
e2 = Entry(window,show=None,textvariable=var2)
e2.pack()
L3 = Label( text="请输入表A中的ID列:")
L3.pack()
e3 = Entry(window,show=None,textvariable=var3)
e3.pack()
L4 = Label( text="请输入表B的名称:")
L4.pack()
e4 = Entry(window,show=None,textvariable=var4)
e4.pack()
L5 = Label( text="请输入表B中sheet名称:")
L5.pack()
e5 = Entry(window,show=None,textvariable=var5)
e5.pack()
L6 = Label( text="请输入表B中的ID列:")
L6.pack()
e6 = Entry(window,show=None,textvariable=var6)
e6.pack()
L7 = Label( text="请输入要匹配的表B中的列名:")
L7.pack()
e7 = Entry(window,show=None,textvariable=var7)
e7.pack()


def data_match():
    path = 'C:\\Users\\PS20190225\\Desktop'
    os.chdir(path)

    table_a_path = e1.get()
    a_type = re.search(r'([a-z]*).([a-z]*)',table_a_path).group(2)
    sheet_a_name = e2.get()
    A_id = e3.get()
    if a_type == 'xlsx':
        table_a = pd.read_excel(table_a_path,sheet_name = sheet_a_name,converters={A_id:str}).dropna(axis=1,how='all')
    else:
        table_a = pd.read_csv(table_a_path, sheet_name=sheet_a_name, converters={A_id: str}).dropna(axis=1, how='all')

    table_b_path = e4.get()
    b_type = re.search(r'([a-z]*).([a-z]*)',table_b_path).group(2)
    sheet_b_name = e5.get()
    B_id = e6.get()
    target_col = e7.get()
    if b_type == 'xlsx':
        table_b = pd.read_excel(table_b_path, sheet_name=sheet_b_name, converters={B_id: str}).dropna(axis=1, how='all')
    else:
        table_b = pd.read_csv(table_b_path, sheet_name=sheet_b_name, converters={B_id: str}).dropna(axis=1, how='all')
    table_b_2 = table_b.groupby(B_id)[target_col].sum().reset_index()

    table_c = table_a.merge(right=table_b_2,how='left',left_on=A_id,right_on=B_id)
    table_c.to_excel('c.xlsx',index=False)

b = Button(window,text='进行匹配',width=15,height=2,command=data_match)
b.pack()
window.mainloop()

学习tkinter可观看莫凡大佬的视频:做简单窗口视窗

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 平时我们经常会使用Excel中的vlookup函数,如果我们有很长一段时间重复相同操作我们可以使用Python将其...
    小T数据站阅读 2,866评论 0 2
  • 一、Python简介和环境搭建以及pip的安装 4课时实验课主要内容 【Python简介】: Python 是一个...
    _小老虎_阅读 5,884评论 0 10
  • 1) 那年,我三个月。 妈妈走了。 2) 那年,我6岁。 妈妈已经好久没回来了,妈妈过年就回来了,我不喜欢妈妈,我...
    壹狗阅读 387评论 0 4
  • 6 焦鹏的爸爸吃了一惊,没想到会有一个女人冲过来,“你是谁?”他错愕地盯着金香兰,打人的手掌在空中划着弧线不知该怎...
    雅贤阅读 545评论 0 3
  • 组别 301期 利他一组 【日精进打卡第090天】 【知~学习】 诵读《六项精进大纲》3遍,累计208遍;诵读《...
    J0hn先生阅读 148评论 0 0