python小demo,使用openpyxl 对两个exl表进行重复数据的删除操作

        朋友找我,说他们领导让他写个脚本,给两个表,取表A和表B的userid进行对比,有重复的就把表A那一行userid相关数据给删除。然后他给了我一包中南海让我帮忙。我才不是看中这包烟才帮他忙的。。。。

上代码:

#!/usr/bin/env.python

#_*_coding:utf-8_*_

from openpyxl import workbook

from openpyxl import load_workbook

import time

def get_userid(file_path, col):

"""

    :param file_path:传入文件路径

    :return: 将指定列以列表类型返回

"""

    exl1 = load_workbook(file_path)

    sheet = exl1.get_active_sheet()

    userid = []

    for cell in sheet[col]:

        if cell.value !='userid':

            userid.append(cell.value)

  return userid


def register():

'''

    计算重复数据条数

    :return: 返回遍历次数'''

    list1 = get_userid(exl1_path, col='B')

    list2 = get_userid(exl2_path, col='B')

    count =0

    for valuein list1:

        if value in list2:

            count +=1

    return count

if __name__ =='__main__':

    exl1_path ='文件路径'

    exl2_path ='文件路径'

    list1 = get_userid(exl1_path, col='B')

    list2 = get_userid(exl2_path, col='B')

    count = register()

    exl = load_workbook(exl1_path)

    wb = exl.active

  if count !=0:

    start_time = time.time()

# 第一层循环,遍历次数

        for i in range(count):

# 第二层循环,获取值和索引

            for index, value in enumerate(get_userid(exl1_path, col='B')):

#判断是否重复,如果重复就把对应行删除,跳出循环,将index置0(如果不跳出循环,列表的index会继续累加下去,这样会导致index和表格的数据索引对应不上,删错数据)

                if value in list2:

                    wb.delete_rows(index +2, 1)

                    index =0

                    exl.save(exl1_path)

                    break

       end_time = time.time()

       use_time = time.time() - start_time

       print('耗时{0:.2f}秒'.format(float(use_time)))

       print('总共{}条数据'.format(len(list1)))

       print('重复数据有{}条'.format(count))

  else:

        print("没有重复数据!")


望python大佬多多指教~~~

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 写在前面的话 代码中的# > 表示的是输出结果 输入 使用input()函数 用法 注意input函数输出的均是字...
    FlyingLittlePG阅读 2,834评论 0 8
  • 1. Python的hello-world: print ("Hello, Python!")、 完了 摇就完事儿...
    LunarShade阅读 1,430评论 0 0
  • 一、快捷键 ctr+b 执行ctr+/ 单行注释ctr+c ...
    o_8319阅读 5,857评论 2 16
  • pyspark.sql模块 模块上下文 Spark SQL和DataFrames的重要类: pyspark.sql...
    mpro阅读 9,503评论 0 13
  • 有一个夜晚,我烧毁了所有的记忆 从此我的梦就透明了 有一个早晨,我扔掉了所有的昨天 从此我的脚步就轻盈了
    初初遇见阅读 141评论 0 0