[Python] 高效比对两个列表的不同

1.概要说明:

通过不断的测试发现,python实现高效快速比对两个列表的不同,可借助python集合set()提供的集合运算进行操作,此方式效率非常高.

而在java语言中,如下方法中方法1相比方法2(集合运算)的方式效率更高速度更快一些.这算是两种语言相通之处的一点不同吧.

2.代码:
#-*- coding:utf-8 -*-
import time

#方法1:
def getDiff1(arr1,arr2):
    start_time = time.time()
    print('1_start:',start_time)
    arr_more1 = []
    arr_more2 = []
    dic_result = {}

    for str_1 in arr1:
        dic_result[str(str_1)] = 1

    for str_2 in arr2:
        if dic_result.get(str(str_2)):
            dic_result[str(str_2)] = 2
        else:
            arr_more2.append(str_2)

    for key,val in dic_result.items():
        if val == 1:
            arr_more1.append(key)

    print('arr1比arr2多的内容为:',len(arr_more1))
    print('arr2比arr1多的内容为:',len(arr_more2))

    end_time = time.time()
    print('1_end:',end_time)
    print('方法1_比对用时为',end_time-start_time)


#方法2:使用集合运算:
def getDiff2(arr1,arr2):
    start_time = time.time()
    print('2_start:',start_time)
    set_1 = ()
    set_2 = ()

    #将列表转换为集合set()
    set_1 = set(arr1)
    set_2 = set(arr2)

    set_more1 = ()
    set_more2 = ()

    #集合运算
    set_1_2 = set_1 & set_2
    set_more1 = set_1 -set_1_2
    set_more2 = set_2 -set_1_2

    print('arr1比arr2多的内容为:',len(set_more1))
    print('arr2比arr1多的内容为:',len(set_more2))

    end_time = time.time()
    print('2_end:',end_time)
    print('方法2_比对用时为',end_time-start_time)

#测试

# 初始化500w条数据数据
arr1 = []
arr2 = []
i = 0
while(True):
    arr1.append(i * 2)
    arr2.append(i * 3)
    i += 1
    if i > 5000000:
        break

print('arr1的长度为:',len(arr1))
print('arr2的长度为:',len(arr2))
print('+'*30)
getDiff1(arr1,arr2)
print('-'*30)
getDiff2(arr1,arr2)
3.运行结果:
D:\python_project\venv\Scripts\python.exe D:/python_project/Test01/CompareTest.py
arr1的长度为: 5000001
arr2的长度为: 5000001
++++++++++++++++++++++++++++++
1_start: 1518180720.871
arr1比arr2多的内容为: 3333334
arr2比arr1多的内容为: 3333334
1_end: 1518180730.1929998
方法1_比对用时为 9.321999788284302
------------------------------
2_start: 1518180730.36
arr1比arr2多的内容为: 3333334
arr2比arr1多的内容为: 3333334
2_end: 1518180731.3630002
方法2_比对用时为 1.003000259399414

Process finished with exit code 0

通过观察运行结果,可以明显的发现方法2要比方法1执行更快更高效.

4.set集合运算:
set集合运算.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 原文链接 《Python数据分析》(Python for Data Analysis, 2nd Edition)第...
    李绍俊阅读 12,735评论 0 5
  • 前言 Python的创始人为Guido van Rossum。1989年圣诞节期间,在阿姆斯特丹,Guido为了打...
    依依玖玥阅读 8,950评论 6 37
  • 十一点多的夏夜,总算凉下来的自来水冲刷掉一日的阳光与劳作攒下的尘垢,轻飘飘走出浴室,抬头却望见嵌满整块夜幕的繁星,...
    月下青锋阅读 1,405评论 0 2
  • 看到“宝藏”这个题目,首先我脑海里涌现出的是“金银珠宝”,“金矿”等等。 如果你问我,人生中最大的宝藏是什么呢?这...
    寻芸阅读 3,421评论 5 9
  • 画的不是很精细,比例也不是很对,瞎画画
    三青w阅读 1,126评论 0 4

友情链接更多精彩内容