python支持键过期的字典(ExpireDict)

在公司项目上需要对数据做过期处理,第一反应是redis里面的key支持过期设置,但在用的脚本都是纯python实现的没有对接过redis,本着“生命在于折腾的原则”,想实现一个类似于redis里面key过期格式的数据结构。总体设计需求:
1.基于python的dict来实现;
2.支持大部分的字典操作;
3.键的过期:支持单个key的设置和全局设置;
4.测试百万级别的键的写入和删除的性能;(性能太烂的话,没有意义呢)
5.为了提高性能,过期的key不实时删除,在读取值或者调用特殊方法时进行删除;
6.获取已过期的key时返回None;

# 定义一个支持key时间过期的字典
import time


class ExpireDict(dict):
    """
    一个支持key过期的类似的字典的数据结构
    1.创建一个过期字典对象 obj = ExpireDict()
    2.设置全局的key的过期时间 obj.exprie_time = 120 默认的过期时间为60秒
    3.添加key,并重新设置过期时间: obj['a'] =1;obj.set_key_expired('a',30);
    4.获取key的值 obj['a'];obj.get('a')
    5.不支持的字典内置方法:fromkeys,update,不支持工厂方法和字典推导式创建字典;
    """

    def __init__(self):
        """
        默认的超时60s
        """
        self.__expired = 60
        super(ExpireDict, self).__init__()

    @property
    def expire_time(self):
        return self.__expired

    @expire_time.setter
    def expire_time(self, value):
        self.__expired = value

    def __setitem__(self, key, value):
        """
        赋值
        :param key:
        :param value:
        :return:
        """
        begin_time = time.time()
        super(ExpireDict, self).__setitem__(key, [begin_time, begin_time + self.__expired, value])

    def __getitem__(self, key):
        """
        每次获取值是调用过期处理方法,只返回真实值
        :param itme
        :return:
        """
        if self.check_key(key) is False:
            return None
        return super(ExpireDict, self).__getitem__(key)[-1]

    def set_key_expired(self, key, expired):
        """
        设置指定key的过期时间:过期时间等于最后一次写入的时间与expired的和
        :param key:
        :param expired 过期时间
        :return:
        """
        value_list = super(ExpireDict, self).__getitem__(key)
        value_list[1] = value_list[0] + expired
        super(ExpireDict, self).__setitem__(key, value_list)

    def get(self, key):
        if self.check_key(key) is False:
            return None
        return super(ExpireDict, self).get(key)[-1]

    def setdefault(self, key, value):
        # self.del_expired_key()
        super(ExpireDict, self).setdefault(key, [time.time(), time.time() + self.__expired, value])

    def values(self):
        self.del_expired_key()
        value_list = list(super(ExpireDict, self).values())
        new_values = map(lambda i: i[-1], value_list)
        return new_values

    def items(self):
        self.del_expired_key()
        itmes_list = list(super(ExpireDict, self).items())
        itmes = map(lambda i: (i[0], i[1][-1]), itmes_list)
        return itmes

    def pop(self, key):
        self.del_expired_key()
        return super(ExpireDict, self).pop(key)[-1]

    def popitem(self):
        self.del_expired_key()
        item = super(ExpireDict, self).popitem()
        return item[0], item[1][-1]

    def __get_expired(self, key):
        """
        获取指定元素的写入时间
        :param item:
        :return:
        """
        return super(ExpireDict, self).__getitem__(key)[1]

    def check_key(self, key):
        """
        判断key是否过期,过期后执行删除动作
        :param key:
        :return:
        """
        end_time = self.__get_expired(key)
        if time.time() >= end_time:
            self.__delitem__(key)
            return False
        else:
            return True

    def del_expired_key(self):
        """
        删除过期的key
        :return:
        """
        itmes_list = list(super(ExpireDict, self).items())
        sorted(itmes_list, key=lambda i: i[1][1])
        end_time = time.time()
        for k, v in itmes_list:
            if v[1] < end_time:
                self.__delitem__(k)


if __name__ == "__main__":
    d = ExpireDict()
    d.expire_time = 3
    d["a"] = 3
    d["b"] = 4
    d.setdefault('c', 5)
    d.set_key_expired('b', 10)
    print("d['a']={0}\nd['b']={1}\nd['c']={2}".format(d['a'], d['b'], d['c']))
    time.sleep(3)
    print("休眠3秒后:")
    print("d['a']={0}\nd['b']={1}\nd['c']={2}".format(d.get('a'), d['b'], d['c']))


使用举例:

if __name__ == "__main__":
    d = ExpireDict()
    d.exprie_time = 3
    d["a"] = 3
    d["b"] = 4
    d.setdefault('c',5)
    d.set_key_expired('b',10)
    print("d['a']={0}\nd['b']={1}\nd['c']={2}".format(d['a'],d['b'],d['c']))
    time.sleep(3)
    print("休眠3秒后:")
    print("d['a']={0}\nd['b']={1}\nd['c']={2}".format(d.get('a'), d['b'], d['c']))

执行结果:


image.png

遍历操作:

    d = ExpireDict()
    d.exprie_time = 3
    #遍历赋值
    for k in range(5):
        d[k] = k
    #遍历取值
    for k,v in d.items():
        print(k,v)

性能测试,以内置字典做对照:
测试环境:python3.7.4
内置字典:

    from sys import getsizeof
    d = dict()
    # d.exprie_time = 3
    #遍历赋值
    start_time = time.time()
    for k in range(10**6):
        d[k] = k
    print(f"字典的大小:{getsizeof(d)}")
    print(f"遍历赋值用时:{time.time()-start_time}")
    #循环
    start_time = time.time()
    for k in range(10**6):
        a = d[k]
    print(f"循环取值用时:{time.time() - start_time}")
    #循环删除
    start_time = time.time()
    for k in range(10**6):
        del d[k]
    print(f"循环删除用时:{time.time() - start_time}")

测试结果:
C:\Python37\python.exe D:/work/tools/ebox_test/ExpiredDict.py
字典的大小:41943144
遍历赋值用时:0.1425952911376953
循环取值用时:0.09574246406555176
循环删除用时:0.11171293258666992

Process finished with exit code 0

过期字典:

       from sys import getsizeof
    d = ExpireDict()
    #遍历赋值
    start_time = time.time()
    for k in range(10**6):
        d[k] = k
    print(f"字典的大小:{getsizeof(d)}")
    print(f"遍历赋值用时:{time.time()-start_time}")
    #循环
    start_time = time.time()
    for k in range(10**6):
        a = d[k]
    print(f"循环取值用时:{time.time() - start_time}")
    #循环删除
    start_time = time.time()
    for k in range(10**6):
        del d[k]
    print(f"循环删除用时:{time.time() - start_time}")

执行结果:
C:\Python37\python.exe D:/work/tools/ebox_test/ExpiredDict.py
字典的大小:41943160
遍历赋值用时:0.9614558219909668
循环取值用时:0.9504311084747314
循环删除用时:0.2124321460723877
测试结论:
1.在100万级别的键的写入和删除操作时,过期字典的用时是内置字典的10倍左右,100w次累计用时小于1秒,单次操作在us级别;
2.存储100w个相同的数据时,内存与内置字典消耗近似;
因此过期字典ExpireDict 在非高并发的场景与内置字典同样适用;

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,277评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,689评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,624评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,356评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,402评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,292评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,135评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,992评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,429评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,636评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,785评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,492评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,092评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,723评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,858评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,891评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,713评论 2 354