使用redis布隆表达式

redis的布隆过滤器

  1. 概念提出

布隆过滤器并不是redis的专属,它的提出和redis没有关系,是一个名叫Bloom的人在1970年的时候提出,对于海量数据我们判断一个数据是否存在于一个系统中,我们可以使用一个二进制数组(数组每一位不是 0 就是 1),然后一系列不同的随机hash方法计算数据的hash,将hash值对应的数组的值标记为1;对于这样的处理方式称为布隆过滤器;

  1. 原理解析

为什么要使用二进制数组?直接保存数据也能判断是否存在,类似 set 不就行了?试想如果一个数据大小是 1K ,那么1024条数据放入set就会是1M,换成二进制数组,每个位占空间是 1bit ,然后就算是每个数据使用8种不同的hash算法,1024位需要的空间是:

1bit * 1024 * 8 / 8 = 1024b = 1k (如果计算误判率可以再除以容忍误判率)

可以看见,数据的压缩是非常明显的,这种压缩的手法,在现在的许多场景中也能见到:比如用一个数字就能表示权限,原理就是将数字转换位二进制,每一个二进制数据都是一个权限,0 为开通 1为 非开通。
那么我们查看数据是否存在的时候通过布隆过滤器就再次按照原先的那一系列的hash算法,如果计算出的所有的位置上的数都是1,那么数据就存在;

  1. 了解缺陷

误判(布隆过滤器说不存在的数据一定不存在,说存在的元素不一定存在)
既然是hash算法,就由随机性,每个数据算出的hash是随机的,那么就可能计算出的hash重复的情况,这样的话就可能出现误判的情况。假设这么几个数据:

数据        hash
zhangsan    1,2,3,4,5,6,7,8;
lisi        9,10,11,12,13,14,15,16;
wangwu      2,4,6,8,10,12,14,16;

如果数据 "zhangsan" 和 "lisi" 存在,但是 "wangwu" 不存在,但是在判断的时候,hash计算出来判断这时 "wangwu" 是存在的,这就是误判,存储的数据越多,是1的数据位就越多,误判的可能性就越大,这个时候可以扩充过滤器来减小误判率;

维护(增加,删除等如何操作)
使用布隆过滤器的时候,我们需要向其中添加数据,不论是动态还是静态的添加总之我们是要维护的,这增加了我们的工作量。其次,如果想要将添加的数据移除,这是不可能的,因为可能这个数据计算的hash会影响到其他的数据,所以不能随意的删除;

  1. 使用场景

总结了布隆过滤器的原理和优劣,那么哪些地方可以使用到他呢?
海量数据的检测:黑名单检测,缓存穿透处理,关键字命中,url去重,用户活跃统计等;
为什么是海量, 数据量不大,压缩数据和维护的成本来说不划算;

  1. java中使用

最简单的使用方式,使用,可以使用redis命令setbit,结合springboot使用:


// 设置值的时候:
/**
 * @Param key : 过滤器的名字
 * @Param offset: 过滤器下标偏移量
 * @Param value : true/false 设置 1 / 0
 */
redistemplate.opsForValue().setBit(key, offset, value);

// 检验判断
redistemplate.opsForValue().getBit(key, offset);

这是java中操作redis中bit的操作,而hash算法,循环设置值等操作,可以自行封装;

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 221,576评论 6 515
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,515评论 3 399
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 168,017评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,626评论 1 296
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,625评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,255评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,825评论 3 421
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,729评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,271评论 1 320
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,363评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,498评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,183评论 5 350
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,867评论 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,338评论 0 24
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,458评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,906评论 3 376
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,507评论 2 359