算法学习----位运算

布隆过滤器

不安全网页的黑名单包含100亿个黑名单网页,每个网页的URL最多占用64字节,现在想要实现一种网页过滤系统,可以根据网页的URL判断该网页是否在黑名单上,请设计该系统。
要求该系统允许有万分之一以下的判断失误率,并且使用的额外空间不要超过30G。

解决方法采用布隆过滤器
黑名单----存入>哈希表或者数据库
数量:100亿
单个url:64kB    那么应该需要640G的空间,不
符合要求。
生成布隆过滤器的过程:
布隆过滤器的生成过程.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,837评论 18 139
  • 布隆过滤器在HBase中的应用 - Echo的博客 - 博客频道 - CSDN.NEThttp://blog.cs...
    葡萄喃喃呓语阅读 5,214评论 1 5
  • ¥开启¥ 【iAPP实现进入界面执行逐一显】 〖2017-08-25 15:22:14〗 《//首先开一个线程,因...
    小菜c阅读 6,497评论 0 17
  • 教练:颜叮 搭档:李双双 1、厘清目标 李:教练,我觉得最近头脑烦乱,每天都有好多想做的事情,想提高自己的水平,...
    帅帅宝贝阅读 201评论 0 0
  • 不要犯曾经犯过的傻 不要被愤怒蒙蔽眼睛 波涛 地铁6号线贯穿 双十中学落户 店面也可以读,第三幼儿园 角美万达已经...
    文字简书阅读 124评论 0 0