散列:排解冲突(一)

多槽位multiple slots

桶单元细分成若干槽位slot,存放(与同一单元)冲突的词条

只要槽位数目不多,依然可以保证O(1)的时间效率

但是,难以预测需要为每个桶配备多少个槽位才能保证O(1),若预留过多则空间浪费,无论预留多少,极端情况下仍有可能不够


独立链linked-list chaining

每个桶存放一个指针,冲突的词条组织成列表

优点:无需为每个桶预留多个槽位,任意多次的冲突都可解决,删除操作实现简单、统一

缺点:指针需要额外空间,节点需要动态申请,更重要的是,空间未必连续分布,系统缓存几乎失效


开放定址open addressing~closed hashing

为每个桶都事先约定若干备用桶,它们构成一个查找链probing sequence/chain

查找:沿查找链,逐个转向下一桶单元,直到命中成功或者抵达一个空桶(已遍历所有冲突的词条) 

线性试探linear probing:一旦冲突,则试探后一紧邻桶单元;

[hash(key)+1]%M,[hash(key)+2]%M,[hash(key)+3]%M,...... 直到命中成功或者抵达一个空桶

优点:无需附加的(指针、链表或溢出区等)空间,查找链具有局部性,可充分利用系统缓存,有效减少I/O

缺点:操作时间>O(1),冲突增多——以往的冲突会导致后续的冲突clustering


懒惰删除

按照开放定址策略:先后插入,相互冲突的一组词条,将存放于同一查找链中

若需删除其中某一词条,应如何实现?

lazy removal:仅做删除标记,查找链不必续接

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 平方试探Quadratic probing 以平方数为距离,确定下一试探桶单元 [hash(key) + 1^2]...
    FridayX阅读 865评论 0 51
  • 为什么要设计散列这种数据结构呢?在现实世界中,实体之间可能存在着映射关系(key-value),比如一个订单可能对...
    yhthu阅读 1,213评论 2 8
  • 1、介绍 散列表(Hashtable)是散列方法的基础。用于存储键值对,散列表的查找和更新操作的时间复杂度为O(1...
    一天不工作浑身难受阅读 469评论 0 0
  • 散列表 (Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是...
    我帅不阅读 421评论 0 0
  • 散列表 (Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是...
    尼桑麻阅读 731评论 0 0