一致哈希 是一种特殊的哈希算法。在使用一致哈希算法后,哈希表大小的改变平均只需要对 K/n 个关键字重新映射,其中 K 是关键字的数量, n 是哈希表大小。
然而在传统的哈希表中,添加或删除一个位置的几乎需要对所有关键字(即 K 个)进行重新映射。
一致哈希也可用于实现健壮缓存来减少大型Web应用中系统部分失效带来的负面影响。
一致哈希的概念还被应用于分布式散列表(DHT)的设计。DHT 使用一致哈希来划分分布式系统的节点。所有关键字都可以通过一个连接所有节点的覆盖网络高效地定位到某个节点。
问题:
假设有 K = 1000w 个数据项 object,n = 100 个存储节点 NODE,请设计一种算法合理地将他们存储在这些节点上。
一种常用的负载均衡方式是,对 object i
的请求使用 hash(i) = i mod n
来映射到某一台节点。
当增加或减少一台缓存服务器时这种方式可能会改变所有资源对应的 hash 值,也就是所有的缓存都失效了,这会使得缓存服务器大量集中地向原始内容服务器更新缓存。
如果有100个 object,当增加一个 NODE,之前99%的数据都需要重新移动
实验代码参见:normal_hash_add.py
因此需要一致哈希算法来避免这样的问题。 一致哈希尽可能使同一个资源映射到同一台节点。
- 增加一台缓存服务器时
n = n + 1
,新的服务器尽量分担存储其他所有服务器的缓存资源。 - 减少一台缓存服务器时
n = n - 1
,其他所有服务器也可以尽量分担存储它的缓存资源。
实现原理
将对应的key哈希到一个具有 232 次方个桶的空间中,即 0 ~ 232 -1的数字空间中。现在我们可以将这些数字头尾相连,想象成一个闭合的环形。如下图:
把数据 object 通过一定的 hash 算法处理后映射到环上。
现在我们将 object1、object2、object3、object4 四个对象通过特定的 Hash 函数计算出对应的 key 值,然后散列到Hash环上。如下图:
Hash(object1) = key1;
Hash(object2) = key2;
Hash(object3) = key3;
Hash(object4) = key4;
将机器 NODE 通过 hash 算法映射到环上。
一般情况下对机器的 hash 计算是采用机器的 IP 或者机器唯一的别名作为输入值,然后以顺时针的方向计算,将所有对象存储到离自己最近的机器中。
假设现在有 NODE1、NODE2、NODE3 三台机器,通过 Hash 算法得到对应的 KEY 值,映射到环中,其示意图如下:
Hash(NODE1) = KEY1;
Hash(NODE2) = KEY2;
Hash(NODE3) = KEY3;
通过上图可以看出对象 object 与机器 NODE 处于同一哈希空间中,这样按顺时针转动:
- object1 存储到了 NODE1 中
- object3 存储到了 NODE2 中
- object2、object4 存储到了 NODE3 中
在这样的部署环境中,hash 环是不会变更的,因此,通过算出对象的 hash 值就能快速的定位到对应的机器中,这样就能找到对象真正的存储位置了。
实验代码参见:consist_hash_add.py
节点(机器)的删除
以上面的分布为例,如果 NODE2 出现故障被删除了,那么按照顺时针迁移的方法,object3 将会被迁移到 NODE3 中,这样仅仅是 object3 的映射位置发生了变化,其它的对象没有任何的改动。如下图:
节点(机器)的添加
如果往集群中添加一个新的节点 NODE4,通过对应的哈希算法得到 KEY4,并映射到环中,如下图:
通过按顺时针迁移的规则,那么 object2 被迁移到了 NODE4 中,其它对象还保持这原有的存储位置。
通过对节点的添加和删除的分析,一致性哈希算法在保持了单调性的同时,还是数据的迁移达到了最小,这样的算法对分布式集群来说是非常合适的,避免了大量数据迁移,减小了服务器的的压力。
平衡性
根据上面的图解分析,一致性哈希算法满足了单调性和负载均衡的特性以及一般 hash 算法的分散性,但这还并不能当做其被广泛应用的原由,因为还缺少了平衡性。
下面将分析一致性哈希算法是如何满足平衡性的。hash 算法是不保证平衡的,如上面只部署了 NODE1 和 NODE3 的情况(NODE2被删除的图),object1 存储到了 NODE1 中,而 object2、object3、object4 都存储到了 NODE3 中,这样就照成了非常不平衡的状态。
在一致性哈希算法中,为了尽可能的满足平衡性,其引入了虚拟节点。“虚拟节点”( virtual node )是实际节点(机器)在 hash 空间的复制品( replica ),一个实际节点(机器)对应了若干个“虚拟节点”,这个对应个数也成为“复制个数”,“虚拟节点”在 hash 空间中以 hash 值排列。
以上面只部署了 NODE1 和 NODE3 的情况(NODE2 被删除的图)为例,之前的对象在机器上的分布很不均衡,现在我们以 2 个副本(复制个数)为例,这样整个 hash 环中就存在了 4 个虚拟节点,最后对象映射的关系图如下:
根据上图可知对象的映射关系:object1->NODE1-1,object2->NODE1-2,object3->NODE3-2,object4->NODE3-1。
通过虚拟节点的引入,对象的分布就比较均衡了。那么在实际操作中,正真的对象查询是如何工作的呢?对象从 hash 到虚拟节点到实际节点的转换如下图:
“虚拟节点”的 hash 计算可以采用对应节点的IP地址加数字后缀的方式。例如假设 NODE1 的 IP 地址为192.168.1.100。引入“虚拟节点”前,计算 cache A 的 hash 值:
Hash(“192.168.1.100”);
引入“虚拟节点”后,计算“虚拟节”点 NODE1-1 和 NODE1-2 的 hash 值:
Hash(“192.168.1.100#1”); // NODE1-1
Hash(“192.168.1.100#2”); // NODE1-2
实验代码参见:virtual_consist_hash.py
引用:
一致哈希
一致性哈希算法的理解与实践
每天进步一点点——五分钟理解一致性哈希算法(consistent hashing)