一致性哈希 Hash - 学习笔记

一致哈希 是一种特殊的哈希算法。在使用一致哈希算法后,哈希表大小的改变平均只需要对 K/n 个关键字重新映射,其中 K 是关键字的数量, n 是哈希表大小。
然而在传统的哈希表中,添加或删除一个位置的几乎需要对所有关键字(即 K 个)进行重新映射。

一致哈希也可用于实现健壮缓存来减少大型Web应用中系统部分失效带来的负面影响。
一致哈希的概念还被应用于分布式散列表(DHT)的设计。DHT 使用一致哈希来划分分布式系统的节点。所有关键字都可以通过一个连接所有节点的覆盖网络高效地定位到某个节点。

问题:

假设有 K = 1000w 个数据项 object,n = 100 个存储节点 NODE,请设计一种算法合理地将他们存储在这些节点上。

一种常用的负载均衡方式是,对 object i 的请求使用 hash(i) = i mod n 来映射到某一台节点。
当增加或减少一台缓存服务器时这种方式可能会改变所有资源对应的 hash 值,也就是所有的缓存都失效了,这会使得缓存服务器大量集中地向原始内容服务器更新缓存。

如果有100个 object,当增加一个 NODE,之前99%的数据都需要重新移动

实验代码参见:normal_hash_add.py

因此需要一致哈希算法来避免这样的问题。 一致哈希尽可能使同一个资源映射到同一台节点。

  • 增加一台缓存服务器时 n = n + 1,新的服务器尽量分担存储其他所有服务器的缓存资源。
  • 减少一台缓存服务器时 n = n - 1,其他所有服务器也可以尽量分担存储它的缓存资源。

实现原理

将对应的key哈希到一个具有 232 次方个桶的空间中,即 0 ~ 232 -1的数字空间中。现在我们可以将这些数字头尾相连,想象成一个闭合的环形。如下图:

image

把数据 object 通过一定的 hash 算法处理后映射到环上。
现在我们将 object1、object2、object3、object4 四个对象通过特定的 Hash 函数计算出对应的 key 值,然后散列到Hash环上。如下图:

Hash(object1) = key1;
Hash(object2) = key2;
Hash(object3) = key3;
Hash(object4) = key4;
image

将机器 NODE 通过 hash 算法映射到环上。
一般情况下对机器的 hash 计算是采用机器的 IP 或者机器唯一的别名作为输入值,然后以顺时针的方向计算,将所有对象存储到离自己最近的机器中。
假设现在有 NODE1、NODE2、NODE3 三台机器,通过 Hash 算法得到对应的 KEY 值,映射到环中,其示意图如下:

Hash(NODE1) = KEY1;
Hash(NODE2) = KEY2;
Hash(NODE3) = KEY3;
image

通过上图可以看出对象 object 与机器 NODE 处于同一哈希空间中,这样按顺时针转动:

  • object1 存储到了 NODE1 中
  • object3 存储到了 NODE2 中
  • object2、object4 存储到了 NODE3 中

在这样的部署环境中,hash 环是不会变更的,因此,通过算出对象的 hash 值就能快速的定位到对应的机器中,这样就能找到对象真正的存储位置了。

实验代码参见:consist_hash_add.py

节点(机器)的删除

以上面的分布为例,如果 NODE2 出现故障被删除了,那么按照顺时针迁移的方法,object3 将会被迁移到 NODE3 中,这样仅仅是 object3 的映射位置发生了变化,其它的对象没有任何的改动。如下图:

image

节点(机器)的添加

如果往集群中添加一个新的节点 NODE4,通过对应的哈希算法得到 KEY4,并映射到环中,如下图:

image

通过按顺时针迁移的规则,那么 object2 被迁移到了 NODE4 中,其它对象还保持这原有的存储位置。
通过对节点的添加和删除的分析,一致性哈希算法在保持了单调性的同时,还是数据的迁移达到了最小,这样的算法对分布式集群来说是非常合适的,避免了大量数据迁移,减小了服务器的的压力。

平衡性

根据上面的图解分析,一致性哈希算法满足了单调性和负载均衡的特性以及一般 hash 算法的分散性,但这还并不能当做其被广泛应用的原由,因为还缺少了平衡性。
下面将分析一致性哈希算法是如何满足平衡性的。hash 算法是不保证平衡的,如上面只部署了 NODE1 和 NODE3 的情况(NODE2被删除的图),object1 存储到了 NODE1 中,而 object2、object3、object4 都存储到了 NODE3 中,这样就照成了非常不平衡的状态。

在一致性哈希算法中,为了尽可能的满足平衡性,其引入了虚拟节点。“虚拟节点”( virtual node )是实际节点(机器)在 hash 空间的复制品( replica ),一个实际节点(机器)对应了若干个“虚拟节点”,这个对应个数也成为“复制个数”,“虚拟节点”在 hash 空间中以 hash 值排列。
以上面只部署了 NODE1 和 NODE3 的情况(NODE2 被删除的图)为例,之前的对象在机器上的分布很不均衡,现在我们以 2 个副本(复制个数)为例,这样整个 hash 环中就存在了 4 个虚拟节点,最后对象映射的关系图如下:

image

根据上图可知对象的映射关系:object1->NODE1-1,object2->NODE1-2,object3->NODE3-2,object4->NODE3-1。
通过虚拟节点的引入,对象的分布就比较均衡了。那么在实际操作中,正真的对象查询是如何工作的呢?对象从 hash 到虚拟节点到实际节点的转换如下图:

image

“虚拟节点”的 hash 计算可以采用对应节点的IP地址加数字后缀的方式。例如假设 NODE1 的 IP 地址为192.168.1.100。引入“虚拟节点”前,计算 cache A 的 hash 值:
Hash(“192.168.1.100”);
引入“虚拟节点”后,计算“虚拟节”点 NODE1-1 和 NODE1-2 的 hash 值:
Hash(“192.168.1.100#1”); // NODE1-1
Hash(“192.168.1.100#2”); // NODE1-2

实验代码参见:virtual_consist_hash.py


引用:
一致哈希
一致性哈希算法的理解与实践
每天进步一点点——五分钟理解一致性哈希算法(consistent hashing)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,362评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,330评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,247评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,560评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,580评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,569评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,929评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,587评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,840评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,596评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,678评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,366评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,945评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,929评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,165评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,271评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,403评论 2 342

推荐阅读更多精彩内容