饿了么异地多活技术实现(三)GZS&DAL(转)

饿了么技术团队花了1年多的时间,实现了业务的整体异地多活,能够灵活的在多个异地机房之间调度用户,实现了自由扩容和多机房容灾的目标。本文介绍这个项目的中五大核心基础组件中的DAL与GZS,关于项目整体介绍以及其它组件的实现细节可以参考本系列的其它文章。

GZS (Global Zone Service:全局状态协调器)

背景

多活改造的一个核心是多活流量路由,来源主要包括三个方面:

  • 从ezone外部发起的请求。比如用户下订单,商户添加菜品等等。这个部分的请求由API Router路由到正确的ezone。详情请参考<u>https://zhuanlan.zhihu.com/p/32587960</u>
  • 非多活业务调用多活业务。当非多活业务调用多活业务时,需要通过SOA Proxy从ezone内部路由到正确ezone。
  • job发起的请求。典型的场景是补偿job,通常是批量拉取符合条件的数据进行业务操作。这种情况需要业务方筛选出本ezone需要处理的数据,各个ezone的job服务只处理自己ezone负责的业务数据。

不仅基础组件依赖多活路由,一些特定的业务也需要获得多活路由,因此必须有一个专门的组件来统一管理多活路由,并且在多活切换时能协调各个模块的工作。

1.jpg

多活路由设计

多活路由由三个部分组成,ezone,shardingid,shardingkey。通过这三层路由关系的调整实现了多活的灵活资源调度以及failover。

  • ezone,代表的是一个可独立支持完整关键业务的逻辑机房,一般来说应该是在一个物理机房内。
  • shardingid,代表的是按地理位置划分出来的逻辑业务分组。一个shardid的业务会被路由到同一个ezone处理。
  • shardingkey,代表的是可以被路由的业务相关id,包括商户id,订单id等等。为了减少多活改造对业务的侵入,我们采用了使用自己业务相关id进行多活路由的策略,由GZS来维护这层路由关系。

下图是一个简单的路由例子

2.jpg

一般来说ezone与shardid的关系是比较固定的,而shardingkey会是一个一直变化的状态。shardingkey的路由规则主要由3种类型

  • 计算型:比如经纬度。GZS根据地理位围栏计算出所属的shardid,来找到目标ezone。这种类型的shardingkey会有一定的cpu消耗。
  • 映射型:比如城市id。每个城市id基本上也是与地理位置绑定的,GZS通过记录一张城市id与shardid的映射表来路由。这种类型的shardingkey会有一定的内存消耗。映射型中有些shardkey总量是不断增长的如商户id。GZS必须实时维护路由关系,保证秒级别的更新。
  • 嵌入型:这种类型的shardingkey几乎是最理想的,GZS可以直接根据预先定义的解析方式从shardingkey中得到shardid来做路由。

多活shard切换协议设计

多活切换的原则是:

  • 可用性优先:当发生故障切换机房时,优先保证系统可用,首先让用户可以下单吃饭,容忍有限时间段内的数据不一致,再事后修复。每个 ezone 都会有全量的业务数据,当一个 ezone 失效后,其他的 ezone 可以接管用户。用户在一个ezone的下单数据,会实时的复制到其他ezone。
  • 保证数据正确:在确保可用的情况下,需要对数据做保护以避免错误,在切换和故障时,如果发现某些订单的状态在两个机房不一致,会锁定该笔订单,阻止对它进行更改,保证数据的正确。

shard切换协议如下:

  1. GZS将shard1状态从“ACTIVE”转化为“BLOCK”,并路由推送到订阅用户(DAL ApiRouter soaproxy e.g.)

  2. DAL阻止在所有机房相应的shard的所有操作 (直接返回操作失败:1036)

  3. API Router阻止相应shard的全部操作 (相应shard全部不可用)(返回固定错误码:530)

  4. GZS将shard1状态从“BLOCK”转化为“RESHARD”,shard1对应ezone从“ezoneA”改变为“ezoneB”,“reshard_at”域为当前时间

  5. DAL阻止在目的机房相应的shard的老数据的更新操作 (update 操作增加一个时间戳的判断条件 created_at > reshard_at)

  6. DAL在其它机房保持阻止

  7. 订阅用户根据新shard-ezone映射路由。

  8. GZS 开始倒计时。倒计时结束 或者DRC 通知同步时间到达reshard_at

  9. GZS 状态从“RESHARD”转化为“ACTIVE”

  10. DAL解除阻止

下面是一个简单的例子,将shard 1 的下单流量从ezone1切换到ezone2。

3jpg.jpg

设计实现

GZS的设计是紧密联系业务特性的产物。

4.jpg

为什么SDK使用订阅推送

由于多活路由查询对于其它多活组件(DAL,APIRouter,soaproxy)来说是个高频操作,远程查询显然不能够胜任。同时对于计算型的shardingkey也不适合在GZS Server做。因此需要把路由信息推送到SDK,来保证查询的高效。

路由订阅是全量更新还是增量更新

GZS定义了一套增量更新的协议,适用于所有的多活路由类型。对于映射型的shardingkey使用增量更新,而对于其它类型的shardingkey直接使用全量更新的策略。

如何考虑一致性与可用性

5.jpg

如前文介绍的,多活路由是三层结构,对于一致性其实有着不同的要求。对于Sharding Id这层路由有着强一致性的要求,我们一组多活切换步骤来保证一致性。整个过程我们是牺牲可用性的。而对于逻辑Sharding key,嵌入型以及计算型的一致型是和Sharding Id一致的是绑定的。我们唯一需要考虑的是映射型的Sharding Key,对于这种类型主要采用BASE的思想来设计,不强调实时高一致性,而是要求一定时间内达到最终一致性。以店铺ID为例子,当新的店铺添时,GZS保证秒级同步映射关系,中间不同步的状态通过业务使用地理位置路由等方式绕开。

GZS 拓扑图

6.jpg

DAL(Data Access Layer:数据访问)

背景

DAL是proxy型的数据库中间件,支持mysql协议,在多活项目启动前已经承载了饿了么全部生产mysql流量。在多活项目中,DAL责无旁贷扮演起保护数据正确性最后一道防线的角色。

多活DAL兜底

在前文我们提到了多活流量来源,来自ezone外的可以统一通过API Router收口。而来自ezone内部的流量,我们很难确认多活改造是否完成。因此需要在DAL层做兜底,防止多活数据错乱。

DAL多活兜底主要体现在两个部分

7.jpg

Global ezone

多活业务场景中,存在全局配置性的数据,呈现大量读,少量写的特性。针对这种业务,我们提供了global ezone这种解决方案。

这是一种跨机房的读写分离机制。查询走本机房的数据库salve,写全部走一个Master,对业务方来说DB的配置透明的。

8.jpg

DAL可以方便的把业务在各个ezone的服务指向同一个master。当发生failover时,通过DB的主备切换,就可以把mysql的master从一个ezone迁移到另一个ezone。

未来的展望

多活切换目前是人工操作的,每次多活切换的决策总要耗费不少的时间。未来我们要把多活切换的过程做到智能化,自动化。

文献引用

<u>https://yq.aliyun.com/articles/57715</u>

<u>https://coolshell.cn/articles/10910.html</u>

<u>https://en.wikipedia.org/wiki/CAP_theorem</u>

<u>https://zhuanlan.zhihu.com/p/32009822</u>

<u>https://zhuanlan.zhihu.com/p/32587960</u>

作者介绍

林静 ,2011毕业于浙江大学,2015年加入饿了么,现任饿了么框架工具部架构师。
转自:https://zhuanlan.zhihu.com/p/33430869

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,039评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,426评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,417评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,868评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,892评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,692评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,416评论 3 419
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,326评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,782评论 1 316
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,957评论 3 337
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,102评论 1 350
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,790评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,442评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,996评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,113评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,332评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,044评论 2 355

推荐阅读更多精彩内容