Discovery:B站服务注册与发现

时间是河流

如果时间是一条河流,那么历史就是无数的浪花,伫立在河岸回眸,常常有意识的想要改变某一朵浪花。

2015年中,一群少年为爱发电来到B站,创建了一个项目,并写下了第一行Go代码。这个项目后来成为了B站微服务、中间件及各类平台的孵化器,服务注册与发现模块也应运而生。

时间回溯到2010年11月,zookeeper正式成为Apache的顶级项目,标志着它是工业级的成熟稳定产品。再到2015年,etcd刚刚发布了2.0版本,consul才初出茅庐,我们自然而然的选择了zookeeper作为我们的服务注册与发现组件。

魔改net/rpc,我们实现了性能优化 链路追踪trace 鉴权 超时传递 数据采集监控 等功能,再加上zookeeper,我们还实现了net/rpc server服务注册 net/rpc client服务发现 负载均衡等功能。

这套框架支撑我们度过了业务快速迭代和频繁改造的阶段,但时间这条河流奔腾不息,转眼进入了2018年。

当我们伫立河畔,回首日新月异的新潮技术变更,凝视一路跌跌撞撞溅起的浪花时,在服务注册与发现领域,我们已经落后了。

落后就要挨打

伴随B站业务的快速发展,微服务的节点数量几乎指数级增长。zookeeper逐渐在下面的场景不堪重负:

大量长连接及session探活,已经支撑不了辣么高TPS
CP系统,当机房间脑裂后不可用
没有专家,出问题全靠运维三宝:重启、重装、换机器

于是,我们调研了已经成熟的etcd、consul、eureka等流行的服务注册与发现系统,经过一番横向对比之后,遵循 注册中心不能因为自身的任何原因破坏服务之间本身的可连通性,我们选择了AP系统eureka。

但我们团队整体都是Go技术栈,eureka在部署及维护上让我们觉得有些不够得心应手,并且以下几点在eureka1.0版本中也是已知存在的问题:

靠轮询拉取节点,无法及时通知
客户端拉取全量节点,无法按需获取
eureka服务间数据同步随着业务节点数增加而成倍增加
没有完善的日志支撑节点变更过程查询
没有管理面板管理节点

针对以上问题,eureka官方也推出了2.0版本计划,但不幸的是停止开发了(幸亏我们选择了自研,不然就被坑了

所以,我们决定基于eureka的机制,打造属于B站的服务注册与发现系统:Discovery

Discovery

时间进入2018,我们也顺应技术的大潮,打造了基于k8s的PAAS平台,大量的业务在准备和正在迁入。我们制定准入规范,将业务标识appid、容器启动行为entrypoint、服务的healthcheck等等进行了统一。

最关键的,我们需要统一服务注册

Discovery在这个大背景下应运而生,设计之初,我们与运维童鞋讨论了很多细节,最终拍定以下设计目标:

实现AP服务注册与发现系统,保证数据最终一致性
与PAAS平台结合,多种发布方式的自动服务注册
网络闪断时服务可开启自我保护,保证健康的服务可用
实现各个语言sdk,基于HTTP协议保证交互简易

基本抽象

在Discovery中我们以appid作为服务的标识,以hostname定位实例instance。定义了三种角色server provider consumer,分别代表:

角色 功能
server Discovery服务节点,提供存储实例信息、检查和剔除无效节点、自我保护等功能
provider 服务提供者,提供包括注册register、30s周期心跳renew、取消注册cancel等功能
consumer 服务消费者,基于appid获取所需服务的节点信息,并可选30s周期的长轮询监听服务及时变更状态通知
instance 存储在discovery内的实例信息抽象对象,包含appid hostname addrs metadata等信息
架构图
基本逻辑
provider

provider启动后会请求Discovery的register接口进行实例信息注册,注册成功后要进行30s周期一次的renew心跳,用于维护Discovery内在线状态。

consumer

consumer启动后请求Discovery的fetch接口,根据appid获取所有的实例信息。如果有实时接收appid变更的需要,可以请求poll接口进行长轮询,首次请求会拿到server节点下发的latestTimestamp(表示appid的最后变更时间,该时间为server自身时间且不server间同步)。当再有变更发生时Discovery更新自身latestTimestamp,与consumer请求时携带的latestTimestamp对比,如超过则下发最新实例信息,否则维持长轮询连接直到30s超时或有变更发生。

discovery-server

server开始会收到appid的某一个实例的注册请求,在内存中存储为instance,通过Peer to Peer将数据同步给其他server节点,之后实例会进行每30s一次的renew心跳请求,并经过LB后打给任意一个server节点,节点间再通过P2P进行数据同步,每次renew都会更新serverinstancerenewTimestamp时间戳。当该实例发送cancel取消注册请求后,server节点将从内存中将该instance信息删除。

server运行期间则会进行每90s一个周期的心跳请求检测,当90s周期内某一instance最近一次的renewTimestamp比当前时间小于90s,则判断该instance失效并删除。为了避免网络故障而导致90s内大量instance全无心跳被全部删除的情况,server内还会进行每60s周期一次的自我保护判断,当 (60s内收集的所有心跳数) 小于 (所有instance的总数*2*0.85) 时进入自我保护模式,此时每90s的删除检测会无效,否则取消自我保护,恢复正常模式。而为了避免确实有大量节点突然挂掉(或其他异常情况)而触发进入自我保护模式但无法恢复为正常模式的情况,设置了最大自我保护时间2h,当超过2h还处于自我保护模式,则自动恢复为正常模式。

重要逻辑
  1. 复制(Peer to Peer),数据一致性的保障:
    • appid注册时根据当前时间生成dirtyTimestamp,Discovery的serverAserverB同步(register)时,serverB可能有以下两种情况:
      • 返回-404serverA携带dirtyTimestampserverB发起注册请求,把最新信息同步:
        1. serverB中不存在实例
        2. serverBdirtyTimestamp较小
      • 返回-409 serverB不同意采纳serverA信息,且返回自身信息,serverA使用该信息更新自身
    • appid注册成功后,provider每30s发起一次renew请求,处理流程同上
  2. instance管理
    • 正常检测模式,随机分批踢掉无心跳instance节点,尽量避免单应用节点被一次全踢
    • 网络闪断和分区时自我保护模式
      • 60s内丢失大量(小于instance总数*2*0.85)心跳数,“好”“坏”instance信息都保留
      • 所有server都会持续提供服务,单个server的注册和发现功能不受影响
      • 最大保护时间,防止分区恢复后大量原先instance真的已经不存在时,一直处于保护模式
  3. consumer客户端
    • 长轮询+server推送,服务发现准实时
    • 订阅式,只需要关注想要关注的appidinstance列表变化
    • 缓存实例instance列表信息,保证与server网络不通等无法访问到server情况时原先的instance可用
特别注意

server间同步复制是需要时间的,那如何保证consumer请求serverB时,因为携带的latestTimestamp是来自serverA,但serverB晚于该次请求才收到同步事件,而导致获取的节点信息不一致?

我们通过consumer启动后,从nodes接口获取到Discovery的所有server节点后,随机选取一个serverA进行fetch poll等请求,保证在consumer生命周期内,实例信息和时间信息始终来自同一个serverA。除非遇到网络等错误才切换节点到serverB并清空latestTimestamp,再当做首次请求重新拉取appid的全部实例信息和时间信息。

多注册中心

Discovery的同步复制机制天生好支持多注册中心。

我们用zone来表示机房,假设zoneAzoneB的Discovery集群之间要相互同步,那我们只需要将zoneA当做zoneB的特殊server节点,同理将zoneB当做zoneA特殊server节点。

zoneAserverA收到appid1的注册请求,并同步给内部的其他server后,再同步给server-zoneBzoneB即可复制到appid1的实例信息。

zoneB内部server间同步后不再需要同步回zoneA,所以特殊server就是指在发送同步请求时,判断该请求是否来自相同的zone,是的话就像zoneA同步给zoneB,否的话就像zoneB内部同步后不再向其他zone同步。

注:zoneAzoneB间,建议使用SLB进行负载均衡

与PAAS在一起

我们的PAAS平台已经集成了Discovery的服务注册,也就是provider能力。业务只需要正常发布就可以直接注册到Discovery,并依赖pod的生命周期进行renew心跳请求管理。

如果服务需要提供RPC、集群、权重等自定义信息,则只需要暴露 /register 接口并返回map[string]string格式的json数据,PAAS在启动实例后和注册信息前,通过回调该接口获取信息,将信息作为metedata同时注册到Discovery。

基于此,依赖服务(consumer)就可以获取到实例信息,并对服务进行访问。

管理节点

我们还实现了简单的管理能力,可以基于appid环境信息获取到所有实例信息。并基于此扩展了查询依赖服务 生成CPU和内存profile图 火焰图等功能。

奔腾不息的河流

当我们再一次伫立在河岸回眸,发现时光的浪花翻腾,但总有那么几朵浪花丑陋,让人想要在今后扔石子时,扔的漂亮~

结语

Discovery已经服务于B站几万+的实例规模,通过借此总结我们在服务注册与发现领域的实践经验,希望对业界阅读此文的童鞋能够有所帮助和启发。同时,我们也希望收到大家的反馈意见,详情请看Discovery开源项目【点我到Github】。

本文作者:冠冠爱看书

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,277评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,689评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,624评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,356评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,402评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,292评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,135评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,992评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,429评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,636评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,785评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,492评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,092评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,723评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,858评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,891评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,713评论 2 354

推荐阅读更多精彩内容

  • あくどい 1[颜色]过于浓艳,[味道]太腻。(色などがくどくて、いやな感じだ)。 あくどい色 刺眼的颜色 あくどい...
    娇靥如花阅读 631评论 0 0
  • 成功真的来的不简单,因为需要持续的重复的练习。舒适区一学习区一恐慌区。天才来自刻意的练习,不断的重复做一件事。这个...
    快乐三人行阅读 188评论 0 0
  • 你知道吗? 荔枝,自己剥的,跟别人给你剥的,味道是不一样的,荔枝的果肉虽然很柔软,很甜美,但,它的外表却很粗糙,...
    等一个人咖啡nan阅读 193评论 2 1
  • 没有了夏日的烈阳 没有了女儿的叛逆 没有了繁琐的羁绊 父亲,就这样与世界之吻,打破了现实的一切,离了一切,不过是另...
    为也阅读 216评论 0 0
  • 有些人,就在身旁,你却感到陌生 寻寻觅觅,越寻越远 别无选择,一个人行走
    泽蔓碧落阅读 135评论 0 0