Discovery：B站服务注册与发现

时间是河流

如果时间是一条河流，那么历史就是无数的浪花，伫立在河岸回眸，常常有意识的想要改变某一朵浪花。

2015年中，一群少年为爱发电来到B站，创建了一个项目，并写下了第一行Go代码。这个项目后来成为了B站微服务、中间件及各类平台的孵化器，服务注册与发现模块也应运而生。

时间回溯到2010年11月，zookeeper正式成为Apache的顶级项目，标志着它是工业级的成熟稳定产品。再到2015年，etcd刚刚发布了2.0版本，consul才初出茅庐，我们自然而然的选择了zookeeper作为我们的服务注册与发现组件。

魔改net/rpc，我们实现了性能优化 链路追踪trace 鉴权 超时传递 数据采集监控 等功能，再加上zookeeper，我们还实现了net/rpc server服务注册 net/rpc client服务发现 负载均衡等功能。

这套框架支撑我们度过了业务快速迭代和频繁改造的阶段，但时间这条河流奔腾不息，转眼进入了2018年。

当我们伫立河畔，回首日新月异的新潮技术变更，凝视一路跌跌撞撞溅起的浪花时，在服务注册与发现领域，我们已经落后了。

落后就要挨打

伴随B站业务的快速发展，微服务的节点数量几乎指数级增长。zookeeper逐渐在下面的场景不堪重负：

大量长连接及session探活，已经支撑不了辣么高TPS
CP系统，当机房间脑裂后不可用
没有专家，出问题全靠运维三宝：重启、重装、换机器

于是，我们调研了已经成熟的etcd、consul、eureka等流行的服务注册与发现系统，经过一番横向对比之后，遵循 注册中心不能因为自身的任何原因破坏服务之间本身的可连通性，我们选择了AP系统eureka。

但我们团队整体都是Go技术栈，eureka在部署及维护上让我们觉得有些不够得心应手，并且以下几点在eureka1.0版本中也是已知存在的问题：

靠轮询拉取节点，无法及时通知
客户端拉取全量节点，无法按需获取
eureka服务间数据同步随着业务节点数增加而成倍增加
没有完善的日志支撑节点变更过程查询
没有管理面板管理节点

针对以上问题，eureka官方也推出了2.0版本计划，但不幸的是停止开发了（幸亏我们选择了自研，不然就被坑了

所以，我们决定基于eureka的机制，打造属于B站的服务注册与发现系统：Discovery

Discovery

时间进入2018，我们也顺应技术的大潮，打造了基于k8s的PAAS平台，大量的业务在准备和正在迁入。我们制定准入规范，将业务标识appid、容器启动行为entrypoint、服务的healthcheck等等进行了统一。

最关键的，我们需要统一服务注册！

Discovery在这个大背景下应运而生，设计之初，我们与运维童鞋讨论了很多细节，最终拍定以下设计目标：

实现AP服务注册与发现系统，保证数据最终一致性
与PAAS平台结合，多种发布方式的自动服务注册
网络闪断时服务可开启自我保护，保证健康的服务可用
实现各个语言sdk，基于HTTP协议保证交互简易

基本抽象

在Discovery中我们以appid作为服务的标识，以hostname定位实例instance。定义了三种角色server provider consumer，分别代表：

角色	功能
server	Discovery服务节点，提供存储实例信息、检查和剔除无效节点、自我保护等功能
provider	服务提供者，提供包括注册`register`、30s周期心跳`renew`、取消注册`cancel`等功能
consumer	服务消费者，基于`appid`获取所需服务的节点信息，并可选30s周期的长轮询监听服务及时变更状态通知
instance	存储在discovery内的实例信息抽象对象，包含`appid` `hostname` `addrs` `metadata`等信息

架构图

基本逻辑

provider

provider启动后会请求Discovery的register接口进行实例信息注册，注册成功后要进行30s周期一次的renew心跳，用于维护Discovery内在线状态。

consumer

consumer启动后请求Discovery的fetch接口，根据appid获取所有的实例信息。如果有实时接收appid变更的需要，可以请求poll接口进行长轮询，首次请求会拿到server节点下发的latestTimestamp(表示appid的最后变更时间，该时间为server自身时间且不server间同步)。当再有变更发生时Discovery更新自身latestTimestamp，与consumer请求时携带的latestTimestamp对比，如超过则下发最新实例信息，否则维持长轮询连接直到30s超时或有变更发生。

discovery-server

server开始会收到appid的某一个实例的注册请求，在内存中存储为instance，通过Peer to Peer将数据同步给其他server节点，之后实例会进行每30s一次的renew心跳请求，并经过LB后打给任意一个server节点，节点间再通过P2P进行数据同步，每次renew都会更新server内instance的renewTimestamp时间戳。当该实例发送cancel取消注册请求后，server节点将从内存中将该instance信息删除。

server运行期间则会进行每90s一个周期的心跳请求检测，当90s周期内某一instance最近一次的renewTimestamp比当前时间小于90s，则判断该instance失效并删除。为了避免网络故障而导致90s内大量instance全无心跳被全部删除的情况，server内还会进行每60s周期一次的自我保护判断，当 (60s内收集的所有心跳数) 小于 (所有instance的总数*2*0.85) 时进入自我保护模式，此时每90s的删除检测会无效，否则取消自我保护，恢复正常模式。而为了避免确实有大量节点突然挂掉(或其他异常情况)而触发进入自我保护模式但无法恢复为正常模式的情况，设置了最大自我保护时间2h，当超过2h还处于自我保护模式，则自动恢复为正常模式。

重要逻辑

复制(Peer to Peer)，数据一致性的保障：
- appid注册时根据当前时间生成dirtyTimestamp，Discovery的serverA向serverB同步(register)时，serverB可能有以下两种情况：
  - 返回-404 则serverA携带dirtyTimestamp向serverB发起注册请求，把最新信息同步：
    1. serverB中不存在实例
    2. serverB中dirtyTimestamp较小
  - 返回-409 serverB不同意采纳serverA信息，且返回自身信息，serverA使用该信息更新自身
- appid注册成功后，provider每30s发起一次renew请求，处理流程同上
instance管理
- 正常检测模式，随机分批踢掉无心跳instance节点，尽量避免单应用节点被一次全踢
- 网络闪断和分区时自我保护模式
  - 60s内丢失大量(小于instance总数*2*0.85)心跳数，“好”“坏”instance信息都保留
  - 所有server都会持续提供服务，单个server的注册和发现功能不受影响
  - 最大保护时间，防止分区恢复后大量原先instance真的已经不存在时，一直处于保护模式
consumer客户端
- 长轮询+server推送，服务发现准实时
- 订阅式，只需要关注想要关注的appid的instance列表变化
- 缓存实例instance列表信息，保证与server网络不通等无法访问到server情况时原先的instance可用

特别注意

server间同步复制是需要时间的，那如何保证consumer请求serverB时，因为携带的latestTimestamp是来自serverA，但serverB晚于该次请求才收到同步事件，而导致获取的节点信息不一致？

我们通过consumer启动后，从nodes接口获取到Discovery的所有server节点后，随机选取一个serverA进行fetch poll等请求，保证在consumer生命周期内，实例信息和时间信息始终来自同一个serverA。除非遇到网络等错误才切换节点到serverB并清空latestTimestamp，再当做首次请求重新拉取appid的全部实例信息和时间信息。

多注册中心

Discovery的同步复制机制天生好支持多注册中心。

我们用zone来表示机房，假设zoneA和zoneB的Discovery集群之间要相互同步，那我们只需要将zoneA当做zoneB的特殊server节点，同理将zoneB当做zoneA的特殊server节点。

当zoneA的serverA收到appid1的注册请求，并同步给内部的其他server后，再同步给server-zoneB，zoneB即可复制到appid1的实例信息。

但zoneB内部server间同步后不再需要同步回zoneA，所以特殊server就是指在发送同步请求时，判断该请求是否来自相同的zone，是的话就像zoneA同步给zoneB，否的话就像zoneB内部同步后不再向其他zone同步。

注：zoneA与zoneB间，建议使用SLB进行负载均衡

与PAAS在一起

我们的PAAS平台已经集成了Discovery的服务注册，也就是provider能力。业务只需要正常发布就可以直接注册到Discovery，并依赖pod的生命周期进行renew心跳请求管理。

如果服务需要提供RPC、集群、权重等自定义信息，则只需要暴露 /register 接口并返回map[string]string格式的json数据，PAAS在启动实例后和注册信息前，通过回调该接口获取信息，将信息作为metedata同时注册到Discovery。

基于此，依赖服务(consumer)就可以获取到实例信息，并对服务进行访问。

管理节点

我们还实现了简单的管理能力，可以基于appid和环境信息获取到所有实例信息。并基于此扩展了查询依赖服务 生成CPU和内存profile图火焰图等功能。

奔腾不息的河流

当我们再一次伫立在河岸回眸，发现时光的浪花翻腾，但总有那么几朵浪花丑陋，让人想要在今后扔石子时，扔的漂亮~

结语

Discovery已经服务于B站几万+的实例规模，通过借此总结我们在服务注册与发现领域的实践经验，希望对业界阅读此文的童鞋能够有所帮助和启发。同时，我们也希望收到大家的反馈意见，详情请看Discovery开源项目【点我到Github】。

本文作者：冠冠爱看书

最后编辑于：2018.11.16 15:29:59

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 217,277评论 6赞 503
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,689评论 3赞 393
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 163,624评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,356评论 1赞 293
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,402评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,292评论 1赞 301
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,135评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,992评论 0赞 275
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,429评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,636评论 3赞 334
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,785评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,492评论 5赞 345
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,092评论 3赞 328
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,723评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,858评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,891评论 2赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,713评论 2赞 354