在分布式系统的服务部署模式。
停机部署(Big Bang / Recreate): 现有停机,然后部署新的版本。
蓝绿部署(Blue/Green /Stage):部署好新版本后,把流量从老服务那边切过来。
滚动部署(Rolling Update / Ramped): 一点一点地升级现有的服务。
灰度部署(Canary):把一部分用户切到新版上来,没有问题 就继续扩大升级,直到全部完成。
AB 测试(A/B Testing):同时上线两个版本,然后做相关的比较。 下面,我们来看一下每种方式的使用场景和优缺点。
一、停机部署
现有版本的服务停机,然后部署新的版本。新版本中的服务使用到了和 老版本完全不兼容的数据表的设计,对生产有两个变更,一个是数据库,另一个是服务,新老版本互不兼容,只能使用停机部署的方式。
优势是,状态完全一致。
二、蓝绿部署
生产线上部署相同数量的新的服务,新的服务测试OK ,把流量切到新的服务这边来。无需停机。就是预发环境。生产线上有两套相同的集群:Prod 真实服务和Stage 预发环境, 发布发 Stage,然后把流量切到 Stage 这边,于是 Stage 就成了 Prod,而之前Prod 则成了 Stage。有点浪费,使用双倍的资源(不过,这只是在物理机时代,在云计算时代没 事,因为虚拟机部署完就可以释放了)。服务中有状态,比如一些缓存什么的,停机部署和蓝绿部署都会有问题。
三、滚动部署
逐个替换应用的所有实例,来缓慢发布新版本。
过程:在负载调度后有个版本 A 的应用实例池,一个版本 B 的实例部署成功,可以响应请求时,该实例被加入到池中。然后,版本 A 的如果在升级过程中,需要做别的一些运维工作,我们还要判断哪些结点是老版本的,哪些结 点是新版本的。这太痛苦了。 因为新老版本的代码同时在线,所以其依赖的服务需要同时处理两个版本的请求,这可能会带来兼容性问题。 而且,我们无法让流量在新老版本中切换。
四、灰度部署(金丝雀)
金丝 雀对瓦斯这种气体十分敏感。空气中哪怕有极其微量的瓦斯,金丝雀也会停止歌唱。而当瓦斯含 量超过一定限度时,虽然鲁钝的人类毫无察觉,金丝雀却早已毒发身亡。当时在采矿设备相对简 陋的条件下,工人们每次下井都会带上一只金丝雀作为 " 瓦斯检测指标 ",以便在危险状况下紧 急撤离。
逐渐将从老版本切换到新版本。通常流量是按比例分配的。例如 90% 的请求流向老版本,10% 的流向新版本。除了切流量外,对于多租户的平台,例如云计算平台,灰度部署也可以将一些新的版本先部署到 一些用户上,如果没有问题,扩大部署,直到全部用户。一般的策略是,从内部用户开始,然后 是一般用户,最后是大客户。用于缺少足够测试,新版本的稳定性缺乏信心的情况 下。
五、AB 测试
AB 测试是同时上线两个版本,做比较。是用来测试应用功能表现的方法,例如可用性、受欢迎程度、可见性等。
蓝绿部署是为了不停机,
灰度部署是对新版本的质量没信心。
AB 测试是对新版的功能没信 心。注意,一个是质量,一个是功能。 比如,网站 UI 大改版,推荐算法的更新,流程的改变,我们不知道新的版本否会得到用户青睐 或是能得到更好的用户体验,我们需要收集一定的用户数据才能知道。于是我们需要在生产线上发布两个版本,拉一部分用户过来当小白鼠,然后通过科学的观测得出 来相关的结论。AB 测试旨在通过科学的实验设计、采样样本代表性、流量分割与小流量测试等 方式来获得具有代表性的实验结论,并确信该结论在推广到全部流量时可信。
AB 测试,其包含了灰度发布的功能。如果只是观测有没有 bug,那就是灰度发布了,如果复杂一点,要观测用户的一些数据指标,这完全也可 能做成自动化的,如果新版本数据好,就自动化地切一点流量过来,如果不行,就换一批用户 (样本)再试试。 对于灰度发布或是 AB 测试可以使用下面的技术来选择用户。 浏览器cookie。 查询参数。 地理位置。 技术支持,如浏览器版本、屏幕尺寸、操作系统等。 客户端语言。
小结
停机或者滚动部署: 开发或者模拟环境时,干净和快速。
滚动部署或者蓝绿部: 生产环境, 主流程测试是必须的。
金丝雀部署或者 AB 测试发布: 缺乏测试或者对软件的功能和稳定性影响缺乏信 心,
AB 测试技术:根据地理位置、语言、操作系统 或者浏览器特征等参数来给一些特定的用户测试。
你接触到的部署方式有哪些?在什么场景下使用哪一种部署方式?