昨天下午,顶着压力把升级的最重要的组件和平台上到了线上。刚好可以经历一轮压测测试。领导是反对这么干的,因为如果影响到压测,影响面就大了。我说了好几次,最终在承担全责的情况下,说服领导压测前上线,为的就是让升级后的组件经历下压测,如果没有问题,那大概率是成功了。
16:00发了变更,16:30全神贯注的开始迭代发布。服务起来了,充满紧张感。服务就绪了,先查日志,好多报错,再一看新集群的,忽略!继续验证,核心功能和发布功能正常,管理功能正常。操作记录也进来了,事件有延迟,不过应该不是升级问题,是消息队列的问题。
整体验证没啥问题了,就等晚上全链路测试了。
21:30,压测平台开始整体扩容了,扩容正常!弹性服务正常!目前都正常!
凌晨1:00压测到高峰,基本都OK,接下来要开始缩容了。
缩容也正常,心里的石头终于落下来了。
