周日新系统上线演练,涉及到很多系统,是一个大工程。
半夜十点多,系统报错了,值夜班的同事在开发人员指挥下排除了错误,任务继续执行。
开发人员定位错误原因是没有执行回退。
前一段时间演练过一次,昨天的演练开始之前要先回退上次的操作,然后再上线新的方案。
执行回退的同事很确定回退已经执行了。周一开发人员最终确定执行的回退方案版本不对。
这就找到问题根源了。
回退方案是我从邮件里找到的,邮件来来回回很多次,我没有细想,找到最新的方案交给同事执行,最终责任在我。
这也暴露出平时管理方面存在不严谨的地方。