目前小组涉及的IT日常运维工作主要可以分为变更、事件和服务请求三大类。对于变更,很多人并不陌生,因为变更是IT运维工作痛苦的原因之一,即它有7×24的业务属性,意味着你可能要随时准备进行变更支持。
随着公司业务的发展,业务对IT的诉求也越来越多,系统的变更数量也是越来越多。近三年来,小组变更数量年增长率达到了50%以上,而小组成员数量不可能每年以如此高的速率增长,同时因为系统越来越庞大,系统之间集成关复杂的缘故,人们对变更质量的要求也越来越高,因为一个看似简单的变更可能对多个IT系统带来影响。鉴于此,变更对自动化的诉求可谓是越来越强烈。
简单的变更流程为申请人提交变更,变更管理员审视变更方案规范性,变更审批人审视方案合理性,若变更影响极大的需要变更评审委员会决议,审视通过后变更管理员会和变更申请人沟通并调度变更,变更实施人员进行变更实施,若遇实施异常就根据变更异常流程进行升级,实施完成之后反馈变更结果并通知变更申请人组织变更验证,若申请人验证失败则通知变更实施人员进行变更回退操作,变更结束后申请人反馈变更实施结果,最后变更管理员关闭变更,若有失败的变更也对其进行跟踪。
以上的变更流程内容看似简单,实际在处理变更过程会有较多的问题。我们可以一起看下这些问题带来的变更质量问题如何通过自动化的方法来进行规避。
1、变更方案质量低的问题
很多项目组频繁换人,由于工作交接不够到位,导致新的变更申请人不知道变更方案如何写。虽然大多数的变更方案都有变更模板支撑,但让一个没有经验的新人来提交变更还是会有各种各样的问题,譬如缺少变更的非标准步骤,有些方案根据自己的直观想象就写了,根本没有根据实施模板。像这种问题,通过变更方案的结构化,申请人可以选择一个个变更标准步骤,集成一个方案,或者直接套用上一次相关的变更作为新的变更模板,只要稍作修改后就可以提交了。变更方案自动化极大的改善了变更方案的准确和规范性。
2、变更冲突的问题
因为之前是变更管理员人工沟通、调度的方式,所以很多变更方案只有等到各个变更管理员汇总变更计划的时才可以发现变更冲突,通过人工校对Excel内容的方式,很容易遗漏或看错。变更相互间的影响对生产环境的影响很大,譬如一个系统的OS做补丁升级,但是另一个系统还在做版本上线,结果发现应用部署时OS被重启了。这对时间窗要求高的关键系统是有巨大的杀伤力。通过变更自动化,可以在对应的系统变更提交时直观的识别出相互影响的变更,避免变更冲突。
3、变更审批不方便的问题
以往的变更调度都是只能在电脑上进行处理的,比如以前经常有一些变更因为方案问题需要反复修改,变更管理员不得不在公司一直等着。随着变更业务量的增加,这种等待情况也变得越来越严重。变更管理员因此而困扰不已,移动审批将变更管理员从这个场景中解救了出来。可以在任何时候,任何地点进行变更审批。
4、变更实施排队等待的问题
之前的变更排队现象是最让人头痛的问题,因为变更量很多,一个人名下有多个项目的变更,导致变更的项目组经常要花变更实施几倍的等待时常。部署自动化的出现极大的改善了这个问题。
我们一直认为,变更实施必须要等到业务系统最不繁忙的时候。大多数系统是工作日在用的,所以为了减少对全球业务的影响,大多数系统变更的时间窗会选择在周六晚上22点,一直持续到周末早上8点结束。与变更相处久了,觉得这样做是理所当然的。其实不然,谁说变更一定要放在周六晚上,通过变更自动化,变更运营管理,可以确保变更的系统的变更质量得到有效控制,譬如一个系统经过多次证明可以在10分钟内顺利完成变更自动化实施。那么,通过架构上的高可用,再加上变更自动化工具平台,变更必将达到随时随地实施的高度。等到那个时候,再多的变更都不是问题。