4月份的总结,基调是“调整和坚持”。
回顾5月份团队中的事与人,同样还是“调整和坚持”,但内容却完全不同。
先说调整
如果说4月我们调整的是“信心”,5月份调整的则是“方向和思路”:
所有工作围绕大白鲨进行,自动化(DevOps)和可靠性(SRE),是我们的两个方向。
1、自动化(DevOps)
普遍认为这点是过去我们的强项,是让团队保持高效,并能抽出精力探索其他领域的基石。(比如终端硬件支持、可靠性保障)
2、可靠性(SRE)
这是一个全新领域,17年初团队内部就都看过Google的这本方法论,看完之后,除了了解到运维团队除了自动化还有一个叫SRE的牛逼方向外几乎没什么别的收获。但从17年底,特别是新老业务调整之后,可靠性事故频发。
无论是业务需要还是团队发展,都是时候祭出SRE的尚方宝剑了。
于是从团队中挤出一两个人开始逐步探索。从灰度发布到代码监控,再到代码规范和框架,折腾与反复到了18年,但因为老产品线资源更加匮乏,新产品线的业务敏感度高了好多,实际成果完全看不到,再加上容量管理、风险管理,目前看来更加重要事情的搁置,可靠性状况甚至更差了。
所以,方向和思路的调整,迫在眉睫。
调整一,全局视角审视可靠性,分析与规划先行(风险梳理),技术后行。
调整二,MOT复盘工作深挖,明确责任,揭示我们做事的软肋,把解决方案沉淀在规范、制度、代码框架上,确保同类问题不再重复发生。当然嘴上说说容易,具体推进工作还是得看我们六月份的努力
调整三,资源,想法再棒也得有人落地。可靠性方向本就是运维团队内部挤出来的资源,有时甚至从其他团队的借调资源,且大部分工作是隐性的看不到短期收益,所以资源被抽调的情况非常严重。痛定思痛,我们把运维团队一分为二,专人专用,加上无锡新进资源,架构方面也不再依赖平台架构组。
再聊一下坚持
工作分三种,一种信手拈来的熟练工作,二种难度适中压力一般有能成长的,三种全新领域需要突破再突破才可能完成的。
每个人都希望做第二种工作,但人生不如意十有八九,总会碰到第三种工作,每个人都有选择权,无所谓对错,但有所谓的是对团队的态度,对自己人生的态度。
我喜欢有创业精神的人,也一直希望把我们团队打造成创业型团队,何不把我们目前做的事情,当成一次创业呢?坚持-坚持-再坚持,应该是创业的基本特质了。
全力以赴,结果不一定完美,但不断突破自己的过程一定是无比美妙的。未来我们的主题可以再加一项,变成:“调整-坚持-突破”。
最后,感谢无锡的小伙伴给我们带来新的气象,未来属于你们!
罗重阳
2018年6月3日