运维这件苦差事

运维真是一件苦差事,在没有做到自动化之前,你时刻都得提心吊胆着。

千台机器共舞

我们的服务跑在ECS上,得益于阿里的生态,我们根本不需要搭建zabbix之类的监控工具,三五个同学建个内部群,然后在群内接入个钉钉机器人,监控目标机器的各项资源。纵然千台节点,依旧不亦乐乎。

今天发生了什么

即使这样,也只是做到了监控,如果发生了问题,还是要白屏或黑屏去处理的。就在今天早上6:50,应该是好梦的时节,却发生了磁盘报警,使用率直逼100%。

接了个组内其他同学的电话,就赶紧爬起来开电脑。排查原因,寻找对策,着手解决。等一切忙完一时间,已经7:40了。

去了趟卫生间,路过阳台看到朝阳已经爬上了护栏,在远处32层写字楼顶部,红光四射,就像一颗腌了许久而流出红油的鸭蛋黄。嗯?这才意识到已经快到端午节了。

时刻准备着

运维线上服务的特点就是,你永远不知道下一秒会发生什么,所以只能7×24h保持联系状态,时刻准备着登录机器、解决问题。可能是周末晚上你正在吃烛光晚餐时,也可能是凌晨两点你的春宵美梦中。

在其位谋其政,既然选择了DevOps,当然要负责到底,也只有这样,对运维才有深刻的认识吧。

只是在此之前,没事多烧几柱香,祈祷不要夜夜爆肝吧。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 本文摘自微信公众号《高效运维》 运维行业有句话:“无监控、不运维”,是的,一点也不夸张,监控俗称“第三只眼”。没了...
    憨大王阅读 9,506评论 0 49
  • Zabbix简介 Zabbix官方网站Zabbix中文文档 本文系统环境是CentOS7x86_64, Zabbi...
    Zhang21阅读 12,505评论 0 37
  • ——没有算法专家,AIOps 也能玩得这么 High 在这样一个 IT 技术高速发展的时代,速度往往能决定一切! ...
    Vincent_56ae阅读 5,755评论 0 2
  • 基于机器学习的智能运维 裴 丹1张圣林2裴昶华3 1清华大学 2南开大学 3阿里巴巴公司 关键词:机器学习 智能运...
    AIOPstack阅读 13,788评论 5 19
  • 20170418 今天看知乎,大量的减肥鸡汤,又想要减肥了,想每天记录自己的饮食,希望自己可以坚持! 201703...
    94f11c7aaafd阅读 2,118评论 0 0

友情链接更多精彩内容