一次线上问题能够想到哪些?

几乎所有的软件都会遇到问题,几乎成了IT界的共识,但也成了好多人的借口。
遇到问题没有关系,但要从问题中总结经验,并尽可能减少类似问题的发生。
做为有心人应该至少要想到下面事项:
1、是否可以更快的发现问题?(监控报警是否完善)
2、是否能够快速的定位到问题原因或者问题节点?(日志和监控)
3、是否能够尽快从问题中恢复?(重启、回滚)
4、怎么从根本上解决问题?(分析和bug修复)
5、怎么将问题尽可能限制在有限范围内(故障隔离)
7、下次如何避免再出现这个问题?(测试用例)
8、如何举一反三消除类似问题?(代码排查,流程优化)
其实软件和流程有个逐步优化的过程,但是如果每次只是头痛医头,脚痛医脚。
问题收敛的很慢,甚至会一直无法收敛

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。