Google SRE的工作内容

SRE是Site Reliability Engineering的缩写,意思是网站可靠性工程学
对于人员来说,就是Site Reliability Engineer,网站可靠性工程师

对于一个SRE来说,工作职责有:

  1. 应急响应
  • 监控
  • 事件处理
  • 事后总结
  1. 日常运维
  • 变更管理
  • 容量规划和置备
  • 性能和效率
  1. 工程研发
  • 工具研发
  • SLO制定和保障
  • 无人值守运维

《凤凰项目》中说,运维工作主要有四类:业务项目,内部项目,变更和计划外的工作。
与SRE的工作职责很类似。

还有一种类型的工作,也许是最重要的一类,因为它的破坏性实在很强,就是计划外的工作。 与其他种类的工作不同,计划外工作是恢复性工作,几乎总是让你远离目标。因此,知道你计划外工作从何而来就显得尤为重要。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容