240 发简信
IP属地:广西
  • 从管控角度谈慢SQL治理

    一、什么是慢SQL 慢SQL是指那些执行效率低下、响应时间长,导致用户等待时间变长和服务器资源利用率下降的SQL查询。那么,如何定义一个SQL查询是"慢"的呢?这不是一个绝对...

  • 故障治理:如何进行故障复盘

    故障复盘的重要性无需多说,每一次故障都是宝贵的学习机会,本人接手故障复盘工作已经半年有余,从一开始的手足无措,慢慢变得游刃有余。以下内容为本人从网上查阅学习多个专家经验,并结...

  • SRE方法论之减少琐事

    我们先回顾一下SRE的定义:SRE就是用软件工程的思维和方法论,通过设计、构建自动化工具完成以前由运维工程师手动操作的任务。所以,SRE要把更多的时间花费在长期项目研发上而非...

  • 240
    SRE方法论之服务质量目标

    为了量化客户对服务可靠性的期望,找到客户对可靠性满意的点,我们需要制定针对用户的服务质量目标,并且努力去达到这个质量目标。在这个过程中,我们需要定义一些服务质量指标(SLI)...

  • SRE方法论之拥抱风险

    一、系统不可能100%可靠 系统不可能100%可靠,人都不可能100%健康,更何况我们人类创造的系统?所以,任何软件系统都不应该一味地追求 100%可靠。事实证明,可靠性超过...

  • 文章应该写多少字

    有很多人在日更,希望入选简书创作者。也曾试着去做,但好像是说必须每日八百字才可以达到。刚开始的时候对自己的文字是有要求的,希望每天写千字文。但是随着时间的长久,也明白日日写个...

个人介绍
围绕系统稳定性保障,分享SRE、AIOps、DevOps、故障治理等知识经验,希望和更多大咖交流学习