一、什么是慢SQL 慢SQL是指那些执行效率低下、响应时间长,导致用户等待时间变长和服务器资源利用率下降的SQL查询。那么,如何定义一个SQL查询是"慢"的呢?这不是一个绝对...
一、什么是慢SQL 慢SQL是指那些执行效率低下、响应时间长,导致用户等待时间变长和服务器资源利用率下降的SQL查询。那么,如何定义一个SQL查询是"慢"的呢?这不是一个绝对...
监控的4个黄金指标 《SRE:Google运维解密》中提出,监控系统的四个黄金指标是:延迟(Latency)、流量(Traffic)、错误(Errors)、饱和度(Satur...
故障复盘的重要性无需多说,每一次故障都是宝贵的学习机会,本人接手故障复盘工作已经半年有余,从一开始的手足无措,慢慢变得游刃有余。以下内容为本人从网上查阅学习多个专家经验,并结...
我们先回顾一下SRE的定义:SRE就是用软件工程的思维和方法论,通过设计、构建自动化工具完成以前由运维工程师手动操作的任务。所以,SRE要把更多的时间花费在长期项目研发上而非...
为了量化客户对服务可靠性的期望,找到客户对可靠性满意的点,我们需要制定针对用户的服务质量目标,并且努力去达到这个质量目标。在这个过程中,我们需要定义一些服务质量指标(SLI)...
一、系统不可能100%可靠 系统不可能100%可靠,人都不可能100%健康,更何况我们人类创造的系统?所以,任何软件系统都不应该一味地追求 100%可靠。事实证明,可靠性超过...
有很多人在日更,希望入选简书创作者。也曾试着去做,但好像是说必须每日八百字才可以达到。刚开始的时候对自己的文字是有要求的,希望每天写千字文。但是随着时间的长久,也明白日日写个...
早晨醒来习惯性打开简书消息栏先浏览一会,平静一下呼吸再起床按节奏做事,其它提醒的消息栏里显示你的文章《故事||换亲》已经被加入《理事会.点赞收录》,还有另一条消息你的文章《故...
我的文字惹了祸,我是文字的书写者,我低估了网络的强大,也为自己的愚钝感到遗憾——我的文字对现实中的人造成了伤害,我得为自己的行为买单! 出于对文字热爱,我在自媒体平台上码字整...
SRE,Site Reliability Engineering,中文翻译为站点可靠性工程师,这个词诞生于谷歌内部。将这个词语展开来说:首先,SRE的关注点在于可靠性;其次,...
近日公司内部多个App出现License证书过期导致App不可用事件。原因很简单,因为运维人员没有在用户报障之前发现证书过期并及时更换。其实像这类忘记续期和更换数字证书的错误...