读书笔记|运维人如何做好趋势预测?

因为工作需要不停充电,前阵子买了《应用智能运维实践》这本书,读过之后受益匪浅,书里详细介绍了应用智能域运维系统建设涉及的技术、工具、流程、方法,分析了关键智能化应用运维技术、相关开源软件工具的能力和真是行业用户建设案例。这里做个总结记录,算是写给我自己的阅读笔记,也给大家做个分享~

对于互联网公司来说,系统复杂化导致的人工运维成本激增已经是普遍现象,通过趋势预测、根源问题分析等智能化手段简化人工运维问题是行之有效的应对策略。

如果应用系统包含上千个无状态的计算集群节点,所有节点都在运行同样的代码,分担相同规模的计算负载,从这些集群中选出异常节点并不容易,那么该怎么做呢?


1,怎么从海量数据中找到异常节点

为了解决上千节点运行期的海量监控数据筛选问题,可以首先利用算法识别节点反馈的监控指标正常运行的状态数据模式,然后过滤集群中监控指标状态数据模式类似的节点,将其识别为正常,剩下的就是疑似异常节点。

这样系统可以自动找出异常节点,不需要通知任何人干预处理。为了排查故障原因,自动处理过程和异常节点的状态数据会被保存并通知相关工程师。通过应用异常检测算法,计算集群中异常节点定位、故障排查和恢复的人工工作量大幅度降低了,服务质量也会有显著提升。

2,如何确定某一时间内数据是否异常

分析指定时间范围内应用指标数据是否存在异常最简单的统计学方法是计算指标的平均值和标准差。通过这种方法,我们能很快发现持续采集的监控数据中指标波动异常的时间范围。

当关键产品服务发生异常时,在凌晨或其他任何时间生成告警短信或电话以通知责任人都是有必要的。但是,当产生的告警并没有明确指出异常原因,或者根本就是错误告警时,就没有必要推送了。

从理论上说,好的告警需要有较高的信噪比,能指示关键KPI指标上实时产生的异常数据点,并能与明确有所指的告警信息匹配,引导责任人快速定位、修正问题。

假如要监控某应用未授权用户尝试非法登录系统的行为,采集的指标数据的概率分布为高斯分布,则越靠近高斯分布钟形曲线边缘的取值,为异常数据的可能性越高。在运维数据分析场景下,这种方法最常用的场景是利用一段时间的监控数据,计算概率分布,并通过标准差设置告警阈值,然后计算实时采集的数据偏离平均值的程度来判断是否触发告警。

例如,若监控的未授权登录量指标符合高斯分布,则可以设置告警策略为筛选未授权登录量比平均值3倍标准差大的时间。

3,总结

对于统计学方法,要围绕实际场景,本着计算简单、结果有效的原则进行选择。因为我们面对的是几万甚至百万级别的指标,过于复杂的统计学方法会给监控系统带来巨大的负担,影响产生结果的时效性,我们也不可能对每个甚至每类指标都定义统计学方法。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,001评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,210评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,874评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,001评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,022评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,005评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,929评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,742评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,193评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,427评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,583评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,305评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,911评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,564评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,731评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,581评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,478评论 2 352

推荐阅读更多精彩内容