监控在整个运维和产品生命周期中扮演着至关重要的角色。其目标是在应用的各个阶段,从程序设计、开发、部署到下线,实现事前预警、事中问题定位和事后问题分析的全方位服务。
一、监控的目的
监控贯穿应用的整个生命周期,服务对象主要包括技术和业务两个方面:
1. 技术
通过监控系统,技术团队能够了解技术环境的实时状态,有助于检测、诊断和解决技术环境中的故障和问题。监控系统在技术层面的目标是提供全面的技术支持。
2. 业务
监控系统最终的目标是为业务提供支持,确保业务的持续开展。因此,监控的目的可以简要概括如下: ● 实现对系统的7*24小时实时监控。 ● 提供及时的系统状态反馈。 ● 保障平台的稳定运行。 ● 确保服务的安全可靠。 ● 保障业务的持续运行。 监控的全面性和及时性使其成为确保系统和业务顺利运行的关键环节。
三、监控的方式
监控的主要方式包括:
1. 健康检查
健康检查针对应用本身的健康状况进行监控,检查服务是否正常存活。
2. 日志
日志是排查问题的主要方式,提供丰富信息用于定位和解决问题。
3. 调用链监控
调用链监控完整呈现一次请求的全部信息,包括服务调用链路、所耗时间等。
4. 指标监控
指标是基于时间序列的离散数据点,通过聚合和计算反映重要指标的趋势。 在这四种监控方式中,健康检查由云平台等基础设施提供,日志一般由独立的日志中心进行采集、存储、计算和查询。调用链监控通常有独立的解决方案进行服务调用的埋点、采集、计算和查询。指标监控则通过抓取目标暴露的指标,清理、聚合数据,并通过展示和告警等方式提供监控信息。 ❝说明:该方案主要针对指标监控❞
四、监控选型
1.健康检查
云平台提供健康检查能力,可在云平台中直接配置。
2.日志
成熟的开源日志解决方案为ELK。
3.调用链监控
常用的调用链监控工具包括skywalking、zikpin、pinpoint、elastic APM、Cat。其中,zikpin和cat对代码有侵入性,而skywalking、pinpoint、elastic APM基于字节码注入技术,对代码没有侵入性。 在云原生环境下,推荐使用skywalking和elastic APM,它们支持多种语言,且无代码侵入。
五、监控应用选择
1. 百川云网站监测
长亭百川云网站监测是一款专为有站点监测需求的用户打造的 SaaS 应用,致力于解决用户互联网风险监测难题的 SaaS 化订阅服务产品。可实现对网络质量、页面性能、入侵篡改、内容违规、挂马暗链、SSL 证书等场景进行周期性监控,支持多维度分析性能指标。利用可视化性能数据和告警通知,帮助用户及时对业务质量作出反应,保证业务稳定正常运行。 监控类型包括: ● 可用性监控 ● 稳定性监控 ● 内容合规监控:敏感内容+内容篡改 ● 安全监控:暗链监控、挂马监控、dns解析监控 ● 漏洞扫描
2. Prometheus
● 成熟的社区支撑,是CNCF的毕业项目,得到大厂支持。 ● 易于部署和运维,核心只有一个二进制文件,无其他依赖。 ● 采用Pull模型,通过HTTP的Pull方式从各监控目标拉取数据,避免了Push模型的运维难度和压力。 ● 强大的数据模型,支持自定义标签,有助于进行数据聚合和计算。 ● 强大的查询语言PromQL,支持数据查询、聚合、可视化和告警。 ● 完善的生态,提供丰富的接入方案和客户端SDK。 ● 高性能,单一实例可处理数以百计的监控指标。
当然还有更多其他好用的监控应用,也可以选择自己二开。你觉得有哪些好用的监控应用呢?在评论区推荐吧~~