1. 为什么需要监控?
1.1 保证为业务提供服务的系统不宕机 不出问题 保证服务可用性
1.2 使用监控程序 及时发现问题 监控系统负载情况 及时告警防止因为系统问题导致业务损失
2. 需要监控哪一些?
硬件:cpu 硬盘 温度
系统:cpu 硬盘 内存 网络 进程 负载情况
应用:nginx tomcat php mysql redis..
日志:错误日志 访问日志 用户行为日志
安全:WAF 敏感文件
API:api请求速度 网站存活
业务:用户注册量 用户在线人数 用户行为
流量:用户流量 用户地图
3. 准备工作?
熟悉被监控对象
整理监控指标
告警阀值定义
故障处理流程