Grafana:数据采集—》数据存储—》数据展示,grafana只是展示数据使用
所有的监控和系统都是在容器里面部署的,
性能瓶颈分析
现象:
1、响应时间 > 5s
2、错误率高于预期要求
3、cpu使用率高
分析流程
1、Jmeter聚合报告指标没有达标
2、分析服务器资源—grafanaz监控平台—cpu使用率特别高
3、根据细分图分析是user%使用率高
4、可以使用top查看具体哪一个进程使用cpu高
5、可以使用docker监控,分析是哪一个容器的cpu使用率高
a.第一阶段:mysql 大于 java进程 b.第二阶段:java高于mysql
6、分析mysql进程的性能—使用监控工具去分析
a.执行效率问题
b.缓存 库结构 死锁问题
7、打开慢查询日志 file ---》 table select->full join 一般是因为数据库里面的查询操作没有索引
8、发现数据库的性能是因为慢查询导致,是具体什么语句导致
9、找到具体的慢查询语句,跟开发确认,截图给开发
什么业务——》什么表-》什么问题-》截图
10、开发优化完,回归测试
注意事项:新版本项目里,需要测试大量查询的业务,请先找开发铺数据,百万级别数据,方便压测
错误率问题:
现象:jmeter聚合报告里有错误率
分析:
a.查看结果树里面是500 服务器问题
b.分析服务端问题
c.了解服务端的架构(单体的tomcat\springboot内部应用服务器、微服务)
d.docker环境,找到对应的哪一个容器
e.进入容器 docker exec -it 容器id /bin/bash
查看容器日志 docker logs -f --tail 100容器id