问题
压测过程中,并发线程数达到一定程度后压测结果中会周期性返回大量502并伴随tps大幅度下降

image.png

image.png
排查
被压测服务前只有一个nginx,用户请求经过slb然后经过nginx后就到达被压测服务,确认slb和nginx均无限流措施且nginx的超时时间设置正产,通过arms查看接口响应情况,发现接口无超长响应时间且arms中接口平均响应时间只有几毫秒,通过arms查看压测过程中存在慢调用,慢调用接口为健康检查接口。
问题定位
由于健康检查接口慢调用导致k8s认为服务不可用,导致nginx大量返回502
解决
健康检查接口是由框架提供的,重新写一个高性能健康检查接口解决问题