话不多说,笔者所在公司ES生产集群 20+,机器 400+,经常会有cpu持续很高情景,一般使用率超过 90 会收到告警~~~
两种方案
1、使用 hot_threads api
集群所有节点:
curl -XGET `hostname -i`:9200/_nodes/hot_threads
单个节点:
curl -XGET `hostname -i`:9200/_nodes/node-name/hot_threads
其中 node-name 替换成自己节点节点名称
剩下的 google 去到底在执行什么代码!
2、使用 top + jstatck 获取堆栈信息
具体参考