【瞬时视角】使用jstack/pstack定位服务端性能问题

我们对一个多线程系统通常需要知道：

先做一个类比

很显然，管理者可以直接得出结论：

 merge代码是当前团队的主要瓶颈，且约占整体时间的38 / 100 = 38%
 员队人数越多时这个比例估算的越准确

对上面的技术团队而言：

  用一部神奇相机记录下某一瞬间所有人在做的事情，并统计他们各自在做些什么
  然后找到哪件事在做的人最多，从而知道团队效率的问题所在

对一个多线程系统而言：

  将服务暂停，并将所有线程正在做的事情dump下来后再让服务继续，统计所有线程的逻辑，从而知道性能瓶颈所在

此方法能定位大多常见的性能问题，但不要迷信
取stack dump会导致服务有一定时间的暂停，但通常较快，可以对线上服务执行
一些方法调用耗时较小时，取stack dump可能是抓不到的
可以给系统较大的压力以使得更多线程在处理任务，此时用本文方法会更加快速准确
需要注意：同一个系统在不同的压力下，瓶颈点可能不同
jstack/pstack工具仅会给出dump的内容，而不会做统计，而dump的内容可能有几万行，查看起来不太方便。因此我写了个脚本用来做统计处理，可参考使用，欢迎提交PR

最后编辑于：2018.12.17 15:02:16

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。