线上服务出问题了!!!!
- 当手机报警短信响起-》
- 我们匆匆忙忙打开电脑-》
- 然后登上跳板机-》
- 一条一条执行命令,dump下当前vm和heap情况
一看表好几分钟过去了!!!多少个用户受到影响,又要做casestudy了,但是发现事后复盘都不知道dump去哪儿找。
写了个简单的脚本分分钟snapshot系统的各种情况。
#!/bin/bash
# Execute this shell where occurrence hanpen
# XXXX 可以是tomcat jetty的主线程
pid=`jps -l | grep XXXX | awk '{print $1}'`
mkdir ~/$pid
jstack $pid > ~/$pid/stack.log
top -H -p $pid -n 1 > ~/$pid/thread.log
jmap -heap $pid > ~/$pid/heap.log
jmap -histo $pid > ~/$pid/histo.log
jmap -dump:format=b,file=~/$pid/dump.bin $pid
虽然脚本简单,但是可以扩展的空间比较大,可以简单搞个web页面,一键触发。