JVM常用命令之-----jstack

Jstack

jstack命令主要用于调试java程序运行过程中的线程堆栈信息,可以用于检测死锁,进程耗用cpu过高报警问题的排查。

jstack语法格式:

| [root@www wangxiaoxiao]# jstack

Usage:

jstack [-l] <pid>

jstack -F [-m] [-l] <pid>

Options:

-F  强制dump线程堆栈信息. 用于进程hung住, jstack <pid>命令没有响应的情况

-m  同时打印java和本地(native)线程栈信息,m是mixed mode的简写

-l  打印锁的额外信息

|

jstack命令会打印出所有的线程,包括用户自己启动的线程和jvm后台线程,我们主要关注的是用户线程,如

| [root@www wangxiaoxiao]# jstack 15525

Full thread dump Java HotSpot(TM) 64-Bit Server VM (25.65-b01 mixed mode):

"elasticsearch[Native][merge][T#1]" #98 daemon prio=5 os_prio=0 tid=0x00007f031c009000 nid=0x4129 waiting on condition [0x00007f02f61ee000]

java.lang.Thread.State: WAITING (parking)

at sun.misc.Unsafe.park(Native Method)

- parking to wait for  <0x00000000eea589f0> (a org.elasticsearch.common.util.concurrent.EsExecutors$ExecutorScalingQueue)

at java.util.concurrent.locks.LockSupport.park(LockSupport.java:175)

at java.util.concurrent.LinkedTransferQueue.awaitMatch(LinkedTransferQueue.java:737)

at java.util.concurrent.LinkedTransferQueue.xfer(LinkedTransferQueue.java:647)

at java.util.concurrent.LinkedTransferQueue.take(LinkedTransferQueue.java:1269)

at java.util.concurrent.ThreadPoolExecutor.getTask(ThreadPoolExecutor.java:1067)

at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1127)

at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)

at java.lang.Thread.run(Thread.java:745)

....

线程dump信息说明:

elasticsearch[Native][merge][T#1] 是我们为线程起的名字

**daemon **表示线程是否是守护线程

**prio **表示我们为线程设置的优先级

**os_prio **表示的对应的操作系统线程的优先级,由于并不是所有的操作系统都支持线程优先级,所以可能会出现都置为0的情况

**tid **是java中为这个线程的id

**nid **是这个线程对应的操作系统本地线程id,每一个java线程都有一个对应的操作系统线程

wait on condition表示当前线程处于等待状态,但是并没列出具体原因

java.lang.Thread.State: WAITING (parking) 也是表示的处于等待状态,括号中的内容说明了导致等待的原因,例如这里的parking说明是因为调用了 LockSupport.park方法导致等待

java.lang.Thread.State说明:

一个Thread对象可以有多个状态,在java.lang.Thread.State中,总共定义六种状态:

1、NEW

线程刚刚被创建,也就是已经new过了,但是还没有调用start()方法,jstack命令不会列出处于此状态的线程信息

**2、RUNNABLE **#java.lang.Thread.State: RUNNABLE****

RUNNABLE这个名字很具有欺骗性,很容易让人误以为处于这个状态的线程正在运行。事实上,这个状态只是表示,线程是可运行的。我们已经无数次提到过,一个单核CPU在同一时刻,只能运行一个线程。

**3、BLOCKED **# java.lang.Thread.State: BLOCKED (on object monitor)****

线程处于阻塞状态,正在等待一个monitor lock。通常情况下,是因为本线程与其他线程公用了一个锁。其他在线程正在使用这个锁进入某个synchronized同步方法块或者方法,而本线程进入这个同步代码块也需要这个锁,最终导致本线程处于阻塞状态。

4、WAITING

等待状态,调用以下方法可能会导致一个线程处于等待状态:

  • [Object.wait](eclipse-javadoc:%E2%98%82=ArtConcurrentBook/D:%5C/Java%5C/jdk1.8.0_60%5C/jre%5C/lib%5C/rt.jar%3Cjava.lang%28Thread$State.class%E2%98%83State%5EWAITING%E2%98%82Object%E2%98%82wait%E2%98%82) 不指定超时时间 # java.lang.Thread.State: WAITING (on object monitor)

  • [Thread.join](eclipse-javadoc:%E2%98%82=ArtConcurrentBook/D:%5C/Java%5C/jdk1.8.0_60%5C/jre%5C/lib%5C/rt.jar%3Cjava.lang%28Thread$State.class%E2%98%83State%5EWAITING%E2%98%82%E2%98%82join%E2%98%82) with no timeout

  • [LockSupport.park](eclipse-javadoc:%E2%98%82=ArtConcurrentBook/D:%5C/Java%5C/jdk1.8.0_60%5C/jre%5C/lib%5C/rt.jar%3Cjava.lang%28Thread$State.class%E2%98%83State%5EWAITING%E2%98%82LockSupport%E2%98%82park%E2%98%82) #java.lang.Thread.State: WAITING (parking)

例如:对于wait()方法,一个线程处于等待状态,通常是在等待其他线程完成某个操作。本线程调用某个对象的wait()方法,其他线程处于完成之后,调用同一个对象的notify或者notifyAll()方法。Object.wait()方法只能够在同步代码块中调用。调用了wait()方法后,会释放锁。

5、TIMED_WAITING

线程等待指定的时间,对于以下方法的调用,可能会导致线程处于这个状态:

  • [Thread.sleep](eclipse-javadoc:%E2%98%82=ArtConcurrentBook/D:%5C/Java%5C/jdk1.8.0_60%5C/jre%5C/lib%5C/rt.jar%3Cjava.lang%28Thread$State.class%E2%98%83State%5ETIMED_WAITING%E2%98%82%E2%98%82sleep)#java.lang.Thread.State: TIMED_WAITING (sleeping)``

  • [Object.wait](eclipse-javadoc:%E2%98%82=ArtConcurrentBook/D:%5C/Java%5C/jdk1.8.0_60%5C/jre%5C/lib%5C/rt.jar%3Cjava.lang%28Thread$State.class%E2%98%83State%5ETIMED_WAITING%E2%98%82Object%E2%98%82wait%E2%98%82long) 指定超时时间 #java.lang.Thread.State: TIMED_WAITING (on object monitor)

  • [Thread.join](eclipse-javadoc:%E2%98%82=ArtConcurrentBook/D:%5C/Java%5C/jdk1.8.0_60%5C/jre%5C/lib%5C/rt.jar%3Cjava.lang%28Thread$State.class%E2%98%83State%5ETIMED_WAITING%E2%98%82%E2%98%82join%E2%98%82long) with timeout

  • [LockSupport.parkNanos](eclipse-javadoc:%E2%98%82=ArtConcurrentBook/D:%5C/Java%5C/jdk1.8.0_60%5C/jre%5C/lib%5C/rt.jar%3Cjava.lang%28Thread$State.class%E2%98%83State%5ETIMED_WAITING%E2%98%82LockSupport%E2%98%82parkNanos)#java.lang.Thread.State: TIMED_WAITING (parking)``

  • [LockSupport.parkUntil](eclipse-javadoc:%E2%98%82=ArtConcurrentBook/D:%5C/Java%5C/jdk1.8.0_60%5C/jre%5C/lib%5C/rt.jar%3Cjava.lang%28Thread$State.class%E2%98%83State%5ETIMED_WAITING%E2%98%82LockSupport%E2%98%82parkUntil)#java.lang.Thread.State: TIMED_WAITING (parking)``

6、TERMINATED

线程终止。

说明,对于** java.lang.Thread.State: WAITING (on object monitor)java.lang.Thread.State: TIMED_WAITING (on object monitor)**,对于这两个状态,是因为调用了Object的wait方法(前者没有指定超时,后者指定了超时),由于wait方法肯定要在syncronized代码中编写,因此肯定是如类似以下代码导致:

<pre class="prettyprint linenums lang-java prettyprinted" style="box-sizing: border-box; overflow: auto; font-family: Menlo, Monaco, Consolas, "Courier New", monospace; font-size: 13px; display: block; padding: 9.5px; margin: 0px 0px 10px; line-height: 1.42857; color: rgb(51, 51, 51); word-break: break-all; overflow-wrap: break-word; background-color: rgb(51, 51, 51); border: 1px solid rgb(204, 204, 204); border-radius: 0px !important; font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; orphans: 2; text-align: start; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;">

  1. synchronized(obj) {
  2. .........
  3. obj.wait();
  4. .........
  5. }

因此通常的堆栈信息中,必然后一个lock标记,如下:

"CM1" #21 daemon prio=5 os_prio=0 tid=0x00007f02f0d6d800 nid=0x3d48 in Object.wait() [0x00007f02fefef000]

java.lang.Thread.State: WAITING (on object monitor)

    at java.lang.Object.wait(Native Method)

    at java.lang.Object.wait(Object.java:502)

    at java.util.TimerThread.mainLoop(Timer.java:526)

   ** - locked <0x00000000eca75aa8> (a java.util.TaskQueue)**

    at java.util.TimerThread.run(Timer.java:505)

|

关于死锁

在 JAVA 5中加强了对死锁的检测。线程 Dump中可以直接报告出 Java级别的死锁,如下所示:

| Found one Java-level deadlock:

=============================
"Thread-1":
waiting to lock monitor 0x0003f334 (object 0x22c19f18, a java.lang.Object),
which is held by "Thread-0"
"Thread-0":
waiting to lock monitor 0x0003f314 (object 0x22c19f20, a java.lang.Object),
which is held by "Thread-1" |

关于nid

每个线程都有一个tid 和nid,tid是java中这个线程的编号,而nid(native id)是对应操作系统线程id。有的时候,我们会收到报警,说服务器,某个进程占用CPU过高,肯定是因为某个java线程有耗CPU资源的方法。

可以通过命令cat /proc/<pid><pid style="box-sizing: border-box;">/task</pid>查看一个进程下面有哪些线程

Image.png

可以通过"top -Hp"命令查看这个进程内所有线程的cpu和内容使用情况使用情况:

Image.png

上例中看到12446进程中,12467线程占用cpu最高,是0.3%。要想看这个线程对应java哪个线程,首先用以下命令将12467转成16进制:

Image.png

接着使用jstack命令,显示堆栈信息:

Image.png
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容