1.top 找到CPU高的进程,比如20753
2.top -H -p 20753(也可以替换成ps -mp 20753 -o THREAD,tid,time | sort -rn | more (sort -rn 以数值的方式进行逆序排列))
3.jstack 20753 > 20753.log 得到dump文件
(jstack 需要进到jdk/bin 目录, which java,找到目录,cd进到指定目录)
4.printf ‘%x\n‘ 21388
得到16进制数字538c/n
5.在20753.log 中查找538c/n (nid=oxn538c/n)
即可知道占用cpu的业务代码。
(这步可以简化为 jstack 20753 |grep 538c/n-A 30)
以上只是告诉你怎么找到dump文件信息。那么找到信息后如何分析呢?
dump文件中的线程状态值有:
1.死锁,Deadlock
2.执行中,Runnable
3.等待资源,Waiting on condition
4.等待获取监视器,Waiting on monitor entry
5.暂停,Suspended
6.对象等待中,Object.wait()或TIMED_WAITING
7.阻塞,Blocked
8.停止,Parked
含义分析如下:
1.Deadlock:死锁线程,一般指多个线程调用间,进入相互资源占用,导致一直等待无法释放的情况。
2.Runable:一般指该线程正在执行状态中,该线程占用了资源,正在处理某个请求,有可能正在传递SQL到数据库执行,有可能在对某个文件进行操作,有可能进行数据类型转换。
3.Waiting on condition:等待资源,或等待某个条件的发生。具体原因需结合stacktrace来分析。
如果堆栈信息明确是应用代码,则证明该线程正在等待资源。一般是大量读取某资源,且该资源采用了资源锁的情况下,线程进入了等待状态,等待资源的读取。
或正在等待其他现场的执行
如果发现有大量的线程都处在Wait on Condition,从线程的stack看,正等待网络读写,这可能是一个网络瓶颈的征兆,是因为网络阻塞导致线程无法执行,一种情况是网络非常忙,几乎消耗了所有带宽,仍然有大量的数据等待网络读写;另一种情况也可能是网络空闲,但由于路由等问题,导致包无法正常的到达。
又或者是该线程在sleep,等待sleep的时间到了,将被唤醒
4.Blocked:线程阻塞,是指当前线程执行过程中,所需要的资源长时间等待却一直未能获取到,被容器的线程管理器表示为阻塞状态,可以理解为等待资源超时的线程。
5.Waiting for monitor entry 和 in Object.wait(): monitor是java中用以实现线程之间的互斥与协作的主要手段,它可以看成是对象或者Class的锁。每一个对象都有且只有一个monitor。当某个线程期待获得Monitor及对象的锁,而在锁被其他线程拥有的时候,这个线程就会进入Entry Set区域。曾经获得过锁,但是其他必要条件不满足而需要wait的线程就进入了Wait Set区域。
解释下WAIT时的两个队列 “ Entry Set”和 “Wait Set”
在 “Wait Set”里面的线程都如饥似渴地等待拿到Monitor。他们是怎么进入到“Wait Set”的呢?当一个线程拿到了Monitor,但是在其他资源没有到位的情况下,调用同步锁对象(一般是synchronized()内的对象)的 wait() 方法,放弃了 Monitor,它就进入到了 “Wait Set”队列。
在 “ Entry Set”里面的线程都等待拿到Monitor,拿到了线程就成为了Runnable线程,否则就会一直处于处于 “waiting for monitor entry”。
原文:https://www.cnblogs.com/xhld19/p/14596493.html