记一次Java程序内存泄漏导致CPU占用高的排查与处理
有一个jar程序,在测试环境运行正常,发布到生产环境后,出现了CPU占用接近100%的情况,jar程序所处理的redis队列也出现了积压。
使用
ps -mp pid -o THREAD,tid,time | sort -rn
命令查看线程中的进程占用资源情况。
m表示进程使用的CPU时间总计,单位1/100秒;p表示SWAP 进程使用的虚拟内存中,被换出的大小,单位kb;sort -rn表示倒序排列。

看到了几个线程占用的资源很高。
使用printf “%x\n” tid命令,得到线程tid的16进制值。
printf “%x\n” 17975
4637
使用 jstack pid |grep tid -A 30
命令打印线程的堆栈信息,tid需要使用16进制值,-A 30表示查找到所在行的后30行。

可以看到一直在进行GC,说明内存已经用尽。
使用
jstat -gcmetacapacity pid
命令查看内存分布情况及GC情况

使用
jstat -gcutil pid
命令查看GC情况

本文记录了一次由于Java程序内存泄漏导致CPU占用过高的排查过程。通过分析线程、内存使用和GC情况,发现LinkedList在处理数据过程中不断增大,超过了内存限制,引发了频繁的垃圾回收。解决方案是优化代码,限制LinkedList大小并使用Redis队列缓解内存压力,避免内存溢出和性能下降。
871

被折叠的 条评论
为什么被折叠?



