1. 传统方法:
  • top oder by with P:1040 // 首先按进程负载排序找到 axLoad(pid)
  • top -Hp 进程PID:1073 // 找到相关负载 线程PID
  • printf “0x%x\n”线程PID:0x431 // 将线程PID转换为 16进制,为后面查找 jstack 日志做准备
  • jstack 进程PID | vim +/十六进制线程PID - // 例如:jstack 1040|vim +/0x431 -
  1. 使用封装的脚本,一键解决
    快速安装
source <(curl -fsSL https://raw.githubusercontent.com/oldratlee/useful-scripts/master/test-cases/self-installer.sh)

1、java 正则表达式回溯造成 CPU 100%

import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;public class RegexLoad {public static void main(String[] args) {String[] patternMatch = {"([\\w\\s]+)+([+\\-/*])+([\\w\\s]+)","([\\w\\s]+)+([+\\-/*])+([\\w\\s]+)+([+\\-/*])+([\\w\\s]+)"};List<String> patternList = new ArrayList<String>();patternList.add("Avg Volume Units product A + Volume Units product A");patternList.add("Avg Volume Units /  Volume Units product A");patternList.add("Avg retailer On Hand / Volume Units Plan / Store Count");patternList.add("Avg Hand Volume Units Plan Store Count");patternList.add("1 - Avg merchant Volume Units");patternList.add("Total retailer shipment Count");for (String s :patternList ){for(int i=0;i<patternMatch.length;i++){Pattern pattern = Pattern.compile(patternMatch[i]);Matcher matcher = pattern.matcher(s);System.out.println(s);if (matcher.matches()) {System.out.println("Passed");}elseSystem.out.println("Failed;");}}}
}

编译、运行上述代码之后,咱们就能观察到服务器多了一个 100% CPU 的 java 进程:


使用方法

show-busy-java-threads.sh
# 从 所有的 Java进程中找出最消耗CPU的线程(缺省5个),打印出其线程栈。show-busy-java-threads.sh -c <要显示的线程栈数>show-busy-java-threads.sh -c <要显示的线程栈数> -p <指定的Java Process>
# -F选项:执行jstack命令时加上-F选项(强制jstack),一般情况不需要使用
show-busy-java-threads.sh -p <指定的Java Process> -Fshow-busy-java-threads.sh -s <指定jstack命令的全路径>
# 对于sudo方式的运行,JAVA_HOME环境变量不能传递给root,
# 而root用户往往没有配置JAVA_HOME且不方便配置,
# 显式指定jstack命令的路径就反而显得更方便了show-busy-java-threads.sh -a <输出记录到的文件>show-busy-java-threads.sh -t <重复执行的次数> -i <重复执行的间隔秒数>
# 缺省执行一次;执行间隔缺省是3秒##############################
# 注意:
##############################
# 如果Java进程的用户 与 执行脚本的当前用户 不同,则jstack不了这个Java进程。
# 为了能切换到Java进程的用户,需要加sudo来执行,即可以解决:
sudo show-busy-java-threads.sh

示例:

work@dev_zz_Master 10.48.186.32 23:45:50 ~/demo >
bash show-busy-java-threads.sh
[1] Busy(96.2%) thread(8577/0x2181) stack of java process(8576) under user(work):
"main" prio=10 tid=0x00007f0c64006800 nid=0x2181 runnable [0x00007f0c6a64a000]java.lang.Thread.State: RUNNABLEat java.util.regex.Pattern$GroupHead.match(Pattern.java:4168)at java.util.regex.Pattern$Loop.match(Pattern.java:4295)...at java.util.regex.Matcher.match(Matcher.java:1127)at java.util.regex.Matcher.matches(Matcher.java:502)at RegexLoad.main(RegexLoad.java:27)[2] Busy(1.5%) thread(8591/0x218f) stack of java process(8576) under user(work):
"C2 CompilerThread1" daemon prio=10 tid=0x00007f0c64095800 nid=0x218f waiting on condition [0x0000000000000000]java.lang.Thread.State: RUNNABLE[3] Busy(0.8%) thread(8590/0x218e) stack of java process(8576) under user(work):
"C2 CompilerThread0" daemon prio=10 tid=0x00007f0c64093000 nid=0x218e waiting on condition [0x0000000000000000]java.lang.Thread.State: RUNNABLE[4] Busy(0.2%) thread(8593/0x2191) stack of java process(8576) under user(work):
"VM Periodic Task Thread" prio=10 tid=0x00007f0c640a2800 nid=0x2191 waiting on condition[5] Busy(0.1%) thread(25159/0x6247) stack of java process(25137) under user(work):
"VM Periodic Task Thread" prio=10 tid=0x00007f13340b4000 nid=0x6247 waiting on condition
work@dev_zz_Master 10.48.186.32 23:46:04 ~/demo >

可以看到,一键直接定位异常代码行,是不是很方便?
2、线程死锁,程序 hang 住

import java.util.*;
public class SimpleDeadLock extends Thread {public static Object l1 = new Object();public static Object l2 = new Object();private int index;public static void main(String[] a) {Thread t1 = new Thread1();Thread t2 = new Thread2();t1.start();t2.start();}private static class Thread1 extends Thread {public void run() {synchronized (l1) {System.out.println("Thread 1: Holding lock 1...");try { Thread.sleep(10); }catch (InterruptedException e) {}System.out.println("Thread 1: Waiting for lock 2...");synchronized (l2) {System.out.println("Thread 2: Holding lock 1 & 2...");}}}}private static class Thread2 extends Thread {public void run() {synchronized (l2) {System.out.println("Thread 2: Holding lock 2...");try { Thread.sleep(10); }catch (InterruptedException e) {}System.out.println("Thread 2: Waiting for lock 1...");synchronized (l1) {System.out.println("Thread 2: Holding lock 2 & 1...");}}}}
}

执行之后的效果:


如何用工具定位:

一键定位:可以清晰的看到线程互相锁住了对方等待的资源,导致死锁,直接定位到代码行和具体原因。
3、免费实用的脚本工具大礼包

除了正文提到的 show-busy-java-threads.sh,oldratlee 同学还整合和不少常见的开发、运维过程中涉及到的脚本工具,觉得特别有用的我简单列下:

(1) show-duplicate-java-classes

偶尔会遇到本地开发、测试都正常,上线后却莫名其妙的 class 异常,历经千辛万苦找到的原因竟然是 Jar冲突!这个工具就可以找出Java Lib(Java库,即Jar文件)或Class目录(类目录)中的重复类。

Java开发的一个麻烦的问题是Jar冲突(即多个版本的Jar),或者说重复类。会出NoSuchMethod等的问题,还不见得当时出问题。找出有重复类的Jar,可以防患未然。

# 查找当前目录下所有Jar中的重复类
show-duplicate-java-classes# 查找多个指定目录下所有Jar中的重复类
show-duplicate-java-classes path/to/lib_dir1 /path/to/lib_dir2# 查找多个指定Class目录下的重复类。Class目录 通过 -c 选项指定
show-duplicate-java-classes -c path/to/class_dir1 -c /path/to/class_dir2# 查找指定Class目录和指定目录下所有Jar中的重复类的Jar
show-duplicate-java-classes path/to/lib_dir1 /path/to/lib_dir2 -c path/to/class_dir1 -c path/to/class_dir2

例如:


# 在war模块目录下执行,生成war文件
$ mvn install
...
# 解压war文件,war文件中包含了应用的依赖的Jar文件
$ unzip target/*.war -d target/war
...
# 检查重复类
$ show-duplicate-java-classes -c target/war/WEB-INF/classes target/war/WEB-INF/lib
...

(2) find-in-jars

在当前目录下所有jar文件里,查找类或资源文件。

用法:注意,后面Pattern是grep的 扩展正则表达式。

find-in-jars 'log4j\.properties'
find-in-jars 'log4j\.xml$' -d /path/to/find/directory
find-in-jars log4j\\.xml
find-in-jars 'log4j\.properties|log4j\.xml'

示例:

$ ./find-in-jars 'Service.class$'
./WEB-INF/libs/spring-2.5.6.SEC03.jar!org/springframework/stereotype/Service.class
./rpc-benchmark-0.0.1-SNAPSHOT.jar!com/taobao/rpc/benchmark/service/HelloService.class

(3) housemd pid [java_home]

很早的时候,我们使用BTrace排查问题,在感叹BTrace的强大之余,也曾好几次将线上系统折腾挂掉。2012年淘宝的聚石写了HouseMD,将常用的几个Btrace脚本整合在一起形成一个独立风格的应用,其核心代码用的是Scala,HouseMD是基于字节码技术的诊断工具, 因此除了Java以外, 任何最终以字节码形式运行于JVM之上的语言, HouseMD都支持对它们进行诊断, 如Clojure(感谢@Killme2008提供了它的使用入门), scala, Groovy, JRuby, Jython, kotlin等.
使用housemd对java程序进行运行时跟踪,支持的操作有:

  • 查看加载类
  • 跟踪方法
  • 查看环境变量
  • 查看对象属性值

详细信息请参考: https://github.com/CSUG/HouseMD/wiki/UserGuideCN

(4) jvm pid

执行jvm debug工具,包含对java栈、堆、线程、gc等状态的查看,支持的功能有:

========线程相关=======
1 : 查看占用cpu最高的线程情况
2 : 打印所有线程
3 : 打印线程数
4 : 按线程状态统计线程数
========GC相关=======
5 : 垃圾收集统计(包含原因)可以指定间隔时间及执行次数,默认1秒, 10次
6 : 显示堆中各代的空间可以指定间隔时间及执行次数,默认1秒,5次
7 : 垃圾收集统计。可以指定间隔时间及执行次数,默认1秒, 10次
8 : 打印perm区内存情况*会使程序暂停响应*
9 : 查看directbuffer情况
========堆对象相关=======
10 : dump heap到文件*会使程序暂停响应*默认保存到`pwd`/dump.bin,可指定其它路径
11 : 触发full gc。*会使程序暂停响应*
12 : 打印jvm heap统计*会使程序暂停响应*
13 : 打印jvm heap中top20的对象。*会使程序暂停响应*参数:1:按实例数量排序,2:按内存占用排序,默认为1
14 : 触发full gc后打印jvm heap中top20的对象。*会使程序暂停响应*参数:1:按实例数量排序,2:按内存占用排序,默认为1
15 : 输出所有类装载器在perm里产生的对象。可以指定间隔时间及执行次数
========其它=======
16 : 打印finalzer队列情况
17 : 显示classloader统计
18 : 显示jit编译统计
19 : 死锁检测
20 : 等待X秒,默认为1
q : exit

进入jvm工具后可以输入序号执行对应命令

可以一次执行多个命令,用分号";"分隔,如:1;3;4;5;6

每个命令可以带参数,用冒号":"分隔,同一命令的参数之间用逗号分隔,如:

Enter command queue:1;5:1000,100;10:/data1/output.bin

(5) greys [@IP:PORT]

PS:目前Greys仅支持Linux/Unix/Mac上的Java6+,Windows暂时无法支持

Greys是一个JVM进程执行过程中的异常诊断工具,可以在不中断程序执行的情况下轻松完成问题排查工作。和HouseMD一样,Greys-Anatomy取名同名美剧“实习医生格蕾”,目的是向前辈致敬。代码编写的时候参考了BTrace和HouseMD两个前辈的思路。
使用greys对java程序进行运行时跟踪(不传参数,需要先greys -C pid,再greys)。支持的操作有:

  • 查看加载类,方法信息
  • 查看JVM当前基础信息
  • 方法执行监控(调用量,失败率,响应时间等)
  • 方法执行数据观测、记录与回放(参数,返回结果,异常信息等)
  • 方法调用追踪渲染

详细信息请参考: https://github.com/oldmanpushcart/greys-anatomy/wiki

(6) sjk sjk --commands sjk --help

使用sjk对Java诊断、性能排查、优化工具

  • ttop:监控指定jvm进程的各个线程的cpu使用情况
  • jps: 强化版
  • hh: jmap -histo强化版
  • gc: 实时报告垃圾回收信息

更多信息请参考: github.com/aragozin/jvm-tools

Refer:

oldratlee/useful-scripts
github.com/oldratlee/useful-scripts

awesome-scripts
github.com/superhj1987/awesome-scripts

JDK自带工具之问题排查场景示例
bit.ly/2xtukcb

Java调优经验谈
bit.ly/2xCIj2L

jvm排查工具箱jvm-tools
segmentfault.com/a/1190000012658814

alibaba/arthas
github.com/alibaba/arthas/blob/7f236219ddbd040764dd821cbcbd44899dd57c90/README.md

一键定位java 线上服务 CPU 100%相关推荐

  1. 线上服务 CPU 100%?一键定位 so easy!

    0.背景 经常做后端服务开发的同学,或多或少都遇到过 CPU 负载特别高的问题.尤其是在周末或大半夜,突然群里有人反馈线上机器负载特别高,不熟悉定位流程和思路的同学可能登上服务器一通手忙脚乱,定位过程 ...

  2. 线上服务 CPU 100% ?一键定位 so easy!

    点击上方 "编程技术圈"关注, 星标或置顶一起成长 后台回复"大礼包"有惊喜礼包! 每日英文 A man should have one dream at le ...

  3. 线上服务 CPU 又 100% 啦?一键定位 so easy!

    点击上方"方志朋",选择"设为星标" 回复"666"获取新整理的面试资料 来源:my.oschina.net/leejun2005/blog ...

  4. JVM:线上服务CPU爆满,如何排查(三)

    0. 引言 前一段时间出现了一个正则表达式引起的线上CPU爆满的问题,一开始没有在第一时间定位到问题,这里也特此记录一下,同时也系统的梳理下CPU爆满问题的排查思路和方法,为后续的同学提供参考. 1. ...

  5. 排查Java线上服务故障的方法和实例分析

    2019独角兽企业重金招聘Python工程师标准>>> 前言 作为在线系统负责人或者是一个技术专家,你可能刚刚接手一个项目就需要处理紧急故障,或者被要求帮忙处理一些紧急的故障,这个时 ...

  6. 面试官:线上服务CPU飙高怎么排查?

    用jstack排查 先执行top,找到CPU占用比较高的进程 jstack 进程id > show.txt 找到进程中CPU占用比较高的线程,线程id转为16进制 到show.txt文件中根据线 ...

  7. 线上服务CPU100%问题快速定位实战--转

    来自微信公众号 架构师之路 功能问题,通过日志,单步调试相对比较好定位. 性能问题,例如线上服务器CPU100%,如何找到相关服务,如何定位问题代码,更考验技术人的功底. 58到家架构部,运维部,58 ...

  8. 线上服务CPU100%问题快速定位实战(转载公众号:架构师之路)

    功能问题,通过日志,单步调试相对比较好定位. 性能问题,例如线上服务器CPU100%,如何找到相关服务,如何定位问题代码,更考验技术人的功底. 58到家架构部,运维部,58速运技术部联合进行了一次线上 ...

  9. 线上服务CPU100%问题快速定位实战

    功能问题,通过日志,单步调试相对比较好定位. 性能问题,例如线上服务器CPU100%,如何找到相关服务,如何定位问题代码,更考验技术人的功底. 58到家架构部,运维部,58速运技术部联合进行了一次线上 ...

最新文章

  1. SAP QM QP03显示一个含有Multiple Specs检验特性的检验计划
  2. 入门SAP PP的学习流程
  3. 一家创业公司,如何服务好数百企业?
  4. 算法笔记 1 31 chapter4
  5. 图解javascript中this指向
  6. 前端基础_认识前端.md
  7. 什么是扩展现实(XR)?云XR系统怎样实现?终于有人讲明白了
  8. 【java】Thread.Sleep(0) 与 Thread.onSpinWait
  9. oracle deul,C#引用传递
  10. bzoj 3261: 最大异或和
  11. 一键导出微信所有聊天记录的小工具
  12. 安徽大学本科毕业论文中英文题目修改指南
  13. 微信小程序开发 | API应用案例(下)
  14. 【blender建模功能】03 倒角工具
  15. Docker理论与实践(三)
  16. 中小企业数字化转型的痛点分析
  17. Android 如何安全的打印日志
  18. 【单镜头反光相机】Nikon尼康
  19. 好程序员Python培训分享Python程序员面试技巧
  20. linux 卸载ogg,ubuntu下卸载realplay

热门文章

  1. Scala 传名参数、注解
  2. 设置多个dns_公共DNS全面故障:114.114.114.114 和 8.8.8.8
  3. vmware 安装honeywall 出现INIT: Id “X” respawning too fast 或者menu命令不识别等问题
  4. 计算机网络第七ppt,考研 计算机网络 第七学时 传输层.ppt
  5. 趣谈C++之void是什么?
  6. 打包压缩(gzip/zip/bzip2/tar)用法详解
  7. 王道C语言督学营oj练习(全部更新完成)
  8. c odp.net连oracle,oracle odp.net 连接不上oracle
  9. 痴人说梦——重读《围城》
  10. 两/2键2通道触摸触控芯片VKD232C,适用电池供电类,高灵敏度,稳定性好,小体积封装