http://www.cnblogs.com/LBSer/p/4417148.html

1 问题描述

某服务有两台机器,每隔几天会报警load高,一开始看监控发现gc时间抖动很大,以为是发生了fullgc引起卡顿而未加注意,之后登入线上机器查看日志发现是jvm崩溃导致了服务重启从而引发gc时间抖动。以某天为例,该服务分别在上午7点和上午10点发生jvm崩溃,如果同时发生崩溃将导致线上停服,后果不堪设想。

2 问题分析

崩溃日志显示jvm崩溃发生在在标记清除扫根路径时。

搜索此bug,发现是jvm的一个已知bug,https://bugs.openjdk.java.net/browse/JDK-8020236,这个bug在1.6和1.7中均有,只是因为重现困难而一直未被修复。

Par_MarkFromRootsClosure::scan_oops_in_oop(HeapWord*)

有人遇到和我们一样的问题(http://hllvm.group.iteye.com/group/topic/43404),他通过压测发现当“ParallelCMSThreads > ParallelGCThreads”会引起此崩溃,而当"ParallelCMSThreads <= ParallelGCThreads"时问题不再复现。而“ParallelCMSThreads > ParallelGCThreads”这个问题也在jvm bug列表中(https://bugs.openjdk.java.net/browse/JDK-6668573),此bug下有人给出的解决思路是将ParallelCMSThreads 设置为 <=ParallelGCThreads。

3 解决方法

查看我们junglepoi-service服务的jvm参数配置,发现ParallelCMSThreads被设置成4,而ParallelGCThreads却未被设置。默认情况下ParallelGCThreads = (ncpus <= 8) ? ncpus : 3 + ((ncpus * 5) / 8),其中ncpus是机器的核数,由于junglepoi-service服务所在的机器为2核4G配置,因此默认情况下ParallelGCThreads=2,此时ParallelCMSThreads > ParallelGCThreads。

解决方法是:1)将ParallelCMSThreads设置为2或1;2)或者不设置ParallelCMSThreads,默认情况下ParallelCMSThreads = (ParallelGCThreads + 3) / 4,如果不设置默认ParallelCMSThreads=(2+3)/4=1。

我们将ParallelCMSThreads设置为2,上线两天未复现jvm崩溃异常,后续将持续观察。

4 启示

不能简单拷贝其它项目的jvm参数配置,需要结合项目特点、机器环境等各方面信息来综合配置。

转载于:https://www.cnblogs.com/LBSer/p/4417148.html

jvm间歇性崩溃分析相关推荐

  1. 02.Android崩溃Crash库之App崩溃分析

    目录总结 01.抛出异常导致崩溃分析 02.RuntimeInit类分析 03.Looper停止App就退出吗 04.handleApplicationCrash 05.native_crash如何监 ...

  2. JVM crash 异常分析

    背景 在升级服务jar包的时候,由于采取的是热升级,即在服务运行的时候,替换掉服务的jar包,导致启动的时候JVM崩溃了,产生hs_err_pidxxx.log这样的log文件 错误日志文件 # # ...

  3. 面对突发事故,APP如何做好崩溃分析与性能监控?

    云妹导读: 在<会展云技术解读>专题中,已先后推出了安全篇.设计篇与智能推荐篇,分别介绍了最严格8大安全保障方案.线上展览中基于服务设计的方法以及展会场景智能推荐搭建之路.本篇文章我们将继 ...

  4. [日更-2019.5.2、3、4] 关于JVM的概略分析

    2019独角兽企业重金招聘Python工程师标准>>> 声明 上一篇写了[日更-2019.4.29.30] 关于JVM.Dalvik.ART的基础分析 ,本篇就单独对JVM进行一下分 ...

  5. java直接内存为什么快_直接内存与 JVM 源码分析

    直接内存(堆外内存) 直接内存有一种叫法,堆外内存. 直接内存(堆外内存)指的是 Java 应用程序通过直接方式从操作系统中申请的内存.这个差别与之前的堆.栈.方法区,那些内存都是经过了虚拟化.所以严 ...

  6. 如何使用MAT进行JVM内存泄露分析

    转载自  如何使用MAT进行JVM内存泄露分析 在<Java Agent的隔离实现以及卸载时一些坑>中,卸载Agent之后,使用 jmap-histo:live pid命令验证执行FGC, ...

  7. 程序崩溃 分析工具_程序分析工具| 软件工程

    程序崩溃 分析工具 A program analysis tool implies an automatic tool that takes the source code or the execut ...

  8. linux 内核部分崩溃,Linux 系统内核崩溃分析处理简介

    Written by arstercz -2019-11-12 Linux 系统内核崩溃分析处理简介 背景说明 目前绝大多数的 Linux 发行版都会将 kdump.service 服务默认开启, 以 ...

  9. Android APP native 崩溃分析之 linker SIGBUS 崩溃

    原文地址:https://caikelun.io/post/2019-05-31-android-app-native-crash-linker-sigbus/ 这是 Android APP nati ...

最新文章

  1. [转]为什么我要用 Node.js? 案例逐一介绍
  2. C++ 调用lib 和 dll的 方法 及 动态库DLL与静态库lib的区别
  3. RAC Failover三种方式
  4. 服务器角色与数据库角色
  5. [转载] 生活小常识 :joke:
  6. ThinkPadnbsp;E40nbsp;硬盘异响…
  7. Spring 缓存大法
  8. tumblr_向您的Tumblr博客添加高级主题
  9. 网络存储服务器系统价格比较,【网络存储器报价】四款不同的网络存储器,你会选择那一款?...
  10. ELK企业内部日志分析系统(elasticsearch/logstash/beats/kibana)centos7详解
  11. 本地搭建Git服务器,两台电脑共享代码如此简单
  12. 全向轮三轮小车的搭建(一)
  13. 北京工业大学外网访问知网数据库方法
  14. easyx的使用(3)
  15. “全球发布——主流声音 · 最强路径”在深落幕 引领主流生态融合新模式
  16. MySql 别犯糊涂了! LEFT JOIN 的 ON 后接上筛选条件,多个条件会出事!
  17. 推进网络强国建设,筑牢网络安全屏障
  18. 信息学奥赛一本通例题2.8~2.13
  19. 漫谈MCMC与Gibbs采样(三)—— 有趣的马尔科夫链
  20. macOS 黑苹果 使用 ffplay 播放斗鱼直播 替代 浏览器播放flash占用CPU过高发热

热门文章

  1. Android项目实战(三十六):给背景加上阴影效果
  2. 简单介绍java Enumeration(转)
  3. Android SDK Manager 更新代理配置
  4. 使用EXE4J自动打包可运行jar文件
  5. Android绑定服务后出现空指针异常问题
  6. java中对时间的操作
  7. 从武侠门派的角度去解释域、域树、林的含义(下)
  8. 用Python破解数学教育
  9. rfc 查看工具_使用技术RFC作为管理工具的6课
  10. asp代理商源代码_广告代理商的源代码是什么样的?