说明:JDK7和JDK8的Region划分实现略有不同(差异非常小,且只有-Xmx和-Xms的值不一样才有区别),本篇文章讲解的是JDK8中Region的划分实现;如果要了解JDK7的Region划分实现,请参考JDK7 headpRegion.cpp

之所以写这篇文章是因为看到有人发出了这样的提问:G1的Xmx大于64G有意义吗?看过一些资料,G1的Region最大可以到32M,2048个分区,这样算下来,32M*2048=64G。

首先说结论,大于64G肯定有意义。那么他的计算方式问题出在哪里呢?让我们一探究竟!

源码分析

G1 Region划分的实现源码在headpRegion.cpp中,摘取部分核心源码如下:

// Minimum region size; we won't go lower than that.
// We might want to decrease this in the future, to deal with small
// heaps a bit more efficiently.
#define MIN_REGION_SIZE  (      1024 * 1024 )// Maximum region size; we don't go higher than that. There's a good
// reason for having an upper bound. We don't want regions to get too
// large, otherwise cleanup's effectiveness would decrease as there
// will be fewer opportunities to find totally empty regions after
// marking.
#define MAX_REGION_SIZE  ( 32 * 1024 * 1024 )// The automatic region size calculation will try to have around this
// many regions in the heap (based on the min heap size).
#define TARGET_REGION_NUMBER          2048size_t HeapRegion::max_region_size() {return (size_t)MAX_REGION_SIZE;
}// 这个方法是计算region的核心实现
void HeapRegion::setup_heap_region_size(size_t initial_heap_size, size_t max_heap_size) {uintx region_size = G1HeapRegionSize;// 是否设置了G1HeapRegionSize参数,如果没有配置,那么按照下面的方法计算;如果设置了G1HeapRegionSize就按照设置的值计算if (FLAG_IS_DEFAULT(G1HeapRegionSize)) {// average_heap_size即平均堆的大小,(初始化堆的大小即Xms+最大堆的大小即Xmx)/2size_t average_heap_size = (initial_heap_size + max_heap_size) / 2;// average_heap_size除以期望的REGION数量得到每个REGION的SIZE,与MIN_REGION_SIZE取两者中的更大值就是实际的REGION_SIZE;从这个计算公式可知,默认情况下如果JVM堆在2G(TARGET_REGION_NUMBER*MIN_REGION_SIZE)以下,那么每个REGION_SIZE都是1M;region_size = MAX2(average_heap_size / TARGET_REGION_NUMBER, (uintx) MIN_REGION_SIZE);}// region_size的对数值int region_size_log = log2_long((jlong) region_size);// 重新计算region_size,确保它是最大的小于或等于region_size的2的N次方的数值,例如重新计算前region_size=33,那么重新计算后region_size=32;重新计算前region_size=16,那么重新计算后region_size=16;// Recalculate the region size to make sure it's a power of// 2. This means that region_size is the largest power of 2 that's// <= what we've calculated so far.region_size = ((uintx)1 << region_size_log);// 确保计算出来的region_size不能比MIN_REGION_SIZE更小,也不能比MAX_REGION_SIZE更大// Now make sure that we don't go over or under our limits.if (region_size < MIN_REGION_SIZE) {region_size = MIN_REGION_SIZE;} else if (region_size > MAX_REGION_SIZE) {region_size = MAX_REGION_SIZE;}// 与MIN_REGION_SIZE和MAX_REGION_SIZE比较后,再次重新计算region_size// And recalculate the log.region_size_log = log2_long((jlong) region_size);... ...
}

源码解读:

MIN_REGION_SIZE:允许的最小的REGION_SIZE,即1M,不可能比1M还小;

MAX_REGION_SIZE:允许的最大的REGION_SIZE,即32M,不可能比32M更大;限制最大REGION_SIZE是为了考虑GC时的清理效果;

TARGET_REGION_NUMBER:JVM对堆期望划分的REGION数量,而不是实际划分的REGION数量(重点);

计算演示

1、 验证下面这段源码,即如果配置了XX:G1HeapRegionSize,那么以配置为准;否则以计算为准:

// JDK8的实现
if (FLAG_IS_DEFAULT(G1HeapRegionSize)) {size_t average_heap_size = (initial_heap_size + max_heap_size) / 2;region_size = MAX2(average_heap_size / TARGET_REGION_NUMBER, (uintx) MIN_REGION_SIZE);
}// JDK7的实现
if (FLAG_IS_DEFAULT(G1HeapRegionSize)) {// We base the automatic calculation on the min heap size. This// can be problematic if the spread between min and max is quite// wide, imagine -Xms128m -Xmx32g. But, if we decided it based on// the max size, the region size might be way too large for the// min size. Either way, some users might have to set the region// size manually for some -Xms / -Xmx combos.region_size = MAX2(min_heap_size / TARGET_REGION_NUMBER,(uintx) MIN_REGION_SIZE);
}

这是JDK7和JDK8关于REGION_SIZE计算唯一的区别,事实上当Xmx和Xms的值不一样时,JVM不太好自动计算region_size,JDK7的注释进一步的解释了,且建议某些-Xms/-Xmx组合情况下,用户自己设置REGION_SIZE

  • 计算为准 假设配置JVM参数-Xmx6144m -Xms2048m,那么计算过程如下:

  1. average_heap_size=(6144m+2048m)/2=4096m

  2. region_size=max(4096m/2048, 1m)=2m

  3. region_size_log=21(因为2^21=2*1024*1024<=2m)

  4. region_size=2^21=2m(保证region_size的值为2^n)

  5. region_size=2m(因为MIN_REGION_SIZE<=2m<=MAX_REGION_SIZE)

  • 配置为准 假设配置JVM参数-Xmx1024m -Xms1024m -XX:G1HeapRegionSize=4m,那么计算过程如下:

  1. region_size=4m

  2. region_size_log=22(因为2^22<=4m)

  3. region_size=2^22=4m

  4. region_size=4m(因为MIN_REGION_SIZE<=1m<=MAX_REGION_SIZE)

2、 验证下面这段源码,即region_size的值一定是2^n:

int region_size_log = log2_long((jlong) region_size);
region_size = ((uintx)1 << region_size_log);

假设配置JVM参数-Xmx3072m -Xms3072m,那么计算过程如下:

  1. average_heap_size=(3072m+3072m)/2=3072m

  2. region_size=max(3072m/2048, 1m)=1.5*1024*1024

  3. region_size_log=20(因为2^20<1.5*1024*1024<2^21)

  4. region_size=2^20=1m(保证region_size的值为2^n)

  5. region_size=1m(因为MIN_REGION_SIZE<=1m<=MAX_REGION_SIZE)

3、 验证下面这段源码,即region_size的值一定是在[MIN_REGION_SIZE, MAX_REGION_SIZE]这个范围:

if (region_size < MIN_REGION_SIZE) {region_size = MIN_REGION_SIZE;
} else if (region_size > MAX_REGION_SIZE) {region_size = MAX_REGION_SIZE;
}

假设配置JVM参数-Xmx1024m -Xms1024m  -XX:G1HeapRegionSize=64m,那么计算过程如下:

  1. region_size=64m

  2. region_size_log=26(因为2^26<=64m)

  3. region_size=2^26=64m

  4. region_size=32m(因为region_size必须在[MIN_REGION_SIZE, MAX_REGION_SIZE]之间)

REGION_SIZE总结

通过上面的分析可知G1垃圾回收时JVM分配REGION的SIZE有如下约束:

1、如果配置了-XX:G1HeapRegionSize,那么先以配置的值为准;否则以计算为准;

2、计算方式为,根据第一步计算得到的REGION_SIZE,取不能大于它的最大的2^n的值为第二步计算得到的REGION_SIZE的值

3、把第二步计算得到的REGION_SIZE和MIN_REGION_SIZE比较,如果比MIN_REGION_SIZE还小,那么MIN_REGION_SIZE就是最终的region_size;否则再把REGION_SIZE和MAX_REGION_SIZE比较,如果比MAX_REGION_SIZE还大,那么MAX_REGION_SIZE就是最终的region_size;如果REGION_SIZE在[MIN_REGION_SIZE, MAX_REGION_SIZE]之间,那么REGIOIN_SIZE就是最终的region_size;

验证方式

通过下面这段源码配置JVM参数即可验证JDK8 G1中REGION_SIZE的计算方式:

import java.util.UUID;/*** @author afei*/
public class StringTest {public static void main(String[] args) throws Exception {for (int i=0; i<Integer.MAX_VALUE; i++){// 利用UUID不断生成字符串,这些字符串都会在堆中分配,导致不断塞满Eden区引起YoungGCUUID.randomUUID().toString();if (i>=100000 && i%100000==0){System.out.println("i="+i);Thread.sleep(3000);}}Thread.sleep(3000);}
}

JVM参数:java -XX:+UseG1GC -verbose:gc {HEAP_OPTS}由上面计算演示过程中提供的JVM参数取代即可,例如:java -XX:+UseG1GC -verbose:gc -Xmx6144m -Xms2048m -XX:+PrintHeapAtGC  StringTest,GC日志如下,从GC日志中可以看出region size为2048k:

i=100000
{Heap before GC invocations=0 (full 0):garbage-first heap   total 2097152K, used 104448K [0x0000000640000000, 0x0000000640202000, 0x00000007c0000000)region size 2048K, 51 young (104448K), 0 survivors (0K)Metaspace       used 2863K, capacity 4486K, committed 4864K, reserved 1056768Kclass space    used 308K, capacity 386K, committed 512K, reserved 1048576K
[GC pause (G1 Evacuation Pause) (young) 102M->440K(2048M), 0.0093728 secs]
Heap after GC invocations=1 (full 0):garbage-first heap   total 2097152K, used 440K [0x0000000640000000, 0x0000000640202000, 0x00000007c0000000)region size 2048K, 1 young (2048K), 1 survivors (2048K)Metaspace       used 2863K, capacity 4486K, committed 4864K, reserved 1056768Kclass space    used 308K, capacity 386K, committed 512K, reserved 1048576K
}
i=200000
... ...

写在最后

现在,我们可以纠正前面问题的计算方式了。如果Xmx设置为128G,Region的大小为32M的话,这时候Region数量为4096个,而不是2048个了!

热门内容:
  • 面试官:String长度有限制吗?是多少?

  • 工作10年后,再看String s = new String("xyz") 创建了几个对象?

  • Java外卖点餐系统

  • Redis 分布式锁使用不当,酿成一个重大事故,超卖了100瓶飞天茅台!!!

最近面试BAT,整理一份面试资料《Java面试BAT通关手册》,覆盖了Java核心技术、JVM、Java并发、SSM、微服务、数据库、数据结构等等。获取方式:点“在看”,关注公众号并回复 666 领取,更多内容陆续奉上。
明天见(。・ω・。)ノ♡

G1的Region是如何划分数量和大小的?相关推荐

  1. HBase Region 简介和建议数量大小

    Region是HBase数据管理的基本单位,region有一点像关系型数据的分区. region中存储这用户的真实数据,而为了管理这些数据,HBase使用了RegionSever来管理region. ...

  2. 地图影像图数量存储大小精度推算

    (Owed by: 春夜喜雨 http://blog.csdn.net/chunyexiyu) 参考:http://www.google.cn/maps/vt?lyrs=s&x=0&y ...

  3. SparkSql 控制输出文件数量且大小均匀(distribute by rand())

    @羲凡--只为了更好的活着 SparkSql 控制输出文件数量且大小均匀(distribute by rand()) Q:Spark如何控制文件你输出数量? A:这个简单,用 coalesce或者re ...

  4. linux系统查看CPU和内存数量,大小,频率

    dmidecode -t memory #查看内存详细信息 dmidecode -t processor #查看CPU详细信息 #以上两条命令得在root用户下执行才有输出 dmidecode |gr ...

  5. Liunx:核实文件数量和大小

    简介:在A.B服务之间进行scp远程复制时,如果文件目录数量众多,并且总量庞大,那么由于网络抖动或者系统存储机制等原因,很容易出现复制多传,少传,漏传的现象.规避此类事件的方法为,首先压缩成tar包, ...

  6. 修改KindEditor上传图片数量和大小

    版本:4.1.10 如果用的不是KindEditor压缩文件,就在在multiimage.js文件修改,具体见下图: 如果用的kindeditor的压缩文件,那么就在该文件中搜索imageSizeLi ...

  7. NLog日志框架-输出文件数量与大小控制

    目录 概述 一.NLog使用说明 二.文件输出控制配置 1.规则说明 2.演示案例 总结 概述 Nlog是一个免费开源的.NET日志框架,拥有丰富的日志路由(XML配置表)和强大的管理能力.NLog便 ...

  8. Linux设置swap分区为128g,swap分区或文件的数量与大小限制

    在Linux系统下,这个虚拟内存就被叫做swap.Linux swap分区是有限制的.在安装操作系统的时候,安装向导会提示用户需要创建多少的SWaP空间.通常情况下,SWaP比较合适的大小为物理内存的 ...

  9. 查看堆内存(histogram)中的对象数量及大小

    执行命令: jmap -histo 3331 num #instances #bytes class name 编号 个数 字节 类名 -------------------------------- ...

最新文章

  1. C语言小知识点练习总结
  2. linux git文件图标,分享|三款 Linux 下的 Git 图形客户端
  3. 容器学习 之 安装docker(二)
  4. 视力检查-2019年2月2日
  5. C#趣味程序----分数之和
  6. Next.js提供了基于React的简单通用JavaScript框架
  7. 让美国颤抖的5G,到底牛在哪里?
  8. Android更改包名
  9. 【BZOJ 3681】Arietta
  10. 文科女生转行软件测试之路
  11. 找不到战网服务器ip地址,wow服务器ip地址-我怎么知道战网服务器的IP地址去PING, – 手机爱问...
  12. html仿QQ资料卡,JS实现的模仿QQ头像资料卡显示与隐藏效果
  13. Mac OS X 遭遇 FileVault 加密异常无法升级系统的解决方案
  14. 卸载windows10强推的新版edge浏览器
  15. 安卓模拟器自动抓取某红书晒单数据
  16. 计算机教师培训感悟反思,教学工作反思感悟
  17. springsecurity总结
  18. SpringMVC @GetMapping注解路径冲突问题
  19. 运维部门工作总结_运维部技术工作总结
  20. 揭秘GES超大规模图计算引擎HyG:图切分

热门文章

  1. 图片1---前馈神经网络+反向传播神经网络
  2. 论文《一种金融市场预测的深度学习模型: FEPA》(4)----金融市场预测的架构--常见的数据降为方法
  3. 新建ROS工作工作空间
  4. adoquery查询结果如何赋给一个变量(delphi和c++ builder)
  5. vc++实现无进程无DLL无硬盘文件无启动项的ICMP后门后门程序
  6. HDOJ2270(How Many Friends Will Be Together With You)
  7. 【组队学习】【26期】编程实践(Django网站开发)
  8. 行列式求值、矩阵求逆
  9. java ee不能运行_Java9+移除 Java EE,导致我的 groovy 脚本无法运行
  10. 水母智能联合蚂蚁森林、犀牛智造等,用AI助力非遗出圈,39万人开工得“福”