Java 9 缩小字符串( Compact String)
从 Java 9 开始,JDK 开始引入了一个叫做 缩小字符串( Compact String)。
在中文语境下,压缩和缩小都是削减的意思,很多时候是可以通用的,但是实际上还是有区别的。
JDK 9 的处理方式是不改变字符串存储使用的 char[] 数组,而是根据字符集来进行处理。
当 String 在创建的时候,如果我们知道这个字符集使用的 LATIN-1 来表示的话,我们就使用一个字节来存储。
如果是中文,或者我们知道不能用 1 个字节来存储的话,我们还是使用 2 个字节来存储,与原来的存储方式保持一致。
换句话说就是尝试用 1 个字节来存储我们可以存储的自己,而不再浪费存储空间。
现在我们需要知道的问题就是,针对 String 的操作是不是会因为这种存储格式的改变而有影响呢,因为我们在数组中存储了 2 个字符集, LATIN-1 和 UTF-16 字符集之间的混合操作是不是会受到改变?
本文章的后续部分就对这种情况进行一些说明和演示,来让我们大致了解这个改进对我们的影响。
针对日常使用 Java 的开发人员来说,这个改变是感觉不到的,至于你使用的比较等操作还是会按照正常的处理方式来处理,对你来说这个是透明的。
Java 9 中的字符串实现
直到现在,我们应该非常明确的了解到 Java 中存储 String 是使用 char[] 来处理的,这个是没有改变的。
首先,我们先定义一个 char[] 数组
private final char[] value;
然后我们再定义一个 byte[] 数组:
private final byte[] value;
定义一个 coder 变量:
private final byte coder;
这个 Code 的变量可以为下面 2 个值:
static final byte LATIN1 = 0;
static final byte UTF16 = 1;
大部分情况下,Stgring 将会对 Coder 进行判断,然后根据值使用不同的实现:
public int indexOf(int ch, int fromIndex) {return isLatin1() ? StringLatin1.indexOf(value, ch, fromIndex) : StringUTF16.indexOf(value, ch, fromIndex);
} private boolean isLatin1() {return COMPACT_STRINGS && coder == LATIN1;
}
CompactString 在 JVM 中是默认启用的,如果你不想启用,你可以使用下面的参数告诉 JVM 不使用 String 压缩功能:
+XX:-CompactStrings
coder 是如何工作的
在 Java 9 的 String 类实现中,有关字符串的长度是下面的方法来进行计算的:
public int length() {return value.length >> coder;
}
如果 String 只含有 LATIN-1 字符的话, coder 的值为 0,那么获得 String 字符串长度的方法就直接返回字节数组的的长度,因为你这个数组的长度就是一个自己一个元素。
在另外的一种情况,如果 Stirng 使用了 UTF-16 字符集的话,coder 的值为 1 Java 将会使用数组中存储的元素的字节实际长度来返回,这是因为数组中存储的字符可能是 2 字节的。
需要注意的是,这个修改是针对 String 的内部修改,针对绝大部分开发者来说,所有有关 String 的处理方法都是透明的。
如果你想了解更多 String 有关的内部实现,这个是你值得深入的地方。
Java 9 中的字符串(String)压缩 - Java - OSSEZ我们都知道 Strings 在 Java 中使用 char[] 数组来实现的。 每一个 char[] 数组中的元素将会使用 2 个字节(byte)的存储空间,这是因为 Java 最初的实现使用 UTF-16 字符集。 如果你不需要存储其他语言,你的语言只有英文,或者 ASCII 码就可以满足的情况下,Java String 使用的 char[] 数组中存储的字符元素还是会使用 UTF-16 字符集,那么就会导致存储一个字符的时候…https://www.ossez.com/t/java-9-string/14024
Java 9 缩小字符串( Compact String)相关推荐
- 【Java 基础】字符串(String、StringBuilder),日期(Date、SimpleDateFormat、Calendar)
字符串.日期 字符串(String) 字符串常量池(String Constant Pool) 字符串的初始化 intern 方法 字符串的常用方法(截取) 可变字符串(StringBuilder) ...
- java privatekey输出字符串_[Java教程]根据字符串(String)生成公钥(PublicKey)和私钥(PrivateKey)对象_星空网...
根据字符串(String)生成公钥(PublicKey)和私钥(PrivateKey)对象 2012-05-29 0 1.字符串生成公钥对象 PublicKey /** * 实例化公钥 * * @re ...
- 字符串类型String总结
1.String类: ①Java中,字符串是String类的对象: ②Java中,String是引用数据类型: ③可以通过使用String类提供的方法来完成对字符串的操作: ④创建一个字符串对象之后, ...
- Java中的字符串串联
String Concatenation in java is very common. Being a Java developer, you are aware that every once i ...
- Java中的字符串程序
String is the most widely used class in java programming. That's why String programs are used in jav ...
- Java 缩小字符串( Compact String)和 压缩字符串(Compressed String)
正如我们在上面文章提到的内容,在英文语境中上面 2 个方法还是有区别的,在中文环境下主要表达就是字符串压缩. JDK 6 使用的压缩字符串方法,主要原因是我们修改了 String 的存储结构,char ...
- java 字符串总结_Java中字符串(String)总结
先说说JDK API: JDK中包含大量的API类库,所谓API(Application Programming Interface,应用程序编程接口,这些功能以类的形式封装). JDK API包含的 ...
- Java基础篇——字符串处理(String,StringBuffer,StringBuild)
提前说明本次的文章很长但是很有用,有耐心看完的必定不是凡人,必定会有很大的收获.本人在总结的过程中也收获了很多的知识,希望我们可以一起学习.写下这篇文章完全是抱着可以帮助到他人的态度. 虽然要写出很高 ...
- Java:字符串类String的功能介绍
在java中,字符串是一个比较常用的类,因为代码中基本上处理的很多数据都是字符串类型的,因此,掌握字符串类的具体用法显得很重要了. 它的主要功能有如下几种:获取.判断.转换.替换.切割.字串的获取.大 ...
最新文章
- Pat乙级 1038 统计同成绩学生
- sbt创建play framework(play!)scala web项目
- PL/SQL Developer 工具连接ORALCE数据库的方法
- JVM调优: 转载JVM调优总结
- linux7安装EMC的多路径,Oracle Linux 7.8 多路径(Multipath)+Udev绑定磁盘
- linux搭建java开发环境_linux中搭建java开发环境
- [HNOI 2014]道路堵塞
- html input url,HTML5表单之Input 部类-url
- 51单片机实现蜂鸣器报警
- adb和frida的一点简单使用记录
- torch.randn和torch.rand有什么区别
- Alist+PotPlayer实现高清影视在线观看
- PyCharm安装中文包
- HTML身份证号校验及根据身份证号获取出生日期/性别
- 一亩三分地新手上路答案
- Python爬虫新手入门教学(十七):爬取yy全站小视频
- Linux常见命令 24 - RPM命名管理-包命名与依赖性
- python3爬虫——千库网
- Linux不重启磁盘扩容
- 基于SSM的垃圾分类管理系统