java编码字数统计
好久没有写博客了,最近在做一个window exe程序。
public static int String_length(String value) {int valueLength = 0;String chinese = "[\u4e00-\u9fa5]";for (int i = 0; i < value.length(); i++) {String temp = value.substring(i, i + 1);if (temp.matches(chinese)) {valueLength += 2;} else {valueLength += 1;}}return valueLength;
}String s1 = "abcd我们";
String s2 = "abcdef";
String s3 = "啊波次得我们";
System.out.println("s1 default " + s1.length() + " s.byte " + s1.getBytes().length);
System.out.println("s1 gbk " + s1.length() + " s.byte " + s1.getBytes("GBK").length);
System.out.println("s1 utf-8 " + s1.length() + " s.byte " + s1.getBytes("UTF-8").length);
System.out.println("s2 " + s2.length() + " s.byte " + s2.getBytes().length);
System.out.println("s3 " + s3.length() + " s.byte " + s3.getBytes().length);System.out.println("func s1 " + String_length(s1));
System.out.println("func s2 " + String_length(s2));
System.out.println("func s3 " + String_length(s3));
得到的结果是:
s1 default 6 s.byte 10 //默认是按utf-8搞
s1 gbk 6 s.byte 8 //gbk固定2个字节中文,英文1个
s1 utf-8 6 s.byte 10 //utf8中文是不固定的,可能是2~3个。英文1个
s2 6 s.byte 6
s3 6 s.byte 18
func s1 8
func s2 6
func s3 12
所以,string.length拿到的是文字的个数;string.getByte().length根据编码来返回字节数;
使用方法函数,使用unicode探测最好。
java编码字数统计相关推荐
- Java实现字数统计(中文英文韩文日文混合),类似word效果
因为业务需求,需要一个字数统计的功能,其实这个功能也不难,但是因为这边涉及到中文,英文, 日文和韩文的混合文本,所以不能用一般的统计方法,在网上搜索了一些, 然后综合了一下自己写了个支持混合统计的工具 ...
- java统计字数_JAVA 仿 MS word 字数统计
// TODO caihao 2016-11-06 字数统计 工具类 /** * 统计字数,参照MS office word 2007规则 * @param context 文本内容 * @retur ...
- java doc字数_JAVA 仿 MS word 字数统计
// TODO caihao 2016-11-06 字数统计 工具类 /** * 统计字数,参照MS office word 2007规则 * @param context 文本内容 * @retur ...
- Hadoop 2.x MapReduce(MR V1)字数统计示例
Before reading this post, please go through my previous post at "How MapReduce Algorithm Works& ...
- 中英文字数统计以及信息熵的计算
中英文字数统计以及信息熵的计算 一.实验要求 二.功能实现 2.1实验环境 2.2统计中文小说的使用频率 2.2.1代码部分 2.2.2运行结果 2.3统计英文小说26个英文字母的使用频率 2.3.1 ...
- c语言 字数统计 字符串,基于C语言的字数统计
摘要:字数统计是文档处理中经常要用到的功能,这其中要包括英文单词.数字和中文等,而且又要和全角或半角的标点符号进行区分,故此在中英文混合文件中进行准确的字数统计也是有一定难度的.这里提出了一种较好的字 ...
- 公司让我编写一套自己的【Java 编码规范】作为员工季度考核标准?!参照Alibaba
目录 一.编码规范 (一)命名风格 (二)常量定义 (三)代码格式 (四)OOP规范 (五)集合处理 (六)并发处理 (七)控制语句 (八)注释规范 (九)其它 二.SVN操作规范 三.异常日志 (一 ...
- vue 富文本 quill 编辑器,实现图片上传到服务器,以及实时字数统计
vue 富文本 quill 编辑器,实现图片上传到服务器,以及实时字数统计 写在前面 vue 富文本 quill / vue-quill-editor 如何使用 图片上传到服务器 实时字数统计 图片编 ...
- 在线字数计算机,在线字数统计工具
字数统计工具是做什么用的? 在线字数查询工具可方便的统计出字符个数.并且能够分别统计出中文汉字,英文字符,标点符号的个数. 英文,数字:1个字节=1个字母. 汉字:2个字节=1和汉字. B(Byte, ...
最新文章
- Centos6.4 + PHP5.5.11 + Mysql5.6.16 + Tnginx2.02 + Memcached1.4.17 + Redis2.2
- .Net Core Cors中间件解析
- HDU.2561 第二小整数(water)
- 几本对于笔试和面试有用的书
- 特岗招聘计算机专业要求,咨询特岗教师招聘专业设置问题
- 【clickhouse】clickhouse表引擎之CollapsingMergeTree
- 正则表达式学习笔记011--贪婪和懒惰的匹配
- Python菜鸟入门:day05列表
- mini2440 貌似复杂的mmu
- 我的大学——不忍舍弃的回忆(3)
- Q145: 三次曲线对比及其矩阵表示(Bezier, B-Spline, Hermite, Catmull-Rom)
- mysql5.6 安装配置 老系统_mysql 5.6 从陌生到熟练之-安装配置(windows系统)
- python强行终止程序,如何终止Python脚本
- Macbook尝试破解WIFI密码
- 盘点2009:Office办公软件谁主江湖
- NRF51822基于蓝牙协议栈SDK+FDS-Flash data storage 的使用及应用例程
- 程序员纷纷“跑路”一线城市,背后的原因是?丨黑马观察
- FastqC结果简介
- python学习——HTMLParser
- 网站推荐用的软文说明