java正则表达式匹配中文_java匹配中文汉 字的正则表达式
java匹配中文汉 字的正则表达式
发布时间:2017-11-11 16:05
来源:互联网
当前栏目:web技术类
代码如下
[u4E00-u9FA5]汉字?[uFE30-uFFA0]全角字符
[u4E00-u9FA5]汉字?[uFE30-uFFA0]全角字符
匹配中文字符的正则表达式: [u4e00-u9fa5]
匹配双字节字符(包括汉字在内):[^x00-xff]
应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 代码如下 String.prototype.len=function(){return this.replace([^x00-xff]/g,"aa").length;}
匹配空行的正则表达式:n[s| ]*r
匹配HTML标记的正则表达式:/.*|/
匹配首尾空格的正则表达式:(^s*)|(s*$)
知道它了我们就好解决了 代码如下 复制代码
public static void regxChinese(){
// 要匹配的字符串
String source = "";
// 将上面要匹配的字符串转换成小写
// source = source.toLowerCase();
// 匹配的字符串的正则表达式
String reg_charset = "]*?title='([0-9]*[s|S]*[u4E00-u9FA5]*)'[s|S]
*class='[a-z]*[s|S]*[a-z]*[0-9]*'";
Pattern p = Pattern.compile(reg_charset);
Matcher m = p.matcher(source);
while (m.find()) {
System.out.println(m.group(1));
}
}
public static void regxChinese(){
// 要匹配的字符串
String source = "";
// 将上面要匹配的字符串转换成小写
// source = source.toLowerCase();
// 匹配的字符串的正则表达式
String reg_charset = "]*?title='([0-9]*[s|S]*[u4E00-u9FA5]*)'[s|S]
*class='[a-z]*[s|S]*[a-z]*[0-9]*'";
Pattern p = Pattern.compile(reg_charset);
Matcher m = p.matcher(source);
while (m.find()) {
System.out.println(m.group(1));
}
}
Java的正则表达式是可以匹配中文字符的,同时,用中文字符来写表达式也是可以的
java正则表达式匹配中文_java匹配中文汉 字的正则表达式相关推荐
- java调用b超_java开源中文分词-jcseg
jcseg是使用Java开发的一个中文分词器,使用流行的mmseg算法实现. 1.目前最高版本:jcseg 1.7.1. 兼容最高版本的lucene. 2.mmseg四种过滤算法,分词准确率达到了98 ...
- java校验ip格式_JAVA IP地址格式验证,使用正则表达式
正则表达式 正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串.将匹配的子串替换或者从某个串中取出符合某个条件的子串等. ...
- java正则表达式匹配任意中文_java匹配中文的正则表达式
[\u4E00-\u9FA5]汉字﹐[\uFE30-\uFFA0]全角字符 [\u4E00-\u9FA5]汉字﹐[\uFE30-\uFFA0]全角字符 所以说,Java的正则表达式是可以匹配中文字符的 ...
- java二进制 中文_Java 实现中文与二进制代码互转
//将二进制字符串转化为中文 import java.util.ArrayList; import java.util.List; import java.util.regex.Matcher; im ...
- java二进制转为汉字_Java 实现中文与二进制代码互转
//将二进制字符串转化为中文 import java.util.ArrayList; import java.util.List; import java.util.regex.Matcher; im ...
- java 字符长度 中文_java判断中文字符串长度的简单实例
话不多说,上代码: /** * 获取字符串的长度,如果有中文,则每个中文字符计为2位 * @param value 指定的字符串 * @return 字符串的长度 */ public static i ...
- java web乱码问题_Java Web中文乱码问题解决
一.为什么会出现中文乱码问题: java内核和class文件是基于unicode码的,这使Java程序具有良好的跨平台性,但也导致在Java和JSP文件在编译时以及Java程序与其他媒介交互时等情况下 ...
- java 拼音首字母_java获取中文拼音首字母的实例
导读热词 正文 如下所示: import net.sourceforge.pinyin4j.PinyinHelper; public class PinyinHelperUtil { /** * 得到 ...
- java 显示中文_java显示中文乱码的解决方法
java显示中文乱码的解决方法 发布时间:2020-06-16 11:08:43 来源:亿速云 阅读:97 作者:Leah 这篇文章运用简单易懂的例子给大家介绍java显示中文乱码的解决方法,代码非常 ...
最新文章
- 初识Tcl(二):Tcl 数据类型
- 如何绘制深度学习-目标检测评估指标P-R(precision-recall)曲线?如何计算AP(average-precision)?
- Android之Inflate()方法用途+setContentView和inflate区别
- Java-进阶:多线程1
- 将博客文章转变为电子书
- [vscode] markdown_index----可以为你的markdown标题添加序号的插件
- 详细分析谷歌紧急修复的 Chrome 0day(CVE-2021-21224)
- C++并发与多线程(一)线程传参
- 单片机用C语言锯齿波,试用c语言编写一个能输出锯齿波信号的单片机c51程序
- 什么软件测试情侣头像,情侣头像搜索另一半 另一半情头查找器在线匹配 - 株洲娱乐网...
- 【吴恩达deeplearning.ai】Course 5 - 2.10 词嵌入除偏
- 国开计算机专业英语答案,国开电大计算机专业英语阅读(河北)形考三参考答案...
- 教你用iTOL轻松绘制高颜值系统进化树
- VB如何自动保存_发酵鱼饵与果酸、VB小药的搭配,这才是夏季钓大鱼的必杀配方!...
- SpringBoot整合RabbitMQ消息队列
- 超简单、超实用的统计方法——因子分析
- 彼岸花开开彼岸,奈何桥前怎奈何
- 【C++】STL——string(两万字详解)
- Heritrix3.1 过滤url
- 全链路压测的大概思路