java匹配中文汉 字的正则表达式

发布时间:2017-11-11 16:05

来源:互联网

当前栏目:web技术类

代码如下

[u4E00-u9FA5]汉字?[uFE30-uFFA0]全角字符

[u4E00-u9FA5]汉字?[uFE30-uFFA0]全角字符

匹配中文字符的正则表达式: [u4e00-u9fa5]

匹配双字节字符(包括汉字在内):[^x00-xff]

应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 代码如下   String.prototype.len=function(){return this.replace([^x00-xff]/g,"aa").length;}

匹配空行的正则表达式:n[s| ]*r

匹配HTML标记的正则表达式:/.*|/

匹配首尾空格的正则表达式:(^s*)|(s*$)

知道它了我们就好解决了 代码如下 复制代码

public static void regxChinese(){

// 要匹配的字符串

String source = "";

// 将上面要匹配的字符串转换成小写

// source = source.toLowerCase();

// 匹配的字符串的正则表达式

String reg_charset = "]*?title='([0-9]*[s|S]*[u4E00-u9FA5]*)'[s|S]

*class='[a-z]*[s|S]*[a-z]*[0-9]*'";

Pattern p = Pattern.compile(reg_charset);

Matcher m = p.matcher(source);

while (m.find()) {

System.out.println(m.group(1));

}

}

public static void regxChinese(){

// 要匹配的字符串

String source = "";

// 将上面要匹配的字符串转换成小写

// source = source.toLowerCase();

// 匹配的字符串的正则表达式

String reg_charset = "]*?title='([0-9]*[s|S]*[u4E00-u9FA5]*)'[s|S]

*class='[a-z]*[s|S]*[a-z]*[0-9]*'";

Pattern p = Pattern.compile(reg_charset);

Matcher m = p.matcher(source);

while (m.find()) {

System.out.println(m.group(1));

}

}

Java的正则表达式是可以匹配中文字符的,同时,用中文字符来写表达式也是可以的

java正则表达式匹配中文_java匹配中文汉 字的正则表达式相关推荐

  1. java调用b超_java开源中文分词-jcseg

    jcseg是使用Java开发的一个中文分词器,使用流行的mmseg算法实现. 1.目前最高版本:jcseg 1.7.1. 兼容最高版本的lucene. 2.mmseg四种过滤算法,分词准确率达到了98 ...

  2. java校验ip格式_JAVA IP地址格式验证,使用正则表达式

    正则表达式 正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串.将匹配的子串替换或者从某个串中取出符合某个条件的子串等. ...

  3. java正则表达式匹配任意中文_java匹配中文的正则表达式

    [\u4E00-\u9FA5]汉字﹐[\uFE30-\uFFA0]全角字符 [\u4E00-\u9FA5]汉字﹐[\uFE30-\uFFA0]全角字符 所以说,Java的正则表达式是可以匹配中文字符的 ...

  4. java二进制 中文_Java 实现中文与二进制代码互转

    //将二进制字符串转化为中文 import java.util.ArrayList; import java.util.List; import java.util.regex.Matcher; im ...

  5. java二进制转为汉字_Java 实现中文与二进制代码互转

    //将二进制字符串转化为中文 import java.util.ArrayList; import java.util.List; import java.util.regex.Matcher; im ...

  6. java 字符长度 中文_java判断中文字符串长度的简单实例

    话不多说,上代码: /** * 获取字符串的长度,如果有中文,则每个中文字符计为2位 * @param value 指定的字符串 * @return 字符串的长度 */ public static i ...

  7. java web乱码问题_Java Web中文乱码问题解决

    一.为什么会出现中文乱码问题: java内核和class文件是基于unicode码的,这使Java程序具有良好的跨平台性,但也导致在Java和JSP文件在编译时以及Java程序与其他媒介交互时等情况下 ...

  8. java 拼音首字母_java获取中文拼音首字母的实例

    导读热词 正文 如下所示: import net.sourceforge.pinyin4j.PinyinHelper; public class PinyinHelperUtil { /** * 得到 ...

  9. java 显示中文_java显示中文乱码的解决方法

    java显示中文乱码的解决方法 发布时间:2020-06-16 11:08:43 来源:亿速云 阅读:97 作者:Leah 这篇文章运用简单易懂的例子给大家介绍java显示中文乱码的解决方法,代码非常 ...

最新文章

  1. 初识Tcl(二):Tcl 数据类型
  2. 如何绘制深度学习-目标检测评估指标P-R(precision-recall)曲线?如何计算AP(average-precision)?
  3. Android之Inflate()方法用途+setContentView和inflate区别
  4. Java-进阶:多线程1
  5. 将博客文章转变为电子书
  6. [vscode] markdown_index----可以为你的markdown标题添加序号的插件
  7. 详细分析谷歌紧急修复的 Chrome 0day(CVE-2021-21224)
  8. C++并发与多线程(一)线程传参
  9. 单片机用C语言锯齿波,试用c语言编写一个能输出锯齿波信号的单片机c51程序
  10. 什么软件测试情侣头像,情侣头像搜索另一半 另一半情头查找器在线匹配 - 株洲娱乐网...
  11. 【吴恩达deeplearning.ai】Course 5 - 2.10 词嵌入除偏
  12. 国开计算机专业英语答案,国开电大计算机专业英语阅读(河北)形考三参考答案...
  13. 教你用iTOL轻松绘制高颜值系统进化树
  14. VB如何自动保存_发酵鱼饵与果酸、VB小药的搭配,这才是夏季钓大鱼的必杀配方!...
  15. SpringBoot整合RabbitMQ消息队列
  16. 超简单、超实用的统计方法——因子分析
  17. 彼岸花开开彼岸,奈何桥前怎奈何
  18. 【C++】STL——string(两万字详解)
  19. Heritrix3.1 过滤url
  20. 全链路压测的大概思路

热门文章

  1. 定时自动开启和关闭Azure虚拟机
  2. iTerm 2 关闭每日提示
  3. 解决电脑不显示桌面图标问题
  4. CSS实现不规则图形的立体效果
  5. Android 自定义手势键盘
  6. itext pdf 嵌入图片问题
  7. 股票量化模型公式操作说明
  8. 股票量化怎么用?怎样才能做好量化交易?
  9. Robots协议(爬虫协议、机器人协议)
  10. Python爬虫小记(2) :抓取全国各省市疫情实时数据 绘制2019-nCoV疫情地图