在中文分词的过程中需要将英文,数字,汉字分离,数字和英文就不用分割了,主要是将分离出来的汉字进行分词,下面的算法实现利用正则表达式分离汉字、英文、数字:

//获取中文
string chRegS = @"[\u4e00-\u9fa5]+";
Regex chRegR = new Regex(chRegS);
Match chMacth = chRegR.Match(str);
while(chMacth.Success)
{
CHresult.Add(chMacth.ToString());
chMacth = chMacth.NextMatch();
}
//英文
string enRegS = @"[a-zA-Z]+";
Regex enRegR = new Regex(enRegS);
Match enMatch = enRegR.Match(str);
while (enMatch.Success)
{
Enresult.Add(enMatch.ToString());
enMatch = enMatch.NextMatch();
}
//数字
string numRegS = @"\d+";
Regex numRegR = new Regex(numRegS);
Match numMatch = numRegR.Match(str);
while (numMatch.Success)
{
Numresult.Add(numMatch.ToString());
numMatch = numMatch.NextMatch();
}

测试字符串:“可复用的WPF或者Silverlight应用程序和组件设计(3)——控件级别”

结果:

利用正则表达式分离汉字、英文、数字相关推荐

  1. 正则表达式匹配汉字/英文(数字)

    匹配条件 只能包含汉字.英文.数字 汉字英文必须存在其中一个 数字任意 正则表达式 /^[0-9]*([A-Za-z]|[\u4E00-\u9FA5])+[0-9A-Za-z\u4E00-\u9FA5 ...

  2. Python小技巧:判断输入是否为汉字/英文/数字

    Python判断输入是否为汉字/英文/数字 1. 判断输入是否为汉字 2. 判读是否为英文 3. 判断是否为数字 1. 判断输入是否为汉字 定义函数is_chinese,输入为字符串,该函数通过遍历字 ...

  3. 经典:统计字符串中汉字,英文,数字,特殊符号个数

    经典:统计字符串中汉字,英文,数字,特殊符号个数 package wzs.arithmetics;/*** 分别统计出其中字符串中汉字,英文字母,数字,其他字符数量* @author wWX15478 ...

  4. 好用的汉字 英文 数字 符号 统计器 还可自动搜寻文本里的数字相加

    汉字英文数字符号统计器,以前有需要用的时候,找篇了整个网络都没找到,今日得闲自己写了一个,将其分享出来,希望能帮到有用得着的人. 汉字英文数字符号统计器的操作简单明了,直接把要统计的内容复制到软件的文 ...

  5. 正则表达式替换全部 中文汉字 英文 数字

    简单说明下用正则表达式替换全部中文汉字.英文.数字的方法 . 使用工具,Notepad2(或者支持正则表达式的都可以) 替换表达式: [a-zA-Z]+ [!^1-^127] 英文 数字 所有小写英文 ...

  6. 纯英文换行的css,利用CSS实现纯英文数字自动换行

    下面为大家带来一篇CSS代码使纯英文数字自动换行的简单实现.内容挺不错的,现在就分享给大家,也给大家做个参考. 当一个定义了宽度的块状元素中填充的全部为纯英文或者纯数字的时候,在IE和FF中都会撑大容 ...

  7. 字符串汉字英文数字判断

    在项目中用到过.在字符串中有标点或其它字符,而只需要得到数字,汉字,英文这三种字符,所以需要过滤一下,代码如下. /** * @找出字串中的数字英文中文 * @param s * @return */ ...

  8. java 正则表达式只有中文汉字英文数字

    //匹配汉字和英文public static String getChinese(String paramValue) {String regex = "[a-zA-Z0-9\\u4E00- ...

  9. .net 数字转汉字_[原创工具] 小熊汉字笔顺学习软件,查笔顺、学拼音、制作汉字英文数字字贴...

    点击右上角"设为星标"每日精彩内容,第一时间送达! 前言 今天带来的是原创软件.家里有上一二年级的小朋友有福了!家里有打印机的可以把设置好的字帖打印出来,小朋友即可临摹.赶紧下载使 ...

最新文章

  1. android studio同步代码块,Android Studio快捷键大全
  2. OpenGL shader class自定义着色器的实例
  3. 安装VS2013的离线MSDN帮助文档
  4. 圆桌对话:数字化升级,视频通信云赋能全行业
  5. C++ 基础知识!初学者必看!
  6. [蓝桥杯2016初赛]方格填数-next_permutation
  7. 图解python pdf_Python合并同一个文件夹下所有PDF文件的方法
  8. 区块如何防篡改_深入浅出:一条数据是如何完成上链的
  9. 使用了未经检查或不安全的操作_违规操作就是对家庭的不负责!电气安全员提醒你的安全常识...
  10. python 货币合适_算法之Python实现 - 001 : 换钱的最少货币数
  11. python实现小型搜索引擎设计_Python实现:设计克隆模式
  12. 联合分布及其随机变量
  13. 天然气压缩因子计算软件_为什么测量天然气选择气体涡轮流量计?
  14. ubuntu系统上进行usb相机端口绑定
  15. AMiner 会议论文推荐第十四期
  16. 计算机超级皇冠关键词是什么,搜狗推广服务
  17. 笔记本清理风扇和散热片灰尘
  18. 洛谷P2437 蜜蜂路线
  19. java中Scanner用法
  20. 二叉树的ZigZag打印-Java

热门文章

  1. 关于黑马-Vue电商后台项目管理(2)
  2. RISC之Alpha
  3. fatal error C1189: #error: OpenGL header already included, remove this include, glad already provid
  4. springSecurity 常用安全功能汇总(含案例分析)
  5. PostgreSql简介
  6. 华为三层交换机路由配置案例_华为 三层交换机VLAN间路由配置详解
  7. 区块链被过度“炒作” 市场需削弱过度消耗的趋势
  8. 继承和多态(水果和香蕉)
  9. 陈福云北京个人演唱会精彩上演 用歌声传递家乡美
  10. phpexcel安装于使用