Python练习5-正则表达式
第 0004 题:任一个英文的纯文本文件,统计其中的单词出现的个数。
这道题题意很模糊,统计“单词”其实很复杂,因为需要词典才能知道一个词到底是不是单词,这里应该就是简单的连续英文字母在一块就算一个单词(个人理解),使用正则表达式很简单。
正则表达式很简单,就是东西太多记不住,每次使用都得看一遍,这里有一篇挺好的深入理解正则表达式
下面是代码:
#coding=utf-8
import ref=open('d:/log/test.txt').read()
regular=r'\b[a-zA-Z]+\b'result=re.findall(regular,f)
print len(result)#查看下匹配到的是不是单词
print result
转载于:https://www.cnblogs.com/InitialD/p/7348880.html
Python练习5-正则表达式相关推荐
- Python中re(正则表达式)模块函数学习
2019独角兽企业重金招聘Python工程师标准>>> Python正则表达式指南 今天学习了Python中有关正则表达式的知识.关于正则表达式的语法,不作过多解释,网上有许多学习的 ...
- Python字符串和正则表达式中的反斜杠(‘\‘)问题
在Python普通字符串中 在Python中,我们用''来转义某些普通字符,使其成为特殊字符,比如 In [1]: print('abc\ndef') # '\n'具有换行的作用 abc defgIn ...
- Python高级语法-正则表达式
正则表达式在字符串匹配中起到巨大的作用. 简介 几个数据提取工具对比: re(正则表达式):速度很快,难度高(语法难记),不需要安装(python标准库内置) bs(BeautifulSoup):速度 ...
- python里面的正则表达式_Python中的正则表达式
以下内容转自:http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html 1. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Pyth ...
- [Python]网络爬虫(七):Python中的正则表达式教程(转)
接下来准备用糗百做一个爬虫的小例子. 但是在这之前,先详细的整理一下Python中的正则表达式的相关内容. 正则表达式在Python爬虫中的作用就像是老师点名时用的花名册一样,是必不可少的神兵利器. ...
- [Python]网络爬虫(七):Python中的正则表达式教程
接下来准备用糗百做一个爬虫的小例子. 但是在这之前,先详细的整理一下Python中的正则表达式的相关内容. 正则表达式在Python爬虫中的作用就像是老师点名时用的花名册一样,是必不可少的神兵利器. ...
- python中的正则表达式是干嘛的_python中正则表达式总结
re.match():从字符串的开始进行匹配 re.search():扫描整个字符串返回第一个匹配 re.findAll():返回所有匹配的字符串 Pattern 对象不能实例化,只能通过compil ...
- python里面的正则表达式
python里面的正则表达式与php稍显不同:1.表达式不用/开头和结尾,若是加上/会报错.2.python里面的匹配结果在a.group()中,类似与php preg_match函数里面的$matc ...
- python 学习总结----正则表达式
python 学习总结----正则表达式 正则表达式应用场景- 特定规律字符串的查找,切割,替换 - 邮箱格式:URl,IP地址等的校验 - 爬虫项目中,特定内容的提取使用原则- 只要使用字符串等函数 ...
- 【Python笔记】正则表达式
正则表达式 行定位符 元字符 限定符 字符类 排除字符 选择字符 转义字符 分组 在 Python 中使用正则表达式语法 行定位符 行定位符就是用来描述子串的边界. "^" 表示行 ...
最新文章
- matlab 画一个矩形
- bzoj4196:[Noi2015]软件包管理器
- VS2005 there is no source code available for the current location 解决方案
- PHP中逻辑运算符的高效用法---和||
- 20个优秀的前端css框架
- html+css基础-1-屏幕居中、双飞翼布局、清除浮动
- vue 关于飞行地图展示的功能
- mysql数据库木马查杀_服务器木马后门怎么查杀
- 泰坦尼克号生存预测python_用Python预测泰坦尼克号生存情况
- 中关村GHOST WIN7 SP1旗舰版
- html链接屏蔽了,js屏蔽广告/屏蔽网站元素/屏蔽网站超链接
- Done、Doing、ToDo
- 烽火移动设备管理:企业安全管理无处遁形
- 计算机二级Java考试笔记
- 服务器远程管理(远程桌面(图形) telnet(命令行))
- UVA 1025 紫书练习题 动态规划
- 内蒙古大学计算机考研复试分数线,内蒙古大学2016年考研复试分数线
- 在Watir中调用JavaScript脚本
- 一周跑步锻炼总结(100301——100307)
- 4月12日 | 【NDSS 2020】FUSE: Finding File Upload Bugs via Penetration Testing