第 0004 题:任一个英文的纯文本文件,统计其中的单词出现的个数。

这道题题意很模糊,统计“单词”其实很复杂,因为需要词典才能知道一个词到底是不是单词,这里应该就是简单的连续英文字母在一块就算一个单词(个人理解),使用正则表达式很简单。

正则表达式很简单,就是东西太多记不住,每次使用都得看一遍,这里有一篇挺好的深入理解正则表达式

下面是代码:

#coding=utf-8
import ref=open('d:/log/test.txt').read()
regular=r'\b[a-zA-Z]+\b'result=re.findall(regular,f)
print len(result)#查看下匹配到的是不是单词
print result

转载于:https://www.cnblogs.com/InitialD/p/7348880.html

Python练习5-正则表达式相关推荐

  1. Python中re(正则表达式)模块函数学习

    2019独角兽企业重金招聘Python工程师标准>>> Python正则表达式指南 今天学习了Python中有关正则表达式的知识.关于正则表达式的语法,不作过多解释,网上有许多学习的 ...

  2. Python字符串和正则表达式中的反斜杠(‘\‘)问题

    在Python普通字符串中 在Python中,我们用''来转义某些普通字符,使其成为特殊字符,比如 In [1]: print('abc\ndef') # '\n'具有换行的作用 abc defgIn ...

  3. Python高级语法-正则表达式

    正则表达式在字符串匹配中起到巨大的作用. 简介 几个数据提取工具对比: re(正则表达式):速度很快,难度高(语法难记),不需要安装(python标准库内置) bs(BeautifulSoup):速度 ...

  4. python里面的正则表达式_Python中的正则表达式

    以下内容转自:http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html 1. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Pyth ...

  5. [Python]网络爬虫(七):Python中的正则表达式教程(转)

    接下来准备用糗百做一个爬虫的小例子. 但是在这之前,先详细的整理一下Python中的正则表达式的相关内容. 正则表达式在Python爬虫中的作用就像是老师点名时用的花名册一样,是必不可少的神兵利器. ...

  6. [Python]网络爬虫(七):Python中的正则表达式教程

    接下来准备用糗百做一个爬虫的小例子. 但是在这之前,先详细的整理一下Python中的正则表达式的相关内容. 正则表达式在Python爬虫中的作用就像是老师点名时用的花名册一样,是必不可少的神兵利器. ...

  7. python中的正则表达式是干嘛的_python中正则表达式总结

    re.match():从字符串的开始进行匹配 re.search():扫描整个字符串返回第一个匹配 re.findAll():返回所有匹配的字符串 Pattern 对象不能实例化,只能通过compil ...

  8. python里面的正则表达式

    python里面的正则表达式与php稍显不同:1.表达式不用/开头和结尾,若是加上/会报错.2.python里面的匹配结果在a.group()中,类似与php preg_match函数里面的$matc ...

  9. python 学习总结----正则表达式

    python 学习总结----正则表达式 正则表达式应用场景- 特定规律字符串的查找,切割,替换 - 邮箱格式:URl,IP地址等的校验 - 爬虫项目中,特定内容的提取使用原则- 只要使用字符串等函数 ...

  10. 【Python笔记】正则表达式

    正则表达式 行定位符 元字符 限定符 字符类 排除字符 选择字符 转义字符 分组 在 Python 中使用正则表达式语法 行定位符 行定位符就是用来描述子串的边界. "^" 表示行 ...

最新文章

  1. matlab 画一个矩形
  2. bzoj4196:[Noi2015]软件包管理器
  3. VS2005 there is no source code available for the current location 解决方案
  4. PHP中逻辑运算符的高效用法---和||
  5. 20个优秀的前端css框架
  6. html+css基础-1-屏幕居中、双飞翼布局、清除浮动
  7. vue 关于飞行地图展示的功能
  8. mysql数据库木马查杀_服务器木马后门怎么查杀
  9. 泰坦尼克号生存预测python_用Python预测泰坦尼克号生存情况
  10. 中关村GHOST WIN7 SP1旗舰版
  11. html链接屏蔽了,js屏蔽广告/屏蔽网站元素/屏蔽网站超链接
  12. Done、Doing、ToDo
  13. 烽火移动设备管理:企业安全管理无处遁形
  14. 计算机二级Java考试笔记
  15. 服务器远程管理(远程桌面(图形) telnet(命令行))
  16. UVA 1025 紫书练习题 动态规划
  17. 内蒙古大学计算机考研复试分数线,内蒙古大学2016年考研复试分数线
  18. 在Watir中调用JavaScript脚本
  19. 一周跑步锻炼总结(100301——100307)
  20. 4月12日 | 【NDSS 2020】FUSE: Finding File Upload Bugs via Penetration Testing

热门文章

  1. matlab对比r语言,R语言与matlab循环时间对比
  2. gRPC 1.20.1 发布,谷歌开源的高性能 RPC 框架
  3. Java 集合系列Stack详细介绍(源码解析)和使用示例
  4. 当万物互联触手可及 你准备好了吗?
  5. 一起talk C栗子吧(第二十七回:C语言实例--插入排序)
  6. Codeforces Round #371 (Div. 2)
  7. ios icon尺寸问题
  8. [翻译] SSKeychain
  9. GIT在Linux上的安装和使用简介
  10. 团购的野心,占领网购市场半壁江山?