统计《西游记》中大圣出现的次数
需要提前掌握的知识点:
一、文件的打开方式(with open)
二、文件的readlines()方法(返回一个字符串列表)
三、正则表达式re.split()方法分割字符串为字符串列表
四、in关键字来判断一个字符串是否在另外一个字符串中
五、for循环和if语句的灵活运用
import re
with open('./xiyouji.txt','r',encoding = 'utf-8') as f:paragraphs = f.readlines()
'''p通过readlines函数获得了一个列表,西游记全文中的每一段话都是列表中的一个元素注意这里段落的分割是根据回车键丫就是'\n'作为标志的
''' ```python
target = '大圣'
counter= 0
word_num = 0
for paragraph in paragraphs:sentences = re.split('。|!|,|:|“|”|?| |;',paragraph)#通过正则表达式,用多个分隔符号,分割paragraph中的字符串为字符串列表for sentence in sentences:sentence = sentence.strip()if target in sentence:counter += 1print(sentence)
print(f'{target}一共出现了{counter}次')
运行结果:
可以看到,大圣一词在西游记中一共出现了1270次。
当然,我们也可以使用jieba分词来一次性搞定:
import jieba
with open('./xiyouji.txt','r',encoding='utf-8') as f:xyj_text = f.read()
word_list = list(jieba.cut(xyj_text))
target = '大圣'
count = 0
for word in word_list:if target in word:count += 1
print(f'{target}出现的次数是:{count}')
运行的结果为:
统计《西游记》中大圣出现的次数相关推荐
- python统计西游记人物名字出现次数_Python文本统计功能之西游记用字统计操作示例...
本文实例讲述了Python文本统计功能之西游记用字统计操作.分享给大家供大家参考,具体如下: 一.数据 xyj.txt,<西游记>的文本,2.2MB 致敬吴承恩大师,4020行(段) 二. ...
- python词频统计西游记_使用python简单实现《西游记》文本分析,通过词频对比探索西游记的主角...
使用jieba模块简单统计西游记词频,并进行同义词处理(如合并 行者,大圣为悟空)及排除词处理. [code]import jieba with open('西游记.txt','r',encoding ...
- python如何统计出现的次数_Python统计日志中每个IP出现次数的方法
本文实例讲述了Python统计日志中每个IP出现次数的方法.分享给大家供大家参考.具体如下: 这脚本可用于多种日志类型,本人测试MDaemon的all日志文件大小1.23G左右,分析用时2~3分钟 代 ...
- c++ map 修改value_干货 | 名企高频考点如何使用map统计字符串各个字符出现的次数...
点击蓝字关注我哦 以下是本期干货视频视频后还附有文字版本哦▼<名企高频考点-如何使用map统计字符串各个字符出现的次数>▼ps:请在WiFi环境下打开,如果有钱任性请随意有某公司这样一道笔 ...
- 主表如何统计在附表中的出现次数?
主表如何统计在附表中的出现次数? 建立主表: create table a1 (id int ,name char(20)); 建立附表: create table a2 (tid int ,name ...
- JS 统计字符串中大小写字母个数
JS 统计字符串中大小写字母个数 注:字母a-z的code为97 - 122,A-Z的code为65 - 90 这很重要.不过记不住也没关系 let str = 'naAZiHesnKuanzgA'c ...
- python统计单词出现次数最多的5个单词_【Python】统计文本中单词的出现次数前十的单词...
代码: # 读取一个文本,并且统计文本中单词的出现次数 def read_file(): # 在windows环境中的编码问题,指定utf-8 with open('F:/python源码/实验区/0 ...
- linux字符串排序文件,Linux awk+uniq+sort 统计文件中某字符串出现次数并排序
https://blog.csdn.net/qq_28766327/article/details/78069989 在服务器开发中,我们经常会写入大量的日志文件.有时候我们需要对这些日志文件进行统计 ...
- 统计中文文本中人物出现次数
大家好,今天跟大家介绍一下如何统计文本中人物出现的次数? 共现关系 统计人物出现次数和人物关系输出到文件 一.共现关系: 在文献计量学中,关键词的共词方法常用来确定该文献集所代表学科中各主题之 ...
最新文章
- 简单 描述oracle 存储结构,下面的各选项中哪一个正确描述了
- COCO数据集数据转换为XML格式
- 同步模式下的端口映射程序
- Asp.Net Core 通过中间件防止图片盗链
- [Qt] 利用QtWebKit完成JavaScript访问C++对象
- Java基础篇:什么是线程优先级?
- Project Euler 66: Diophantine equation
- linux嵌入式开发从入门到精通
- 浅谈计算机软硬件的日常维修与维护,浅谈计算机硬件的日常维护工作
- adb连接Android设备使用screenrecord命令录屏和screencap命令截屏
- 计算机管理的事件id,事件ID6009,6006检测电脑开关机时间
- 自然语言处理(NLP)概论
- 南卡OE Pro上线!开放式耳机新里程碑!前所未有的音质舒适双冠
- 使用ip小魔棒让外部网络访问内网中的资源
- jni in linux
- 批量抓取东方财富EastMoney的宏观经济数据
- 1-网络字节序和ip地址
- c语言实现进行偶数素数分解
- C语言和C++关键字总结——一篇就够了
- Solaris/Linux 命令手册