python三国演义人物 统计分析_python统计三国演义人物出场次数
[Python] 纯文本查看 复制代码import jieba
excludes = {"将军", "却说", "荆州", "二人", "不可", "不能", "如此", "商议", "如何", "主公",
"军士", "左右", "军马", "引兵", "次日", "大喜", "天下", "东吴", "于是", "今日",
"不敢", "魏兵","人马", "陛下", "一人", "不知", "汉中", "只见", "众将"} #排除
txt = open("三国演义.txt", "r", encoding="utf-8").read()
words = jieba.lcut(txt)
counts = {}
for word in words:
if len(word) == 1:
continue
elif word == "诸葛亮" or word == "孔明曰":
rword = "孔明"
elif word == "关公" or word == "云长":
rword = "关羽"
elif word == "玄德" or word == "玄德曰":
rword = "刘备"
elif word == "孟德" or word == "丞相":
rword = "曹操"
elif word == "公瑾" or word == "周都督":
rword = "周瑜"
else:
rword = word
counts[rword] = counts.get(rword, 0) + 1
#如果word在counts中,返回word对应的值,否则返回0
for word in excludes:
del(counts[word])
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)
fo = open("三国人物出场次数.txt", "a")
for i in range(10):
word, count=items[i]
word = str(word)
count = str(count)
fo.write(word)
fo.write(' ')
fo.write(count)
fo.write('\n')
print (word, count)
fo.close()
python三国演义人物 统计分析_python统计三国演义人物出场次数相关推荐
- python三国演义人物 统计分析_Python统计三国演义主要人物出场次数
import jieba #读取三国演义 with open("三国演义.txt",'r',encoding='utf-8') as f: txt= f.read() #进行中文分 ...
- python统计文件中每个单词出现的次数_Python统计单词出现的次数
题目: 统计一个文件中每个单词出现的次数,列出出现频率最多的5个单词. 前言: 这道题在实际应用场景中使用比较广泛,比如统计历年来四六级考试中出现的高频词汇,记得李笑来就利用他的编程技能出版过一本背单 ...
- python统计txt文件中不同文字出现的次数_Python统计文本词汇出现次数的实例代码...
问题描述 有时在遇到一个文本需要统计文本内词汇的次数 的时候 ,可以用一个简单的python程序来实现. 解决方案 首先需要的是一个文本文件(.txt)格式(文本内词汇以空格分隔),因为需要的是一个程 ...
- python统计字符出现的次数最多的字符_Python统计字符串中出现次数最多的人名
人名最多数统计 题目摘自https://python123.io 描述 编程模板中给出了一个字符串,其中包含了含有重复的人名,请直接输出出现最多的人名. ...
- python股票历史最低点_Python统计某一只股票每天的开盘,收盘,最高,最低价格!...
模块:Numpy 码字不易,转载请注明出处!十分感谢! 准备工作: 抓取某一只股票的信息,每30min为一组数据,可以参考上一篇: Note: 只为演示如何统计,更精准的可以抓取每5min为一组数据 ...
- python 计算数字位数_Python 统计位数为偶数的数字的代码
问题描述 给出一个整数数组 nums,请返回其中位数为偶数的数字的个数. 示例 1: 输入:nums = [12,345,2,6,7896] 输出:2 解释: 12 是 2 位数字(位数为偶数) 34 ...
- python中英文字频率_python统计文本字符串里单词出现频率的方法
本文实例讲述了python统计文本字符串里单词出现频率的方法.分享给大家供大家参考.具体实现方法如下: # word frequency in a text # tested with Python2 ...
- python中英文字频率_python 统计英语文档词汇出现频率,以六级真题为例
很多人免不了参加各种英语考试,词汇量就是参加英语考试的一个拦路虎,单词不认识,技巧再多也枉然.但考试大纲要求的单词太多了,时间紧,任务重,背了又容易忘,如果能知道真题中词汇出现的频率高低,那么有意识的 ...
- python中文词频排序_python统计词频并排序
Python 贝叶斯文本分类模型从原理到实现朴素贝叶斯分类器是一种有监督学习, 常见有两种模型, 多项式模型(multinomial model) 即为词频型和伯努利模型(Bernoulli mode ...
最新文章
- 【Verilog HDL 训练】第 13 天(存储器、SRAM)
- 若5G的速度不够:那6G和16K是必然么?
- KVO 的进一步理解
- Python dict() 函数
- ORACLE数据库管理工具EM
- ghost不要用作域控的备份
- 营销系统优惠券模板设计
- 【码学堂】教师如何在码学堂上组织教学活动?
- matlab函数结果,matlab多返回值函数怎么设定
- 进程之间究竟有哪些通信方式
- 有趣的推理html,关于有趣的推理评课稿
- halcon机器视觉实例1--表面划痕检测
- 软件包下载地址(一)
- MAC环境下Wi-Fi破解演示
- 黑马代码生成器2.5
- 连自律都做不到 还谈什么梦想
- 小程序发送模板消息form_id的获取
- Canvas 3D球形文字云动画特效
- 决策树相关算法——ID3、C4.5的详细说明及实现
- 2017 年终总结 —— 在路上
热门文章
- 通过AT指令访问SIM卡
- win32汇编 屏幕截图保存BMP 学习笔记第三篇之odbg调试
- python 创建一定区间内的满足正态分布的随机数
- [渝粤教育] 山东财经大学 数据库原理及应用 参考 资料
- 计算机输入法入门,电脑入门——第章 学习中文输入法.doc
- input 输入事件防抖
- 长沙理工计算机竞赛黑马,全国第三!长理紧跟清华、华科成最大黑马!
- js 中的in_array
- matlab画图环形颜色渐变,Core Animation实战之环形颜色渐变进度条
- 全球流媒体新巨头诞生,HBO Max 和 Discovery Plus 完成合并