《三国演义》,《水浒传》,《西游记》的人物出场次数Python代码:

  • 经过代码运行的结果可以看出三国作者对曹操和孔明比较喜爱;水浒作者对宋江和武松比较喜爱;西游作者对齐天大圣孙悟空比较喜爱
  • 通过这类代码,我们可以看出一篇文章中作者想表达的主要的的一些东西
#三国演义
print("三国演义人物出场次数:")
import jieba                                #jieba库的应用
import time                                 #引入time库,计算下程序运行的时间
start=time.perf_counter()
txt=open("三国演义.txt","r",encoding="utf-8").read()
excludes={"将军","却说","二人","后主","上马","不知","天子","大叫","众将","不可","主公","蜀兵","只见","如何","商议","都督","一人","汉中","不敢","人马","陛下","魏兵","天下","今日","左右","东吴","于是","荆州","不能","如此","大喜","引兵","次日","军士","军马"}                #这些文字是多次程序运行所得
words=jieba.lcut(txt)
counts={}
for word in words:if len(word)==1:continueelif word=="诸葛亮" or word=="孔明曰":rword="孔明"elif word=="关公" or word=="云长":rword="关羽"elif word=="玄德" or word=="玄德曰":rword="刘备"elif word=="孟德" or word=="丞相":rword="曹操"                             #把意思相同的归为一个人else:rword=wordcounts[rword]=counts.get(rword,0)+1
for word in excludes:del counts[word]
items=list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)
for i in range(10):word,count=items[i]print("{0:<10}{1:>5}次".format(word,count))
dur=time.perf_counter()-start
print("运行时间为{:.2f}s".format(dur))
print("-----------------------------------")#水浒传
print("水浒传人物出场次数:")
import jieba
import time
start=time.perf_counter()
txt=open("水浒传.txt","r",encoding="utf-8").read()
excludes={"二人","一个","来到","人马","你们","我们","好汉","知府","什么","他们","银子","梁山","两个"}
words=jieba.lcut(txt)
counts={}
for word in words:if len(word)==1:continueelif word=="哥哥":rword="宋江"elif word=="头领":rword="林冲"else:rword=wordcounts[word]=counts.get(word,0)+1
for word in excludes:del counts[word]
items=list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)
for i in range(10):word,count=items[i]print("{0:<10}{1:>5}次".format(word,count))
dur=time.perf_counter()-start
print("运行时间为{:.2f}s".format(dur))
print("-----------------------------")#西游记
print("西游记人物出场次数:")
import jieba
import time
start=time.perf_counter()
txt=open("西游记.TXT","r",encoding="utf-8").read()
excludes={"一个","那里","怎么","我们","不知","两个","甚么","只见","不是","原来","不敢","闻言","如何"}
words=jieba.lcut(txt)
counts={}
for word in words:if len(word)==1:continueelif word=="行者" or word=="大圣" or word=="老孙":rword="悟空"elif word=="师父" or word=="三藏" or word=="长老":rword="唐僧"elif word=="和尚" or word=="呆子":rword="沙僧"else:rword=wordcounts[rword]=counts.get(rword,0)+1
for word in excludes:del counts[word]
items=list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)
for i in range(9):word,count=items[i]print("{0:<10}{1:>5}次".format(word,count))
dur=time.perf_counter()-start
print("运行时间为{:.2f}s".format(dur))

Python学习之四大名著人物出场次数Python代码相关推荐

  1. python三国演义人物出场统计ppt_Python学习之四大名著人物出场次数Python代码-Go语言中文社区...

    <三国演义>,<水浒传>,<西游记>的人物出场次数Python代码: 经过代码运行的结果可以看出三国作者对曹操和孔明比较喜爱:水浒作者对宋江和武松比较喜爱:西游作者 ...

  2. python诞生的时间地点人物事件_Python学习之四大名著人物出场次数Python代码

    <三国演义>,<水浒传>,<西游记>的人物出场次数Python代码: 经过代码运行的结果可以看出三国作者对曹操和孔明比较喜爱:水浒作者对宋江和武松比较喜爱:西游作者 ...

  3. python统计红楼梦人物出场次数_《红楼梦》人数统计,人物,出场,次数

    这个也是学习过程中的一个成果吧,希望大家能批评指正. 红楼梦人物出场次数统计.亮点在于,考虑了人物的别称,以及有较为丰富的排除词库.如凤姐的称谓就有许多,凤辣子,凤姐,王熙凤等等,还有黛玉,有林黛玉, ...

  4. python三国演义人物 统计分析_python统计三国演义人物出场次数

    [Python] 纯文本查看 复制代码import jieba excludes = {"将军", "却说", "荆州", "二人 ...

  5. Python中文分析:《射雕英雄传》统计人物出场次数、生成词云图片文件、根据人物关系做社交关系网络和其他文本分析

    前言 python中文分析作业,将对<射雕英雄传>进行中文分析,统计人物出场次数.生成词云图片文件.根据人物关系做社交关系网络和其他文本分析等. 对应内容 1.中文分词,统计人物出场次数, ...

  6. Python 三国演义文本可视化(词云,人物关系图,主要人物出场次数,章回字数)

    文章目录 效果展示 介绍 软件架构 使用说明 导入需要的库 执行main.py 这里以三国演义为例 三国演义.txt alice_mask.png 效果展示 介绍 Python读取小说文本,绘制词云图 ...

  7. 利用python语言分析小说的词频、词性、词云、小说人物出场次数排序以及小说人物关系

    1.需要准备的文件 bird.png:云底图片 sgyy.txt:三国演义原文 tingyong.txt:停用词文件 2.源代码 1.统计词频词性并写入文件中 # 贾高亮 # 时间:2023/3/21 ...

  8. Python词频统计——《红楼梦》人物出场次数统计

    代码实现 import jieba as j names = ['贾母', '贾珍', '贾蓉', '贾赦', '贾政', '袭人', '王熙凤', '紫鹃', '翠缕', '香菱','豆官', '薛 ...

  9. 小猪的Python学习之旅 —— 15.浅尝Python数据分析

    小猪的Python学习之旅 -- 15.浅尝Python数据分析:分析2018政府工作报告中的高频词 标签:Python 一句话概括本文: 爬取2018政府工作报告,通过jieba库进行分词后做词频统 ...

最新文章

  1. shell脚本中常见的一些特殊符号和作用详解
  2. 第 3 章 Keystone - 018 - 理解 Keystone 核心概念
  3. Android之內置、外置SDCard
  4. CSS3基础03(3D②) 求粉丝
  5. boost::adjacency_list用法的测试程序
  6. Apache Ignite的Node.js客户端使用入门
  7. 《ASP.NET Core 微服务实战》-- 读书笔记(第3章)
  8. Markdown编辑器模板
  9. [css] 怎样修改chrome记住密码后自动填充表单的黄色背景?
  10. springboot security 权限校验_十二、SpringBoot 优雅的集成Spring Security
  11. Python Socket编程初探
  12. git pull命令报错
  13. LIVE555play流程
  14. SVN统计一段时间的日志
  15. Android——ASM 极速上手 简单使用
  16. 扩展欧几里得模板+例题
  17. PPT流程图这样画,感动老板第一步!
  18. CentOS官网下载对应版本
  19. mysql错误1273_mysql8 参考手册--错误代码1273-1294
  20. 2019高考(高中)数学必背重点公式大全

热门文章

  1. 微小说获奖作品50则
  2. 【文学文娱】《河北省》的荣光
  3. encoder-decoder模型学习
  4. linux ghost 硬盘备份系统,使用ghost对linux进行系统备份
  5. SQL Server SA权限总结(还是在冰血blog偷的)
  6. java IO流(一)文件, InputStream,OutputStream,Reader,Writer
  7. 程序员入职软件外包公司的注意事项!!
  8. 内测“轻雀协作”,三入办公市场的快手还有机会吗?
  9. SRE之SLI/SLO设定
  10. 2022年大二学生HTML期末作业,网页制作作业(我的校园网站制作)