本文主要向大家介绍了Python语言之用Python分析一下当年看金庸小说最爱的主角是谁,通过具体的内容向大家展示,希望对大家学习Python语言有所帮助。

jieba用起来非常简单,短短几行代码就完成了分词工作(下图),可是...仔细一看发现哪里不对了

“段誉”作为一个姓名没有被单独分出来,而是和其他一些动词连在一起,另外也有一些角色名字被拆分成了两个甚至更多的单词,例如“神仙姊姊”被分成了“神仙”和“姊姊”两个词。

不过这也难怪,中文的灵活性太强,一个词往往有多层含义和多种用法,看来直接使用jieba分词还是会有不小的误差,我们得想办法来解决这个问题,不然会对分析结果造成干扰。

现在是不是有一种“我为刀俎,它为鱼肉”的感觉了。经过简单的数据处理,我们得到了每个人物的名字在小说中出现的频次,由于萧峰和乔峰是同一个人,为了方便统计将两个名字的出场次合并。

然后取出场率排名前30位的角色数据,用图表的形式展示出来。

其实《天龙八部》的中心思想就是“求不得”:

段誉不想学武功却练成了绝世神通

一心追求王语嫣最终美人对慕容复不离不弃

萧峰立志保卫大宋没想到自己居然是契丹人

决定与阿朱塞外牧马,然而造化弄人,心爱的人却死在自己手上

这里我们仅提取词长度不小于4的成语、俗语和短语进行分析。同时,考虑到某些人名(例如:上官婉儿、澹台灭明)等专有名词会对分析结果造成干扰,在分词取词的时候可以一并过滤掉,最终得到这样一份词语文件:

2.云图

对用词习惯的分析更倾向于定性分析,我们这里使用词云图来作展示,首先绘制《萍踪侠影录》的词云图。

我们可以看到在这篇小说中“微微一笑”、“哈哈大笑”、“大吃一惊”、“非同小可”等词语使用频率非常高,再来看另一部作品《女帝奇英传》,词云图如下:

本文由职坐标整理并发布,希望对同学们学习Python有所帮助,更多内容请关注职坐标编程语言Python频道!

用python分析小说_Python语言之用Python分析一下当年看金庸小说最爱的主角是谁相关推荐

  1. python 小说人物分析_Python语言之用Python分析一下当年看金庸小说最爱的主角是谁...

    本文主要向大家介绍了Python语言之用Python分析一下当年看金庸小说最爱的主角是谁,通过具体的内容向大家展示,希望对大家学习Python语言有所帮助. jieba用起来非常简单,短短几行代码就完 ...

  2. 孔庆东看金庸小说的奇情怪恋

    孔庆东看金庸小说的奇情怪恋 主讲人简介: 孔庆东,北京大学中文系副教授.祖籍山东,系孔子第73代直系传人.1983年自哈尔滨考入北京大学中文系,钱理群先生的开山硕士.严家炎先生的博士, 主攻现代小说与 ...

  3. 从金庸小说看古代武侠世界计划生育

    当我们还在狠批马寅初的人口论,号召群众大生特生的时代,金庸已经在自己的小说中实行了严格的计划生育政策.鉴于金庸小说在宣传计划生育方面的突出贡献,有必要授予金庸计划生育先进工作者称号. 金庸小说的主要人 ...

  4. 金庸小说考试之模板方法模式学习笔记[C++版]

    /************************************************************************ * 模板方法模式学习笔记[C++] * Author ...

  5. 基于Python分析金庸小说里的主角,原来他才是真正的主角!

    粉丝独白 说起武侠小说,不得不提中国武侠小说三大宗师--金庸.梁羽生.古龙,从上世纪七八十年×××始,大量的武侠经典出现在荧幕之中.三位大师的文字作品几乎都读过,在学习Python和数据分析后又发现了 ...

  6. 视频教程-快速入门Python基础教程_Python基础知识大全-Python

    快速入门Python基础教程_Python基础知识大全 十余年计算机技术领域从业经验,在中国电信.盛大游戏等多家五百强企业任职技术开发指导顾问,国内IT技术发展奠基人之一. 杨千锋 ¥99.00 立即 ...

  7. 我们分析了金庸小说中出现的1367个人物名字,发现了一些相当惊人的事情

    如果你也想赚钱,实现财务自由,但接触不到优质的人脉和资源,可以到公June浩:成长home,发"资源" ,就会看到我吐血整理的168条保姆级零基础吸金秘籍,跟着我一起亲历毕业5年. ...

  8. 把金庸小说数据化——关于语言的思一点考

    先看几道有关金庸小说的问题: 第一题: 1.一男性角色叫她姑姑,但二者没有血缘关系: 2.她的师父是女性,师父的师父也是女性: 3.她于人情世故所知甚少,更习惯生活在原来的的环境中. 4.曾经有一位武 ...

  9. python爬取金庸小说人物

    python 爬虫 python爬取金庸小说人物 ''' 通过http://www.jinyongwang.com/data/renwu/来获取金庸小说中的人物 输出结果为 小说1 人物1 人物2 人 ...

最新文章

  1. OpenCv 金字塔之上采样与下采样
  2. Eclipse launch failed.Binary not found解决方案
  3. 开放273项AI能力,创建34万模型,汇聚265万开发者,百度大脑的2020成果一览
  4. uni-app 2.2 发布,大幅度优化 H5 端性能体验 | 技术头条
  5. Java的PDF分页操作:分页读取、分页拆分
  6. Oracle VM VirtualBox虚拟机安装Windows XP系统,在xp中多核cpu不识别问题
  7. FME实现CAD文件复杂注记
  8. 数据挖掘-朴素贝叶斯算法
  9. python列表get方法_Python json.get方法代码示例
  10. python3 模拟登陆_python3作业:模拟登录
  11. iOS面试一般性问题
  12. 每天干的啥?(2019.6)
  13. 聚类方法:DBSCAN算法研究(1)--DBSCAN原理、流程、参数设置、优缺点以及算法
  14. 红外循迹传感器PID循迹算法
  15. VVC学习之五:帧内预测——67个模式预测信号生成 predIntraAng()
  16. 标准光源与色温、波长的关系
  17. 天地图 添加遮罩层效果
  18. 蓝桥杯【历届试题】九宫重排
  19. 爬梯:Docker全解析(一)
  20. win7打开计算机有嘟嘟提示音,win7系统电脑经常出现“嘟嘟哔哔”声音的解决方法...

热门文章

  1. 如何使用文件上传实现发布朋友圈?
  2. 叭叭日记918第二天
  3. java 数字从小到大输出_Java如何实现将数字由小到大输出
  4. 教你如何将SolidWorks草图导出成CAD图纸
  5. iphone自定手机铃声
  6. Electron 添加桌面图标
  7. 为了健康,别做这19件事!
  8. 使用Python 开发录屏小工具
  9. Doze中的adb命令大全
  10. 离散数学(荣誉) 作业一