用python分析小说_Python语言之用Python分析一下当年看金庸小说最爱的主角是谁
本文主要向大家介绍了Python语言之用Python分析一下当年看金庸小说最爱的主角是谁,通过具体的内容向大家展示,希望对大家学习Python语言有所帮助。
jieba用起来非常简单,短短几行代码就完成了分词工作(下图),可是...仔细一看发现哪里不对了
“段誉”作为一个姓名没有被单独分出来,而是和其他一些动词连在一起,另外也有一些角色名字被拆分成了两个甚至更多的单词,例如“神仙姊姊”被分成了“神仙”和“姊姊”两个词。
不过这也难怪,中文的灵活性太强,一个词往往有多层含义和多种用法,看来直接使用jieba分词还是会有不小的误差,我们得想办法来解决这个问题,不然会对分析结果造成干扰。
现在是不是有一种“我为刀俎,它为鱼肉”的感觉了。经过简单的数据处理,我们得到了每个人物的名字在小说中出现的频次,由于萧峰和乔峰是同一个人,为了方便统计将两个名字的出场次合并。
然后取出场率排名前30位的角色数据,用图表的形式展示出来。
其实《天龙八部》的中心思想就是“求不得”:
段誉不想学武功却练成了绝世神通
一心追求王语嫣最终美人对慕容复不离不弃
萧峰立志保卫大宋没想到自己居然是契丹人
决定与阿朱塞外牧马,然而造化弄人,心爱的人却死在自己手上
这里我们仅提取词长度不小于4的成语、俗语和短语进行分析。同时,考虑到某些人名(例如:上官婉儿、澹台灭明)等专有名词会对分析结果造成干扰,在分词取词的时候可以一并过滤掉,最终得到这样一份词语文件:
2.云图
对用词习惯的分析更倾向于定性分析,我们这里使用词云图来作展示,首先绘制《萍踪侠影录》的词云图。
我们可以看到在这篇小说中“微微一笑”、“哈哈大笑”、“大吃一惊”、“非同小可”等词语使用频率非常高,再来看另一部作品《女帝奇英传》,词云图如下:
本文由职坐标整理并发布,希望对同学们学习Python有所帮助,更多内容请关注职坐标编程语言Python频道!
用python分析小说_Python语言之用Python分析一下当年看金庸小说最爱的主角是谁相关推荐
- python 小说人物分析_Python语言之用Python分析一下当年看金庸小说最爱的主角是谁...
本文主要向大家介绍了Python语言之用Python分析一下当年看金庸小说最爱的主角是谁,通过具体的内容向大家展示,希望对大家学习Python语言有所帮助. jieba用起来非常简单,短短几行代码就完 ...
- 孔庆东看金庸小说的奇情怪恋
孔庆东看金庸小说的奇情怪恋 主讲人简介: 孔庆东,北京大学中文系副教授.祖籍山东,系孔子第73代直系传人.1983年自哈尔滨考入北京大学中文系,钱理群先生的开山硕士.严家炎先生的博士, 主攻现代小说与 ...
- 从金庸小说看古代武侠世界计划生育
当我们还在狠批马寅初的人口论,号召群众大生特生的时代,金庸已经在自己的小说中实行了严格的计划生育政策.鉴于金庸小说在宣传计划生育方面的突出贡献,有必要授予金庸计划生育先进工作者称号. 金庸小说的主要人 ...
- 金庸小说考试之模板方法模式学习笔记[C++版]
/************************************************************************ * 模板方法模式学习笔记[C++] * Author ...
- 基于Python分析金庸小说里的主角,原来他才是真正的主角!
粉丝独白 说起武侠小说,不得不提中国武侠小说三大宗师--金庸.梁羽生.古龙,从上世纪七八十年×××始,大量的武侠经典出现在荧幕之中.三位大师的文字作品几乎都读过,在学习Python和数据分析后又发现了 ...
- 视频教程-快速入门Python基础教程_Python基础知识大全-Python
快速入门Python基础教程_Python基础知识大全 十余年计算机技术领域从业经验,在中国电信.盛大游戏等多家五百强企业任职技术开发指导顾问,国内IT技术发展奠基人之一. 杨千锋 ¥99.00 立即 ...
- 我们分析了金庸小说中出现的1367个人物名字,发现了一些相当惊人的事情
如果你也想赚钱,实现财务自由,但接触不到优质的人脉和资源,可以到公June浩:成长home,发"资源" ,就会看到我吐血整理的168条保姆级零基础吸金秘籍,跟着我一起亲历毕业5年. ...
- 把金庸小说数据化——关于语言的思一点考
先看几道有关金庸小说的问题: 第一题: 1.一男性角色叫她姑姑,但二者没有血缘关系: 2.她的师父是女性,师父的师父也是女性: 3.她于人情世故所知甚少,更习惯生活在原来的的环境中. 4.曾经有一位武 ...
- python爬取金庸小说人物
python 爬虫 python爬取金庸小说人物 ''' 通过http://www.jinyongwang.com/data/renwu/来获取金庸小说中的人物 输出结果为 小说1 人物1 人物2 人 ...
最新文章
- OpenCv 金字塔之上采样与下采样
- Eclipse launch failed.Binary not found解决方案
- 开放273项AI能力,创建34万模型,汇聚265万开发者,百度大脑的2020成果一览
- uni-app 2.2 发布,大幅度优化 H5 端性能体验 | 技术头条
- Java的PDF分页操作:分页读取、分页拆分
- Oracle VM VirtualBox虚拟机安装Windows XP系统,在xp中多核cpu不识别问题
- FME实现CAD文件复杂注记
- 数据挖掘-朴素贝叶斯算法
- python列表get方法_Python json.get方法代码示例
- python3 模拟登陆_python3作业:模拟登录
- iOS面试一般性问题
- 每天干的啥?(2019.6)
- 聚类方法:DBSCAN算法研究(1)--DBSCAN原理、流程、参数设置、优缺点以及算法
- 红外循迹传感器PID循迹算法
- VVC学习之五:帧内预测——67个模式预测信号生成 predIntraAng()
- 标准光源与色温、波长的关系
- 天地图 添加遮罩层效果
- 蓝桥杯【历届试题】九宫重排
- 爬梯:Docker全解析(一)
- win7打开计算机有嘟嘟提示音,win7系统电脑经常出现“嘟嘟哔哔”声音的解决方法...