词云分析《天龙八部》人物出现次数
一.需要的三方库
1.安装词云:
pip install wordcloud
2.安装结巴
pip install jieba
3.安装matplotlib
pip install matplotlib
二.实现代码
1 import jieba # 分词函数 2 from scipy.misc import imread # 这是一个处理图像的函数 3 from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator 4 import matplotlib.pyplot as plt # 分析数据的函数 5 6 file_apath = open('tlbb.txt','r',encoding='UTF-8').read() # 打开文件 7 bg_pic = imread('map.jpg') # 图片路径 8 9 # 王语嫣, 慕容复, 木婉清, 游坦之, 鸠摩智, 段延庆,包不同, 丁春秋, 阿紫, 阿朱, 段正淳, 钟万洪, 风波恶, 天山童姥, 耶律洪基........... 10 11 jieba.add_word('乔峰') # 添加关键词 12 jieba.add_word('段誉') 13 jieba.add_word('虚竹') 14 15 jieba.add_word('王语嫣') 16 jieba.add_word('慕容复') 17 jieba.add_word('木婉清') 18 jieba.add_word('段正淳') 19 jieba.add_word('鸠摩智') 20 jieba.add_word('游坦之') 21 jieba.add_word('包不同') 22 jieba.add_word('钟万洪') 23 jieba.add_word('耶律洪基') 24 jieba.add_word('萧峰') 25 jieba.add_word('南海恶神') 26 jieba.add_word('阿朱') 27 jieba.add_word('钟灵') 28 jieba.add_word('阿碧') 29 jieba.add_word('阿紫') 30 jieba.add_word('玄慈') 31 32 33 34 35 wordlist_jieba = jieba.cut(file_apath, cut_all = True) # 使用jieba分词 36 world_split = " ".join(wordlist_jieba) # 分词后的数据 37 38 39 my_wordcloud = WordCloud(background_color='white', # 设置背景色 40 max_font_size=50, # 字体大小 41 width=2100, height=1400,margin=2, # 图片的宽,高,和边距 42 mask=bg_pic, # 设置背景图片 43 font_path="C:/Windows/Fonts/simhei.ttf"# 设置字体路径 44 # random_state=42, 45 ) 46 # 屏蔽关键词 47 stopwords=STOPWORDS.add('自己') 48 stopwords=STOPWORDS.add('说道') 49 stopwords=STOPWORDS.add('什么') 50 stopwords=STOPWORDS.add('他们') 51 stopwords=STOPWORDS.add('一个') 52 stopwords=STOPWORDS.add('不是') 53 stopwords=STOPWORDS.add('便是') 54 stopwords=STOPWORDS.add('甚么') 55 stopwords=STOPWORDS.add('不知') 56 stopwords=STOPWORDS.add('咱们') 57 stopwords=STOPWORDS.add('我们') 58 stopwords=STOPWORDS.add('可是') 59 stopwords=STOPWORDS.add('只是') 60 stopwords=STOPWORDS.add('如此') 61 stopwords=STOPWORDS.add('这些') 62 stopwords=STOPWORDS.add('倘若') 63 stopwords=STOPWORDS.add('怎么') 64 stopwords=STOPWORDS.add('这么') 65 66 67 my_wordcloud.generate(world_split) # 生成词云 68 image_colors = ImageColorGenerator(bg_pic) # 转换字体主题色与图片一致 69 # 绘制词云 70 plt.figure() 71 plt.imshow(my_wordcloud.recolor(color_func=image_colors)) 72 plt.title('Word Cloud') # 词云标题 73 plt.axis("off") # 关闭词云 74 plt.show() # 显示生成的词云图片 75 my_wordcloud.to_file('ciyun.png') # 保存图片
三.实现效果
转载于:https://www.cnblogs.com/kadycui/p/9588942.html
词云分析《天龙八部》人物出现次数相关推荐
- 利用python语言分析小说的词频、词性、词云、小说人物出场次数排序以及小说人物关系
1.需要准备的文件 bird.png:云底图片 sgyy.txt:三国演义原文 tingyong.txt:停用词文件 2.源代码 1.统计词频词性并写入文件中 # 贾高亮 # 时间:2023/3/21 ...
- 大江大河2弹幕数据之词云分析、情感极性分析、主题分析、共现网络分析
最近,自己在疯狂追<大江大河2>这部剧,作为当下最热门的电视剧之一,这部电视剧深受观众的喜爱,自从播出以后就好评不断 它主要讲述了改革开放三十年,一代人奋斗向阳的故事,看完之后深受启发,特 ...
- jieba库词频统计_如何用python对《三国演义》、《红楼梦》等名著开展词云分析及字频统计、出场统计等工作。...
以下以<红楼梦>为例进行设计. 在制作词云图及统计之前,需要下载python的几个库,wordcloud.jieba以及imageio等,我的操作系统为Windows10,IDE环境为id ...
- 词云分析案例_品牌案例中的案例研究词
词云分析案例 A close-up look at Friday's design process. 近看星期五的设计过程. WORDS IN THE WILD IS A BAY-AREA NONPR ...
- python词云代码手机_【云计算】爬取淘宝手机品牌词云分析(python)
本文主要向大家介绍了[云计算]爬取淘宝手机品牌词云分析(python),通过具体的内容向大家展现,希望对大家学习云计算有所帮助. 淘宝手机信息的爬取,请看这边博客(点击这里),然后我们利用其中保存的文 ...
- NO.16——Pathon爬取杨超越新浪微博数据做词云分析
看到网上充斥着很多词云分析的资料,今天心血来潮,也尝试下词云分析.最近热火的<创造101>,杨超越小姐姐一直在风口浪尖,因此这里借用小姐姐的微博数据做分析. 一.准备工具 作词云分析主要用 ...
- python词云分析--媒体近期的讨论热点
目录 背景 词云的定义 词云的创建 背景 据社交媒体研究机构Shareablee统计的数据显示,近期社交媒体已经超过网络搜索,成为人们消遣和了解疫情的首要渠道. 作为数据分析小白,为了初探疫情下的媒体 ...
- Java后端以及web前端及echarts框架词云分析
运用Java后端以及web前端及echarts框架词云分析做出数据分析统计可视化展示. 以下为我的项目展示截图: 开发环境: 集成开发环境(IDE):IntelliJ IDEA 2021 服务器:To ...
- python歌词分析_Python 词云分析周杰伦新歌《说好不哭》
周杰伦难得出新歌 ,最近终于推出了单曲<说好不哭>,然后直接把QQ音乐服务器干崩了,天王的实力可见一斑,QQ音乐还把这个当作 今天过年 看我公众号头像就知道是杰伦粉了 ,高中的时候开始喜欢 ...
- Python 词云分析周杰伦新歌《说好不哭》
周杰伦难得出新歌 ,最近终于推出了单曲<说好不哭>,然后直接把QQ音乐服务器干崩了,天王的实力可见一斑,QQ音乐还把这个当作 看我公众号头像就知道是杰伦粉了 ,高中的时候开始喜欢上了他的歌 ...
最新文章
- python按行读取文件取消空白行_python按行读取文件 如何去掉换行符 \n
- 潍坊市计算机专业招聘,潍坊市工业学校计算机专业介绍
- 网页调用摄像头_【WebAR】虚拟现实来到网页——WebXR Device API第二部分
- 【转】python装饰器
- activiti 5.22的demo运行
- 安卓手机主题软件_类似主题软件下载-类似主题安卓官方版下载v2.6.6.3
- 维珍银河创始人布兰森成功进入太空 早于贝佐斯9天
- 北京大兴国际机场官微追星蔡徐坤,网友大怒,官方道歉...
- Android 标题栏(2)
- top 显示按照内存、CPU排序
- vi命令下编辑文件时,按insert键文件底部不出现“INSERT”问题
- keystone WSGI流程
- 逐点插入法-delaunay三角剖分
- 测序 测序过程和原理
- 如何寻求知识产权的刑事救济
- C语言零基础项目:打字母游戏!详细思路+源码分享
- Intellij IDEA 在win10 中输入法的输出框不跟随
- Executor框架-Executors
- datawhale组队学习task9—文件与文件系统
- BAT包围下的企业协作与通信之道
热门文章
- java.lang.ClassNotFoundException: Cannot find class:×××
- DC反标 翻转率文件[Modelsim+vcd2saif+report_power]
- 比较好的Java 网站/论坛/博客集锦
- 再聊inno 打包工具之关于安装或者卸载时判断程序是否在运行
- Windows Azure平台简介(三):AppFabric
- 学车比学计算机简单,不懂C1和C2的这些区别,千万不要报名学车!
- ESP8266使用MQTT
- 有什么Linux书籍推荐吗
- 四舍五入 与 四舍六入五成双
- Smart3d和3dsmax结合做人脸建模