一.需要的三方库

1.安装词云:

  pip install wordcloud

2.安装结巴

  pip install jieba

3.安装matplotlib

  pip install matplotlib

二.实现代码

 1 import jieba # 分词函数
 2 from scipy.misc import imread  # 这是一个处理图像的函数
 3 from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
 4 import matplotlib.pyplot as plt # 分析数据的函数
 5
 6 file_apath = open('tlbb.txt','r',encoding='UTF-8').read() # 打开文件
 7 bg_pic = imread('map.jpg') # 图片路径
 8
 9 # 王语嫣, 慕容复, 木婉清, 游坦之, 鸠摩智, 段延庆,包不同, 丁春秋, 阿紫, 阿朱, 段正淳, 钟万洪, 风波恶, 天山童姥, 耶律洪基...........
10
11 jieba.add_word('乔峰') # 添加关键词
12 jieba.add_word('段誉')
13 jieba.add_word('虚竹')
14
15 jieba.add_word('王语嫣')
16 jieba.add_word('慕容复')
17 jieba.add_word('木婉清')
18 jieba.add_word('段正淳')
19 jieba.add_word('鸠摩智')
20 jieba.add_word('游坦之')
21 jieba.add_word('包不同')
22 jieba.add_word('钟万洪')
23 jieba.add_word('耶律洪基')
24 jieba.add_word('萧峰')
25 jieba.add_word('南海恶神')
26 jieba.add_word('阿朱')
27 jieba.add_word('钟灵')
28 jieba.add_word('阿碧')
29 jieba.add_word('阿紫')
30 jieba.add_word('玄慈')
31
32
33
34
35 wordlist_jieba = jieba.cut(file_apath, cut_all = True) # 使用jieba分词
36 world_split = " ".join(wordlist_jieba) # 分词后的数据
37
38
39 my_wordcloud = WordCloud(background_color='white', # 设置背景色
40                         max_font_size=50, # 字体大小
41                         width=2100, height=1400,margin=2,  # 图片的宽,高,和边距
42                         mask=bg_pic, # 设置背景图片
43                         font_path="C:/Windows/Fonts/simhei.ttf"# 设置字体路径
44                         # random_state=42,
45                         )
46 # 屏蔽关键词
47 stopwords=STOPWORDS.add('自己')
48 stopwords=STOPWORDS.add('说道')
49 stopwords=STOPWORDS.add('什么')
50 stopwords=STOPWORDS.add('他们')
51 stopwords=STOPWORDS.add('一个')
52 stopwords=STOPWORDS.add('不是')
53 stopwords=STOPWORDS.add('便是')
54 stopwords=STOPWORDS.add('甚么')
55 stopwords=STOPWORDS.add('不知')
56 stopwords=STOPWORDS.add('咱们')
57 stopwords=STOPWORDS.add('我们')
58 stopwords=STOPWORDS.add('可是')
59 stopwords=STOPWORDS.add('只是')
60 stopwords=STOPWORDS.add('如此')
61 stopwords=STOPWORDS.add('这些')
62 stopwords=STOPWORDS.add('倘若')
63 stopwords=STOPWORDS.add('怎么')
64 stopwords=STOPWORDS.add('这么')
65
66
67 my_wordcloud.generate(world_split)  # 生成词云
68 image_colors = ImageColorGenerator(bg_pic)  # 转换字体主题色与图片一致
69 # 绘制词云
70 plt.figure()
71 plt.imshow(my_wordcloud.recolor(color_func=image_colors))
72 plt.title('Word Cloud') # 词云标题
73 plt.axis("off") # 关闭词云
74 plt.show() # 显示生成的词云图片
75 my_wordcloud.to_file('ciyun.png') # 保存图片

三.实现效果

  

转载于:https://www.cnblogs.com/kadycui/p/9588942.html

词云分析《天龙八部》人物出现次数相关推荐

  1. 利用python语言分析小说的词频、词性、词云、小说人物出场次数排序以及小说人物关系

    1.需要准备的文件 bird.png:云底图片 sgyy.txt:三国演义原文 tingyong.txt:停用词文件 2.源代码 1.统计词频词性并写入文件中 # 贾高亮 # 时间:2023/3/21 ...

  2. 大江大河2弹幕数据之词云分析、情感极性分析、主题分析、共现网络分析

    最近,自己在疯狂追<大江大河2>这部剧,作为当下最热门的电视剧之一,这部电视剧深受观众的喜爱,自从播出以后就好评不断 它主要讲述了改革开放三十年,一代人奋斗向阳的故事,看完之后深受启发,特 ...

  3. jieba库词频统计_如何用python对《三国演义》、《红楼梦》等名著开展词云分析及字频统计、出场统计等工作。...

    以下以<红楼梦>为例进行设计. 在制作词云图及统计之前,需要下载python的几个库,wordcloud.jieba以及imageio等,我的操作系统为Windows10,IDE环境为id ...

  4. 词云分析案例_品牌案例中的案例研究词

    词云分析案例 A close-up look at Friday's design process. 近看星期五的设计过程. WORDS IN THE WILD IS A BAY-AREA NONPR ...

  5. python词云代码手机_【云计算】爬取淘宝手机品牌词云分析(python)

    本文主要向大家介绍了[云计算]爬取淘宝手机品牌词云分析(python),通过具体的内容向大家展现,希望对大家学习云计算有所帮助. 淘宝手机信息的爬取,请看这边博客(点击这里),然后我们利用其中保存的文 ...

  6. NO.16——Pathon爬取杨超越新浪微博数据做词云分析

    看到网上充斥着很多词云分析的资料,今天心血来潮,也尝试下词云分析.最近热火的<创造101>,杨超越小姐姐一直在风口浪尖,因此这里借用小姐姐的微博数据做分析. 一.准备工具 作词云分析主要用 ...

  7. python词云分析--媒体近期的讨论热点

    目录 背景 词云的定义 词云的创建 背景 据社交媒体研究机构Shareablee统计的数据显示,近期社交媒体已经超过网络搜索,成为人们消遣和了解疫情的首要渠道. 作为数据分析小白,为了初探疫情下的媒体 ...

  8. Java后端以及web前端及echarts框架词云分析

    运用Java后端以及web前端及echarts框架词云分析做出数据分析统计可视化展示. 以下为我的项目展示截图: 开发环境: 集成开发环境(IDE):IntelliJ IDEA 2021 服务器:To ...

  9. python歌词分析_Python 词云分析周杰伦新歌《说好不哭》

    周杰伦难得出新歌 ,最近终于推出了单曲<说好不哭>,然后直接把QQ音乐服务器干崩了,天王的实力可见一斑,QQ音乐还把这个当作 今天过年 看我公众号头像就知道是杰伦粉了 ,高中的时候开始喜欢 ...

  10. Python 词云分析周杰伦新歌《说好不哭》

    周杰伦难得出新歌 ,最近终于推出了单曲<说好不哭>,然后直接把QQ音乐服务器干崩了,天王的实力可见一斑,QQ音乐还把这个当作 看我公众号头像就知道是杰伦粉了 ,高中的时候开始喜欢上了他的歌 ...

最新文章

  1. python按行读取文件取消空白行_python按行读取文件 如何去掉换行符 \n
  2. 潍坊市计算机专业招聘,潍坊市工业学校计算机专业介绍
  3. 网页调用摄像头_【WebAR】虚拟现实来到网页——WebXR Device API第二部分
  4. 【转】python装饰器
  5. activiti 5.22的demo运行
  6. 安卓手机主题软件_类似主题软件下载-类似主题安卓官方版下载v2.6.6.3
  7. 维珍银河创始人布兰森成功进入太空 早于贝佐斯9天
  8. 北京大兴国际机场官微追星蔡徐坤,网友大怒,官方道歉...
  9. Android 标题栏(2)
  10. top 显示按照内存、CPU排序
  11. vi命令下编辑文件时,按insert键文件底部不出现“INSERT”问题
  12. keystone WSGI流程
  13. 逐点插入法-delaunay三角剖分
  14. 测序 测序过程和原理
  15. 如何寻求知识产权的刑事救济
  16. C语言零基础项目:打字母游戏!详细思路+源码分享
  17. Intellij IDEA 在win10 中输入法的输出框不跟随
  18. Executor框架-Executors
  19. datawhale组队学习task9—文件与文件系统
  20. BAT包围下的企业协作与通信之道

热门文章

  1. java.lang.ClassNotFoundException: Cannot find class:×××
  2. DC反标 翻转率文件[Modelsim+vcd2saif+report_power]
  3. 比较好的Java 网站/论坛/博客集锦
  4. 再聊inno 打包工具之关于安装或者卸载时判断程序是否在运行
  5. Windows Azure平台简介(三):AppFabric
  6. 学车比学计算机简单,不懂C1和C2的这些区别,千万不要报名学车!
  7. ESP8266使用MQTT
  8. 有什么Linux书籍推荐吗
  9. 四舍五入 与 四舍六入五成双
  10. Smart3d和3dsmax结合做人脸建模