wordcloud库应用-《唐诗三百首》词云图详解
本文主要介绍用wordcloud库制作《唐诗三百首》的词云图的方法,以及注意点。
根据北京理工大学嵩天老师《Python语言程序设计》课程的代码做了部分修改。
主要思路
- 读取《唐诗三百首》文件
- 使用jieba库分词,使用wordcloud库生成词云图
- 输出词云图
import os
from imageio import imread
import jieba
import wordcloud
d = os.getcwd()
#读取文件
f = open(os.path.join(d,'唐诗三百首.txt'),'r',encoding = 'utf-8') #这里可以直接输入路径,就不需要使用os.path.join()了,下面同理
t = f.read()
f.close()
#jieba分词
ls = jieba.lcut(t)
txt = ' '.join(ls)
#生成词云
mask = imread(os.path.join(d,'dufu.jpg')) #设置蒙版图形
w = wordcloud.WordCloud( width = 1000, height = 700,\background_color = "white",font_path = "msyh.ttc", mask = mask)
w.generate(txt)
#词云图输出
w.to_file(os.path.join(d,'tangshi2.png'))
生成的词云图效果如下
从中可以看出,唐诗三百首出现次数较多的诗人有杜甫、王维、李白、孟浩然等;而较常出现的词有万里、不见、何处、明月、故人、芙蓉、青山、相思、琵琶等。
注意点
模板图形的读入:最初使用的是代码是from scipy.misc import imread
,但是运行之后报错,如下:
DeprecationWarning:
imread
is deprecated!
imread
is deprecated in SciPy 1.0.0, and will be removed in 1.2.0.
Useimageio.imread
instead.
所以,改用imageio库的imread指令。
欢迎指正交流~
wordcloud库应用-《唐诗三百首》词云图详解相关推荐
- 用Python画出好看的词云图(详解)
相信很多人在第一眼看到下面这些图时,都会被其牛逼的视觉效果所吸引,下面我就带领大家一起来学习怎么用Python画出这种图. 前期准备 上面的这种图叫做词云图,主要用途是将文本数据中出现频率较高的关键词 ...
- python唐诗分析综合_Python利器之胎教《唐诗三百首》文本分析
事情是这样的,你们听我讲: 有一天,孕妈妈在家庭群里对准爸爸说,在某猫上买本<唐诗三百首>吧,每天给宝宝读一首唐诗,作为胎教.有图有真相: 作为好吃懒做的准爸爸,听到这个消息的瞬间,表情是 ...
- python+jieba分析唐诗三百首
python+jieba分析唐诗三百首 代码及源文件地址:poem_300 代码保证符合命名规范.遵循PEP8规则.导包顺序清晰.尽量做到复用性和不罗嗦 记得修改文件路径哟(^U^)ノ~YO 如果有帮 ...
- 【Pygame小游戏】史上最全:《唐诗三百首》合集,每一首都是精华,果断收藏~(学诗+锻炼记忆+Python诗句填空小程序上线啦)
前言 岁岁年龄岁岁心,不负时光不负卿 哈喽!我是你们的栗子同学,今天给大家来点儿有趣的-- 有句话说:"读史使人明智,读诗使人灵秀."唐诗本来就是中国文化的绚丽瑰宝,是每个人都 ...
- 《唐诗三百首》中的童年记录
这是学习笔记的第 2192 篇文章 读完需要 9 分钟 速读仅需7分钟 唐诗三百首在最近读了几遍,你可能不了解的<唐诗三百首>,看了下<诗词大会>发现真是人才济济.一方面是词穷 ...
- 你可能不了解的《唐诗三百首》
这是学习笔记的第 2189 篇文章 读完需要 9 分钟 速读仅需3分钟 对于唐诗,自己其实是一种复杂的心情,好像会背些,但是用的时候却都想不起.<唐诗三百首>算是重温古诗的一种方式,借着让 ...
- python爬取唐诗三百首
python讨论qq群:996113038 导语: 最近一直在写爬虫,写过一些爬取"妹子图","小视频"之类的爬虫,但是我想了想.咱们公众号虽然是个技术类公众号 ...
- 唐诗三百首出现最多的字是什么?大数据分析告诉你
一个人要是长时间一直做一件事,思维容易固化. 就像那些从太空回来的宇航员,吃饭时容易丢开拿在手里的勺子.当勺子掉在地上时,哦,我已经回到地球了^_^. 所以,适当尝试新鲜事物,既是对大脑的放松,也是开 ...
- 使用maven构建一个基于Java的spark应用程序用于统计唐诗三百首中各汉字出现的次数
目的:统计唐诗三百首全集每个汉字出现的次数 软件需求: 下载 Eclipse ,安装Maven 安装好JDK1.8 下载并配置了hadoop-2.7.3 spark-2.2.0-bin-had ...
- 唐诗三百首微电影合集(300集)
诗词是最美的语言,是迷醉心怀的智慧.古典诗词,寥寥数语,却四两拨千斤,字字千锤百炼,就这么几个字,或勾勒出恢弘清雅的画卷,或传递出幽咽情愫.苍茫之志.以下是我们推荐给大家的古诗词微电影合集,大家可以收 ...
最新文章
- 如何彻底卸载mysql(xp)
- 改变,从跨出第一步開始——记海大ITAEM团队首次IT讲座掠影
- activeMQ 安装于使用
- keycode值对照表_JavaScript中键盘字母与keyCode值(键值)的对照表
- SAP后台作业记录操作
- centos 6.5升级openssl
- shell命令直接分区
- 使用MailMessage.AlternateViews时遇到的小问题
- git 撤销挂起的更改_Timer计时任务因系统时间的修改导致挂起解决方案
- mysql5.6 二进制免编译安装
- 开源android手写批注,浅析各阅读平台手写批注 智器阅读显身手
- android 3d布局轮播,android 图片/视频混合轮播控件banner
- 空间数据挖掘主要方法
- 使用 Python 进行线性搜索优化
- 下载anaconda后配置环境变量
- DO447安装红帽Ansible Tower
- AI人工智能专业词汇集
- RocketMQ-单条消息大小上限
- 你知道icp许可证与edi许可证的区别吗
- 如何查询往年国家自然科学基金