本文主要介绍用wordcloud库制作《唐诗三百首》的词云图的方法,以及注意点。
根据北京理工大学嵩天老师《Python语言程序设计》课程的代码做了部分修改。

主要思路
  • 读取《唐诗三百首》文件
  • 使用jieba库分词,使用wordcloud库生成词云图
  • 输出词云图
import os
from imageio import imread
import jieba
import wordcloud
d = os.getcwd()
#读取文件
f = open(os.path.join(d,'唐诗三百首.txt'),'r',encoding = 'utf-8') #这里可以直接输入路径,就不需要使用os.path.join()了,下面同理
t = f.read()
f.close()
#jieba分词
ls = jieba.lcut(t)
txt = ' '.join(ls)
#生成词云
mask = imread(os.path.join(d,'dufu.jpg')) #设置蒙版图形
w = wordcloud.WordCloud( width = 1000, height = 700,\background_color = "white",font_path = "msyh.ttc", mask = mask)
w.generate(txt)
#词云图输出
w.to_file(os.path.join(d,'tangshi2.png')) 

生成的词云图效果如下

从中可以看出,唐诗三百首出现次数较多的诗人有杜甫、王维、李白、孟浩然等;而较常出现的词有万里、不见、何处、明月、故人、芙蓉、青山、相思、琵琶等。

注意点

模板图形的读入:最初使用的是代码是from scipy.misc import imread ,但是运行之后报错,如下:

DeprecationWarning: imread is deprecated!
imread is deprecated in SciPy 1.0.0, and will be removed in 1.2.0.
Use imageio.imread instead.

所以,改用imageio库的imread指令。
欢迎指正交流~

wordcloud库应用-《唐诗三百首》词云图详解相关推荐

  1. 用Python画出好看的词云图(详解)

    相信很多人在第一眼看到下面这些图时,都会被其牛逼的视觉效果所吸引,下面我就带领大家一起来学习怎么用Python画出这种图. 前期准备 上面的这种图叫做词云图,主要用途是将文本数据中出现频率较高的关键词 ...

  2. python唐诗分析综合_Python利器之胎教《唐诗三百首》文本分析

    事情是这样的,你们听我讲: 有一天,孕妈妈在家庭群里对准爸爸说,在某猫上买本<唐诗三百首>吧,每天给宝宝读一首唐诗,作为胎教.有图有真相: 作为好吃懒做的准爸爸,听到这个消息的瞬间,表情是 ...

  3. python+jieba分析唐诗三百首

    python+jieba分析唐诗三百首 代码及源文件地址:poem_300 代码保证符合命名规范.遵循PEP8规则.导包顺序清晰.尽量做到复用性和不罗嗦 记得修改文件路径哟(^U^)ノ~YO 如果有帮 ...

  4. 【Pygame小游戏】史上最全:《唐诗三百首》合集,每一首都是精华,果断收藏~(学诗+锻炼记忆+Python诗句填空小程序上线啦)

    前言   岁岁年龄岁岁心,不负时光不负卿 哈喽!我是你们的栗子同学,今天给大家来点儿有趣的-- 有句话说:"读史使人明智,读诗使人灵秀."唐诗本来就是中国文化的绚丽瑰宝,是每个人都 ...

  5. 《唐诗三百首》中的童年记录

    这是学习笔记的第 2192 篇文章 读完需要 9 分钟 速读仅需7分钟 唐诗三百首在最近读了几遍,你可能不了解的<唐诗三百首>,看了下<诗词大会>发现真是人才济济.一方面是词穷 ...

  6. 你可能不了解的《唐诗三百首》

    这是学习笔记的第 2189 篇文章 读完需要 9 分钟 速读仅需3分钟 对于唐诗,自己其实是一种复杂的心情,好像会背些,但是用的时候却都想不起.<唐诗三百首>算是重温古诗的一种方式,借着让 ...

  7. python爬取唐诗三百首

    python讨论qq群:996113038 导语: 最近一直在写爬虫,写过一些爬取"妹子图","小视频"之类的爬虫,但是我想了想.咱们公众号虽然是个技术类公众号 ...

  8. 唐诗三百首出现最多的字是什么?大数据分析告诉你

    一个人要是长时间一直做一件事,思维容易固化. 就像那些从太空回来的宇航员,吃饭时容易丢开拿在手里的勺子.当勺子掉在地上时,哦,我已经回到地球了^_^. 所以,适当尝试新鲜事物,既是对大脑的放松,也是开 ...

  9. 使用maven构建一个基于Java的spark应用程序用于统计唐诗三百首中各汉字出现的次数

    目的:统计唐诗三百首全集每个汉字出现的次数 软件需求: 下载 Eclipse ,安装Maven 安装好JDK1.8 下载并配置了hadoop-2.7.3     spark-2.2.0-bin-had ...

  10. 唐诗三百首微电影合集(300集)

    诗词是最美的语言,是迷醉心怀的智慧.古典诗词,寥寥数语,却四两拨千斤,字字千锤百炼,就这么几个字,或勾勒出恢弘清雅的画卷,或传递出幽咽情愫.苍茫之志.以下是我们推荐给大家的古诗词微电影合集,大家可以收 ...

最新文章

  1. 如何彻底卸载mysql(xp)
  2. 改变,从跨出第一步開始——记海大ITAEM团队首次IT讲座掠影
  3. activeMQ 安装于使用
  4. keycode值对照表_JavaScript中键盘字母与keyCode值(键值)的对照表
  5. SAP后台作业记录操作
  6. centos 6.5升级openssl
  7. shell命令直接分区
  8. 使用MailMessage.AlternateViews时遇到的小问题
  9. git 撤销挂起的更改_Timer计时任务因系统时间的修改导致挂起解决方案
  10. mysql5.6 二进制免编译安装
  11. 开源android手写批注,浅析各阅读平台手写批注 智器阅读显身手
  12. android 3d布局轮播,android 图片/视频混合轮播控件banner
  13. 空间数据挖掘主要方法
  14. 使用 Python 进行线性搜索优化
  15. 下载anaconda后配置环境变量
  16. DO447安装红帽Ansible Tower
  17. AI人工智能专业词汇集
  18. RocketMQ-单条消息大小上限
  19. 你知道icp许可证与edi许可证的区别吗
  20. 如何查询往年国家自然科学基金

热门文章

  1. dubbo配置timeout
  2. 翻译题9寒假1周赛题
  3. jolog扫地机器人怎么样_扫地机器人怎么样?
  4. 计算机网络总线型结构优,总线型拓扑结构优缺点是什么
  5. 磨刀不误砍柴工(四)-IDEA常用快捷键
  6. 计算机 电脑 整机 加密,如何加密文件夹
  7. arcgis10.3添加工具
  8. 交换机的基本原理与配置
  9. ue4 计算向量夹角
  10. 严师出高徒VS名师出高徒