本周为大家带来炫酷好玩的 wordcloud 词云构造库。

使用 wordcloud 可以做出这样的图片:

还可以做出这样的:

接下来,我们来学习如何制作属于自己的词云图。

本来想说一句,安装过程不表,直接进入正题,可是在编程教室的QQ群和微信群中都有人遇到wordcloud 安装失败的问题。

所以在此简单提一下安装过程:

当然最直接的是 pip

pip install wordcloud

但很多同学会发现直接 pip 是会报错的,所以这里提供第二种安装方式:

下载 whl 手动安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud

静静等待页面加载完成,然后选择适合自己 Python 的 wordcloud 版本,最后运行以下命令。filepath 替换为你的安装文件完整路径。

pip install filepath\wordcloud-1.2.1-cp35-cp35m-win_amd64.whl

wordcloud 在安装过程中会自动安装其依赖的库。

基本的用法

我们读入一本英文小说,取其中的词汇生成一张词云图

  1. # 导入 wordcloud 模块和 matplotlib 模块
  2. from wordcloud import WordCloud
  3. import matplotlib.pyplot as plt
  4. # 读入一个txt文件
  5. text = open('Jane Eyre.txt','r').read()
  6. # 生成词云
  7. wordcloud = WordCloud().generate(text)
  8. # 显示词云图片
  9. plt.imshow(wordcloud)
  10. plt.axis('off')
  11. plt.show()
  12. # 保存图片
  13. wordcloud.to_file('test.jpg')

结果如图所示

运行脚本之后就可以看到生成的图片了,是不是很简单。本文主要讲 wordcloud。代码中涉及到的 matplotlib 就不做更详细解释。

除了直接读入文本生成词云,也可以使用字典格式的词频作为输入

  1. # 读入一组词频字典文件
  2. text_dict = {
  3. 'you': 2993,
  4. 'and': 6625,
  5. 'in': 2767,
  6. 'was': 2525,
  7. 'the': 7845,
  8. }
  9. wordcloud = WordCloud().generate_from_frequencies(text_dict)

还可以将词云填充到指定的形状之中。为达到填充指定形状的效果,需要使用 png 格式的图片。

  1. # 读入图片
  2. from scipy.misc import imread
  3. bg_pic = imread('Anne_Hathaway.png')
  4. # 配置词云参数
  5. wc = WordCloud(
  6. # 设置字体
  7. font_path = 'BeaverScratches.ttf',
  8. # 设置背景色
  9. background_color='white',
  10. # 允许最大词汇
  11. max_words=200,
  12. # 词云形状
  13. mask=bg_pic,
  14. # 最大号字体
  15. max_font_size=100,
  16. )
  17. # 生成词云
  18. wc.generate(text)
  19. # 保存图片
  20. wc.to_file('word.jpg')

最后的效果如下

还可以结合 jieba分词,实现用中文填充的词云图(如果不通过分词,无法直接生成正确的中文词云)。使用中文填充时一定得指定中文的字体,否则会出现乱码。如果报错找不到字体,就复制一个中文字体文件放在代码目录下。

  1. #-*- coding:utf-8 -*-
  2. from scipy.misc import imread
  3. import matplotlib.pyplot as plt
  4. from wordcloud import WordCloud
  5. import jieba
  6. from collections import Counter
  7. # 读入 西游记 txt 文件,windows 下过滤编码错误
  8. text = open('西游记.txt',encoding='utf-8',errors='ignore').read()
  9. # 使用 jieba 分词
  10. text_jieba = list(jieba.cut(text))
  11. # 使用 counter 做词频统计,选取出现频率前 100 的词汇
  12. c = Counter(text_jieba)
  13. common_c = c.most_common(100)
  14. # 读入图片
  15. bg_pic = imread('Anne_Hathaway.png')
  16. # 配置词云参数
  17. wc = WordCloud(
  18. # 设置字体
  19. font_path = '李旭科书法1.4.ttf',
  20. # 设置背景色
  21. background_color='white',
  22. # 允许最大词汇
  23. max_words=200,
  24. # 词云形状
  25. mask=bg_pic,
  26. # 最大号字体
  27. max_font_size=100,
  28. )
  29. # 生成词云
  30. wc.generate_from_frequencies(dict(common_c))
  31. # 生成图片并显示
  32. plt.figure()
  33. plt.imshow(wc)
  34. plt.axis('off')
  35. plt.show()
  36. # 保存图片
  37. wc.to_file('anne.jpg')

最终的结果:

关于 wordcloud 的一些基本的常用的方法就在这里。想了解更多特性的同学,可以访问官方网站: https://amueller.github.io/word_cloud/

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/29096438/viewspace-2146151/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/29096438/viewspace-2146151/

【Python】Wordcloud 词云相关推荐

  1. Python wordcloud词云:源码分析及简单使用

    Python版本的词云生成模块从2015年的v1.0到现在,已经更新到了v1.7. 下载请移步至:https://pypi.org/project/wordcloud/ wordcloud简单应用: ...

  2. Python 数据可视化:WordCloud 词云的构建

    WordCloud 官方文档:https://amueller.github.io/word_cloud/index.html WordCloud GitHub 地址:https://github.c ...

  3. python数据挖掘学习笔记】十三.WordCloud词云配置过程及词频分析

    #2018-03-28 09:59:40 March Wednesday the 13 week, the 087 day SZ SSMR 11,12因为涉及到数据库被我暂时放弃了 python数据挖 ...

  4. Python实现的《芳华》WordCloud词云+LDA主题模型

    WordCloud 词云 + LDA 主题模型 何小嫚&刘峰原图.jpg 人物词云效果.jpg 电影<芳华>在春节重映了一波,加上之前的热映,最终取得了 14 亿票房的好成绩.严歌 ...

  5. python中文分词器-jieba分词器详解及wordcloud词云生成

    jieba分词 jieba分词支持三种分词模式: 精确模式, 试图将句子最精确地切开,适合文本分析 全模式,把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义 搜索引擎模式,在精确模 ...

  6. 一步一步教你如何用python做词云_一步一步教你如何用Python做词云

    前言 在大数据时代,你竟然会在网上看到的词云,例如这样的. 看到之后你是什么感觉?想不想自己做一个? 如果你的答案是正确的,那就不要拖延了,现在我们就开始,做一个词云分析图,Python是一个当下很流 ...

  7. python 词云_利用Python生成词云

    利用Python生成词云 一.第三方库的安装与介绍 1.1  Python第三方库jieba(中文分词) 1.介绍 "结巴"中文分词:做最好的 Python 中文分词组件. 2.特 ...

  8. Hadoop3.0基础平台搭建(三节点),以及案例运行并使用python生成词云

    一.设备配置列表,软件包 二.主机名映射 三.生成密钥 四.将密钥发送到各个节点 五.注意事项及验证 六.关闭防火墙和SeLinux安全模块(所有主机均需操作 七.解压JDK.hadoop包,设置Ja ...

  9. python词云有什么用_如何用Python实现词云效果

    如何用Python实现词云效果 发布时间:2020-06-06 10:56:57 来源:亿速云 阅读:204 作者:Leah 这篇文章主要为大家详细介绍了用Python实现词云效果的方法,图文详解容易 ...

最新文章

  1. 电力系统非线性控制_什么是谐波?电力系统谐波怎么产生的?老司机给你科普一下!...
  2. 理论 | 优雅的构建一个健壮的API接口
  3. 135.002 智能合约设计-——多员工薪酬系统
  4. Linux下磁盘分区卸载和磁盘配额
  5. 2048源码 linux,分享|2 的威力,Linux 的威力:终端中的 2048
  6. BUUCTF------相册
  7. 锐捷长ping_【交换机】S8606--s5750E互连接口ping大包(length=18024)会丢包
  8. Xposed框架安装、使用及插件开发
  9. html添加省市县联动下拉框,JSON+JS实现省市县三级联动下拉框
  10. ILSVRC2015_DET.tar.gz下载地址
  11. fastadmin 表格文字实现换行
  12. go操作excel单元格合并
  13. spring mvc 404 报错记录
  14. 在两台电脑之间通过网线、局域网快速传东西的几种方法
  15. 联想服务器linux系统raid驱动,ThinkSystem服务器RAID 530/930系列阵列卡驱动及安装RHEL7.3要点说明...
  16. C#如何获取局域网ip地址
  17. linux批量安装系统uefi,PXE批量部署Linux之四:一台服务器同时支持BIOS和UEFI
  18. JavaScript小记——Ajax异步请求
  19. 安装tensorflow
  20. linux怎么看go写的程序进程,Linux中查看进程状态信息-Go语言中文社区

热门文章

  1. linux startx xinit
  2. 第一篇:关键点检测算法基础及mmpose文件夹规则
  3. 指纹识别技术综述(扫盲篇)(转载)
  4. MATLAB---构造一个插值三次样条曲线
  5. 抖音快手民俗的作品制作方法
  6. day14课后总结app
  7. 【SQLserver】使用openrowset方法导入EXCEL表格数据
  8. zbrush 制作护腕1 -- 基础模型
  9. XML解析及JSON解析
  10. AirPods pro 连接Macbook pro左耳无声音