1.词云是什么?想必大家都见过这种图片,这就是词云啦


“词云”这个概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)于近日提出。戈登做过编辑、记者,曾担任迈阿密先驱报(Miami Herald)新媒体版的主任。他一直很关注网络内容发布的最新形式——即那些只有互联网可以采用而报纸、广播、电视等其它媒体都望尘莫及的传播方式。通常,这些最新的、最适合网络的传播方式,也是最好的传播方式。 因此,“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。----百度百科

2 . 那如何做词云呢,这些词云是怎么生成的呢

    现在,我们用Python这门非常热门的编程语言来做词云,如果你之前没有编程基础,没关系。从零开始,意味着我会教你如何安装Python运行环境,一步步完成词云图。希望你不要限于浏览,而是亲自动手尝试一番。

3.环境的安装

要使用Python,我们就需要安装Python的运行环境,如果你和我一样使用的是Ubuntu系统,那么的你的系统就已经安装了Python2.7和Python3.6的运行环境,在终端下输入python2.7或python3即可启动。

但这只是一个运行环境,我们知道Python是一门非常强大的语言,拥有非常多的库。所有我们要做词云,也需要安装一些库.那么我们最好是安装一个工具包,这样我们需要的库,或者扩展包都包含了,不需要我们在安装上花费太多的时间。

那么我推荐,也是业内非常推荐的一款套装,他就是大名鼎鼎的Anaconda
官方下载地址:https://www.anaconda.com/download/

但是这个地址下载速度实在是慢得让人抓狂,所有我给出这个下载地址
清华大学开源软件镜像站:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
按照对应的系统版本下载即可。

这里有一个版本选择的问题我们是选择Python2.7还是Python3呢
我推荐大家选Python3,也就是Anaconda3毕竟长江后浪推前浪

我的是Ubuntu,下载好的是一个以.sh结尾的脚步文件。
打开终端,输入

bash Anaconda3-4.4.0-Linux-x86_64.sh

按提示输入回车,所有要求选择yes/no的都选择yes
骚等片刻,Anaconda就安装好了。

接着我们打开终端,输入

mkdir ciyun                  //创建一个专用的目录(个人喜好)
cd ciyun
pip install wordcloud     //安装词云wordcloud扩展包,做词云用的
//过程略 ....
pip list                      //输出的结果下有wordcloud

一路下载安装,完成。如果没有报错,并且在恭喜你环境就配置好了。非常简单是不是.

4.开始动手做词云

在开始之前,我们还需要分析的对象,也就是文本。因为中文的构成毕竟复杂,我们先选择英文文本
我这次选择的是马丁路德金的我有一个梦想演讲搞,大家可以去搜索一下。把这个txt的文本放在我们创建的ciyun目录下。我取名为dream_En.txt

在终端输入

jupyter notebook      //自动打开一个浏览器

然后切换到我们创建的ciyun目录,点击右上角的NEW,创建一个编辑器,名字随意,有些不用名字.输入一下代码

file = open('dream_En.txt')   //打开文本
text = file.read()              //读取文本
text                        //输出文本   按Shift+Enter执行代码

到这里说明我们的数据没有问题,接着我们需要使用wordcloud对文本进行分析

from wordcloud import WordCloud
wordcloud = WordCloud().generate(mytext)  //如果出现警告,忽略,不影响的

把text用#注释掉,防止干扰。但是到这一步却没有输出,但词云其实已经分析完成了,只是没有输出

注意:如果你在这一步报了一个错,比如

ImportError:cannot import name wordcloud   //类似字眼的

那么是你的wordcloud没有安装好,回到终端检查一下。

pip list            //看看输出结果有没有wordcloud,如果没有,请继续
pip install wordcloud     //安装

接着,

%pylab inline
import matplotlib.pyplot as plt
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")      //忽略警告

是不是很激动,一张英文词云就这样做好了.简单吧!

5.总结

wordcloud这个扩展包的功能非常多,大家发现,做出的词云与本文开头的还是有一些差距的,那么在后续的文章中我会一一讲解。慢慢挖掘wordcloud的高级特性。

Ubuntu安装anaconda做英文词云相关推荐

  1. linux英汉字典代码,Ubuntu安装英汉词典(词库)详细步骤

    Ubuntu安装英汉词典(词库)详细步骤 发布时间:2013-05-26 11:26:08   作者:佚名   我要评论 linux并不缺少词典软件.但是缺少词库.所有的词典软件都需要,自己下载安装词 ...

  2. 词云python灿烈_如何用Python做中文词云?

    打算绘制中文词云图?那你得先学会如何做中文文本分词.跟着我们的教程,一步步用Python来动手实践吧. 需求 在<如何用Python做词云>一文中,我们介绍了英文文本的词云制作方法.大家玩 ...

  3. python中词云的图片是蒙版_用Python做简易词云

    最近突发奇想,想做个词云玩玩,这算是Python的一个很初级的应用,虽然很初级,依然免不了会出现各种bug~ 使用工具: Anaconda:一个开源的用于Python科学计算的发行版本 jieba:一 ...

  4. python英文词云代码_手把手教你制作 中英文 词云 | python demo

     以前做词云的时候网上看的python做词云的坑都很多,耗了很多时间才高清楚wordcloud制作词云的精髓和脉络,整理如下. 相关文章 准备Mac环境下直接pip install wordclou ...

  5. python 只去除英文_如何使用 Python 制作词云(Word Cloud)-英文词云篇

    wordcloud 安装报错与解决 虽然网络上也有各种工具可以一键生成词云,但是使用Python制作词云感觉是一件很酷的事情.作为一个 Python 小白,使用 Python 的过程并不那么轻松.比如 ...

  6. Ubuntu安装anaconda,tensorflow,keras,pytorch

    Ubuntu安装anaconda,tensorflow,keras,pytorch 博客转载自:https://blog.csdn.net/lyb3b3b/article/details/782398 ...

  7. python英文词云代码_Python 词云 【中/英】小白简单入门教程

    1. 分析 构建词云需要具备: 原料即文章等内容 将内容进行分词 将分词后的内容利用构建词云的工具进行构建 保存成图片 2. 需要的主要模块 jieba 中文分词 wordcloud 构建词云 3. ...

  8. Ubuntu 安装 anaconda

    文章目录 写在前面 一.官网下载安装包 二.安装 参考链接 写在前面 Ubuntu安装 anaconda 比较简单,去官网下载 anaconda 安装包,然后安装即可. 自己的安装环境:Ubuntu1 ...

  9. python wordcloud详解_Python+wordcloud十分钟学会生成英文词云

    基于python生成的wordcloud 词云在这两年一直都热门话题,如果你耐下性子花个10分钟看看这篇文章,或许你就再也不用羡慕那些会词云的人了.这不是一项高深莫测的技术,你也可以学会.快来试试吧! ...

最新文章

  1. 2010-11季,关注波士顿凯尔特人的10个理由
  2. ASP.NET Core 中的依赖注入
  3. Java多线程sleep和wait的区别,总结得非常好
  4. Select 可编辑 - 完美支持各大主流浏览器
  5. kaggle实战—泰坦尼克(五、模型搭建-模型评估)
  6. iOS应用开发环境准备
  7. 布谷鸟哈希函数的参数_系统学习hash算法(哈希算法)
  8. RPG游戏-NPC系统
  9. 第九届蓝桥杯(国赛)——阅兵方阵
  10. PyTorch | torch.manual_seed(1)是什么意思?torch随机数manual_seed(1)有什么用?如何理解torch.manual_seed(1)
  11. python培训机构靠谱吗
  12. java入门篇(21)File类
  13. HTML5验证表单内容是否为空
  14. uni-app学习路线与建议
  15. InvalidDefinitionException: No serializer found for class java.lang.Object and no properties discove
  16. Tapestry 5 组件模板
  17. SpringBoot+EasyPOI word模板导出,含多张图片
  18. 如何选择一款好相机?
  19. 计算机教学得意之处,看不懂没关系,知道厉害就行了:中科大俩教授11年解了两道数学难题...
  20. EasyUi之Dialog(对话框窗口)

热门文章

  1. Linux 服务器建站新手教程 (宝塔建站全流程)- 不需要敲一行命令 (记录啊、好东西)
  2. 【论文导读】DAG-GNN: DAG Structure Learning with GNN
  3. 一个路由器配置多台不同网段的PC,使PC间能够互通
  4. Adobe photoshop cc启动后,新建命令不能用,背景黑色的解决方法
  5. python3配置PyOpenGL环境
  6. 《C陷阱与缺陷》----第三章 语义陷阱
  7. **ISO9001好处和定义**
  8. HDMI和DP线的等级和速度
  9. 机器学习项目2-葡萄酒质量和年份的关系
  10. 8090的你该知道的......很长,但看完后,你会成长