Ubuntu安装anaconda做英文词云
1.词云是什么?想必大家都见过这种图片,这就是词云啦
“词云”这个概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)于近日提出。戈登做过编辑、记者,曾担任迈阿密先驱报(Miami Herald)新媒体版的主任。他一直很关注网络内容发布的最新形式——即那些只有互联网可以采用而报纸、广播、电视等其它媒体都望尘莫及的传播方式。通常,这些最新的、最适合网络的传播方式,也是最好的传播方式。 因此,“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。----百度百科
2 . 那如何做词云呢,这些词云是怎么生成的呢
现在,我们用Python这门非常热门的编程语言来做词云,如果你之前没有编程基础,没关系。从零开始,意味着我会教你如何安装Python运行环境,一步步完成词云图。希望你不要限于浏览,而是亲自动手尝试一番。
3.环境的安装
要使用Python,我们就需要安装Python的运行环境,如果你和我一样使用的是Ubuntu系统,那么的你的系统就已经安装了Python2.7和Python3.6的运行环境,在终端下输入python2.7或python3即可启动。
但这只是一个运行环境,我们知道Python是一门非常强大的语言,拥有非常多的库。所有我们要做词云,也需要安装一些库.那么我们最好是安装一个工具包,这样我们需要的库,或者扩展包都包含了,不需要我们在安装上花费太多的时间。
那么我推荐,也是业内非常推荐的一款套装,他就是大名鼎鼎的Anaconda
官方下载地址:https://www.anaconda.com/download/
但是这个地址下载速度实在是慢得让人抓狂,所有我给出这个下载地址
清华大学开源软件镜像站:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
按照对应的系统版本下载即可。
这里有一个版本选择的问题我们是选择Python2.7还是Python3呢
我推荐大家选Python3,也就是Anaconda3毕竟长江后浪推前浪
我的是Ubuntu,下载好的是一个以.sh结尾的脚步文件。
打开终端,输入
bash Anaconda3-4.4.0-Linux-x86_64.sh
按提示输入回车,所有要求选择yes/no的都选择yes
骚等片刻,Anaconda就安装好了。
接着我们打开终端,输入
mkdir ciyun //创建一个专用的目录(个人喜好)
cd ciyun
pip install wordcloud //安装词云wordcloud扩展包,做词云用的
//过程略 ....
pip list //输出的结果下有wordcloud
一路下载安装,完成。如果没有报错,并且在恭喜你环境就配置好了。非常简单是不是.
4.开始动手做词云
在开始之前,我们还需要分析的对象,也就是文本。因为中文的构成毕竟复杂,我们先选择英文文本
我这次选择的是马丁路德金的我有一个梦想演讲搞,大家可以去搜索一下。把这个txt的文本放在我们创建的ciyun目录下。我取名为dream_En.txt
在终端输入
jupyter notebook //自动打开一个浏览器
然后切换到我们创建的ciyun目录,点击右上角的NEW,创建一个编辑器,名字随意,有些不用名字.输入一下代码
file = open('dream_En.txt') //打开文本
text = file.read() //读取文本
text //输出文本 按Shift+Enter执行代码
到这里说明我们的数据没有问题,接着我们需要使用wordcloud对文本进行分析
from wordcloud import WordCloud
wordcloud = WordCloud().generate(mytext) //如果出现警告,忽略,不影响的
把text用#注释掉,防止干扰。但是到这一步却没有输出,但词云其实已经分析完成了,只是没有输出
注意:如果你在这一步报了一个错,比如
ImportError:cannot import name wordcloud //类似字眼的
那么是你的wordcloud没有安装好,回到终端检查一下。
pip list //看看输出结果有没有wordcloud,如果没有,请继续
pip install wordcloud //安装
接着,
%pylab inline
import matplotlib.pyplot as plt
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off") //忽略警告
是不是很激动,一张英文词云就这样做好了.简单吧!
5.总结
wordcloud这个扩展包的功能非常多,大家发现,做出的词云与本文开头的还是有一些差距的,那么在后续的文章中我会一一讲解。慢慢挖掘wordcloud的高级特性。
Ubuntu安装anaconda做英文词云相关推荐
- linux英汉字典代码,Ubuntu安装英汉词典(词库)详细步骤
Ubuntu安装英汉词典(词库)详细步骤 发布时间:2013-05-26 11:26:08 作者:佚名 我要评论 linux并不缺少词典软件.但是缺少词库.所有的词典软件都需要,自己下载安装词 ...
- 词云python灿烈_如何用Python做中文词云?
打算绘制中文词云图?那你得先学会如何做中文文本分词.跟着我们的教程,一步步用Python来动手实践吧. 需求 在<如何用Python做词云>一文中,我们介绍了英文文本的词云制作方法.大家玩 ...
- python中词云的图片是蒙版_用Python做简易词云
最近突发奇想,想做个词云玩玩,这算是Python的一个很初级的应用,虽然很初级,依然免不了会出现各种bug~ 使用工具: Anaconda:一个开源的用于Python科学计算的发行版本 jieba:一 ...
- python英文词云代码_手把手教你制作 中英文 词云 | python demo
以前做词云的时候网上看的python做词云的坑都很多,耗了很多时间才高清楚wordcloud制作词云的精髓和脉络,整理如下. 相关文章 准备Mac环境下直接pip install wordclou ...
- python 只去除英文_如何使用 Python 制作词云(Word Cloud)-英文词云篇
wordcloud 安装报错与解决 虽然网络上也有各种工具可以一键生成词云,但是使用Python制作词云感觉是一件很酷的事情.作为一个 Python 小白,使用 Python 的过程并不那么轻松.比如 ...
- Ubuntu安装anaconda,tensorflow,keras,pytorch
Ubuntu安装anaconda,tensorflow,keras,pytorch 博客转载自:https://blog.csdn.net/lyb3b3b/article/details/782398 ...
- python英文词云代码_Python 词云 【中/英】小白简单入门教程
1. 分析 构建词云需要具备: 原料即文章等内容 将内容进行分词 将分词后的内容利用构建词云的工具进行构建 保存成图片 2. 需要的主要模块 jieba 中文分词 wordcloud 构建词云 3. ...
- Ubuntu 安装 anaconda
文章目录 写在前面 一.官网下载安装包 二.安装 参考链接 写在前面 Ubuntu安装 anaconda 比较简单,去官网下载 anaconda 安装包,然后安装即可. 自己的安装环境:Ubuntu1 ...
- python wordcloud详解_Python+wordcloud十分钟学会生成英文词云
基于python生成的wordcloud 词云在这两年一直都热门话题,如果你耐下性子花个10分钟看看这篇文章,或许你就再也不用羡慕那些会词云的人了.这不是一项高深莫测的技术,你也可以学会.快来试试吧! ...
最新文章
- 2010-11季,关注波士顿凯尔特人的10个理由
- ASP.NET Core 中的依赖注入
- Java多线程sleep和wait的区别,总结得非常好
- Select 可编辑 - 完美支持各大主流浏览器
- kaggle实战—泰坦尼克(五、模型搭建-模型评估)
- iOS应用开发环境准备
- 布谷鸟哈希函数的参数_系统学习hash算法(哈希算法)
- RPG游戏-NPC系统
- 第九届蓝桥杯(国赛)——阅兵方阵
- PyTorch | torch.manual_seed(1)是什么意思?torch随机数manual_seed(1)有什么用?如何理解torch.manual_seed(1)
- python培训机构靠谱吗
- java入门篇(21)File类
- HTML5验证表单内容是否为空
- uni-app学习路线与建议
- InvalidDefinitionException: No serializer found for class java.lang.Object and no properties discove
- Tapestry 5 组件模板
- SpringBoot+EasyPOI word模板导出,含多张图片
- 如何选择一款好相机?
- 计算机教学得意之处,看不懂没关系,知道厉害就行了:中科大俩教授11年解了两道数学难题...
- EasyUi之Dialog(对话框窗口)
热门文章
- Linux 服务器建站新手教程 (宝塔建站全流程)- 不需要敲一行命令 (记录啊、好东西)
- 【论文导读】DAG-GNN: DAG Structure Learning with GNN
- 一个路由器配置多台不同网段的PC,使PC间能够互通
- Adobe photoshop cc启动后,新建命令不能用,背景黑色的解决方法
- python3配置PyOpenGL环境
- 《C陷阱与缺陷》----第三章 语义陷阱
- **ISO9001好处和定义**
- HDMI和DP线的等级和速度
- 机器学习项目2-葡萄酒质量和年份的关系
- 8090的你该知道的......很长,但看完后,你会成长