在虎扑上随便找了一段文字,粘贴到word.txt文件中,然后对这段文字进行处理。
其中用到的matplotlib库,主要是用来绘图;jieba库,对文字进行分词;wordcloud库,构建词云。
一、引用库
import jieba
import matplotlib as mpl
import matplotlib.pyplot as plt
from wordcloud import WordCloud
二、读取txt文件
#定义一个空字符串
final = ""
#文件夹位置
filename = r"E:\Program Files\爬虫\word.txt"#打开文件夹,读取内容,并进行分词
with open(filename,'r',encoding = 'gb2312') as f:for line in f.readlines():word = jieba.cut(line)for i in word:final = final + i +" "
三、构造词云
word_pic = WordCloud(font_path = r'C:\Windows\Fonts\simkai.ttf',width = 2000,height = 1000).generate(final)
plt.imshow(word_pic)
#去掉坐标轴
plt.axis('off')
#保存图片到相应文件夹
plt.savefig(r'E:\Program Files\6.png')
最后生成的图片如下:

python读写txt文件,并用jieba库进行中文分词相关推荐

  1. python文件读写用到的库_python 读写txt文件并用jieba库进行中文分词

    python用来批量处理一些数据的第一步吧. 对于我这样的的萌新.这是第一步. #encoding=utf-8 file='test.txt'fn=open(file,"r")pr ...

  2. python的jieba库第一次中文分词记录

    python的jieba库第一次中文分词记录 记录一下最基本的jieba分词程序 1.通过cut import jiebaseg = jieba.cut("这是一段中文字符", c ...

  3. 与自定义词典 分词_使用jieba库进行中文分词、关键词提取、添加自定义的词典进行分词...

    jieba库在中文分词中很常用,做一个简单的介绍和运用~ 需求1:打开本地的十九大报告文本,并采用jieba分词器进行分词,最后将分词结果存入名为segresult的文本文件中. 注释:①jieba库 ...

  4. python 读写txt文件乱码问题

    从报错讲起: UnicodeDecodeError: 'gbk' codec can't decode byte 0xaa in position 2: illegal multibyte seque ...

  5. Python读写txt文件时的编码问题

    转载自: https://www.cnblogs.com/baijing1/p/9885891.html (授权问题请直接私信) 这个问题来自于一个小伙伴,他在处理中文数据时需要先把里面的文本过滤然后 ...

  6. python读写txt 文件

    一.读文件 步骤:打开 – 读取 – 关闭 f= open('D:\pythontxt1.txt') f.read() #返回txt 文件的所有内容 while True: lines = f.rea ...

  7. jieba库与中文分词

    jieba库概述 由于中文文本中的单词不是通过空格或者标点符号分割,中文及类似语言存在一个重要的"分词"问题. jieba是python中一个重要的第三方中文分词函数库,能够将一段 ...

  8. python读txt很大_Python读写txt文件

    python读写txt文件 准备原始txt数据 3.14159265358979323846264338327950288419716939937510582097494459230781640628 ...

  9. python读取txt文件并写入excel-Python读excel生成数据存入txt文件

    我的excel文件结构: 学习了xlrd如何操作excel文件.python读写txt文件.jason.dumps()转换dict为string类型之后,进行了第一次尝试. 第一次尝试: import ...

最新文章

  1. vi/vim 命令手册(初级篇)
  2. OpenCASCADE绘制测试线束:数据交换命令之IGES 命令
  3. java 门面模式_Java门面模式
  4. Feign Hystrix (HystrixCommonKey) 设置单独接口的超时时间和FallBack
  5. springMVC重复扫描bean导致声明式事务失效
  6. ARMv8体系结构基础02:搭建实验环境
  7. 12 月 Web 服务器调查:“王者” nginx 增长最快!
  8. STM32国产替代,再来一波
  9. 常用电子元器件基础知识总结
  10. 微信公众平台教程,注册申请、认证、开发、推广营销,教你怎么用微信公众号...
  11. java同步锁有哪几种_Java实现锁的几种方式
  12. 智齿调用a标签时触发绑定事件
  13. String相关用法记录
  14. find 查找文件或文件夹命令find
  15. 【ML】英雄联盟对局胜负预测任务
  16. ultraiso制作u盘启动盘教程详解
  17. 大学计算机作业互评评语简短,大学生互评评语简短
  18. 记进组后第五次组会汇报
  19. 如何获取苹果设备的UDID(iPhone/iPad UDID查询方法)
  20. java 下标的使用_使用 Java Excel 操作excel-excel下标

热门文章

  1. 从程序猿转向淘宝店主的探索
  2. PDF转换成PPT,让PPT演示更专业
  3. 跟着陶哲轩一起学数学(一): 习题3.1.6: 证明德摩根定律
  4. 蓝桥杯 1004 [递归]母牛的故事
  5. 螺毗喃/螺唔嗓/六苯基双咪哇/水杨醛缩苯胺/周蔡靛兰类染料/偶氮/稠环芳香化合物/哗嗓/俘精酸配类/二芳基乙烯化合物
  6. 72、任务72——扫描工具Nikto(附带Httrack)
  7. 利用python 解对称正定矩阵方程组的平方根法
  8. Atlas800-9000 开发环境搭建
  9. 轻松理解前后端分离(通俗易懂)
  10. JLink-OB下载程序失败解决版本(附JFlash任意版本程序下载地址)