使用Python将《青花瓷》歌词生成词云图
哈喽大家好,因为上次有小伙伴问我,歌曲的歌词和评论怎么生成词云图,想买代码…
当时我就拒绝了,直接免费送给了他。
所以今天来分享给大家
我们以周董的《青花瓷》为例,要对《青花瓷》歌词生成词云图,需要采取以下步骤:
- 安装所需的库
要完成该任务,需要安装 jieba
和 wordcloud
库。可以在命令行下输入以下代码进行安装:
pip install jieba wordcloud
- 获取歌词数据
将周杰伦《青花瓷》歌词数据保存为文本文件,并将其读取到 Python
程序中。可以使用 Python
的文件操作等方法获得文本文件数据,例如:
with open('qhc.txt', 'r', encoding='utf-8') as f:lyrics = f.read()
- 分词
使用 jieba
库进行中文分词,将歌词文本数据分解为一个个单词,统计每个单词的词频。
import jiebalyrics = jieba.cut(lyrics)
word_freq = {}
for word in lyrics:if len(word) > 1:word_freq[word] = word_freq.get(word, 0) + 1
- 生成词云
使用 wordcloud
库生成词云图并将其保存到本地。
from wordcloud import WordCloud
import matplotlib.pyplot as pltwc = WordCloud(background_color='white', width=800, height=600)
wc.generate_from_frequencies(word_freq)
plt.imshow(wc)
plt.axis('off')
plt.show()# 将生成的词云保存为图片文件
wc.to_file('qhc_wordcloud.png')
完整代码如下所示:
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt# 读取歌词
with open('qhc.txt', 'r', encoding='utf-8') as f:lyrics = f.read()# 分词并计算词频
lyrics = jieba.cut(lyrics)
word_freq = {}
for word in lyrics:if len(word) > 1:word_freq[word] = word_freq.get(word, 0) + 1# 生成词云并展示
wc = WordCloud(background_color='white', font_path='msyh', width=800, height=600)
wc.generate_from_frequencies(word_freq)
plt.imshow(wc)
plt.axis('off')
plt.show()# 将生成的词云保存为图片文件
wc.to_file('qhc_wordcloud.png')
运行该代码后,会生成包含《青花瓷》歌词词云图的图片并保存到本地。需要注意的是,由于分词的准确性和歌词长度等因素的影响,该词云图可能需要经过调整和优化。
效果展示
对于想学好Python的小伙伴,我还准备了
Python软件工具+数百本Python电子书+Python基础教程+Python实战教程
直接在文末名片自取
图片不能发多了,仅做展示。
好了今天的分享就到这结束了,下次见!
使用Python将《青花瓷》歌词生成词云图相关推荐
- python爬取歌词生成词云图_爬取毛不易歌词作词云展示
爬取毛不易歌词作词云展示 今天我们做一个数据可视化的项目,爬取毛不易的歌词做词云展示. 1.爬取数据 我们主要使用 Python 爬虫获取 HTML,用 XPath 对歌曲的 ID.名称进行解析,然后 ...
- 用Python将《青花瓷》的歌词生成词云图
前言 大家早好.午好.晚好吖 ❤ ~欢迎光临本文章 因为上次有小伙伴问我,歌曲的歌词和评论怎么生成词云图,想买代码- 当时我就拒绝了,直接免费送给了他. 所以今天来分享给大家 我们以周董的<青花 ...
- python爬音乐评论生成词云图_python爬虫+词云图,爬取网易云音乐评论
又到了清明时节,用python爬取了网易云音乐<清明雨上>的评论,统计词频和绘制词云图,记录过程中遇到一些问题 爬取网易云音乐的评论 一开始是按照常规思路,分析网页ajax的传参情况.看到 ...
- Python | 根据指定文件生成词云图
任务:编写程序,编好后,把多个文本文件(中文.英文或中英文语言混合的文本文件,编码格式为UTF-8,扩展名为txt)放到程序所在目录.程序运行时,能把程序所在目录下所有文本文件找出来,并显示出文件基本 ...
- python爬歌词生成词云图_Python爬虫摇滚网易云音乐歌词生成词云图
我相信经过前三篇文章,大家已经学会了怎么下载歌词和歌曲了.看了我的文章后开始行动起来的应该都享受到音乐的福利了.问一个问题,当你疲惫时,你想提起精神来去工作或者看书,你会选择听什么歌曲让自己兴奋起来呢 ...
- python网易云歌词做成词云图_讨好女朋友:用Python给女朋友做一个歌曲词云图
今天咋们来看看网易云赵雷的歌曲歌词,并做一个词云图.这篇文章可以学习到什么是词云,爬虫的基本流程,简单的可视化操作 一 什么是词云 可视化有很多种,好的数据可视化,可以使得数据分析的结果更加通俗易通. ...
- Python WordCloud 文本分析 生成词云图
文章目录 环境准备 Code 结果文件 Links 环境准备 Python, pip安装配置: 安装依赖的包(使用-i url指定要使用的镜像源,加快下载速度) pip install wordclo ...
- python网易云歌词做成词云图_Python爬取李荣浩最短歌曲贝贝的网易云评论并做成词云图...
前言 在18 年的 10 月 17 号,李荣浩发了一张新专辑「耳朵」,专辑里有一首歌「贝贝」,只有 4 秒,歌词也就两个字.而且这首歌的作曲 .作词 .编曲.制作人.和声.录音师.混音师.录音室.混音 ...
- python 统计文本字数 生成词云图
程序采用wordcloud.jieba分词.matplotlib绘制图像的模块 02.py # 题目二 # 请你设计一个统计字数的工具,工具要求如下: # 1.统计的是任意文本文件(txt)内容的字数 ...
最新文章
- 强大自己,从学习开始!2020年最有内容的订阅号,每一个都是万里挑一!
- FPGA中状态机的稳定性
- 学python有必要买书吗-终于明白python需要学什么
- NHibernate中,查询SqlServer数据库多个实体对象
- webpake-node-sass 报错
- ai钢笔工具怎么描线_AI中钢笔工具绘图的实战操作技巧!(干货满满)
- 高级考题_理论干货最最直观的词云分布,带你一次看清天大考题端倪!
- 解决cannot import name ‘finance‘ from ‘matplotlib‘报错与问题解析
- java 16进制Util转换类
- 最近卡脖子的汽车芯片产业链全景图(车规级芯片)
- Android快速入门之使用AdapterView展示不同风格的列表
- 「无捆绑不锁页」极度纯净win10 32位专业版下载地址
- 5ecsgo启动失败2错误代码2,5E打开csgo说csgo客户端需要更新 然后进不去游戏怎么回事?...
- 第08篇:Mybatis事务处理
- PRD:腾讯会议APP产品需求文档
- 2021年高光谱图像文献追踪_ISPRS_V.180_10
- 台式计算机电源接线图,​台式机硬盘电源线接法【图解】
- 【大数据离线开发】1、大数据准备环境之Linux配置
- 小米,苹果,百度,三星等公司的智能语音识别功能如何测试?
- 股票期货化数据文大覆盖国6大交易所的历史数据和实时行情
热门文章
- python爬取数据热点词生成词云
- c语言计算一元二次方程ax2+bx+c=0的根,C语言,求一元二次方程ax2+bx+c=0的根。
- 项目缺陷管理工具——禅道
- Event对象、MouseEvent对象、inputEvent对象和focusEvent对象
- 英语学习:onset and rime;声母与韵母;元音字母
- [转载]《狼》-bressanon布列瑟农 一次触动每个人心灵的感受
- 浅浅理解.net core的路由
- 解决前端调用WEB-INF下jsp无法访问的问题
- try、catch、finally用法
- Javascript当中的 getElementsByTagName() 方法