python淘宝关键字词云分析
前言
续上篇《Python爬虫 获得淘宝商品评论》用python实际应用了一把。今天试着用python试玩一词云。从客户搜索的关键字中分析下客户的喜好,从而去优化宝贝标题,提高宝贝曝光率。
“词云”是对文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨
正文
0x01 数据来源
数据来源是 淘宝直通车表,下载是excel文档,筛选二级类目“染发烫发”,得到相关关键字列表,然后统一贴至txt中。我收集了下列数据并存放至ranfa.txt中
文件名 |
---|
07月26日TOP20万词表PC.xlsx |
07月26日TOP20万词表无线.xlsx |
06月27日TOP20万词表PC.xlsx |
06月27日TOP20万词表无线.xlsx |
05月23日TOP20万词表无线.xlsx |
4月25TOP20万词表无线.xlsx |
0x02 代码
安装wordcloud 和 相关库存。详细安装说明
python库名 |
---|
wordcloud |
matplotlib |
numpy |
pillow |
jieba |
源代码块
import os
import jieba
import matplotlib.pyplot as plt
from os import path
from wordcloud import WordCloud, STOPWORDS, ImageColorGeneratortext = open(path.join(os.getcwd(), 'ranfa.txt')).read()
# print(text)
text = ' '.join(jieba.cut(text))
# print(text)
backgroud_Image = plt.imread('12.jpg')
wordcloud = WordCloud(background_color = 'black', # 设置背景颜色mask = backgroud_Image,# max_words = 2000, # 设置最大现实的字数stopwords = STOPWORDS, # 设置停用词font_path='C:\Windows\Fonts\simsun.ttc',max_font_size=70, # 设置字体最大值# min_font_size=5,random_state=42,scale=2,).generate(text)image_colors = ImageColorGenerator(backgroud_Image)
plt.imshow(wordcloud.recolor(color_func=image_colors))
plt.imshow(wordcloud)
plt.axis("off")
plt.show()
0x03 词云效果
分析
从图片我们一目了然,客户购买时最先搜索的关键字。淘宝卖家可以根据关键字优化标题,增加宝贝曝光率。
简要分析
1. 搜索频率最高是“染发”、“染发剂”。
2. 多数客户更佳关注无害“植物”、“纯天然”染发。
3. 颜色上更多客户选择黑色
更多分析…
源码下载
链接: https://pan.baidu.com/s/1xRkwQNePtRf_ScVtKsROHg
密码: 4edk
广告
纯天然植物提取染发剂,有需要的朋友客户关注下我老婆的店铺。
【广州威蒂娜品牌店】,復·制这段描述€kmMQb0VNFEr€后咑閞手机淘宝或者用浏览器咑閞http://m.tb.cn/h.32gDlKv查看
python淘宝关键字词云分析相关推荐
- python 淘宝用户行为数据集 分析与数据源
利用Python对淘宝用户行为进行分析 源数据来源于: https://tianchi.aliyun.com/dataset/dataDetail?dataId=649&userId=1 可以 ...
- Python 淘宝系列(三): 模拟登陆成功后获取购物车信息
http://my.oschina.net/u/811744/blog/192604(本文的转载地址) ================================================ ...
- Python淘宝美眉图片下载爬虫视频教程-何家胜-专题视频课程
Python淘宝美眉图片下载爬虫视频教程-21985人已学习 课程介绍 本套视频主要讲述Python项目实训一:如何利用Python的while循环体设计实现网络爬虫刷博器的程序的设计 ...
- python 淘宝搜索_Python使用Selenium+BeautifulSoup爬取淘宝搜索页
使用Selenium驱动chrome页面,获得淘宝信息并用BeautifulSoup分析得到结果. 使用Selenium时注意页面的加载判断,以及加载超时的异常处理. import json impo ...
- 如何用mysql对淘宝用户行为进行分析
一.项目背景和目的 项目集中于对淘宝用户行为的分析,如购买时段的分析.热销商品的分析.用户行为转化漏斗分析以及通过RFM模型对用户进行分类等,希望从中探索用户购买的规律,并将这些规律与店铺营销策略相结 ...
- 近几年在淘宝及阿里云上的高可用架构演进
原文:架构之家 主要介绍了其近几年在阿里电商平台及阿里云上的高可用设计的经验,分为两个部分:第一部分主要包括传统的淘宝店铺稳定性体系的建设及相关的基础链路设计.缓存和容灾方案的设计及部署:第二部分主要 ...
- python淘宝_python实现淘宝购物系统
本文实例为大家分享了python淘宝购物系统的具体代码,供大家参考,具体内容如下 代码如下: #刚创建账户所拥有的钱 money = 0 #定义商品列表 goods_list = [ {'name': ...
- 利用python做微信聊天记录词云分析——记录美好回忆
目录 1 概述 2 数据准备 2.1 安卓设备 2.1.1 Root手机,安装Root Explorer 2.1.2 用Root Explorer将聊天记录的数据文件导出并存入电脑 2.1.3 对En ...
- python淘宝秒杀_python实现简单淘宝秒杀功能
本文实例为大家分享了Python淘宝秒杀的具体代码,供大家参考,具体内容如下 昨天茅台在线上搞秒杀,本来想着靠我惊人的手速去秒一瓶,结果. 所以痛定思痛,想想还是用脚本更靠谱.就在网上搜啊搜,看到se ...
- 淘宝登录取Cookie分析
淘宝登录取Cookie分析 二维码登录 二维码登录 通过手机扫描二维码登录,整体步骤如下: 打开网页,定位到二维码标签,点击,让登陆框载入二维码 : 等待扫码,同时判断二维码是否过期,过期则刷新二维码 ...
最新文章
- oracle 统计一年中每个月数据总和_excel表格有每月数据 怎样统计全年的-用excel公式怎样计算每年每个月的数据总和?...
- android 自定义弹窗,Android自定义弹窗
- android 如何使用服务器进行版本更新
- 腾讯云实时音视频技术发展简史 — 从编解码器容错优化到云端决策系统
- 某些小时后MySql连接自动掉线
- 这就是数据分析之数据采集
- Spark sql数据倾斜优化的一个演示案例
- 乐优商城个人笔记上-主要框架、基础知识、管理系统代码
- 三星5G商用关键设备开发完成;施耐德布局物联网│IoT黑板报
- 程序员的8个职业发展方向,了解一下!
- 2018.05.11 种花小游戏
- ns-3中的数据跟踪与采集——Tracing系统的配置
- 个保法下个人信息委托处理活动合规要点
- mysql分区表去重复_MySQL分区表管理
- docker 问题集
- hdu5594 ZYB's Prime
- 【高级UI】【026】手动为RecyclerView添加橡皮筋拉伸回弹效果
- 第十四届蓝桥杯大赛软件赛省赛 C/C++ 大学 B 组
- Day6 - 头像存储与EasyExcel
- el-input-number默认值为空怎么设置