本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

以下文章来源于志斌的python笔记 ,作者 志斌

Python爬虫、数据分析、网站开发等案例教程视频免费在线观看

https://space.bilibili.com/523606542 

Python学习交流群:1039649593

前言

要说最近哪种水果最火,那就不得不说说菠萝了。随着“每3个中国菠萝就有1个来自徐闻”的话题登上各大平台热搜。徐闻菠萝迅速成为消费市场的热门商品。

随着徐闻菠萝高铁的开通大大降低了菠萝的运输成本和时间成本,这意味着我们可以以更低的价格吃上更新鲜的菠萝。在这种情况下,你还会担心网购的不新鲜吗?

数据获取

本文利用Python详细采集了淘宝网1774个商家菠萝的销售数据,获取到菠萝的店铺名称、商品名称、价格、产地、销量等数据,由于之前的文章已经详细介绍过淘宝网商家数据采集方法(不懂的看这篇文章用Requests+Cookie,轻松获取淘宝商品数据!),所以这里我们直接上代码:

response = requests.get('https://s.taobao.com/search', headers=headers, params=params)shangpinming = re.findall('"raw_title":"(.*?)"',response.text)
jiage = re.findall('"view_price":"(.*?)"',response.text)
fahuodi = re.findall('"item_loc":"(.*?)"',response.text)
fukuanrenshu = re.findall('"view_sales":"(.*?)人付款"',response.text)
dianpumingcheng = re.findall('"nick":"(.*?)"',response.text)

数据处理

我们打开Excel文件对数据进行观察,发现有很多重复的数据,如图:

可能是因为某些店铺数据在不同页面中也存在导致的,我们可以采用pandas对数据进行清洗,但是这里我们可以用一种更简单的方式来对重复数据进行清洗,那就是Excel,它自带有删除重复项的功能,如图:

数据处理后,数据预览:

数据可视化

本文采取Excel进行菠萝数据可视化,因为在绘图方面Excel甚至强于Python!

菠萝价格分布图

从图中可得菠萝的价格45%在30元以下,绝大多数的在100元以下,根据国家统计局公布的全国人均可支配收入来看,实现菠萝自由还是挺简单的。

那些店铺的销量较好

从图中我们可以看出,销量前十的店铺9个都是旗舰店,看来当价格较低时,人们更加的注重商品质量。

价格与销量之间的关系

从散点图中我们可以看到,价格和销量基本上成反比,即价格越低,销量越高。

有三个点较高,可能是因为店铺的名气较大所导致的。

国内哪里盛产菠萝

对淘宝店铺所在地进行可视化发现,大部分店铺集中在广东、海南、浙江这些沿海地区,我专门上网搜了一下菠萝生产的条件:

在售菠萝的特点

我们将所有的商品名称做成词云图,从词云图中我们可以看出,菠萝商品数据的关键字有:新鲜、凤梨、罐头、零食、海南。整箱、包邮等等。

Python爬取某宝菠萝数据,并可视化分析销量相关推荐

  1. python爬淘宝app数据_一篇文章教会你用Python爬取淘宝评论数据(写在记事本)

    [一.项目简介] 本文主要目标是采集淘宝的评价,找出客户所需要的功能.统计客户评价上面夸哪个功能多,比如防水,容量大,好看等等. [二.项目准备工作] 准备Pycharm,下载安装等,可以参考这篇文章 ...

  2. python电商数据挖掘_利用Python爬取淘宝商品并数据挖掘与分析实战!此乃大型项目!...

    项目内容 本案例选择>> 商品类目:沙发: 数量:共100页 4400个商品: 筛选条件:天猫.销量从高到低.价格500元以上. 项目目的 1. 对商品标题进行文本分析 词云可视化 2. ...

  3. Python爬取淘宝商品数据,价值千元的爬虫外包项目

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 完整代码可以点击下方链 ...

  4. 如何写一个python程序浏览淘宝_一篇文章教会你用Python爬取淘宝评论数据(写在记事本)...

    [一.项目简介] 本文主要目标是采集淘宝的评价,找出客户所需要的功能.统计客户评价上面夸哪个功能多,比如防水,容量大,好看等等. [二.项目准备工作] 1. 准备Pycharm,下载安装等,可以参考这 ...

  5. 用python爬取淘宝用户数据的单位是_国内有没有数据爬取方面的公司?

    1).diffbot,官网:https://www.diffbot.com/,这是被腾讯资本加持的一家人工智能公司,通过人工智能技术,让"机器"识别网页内容,抓取关键内容,并输出软 ...

  6. 用python爬取前程无忧网大数据岗位信息并分析

    爬虫的基本思路 1.在前程无忧官网检索"大数据"的结果中,每条检索结果详情对应的URL存在a标签的href属性中,通过组合选择器可以找到每条检索结果详情的URL. 2.前程无忧的招 ...

  7. 利用Python爬取各大高校信息并可视化分析,让你填志愿选学校不再迷茫

    高考结束了,接下来最重要的就是玩玩玩,然后准备报志愿吧. 关于学校的填报 不管是能填几个平行志愿,一定要把所有志愿和专业都填上,不然滑档都没地方给你哭的.但一定要量力而行,切忌好高骛远,选报志愿留有余 ...

  8. python爬取淘宝全部『螺蛳粉』数据,看看你真的了解螺蛳粉吗?

    01.前言 上一篇文章(爬取淘宝热卖商品并可视化分析,看看大家都喜欢买什么!)爬取分析了淘宝的热卖商品,从分析来看『螺蛳粉』的销量巨高.因此这篇文章将爬取淘宝全部『螺蛳粉』商品数据,通过可视化分析淘宝 ...

  9. python词云代码手机_【云计算】爬取淘宝手机品牌词云分析(python)

    本文主要向大家介绍了[云计算]爬取淘宝手机品牌词云分析(python),通过具体的内容向大家展现,希望对大家学习云计算有所帮助. 淘宝手机信息的爬取,请看这边博客(点击这里),然后我们利用其中保存的文 ...

最新文章

  1. html中设置td中内容的垂直位置
  2. 软件推荐---站长查询工具
  3. charles 手机证书下载安装
  4. linux下的系统监控软件,Linux系统监控工具sysstat
  5. deepfashion 深度学习_基于Alluxio加速混合云下的Intel Analytics Zoo开源深度学习平台...
  6. 深度学习(三十五)异构计算GLSL学习笔记(1)
  7. 4位先行进位电路 logisim_数字电路基础之逻辑电路
  8. Effective JavaScript Item 40 避免继承标准类型
  9. 查询sql执行计划_使用SQL执行计划进行查询性能调整
  10. 谷歌设立 COVID-19资助金,助力漏洞猎人度过新冠肺炎疫情
  11. 数据质量低该如何解决
  12. 数据库审计系统(启明设备)
  13. 阿里云DataV数据可视化工具的简单使用与地图组件区域下钻热力图下钻上钻控制缩放比例demo
  14. pppd详解_PPPD
  15. xmanager 修改linux ip,Linux配置XManager
  16. 二级c语言程序基础知识,计算机二级《C语言》基本知识点
  17. QNX系统挂载CF卡
  18. Zotero使用指南06:Markdown笔记
  19. springboot(三):连接mysql数据库
  20. 玛塔机器人函数_USA Today旗下专家详测!玛塔机器人到底靠什么打动了歪果仁?...

热门文章

  1. html,css笔记
  2. 逆序输出数组,将给定数组逆序输出
  3. 微信号名称乱码什么情况_2020最火微信号,微信号改成什么比较好?
  4. 扫地机器人自动回充原理
  5. 从苦寻ADSL拨号王想到的 -- 需到用时方恨知道的少啊
  6. python初学者学习简单教程
  7. php获取cnzz数据,PHP curl抓取cnzz统计数据
  8. 【历史上的今天】9 月 27 日:“3Q 大战”正式打响;第一个被通缉的电脑黑客;知名“美女病毒”作者被定罪
  9. 【推荐】700套高端简历模板合集
  10. 最新抖音简单无人直播教程