最近和小伙伴一起探索了一下双十一后闹得沸沸扬扬的一篇文章:“淘宝2009-2018年历年双十一销售额数据造假”。原文作者使用初中阶段学过的抛物线,就将每年的销售额增长趋势拟合得非常完美。


(如果大家想学习如何画出上述的图像,可参见前面一篇博客:用 ggplot 重绘天猫双十一销售额图)

同时在知乎上,这个问题也成功上了当时的热搜榜,各路大神云集,也发表了很多很有意思的观点:如何看待有人质疑淘宝双十一数据造假,并在4月份成功预测今年销售额为2680亿?。

看了很多大神的文章后,自己对这个数据也进行了一些探索,尝试看看能否发现一些不一样的有趣的事情。


我们先看看原文中提到的问题,这条直线拟合得过于完美了,在我们通常的认知中,如果某个指标随着年份发生变化,例如:销售额,增长率等,我们用一条非常规律的曲线去回归,是基本上不可能呈现这种没有波动的情况,一般会呈现下图这样的结果。

但从原文的图中我们可以看到,红色的散点近乎完美地点缀在拟合出来的曲线上。在现实生活中出现这种情况非常罕见,且极其神奇!

原文作者至此就断言:拟合太过完美,在现实生活中不可能存在。双十一数据一定是造假了,马云是个大骗子,骗了我们十年。并且文章认为数据造假提到的核心证据是 R 2 R^2 R2 过高(越高数据和模型的拟合效果越好, R 2 = 1 R^2=1 R2=1,是几乎不会存在的完美拟合),而我们在亲手重现原文的结果之后,也验证了原文的观点。可是原文除了以 R 2 R^2 R2 极高来判断淘宝数据作假,还有其他证据吗?是否探索了该数据现象背后可能的原因?

乍一看原文的内容和如此精妙的拟合,我也差点相信了。但仔细一想,就逻辑而言,原文这种断言是非常不严谨的。原作者有一个问题,那就是过于武断和过于依靠经验。举个栗子,有人没见过灰天鹅,就说所有的天鹅一定都不是灰色的,但只要有一只灰天鹅出现,就能推翻“天鹅一定不是灰色的”这个结论,这就是证伪。

同样,我们也不能因为某件事情出现的情况非常少,就直接说明这件事是有问题的。例如,每一期彩票中头奖的幸运儿,我们难道能说他们都是开了挂才中奖的吗?


事实上,在现实生活中,许多经济学原理都与发展阶段或增长率挂钩。那么,像原文那样完美拟合的情况会不会是一些经济学现象所引起的呢?如果我们能够通过理论验证它符合某些经济学规律,我们就有证据说明这样拟合的非常好的销售额曲线是因为服从这样的规律,才出现了这么巧合的现象,而不是因为数据造假。另一方面,如果我们通过验证发现它不符合经济学规律,那么也能从理论的角度说明原数据存在造假的嫌疑。

那么,增长率是如何变化的呢?我们来看看!

年份 销售额 增长率
2009 0.5
2010 9.36 1772.00
2011 52 455.56
2012 191 267.31
2013 350 83.25
2014 571 63.14
2015 912 59.72
2016 1207 32.35
2017 1682 39.35
2018 2135 26.93
2019 2684 25.71

我们绘制了销售额增长率在这十年间的下降曲线:

其实从销售额增长率的角度而言,其是符合一些经济学规律的。具体的量化分析我们后面再进行更加深入 ,严谨的分析~


最后,本篇博文涉及的绘图,后面都会一个一个写个教程,手把手教大家进行绘制~

  • 用 ggplot 重绘天猫双十一销售额图
  • ggplot 添加左右两边的y轴(以天猫双十一销量与增长率为例)

玩一玩天猫双十一数据相关推荐

  1. 你真的会玩SQL吗?玩爆你的数据报表之存储过程编写(上)

    你真的会玩SQL吗?系列目录 你真的会玩SQL吗?之逻辑查询处理阶段 你真的会玩SQL吗?和平大使 内连接.外连接 你真的会玩SQL吗?三范式.数据完整性 你真的会玩SQL吗?查询指定节点及其所有父节 ...

  2. 你真的会玩SQL吗?玩爆你的数据报表之存储过程编写(下)

    你真的会玩SQL吗?系列目录 你真的会玩SQL吗?之逻辑查询处理阶段 你真的会玩SQL吗?和平大使 内连接.外连接 你真的会玩SQL吗?三范式.数据完整性 你真的会玩SQL吗?查询指定节点及其所有父节 ...

  3. 【数据库必备知识】玩转表及其数据

    数据库系列文章 1. 零基础带你快速上手SQL语言 2. 玩转表及其数据 3. 上手表设计 4. 索引和事务 5. 最新版MySQL的JDBC编程 目录

  4. 《Java特种兵》1.3 简单数字游戏玩一玩

    1.3 简单数字游戏玩一玩 数字游戏没错就是玩数字游戏 Java怎么玩马上见证下 玩数字有什么用途呢我们不是虚拟数据给别人看而是通过玩数字转换让我们更了解计算机的数字运算也许数字运算可以有一些神奇的地 ...

  5. linux手动生成dump文件权限不足_来玩一玩Linux常见命令~

    写在前面: 小伙伴儿们,大家好!上一篇我们学习了Linux相关部署方面问题: 这次我们一起来玩一玩常见的Linux相关命令,有点意思: 思维导图: 1,命令格式: 我们刚打开FinalShell,可能 ...

  6. 白鹭引擎用java_白鹭引擎产品工具更新 完善小游戏、QQ玩一玩开发支持

    原标题:白鹭引擎产品工具更新 完善小游戏.QQ玩一玩开发支持 为了让开发者们获得更好的开发体验,同时在搜集大家通过官方社区.微信小游戏技术讨论群提交的反馈意见后,我们在1月29日对旗下的白鹭引擎.Eg ...

  7. 玩一玩Android下载框架

    前言 继上篇<不一样的HTTP缓存体验>已经有一段时间了,一直没写教学型文章不是因为太忙,想了很久不知道以什么为主题,有个哥们看了我的开源项目CrazyDaily,好像对下载挺感兴趣,那我 ...

  8. Egret QQ玩一玩适配【踩坑日记】

    需要申明一点,这是我接过最坑的渠道了,各种神奇的问题,首先是接口比较奇怪而且新旧版本搞得很混乱,其次是平台底层实现性能差而且很多限制.此外,这里需要理清楚一个概念:QQ 玩一玩 和 QQ 玩吧 并非同 ...

  9. QQ玩一玩(轻游戏)入门到放弃?

    姓名:Javen Email:javendev@126.com Github:https://github.com/Javen205 Gitee:https://gitee.com/Javen205 ...

  10. Cocos Creator 开发QQ玩一玩入门到放弃?

    Cocos Creator 开发QQ玩一玩入门到放弃? 文章目录 Cocos Creator 开发QQ玩一玩入门到放弃? 1.环境搭建 1.1 开发工具准备 1.1.2 官方站点 1.1.3 编辑器使 ...

最新文章

  1. 从零开始 Mask RCNN 实战:基于 Win10 + Anaconda 的 Mask RCNN 环境搭建
  2. OpenGL perpixelgloss逐像素光泽度的实例
  3. [css] 使用css写一个垂直翻转图片的效果
  4. quartz mysql 初始化_quartz scheduler 从数据库初始化
  5. 没来得及整理的一些网站
  6. CTF中基本的Xor解密操作
  7. [置顶]       javascript中的数组对象以及json学习笔记
  8. 安卓编程用什么软件_手机上能安装PLC编程软件吗?为什么?
  9. 有什么可以测试耳机性能的软件吗,测试耳机性能好坏的简单方法
  10. Linux C++ socket编程实例
  11. 智能机器人机器人心得_你是机器人吗
  12. 王和勇计算机软件,图像空间中的鉴别型局部线性嵌入方法
  13. 1.Spring学习笔记_HelloWorld(by尚硅谷_佟刚)
  14. Android学习之导航
  15. “大众点评开发者平台”正式上线
  16. 考试/答题系统的设计思路
  17. Ringbuff note
  18. 信息安全是无价之宝 低代码平台安全机制全方位解密
  19. 思科DTP和VTP协议
  20. 三参数 S-N 曲线拟合及MATLAB程序

热门文章

  1. [FIDO]U2F Message协议介绍
  2. 阿迪达斯发布公司新战略;联合利华美容个护产品将弃用“正常”一词;TCL电子发布高端Mini LED智屏 | 美通企业日报...
  3. pytorch加载部分参数训练
  4. 精彩回顾:2020年自动化软件测试质量峰会
  5. 【Python】网页爬取CVPR论文
  6. Service xxx does not have a SELinux domain defined.amp;amp;avc denied权限问题
  7. 图像信号以及图像属性的像素
  8. IDCNAR 账龄未清应收负数问题解决 F-51清账 示意
  9. win10 1903 回收站属性无法操作问题
  10. shell字符串拼接