作为一个小头目,经常会读到来自各种团队的数据分析报告,看似基于理性和事实的雄辩,然而有可能是有意或无意的诡辩。搞得我经常像傻白甜的美少女面对追求的少男一样,面对这些严谨的数据分析也不得不多长几个心眼。

1、可视化的误导

一般来说,画出图表就容易让人肃然起敬,至少架势是足的,然而其中却容易出现诡计。

下图的作者为了表达中国城镇化率的增加以及家庭小型化趋势对房价的支撑作用,摆出了两个柱状图,然而为了表达这两个指标的强烈趋势,Y轴都不是从0开始,于是在视觉上更容易让人有冲击力,然而却含有误导性。(不过被误导也就罢了,一二线这个趋势,早几年买房也不是坏事儿)

作者为了表达软件开发类不等级别之间的工资巨大差异,居然把最低值、平均值和最高值叠加在一起进行呈现。效果是出来了,但逻辑和节操却大珠小珠落玉盘。

2、使用孤证或者不靠谱的绝对值

“林子大了什么鸟都有”,这句俗语特别适合于使用孤证或者不靠谱绝对值来证明自己价值的数据分析,这是大公司里经常出现的一些场景,因为大公司产品经理偏爱依赖巨大流量来尝试一些新功能。

比如最近某产品推出类社区的产品功能,大家都质疑其与主方向毫无关系。产品经理立即跳出来反驳,使用该功能的n个用户已经找到了工作(找工作是该产品的核心功能之一)。然而每天上千万用户在产品里晃来晃去,做出啥事儿都不稀奇,举出孤证有意思吗?这时候想起知乎名言:脱离剂量,谈论食物毒性,都是耍流氓。

所以为了印象深刻,参考“奶子大了什么鸟都有”,这句俗语可以考虑改成“数字大了什么鸟都有”。

3、推理逻辑混乱

许多数据分析虽然带有翔实的数据,但是逻辑推理极其混乱。

前段时间遇到某产品在一级入口上线新功能X,然而却有可能和位于二级入口的原有功能Y冲突,X抢夺了使用Y的用户。

如同大家都了解的,大公司里面做产品,经常发生的事情就是左兜掏右兜,把用户像赶鸭子一样赶来赶去;不过总有一个兜的人因为数据大增要得到嘉奖。这里面最直观的例子就是:不少公司的小程序用户大增而受表扬,不过主App的数据跌了。

当挑战这个产品经理的时候,他经过一天的数据分析后得意宣称:担心是多余的,因为数据显示,使用X功能的用户有60%使用了Y功能。

画外音:那么使用X而不用Y的40%用户在干嘛呢?算不算Y功能的流失?

4、扶不上墙的小规模测试

产品经理为了工作的严谨性,经常利用小规模测试甚至是AB测试来观察新功能。然而一个诡异的现象却是,小规模测试效果不错的功能,全量之后却差强人意。这往往可能是因为取样偏差造成的,因为求胜心切,产品经理在取样时很容易有意或无意得形成取样偏差。这里面常见的两个偏差是幸存者偏差和辛普森偏差。

幸存者偏差。前一段我们公司搞用户开放日,与应邀前来的用户做Focus Group(用户焦点访谈)。结果在访谈中用户对我们产品简直是满意无比,大大出乎我们意料。除去用户保持绅士风或淑女风不敢当面怼我们之外,更主要的原因是邀约是通过我们App上面的推广,来的用户都不是被我们伤碎了心的人,所以好感爆棚。如果基于这些用户去做新功能的小规模测试,一定会出现偏差。

辛普森偏差。从网上摘取的一个关于肾结石治疗方案的AB测试。单个病例看,A方案都优于B方案;然而,总体看,结论反转。这么诧异的结论主要是来源于样本的不同:大小结石病例在A和B中的构成比例相差较大,从而形成两个完全不同的样本,从而造成这样的结果反转。

5、乱配因果关系

据说世界上比暧昧关系更难证明的关系是因果关系,也比暧昧关系更加容易搞错而陷入泥潭。这里举自己犯过的错误再恰当不过了

在面对冷门问答时,自鸣得意得使用百度指数相关功能,发现“诗歌”和“感恩节”之前的强相关性,于是又找到各种理由来相信他们之间的因果关系。

虽然总觉得哪里有点不对,为了骗赞还是忍不住发了。结果被人打脸,更为可能的因果关系是:被人教版语文课本折磨的六年级小学生,赶上综合性学习活动“轻叩诗歌的大门”,课本的进度正在这个时间点左右,于是大量小学生搜索“诗歌”来完成作业。

这样错配因果关系的案例在生活中不少,大家可以留意收集。不过有个很有趣的国外网站(15 Insane Things That Correlate With Each Other)已经这么做来搞笑了,专门列出来看似逻辑相关但是其实因果关系错乱的例子。发出来与大家共享,以便行文自嘲。

1、尼古拉斯凯奇在电影中的出镜和淹死在游泳池里的人数,高度相关。

2、被床单缠死的人数和人均奶酪消耗量,高度相关。

3、美国在科技及空间领域的投入和绞死及各种窒息的花样作死的人数,高度相关。

本文由Startifyd整理,原文来源于@数据冰山。

斯图飞腾( Stratifyd )大数据智能分析平台兼具实时交互、图像可视化、非结构化数据和结构化数据的分析能力,识别差异化标签数据,可以帮助各种规模的企业快速、科学、精准地定位客户、员工,以及市场中的海量文本反馈信息,洞察其商业价值,提升企业的经济效益。

我好像看到了假的数据分析?相关推荐

  1. 超级菜鸟如何入门数据分析?

    大家好,我是宝器! 今天这篇文章是宝器在知乎上的一个问答,超级菜鸟如何入门数据分析? 我的回答全文大致如下(全文很长,建议收藏阅读): 经常看到很多朋友会问,入行数据分析之前我要不要学个java,学个 ...

  2. 海外直播软件 Bigo 的 TiDB 4.0 线上实践

    作者介绍:徐嘉埥,Bigo DBA,TUG 华南区大使. Bigo 于 2014 年成立,是一家高速发展的科技公司.Bigo 基于强大的音视频处理技术.全球音视频实时传输技术.人工智能技术.CDN 技 ...

  3. 国庆6.37亿出游花费4665.6亿处于什么水平?哪个省市客流最大?收入最高?

    随着国内疫情的有效防控,当国庆遇上中秋,今年的双节假期,国人被压抑了大半年的出行欲望爆发了. 这个接待国内游客6.37亿人次,实现旅游收入4665.6亿元的大项目,你参加了吗? 据说过节的人群泾渭分明 ...

  4. python按位置从字符串提取子串的操作是_Python基础-字符串操作和“容器”的操作...

    星火:Python基础-IF和循环​zhuanlan.zhihu.com星火:Python基础-函数​zhuanlan.zhihu.com星火:Python基础-模块​zhuanlan.zhihu.c ...

  5. “2020年嵌入式软件秋招经验和对嵌入式软件未来的一点思考”

    关注.星标公众号,直达精彩内容 乐鑫科技(提前批) 选择填空60/编程40,基础题不难,编程题两道算法. 联发科(提前批) 嵌入式软件岗.台企做射频芯片,wifi/蓝牙这种,台湾第一,给的不高但有加班 ...

  6. OSChina 周四乱弹 ——士可杀不可辱,这句话用英语怎么说?

    2019独角兽企业重金招聘Python工程师标准>>> Osc乱弹歌单(2017)请戳(这里) [今日歌曲] @南寻  :分享崔开潮的单曲<声声慢>: <声声慢&g ...

  7. OSChina 周三乱弹 ——请留意 重磅新闻!乱弹新年活动开始啦!

    2019独角兽企业重金招聘Python工程师标准>>> [今日歌曲] @温家成 :分享周杰伦的单曲<分裂(离开)> <分裂(离开)>- 周杰伦 手机党少年们想 ...

  8. 2018十二月刷题列表

    Preface \(2018\)年的尾巴,不禁感慨自己这一年的蜕变只能用蜕变来形容了. 而且老叶说我们今年没的参加清北冬令营可以参加CCF在广州二中举办的冬令营,只要联赛\(390+\)就应该可以报. ...

  9. UCloud:云计算的四个真相,BAT之外仍有空间

    ​ "我每次出差经过机场,都有一种高大上的感觉--机场里各种云计算广告,不是智能大脑.奥林匹克.量子计算,就是企业赋能与生态.而回到公司,听到客户在抱怨的话就瞬间回到了人间:'我们的业务有波 ...

最新文章

  1. ROS系统实现 tf坐标系广播与监听
  2. php mysqli::close()
  3. Ribbon-饥饿加载
  4. 【IDEA】IDEA中使用git将项目上传到码云上
  5. numpy 矩阵与向量相乘_高能!8段代码演示Numpy数据运算的神操作
  6. apollo集群部署_egg框架对接Apollo
  7. 虚拟机网络桥接-NAT-HOST的理解
  8. Gsoap在QT工程里如何调用
  9. Java之父:Solaris前景堪忧
  10. mysql添加值_怎么给mysql添加值?
  11. 云表中表单使用导入excel到明细
  12. 适合程序员的护眼显示器——大上科技Paperlike系列电子墨水显示器
  13. 2021年全国大学生电子设计竞赛官方通知正式发布
  14. 1K直接金属涂层(DTM)-市场现状及未来发展趋势
  15. java 打开url连接访问不了,android 应用Java自带的HttpURLConnection 连接网络 读取返回数据...
  16. JS返回前一页(或关闭本页面,返回首页)
  17. 《爬楼梯》算法日记 2021.7.22,每天一道算法题,怒刷Leetcode,未做出,看评论思路后得出解。
  18. 文章详情页----- 详细步骤
  19. std list/vector sort 排序就这么简单
  20. 山东教师教育网研修平台-首页

热门文章

  1. 人体的五脏六腑 奇经八脉 十二经络
  2. Java牛客项目课_仿牛客网讨论区_第八章
  3. 免费软件 --- 国信证券帐户历史成交统计器
  4. Linux下安装mysql以及配置用户与数据导入
  5. 火狐浏览器 Firefox 防病毒防木马 更安全
  6. xbox360春季更新后对媒体文件的支持情况
  7. Excel批量删除选区非数字的单元格的操作
  8. 燃气蒸汽发生器助力酿酒企业更好把控啤酒加工温度
  9. 学会配置Pycharm这一招,事半功倍!
  10. 用闲置小U盘变身最强大路由器