目录

1、破题能力

2、框架与逻辑

需求端

供给端

供需结合

3、发散思维

4、相关题目


转载1:https://mp.weixin.qq.com/s/gEHs2MWgBFn70StSmJD2tQ

转载2:WX公众号《阿狸与小兔》

1、破题能力

这里要强调的第一条原则也是最重要的原则:与需求方明确统计口径,是数据分析最基本的素养。

怎样估算北京市餐馆的数量?

餐馆的范围是哪些?无门店的外卖和街边摊大排档算吗?北京范围是哪些?城六区还是五环内还是行政区划都算?(城市范围的口径问题下同)

怎样估算深圳市学生的数量?

学生的范围是哪些?幼儿园、大学生算吗?还是只算九年义务教育阶段的在校生?

2、框架与逻辑

费米估算是有逻辑套路的。我们从需求端、供给端、供需端三个方面给出案例。

============================

需求端

============================

顾名思义,需求端就是从用户需求的角度出发,去计算市场的大小。常见的应用案例包括:

“全中国一年需要消费多少猪肉?”

“上海每天卖多少豆浆?”

……

我们以“全中国一年要消费多少猪肉”为例,看一下这类问题如何解答。

【STEP1】:我们将全中国一年消耗的猪肉量进行【初步】拆解,拆成以下的公式1:

公式1:全中国一年的猪肉消费量=每天消费猪肉量*全国人数*一年的天数

有人会说,年龄、生活水平等等都会影响到每天吃的肉量啊。那请注意下回归我们面试的本质:不是为了最终的答案,是为了考察你的逻辑!只要拆解逻辑流畅,自然能够获得面试官的认可。那我们先看下最简单的拆解下,应该如何计算。

在拆解公式中,全国人数、一年天数是已知的,那未知数据便是每天消费的猪肉量了。

【STEP2】:判断初级公式中数据是否已知,若仍有数据未知,继续拆!得到公式2:

公式2:每天消费的猪肉量=每天消耗的肉量*猪肉在肉类食材中的占比

联想自己:一份辣椒炒肉能够干掉一餐米饭,结合买菜经验,我一餐的肉量(注意,是肉量,不是猪肉量)约100G。在这里联想一下在西餐店吃牛排,一块牛排的重量约100G-120G。那么可以更加确信的得到:

每天消耗的肉量=100G*2餐=200G

再仔细思考:肉类=猪肉+牛羊+鸡鸭+水产+……,而猪肉是大部分最常食用的肉类,那大胆的给出估算:我认为猪肉在肉类食材中的占比约为50%!继续计算:

每天消费的猪肉量=每天消耗的肉量*猪肉在肉类食材中的占比

=200G*50%=100G

【STEP3】:数据整合,代入公式计算最终结果

我们把拆解的公式合并一下,得到公式3:

公式3:全中国一年的猪肉消费量

=每天消费猪肉量*全国人数*一年的天数

=每天消耗的肉量*猪肉在肉类食材中的占比*全国人数*一年的天数

=200G*50%*14亿*365天=5110万吨

随手在咨询报告截图中国猪肉消费增长走势,如下:

EMMM,在我们粗略的估算下,发现数量级对得上(笑哭,都是百万吨级别)。其实用公式拆解的套路来推算费米问题时,最终的答案结果是否准确真的一点也不重要,面试官看重的,就是你有没有拆解复杂问题的逻辑。

【STEP4】:思路优化与升级

当然咯,肯定还会有人不满足于这种简单的拆分,还想更加细致,可以从下面的角度来考虑:

市场调查:有人说以自己吃肉的标准来评估全国肯定不准确,那这是你可以在描述数据的时候,替换成:采用问卷访谈形式,取了被调查人食肉的中位数,发现人均每餐食肉量约100G,猪肉占比50%。

  市场细分:也有人提出来,全国14亿人口,34个省级行政区,肯定有不同的食肉标准。那可以再继续市场细分,比如考虑区域、考虑年龄。

比如说从区域的角度进行细分,上面的公式1可以拆解为

全中国一年的猪肉消费量

=每天消费猪肉量*全国人数*一年的天数

=(西北地区每天消耗的肉量*西北地区猪肉在肉类食材中的占比*西北人数*365天)

+(南方沿海地区每天消耗的肉量*南方沿海地区猪肉在肉类食材中的占比*南方沿海人数*365天)

+(其他地区每天消耗的肉量*其他地区猪肉在肉类食材中的占比*其他人数*365天)

  • XX地区每天消耗的肉量可以围绕100G/餐上下浮动;

  • XX地区的人数则可以根据中国西北地广人稀的特征,随便给出估算比例,比如假设西北人数为2亿人,南方沿海2亿人,其他地区10亿人。

最后把西北、南方沿海、其他地区的估算值分别算出来后加总即可。

=========================================

供给端

 =========================================

顾名思义,供给端就是从企业的供给能力出发,评估企业能够支持多大的市场规模,从供给端的角度可以考虑下面的问题:

“楼下星巴克一年卖咖啡收益?”

“北京市每天多少人乘坐地铁?”

……

我们来看看第一个问题:楼下星巴克一年卖咖啡收益?

【STEP1】:万年第一步,初步拆解公式

公式1:星巴克一年营业额=一杯咖啡均价*每天卖出咖啡数量*365天

在拆解公式里,一杯咖啡的均价是已知的,但是每天卖出咖啡的数量是未知的。所以下一步要想办法计算出每天卖出咖啡的数量。

【STEP2】:找到供给能力的瓶颈

Emmm……根据我们的常识,其实也可以判断,饮料店的点单、收银虽然需要排队,但绝不是供给能力的瓶颈问题,星巴克的瓶颈在于制作咖啡的流程,每一杯咖啡需要2分钟的制作时间。(以上数字纯属瞎诌……可自行任意假设……)

【STEP3】:继续拆公式

(以下数字也是瞎诌……自行理解逻辑即可……)

根据供给实际情况,我们考虑忙时和闲时两种情况

在星巴克忙碌(早8点-10点,午1点-3点,共计4小时)的时候,产能达到极限;而在闲暇(早10点-午1点,午3点-晚8点,共计8小时)的时候,产能非常宽松。我们继续拆解得到公式:

公式2:每天卖出的咖啡数=忙时产能+闲时产能

假设①:星巴克有2台咖啡机,每台咖啡机可以同时制作2杯咖啡,那么一家咖啡店可以同时制作4杯咖啡。

假设②:忙时设备利用率100%,闲时设备利用率20%

计算忙时产能:两分钟4杯咖啡->平均每分钟两杯咖啡->共计480杯咖啡

计算闲时产能:设备利用率为20%->平均每分钟生产0.4杯咖啡->共计192杯咖啡

【STEP4】:数据整合,得到最终结果

公式3:星巴克一年营业额

    =一杯咖啡均价*(每天闲时产能+每天忙时产能)*365天

             =30*(480+192)*365

             =736 万

好啦,就这样能够从供给端出发计算星巴克的销量啦,根据相似的方法,你可以动笔计算一下北京市每天多少人乘坐地铁。

=========================================

供需结合

=========================================

利用供需结合的方式来进行估算是最简单的方式,可以分为【以小见大】和【以大见小】两种方法。

以小见大

“香港有多少个自助提款机?”

被面试的学生来自港中文大学,知道港中文约有10000名师生,有5台ATM取款机。

在【供给与需求满足一定比例】的假设下,推测一台ATM机能够满足2000人的取款需求。

全香港大概有700万人口,需要3500台ATM机

以大见小

“XX县城有多少金融行业从业人员?”

作出假设:全国大概800W金融行业从业人员

在【供给与需求满足一定比例】的假设下,800W金融从业人员服务与14亿中国人,1个金融从业人员可以服务175人。

XX县城的金融从业人员数量=XX县城总人数/175

从面试官的角度来说,只要在一定的框架之下,把问题分解为易估或常识数据,同时假设与逻辑能够自圆其说,就是一个合格的回答。与此同时,作为面试官我还希望看到这些加分项:

了解有哪些假设缺陷,例如上述对理发师数量估算中,其中一个假设是男女剪发周期相同,这里可能存在缺陷,如果能够分情况讨论男女客户剪发需求估算会更准确

了解有哪些分布缺陷,例如上述对学生数量估算中,人口按年龄平均分布是不合理的,按1个学生对应2个家长的假设,估算的学生数量大约需要再折半计算

保守估算和激进估算能力,对每个估算的参数,知道自己的方法得到的结果应该是一个上界还是下界

多方法Double check的意识,如上述对学生数量的估算,每个问题至少能提出2种及以上估算方法进行交叉验证

3、发散思维

假设所有数据开放,会去找哪些数据源?有哪些计算或估算方法?

这个问题的主要目的是进一步考察发散思维,因为在实际的工作过程中,手头有很多工具可以触及很多数据源,怎样筛选数据源或打开思路找数据源,也是数据分析一个重要的能力;合理的数据源越多,越能接近问题的真相。

估算北京市(全行政区划)餐馆(门店)的数量?

还是以上面这个问题为例,我收到过的回答就有:

官方数据源:国家统计局、工商局餐饮类营业执照……

互联网企业数据源:美团点评数字、地图采样统计、招聘网站招聘方……

产业链上下游:盐的消耗量、可出租商铺量……

4、相关题目

(1)估算永和豆浆一年的油条销量?

(2)上海理发店有多少tony老师?

(3)长沙一年的燃油税费是多少?(这是我面网易考拉的原题)

【数据分析】费米问题相关推荐

  1. [数据分析] 费米问题

    美图欣赏2022/06/06 什么是费米问题? 费米问题,即估算问题,由美国科学家恩利克·费米提出 费米问题实际上是通过将复杂问题不断拆分为较容易获得数据的子问题,再通过获得子问题的数据从而得到看似毫 ...

  2. 数据分析——费米估算问题

    ( 一 )费米问题介绍 根据美国科学家恩利克·费米命名.费米问题是科学家在科学研究中用来做量纲分析.估算和清晰地验证一个假设的估算问题.这类问题通常包括关于给定限定信息的有可能计算的数量的猜想的验证. ...

  3. 数据分析思维与方法总结

    目录 ABtest实验 漏斗分析 用户画像 辛普森悖论 费米估计 AARRR 事件分析 用户路径分析 留存分析 归因分析 RFM模型 ABtest实验 数据分析--AB实验 漏斗分析 漏斗分析是指将某 ...

  4. 数据分析求职之费米估算解析

    1 背景] 当面试官问你上海有多少理发店时,他真的想知道上海有多少理发店吗? 估算题又称为费米问题,是数据分析笔试面试中常见的题型,也是很多面试官认为能够考察候选人逻辑能力以及数据敏感度的问题.没有接 ...

  5. 逻辑推理篇:数据分析最爱用的估算法:费米估计

    在科学研究中,有这样一类估算问题,初次接触会觉得已知条件太少,无法得出答案,但如果对分析对象进行变通替换,问题就会迎刃而解,这就是费米问题.它可以用来对给定有限信息的问题做出清晰地验证估算. 一.费米 ...

  6. 数据分析笔面试之——费米估计问题

    数据分析笔面试之--费米估计问题 阅读之前看这里

  7. 【数据分析思维】逻辑树分析(费米估算)

    00 写在前面 为什么要写[数据分析思维]这个系列文章?还是回到一个最根本的问题上:数据分析师到底是干什么的? 我相信不仅是想入门的小伙伴,已经入行很久的数据分析师可能多多少少还是会有些不清楚.数据分 ...

  8. 入坑数据分析的几个问题——学习、面试、作报告

    本文盘点了入坑数据分析的几个问题,主要涉及数据分析入门学习策略.面试数据分析岗位工具及业务的考察点.无实习经历如何准备面试以及面试时项目经历如何叙述等问题. 一.问题概览 二.问题解答 问题1:数据分 ...

  9. 算法面试必备-----数据分析常见面试题

    算法面试必备-----数据分析常见面试题 算法面试必备-----数据分析常见面试题 1.统计学问题 问题:贝叶斯公式复述并解释应用场景 问题:朴素贝叶斯的理解 问题:参数估计 问题:极大似然估计 问题 ...

最新文章

  1. CVPR 2020丨UDVD:用于可变退化的统一动态卷积超分辨率网络
  2. PPT模板中的”书签”
  3. Linux-文件查找
  4. CityEngine下如何更好的实现影像与地形叠加
  5. arpanet(阿帕网)
  6. mysql函数之SUBSTRING_INDEX(str,/,-1)
  7. 利用httponly提升应用程序安全性
  8. python项目总结与展望_我做知识星球一周年总结与未来展望
  9. 使用 Python 第三方库 daft 绘制 PGM 中的贝叶斯网络
  10. Activity与Fragment间的通信
  11. 最近啃的有点多了,乱了
  12. ps裁剪和裁切的区别_ps裁剪工具怎么用?调整图像与画布的尺寸(三)
  13. 8.绘制统计图形——直方图
  14. 用来在计算机各功能部件之间,广义相对论确认光在太阳附近会弯曲,引力透镜,水星进动等实验支持广义相对论。()...
  15. pandas与csv的用法笔记
  16. Pytorch中的Conv1d()和Conv2d()函数
  17. 东北育才高中2021年高考成绩查询,东北育才学校2020年高考成绩喜报
  18. C++基础-介绍·数据结构·排序·算法
  19. jdk1.8版本连接Access数据库驱动包
  20. 如何将iPhone投屏到Mac电脑上?iphone投屏到mac方法

热门文章

  1. <吃掉那只青蛙>读后感
  2. 程序员:想静静地写代码,这是正确的吗?千万别让这些观念误导你!
  3. 黑帽python第二版(Black Hat Python 2nd Edition)读书笔记 之 第八章 Windows常见特洛伊木马任务(1)有趣的键盘记录器
  4. jetson nano 环境配置(pytorch+ros+rartographer)
  5. informix-onbar
  6. Arduino Uno资料简介
  7. Android Studio构建时报gradle相关错误的解决办法
  8. Microsoft Graph notifications API 退役
  9. entity、bo、vo、po、dto、pojo、dao、service、controler如何理解和区分?
  10. Vue.js在chrome游览器下下拉菜单无法响应