在互联网公司,数据指标是一种非常重要的资源,不管老板,产品经理,运营人员都在关注数据指标。老板经常会问最近产品的数据情况怎么样啊?怎么这两天产品的下载量突然极速下滑了啊?面对老板的问题,作为一位数据分析师,必须搞懂互联网行业的常用数据指标。本文通过用户、行为、业务三个方面为大家介绍常用的数据指标。

首先我们来看什么是数据指标?

用大白话来说,数据指标就是对于当前的业务有参考价值的一种统计数据。我们拆解这一句话得到了两个标准:

(1)可统计,可被观测的数据。

(2)对当前业务有参考价值的数据

比如某超市最近在门口做了一次营销活动,我们怎么衡量这个活动是否有效呢?

我们的业务目标是通过这次活动来售卖更多的商品。售卖商品可以联想到“销售额”和“利润率”,但有了这两个还不能表达“更多”,所以还需要添加“销售增长率”,那怎么来衡量活动的吸引力呢?要证明“有吸引”,就要在同等路人数量的情况下对比活动前后进店客户数量的变化,但我们不能保证每天的路人数量都一样啊,所以还需要把单位化成“平均每人进店的可能性”,也就是对比活动前后的“进店率”和“下单率”。

具体怎么知道什么指标对业务有参考价值呢?

抛开指标的概念,通常来说当我们去评价一个业务的时候,无非就是看这三个方面,我们想知道的就是 谁,干了什么,干完之后结果怎么样?抽象出来就是用户群体、用户行为和业务表现,对应的指标分别是用户数据、行为数据和业务表现数据。

常见的用户、行为和业务指标有哪些?

一、常见的用户群体数据可以从四个方面描述:

存量、增量、质量(健康程度)、来源(渠道)

1、存量(活跃用户、注册用户等):描述一个产品的用户群体规模有多大

1.1 、DAU(Daily active user) or MAU(Monthly active user):细分下来有日活用户 or 月活用户等等,接下来对“Daily”、“Monthly”、“active”、“ user”关键词进行拆解

1.1.1 、Daily:定义了每天,在中国就采用北京时间;对于出海跨时区业务,我们需要对所有国家采取统一的标准,统一采用某时刻最近的24h

1.1.2 、Monthly:一个月当中的每天加起来可以得到每月,但MAU不等于每日的DAU之和,因为每日的DAU可能会重复出现,单纯相加不具有参考价值,应该进行去重处理

1.1.3 、Active:什么叫“活跃”呢?我们认为只有使用了产品的核心功能,执行了关键事件的用户才叫活跃用户。研发在埋点的时候要注意,只有用户主动使用了产品的核心功能才向数据统计平台上报一个事件,而不是在客户不主动的时候也上报事件。 一个产品在不同的发展阶段可能有不同的核心功能,核心功能数量会随着时间的推移越来越多,在统计的时候需要把每个核心功能都考虑进去。为了降低维护成本和沟通成本,我们可以制作一个“日活事件列表”,把它尽量放在大家触手可及的地方,每次更新时都及时让全公司知道。

1.1.4 、User:在零售行业,每个客户都有唯一的ID,我们可以比较容易分辨出来。但是在互联网行业,一个用户可能会有多台不同IP的设备登陆网页,一台设备在不同的时间可能又会有不同的IP地址,同一个设备可能又会被不同的用户使用。那么到底是按“人”来统计还是按“设备”来统计呢?

主要取决于我们的业务场景

2、增量(新增用户)

业务场景:我们去做app推广的时候,需要找很多的渠道,市场运营的同学会去跟这些渠道商合作,最后会依据渠道为我们带来的新增用户数进行一个结算。那这个“新增用户”到底怎么计算呢?一般各公司甚至各部门的口径都会不太一致,渠道商会认为,只要用户在他的推广页面点了下载按钮,就算一个“新增用户”。但市场运营的同学会说,总得下载成功了才算吧!而且我觉得一个用户一天最多算一次,要不然一个用户每天点十次,那我这个钱就冤枉了!但对于产品的同学,觉得下载成功不算什么,万一没有安装呢?应该按用户启动量来算。但研发的同学又说,注册了才叫“新增用户”,否则后台压根没这条数据!大家可以看到,虽然每个角色都在提“新增用户”这个词,但其实每个人讲的“新增”其实是不一样的。我们要知道数据指标的定义没有绝对的对错之分,只能根据具体的业务场景来定义。那在这个场景里面,我们谈的“新增用户”到底是什么呀?要搞清楚这个,我们先定义什么叫“增”?我们定义只要用户在业务流程上某个节点出现了就算是一个“增”

那接下来我们怎么选择节点呢?对于企业而言,通常的想法是利用有限的资源去产生最大的效益。我们可以用不同节点的优劣势来界定不同的业务场景,反过来基于业务场景来选择合适的节点。

怎么判定这个用户是不是“新”呢,因为“增”并不等于“新”啊。如果一个用户三天前安装了又卸载了,今天又安装了,那算不算“新”呢?

①基于设备(iOS、Android、web各有门道)

②账号关联(与后台已有的账号比对匹配)

3、用户质量(留存率)

业务场景:假设一款产品发布之后第一天获取了10位用户,在获取这10位用户之后呢,再也没有新增用户了。在这种极端情况下,如果是说第一天是10个DAU,第二天是8个,第三天3个,依照着这样的情况走下去,这个月的MAU就是10,对吧?因为这个产品总共就只有10位用户,按照前面的MAU的算法结果就是10。但如果我问这个产品的七日留存率是多少?这个时候去问不同公司或者是不同部门的人,大家都会有不同的说法。那具体的分歧在哪呢?

3.1、第一种七日日留存:用第七天的人数/第一天的人数

我们用最后一天的4位用户去除以我们第一天新增的10位用户,算出来是40%。老板看到之后觉得有点低,觉得这个产品质量不太行。

3.2、第二种七日内留存:用七天以内的去重的人数/第一天的人数

产品部听到后,说第一种七日日留存算法里面,中间的那些用户对业务都有贡献,但都被扔掉了,这个算法不科学啊。应该把这七天的用户全加起来,然后再去重,这样留存率就是90%,产品质量还是很好的!

这就是我们日常经常会遇到的一些争论,那到底哪个算法是正确的呢,这个时候就要回归到我们业务当中,具体问题具体分析,就是我们目前为什么要看留存?

3.3、了解某个渠道的质量——七日日留存

我们为什么要采用第一种算法来衡量渠道的质量呢?

假设我们现在有两个渠道A和B,在第一天同样获取了10000个新客户,第二天A渠道留存的用户数比B渠道的用户数要多,但是第七天A渠道留存的用户数比B渠道的用户数要少,如果按照第二种七日内留存算法,渠道A的质量是好过渠道B的质量的,但是渠道A最后引入的用户数要少于渠道B的,渠道A的质量应该没渠道B的质量好才对,因此我们要采用第一种算法。

那我们是不是只看一次七日日留存情况就可以衡量渠道的质量了呢?如果当天外 界因素对用户产生了过多的干扰,过多影响了我们的用户数,那也不能准确地衡量渠 道的质量。所以我们要采用空值变量法,设置对照组实验

假设1月1日有x个新增用户,1月7日还有y个用户活跃,则七日日留存=y/x=7.83%

设置对照组,在2月份相同的天数再算一遍,消除误差

假设2月1日有m个新增用户,1月7日还有n个用户活跃,则七日日留存=n/m=7.22%

所以七日日留存,只关心到特定日的留存情况,避免了其他日数据的干扰,以“X日日留存”作为比较标准时,可以避免其它日数据的干扰

3.4、产品的质量——七日内留存

如果产品比较特殊,用户只在一周之内的特定时间活跃,比如一个面向用户是学生的产品,学生平时要上学,用不到,只有在周六周日才会去使用你的产品,又或者说这是一个只在工作日上班的时候才有用的产品,在周末的时候是没有人会用的,那如果采用第一种算法就会产生较大的误差,所以只能选择第二种算法。因此七日内留存适用于有固定使用周期,且周期较长的业务

特殊情况下,我们还可以以“八日日留存”或“三十一日日留存”为标准,来衡量渠道健康情况,因为第八天的工作日和第一天的工作日相同,第三十一天的日期和第一天的日期相同,消除了更多的误差

同样也可以以“次周周留存”或“次月月留存”为标准,来衡量产品的健康情况,观察用户在平台上的粘性

二、常见的行为数据可以由四个方面描述:次数人数、时长、路径深度、质量(会话)

1、次数 or 人数(PV or UV or 访问深度DV)

业务场景:某天5个用户来到某电商网站,总共访问了13次首页;在13次首页访问中,有8次点开了商品详情页;最后有2个用户注册了会员;这2个用户中后续有1个购买了商品。我们把上面的步骤用下图表示,并且把每一步涉及到的PV(次数)和UV(人数)分开进行表述

老板突然过来问最近的情况:

来了多少用户?访问情况如何? → 来了5个,访问13次,人均2.6次

首页转化效果如何? → 有8/3=62%的人进入课程详情页

有多少用户注册了? → 来的5个人当中有2个人注册了,占40%

注册了的用户又有多少付费了? → 这2人有1个付费了,占50%

从上面的回答我们可以得出

1.1、PV

描述的是所有用户的浏览页面的数量或者行为次数(如点赞),当我们评价一个页面的表现质量的时候,我们用PV和两个步骤之间PV的比值来表述;

1.2、UV

描述的是所有独立的用户的数量,当描述用户对下一页面的倾向程度时,我们用UV和两个步骤之间UV的比值来表述

1.3、访问深度DV(PV/UV):用户平均每次会话浏览的页面数,表示用户体验度和网站的粘性。

2、会话时长

次数只能从整体上衡量行为情况;用户在某个网页驻留一分钟或者半个小时所表现的兴趣程度是不一样的,比如标题浮夸的广告文和内容质量高的文章。统计时长可以了解内容被消费程度、内容质量

那如何统计呢?

通常情况下我们会根据用户的特殊行为(记录暂停/关闭页面后的进度)来计算访问时长,而不是计算待会话自动关闭时的访问时长,因为在APP时代,用户在打开一个页面后可能会把手机扔在一边,导致访问时长长但无效的数据。

3、路径深度(转化率)

对用户某些关键行为的访问次数,将网站/内容分成几个层级,以用户本次访问过最深的一级计算

3.1、转化率:流程转化(PV/PV,UV/UV)

4、会话质量(弹出率)

4.1、弹出率:指整个网站所有会话中用户来了立即就走的比例,它不是基于用户也不是基于页面的数据。

4.1.1、网站只有一个页面,每位用户只访问一次的情况:弹出率100%

4.1.2、网站有多个页面,每位用户只访问一次的情况:3/6=50%

4.1.3、网站有三个页面,用户不只访问一次的情况,把每次访问的用户都看成是一个新用户来计算:6/10=60%

三、常见的业务数据, 描述业务本身的发展,可以从总量、人数、人均、业务质量(健康程度)

业务场景:某电商公司老板想问一下商铺最近情况:

一共卖了多少钱?

有多少顾客?

顾客消费水平怎么样?

有多少顾客消费了?新顾客和老顾客占比多少?

我们的商品好不好卖?

这些业务问题是老板最关心的问题。那我们具体可以看哪些指标呢?

1、总量(GMV or 播放时长)

描述业务目标完成数量

1.1、GMV

描述交易完成金额总规模

1.2、播放时长

描述视频or音频播放时长

2、人数(付费人数or播放时长)

描述完成业务目标的人数

2.1、付费人数

描述愿意为服务付费的人数总规模

3、人均(ARPU or ARPPU or 人均播放时长)

描述人均访问时长

3.1、ARPU:描述每个用户的平均贡献价值

3.2、ARPPU:描述每个付费用户的平均贡献价值

4、业务质量(付费率 or 付费频次 or 播放率):使用产品核心功能的用户所占比例

4.1、付费率/付费频次

描述总体上的用户付费意愿,评判一个产品或服务的健康程度

5、被消费对象(SKU视角)

从用户视角转换为物品视角,可采用上述计算方式计算结果

5.1、SKU视角:被消费对象产生了多少用户行为,多少消费金额

本文从用户、行为、业务三个方面为大家介绍了常用的数据指标,但实际的商业模式往往会比较复杂,覆盖的业务板块非常多,单单用这些指标是不能完全衡量完全的。所以在后续我们还需要具体问题具体分析,结合相关的商业模式,对业务模块进行拆解,选取合适的数据指标。

原文链接: https://zhuanlan.zhihu.com/p/129633055

常见的互联网数据指标相关推荐

  1. 互联网常见通用的运营数据指标

    文章目录 一.常见通用数据指标 1.用户基础信息字段 2.行为数据 1)社区产品的关键用户行为字段: 2)电商产品的关键用户行为字段: 3)评估拉新指标-效果数据: 4)评估活跃指标-效果数据: 5) ...

  2. 上海市经济信息化委关于支持新建互联网数据中心项目用能指标的通知

    有关单位: 根据<上海市推进新一代信息基础设施建设助力提升城市能级和核心竞争力三年行动计划(2018-2020年)的通知>(沪府办发[2018]37号)总体要求,我委组织相关专业机构和行业 ...

  3. 产品经理 : 最全的运营数据指标解读

    业务是一个复杂体系,数据分析也从来不简单,两者结合都是充满挑战的.作者总结了一份全面的运营数据指标,希望给大家的工作带来帮助与启发. 运营和数据分析脱离不开关系.业务的洞悉决定了数据分析结果的上限,数 ...

  4. 强烈推荐 :最用心的运营数据指标解读

    数据分析涉及不同的业务领域,很多时候,业务的了解比数据技巧更重要.很多新人常问Python.SQL,但鲜有问业务,可后者才决定分析的成败. 业务的洞悉决定了数据分析师发展的上限,数据技巧只是逼近它.好 ...

  5. 详解数据仓库数据指标数据治理体系建设方法论

    一.数据仓库 数据仓库概念 英文名称为Data Warehouse,可简写为DW或DWH.数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support).它出于分 ...

  6. 数据仓库amp;数据指标amp;数据治理体系搭建方法论

    数据仓库的基本概念 数据仓库概念 英文名称为Data Warehouse,可简写为DW或DWH.数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support).它 ...

  7. APP活动运营:应关注哪些数据指标?

     活动策划(准备阶段)需要思考哪些数据指标 策划一个活动,肯定要明确自己做活动的一个目的是什么?更偏重的是品牌传播.拉新?还是更多为了活跃用户,提高用户留存?通过活动想达到什么样的具体效果?因此在 ...

  8. 最全的运营数据指标解读

    本文是<如何七周成为数据分析师>的第十七篇教程,如果想要了解写作初衷,可以先行阅读七周指南.温馨提示:如果您已经熟悉业务基础,大可不必再看这篇文章,或只挑选部分. 数据分析涉及不同的业务领 ...

  9. 标签 VS 数据指标,一文搞懂概念与区别

    一.标签体系相关概念 标签由标签和标签值组成,打在目标对象上,如图所示. 打标签示例 标签由互联网领域逐步推广到其他领域,打标签的对象也由用户.产品等扩展到渠道.营销活动等. 在互联网领域,标签有助于 ...

最新文章

  1. AtCoder Beginner Contest 197 题解(A ~ F)
  2. PowerDesigner与Rose详解教程
  3. 2019.3.18 异常处理和日志相关
  4. Be the Winner(结论:反nim博弈)
  5. Redis事务深入解析和使用
  6. CWNP认证和Cisco无线认证区别
  7. php函数trim(),php trim函数怎么用?
  8. html标签属性值拼接,js拼接url以及为html某标签属性赋值
  9. Django-ROM(字段,参数)
  10. 数据结构上机实践第三周项目1
  11. 1.Kubernetes 简介
  12. 去掉txt文本某些字符
  13. DirectX修复工具强力修复实验包
  14. 从盘古开天辟地说起JVM性能调优
  15. 【Android】Android外接音源设备之小蜜蜂坑
  16. 在html中加上时钟,Html5绘制时钟
  17. Kali下卸载程序和安装程序的方法
  18. 倍福PLC基于NT_Shutdown实现控制器自动关机重启
  19. 15个常用excel函数公式_【Excel公式函数】一大波常用的日期公式来袭,强烈建议收藏!...
  20. 图神经网络对抗攻击的研究学习(一)

热门文章

  1. C# SSL/TLS - 提示错误:“调用 SSPI 失败,请参见内部异常。”
  2. turtlebot深度相机_Turtlebot入门-测试Kinect
  3. 领导暴怒发言:技术就是古代的叫花子,贱命一条!
  4. python局部变量转全局变量_python局部变量和全局变量
  5. (Pycharm新版专业版)初次部署无法同步文件,报错信息:找不到要处理的文件或文件夹
  6. linux下载TCGA数据,TCGA数据库讲解与数据下载
  7. windows的命令提示符问题
  8. 科技哲学学期要点归纳
  9. web项目中填写sql信息自动动态生成报表功能(springboot)
  10. [zz]基于flashplayer的视频播放优化