【数据化运营模型】预估产品收入 新游戏用户规模预测模型
对于任何一个游戏产品来说,用户规模都是基础中的基础。相信不少做游戏数据分析的同学们都被老板问到过这样一个问题,游戏今年有X人,你能否告诉我明年会有多少人?
由于游戏产品受到竞品(剑灵开测端游MMORPG集体滑铁卢)、外部事件(如世界杯春节)、自身运营活动(开个登陆活动活跃瞬间暴涨)等诸多因素影响,要预测用户人数并不是一个容易回答的问题。特别是对于一个成熟产品而言,新用户数量、流失回归用户数量、口碑传播等都会对成熟产品的数量产生影响。而成熟产品的用户成分复杂,流失与否波动性较大,更容易给预测模型带来误差。
相对而言,如果有测试阶段的相关数据,则预测一个新游戏的用户规模会相对容易。但需要说明的是,任何模型都要基于一定的假设才能成立。而这些假设的先决条件,往往在不同环境下有差别甚至不成立。因此,不存在一个通用于所有游戏的模型。本文仅介绍模型建立的思路及方法,细节之处还需根据产品自行调整。
一、模型假设
每日新登录用户 Px
假设条件:对于一个新推广的产品而言,我们假设其原始用户初始为0。
推广第1天进入游戏的新登录用户为P0,推广第2天为P1,推广第X天为Px-1。
假设条件:新登录用户的成分组成不影响其数据表现。
新登录用户中,可以根据来源分为诸如广告获取、活动导入、口碑传播等,在这个模型中将所有用户均视为一个整体。
需要说明的是,在现实推广中,登录用户的成分会极大影响该批用户的数据表现。如通过百度品牌词导入的用户其后期留存充值是网盟用户的数倍。在用户成分组成不稳定的 条件下,做人数预测的误差会很大。
当然,如果要做精确预测,可以将不同成分用户留存表现单独建模,本文不详细说明。
沉淀用户Cx
假设条件:本文为新游戏用户规模预测,因此不考虑流失回流的情况。
沉淀用户可理解为核心用户,这部分用户已经经过了留存急速下降的阶段。留存与否受到新手和产品内容影响较小。当一批用户的留存出现上下波动,且持续了一段时间之后,则可认为该批用户已成为沉淀用户。
沉淀用户的流失率可以用一个普适的流失系数a来表示。一般来说沉淀用户的流失系数都是非常小的。
不同游戏的用户沉淀周期千差万别,本文实例中的沉淀周期为70天。
留存用户Ux
既不属于该日新登,也不属于沉淀用户的用户,定义为留存用户。留存用户由第一日新登用户到本日留存数+第二日新登用户到本日留存数+第X日新登用户到本日留存数组成。
为何要单独将留存用户划分出来而不是和沉淀用户合并为一个类别呢?
因为新用户在进入游戏后的留存率,并不是每天按照一个定值系数递减的,如果这样建模会令结果产生巨大的误差。
总用户数Sx
显而易见,新游戏上线X天后,用户数Sx=Px+Cx+Ux
二、模型构建
假设条件:开服后无论多少天进入游戏,其留存表现无明显差异。
实际上,开服后几天进入游戏,对端游来说留存表现差异明显,后续会用实例进行说明。
留存用户Ux的计算方法:
首先,定义第N天进入游戏的用户在第X天的留存人数为 Pn*f(x-n)
其中,f(x)为留存率预测函数,可使用最小二乘法通过次日、3日、7日留存求得。本文 实例数据计算出的f(x)为对数函数。
则第X天留存用户总数:
沉淀用户Cx的计算方法:
由于我们假设70天之后,用户变为沉淀用户,定义70天后,留存用户变为沉淀用户,则沉淀用户在70+y天后的留存为Pn*f(70)*a^y。
令c=f(70),x=70+y,则沉淀用户计算公式为:
总用户数Sx的计算方法:
规定n=x-1
三、模型实例检验
以下为某款新游戏在测试阶段的数据。基于数据保密原因,实例中结果数据是在真实数据基础上进行了一定的处理。
留存率函数f(x)的获得:
由真实留存率图像看,该曲线拟合应为对数函数,使用回归分析可获得对应的拟合函数。
获得留存率拟合函数后,进行计算:
日期 | 实际登陆数 | 预测登陆数 |
2014/4/16 | 34529 | 34529 |
2014/4/17 | 23357 | 20280 |
2014/4/18 | 19737 | 18767 |
2014/4/19 | 18884 | 18067 |
2014/4/20 | 17718 | 17456 |
2014/4/21 | 20243 | 19925 |
2014/4/22 | 21345 | 21291 |
2014/4/23 | 21623 | 21285 |
2014/4/24 | 20173 | 20929 |
2014/4/25 | 20805 | 20743 |
2014/4/26 | 20284 | 20450 |
2014/4/27 | 17344 | 19845 |
2014/4/28 | 15354 | 19108 |
2014/4/29 | 14736 | 18443 |
2014/4/30 | 14091 | 17861 |
2014/5/1 | 13800 | 17586 |
2014/5/2 | 13724 | 17243 |
2014/5/3 | 13994 | 16981 |
从上表看4月16日~4月26日间,预测拟合效果还不错,但4月27日后拟合出现了较大误差。
那么造成此误差的原因是什么呢?
误差分析及模型修正:
从上图不难看出,推广第1天至第5天,留存率数据表现都差不多,但第六天后,数据表现差异明显,拟合函数已经从对数函数变为幂函数。因此才会造成后期拟合数据的差异。
将开服后6天的留存率拟合函数替换为幂函数后的结果如下:
日期 | 实际登陆数 | 预测登陆数 |
2014/4/18 | 19737 | 18767 |
2014/4/24 | 20173 | 20652 |
2014/4/25 | 20805 | 19726 |
2014/4/26 | 20284 | 18855 |
2014/4/27 | 17344 | 17746 |
2014/4/28 | 15354 | 16532 |
2014/5/16 | 10783 | 10896 |
2014/5/26 | 10166 | 9783 |
2014/6/5 | 8349 | 7713 |
2014/6/15 | 6796 | 6397 |
2014/6/25 | 5506 | 5456 |
2014/7/5 | 5201 | 4651 |
四、模型分析
基于此拟合模型实例,我们可以测试一下,当游戏数据发生以下变化时,游戏用户规模会发生什么样的变化。
次日留存率提高5%:
在导入用户量不变的情况下,30日后用户规模会上升到12951人,比原拟合数据10896提高了18%。
后期导入用户留存率与前期无明显差异:
在导入用户量不变的情况下,30日用户规模会上升至17280人,比原拟合数据10896提高了58%。可见,若不能一周开一服,则应设计活动提升后进玩家的周留存和月留存。基于此用户规模预测模型,结合用户的arpu值等数据和计划的导入用户量,即可粗略预估产品在一般情况下的收入情况。
原文链接:http://ol.tgbus.com/news/cyxw/201411/13641875.shtml
转载于:https://www.cnblogs.com/haobang008/p/6042241.html
【数据化运营模型】预估产品收入 新游戏用户规模预测模型相关推荐
- 数据分析真题日刷 | 欢聚时代2018校招笔试题-产品经理/数据分析/游戏运营/市场专员 A卷
今日真题 欢聚时代2018校招笔试题-产品经理/数据分析/游戏运营/市场专员 A卷(来源:牛客网) 题型 客观题:单选5道,不定项选择10道 主观题:问答4道 完成时间 90分钟 牛客网评估难度系数 ...
- 数据挖掘与数据化运营实战
大数据技术丛书 数据挖掘与数据化运营实战:思路.方法.技巧与应用 卢辉 著 图书在版编目(CIP)数据 数据挖掘与数据化运营实战:思路.方法.技巧与应用 / 卢辉著.-北京:机械工业出版社,2013. ...
- 数据化运营19 传播(上):如何打造千万级的私域运营体系?
<2019 年私域电商报告>显示,阿里京东传统电商获客成本居高不下,流量价格攀升,中长尾商家生存越发艰难.于是,电商卖家纷纷把目光投向了"一次努力,终身免费"的私域流量 ...
- 产品运营模型:AARRR模型
AARRR模型,即Acquisition.Activation.Retention.Revenue.Referral,对应产品用户生命周期的5个重要环节,获取用户.提高活跃度.提高留存率.获取收入.自 ...
- 数据化运营14 洞察与获客:如何⾼效拉新获客?
拉新获客是几乎所有产品最重要的业务板块,但也是最容易被人轻视的板块.之所以说拉新获客容易被忽视,因为我们通常会认为拉新获客就是在外部做一些投放,或者流量交换,再或者抓几个渠道放放活动来吸引用户. 所以 ...
- 数据挖掘与数据化运营实战. 3.8 用户(买家、卖家)分层模型
3.8 用户(买家.卖家)分层模型 用户(买家.卖家)分层模型也是数据化运营中常见的解决方案之一,它与数据化运营的本质是密切相关的.精细化运营必然会要求区别对待,而分层(分群)则是区别对待的基本形式. ...
- 数据挖掘与数据化运营实战. 3.2 目标客户的预测(响应、分类)模型
3.2 目标客户的预测(响应.分类)模型 这里的预测(响应.分类)模型包括流失预警模型.付费预测模型.续费预测模型.运营活动响应模型等. 预测(响应.分类)模型是数据挖掘中最常用的一种模型类型,几乎成 ...
- 数据挖掘与数据化运营实战. 3.5 交叉销售模型
3.5 交叉销售模型 交叉销售这个概念在传统行业里其实已经非常成熟了,也已被普遍应用,其背后的理论依据是一旦客户购买了商品(或者成为付费用户),企业就会想方设法保留和延长这些客户在企业的生命周期和客户 ...
- 【智能零售】数据如何驱动新零售:线上单月 1.2 亿背后的数据化运营
作者简介: 付凌峰,2017 年加入百果园,现数据中心 AI 负责人.此前就职于沃尔玛.卜蜂莲花等大型外资连锁企业,在数据分析.建模与应用实践方面有丰富经验.2010 年起在沃尔玛(中国)总部工作 6 ...
最新文章
- 构建一个LVS-DR模型的高性能集群,并实现Nginx、PHP、MySQL分离
- python3 定义 跨越多行的字符串
- base(C# 参考)
- 自定义Annotation
- Difference between expressions and statements?
- 用vhdl实现4位加减法计数器_频率计数器的使用方法介绍
- 你不知道的BAT大数据面试题
- Java基础学习总结(178)——时候替换你的logback/log4j1了,使用性能更强大配置更简单的log4j2
- Centos源码安装Python3
- 面试题:不使用其他变量交换两个数字
- 阶段3 3.SpringMVC·_07.SSM整合案例_01.ssm整合说明
- Windows内核的基本概念
- MLDN Java学习笔记(3)
- Flutter 使用阿里巴巴icon库
- #Java教程:集合 #Collection、List、Set #ArrayList、LinkedList、Vector、HashSet、TreeSet #一个斗地主小游戏@FDDLC
- Hibernate 马士兵 学习笔记
- 获取手机存储卡路径的一种方法
- 【夜读】2022年最后10天,致自己!
- UE4(Unreal Engine 4)显示FPS
- 【JS中循环嵌套常见的六大经典例题+六大图形题,你知道哪几个?】