1、前言:本篇目的在于介绍一种数据预测方式,帮助大家在遇到实际业务需求时找到解决方案!如有不清晰之处,欢迎指正探讨~
假定你的老板,给你这样一个任务,你是否知道怎么解决?老板:小丽,做一个日活预测,看看按照当前策略增量情况下,到年底我们的日活是否能达到400万?如果你对这个问题,不知道如何下手,那么本篇内容,将对你有所帮助~
2、解决方案:
DAU=新用户活跃用户数+老用户活跃用户数(下文的预测,仅介绍对于增量部分的日活预测,存量用户需要考虑时间衰减因素,相较更为复杂,不在本次分享讨论范围)
第2日活跃用户数=第2日新增用户数+第1日留存用户数(其中:第1日留存用户数=第1日新增用户数*第1日留存率)
第3日活跃用户数=第3日新增用户数+第2日留存用户数+第1日留存用户数(其中:第2日留存用户数=第2日新增用户数*第2日留存率)
....以此类推
第30日活跃用户数=第30日新增用户数+第29日留存用户数+第28日留存用户数+第27日留存用户数...+第1日留存用户数(其中:第2日留存用户数=第2日新增用户数*第2日留存率)
设:DAU(n)为第n天的日活,A(n)为第n天的新增,R(n-1)为第n-1天的留存率。则:DAU(n)=A(n)+A(n-1)R(n-1)+A(n-2)R(n-2)+... ...+A(1)R(1)
假设每日的新增用户数是一个固定值,那么基于上面的公式,唯一需要确定的变量则是第1日-第n日,每日的留存率。
留存率怎么求?
大部分产品的留存衰减曲线,基本都是符合幂函数曲线。我们可以通过幂函数来近似拟合留存率的衰减曲线,也就可以顺利的预估出日活模型中需要的留存之和。
案例:假设现在7月1日,我们现有数据如下,第1日留存率、第7日留存率、第14日留存率、第30日留存率,需要我们预测到今年底的日活数据。(下发截图数据,为作者整理的虚拟数据,不代表任意业务数据)
解:
第一步:在excel借助散点图,用已有数据,绘制一个幂函数曲线,得到公式:y = 0.3325x-0.36,其中R的平方=0.9976,一般来说R的平方超过60%,这个结果可以用,越接近1,其结果也越与真实情况接近。因为7月1日-12月31日,相距183天,留存率预测超过50天,其实第≥50日的留存率,可以简单采用一个恒定的值,如下图是模拟的一个处理过程。
第二步:假设每日新增用户数固定是100000,现在我们可以通过每日留存率,来预测每日活跃用户数。每日留存率*每日新增用户数=每日活跃用户数(下文的预测,仅介绍对于增量部分的日活预测,存量用户需要考虑时间衰减因素,相较更为复杂,不在本次分享讨论范围)以下是操作执行的细节:
表单解释:横坐标第1行,是7月1日-12月31日,每天的日期,第二行是第N天,7月1日-12月31日是183天,因此是1-183,第3行是上一步我们预测出来的每日留存率,将它填充到这个sheet表单即可。D4=C4*D3、E4=C4*E3、....,一直算到第183天后的月活,即GD4=C4*GD3,最后我们将第183天的活跃用户数=第183天新增用户数+(1-182天的留存用户数),计算得出的结果就是第183天的日活了,如下图是对应执行细节图: