How to calculate CLV(customer lifetime value)and predict the salesby retention rate
一、引言
我们80%的销售来之20%的黄金客户(根据28法则帕累托原则),向现有客户销售的成本比找到新客户的成本低10倍不同的用户群体为企业产生不同级别的销售,我们需要识别与重点维护哪些客户?如何用过去的数据推测未来的销售?过去什么样的客户将成为未来给我们销售贡献最多的客户?我们能做的就是找到黄金客户,让他们对我们的服务更加满意,让我们有限的资源和精力能效最大化。CLV的概念可以鼓励企业将周期内利润的重点转移到客户关系的长期健康状态与长期价值上,对企业发展远瞻性更有利。帮助企业了解获客成本,帮助企业定位用户群体,可以将更多的营销工作放在最有意义的细分市场上,可以帮助企业衡量广告ROI。
如果我们提前知道X用户群体将在未来五年带来10 k的收入,而Y用户群体只会产生500美元,我们可以在X用户群体上花更多的营销资金并收获他的全部潜在预算。使用客户生命周期价值标记每个客户有助于企业专注于那些能够在未来带来最大收益的客户。我们可以构建一个面向用户群(并非面向个体)的回归模型,根据对象群体的留存率值,计算并预测新客户群的平均客户生命周期价值(又称平均客户终身价值、CLV)。CLV是一个动态概念,而不是静态模型,客户生命时间值是模型的输出,而不是输入,如果营销有效并且能提高留存率,平均CLV将会增加,回归模型的数据是要随着更多有意义的数据挖掘,随时更新并重新计算。我们将创建过去一段周期的数据集,使用的算法是算数平均法与线性回归。
当然,我们还需要对我们的商业有个清晰的认识,根据不同的商业,构建不同的预测模型。销售一部手机,客户还会在1年内有在此购买吗;销售一次餐饮服务、客户明天会再来吗;销售一堂健身课程、客户会更换教练吗;销售一个游戏充值、客户会玩多久这款游戏;销售一次话费充值,他每月需要充值多少钱;以上这些商业形式里,他们的用户未来行为会有哪些不同?我们需要的是人口统计学知识,去分析他们的商业模式的受众群体,预测体量,然后我们用符合市场趋势的投入力度,在合适的时候开展运营活动(忠诚计划、优惠、套餐等)
二、什么是CLV
来之客户的销售收入减去获得和服务客户的成本 = CLV,我们需要关心的是客户销售收入是多少,获客成本,与服务客户成本是多少,假设在我们的商业模型里,服务客户成本不会随着获客增长而同比增长,并且持续保持一个水平的情况下,我们更关心的是销售收入与获客成本之间的计算关系,在这里我们可能需要考虑获客成本的组成包括第一次(拉新)获客成本,及再营销获客成本。另外因为我们不能完全知道每个用户与我们的关系有多长时间,所以我们一般在描绘CLV时定义一个周期值,比如12个月CLV是xxx美金,24个月CLV是xxx美金,本文后续我是按照36月CLV计算的,不过我也可以随时改为其他周期CLV。
CLV(客户终身价值)计算过程包括四个步骤:
1、预测剩余客户寿命(通常以年为单位)
2、根据对未来购买产品和支付价格的估计,预测未来收入(通常是逐年)
3、估计交付这些产品的成本
4、计算这些未来金额的净现值
从一个减法开始:销售额-成本=利润,
销售额=用户量*用户贡献销售;成本=拉新广告+再营销广告+优惠+损失;利润,本文不对成本与利润过多阐述。
三、关键词定义
留存率的定义:在统计的周期内,在定义了起始事件、定义了事件转化周期的受众群体在一段时间后的相同相同转化周期,发生了留存事件群体数量的相同统计周期的用户占起始事件的受众群体的占比。
这里确定几个定义:
留存颗粒度:日留存/周留存/月留存;
日留存:是指按自然日统计完成起始行为目标用户量并按天来观测后续每天的留存情况;
周留存:是指按自然周统计完成起始行为目标用户量并按周来观测后续每周的留存情况;
月留存:是指按自然月统计完成起始行为目标用户量并按月来观测后续每月的留存情况;
目标用户:目标用户是设定要观测的目标用户人群。比如,要观测新访问用户的留存,那目标用户就设定为新访问用户。
起始行为:起始行为是对目标用户起始行为的限定。比如,如果要观测新用户查看过商品详情之后的留存率是否会有明显提升,那么起始行为可以设定为 "查看商品详情"。我们这里定义的起始行为是成交(后台识别为已发货)
留存行为:某个目标用户完成了起始行为之后,在后续日期完成了特定留存行为,则留存人数 +1;如果某目标用户只完成了起始行为,没有完成相应的留存行为,则留存人数 +0 。
留存图:留存图中默认给出的是留存曲线,跟留存表中的第一行数据对应,切换留存颗粒度时,展示的留存数据会随之变化。留存率曲线会看到随着时间推移的用户留存衰减情况;理想情况是,留存曲线会最终稳定在某个值,这些用户就是我们最终真正获取到的稳定用户。
1 标明了 "目标用户";
2 给出了每天完成起始行为的目标用户量,是留存用户的基数;
3 给出了第 2 部分的用户,在后续每天完成留存行为的用户量和比例,也就是留存人数和留存率;
5722:这个是日期行的 "用户量"一列,代表的是 9 月 18日,"目标用户"中完成"起始行为"的用户量,这是后续用户留存的基数。图中给出的 "日颗粒度",如果是周颗粒度,那么这个单元格中的用户量是当前自然周的获取的用户去重得到的独立用户量。
26.9%:这个是日期行的留存率图中的留存率数据。 给出了统计口径;5722 个满足起始行为的用户,有 1537 个用户在第二天(09月/19日)完成了留存行为。次日留存率的计算:26.9% = 1537(人)/5722(人)
四、预测用户寿命
对于各种商业当中我们一般所说的用户寿命是群体范畴,并不是单指个体,所以这里指的用户寿命指的是对象用户群体的个月留存率,举例2015年11月新成交用户群体(3299人,当月销售671925美金)的未来36月的个月留存率走势,如图可以看到次月留存率最高36.62%(1208人、435145美金),12月留存率12.55%(414人、125580美金),24月留存率6.52%(215人、76294美金),36月留存率4.73%(156人、45021美金)。这样推测猜想48月留存率会是多少,2%?2万美金?这个数字是否需要考虑到用户寿命里呢?
如下图留存量表:我们可以看到2015年11月至2018年11月每月新成交用户(起始行为:下单并已成交),其中2015年11月新成交的3299个新成交用户在36个月后的2018年11月份有156个用户有成交(留存行为:下单并成交),
举例:计算上图做下角36月留存用户,对应的2015年11月新成交用户36月留存p36=n36/n0=4.73%
并同理计算其他月份的留存率,并得到下图留存率表
下图为留存用户带来的销售
五、计算平均用户终身销售价值
(这里写销售价值是与减去成本的平均终身价值区分,成本在计算CLV时非常非常重要,由于本文论述的是方法,所以内容暂时不对成本因素考虑)
为了我们能计算出平均用户终身价值,我们必须要根据已知数据推倒并预测留存率,补全表格,
2015年11月至2018年11月的月留存率,转化周期为1个月,起始行为成交(已发货,)
横轴是月份,纵轴是个月留存率,举例预测2018年11月的次月留存率=(2017年11月次月留存率+2018年12月次月留存率+2018年1月次月留存率+。。。+2018年10月次月留存率)/12=31.91%(下图右侧第一列第三行,第一个留存率,红色次月留存率)
面对每个月份的次月、2月、3月、4月直到36月留存率预测,叠加如下图
次月留存率最大值为2016年11月37.75% 次月留存率最小值为2018年10月27.85%
在7月留存率出现一个较明显的最宽区域,最大值2017年10月留存率,2016年11月留存率11.11%
次月留存率一直下降明显,其他的留存率变化不明显。
根据过去36个月数据,平均用户终身价值(V平均)的定义:举例2015年11月当月新成交的用户3299个(n新),如下表:
就目前数据而言我们可以准确看到2015年11月新成交用户群体的36月CLV,从2015年12月开始的个月新成交用户群体的36月CLV都是需要预测
平均用户终身价值公式V平均=(s0+s1+…+s36)/n0
2015年11月V平均=(s0+s1+…+s36)/n0=1611.03美金
2015年12月V平均=(s0+s1+…+s36)/n0=??美金(s36预测值)
2016年11月V平均=(s0+s1+…+s35+s36)/n0=??美金(s35、s36预测值)
……
2018年11月V平均=(s0+s1+…+s35+s36)/n0=??美金(s1…s35、s36预测值)
下图为2015年11月至2018年11月,36个月的新成交用户平均用户终身价值(36个月平均CLV)预测走势,为什么是预测走势呢,这里需要解释一下,是因为目前只有2015年11月及之前的成交用户有36个月留存跟踪,2015年12月及以后的月份都没有36个月,需要根据预测算法来给出。具体预测方法前文提到。我们当下的销售总额是来之于老客户支撑贡献。
六、成交会员人数预测
成交会员人数预测是销售预测的基础,之后再结合平均客户销售贡献可计算并预测销售额,成交会员人数预测方法多种多样,我们所研究的成交会员数预测不是对结果的估计,更多的我们需要研究的是,销售目标向下分解的各个kpi(用户量、转化率、留存率等)指标的计算关系,以指导团队对工作效果与最终销售结果建立合理的计算公式,并加强对运营工作的信心,因为我们日常运营工作各项活动可影响的范围与各项kpi更接近,对中、长期的影响难以数据可视化。
留存率趋势分析
根据分析发现,每个月的新成交用户群体的当月平均客户贡献销售额较低180美金左右,每个月的新成交用户群体的次月留存最高维持在27-37%,并随着时间推移不断降低,2月留存率到36月留存逐渐递减,但是平均客户贡献销售额稳定在300-400美金之间,不过这些数字暂时为呈现明显规律,并一般不与时间推移进行规律的变化,初步怀疑客户贡献销售额与用户刚需有关。当然在201605、201802月份次月留存有个突降需要进一步研究。
下月销售额预测公式:
下月销售额=下月新用户成交预测量(市场推广目标量)*下月新用户平均贡献预测销售额+历史各月留存到下月的预测用户量之和*校正系数R*留存用户平均贡献预测销售额
举例:我们现在的时间是2018年10月份,我们打算预测2018年10月份(未过完)、11月份的成交会员人数、新成交会员人数、留存成交会员人数、修正系数R、新成交会员平均贡献销售额、留存会员平均会员销售额,我们可以已知(至少已知)以下数据:
为了方便解释算法转化为下图
N新:新成交会员人数,举例,N12新代表第12个月份内成交的新会员数量,月去重
N留:留存成交会员人数之和,举例,N12留代表第12个月份成交会员数-新成交会员数,即历史成交的过的会员在本月有留存行为(成交)的会员数量之和,月去重
N:当月成交会员人数总和,举例,N12代表第12个月份成交人数,月去重。
n:月留存人数,举例,n1210代表第12月份成交的会员数量在10个月后的第22月份有留存行为(成交)的会员数量
p:月留存率,举例,p1210=n1210/N12
把空白补全并标红,红色代表需要预测的部分
第一步,根据留存率趋势分析用过去12个月算数平均数的算法预测未发生的留存率。
举例:p1312=(p112+p212+…+p1212)/12;
举例:p1612=(p412+p512+…+p1512)/12其中p1512是预测值
第二步,根据预测的留存率p乘以当月实际成交的用户量N,计算获得月留存人数n。
举例:n1312=N13*p1312
计算获得以下结果
其中,N201810新、N201810留、N201810、N201811新、N201811留、N201811是需要计算预测的,N201810新、N201811新需要根据市场情况分析预测,在此不深入论述。N201810= N201810新+N201810留、N201811=N201811新+N201811留、所以,我们需要唯一预测的是N201810留、N201811留。
由于2018年9月的次月留存用户、2018年8月的2月留存用户、…、2017年10月的12月留存用户会在2018年10月发生留存行为(成交),得出公式:N201810留=n2018091+n2018082+n2018073+…+n20171012,在此需要考虑2个问题,第一,我们并没有考虑2017年9月份乃至更早月份成交用户在2018年10月的留存用户,假设我们可能不能考虑全部历史留存过来情况;第二,,根据这个算法很明显和非常大,因为某用户在2017年10月到2018年9月都有可能发生留存行为(成交),所以这个“总和”会有大量重复用户相加,所以我们需要引用一个修正系数R,来修正这个值,这个R值也是需要根据历史情况预测
整理公式:N留=(n1+n2+…+n12)*R
N201810留=(n2018091+n2018082+n2018073+…+n20171012)*r201810
N201811留=(n2018101+n2018092+n2018083+…+n20171112)*r201811
修正系数R值预测
我们在数据表里加一行“修正系数R”面对每个月的修正系数,进行标记r1、r2…r25红色代表需要预测的,我们需要先计算出所有历史的修正系数R
我们定义修正系数R=当月留存成交用户/历史个月留存用户之和(不去重),举例:r13=N13留/(n121+n112+n103+n94+n85+n76+n67+n58+n49+n310+n211+n112+)
计算得到下表:
分析系数趋势,备注2017年1月份、2月份数据与当期匿名购买有关,导致本应该识别到的重复用户无法识别出来造成系数偏大,修正系数预测红点,线性法预测2018年10月的修正系数r201810约等于0.1911,r201811约等于0.1891或用算数平均算法r201810=(r201710+r201711+…+r201809)/12=0.196969,r201811=(r201711+r201711+…+r201810)/12=0.196944
本次用算数平均数法预测修正系数为r201710=0.196969,r201811=0.196944,及公式:N留=(n1+n2+…+n12)*R,并假设2018年10月,11月份新成交用户分别为2400、2400得到下表:
得到预测2018年10月份总成交人数为15965(新成交人数为2400、留存成交人数13565),11月份总成交人数为15790(新成交人数2400、留存成交人数13390)
取2016年1月份至2017年12月留存用户数据表,预测2018年各月成交会员量,校验结果:
误差率分析,最大误差发生在2018年2月,还有2次大于5%的误差,其余都小于5%
七、销售额预测
销售额=新成交人数*新成交会员平均贡献销售+留存成交人数*留存成交会员平均贡献销售
新成交会员平均贡献销售
根据之前的新成交会员平均贡献销售额分析,2015年12月至201810月新成交会员趋势稳定,所以使用算数平均法预测新成交会员平均贡献月销售,某月新成交会员的平均贡献销售额=过去12个月新成交会员的平均贡献销售额之和除以12,公式为:
继续之前的举例:我们现在的时间是2018年10月份,我们打算预测2018年10月份(未过完)、11月份的新成交会员平均贡献月销售额,2018年10月份的新成交会员平均贡献月销售用
表示
新成交会员的销售额
留存成交会员平均贡献销售
留存成交会员平均贡献销售分析,2015年12月至2018年11月留存成交会员趋势分析,趋势稳定所以使用算数平均法预测留存成交会员平均贡献月销售,
继续之前的举例:我们现在的时间是2018年10月份,我们打算预测2018年10月份(未过完)、11月份的留存成交会员平均贡献月销售额,2018年10月份的新成交会员平均贡献月销售用
表示
留存成交会员的销售额
销售额预测表如下:
销售预测的误差分析,正负误差10%可控
按照以上模型,假设2019年每月新成交会员人数达到2400,成交会员人数、日、周、月留存率没有得到提高、修正系数R不变、新成交会员平均贡献销售额不变、留存会员平均会员贡献销售额不变,那么我们2019年全年销售的预测结果是4904万美金,考虑误差在正负10%,最高销售不超过5394万美金,最低不低于4413万美金
八、结尾
由此可见新客户量、留存率、客单价这些关键点与销售额之间的计算关系,根据本文方法,可以深入分析用户群体细分受众,找出影响商业成本的黄金客户群体,这样可以衡量市场投放ROI,并聚焦团队的认识认知。接下来对CLV与销售预测程序建模模型,机器学习,自动修正。
计算CLV与销售预测仅是一个开始,以终为始更进一步考虑杠杆点,采取哪些措施轻轻力去撬动地球,这是个否定之否定的度量过程,我们应对从一个产生重大变化的微小动作开始。宏观上说说,如何能提高CLV与销售,个人建议是第一是客户服务(这里指的服务不是狭义的服务接待),这是一个简单的事实,基本每个人都同意,这是大多商务成功的关键;第二是,产品用户体验,与客户服务一样对留存率的影响是非常非常关键的,可能是一个元素的添加,或者字体的改变,或者适当的链接,都是提高留存率的触点,虽然力很轻,但是它会撬动杠杆的另一头。