如何计算用户生命周期价值(CLV)

在用户关系管理中,常会遇到些直击灵魂的问题:

  • 这批用户到底价值几何?

  • 为什么要用这种措施去干预用户,而不是另一种方式。

  • 为什么干预这类用户,而不去干预另一类,他们的划分标准是什么。

有这些问题,实质是因为对客户价值不够了解,缺乏行之有效的划分方式。

用户精细化运营价值巨大

随着人口红利的消失,增长逐渐见顶,急需在现有用户池做学问。过去粗放式的买量策略已经不再生效,一是买量成本逐渐高企,二是买量带来的用户忠诚度极低。对现有客户群体的划分和互相倒流,成为重中之重。行业中的黑话“洗用户”,即是讲的这一策略。

对于如何划分用户,不用的职能会有不同的看法。产品有产品的看法,可能基于某项功能偏好;运营有运营的看法,是各种活动玩法的定义;甚至领导还有他的一套看法。但是,无论怎么切入,商业的核心拿捏住,才会八九不离十。

什么是商业的本质:商业的本质是获利。因此,我们从用户的货币价值切入,评估和划分用户的生命周期。

用户生命周期价值,这并不是学界的新鲜产物,该理论在上世纪80年代就已经提出。但对于互联网,网上可搜寻到的资料少之又少。可能的原因有两个:一是互联网在过去20年快速爆发,风口上躺着也能赚钱;二是各家的策略内部不统一,无法形成统一的口径。

但这些都不是不去应用他的理由,反而说明其中价值巨大。这里,我们剥离开复杂的商业逻辑,仅从交易入手,分析用户的生命周期价值,以及用户所处的状态。

用户生命周期价值(CLV)

随着精细化运营的铺开,过去粗放式的、买量用户已经不再买账。每个用户所能接受的最低服务各不相同。如何根据用户价值,进行资源的有效利用。最大化杠杆的使用,成为企业生死的关键。

过去,没有统一的理论出现在互联网应用或是游戏中。但是,运用跨学科的思维,就可以发现:市场营销领域已进行过研究,并给出了精度极高、可解释性强的模型方法。

这种方法,就叫做用户生命周期价值,英文名称 Customer Life Time Value,简称 CLV 或者 LTV。

CLV 是什么

用户生命周期,是一种刻画用户的方法。一般用来解决两类问题:

  1. 用户还有多少价值、用以衡量投入产出比
  2. 在干预用户后,根据用户生命周期价值的变化,优化资源的投放。

即用户管理的两个核心问题:用户所具备的价值以及策略的有效性。

需要注意的是,CLV 的产品形态要求非合约。合约在国内最有代表的是合约手机。一般互联网产品,合约形态较为少见。

CLV 的用户群体需已经产生交易,未付费用户不纳入考量。当然,概念迁移,将付费换成活跃或内容消费,该模型也能处理。

CLV 回答哪些问题

用户活跃还是流失,用户还有多少付费潜力,用户在未来某段时间会否再次购买。这三个问题,是用户生命周期价值能够回答的。

如何在自家产品中引入 CLV

应用场景

  • 判断用户所处生命周期阶段
  • 预测用户指定周期内购买概率
  • 预测用户的生命周期价值
  • 通过历史付费数据,预测未来付费

活跃与流失的定义

定义:

用户有交互为活跃

用户一段时间不交互,即为流失

lifetims 工具包引入

安装 python 的工具包:

pip install lifetimes

CLV 数据挖掘

用户生命周期判定,需要三个指标

  1. frequency 用户登录的频率,这里为周期内的天数
  2. recency 用户的最大周期,即第一次活跃到最后一次活跃
  3. T 用户所处阶段,第一次活跃到观察周期结束

对于付费预测,还需要用户的平均付费金额。

数据获取

从数据库获取

    SELECT
      customer_id,
      COUNT(distinct date(transaction_at)) - 1 as frequency,
      datediff('day', MIN(transaction_at), MAX(transaction_at)) as recency,
      AVG(total_price) as monetary_value,
      datediff('day', CURRENT_DATE, MIN(transaction_at)) as T
    FROM orders
    GROUP BY customer_id

python 处理

    from lifetimes.datasets import load_transaction_data
    from lifetimes.utils import summary_data_from_transaction_data
    
    transaction_data = load_transaction_data()
    print(transaction_data.head())
    """
                      date  id
    0  2014-03-08 00:00:00   0
    1  2014-05-21 00:00:00   1
    2  2014-03-14 00:00:00   2
    3  2014-04-09 00:00:00   2
    4  2014-05-21 00:00:00   2
    """
    
    summary = summary_data_from_transaction_data(transaction_data, 'id', 'date', observation_period_end='2014-12-31')
    
    print(summary.head())
    """
    frequency  recency      T
    id
    0         0.0      0.0  298.0
    1         0.0      0.0  224.0
    2         6.0    142.0  292.0
    3         0.0      0.0  147.0
    4         2.0      9.0  183.0
    """
    
    bgf.fit(summary['frequency'], summary['recency'], summary['T'])
    # <lifetimes.BetaGeoFitter: fitted with 5000 subjects, a: 1.85, alpha: 1.86, b: 3.18, r: 0.16>


from lifetimes.datasets import load_cdnow_summary
data = load_cdnow_summary(index_col=[0])

print(data.head())
"""
     frequency   recency      T
ID
1    2           30.43       38.86
2    1            1.71       38.86
3    0            0.00       38.86
4    0            0.00       38.86
5    0            0.00       38.86
"""

BG/NBD 模型

BG/NBD 是一个经典模型改进型,详细的数学论证参见:A Note on Deriving the Pareto/NBD Model and Related Expressions

该模型有如下假设:

assumptions.jpg

通过模型拟合,得到4个参数。

from lifetimes import BetaGeoFitter

# similar API to scikit-learn and lifelines.
bgf = BetaGeoFitter(penalizer_coef=0.0)
bgf.fit(data['frequency'], data['recency'], data['T'])
print(bgf)
"""
<lifetimes.BetaGeoFitter: fitted with 2357 subjects, a: 0.79, alpha: 4.41, b: 2.43, r: 0.24>
"""
bgf.summary
bgm.jpg

效果可视化

from lifetimes.plotting import plot_probability_alive_matrix

plot_probability_alive_matrix(bgf)
frequency_recency.jpg

右下角为最佳客户,交易频率高。交易跨度大;右上的客户短时多次交易,极可能已流失。

预测单个用户的购买行为

t = 10 #predict purchases in 10 periods
individual = summary.iloc[20]
# The below function is an alias to `bfg.conditional_expected_number_of_purchases_up_to_time`
bgf.predict(t, individual['frequency'], individual['recency'], individual['T'])
# 0.0576511

生命周期价值预测

在预测价值时,需要第四个参数:用户交易的次均金额。

该模型有个重要前提:购买频次和购买金额无相关性。具体可参考 The Gamma-Gamma Model of Monetary
Value

from lifetimes.datasets import load_cdnow_summary_data_with_monetary_value

summary_with_money_value = load_cdnow_summary_data_with_monetary_value()
summary_with_money_value.head()
returning_customers_summary = summary_with_money_value[summary_with_money_value['frequency']>0]

print(returning_customers_summary.head())
"""
             frequency  recency      T  monetary_value
customer_id
1                    2    30.43  38.86           22.35
2                    1     1.71  38.86           11.77
6                    7    29.43  38.86           73.74
7                    1     5.00  38.86           11.77
9                    2    35.71  38.86           25.55
"""

相关性检验

returning_customers_summary[['monetary_value', 'frequency']].corr()
"""
                monetary_value  frequency
monetary_value        1.000000   0.113884
frequency             0.113884   1.000000
"""
from lifetimes import GammaGammaFitter

ggf = GammaGammaFitter(penalizer_coef = 0)
ggf.fit(returning_customers_summary['frequency'],
        returning_customers_summary['monetary_value'])
print(ggf)
"""
<lifetimes.GammaGammaFitter: fitted with 946 subjects, p: 6.25, q: 3.74, v: 15.45>
"""

次均估计

print(ggf.conditional_expected_average_profit(
        summary_with_money_value['frequency'],
        summary_with_money_value['monetary_value']
    ).head(3))
"""
customer_id
1     24.658619
2     18.911489
3     35.170981

总价值估计

最后,使用 DCF 现金流折现,得到用户总体价值的当下估值。

# refit the BG model to the summary_with_money_value dataset
bgf.fit(summary_with_money_value['frequency'], summary_with_money_value['recency'], summary_with_money_value['T'])

print(ggf.customer_lifetime_value(
    bgf, #the model to use to predict the number of future transactions
    summary_with_money_value['frequency'],
    summary_with_money_value['recency'],
    summary_with_money_value['T'],
    summary_with_money_value['monetary_value'],
    time=12, # months
    discount_rate=0.01 # monthly discount rate ~ 12.7% annually
).head(3))
"""
customer_id
1      140.096211
2       18.943467
3       38.180574
Name: clv, dtype: float64
"""

总结

用户生命周期价值模型,不同于其它模型。该模型对每个用户单独建模,而不是硬性的按流失天数划分,有极强的灵活性。在得到用户生命周期阶段、以及用户的生命周期价值,下一步就是具体应用了。

落地场景多种多样,但要推动上下游,仍需要足够信服的理由。这里给到的建议是,去模拟历史的数据表现,用数据说明效果。

喜欢本文的朋友,别忘了点赞 👍、喜欢 ❤ +关注 🔔哦,您的小小举动,是对作者最大的支持~💪

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,558评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,002评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,024评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,144评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,255评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,295评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,068评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,478评论 1 305
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,789评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,965评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,649评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,267评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,982评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,800评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,847评论 2 351

推荐阅读更多精彩内容