背景:将每月中旬将上月充值的流失用户召回和沉默用户激活,提高本月的充值金额
-
目标:将月付费用户A 和 月付费用户B 交叉分析 实现充值用户分类
月付费用户A = 登录流失玩家 + 沉默付费玩家 + 连续付费玩家
登录流失玩家:上月充值且游戏 + 本月7号后未登录游戏
沉默付费玩家:上月充值且游戏 + 本月7号后有登录游戏 + 本月充值未充值
连续付费玩家:上月充值且游戏 + 本月7号后有登录游戏 + 本月充值未充值
月付费用户B = 鲸鱼(前10%的付费用户,投入大量资金) + 海豚(40%的付费用户,花费“中等”数额) + 小鱼(50%的付费用户,每月投入较少资金) 周期统计时间:每月中旬(15号)
基础数据:用户ID,游戏等级,注册时间,上月充值金额,是否流失,次月充值沉默
参考资料:《游戏数据分析的艺术》
处理过程
setwd("D:\\完成的任务")
library(sqldf)
data <- read.csv('20170222vou.csv')
# View(data)
# 流失和2月是否付费两个指标在游戏分析中都比较重要,下面基于这两个指标展开分析
table(data$是否流失)
table(data$次月沉默)
# 充值用户的流失和次月是否继续付费等级分布对比
par(mfrow=c(1,2))
Level_l <- t(table(data$平台等级,data$是否流失))
barplot(Level_l,legend=rownames(Level_l),col = c('darkgreen','darkred'))
title(main = list("充值流失用户等级分布", font = 4))
Level_p <- t(table(data$平台等级,data$次月充值沉默))
barplot(Level_p,legend=rownames(Level_p),col = c('darkgreen','darkred'))
title(main = list("充值用户沉默等级分布", font = 4))
图解
付费玩家的月登录流失主要集中在110级,10级之后玩家大部分都继续登录。这也说明,深度体验了游戏的玩家(也就是游戏的核心玩家)相对不容易流失,而处于110级玩家(也就是所谓的边缘玩家)如果接受了游戏核心玩法就会从边缘转移到核心群体,随后也不容易流失;反之,由于各种原因没能接受到核心玩法的边缘玩家就会因此而流失。而后期就可以重点针对1~15的边缘玩家进行直接或者间接的拉动,使之过渡到核心群体,这部分往往是游戏运营比较难的部分,但是又不能忽视的一部分。
图解:
“充值用户沉默等级分布”图反映的信息是不同等级的玩家都有不同程度的付费沉默,对于这部分用户需要后期不断跟踪其动向以及其各项活跃度,看其是否有流失的趋势,并且可以尝试从运营角度诱惑其继续付费。我们知道挽留一个用户的成本远比拉一个新用户要低,
挽留一个付费用户成本比拉一个新付费用户更低,因此沉默付费用户的监控不容忽视。玩家沉默付费一部分原因是不同玩家会有不同深度的追求,这种原因的不继续付费的玩家一般比较难拉回,而对于一些付费模棱两可的玩家,拉回继续付费是极有可能的。
quantile(data$一月充值,na.rm=T) # 一月充值的四分位数
quantile(data$一月充值,na.rm=T,c(0.9,0.5)) # 指定截点的分位数
# 添加基于充值分类变量
data = sqldf("select 用户id,平台等级,注册时间,是否流失,一月充值,次月沉默,
(case when 一月充值 > 1230 then '鲸鱼'
when (一月充值 > 20 and 一月充值 <= 1230) then '海豚' else '小鱼' end) as 充值等级,
(case when 是否流失 = 'yes' then '登录流失'
when (是否流失 = 'no' and 次月沉默 = 'no') then '连续付费' else '沉默付费' end ) as 玩家类型
from data
")
table(data$玩家类型,data$充值等级)
结果
鲸鱼
首先看鲸鱼玩家,越是深度的玩家越不容易流失,从数据特征来看,绝大多数的鲸鱼用户下个月还会继续付费并且流失比例相对海豚、小鱼玩家都少。
海豚
小鱼
最佳的运营状态是玩家有沉默付费与流失倾向的时候就有针对性地进行运营计划,因此玩家的沉默付费预测以及登录流失预测就会起到很大的作用。