数据分析存在问题
- 数据分析只是用在复盘环节而且只是展示数据
总结时才罗列数据,看似分析了一串实际上对业务没有帮助。 - 数据解读只停留在表面
常见是做KPI趋势图,观察异常数据,然后分析原因可能是什么。 - 分析完数据后压根没有用上数据分析思维来解决问题
通过异常数据分析出原因后不知用使用什么样的解决方案,最后只能拍脑袋做决策。
长此以往数据分析解决问题的能力很难提升,每次都是一做三不知:
- 不直到分析什么数据
- 不知道怎样分析数据
- 不知道怎么用数据分析结果解决问题
数据分析时需要做到
- 有结构化的数据分析思维
- 能够对业务流程进行梳理,明确核心指标。
- 能够根据业务流程将核心指标拆解成多个可执行指标。
比如活动策划要完成100w流量目标,应该思考100w从哪里来,新老用户?各个渠道?最终拆解到可以行动的指标。 - 能够对数据字段进行加工
数据分析中,如果没有数据能用,需要对更基础的数据字段进行加工处理,将其转换为可以衡量的指标。
比如做用户运营的,采集到用户信息字段和行为字段后,可以用用户分层、用户分群、FRM用户价值分析、用户忠诚度分析等方式对数据字段进行加工,通过基础数据,对用户的购买潜力和流失概率进行量化。
- 能够制定指标报表、指标预测、指标状态
数据分析绝对不是在复盘阶段才需要,而是在业务开展过程中持续观察、优化,因此需要指定指标报表并做出指标预测进而观察指标状态。
指标 | 预估 | 后续 |
---|---|---|
平均活动参与转化率 | 30% | <30%提供活动奖品吸引度 <20%优化引导文案 |
渠道拉新费用 | CPA<5元 | >5元则进行渠道交叉分析并叫停低质量渠道 |
流失用户召回比例 | 10% | >10%则全量流失用户召回推送 <6%则优化推送文案 |
预警用户召回比例 | 30% | >30%全量预警用户召回推送 <20%优化推送文案 |
- 能够根据数据结果做出运营决策
采用推演复盘法,根据预设活动指标和实际指标做对比,快速获取问题关键所在。
对于异常数据指标,采用鱼骨分析法挖掘产生此项数据结果背后的原因,给出针对性的解决方案。
PRAPA
2003年盛大网络向行业输出PRAPA分析模式,针对游戏用户推广(Promotion)、注册用户(Register)、活跃用户(Active)、付费(Pay)、平均用户收益(ARPU)进行有效的分析指导,为游戏行业的成熟提供了标杆。在当时的盛大网络内部,针对游戏的用户体验瓶颈环节,设定了“卡外掉冲安”(卡机、外挂、掉线、充值、安全)专项,通过数据分析不断进行验证和调整,使得用户体验满意提升。
数据分析员人不应当只会数羊,只是发现哪些本就应该发现的经验和常识,而应当掌握数据探索方法,发现数据潜在的价值,既要预见可能将发生的某种坏的,也要预见好的。在规避风险的同时,也能抓住机遇,才能提现数据分析的价值。
数据分析流程
- 明确需求
分析需求的目的、分析范围、分析时间以确定分析内容 - 数据收集
根据数据来源可分为内部数据和外部数据,内部数据又可分为游戏行为数据和问卷调查数据。外部数据在需要做舆情监控、竞品分析时,需从新闻、论坛、贴吧、QQ群等渠道收集数据,通过爬虫爬取后导出。 - 数据处理
根据分析需求对收集到的数据继续进行处理。比如将明细数据聚合为统计数据,基于统计数据计算分析指标,利用预测模型计算预测数据等。 - 数据分析
数据分析即使用适当的数据分析方法与工具,对处理过的数据进行分析,提取有价值的数据,形成有效结论的过程。 - 数据展现
数据展现主要是通过图表来实现,图表的作用是表达形象化、突出重点、提现专业化。制作图表时需注意明确所要表达的主体或目的,选择最适合主体的图表,检查是否真实地展示数据,检查是否准确地表达了观点。 - 报告撰写
撰写分析报告要熟悉分析报告的结构特点,游戏分析报告采用总分结构,内容分为标题、导语、结论、详细分析四大部分。
数据分析方法
- 对比分析
比较分析将两个或两个以上的数据进行对比发现差异,对比可分为静态对比和动态对比,静态对比又叫横向对比是同一时间下对不同指标的对比,动态对比是纵向对比指同一总条件下不同时期指标数值的比较。
- 分组分析
分组分析是为了对比,将总体中不同性质的对象分开以便进一步了解内在数据关系。
- 结构分析
结构分析是指总体内的各部分与总体之间对比的分析方法,即总体内各部分占总体的比例,属于相对指标。
- 平均分析
计算平均数来反映总体在一定时间、地点条件下某数量特征的水平。
- 交叉分析
交叉分析又称为立体分析,是纵向分析和横向分析的基础上,从交叉、立体的角度出发由浅入深、由低到高的一种分析方法,用于分析两个字段之间的关系。同时将两个有一定联系的变量及其值交叉排列在一张表格内,变量值的交叉节点形成交叉表,从而分析数据表中变量之间的关系。
- 漏斗分析
漏斗分析结合对比、分组,比较同一环境优化前后、不同群体、同行类似的转化率。
- 矩阵分析
根据事物的两个指标作为分析依据,进行分类关联分析找到问题。
- 5W1H
5W1H叫做六何分析,对选定的项目、工序、操作从原因(Why)、对象(What)、地点(Where)、时间(When)、人员(Who)、方法(How)六个方面提出问题进行思考。
- 相关分析
确定现象之间有无关系、确定现象之间关系的密切程度、确定两个变量之间关联性、测定因变量估计值和实际值之间的差异。
- 回归分析
研究变量之间存在但又不确定的相互关系及密切程度,将某因素作为自变量,另外随着自变量变化而变化的变量作为因变量,研究它们之间非确定因果关系。
- 聚类分析(Cluster Analysis)
根据事物本身的特性研究个体分类的方法,原则是同一类中个体较大的相似性、不同类的个体差别比较大。根据分类对象的不同分为样品聚类、变量聚类。利用聚类分析将看似无序的对象进行分组、归类,以达到更好地理解研究对象的目的。
- 判别分析
根据表明事务特点的变量值和所属类别获取判别函数,根据判断函数对未知所属类别的事物进行分类的一种分析。与聚类分析不同的是判别分析需要已知一系列反映事务特性的数值变量值,并已知个体的分类。
- 主成分分析
主分量分析、主成分回归分析,是利用降维思想,将多个指标转化为少数几个综合指标的方法。
- 因子分析
将多个实测变量转化为少数综合指标或落潜变量,通过将相关性高的变量聚在一起达到减少需要分析的变量的数量,从而减少问题分析的复杂性。
- 时间序列分析(Time Series Analysis)
时间序列分析是一种动态数据处理的统计方法,基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的规律以解决实际问题。
- 方差分析
变异数分析用于分析两个及两个以上样本均数差别的显著性检验
数据分析的价值
从数据本身来说,数据分析的价值在于通过数据驱动业务,产生落地的解决方案,提高产品运营效率,提升产品健康度,有助于企业减少成本增加收入。在游戏行业主要包括
- 为企业管理层提供企业整体运营情况数据,设定预警指标并监控其是否有异动,快速定位指标移动原因。获取并分析同行企业产品的主要指标数据及其本企业产品的对比。获取行业市场规模、畅销游戏类型、IP和题材等数据。通过多层次多角度的数据分析报告启发决策人发现商机,了解同行发展动态,从宏观上把握市场发展趋势,及时发现市场热点。
- 通过游戏测试数据评估产品质量,帮助产品定位。预估最优市场投放金额,为市场投放决策提供依据,合理分配资源,减少资源浪费。
- 对高价值用户进行画像,分析其行为和偏好,制定由针对性的营销策略。建立高价值用户的流失预警模型,挽留流失用户,帮助提升游戏用户活跃度和收入。稽核用户质量,提早发现异常用户,避免造成损失。
- 分析用户流失原因,流失用户行为特征,提出版本修正建议,让用户更好地体验游戏,配合运营活动减少用户流失并提升收入。
- 通过文本挖掘分析用户反馈和舆情数据,解决产品问题和分析竞品数据。
- 监控各位置的转化效率、价值,进行资源位合理安排和定价。监控广告投放效果,有卒于市场人员及时发现问题,优化素材内容和形式,使其投放效果最大化。
- 帮助开发人员发现问题,通过崩溃数据、用户不正常行为等因素定位bug及其原因,帮助测试人员发现问题,通过数据定位问题发生的具体场景,进行有目的的测试。
游戏关键数据指标
转化率
转化率分析在手游中以关注玩家点击广告到进入游戏后付费的每一步转化,相对于端游激活率是手游持有的一项数据内容。
- 激活:手游激活是指用户安装好客户端以后联网打开客户端的数量与比率
- 激活率 = 激活量 / 安装量
- 对于发放邀请码的:激活码的激活率 = 激活量 / 激活码发放量
- 激活且登录:激活码激活且登录率 = 激活且登录量 / 激活码激活量
激活且登录的应用场景会在游戏封测期间,为了限制用户数量会进行限制测试,对用户数量进行把控的方式是发放激活码,激活码的激活且登录比率反映实际进入游戏的用户数量。当激活且登录较低时,首先会联想到的是玩家登录环节是否遇到困难,主要排查网络、客户端问题。若游戏登录环境没有异常,则该指标能说明玩家对该游戏的兴趣程度,对比不同渠道的激活且登录也能侧面反映渠道的用户质量。
激活且登录比率 | 效果 |
---|---|
>90% | 优秀 |
80% ~ 90% | 较好 |
60% ~ 80% | 一般 |
<60% | 较差 |
转化率漏斗
游戏运营主要目标分为拉新、促活、留存、付费转化
- 拉新是通过渠道合作和广告投放等方式获得新用户
- 留存是将获得的用户尽量持久地留在产品中
- 促活即促进用户活跃,让用户愿意更加频繁更加开心的游戏。
- 付费转化则包含促进用户充值和冲进用户消费
游戏行业拉新成本很高,要投放广告、投放时间都是成本。如果用户没有产生价值就流失了,一定是亏损的。相反拉新过来的用户留存时间越长,产生的价值也就越大,也才能弥补其它流失用户所产生的损失。因此,提高用户留存时间,是提高收入并创造更多价值的重要环节。
可以在产品设计的每个可控环节中进行数据埋点,建通每个环节的漏斗转化,帮助发现产品设计中的问题,通过改善环节获取更多新增用户。
例如:某手游在某渠道上线第一天的数据
从点击广告进入游戏的转化率只有9.8%,付费转化率为0.5%, 也就是说10w用户点击广告,最终进入游戏的用户为9800人,最终付费的用户为500人。
用户行为 | 转化率 | 付费转化率 |
---|---|---|
点击 | 100% | |
下载 | 30% | 30.4% |
安装 | 89% | 27% |
激活 | 44% | 12% |
注册 | 86% | 10.3% |
进入 | 95% | 9.8% |
付费 | 5% | 0.5% |
主要问题
- 点击广告后下载游戏转化率低,只有30%。
影响因素:广告素材会影响到玩家下载游戏的意愿,包大小、联网环境、运营商会影响用户下载成功率。 - 下载后激活的转化率低,只有39%。
影响因素:程序bug影响客户端安装成功率,包大小、联网环境、运营商同样会影响用户激活成功率。
除了优化产品自身细节外,提供各个环节的转化率,对渠道各项转化率指标的长期监控以及追踪不同渠道、媒体来源用户的后续质量(包括登录、活跃、留存、付费等)能帮助快速发现渠道异常、调整广告投放策略等。
留存率
留存率是指新增用户在一段时间内再次登录游戏的比例
留存率反映的实际上是一种转化率,即由初期不稳定的用户转化为活跃用户、稳定用户、忠诚用户的过程。
随着流程率统计过程的不断延展,可以看到不同时间的用户变化情况。
日留存率
- 次日留存率
- 次日(第1天)留存率是指新用户在首次登录后的次日再次登录游戏的比例
- 次日(第1天)留存率 = 第1天新增用户在第2天登录过的人数 / 第1天新增用户数量
例如:第1天新增用户100人,其中50人在第2天登录过,那么次日留存率为50/100=50%。
- 七日留存率
- 七日留存率是指新用户在首次登录后的第7天再次登录游戏的比例
- 七日留存率 = 第1天新增用户在第7天登录过的人数/第1天新增用户数
例如:1月1日作为第1天,新增用户100人,其中30人在1月7日登录过,那么七日留存率为30/100=30%。
- 三十日留存率
- 三十日留存率是指新用户在首次登录后的第30天再次登录游戏的比例
- 三十日留存率 = 第1天新增用户在第30天登录过的人数 / 第1天新增用户数
例如:1月1日作为第1天新增用户100人,其中10人在1月30日登录过,那么30日留存率为10/100=10%。
周留存率
- 周留存率和日留存率相似,周留存率为新用户在第1周登录后的第2周再次登录游戏的比例。
- 周留存率 = 第1周新增用户在第2周登录过的人数/第1周新增用户数
例如:1月1日到1月7日作为第1周有1000个新增用户,其中500人在1月8日至1月14日之间登录过,那么周留存率为500/1000=50%。
月留存率
- 月留存率为新用户在第1月登录后的次月再次登录游戏的比例
- 月留存率 = 第1月新增用户在次月登录过的人数 / 第1月新增用户数
例如:1月1日至1月31日作为第1月有1000个新增用户,其中100人在2月1日至2月28日之间登录过,那么月留存率为100 / 1000 = 10%。
加权留存率
加权留存率是指某端时间内(时间段a)的新增用户在若干天后的另一端时间(时间段b)的留存数量除以之前那个时间段(时间段a)的新增用户总量。
每日留存率和加权留存率关注点一样,根据留存率数据可以了解到产品对用户的黏度,反映产品质量。
使用加权留存率的原因是,当人数变化大时数据会产生偏差,加权之后数据更稳定。
例如:游戏开服1天后用户的导入量会逐渐变少,日新增用户数据逐步下滑,好像日留存率提高了不少,这主要是因为数据基数减少了,导致留存率虚高。如果直接做平均,那么均值出来的留存率也会存在虚高的现象,所以需要对留存率做加权平均。
日期 | 第1天 新增用户数量 | 第2天 留存用户数量 | 第1天 留存率 |
---|---|---|---|
2019-01-01 | 100 | 50 | 50.00% |
2019-01-02 | 10 | 9 | 90.00% |
- 留存率均值 = (50% + 90%) / 2 = 70%
- 加权平均留存率 = (50 + 9) / (100 + 10) = 53.64%
- 留存率均值 - 加权平均留存率 = 70% - 53.64% = 16.36%
留存率和游戏质量的关系
游戏从封测开始,多数公司都会投入固定的内、外宣传资料作为游戏初期市场推广,以收集游戏的封测数据,其中主要是留存率,无论是端游还是手游,都非常重视这个指标。留存率称为衡量产品质量的重要指标之一,用以判定游戏的基本品质,为后续市场资源调配提供参考。
游戏封测主要有两种形式,为发送激活码测试和不发放激活码测试,由于发放激活码测试针对的用户群体更偏向核心用户,一般来说其留存率高于非激活码测试。
- 限量发放激活码封测的游戏评级留存率标准
因用户规模对留存率有一定影响,当测试用户过少时,可能不能反映游戏真实的留存率数据,因此为了保证封测数据准确性,封测周期要求7天及以上,新登录总人数在5000以上,才能按标准评估游戏级别。
例如:某渠道对游戏限量发放激活码测试节点进行评级的留存标准
游戏评级 | 优秀 | 良好 | 一般 | 改善 |
---|---|---|---|---|
第1天 留存率 | 65% | 45% | 30% | 低于一般 |
第3天 留存率 | 55% | 35% | 25% | 低于一般 |
第7天 留存率 | 35% | 20% | 11% | 低于一般 |
- 不限量封测,不发放激活码的游戏评级留存率标准
不限量封测时需要接入渠道,由渠道导入自然用户量,其用户导入量不能高于封测服务器最高承受的用户能力。当用户规模接近服务器上限时停止导入,因此从某种意义上讲也时限量的。同样考虑到用户规模对留存率的影响。为确保数据准确性,要求不限量封测的用户规模至少1万人。
例如:某渠道对游戏不限量封测节点进行评级的留存标准
游戏评级 | 优秀 | 良好 | 一般 | 改善 |
---|---|---|---|---|
第1天 留存率 | 45% | 35% | 20% | 低于一般 |
第3天 留存率 | 30% | 20% | 15% | 低于一般 |
第7天 留存率 | 25% | 15% | 10% | 低于一般 |
通过历次测试的手游数据发现,不限量封测的留存率接近于公测后的留存率。
用户付费指标
用户付费指标有三个关键指标,分别是付费率、平均每付费用户收入ARPPU、每用户平均收入ARPU。这三个指标理论上是越高越好,但实际很难兼得。一般来说,高付费率的游戏,ARPPU比较低。ARRPU比较高综合来看,ARPU从某种程度上能衡量游戏的盈利能力。对游戏进行付费优化,挖掘玩家付费潜力能提升游戏的营收能力。
付费率 PUR
付费率(Pay User Rate,PUR)也称为付费转化率,指每日付费用户占活跃用户的比例,当付费用户的生命周期总价值 有一定保证后,提升付费用户比例就将称为提升公司营收的有效途径。
付费率 = 付费用户 / 活跃人数
平均每付费用户收入ARPPU
ARPPU(Average Revenue per Paying User)即平均每付费用户收入,反映每个付费用户的平均付费额度。
平均每付费用户收入 = 付费金额 / 付费人数
每用户平均收入ARPU
ARPU(Average Revenue Per User)即每用户平均收入,ARPU注重的是一个时间段内运营商从每个用户处所得到的收入。
每用户平均收入 = 付费金额 / 活跃人数
目前较好的手游每日的ARPU超过5元,一般的手游ARPU在3~5元之间,ARPV低于3元则说明表现较差。
导入用户成本
CPC、CPA、CPR、CPL均和用户成本有关,是衡量广告投放效果的重要指标。
- CPC(Cost Per Click)单个点击用户的成本,关键词广告采用的定价模式。
CPC = 广告投放总额 / 所投放的广告带来的点击用户数量
- CPA(Cost Per Action)平均每个激活用户的成本
CPA = 广告投入总额 / 所投的广告带来的激活用户数量
- CPR(Cost Per Register)平均每个注册用户的成本
CPR = 广告投入总额 / 所投的广告带来的注册用户数量
- CPL(Cost Per Login)平均每个登录用户的成本
CPL = 广告投入总额 / 所投的广告带来的新登录用户数量
导入用户成本 | 广告投入总额 | 所投广告带来 |
---|---|---|
CPC | 广告投入总额 | 点击用户数量 |
CPA | 广告投入总额 | 激活用户数量 |
CPR | 广告投入总额 | 注册用户数量 |
CPL | 广告投入总额 | 新登录用户数量 |
根据用户转化漏斗,CPC < CPA < CPR < CPL,各项指标的成本越低说明效果越好,但最终效果仍要看用户在游戏内的留存和付费,即ROI(Return On Investment)投资回报率。
生命周期总价值LTV
LTV(Life Time Value)生命周期总价值又称为用户终生价值,是指用户在生命周期内为游戏应用创造的收入踪迹,可看成是一个长期累计的ARPU值。用户的生命周期是指一个用户从第一次启动游戏应用到最后依次启动游戏应用之间的周期。
单个用户平均的LTV = 每月ARPU * 用户按月计的平均生命周期
例如:如果游戏的ARPU=5,游戏用户平均生命周期为3个月,则LTV = 5 * 3 = 15。
LTV和CPA的关系
LTV是指用户在游戏中产出的价值,CPA是指获取一个有效用户的成本,当CPA > LTV时可理解为获取用户成本大于用户产出,可通过改数据判断市场投放效果,以及是否有必要追加投放或停止投放尽早止损。
例如:某款游戏分别在9月和10月两次投放市场费用的CPA激活用户成本与LTV的关系。
- 9月10日 ~ 9月23日 公测投放阶段花费870w元,CPA值低于10元明显低于LTV,效果较为理想。
- 10月1日 ~ 10月8日 分众框架楼宇广告消耗94w元,CPA值接近30元,远高于LTV,效果不理想。
投资回报率ROI
ROI(Return On Investment)投资回报率是指投资后所得收益与成本之间的百分比率。
ROI = 利润 / 投资总额 x 100%
ROI主要衡量产品的付出与收获是否成正比
- ROI>0 盈利
- ROI=0 盈亏平衡
- ROI<0 亏损
游戏ROI的价值
- 衡量产品推广的盈利/亏损状态
- 筛选推广渠道分析每个渠道的流量变现能力
- 实时分析衡量渠道付费流量获取的边际效应,调整投入力度。
- 结合其它数据比如新增、流失、留存、付费等调整游戏,进行流量转化和梳理。
- 综合分析LTV值对新生产品进行LTV预测,结合CPX衡量推广预算,或综合同类游戏LTV值进行评估采样,结合CPX衡量推广预算。
- 评估后续推广活动的成功与否
- 评估直接ROI及间接ROI的推广优劣
- 推广数量导向,衡量渠道投入性价比。