本文作者为数数科技某游戏客户的运营总监,在使用数数科技的产品之前,他们在内部尝试自建数据分析平台,“从入门到放弃”。上线数数科技的大数据分析平台后,该公司一款全球下载量5000W+的休闲游戏每天所有的数据都在平台上流转。
1. 为什么需要数据分析
移动游戏已经进入充分竞争的阶段,市场供过于求。从2018年开始,新游戏发布的数量就逐步下降,轻松挣钱的时代已经过去,开发者们逐渐离场,留给我们的试错机会越来越少,同时数据驱动增长的方法越来越受到关注。
《硅谷增长黑客实战笔记》中写到:增长的精髓是一套体系和方法,它以数据为指引,以实验的方式,系统性地在用户生命周期的各个阶段,寻找当下性价比最高的机会,在具体的执行上横跨市场、产品、工程、设计、数据等团队,通过快速迭代实验的方式达到目标。
所以无论是新产品调优,还是老产品运营,都离不开数据的指引与支持。它能帮助我们节约成本,扩大用户规模,提升变现效率,是不可或缺的工具。
2. 数据分析落地难点
虽然,数据对游戏增长的重要性日益明显。游戏厂商也有心做“数据化”转型,但这个过程依然难关重重。
其一,数据不是孤岛,只有熟悉各种游戏数据的应用场景,能将冰冷的数据和实际的游戏场景关联起来才有价值。每一个数据指标,都是受什么业务影响的?怎么调整能让留存提升10%?怎么运营能让变现效率提升50%?这需要数据分析师团队具备数据、产品、运营、技术多重能力的综合。
其二,要有一套高效的数据分析平台,这非常重要,也是最难落地的——如何把想看的数据统计出来,展示在网页上。这涉及到三个部分:
1) 需求梳理。先要自己清楚需要看哪些维度的数据?界面什么样能满足分析需求?
数据平台就像一个产品,需要缜密的需求设计,才能开发。一遍一遍的修改需求,对于开发效率和士气都影响巨大。
2) 收集原始数据。这些数据如何统计?如何落地到游戏内的埋点?如何推进程序在产品内埋点?
这需要对数据统计有一定的专业了解,知道统计原理。
知道怎么埋点最能节省人力,明确埋点的优先级
预想潜在的数据应用场景会需要哪些埋点,做好提前准备。
3) 数据统计和展示。界面什么样?每个数字怎么统计?都要交代清楚,跟进最终效果实现。
已经有了原始数据表,建议先做一个Excel,把想要的数据,先用SQL跑出来,并且把SQL语句写在文档里,标明统计是需要哪些筛选器。这样能降低沟通成本保证开发的准确性,提升开发效率降低统计出错的几率,大大提升开发效率。后续还需要持续迭代,一旦有新需求或者临时性需求,都需要平台部门维护。
3. 为什么选择第三方平台
2019年中旬,我牵头在公司搭建游戏产品的数据分析平台,目标是做一个所有项目通用的数据平台。但耗时2个月,结果却不如人意。服务器频繁宕机,导致数据收集不完整;平台性能差,导致网页响应速度极慢;每个项目数据埋点样式不同,导致数据部门无法避免二次开发。
其实数据平台的研发非常复杂,从数据采集,到数据建模和存储,再到数据分析和展现,三大步骤,再分成多个细节。一般的游戏公司很难驾驭,自己开发不仅会占用人力物力,并且很难有预期的效果。
后来我们从自建转向选型外部平台,这个过程中遇到了数数科技,帮助我们轻松解决了业务难题。其优势在于:
- 私有化部署——保证数据安全性和私密性。
- 去程序化——统计和可视化工作,运营同学就可以胜任,脱离程序爸爸。可以保障多项目高效接入,而且任何新需求都可以快速得到数据,保证分析效率。
- 多种分析模型——帮助我们多个角度、直观的的看到问题。
- 网站响应速度快。
这是我第一次接触这类产品,觉得特别牛,能解决各种规模企业的痛点。
对于小型企业:开发资源都不足,没有人手来做平台。
对于中型企业:有人手但是经验欠缺,能否从0到1完成是个问题,而且平台多次返工肯定再所难免。
对于大型企业:如何满足不同类型项目的统计需求?如何能满足不同项目组的定制化需求?海量数据是否能高效统计?如何持续优化平台基础设施?
4. 我们怎么使用数数科技的数据分析平台
下面会讲一下从埋点到数据平台的使用经历。
4.1 如何收集原始数据
所有的游戏数据都来源于业务埋点,拿一款简单的闯关休闲游戏举例,我们将数据存入两个地方:用户事件表、用户信息表。
用户事件表:每当用户发生指定行为,我们就需要把这次的行为,带上一些需要的信息,存入事件表里。比如统计每日DAU,那么就需要在启动游戏时上报一条登录(Login)数据,其中包括了时间、UID。统计时,按照日期分别统计每天登录UID的去重次数即可。
有些数据每条事件里都有,我们可以管这些数据叫公共头数据,这些数据能精确的描述在事件发生时刻用户的属性。比如UID存储在公共头部分,通过该用户属性,我们能知道哪条日志属于哪个玩家。至于什么数据存在公共头,没有很明确的讲究,看个人习惯和踩过的坑。而个性化数据,只有在部分日志中出现,比如关卡ID就没必要出现在Login日志中。
用户信息表:一些伴随用户终身的数据,可以存在信息表里。比如一些基本信息,用户国家、渠道来源,广告组;比如一些业务信息,用户最后一次登录时间、总充值金额。两个表用UID关联。
需要告知程序,事件表中的每条事件什么时候发,每个值的意义、名称、数值类型,部分值有多种情况,需要标明值的含义。用户信息表也相同,需要标明数据更新时机,哪些数据只赋值一次,哪些数据需要更新。这样大幅度提升沟通效率。通过以上方式,就可以完成原始日志的收集工作。
另外,我们还可以打通广告变现平台和广告投放平台,将更多运营和市场层面的数据结合到一起,让运营、UA、广告制作团队能在一个平台上看到所有数据,将数据串联在一起。
4.2 平台常用统计模型
平台提供了多种分析模型,帮助运营同学完成各种数据统计需求。事件模型、留存模型、漏斗模型、分布模型、路径分析模型。可以借助这些工具轻松搭建平台,如果思路清晰,一个工作日就可以完成平台建设。
考虑公司产品的数据安全,以下截图来自数数科技游戏Demo。
事件模型
事件模型是业务上最常用的统计模型,也是最基础的统计方式。根据统计好的日志,运营同学只需要简单的编辑公式,就可以统计各种数据。核心数据这种复杂报表,几分钟就可以轻松搞定。
不仅如此,我们还可以使用属性筛选功能,实现更细节的数据分析,比如分析美国facebook用户在注册当天的充值情况,只要数据分还能细分,筛选条件就能不断追加,以满足更细颗粒度的数据分析。
留存模型
留存模型也是常用模型之一,分析两个事件的关联性。主要适用于以天为单位的数据走势情况,比如留存、用户生命价值、某个功能随天数的参与情况等等。拿最基础的留存来举例,我们可以设置初始事件是“Reg”,回访事件是“Login”,这样就能看到每天新用户的留存情况。不仅我们可以使用筛选功能,还可以使用分组功能,分别查看每个渠道的留存情况。
如果想对某个用户群进行下钻分析,可以通过用户分群功能,清洗出用户范围,进行更深度的分析。比如想分析facebook渠道,次日回来的用户。用户群定义中,设置用户触发Login事件的天数大于1,且用户的渠道为facebook即可。
筛选出这批用户后,在任何模型下,都可以将该人群设置为筛选条件,进行数据分析。
漏斗模型
这个模型分析转化率非常方便,设置每一步行为事件,就可以看到每一步的流失情况。
分布模型
顾名思义,我们可以看到某数据的分布情况。比如查询充值用户周累充分布,来分析用户充值意愿。
路径分析模型
这是一个非常有趣的分析方法,观测用户在多个事件之间行为串联的路径。比如玩家登录游戏后的行为顺序是什么,选定好希望分析的事件种类,然后以Login为其路径起始点,就可以得出想要的结果。
5. 游戏数据平台常用的分析维度
一个好的数据平台体系,能提升分析效率,帮助分析者梳理思考流程。平台的结构没有局限性,每个人都有自己的习惯的方法,以我自己习惯的方式,给大家介绍一下。
核心数据
顾名思义,展示每个部门最关心的数据,通过宏观的大盘数据就能了解产品基本面、各自部门的KPI指标。这些数据是整个商业最终表达形态,我们也可以对此进行日常监测,能从中及时发现数据异常,再根据情况具体分析。
综合日报:这是我们最关心的基础数据,也是老板最关心的。每天的活跃用户,新增用户有多少?收入多少,付费渗透率如何,人均付费多少?
留存和LTV:市场和运营同学最关注的数据。主要关注新用户的质量?产品是否能留住用户,用户变现效率如何?
实时监控:今天用户登录情况如何,服务器是不是宕机了?新版本有没出大BUG?今天付费走势和前几天对比如何,要不要增加新的活动和礼包?
BUG监控:新手引导通过率是不是正常?内购和广告成功率怎么样?崩溃率如何?
我们也可以使用筛选功能,查看更细颗粒度的数据。
用户分析
用户分析的角度比较杂,通过多个维度可以更详细了解产品数据。新用户分析,渠道分析、活跃分析、付费分析、流失分析等等。
系统分析
该模块的分析更贴近游戏具体的业务。经济体系中的货币和道具,产出、消耗、库存情况。每个玩法模块的参与情况、付费用户的喜好程度、付费贡献、货币产消。
以上是我搭建游戏产品的数据分析平台的整体思路。随着产品的持续运营,我们可以以此为基础,持续迭代,提高分析效率。
最后我想说,数据分析平台只是工具,而最终目的是帮助我们做数据归因和决策。一个好的工具,可以省去重复造轮子的时间,让我们有更多时间聚焦思考。在数据分析的过程中,重要的是学会假设,用数据去验证观点,再用数据来检验新方向是否正确。只有这样才能在一次一次的迭代中,获得游戏的爆发增长。