数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。
数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广。数据分析是数学与计算机科学相结合的产物。
数据分析因人而异,但目的都是为了指导决策路径,经常与做决策的工具方法共同使用,因此在做数据分析前明确本次目的会事半功倍。而确认需求-收集数据-分析数据-确认有效性-改进迭代是其相对完整的闭环。
数据分析做什么?
指导决策,而具体说来分四种:监控、评估、预研、收集。
监控,来自看火人的守护
监控即日常对数据的监控与把控,一名优秀的数据分析师可以从一点点数据异常和拐点中判断出大盘趋势以及当前游戏的状态,防范于未然之中。而平时的日报、周报、月报就是辅佐来做这些事情的:
-日报观测单日情况,用来识别是否出现重大的运营状况,通常采用环比和同比两种手段,不过要去除节日噪点。
-周报观测每周整体情况,主要关注为整体趋势和环比。需要注意的点两端和拐点,要将前后数据连接起来观察。平均DAU、PU和ARPU是重点关注指标。
-月报关注是整体的数据的变化,它与当月天数及节日的特殊性有关联。需要关注的仍然是趋势,此时趋势走向很重要,决定后面的研发计划方向。
评估,对经验的淬炼
评估指的是用数据复盘开发,一般来说是基于某个版本、活动或系统做大盘分析,在产品初期打磨时也用于去分析问题帮助产品进行打磨。
常用的手法一般是自上而下法,进行层层拆解。即从某个大数据的变动开始分析,慢慢向下进行渗透,最终定位关键点。除此之外会做一些常规性的检测,来协助判断效果,如收入评定(瞬时与长期),活跃评定(瞬时与长期),新进玩家与流失玩家数量和分层比例,玩家口碑,游戏行为如登陆次数在线时长等。
最后这三项很重要,大多数游戏及其容易忽略的,而累积起来很容易造成大的运营事故。
在此之上也可以做更为细致的拆分,还原系统里的成功之匙,为经验的积累提供正向累加。
预研,航海士的罗盘
又称为数据挖掘,一般指的是用数据指导开发,带着问题去分析,概念上比较容易和评估进行混淆,工作上又和用户研究有些重叠。评估是指基于结果去做分析指导改进,预研是基于现成数据去评估是否要做某些新的内容。
比如说现在的游戏时间达到了2小时,我希望提高到3个小时会不会产生什么影响;再比如说我现在要做个消耗活动,那么需要做的额度在多少。基于以上内容对整个游戏进行全方位的衡量与评估。
再比如说,现在银币产出过多,要做一个消耗银币的功能,那么这个银币消耗的范围要做多少,就需要进行预研评估了。
收集,重装弹药整装待发
这是一般数据分析人员很少去做的事情,它相当于数据分析师的一个资料库,也可以称之为弹药库。使得分析师可以将标准线不断的进行调整,不断建立新的模型来帮助自己进行更精准的分析,来大幅省人力的成本。
在整体过程中,将会不断出现新的模型更精准的数据来指导数据开发,如过去常见的ARPU、LTV分别指导不同的发行模型。而近几年在端游页游比较火的FRD模型也开始出现了。
数据分析怎么做?
分析的数据的方法过程,大致为三种类型:逻辑推导法、量化分析法、测试校验法。
逻辑推导法
使用的是逻辑的方式来进行,有自上而下法、系统关联法、核心指标法等。
自上而下法,从变化数据出发入手。一般用于品评估某次活动或系统的情况,具体的方法基于某次活动可能会影响的预定指标进行拆解,比如说新增的玩家会不会影响老玩家,新增玩家的质量如何等等。基于此不断进行拆解,细化到下层,最终得出相应的结论。类似于验证性因素分析/CFA的方法。
系统关联法,从具体系统开始入手,本质上类似于控制变量法。确认近期变动,如更新版本、政策变化、人群变化,从这些内容进行入手进行,寻找数据的变化,逐条筛查。
核心指标法,从结论数据入手,先确认目标指标的数据。确认有效目标,通过目标去量化各个环节的内容。比如说我们现在需要衡量好友拉新活动的效果,先定义指标为单位用户所消耗的成本,其余则有单位用户提供的数量,参与度等等。上层数据决定活动整体效果,下层数据决定可优化空间。
量化分析法
使用的是代入关键值的方式,一般有代入分析法、抽样调查法、调查问卷三种。
代入分析法,因为数据分析的核心在于找到原因进而加以解决,并不仅仅是单纯的给出数据。因此细节的时候会使用代入法进行,来还原为什么这个位置出现的变化。
抽样调查法,有的时候上述的方法都很难得出结论,因为涉及到的内容比较多。这时只能缩小范围,抽取典型用户进行验证。一般来说抽取在10~20人可以发现共性问题,在基于共性问题继续进行分析,最终比对数据变化的幅度达成结论。
调查问卷法,抽样调查法的扩展方式,采用调查问卷的方式定位玩家的属性并区分数据。
测试校验法
使用的是以立场去验证的思路,一般会经历版本的迭代来测试。具体也有ABTEST、控制变量法、定量测试法,其核心都是是变量的定位:ABTEST是直接在一次测试中对变量作出调整;控制变量则是对前一次进行校验分析;定量测试则是和前一次做对比并对某一种类型进行。
而数学归纳、线性规划、动态分布、傅里叶变化等则是更高阶需要使用的,更多针对大数据使用,合理引用数据方法会让分析速度事半功倍。
总之,依据不同的情况使用不同分析方式,最终都是为了相对准确的结果而服务。
验证,保证结论准确性
整体完成后要再次校验确认其有效性,并且不断关注改进迭代。基本基于目的、来源、逻辑、循环再次进行确认。
-收集数据的目的是否明确,数据是否真实且充分,信息渠道是否可信畅通;
-基础数据是否充分、可信,是否存在因信息不足、失准、滞后而导致数据;
-数据分析方法是否合理,逻辑是否无误。是风险控制是否在可接受的范围,噪点的控制是否合理;
-方法模型对提升工作效率、准确性是否有提升,是否具有可传递性以及是否可以更快速解决问题。
结语
数据分析是为决策服务的,因此不论什么样的方法及模型只要指导出准确的决策就是好的数据分析师。
记住两点:
1、埋点打桩是做不完的,考虑如何最大性能的去进行铺设。
2、无论新模型还是旧模型,核心是指导解决问题,更好的模型更有效率的解决问题。