一、实际问题的量化
产品或者运营,都需要做出各种决策,例如某个功能要不要做、要不要和某个渠道合作、怎么合作等决策问题,需要根据特定的指标数据来量化,从而确定产品功能的上线或者运营方案的实施,是否达到了预期的效果。
二、过去发生了什么
在产品中加入各种埋点,收集各种用户的行为数据,同时把用户各种维度的数据,例如机型、地域、操作系统、网络类型、推广渠道等上报到数据仓库里面,把每个功能的DAU、MAU、留存、召回、转化等报表做出来。达到了数据分析的第一个目的,就是知道了过去,也就是明白过去发生了什么事情,想要知道过去发生了什么,即完成报表系统。接下来要通过过去的数据去解决问题。
三、现在为什么会发生
不但要知道发生了什么,还要知道为什么会发生,只需要一种数据分析方法即可,那就是对比分析,具体分为以下三方面:
第一个手段,就是多维度对比分析(用户画像分析)。前面我们收集了那么多维度的信息(机型、品牌、地域、操作系统、版本等等),通过多种维度的对比,我们很容易就发现了某个指标的变化,是由于哪几个维度的变化而导致的。
第二个手段,就是相关分析。相关分析通过对比多个指标之间的相关性,找出指标之间的相关关系,例如广告费用和每日新增用户数之间的关系一般是强正相关的,应用内广告的频次的数量一般和留存率是强负相关的等等,通过相关分析,可以把要分析的指标转移到另外一个指标去,例如我们分析为什么日活跃用户数降低了,如果发现应用内广告的频次增加了,留存是降低了,那么日活说不定就受到影响了,这时候,我们把这个影响量化,基本上就可以回答为什么这个问题了。
第三个手段,就是A/B test了。可以找到因果性,不在于采用的分析方法(例如回归、神经网络、聚类、有监督、无监督等等),而在于其解决问题的方式:通过对现有问题做出各种假设,然后通过实施各种A/B Test的科学实验,验证假设是否正确。
达到了数据分析的第二个目的,知道现在发生了什么事情,也就是可以通过数据去解释业务中的问题。如何了解目前业务中的问题呢?一般我们会通过专题分析,不停地去对比数据之间的差异性,找出现在这个业务问题发生的原因。此时知道发生了什么、知道为什么发生,接下来就应知道要做什么。
四、未来应该做什么
不仅知道了过去以及现在的业务状况,还需要指导业务的下一个走向,也就是未来应该做什么。通过数据分析确定下一步应该做什么,可以让组织达到最大化的提高。通过数据分析的结论,推动产品的改进,知道将来应该做什么。
其他表述:
定量描述问题现状:是多少(数据描述现状)
树立标准,给现状下判断:是什么(到底现状好不好)
原因分析:为什么(出现这个事的原因是)
预测分析:会怎样(预测一下,这样的后果是)
评估分析:又如何(总结一下,这个事的结论是)
数据分析具体两大方向
数据分析岗位目前分为两个大方向,一个是偏向业务,一个是偏向数据工程(如机器学习、数据挖掘等)。业务方向又有很多细分方向,如网页分析、会员分析、经营分析等。这块主要是要求从业者用熟练的业务知识去解决实际问题,对业务有较深的理解,对数据比较敏感,数据分析技能为辅。
数据工程方向主要是用模型、算法去解决实际业务问题,如风控、个性化推荐等。更多的要求从业者对算法和模型等有很深入的理解,当然也需要从业者对业务有一定的理解。
数据分析三大必备能力
首先是分析能力,分析能力没有速成的方法,只能靠实战去累积。
其次是表达能力,也就是说你能不能用讲故事的方式把你的发现和结论用浅显易懂的方式讲出来。
然后是可视化,这也是一个好的业务分析师的核心技能点。