作为本文的开头,我要先问一个问题“你所要的数据真的是你需要的吗?真的能够说明客观问题或者代表客观规律吗?”,你做的营销,你的产品,真的那么好吗?其实有很大一部分人要面对一个事实,那就是,你其实是沉迷在妄想中,你的数据指标只是虚荣指标。
个人感觉,数据是一门大学问,要说数据的重要性,我觉得还是主要是因为会影响到决策。要清楚什么是好的数据指标。
一.什么是好的数据指标?
好的数据指标能带来你所期望的变化,下面就是一个衡量其好坏的重要准则,也请拿你工作或生活或创业中所的到的数据以及得到的结果,来思考下,是否满足这些数据指标呢?
1.好的数据指标是比较性的
能够比较的数据更容易洞察产品的实际走向,比较对象可以是用户群体,竞争产品之间的表现,不同的时间段之类的有对比度的指标。例如“本周用户的营销转化率要比上周高10%”就是一个有比较性的数据,可以进而的分析产生的更有的原因,对比先后时间段内开展的活动等,进而对之后的决策进行指导。而如果这数据是,“转化率为20%”,那这只是个数据而已。
2.好的数据指标是简单易懂的
好的数据是直观易懂的。隐晦,晦涩的数据,是不易被人理解的,更加不可能在某次会议或者讨论中被更多人认同,那么这样的数据对于下一步的决策影响意义并不大,更不能说影响下一步的计划了。
3.好的数据指标是一个比率
之所以这么说,从宏观理解上来说,所有的数据一定会有一个基数,例如说我的产品相比上周用户注册率高100%,这听起来简直是个奇迹,成倍的注册量与留存量,那如果这个的基数是1呢?可能只能被当作笑话听了吧。
比率会是个好的考察数据的指标,还因为比率的可操作性强,是行动的向导,例如我要从河的上游漂流到下游,相距里程数只是一个举例信息,只有知道水流的流速等信息后才能大体判断需要花费多久时间;比率是一个有比较性的指标,例如我想再规定时间内到达下游的话,流速要在2km/h才行,知道当前水的流速,我才能知道,我会更早到还是晚到;比率更容易察觉出其他因素之间的关系,例如我知道了坡度和速率的变化情况,看起来越平缓的速率越慢,这样就慢慢就能知道这两者的是相关的,对于以后会有很大的参考价值。
4.好的数据指标会改变行为
这我觉得更是一种数据结果的参考价值的体现。我们可以通过数据的对比得到更优的结果。例如,我的首页是粉色的时候比我首页是黑色的时候留存率更高,那么我是不是更应采取粉色首页呢?
这是一个根据数据确定一个事情做与不做的重要指标,对规范营销,产品走向等行为有着很深的意义。一个好的数据指标之所以能改变商业行为,是因为它与最终的目标是抑制的,总就是保留用户,宣传口碑,创造收益。
当然,要注意的是这并不是那么绝对的。
5.好的数据是多方面多维度的
数据之间其实是存在耦合现象的,正如比率那里举的例子,数据之间很多时候是存在着这样那样的关系的,有的是现象相关,有的是存在因果关系。例如“转化率” 通常和 “购买所需时间”想绑定的,通过两者可以分析出很多现金流的信息;还例如“病毒式传播系数”和“病毒传播周期”,通俗一点的说就是用户会邀请来多少新用户,与邀请其他用户产生的时间的关系,这些相关的耦合数据中包含着很多的信息等待着你去挖掘。
2.如何确定所需的数据目标?
知道了什么是好的数据,那么怎么来找出正确的数据指标呢?根据经验以及其他资料中,有几点是出现频次极高的。
1.定性指标与量化指标
定性数据的话是指我们跟踪和衡量的数字,它是杂乱的,略显主观的,不精确的,然后每当我们将那些数据进行计数,筛选,分析的时候,数据就被量化来,被量化的数据使用方便,也就是我们统计数据所必须的条件,也具有科学性,当确保算法没错的时候,会更易于归类,外推等。真正有意义的数据是量化后的客观数据。
2.虚荣指标与可付诸行动的指标
之前有个企业很推崇的概念,“数据驱动决策企业”,这就是一个数据和企业决策的一个重要关系。如果有一个数据,但是却不知道如果应为这个数据采取下一步的行动, 那么这个数据就是一个虚荣指标,除了让人为了这个看起来美丽的指标沾沾自喜外,没有它用。这里更应该注意的指标是可付诸行动的指标,例如两个数据“活跃的用户”与“活跃用户占比多少”,活跃用户数据增长是很正常的事情,除非发生了一个令人厌恶的问题或者被其他挖了墙角,占比这个才能更利于作为行动的参考指标。
3.探索性指标与报告性指标
先要引述前美国国防部长唐纳德·拉姆斯一句话 世界上的事物可以分成这样几类:我们知道我们知道的,我们知道我们不知道的;此外还有我们不知道我们知道的,以及我们不知道我们不知道的。这四类信息也是我们需要去探索的重要指标。
“我们知道我们不知道的”意味着某种度量行为,比如数数,计算代码行数,都是度量行为,我们不知道这类的指标的具体值,所以采取度量它,这类指标可应用于核算或衡量试验结果。
“我们不知道我们不知道的”意味着在一系列探索后,我们得到了一个真理性的数据,能够让我们的决策使企业有可以撼动市场的可能。
数据分析对于这些话有着重要的应用。检验事实和假设,证明是切实可行的,而不是自欺欺人;为预测表等提供数据;发现机遇。
4.先见性指标与后见性指标
无论是先见性指标还是后见性指标都是很有意义的。只是解决问题不同。先见性指标可预测未来。后见性指标更能指出问题的存在。当数据量不足以支撑决策的时候,后见性指标更加重要。如果要启用先见性指标的话,一般是进行同期群分析并比较客户对照组在不同时间段的表现,来预测未来。
5.相关性指标与因果性指标
敲黑板,这个是重点。知道相关性和因果的话更能够让我们进行决策,例如气温和冷饮售卖是相关的数据,那么如果气温渐渐高了起来,我们这里就该考虑去备些冰糕来。
对于这个指标的重要性不用过多描述,毕竟大家都懂得,两个数据之间发现相关性是一件好事,发现相关性可以预测未来,发现因果关系意味着可以改变未来。不过注意的事情,就是通常因果关系并不是简单的一对一的关系,是很多事情共同作用的结果!
三.如何去分析数据##
数据分析博大精神,很难说几句话就能够说清楚的,下面说下就是可以通过简单的对比测试出数据的真伪的简单方法。分为下面几步:
第一步:市场细分
简单的就是一群有共同特征的人。共同特征包含很多,可以是性别,可以是年龄段等。市场细分不仅可用户IT行业,对于其他行业的各种营销模式也同样适用。
第二步:同期群分析
比较的是相似群体随时间的变化而产生的影响。同期群分析是你可以观察处于生命周期不同阶段的客户的行为模式,而非忽略个体的自然生命周期,对多有客户一刀切。同期群分析适用于运营,客户流失率,口碑传播等任何值得被关注的指标。
3.A/B测试
这是种横向研究,在同一时间段内,对不同的被实验群体提供不同的体验。例如产品上有一个按钮,在统一时间段内,某些人是“免费开始”,某些人是“免费试用”,进行对比实验。
4.多变量分析
这其实就是对于A/B的引申,因为进行一连串的单独测试会占用大量的时间和精力。多变量分析就是同时对多个属性进行测试,其原理为用统计学方法剥离出单个影响因子与结果中某一项指标提升的相关性。