大家有没有特别羡慕和害怕过这种人,他能一眼看出你做的PPT里面的数据异常,随时能提出一个数据证明你的小结论有问题,然后以一个数据问题迅速推翻你整个报告的结论,结果就是你做了整整一个月的分析,全毁了,从头再来。
这样的人逻辑性极强且对你的汇报有生杀大权,最重要的是他有极强的数据敏感度。
什么是数据敏感度呢?我们先从身边的一件小事说起:
7月初交水电费的时候发现用水量大幅上涨——6月份竟然用了9吨水——之前每个月都是在3-4吨左右,这期间用水习惯、计费周期并没有发生变化。“用水量”很可能有问题。
用水量来自水表的读数,水表读数异常可能有两种情况:①水管有漏水(水表出口的那头),②水表的读数不准。
水管漏水的话,那么不用水的时候表也会转,这个假设很快就通过试验排除了。接下来验证水表的跑数,接连3天下班后查看一下水表数据,发现水表跑得真得好快啊,平均一天能跑半方(吨)水,一个月能跑15方,明显不科学啊。后来把这个事情反馈给房东,就把水表换掉了。
从上面的案例中可以看出,如果没有注意到之前每个月的用水量,那么很可能不会发现水表有问题——对数据敏感不是数据分析师的专利,而是日常生活、工作中,人人都需要也很容易习得的能力。
对数据敏感的起点是“ 注意力”——要有意识的去感知和记录一些数据,做到“心中有数”是对数据敏感的基础。
于数据分析师而言,“数据敏感度”可以定义为对数据的感知、计算、理解的能力:
数据敏感度具体表现
在一般业务中,需要用到“数据敏感度”的场景可能涉及到如下几方面:
鉴别真伪,能看出数据是不是有猫腻;
评判好坏,从数据指标上评判事物的好坏以及是否异常;
数据关联,基于特定的场景,发现数据间的关联;
问题定位,通过数据来诊断特定问题;
提炼规则,从数据中发现某种模式或者趋势;
数据预估,基于已知的数据推算未知的目标数据;
在这些场景中,一个数据分析师数据敏感度高的表现应该是这样的:
1、看到业务关键数据指标,能够在1秒内,发现它们是高了低了还是错了;
2、知道所有指标是怎么来的,知道它们的意义以及相互的关系,进而判断数据异常的原因;
3、拿到海量的数据,能够根据分析目标很快理出分析框架,得出结论。
通常在接受面试的时候,判断你对数据是否敏感,会这样来考你:
一种是拿几张多维度的图表给你看,问你有什么想法,看你能否看出数据偏差,能否发现偏差的是某个产品,能否分析出这个产品为什么会出现这样的状况等等。
一种是给一个规模推算的问题,看你推演的逻辑与技巧:例如在深圳机场每天出行的有多少人?是直接手机查资料,还是从上到下推演,或是从小到上归纳,都能判断一个人的思考框架是怎样的,抑或在面对未知问题的时候是怎样从容面对的。
一个牛逼的分析师,每天都会面对一些超出能力范围内的判断决策,抗压能力也很重要~
如何锻炼数据敏感度
要想锻炼数据敏感度,就要把数据分析变成自己的本能。好比你呼吸,走路,睡觉一样,变成不需要有意控制的本能。
提升数据敏感性,主要靠积累经验,看的数据,量越多、种类越丰富,敏感性越强。
但是这也不意味着随便看、胡乱看,而是有针对性的增加自己能力,可以参考以下三个方向:
预估能力
发现数据异常的能力
数据转化为知识的能力
预估能力
在看到实际数值前,就可以依据其他数据、主观感觉来估算数值,并控制估算误差。
此能力较容易锻炼。看数据之前,对数据进行主观猜测,再拿猜测值与实际值对比,根据实际值调整自己的感觉,多多练习即可。
对于系列数据,比如销量、网站访问量、活跃用户数等,需要明白,在没有异常的情况下,系列数据是由 规律+随机数 组成的。比如周一网站访问量在100W左右,这是规律;上下波动95%的可能在5W以内,这是随机数。
发现数据异常的能力
发现数据异常,是预估能力的一个延伸。越强的预估能力,就越能提高发现异常的速度、准度。
异常有两种:
正确的异常,即现实中有特殊事件发生,反映到数据就异常。
错误的异常,即现实正常,但统计错误导致数据异常。
发现错误的异常也有些小技巧,一并分享如下:
数量级
观察最终数据,保证在数量级上没有大的误差。例如,通过询问需求方得知,每天付费数在30单左右,若统计结果在80单或者8单,则结果很可能有问题。
各维度汇总
对于不同纬度分析,各纬度汇总值是否一致
交互式报表,下钻之后的汇总是否跟下钻前一致。
分布
统计结果的分布,往往有其特性。
例如每天付费数,会有连续性跟周期性两种特性,连续性是不会出现忽高忽低的大幅变动,周期性是周末都会有一定程度的提高或降低,7天一重复。
例如统计员工工作量,对一周的工作总量按员工汇总,一般是由高到低的一个均匀递减。
抽样
抽样检查一直是最有效的方式。取统计值的明细,直接对其中几条进行核对。
选择核对明细时,尽量保证抽样能覆盖各个分层,以及随机性。
数据转化为知识的能力
从数据、信息到知识的演变如下:
数据、信息和知识的区别联系:
(以上两图,引自涂子沛的《大数据》88页)
这部分能力最难培养。可通过查看各行各业的分析报告,学习从数据转为知识的常见思路,例如:归纳、细分、对比等。
另外针对自己日常工作,请将根本目的设为解决问题,而非完成数据需求。只有深入了解运营,深入了解数据的一线运用场景,才能完成数据到知识的转化。
对于数据分析师而言,还要做到:
对业务的理解是数据分析发挥效用的基础,分析师对业务数据的敏感度通常是从报表中来,从需求中来,从数据报告中来。
学习任何一项技能,勤动脑,勤动手,始终是根本,“数据敏感度”的培养也不例外。