当我们在说数据敏感度时,我们究竟在说什么

大家有没有特别羡慕和害怕过这种人,他能一眼看出你做的PPT里面的数据异常,随时能提出一个数据证明你的小结论有问题,然后以一个数据问题迅速推翻你整个报告的结论,结果就是你做了整整一个月的分析,全毁了,从头再来。

这样的人逻辑性极强且对你的汇报有生杀大权,最重要的是他有极强的数据敏感度。

关注同名公众号,获取数据分析更多资讯

什么是数据敏感度呢?我们先从身边的一件小事说起:

7月初交水电费的时候发现用水量大幅上涨——6月份竟然用了9吨水——之前每个月都是在3-4吨左右,这期间用水习惯、计费周期并没有发生变化。“用水量”很可能有问题。

用水量来自水表的读数,水表读数异常可能有两种情况:①水管有漏水(水表出口的那头),②水表的读数不准。

水管漏水的话,那么不用水的时候表也会转,这个假设很快就通过试验排除了。接下来验证水表的跑数,接连3天下班后查看一下水表数据,发现水表跑得真得好快啊,平均一天能跑半方(吨)水,一个月能跑15方,明显不科学啊。后来把这个事情反馈给房东,就把水表换掉了。

从上面的案例中可以看出,如果没有注意到之前每个月的用水量,那么很可能不会发现水表有问题——对数据敏感不是数据分析师的专利,而是日常生活、工作中,人人都需要也很容易习得的能力。

对数据敏感的起点是“ 注意力”——要有意识的去感知和记录一些数据,做到“心中有数”是对数据敏感的基础。

于数据分析师而言,“数据敏感度”可以定义为对数据的感知、计算、理解的能力

关注同名公众号,获取数据分析更多资讯

数据敏感度具体表现

在一般业务中,需要用到“数据敏感度”的场景可能涉及到如下几方面:

鉴别真伪,能看出数据是不是有猫腻;

评判好坏,从数据指标上评判事物的好坏以及是否异常;

数据关联,基于特定的场景,发现数据间的关联;

问题定位,通过数据来诊断特定问题;

提炼规则,从数据中发现某种模式或者趋势;

数据预估,基于已知的数据推算未知的目标数据;

在这些场景中,一个数据分析师数据敏感度高的表现应该是这样的:

1、看到业务关键数据指标,能够在1秒内,发现它们是高了低了还是错了;

2、知道所有指标是怎么来的,知道它们的意义以及相互的关系,进而判断数据异常的原因;

3、拿到海量的数据,能够根据分析目标很快理出分析框架,得出结论。

通常在接受面试的时候,判断你对数据是否敏感,会这样来考你:

一种是拿几张多维度的图表给你看,问你有什么想法,看你能否看出数据偏差,能否发现偏差的是某个产品,能否分析出这个产品为什么会出现这样的状况等等。

一种是给一个规模推算的问题,看你推演的逻辑与技巧:例如在深圳机场每天出行的有多少人?是直接手机查资料,还是从上到下推演,或是从小到上归纳,都能判断一个人的思考框架是怎样的,抑或在面对未知问题的时候是怎样从容面对的。

一个牛逼的分析师,每天都会面对一些超出能力范围内的判断决策,抗压能力也很重要~

如何锻炼数据敏感度

要想锻炼数据敏感度,就要把数据分析变成自己的本能。好比你呼吸,走路,睡觉一样,变成不需要有意控制的本能。

提升数据敏感性,主要靠积累经验,看的数据,量越多、种类越丰富,敏感性越强。

但是这也不意味着随便看、胡乱看,而是有针对性的增加自己能力,可以参考以下三个方向:

预估能力

发现数据异常的能力

数据转化为知识的能力

预估能力

在看到实际数值前,就可以依据其他数据、主观感觉来估算数值,并控制估算误差。

此能力较容易锻炼。看数据之前,对数据进行主观猜测,再拿猜测值与实际值对比,根据实际值调整自己的感觉,多多练习即可。

对于系列数据,比如销量、网站访问量、活跃用户数等,需要明白,在没有异常的情况下,系列数据是由 规律+随机数 组成的。比如周一网站访问量在100W左右,这是规律;上下波动95%的可能在5W以内,这是随机数。

发现数据异常的能力

发现数据异常,是预估能力的一个延伸。越强的预估能力,就越能提高发现异常的速度、准度。

异常有两种:

正确的异常,即现实中有特殊事件发生,反映到数据就异常。

错误的异常,即现实正常,但统计错误导致数据异常。

发现错误的异常也有些小技巧,一并分享如下:

数量级

观察最终数据,保证在数量级上没有大的误差。例如,通过询问需求方得知,每天付费数在30单左右,若统计结果在80单或者8单,则结果很可能有问题。

各维度汇总

对于不同纬度分析,各纬度汇总值是否一致

交互式报表,下钻之后的汇总是否跟下钻前一致。

分布

统计结果的分布,往往有其特性。

例如每天付费数,会有连续性跟周期性两种特性,连续性是不会出现忽高忽低的大幅变动,周期性是周末都会有一定程度的提高或降低,7天一重复。

例如统计员工工作量,对一周的工作总量按员工汇总,一般是由高到低的一个均匀递减。

抽样

抽样检查一直是最有效的方式。取统计值的明细,直接对其中几条进行核对。

选择核对明细时,尽量保证抽样能覆盖各个分层,以及随机性。

数据转化为知识的能力

从数据、信息到知识的演变如下:

关注同名公众号,获取数据分析更多资讯

数据、信息和知识的区别联系:

关注同名公众号,获取数据分析更多资讯

(以上两图,引自涂子沛的《大数据》88页)

这部分能力最难培养。可通过查看各行各业的分析报告,学习从数据转为知识的常见思路,例如:归纳、细分、对比等。

另外针对自己日常工作,请将根本目的设为解决问题,而非完成数据需求。只有深入了解运营,深入了解数据的一线运用场景,才能完成数据到知识的转化。

对于数据分析师而言,还要做到:

关注同名公众号,获取数据分析更多资讯

对业务的理解是数据分析发挥效用的基础,分析师对业务数据的敏感度通常是从报表中来,从需求中来,从数据报告中来。 

学习任何一项技能,勤动脑,勤动手,始终是根本,“数据敏感度”的培养也不例外。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,616评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,020评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,078评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,040评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,154评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,265评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,298评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,072评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,491评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,795评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,970评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,654评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,272评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,985评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,815评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,852评论 2 351

推荐阅读更多精彩内容