数据分析师都需要对业务非常了解,对数据敏感,能判断出指标的波动是否异常。
常用来判断指标波动是否异常的方法有箱线图法、六西格玛原则等,这些方法的原理是一样的,就是界定正常波动的范围,再确定离群点,只是所使用的方法和标准有所差异。
诊断性分析的一般流程:通过分析数据+业务调研寻找问题原因
发现问题—>定义问题—>拆解问题—>寻找原因—>提出解决方案—>落地执行—>反馈迭代—>直到业务问题被解决
数据分析:
(1)从解决的问题本身出发进行数据分析,选择合适的分析方法而不是崇尚高级分析方法。
(2)不盲目地进行分析,先根据业务理解,提出假设,通过数据分析验证假设是否成立
业务调研:
当分析到某些数据变化,已经提不出业务猜想或者无法再往下进行数据分析时,需要多去访谈和调研一线业务人员,从实际业务中寻找输入,最终要定位业务原因,而不是数据原因。
箱线图法
1)收集指标在时间序列上的表现,找出中位数和两个四分位数
① 中位数是一组数据在排序后处于50%位置上的数据
② 四分位数是一组数据在排序后处于25%位置和75%位置上的两个分位值,分别用Q25%和Q75%来表示。Q75%-Q25%称为四分位差,一般用IQR(InterQuartile Range)表示
(2)计算内围栏
① 下围栏:Q25%-1.5×IQR
② 上围栏:Q75%+1.5×IQR
(3)找出离群点。
离群点是大于上围栏或者小于下围栏的数据点。
业务方让数据分析师帮忙分析线下运营的A零售门店最近销量下滑的原因
(1)可衡量的:销量的计算口径是什么?是所有品类还是某单一品类?销量下滑了多少?
(2)有期限的:最近是什么时间段?销量下滑是同之前什么时间段比较的?
(3)带着这些问题确认细节,并辅助业务方计算一些相关数据(相关的、可实现的),确定问题确实是存在的
(4)最终确定具体的问题:分析线下运营的A零售门店的坚果品类2月的日均销量比1月下滑10%的原因。
(1)在工作中我们经常会遇到不具备一般性的业务问题,往往是遵照逻辑树的规则来拆解。
为了保证最终结果不重不漏,通常会按照业务流程的顺序来拆解模块。
例:实体零售店销售一件商品,整个业务流程为店外流量—进店—选购/导购—购买。
(2)在拆解问题时,我们需要往后续可运营的方向上拆解
例:
假设某高考考生需要考的科目是语文、数学、英语、物理、化学和生物,我们想要帮他提升总分,该怎么来分析呢?
① 第一种拆解维度:
总分=语文分数+数学分数+英语分数+物理分数+化学分数+生物分数
我们分析他每个科目近几次考试的平均分和科目满分的差距,假设分析的结果是数学分数比较低,不考虑其他因素,要提升总分,他就需要在数学上用功了。
这种拆解维度最终运营的方向是可以落地的,就是提升数学科目的分数。
②第二种拆解维度:
总分=特级教师所教科目总分+非特级教师所教科目总分
假设分析结果是大部分非特级教师所教科目的总分较低,那么提升总分的方式可能就是更换教师。
这种拆解维度最终运营的方向是无法落地的
当找到业务波动的原因之后,数据分析师就需要和业务方一起探讨解决方案
探讨一般分为以下几个方面:
(1)如何来解决?
短期和长期的方案是什么?
是运营活动还是产品机制?
(2)问题解决的优先级
根据综合成本判断
根据收益等情况判断
在确定解决方案之后,相关人员就需要将解决方案落地,使业务发展进入一个良性循环
数据分析师要不断地关注核心指标的变化,及时复盘解决方案的落地效果
针对过程中出现的不符合预期的偏差及时调整迭代策略
若偏差严重,则数据分析师可能需要重新进行分析,直到问题被解决
三个关键词:需求方、结论、分析过程
一份好的数据分析报告一般要满足以下3个要求:
(1)面向需求方:针对不同的对象,用不同的风格来写
(2)结论简明扼要
(3)分析过程严谨、全面
数据分析报告整体的结构要有逻辑,每个部分之间的起承转合要顺畅,整份报告的内容要是一个完整的故事
报告的形式,可以是PPT、Tableau报告或者Excel表格,形式不限,合适就好
在多数情况下,预测性分析的报告都是以Excel表格的形式来呈现的。
数据分析师在撰写预测性分析报告时,需要注意以下几点:
(1)要分开展示测算的过程数据和最终的结果数据,尽量不要将二者混在一起。
(2)一定要保留过程的计算公式,以方便后续对数据进行调整。
(3)最好用一个单独的工作表来记录数据之间的计算逻辑和指标的口径。
数据分析师可以将测算的过程按数据计算的逻辑顺序来展示,以降低理解成本低,力求让预测性分析报告结构清晰、逻辑严谨、数据预测的可解释性强。
描述性分析的目的:用体系化的框架、合理的指标去评估业务状态,清楚地判断业务现状及定位业务波动的数据原因
描述性分析报告在大多数情况下会沉淀在数据产品上,以减少数据分析师的重复工作,提升工作效率。
可以按以下顺序整理:
(1)描述性分析报告面向的对象:根据职责范畴,确定描述性分析报告中要展示哪些业务
(2)业务的展示顺序:可以按业务级别的高低来展示,或者按业务之间的流程顺序来展示等
(3)具体业务的评估:按总—分的结构来展开,分3层,即评估指标、指标表现、呈现形式
① 确定业务的核心监控指标、拆解的子模块的监控指标
② 用对比分析的方法评估指标的表现,反映业务的变化
定向对比:完成目标进度与时间进度的对比
横向对比:不同对象间的对比
纵向对比:同一对象不同维度的对比(不同的时间段,同环比、活动前后的对比等)
③ 合理的呈现形式:趋势图、颜色梯度等。