数据分析是当前比较火的一个职业,这个职业要做好,是否存在一定的方法可以让结果更好呢?如下是基于鄙人工作经验总结的一些心得,希望对大家能有所帮助
主要从分析四步骤及如何把每个步骤做到更好的方法来进行总结
一、分析思路
1.确认分析点
为什么要做这个呢?往往数据需要分析的点不是分析师自己发起,而是业务发起,但他们往往不能第一时间描述清楚自己的问题和真实需求,所以需要分析师协助其更好的理解自己真实的诉求,清楚的解读这个问题到底是什么
2.思路梳理
将问题进行切割梳理,为后面有条理有目的的深入看数据做准备,每条思路都存在一种基于业务认知的预设假设,而后再利用数据去判断假设是否成立
3.收集信息
基于步骤2梳理的思路,收集相关信息,主要包括业务在什么时间点做过什么调整决策、和这个主题相关的内部外部信息等等
4.深入分析
基于梳理的思路及掌握的信息,结合数据逐个去验证每个假设对结果的影响。看数据时可能会产生新的思路,可返回完善思路
如上四步骤是为了更好的理解所以拆分开,但实际工作中每步是互通的,如收集信息时发现思路有缺失,如看数据时发现之前的思考缺失,都可返回补充完善思路
二、如何把上述四步骤做的更好呢?
1.如何更好的确认分析点
(1) 问题
对方在表达需求时,很多时候是自己习惯性的语言,缺乏专业的数据背景,导致表达不得要领,需要基于专业的引导帮助找到真实的问题
(2) 方法
和对方交流时换个方式,用“您做这件事的目的是什么,想解决什么问题?”替换对方字面的意思,再基于自己数据的专业,给予对方更专业的引导,让彼此达成一致
(3) 案例
A=业务;B=初级分析师;C=资深分析师
A:能否帮拉下通过XX收银机卖的TOP20商品
B:准备给对方提供前30天销售额最好的20支商品
C:B,可稍微缓缓,我们来交流一下,想问个问题,你觉得她问的问题是什么?
B:她要XX收银机卖的最好的TOP20商品,所以准备给销售额最好的
C:为什么会直接给销售额TOP20,是不是本能反应觉得对方要的是销售额TOP20?
B:是的,因为一直以来都把卖的最好的普遍定义为销售额最好的
C:好,那我们换个角度往深再想一下,她提出来卖的最好的商品这句话背后实际意义是什么?做这件事的目的是什么,如果不清楚可以和对方交流下,提个醒“问问他拿这些数是想干什么事情”
B找到A,并进行如下交流
B:你好,请问你要那个数据做什么
A:是想给XX收银机的商品做个推荐排序,看哪类商品最受客户欢迎
B:其实是要看人流最高的商品,用售卖订单量最高的商品,是不是更合适
A:是的是的,是这个样子
2.如何梳理思路切分问题
(1) 问题
思路梳理的好坏,直接影响深入分析的产出,能否更完整的对问题进行诊断,能否更清晰的去用数据看问题
(2) 方法
找到影响的直接结果因素A,B,C等等
基于a,找到影响每个结果因素的因素,如影响A的A1,A2,A3等等
基于a和b,穷举出对问题结果可能影响的思路
(3) 案例
以客单价为例,应用场景:当客单价下降,找到下降的缘由
1)直接因素
客单价
=销售额/客流
=商品1的金额+..+商品n的金额)/客流
=(客户1的金额+...+客户n的金额)/客流
2)间接因素
销售额=商品1的售价*数量+商品2的售价*数量+....+商品n的售价*数量
商品n的金额=不同价格区间商品金额=不同品类价格区间的商品金额总和=售卖的SKU数越多,n越大
客户n的金额=不同价格区间的客户分布
数量=备货是否足够,市场诉求是否下降
3)穷举出影响的因素:
不同单价商品的销售对结果的影响,价格有区间,看区间销售分布
提供给客户的商品选择范围,对客户购买商品的SKU分布影响
备货是否足够,缺货导致可选择的商品种类变少,丰富度降低
单笔金额的客户分布情况,不同消费能力的用户是否变化,各自贡献如何
市场诉求是否变化
3、如何收集信息
(1) 方法
对内
梳理完整的业务工作流,可从系统使用、业务流程、人员架构入手
基于工作流找到关键环节,如使用系统收货、促销活动制定、盘点等
针对关键环节收集近期与其相关的信息,如是否调整、做了什么调整
对外
外部市场竞争对手
相关政策调整
黑天鹅事件
(2) 案例
销售额下降为例
对内:
工作流-系统:如新的订货系统上线,需学习使用
工作流-业务流:如蔬菜订货有T+1更换为T+2,部分食百商品更换为系统自动补货
工作流-人员架构:售卖的负责人、商品采购负责人都进行了重大调整
对外:
竞争对手:新开了两家店
政策调整:垃圾分类
黑天鹅事件:新冠疫情的爆发
4.如何深入分析
(1) 深入看数据的通用方法及关键点
由粗到细
可协助初步定位发生问题的点,核心是找到切分问题的维度,维度取决于行政架构、业务模型,一般零售企业可从人、货、场切入
人:购买用户进行分类
货:售卖的全部商品及商品分类,如卖肉的里面分前腿肉和后腿肉,水果有进口和国内
场:售卖的区域及划分,有国家通用的行政区域,如全国->省->市->县->门店,企业的区域划分,如华东大区->某区域->某门店
粒度组合
粒度数据由不同维度交叉组合而成,同一度量值在不同粒度下的变化趋势,可帮助精准定位问题及找到可能的机会
如:江苏区19年3月(区域维度=江苏区,时间维度=19年3月);华东区19年的猪肉(区域维度=华东区,时间维度=19年,商品维度=猪肉)
度量值
是衡量业务实际表现的指标,不同度量值之间存在此起彼伏或间接相关的关系
如:销售提升毛利提升,客流上升客单却下降,这种关系对于分析很关键
对比对象
无对比无惊喜,很多惊喜源于对比,选择合适的对比对象很关键
通用对比:空间对比(如:不同区域对比),时间对比(如:不同年同月份对比),流程对比(如:下单量对比到货量),但对比往往取决于实际看数过程的一些拆分组合,但也都基于原始维度的拆分,万变不离其宗
(2) 实际看数据的流程
步骤一:初步定位问题出现的地方
找到问题发生的地方,帮助下一步有针对的进行问题产生的原因进行分析,两个关键点可帮助做的更好
关键1:选择最合适的角度切入,核心取决于业务形态的主要组成维度,如零售的主要维度是门店区域和商品种类
关键2:为后续分析提供新的对比维度视角,因为问题发生可能不是全面性,而是局部,局部之间的对比有优劣势,从中可对比出很多的机会点
步骤二:验证思路,找到原因
结合步骤一和前期梳理的思路进行逐一验证,找到问题产生的原因,3个关键点可帮助做的更好
关键1:如何将步骤一确定的出现问题的地方与梳理的思路结合起来看
关键2:验证过程很有可能产生新的思路,即使是新的,也都基于相类似的业务,可返回把之前梳理思路的过程再来一遍,补充完善
关键3:选择合适的对标对象很重要,一般基于90%相同的条件+关键条件有差异的方式选择对标对象,这样可更好的验证结果与有差异的因素的强相关性
5.如何找到合适的数据指标来衡量业务问题
数据指标在每个步骤都是内含的,所以单独列出来详细说明一下
(1) 问题
数据指标是怎么来的,不同业务场景,数据指标可选择的范围又有哪些呢?
(2) 方法&案例
数据指标由各种维度和度量值进行组合而成的,找到合适的维度和度量,可协助找到合适的数据指标
维度
案例如下
时间:自然日=日、周、月、年、同节日;季节=春季、夏季、秋季、冬季;节日=中秋节、春节、五一劳动节、清明
空间:地域=国家、省、市、县;流程=引入、上架、下单、发货、收货、售卖、退货;渠道=门店、天猫、淘宝、京东;
逻辑:归属关系=商品种类-部类、商行、课组、中类、小类
度量值
零售案例如下,通过人货场拆分
人:新客、老客、流失客户;高单价客户、低单价客户
货:售卖、进货、库存等等
售卖=销售额、销量、平均售价、毛利额、毛利率
进货=下单量、到货量、数量到货率
库存=库存量、库存额、 库存周转、高库存额
场:费用、成本
费用=人力费用、营销费用、房租、水电费等等
成本=商品成本、固资折旧等等
(3) 应用数据指标的关键点
度量值的对比需在同一体量之内,若不在,需做归一化处理
如不同门店不同售价区间的销售对比,用销售额直接对比不合理,需换成销售贡献,因为不同门店本身体量的上限存在差异
基于原始维度衍生的新维度,随着看数据的深入,对比维度对随着对比对象的变化而调整,让数据的可参考性更强
如原本按照行政区域划分门店群,但看客单价问题时,不同门店群的表现有一定的分类聚集性,此时需重新调整门店群的划分,基于客单价不同进行划分,而非行政区域
新维度的度量值,需基于该场景下真实数据而合理划分
如售价区间,需看商品价格的分布来确认区间值的划分,不能拍脑袋,不同业务形态单价差异很大,卖衣服单价300以100元的差异划分,超市单价10块以1元的差异划分
选择合适的数据指标衡量该因素对整体的影响是否足够大,可帮助快速判断是否需要深入分析,提高工作效率
如衡量售卖商品中折扣对整体的影响,可先用打折产生的销售额占总体销售的占比进行判断,若体量太小,则不需继续深入分析操作,避免人力物力的浪费
非数据参考的重要性
有些数据结论不是单纯从数据得出,而是实地调研+数据结合判断,才可更好的验证结论,如门店人员对系统操作的匮乏,不知道怎么订货,从而导致缺货
写在最后:
本文是总结的方法套路,具体怎么在一个个实际案例中实现,会在后续的文章中做一些分享的,欢迎交流