1.案例背景
某日式连锁餐饮公司针对所有门店工作日的夜间客流量都不理想的问题做了一次市场调查,根据调查结果分析怎样才能改善工作日夜间的收益性。
2.案例数据
数据包含1000份问卷调查结果,调查对象都是在过去三个月光顾过这家餐厅的顾客。
2.1 数据概览
2.2 输出结果
输出结果是直接与利润挂钩的要素。从图1可以看出,数据项有年龄、性别、婚姻情况、广告印象、光顾次数、光顾人数、消费金额以及所点菜品的种类,据此可得输出结果是什么?
根据调查目的“过去三个月间至少一次光顾过这家店”,可以确定,过去三个月夜间时段的光顾次数、光顾人数、消费金额等可作为输出结果的备选项。因为,每个顾客的光顾次数增加,营业额会增长;每组顾客的光顾人数增加,营业额也会增加;显然,光顾的每组顾客消费金额增加,营业额必然提升。
那么,选择哪个作为输出结果呢?直接选择任一备选项吗?根据要解决的问题“夜间客流量不理想”,即夜间时段的营业额不理想,鉴于上述输出结果的任一备选项都能促进营业额提升,可将输出结果设为“过去三个月夜间时段总消费额”,计算公式如下。
思考:
如果“夜间客流量还可以,但是每位顾客的消费额比较低”,此时该如何确定输出结果?
2.3 分析单位
分析单位为顾客。
2.4 解释变量
通常情况下,除了输出结果,其他都是解释变量。但实际上,有些数据项不能作为解释变量,也有一些数据项需要加工处理。这里围绕分析单位“顾客”,与顾客有关的特征如性别、年龄、光顾次数及消费额等都是解释变量。
2.5 分析方法
根据数据分析思路初步探索所述的分析方法确定原则,输出结果“过去三个月夜间时段总消费额”是定量数据,解释变量中有像光顾次数这样的定量数据,也有像性别这样的定性数据。所以,这里要考察输出结果与多个解释变量(无论是定性数据还是定量数据)之间的关联性,用多元回归分析方法来实现。
3.案例过程
3.1 追加“总消费额”数据列
在Excel表中“消费金额”列后面追加一列“总消费额”。并根据公式总消费额=光顾次数 * 消费金额
计算总消费额。
3.2 对定性解释变量进行one-hot编码
新建男性虚拟变量、已婚(未育)虚拟变量、已婚(已育)虚拟变量,以及套餐类、面类、盖浇饭类、甜品类、其他小食类、饮料类(除酒类)、酒类虚拟变量,加上年龄、广告印象、光顾次数、光顾人数和消费金额这5个定量解释变量,一共15 列解释变量,这是此次多元回归分析的对象。
以准备男性虚拟变量为例,分别完成上述虚拟变量的one-hot编码。
- 在输出结果“总消费金额”左侧插入“男性虚拟变量”列。用
IF
函数,新建表示“性别为男性时1,非男性时0”的单元格。在初始数据中,性别列为C列,在项目名下录入=IF(C2=" 男",1,0)
,并将该单元格的内容复制到列表最后一行。 -
编码完成后,“男性虚拟变量” 是只含有0(女)和1(男)两个数值的定量数据。最终虚拟变量的one-hot编码结果如图3所示。
3.3 进行多元回归分析
首先,根据公式总消费额=光顾次数 * 消费金额
先对与利润有明显关联的解释变量光顾次数、光顾人数以及消费金额进行回归分析,结果如图4所示。
可以用交叉表来分析定性解释变量。
4.案例结论
将图4、图5所示的多元回归分析结果整理成只包含解释变量、回归系数、信赖区间和p值的表格,并标出p值小于0.05的解释变量,结果如图6、图7所示。根据图6和图7,p值小于0.05的解释变量有8个:光顾次数,光顾人数,消费金额,年龄,男性虚拟变量,广告印象,套餐虚拟变量,酒类虚拟变量。此外,除了“套餐类虚拟变量”外,其他解释变量的回归系数都为正,这说明“解释变量每增加1个单位,输出结果总消费额就会随之发生相应的增长”。
以“男性虚拟变量”为例,顾客如果是男性,总消费额就平均增加1103日元。仅针对观察到的信赖区间的数据,在考虑到误差的情况下,男性的总消费额要比女性高,最低487日元,最高可能达1719日元。其他解释变量同理。
此外,“套餐类虚拟变量”的回归系数为-3562,这说明点套餐的顾客的总消费额存在大幅降低的倾向。这要考虑点套餐的顾客在工作日夜间不光顾或基本不消费的情况。
从数据结论来看,可能会对餐厅夜间营业额的增长有贡献的顾客,不论婚姻情况如何,主要是年龄较大的男性。其中,喜欢在这家店里喝酒的顾客在夜间的总消费额比较高。也就是说,年龄层偏高、点酒类的男性顾客在人数相同的情况下会带来更高的销售额。
另外,适当的广告也会提升夜间总营业额。
为此,可以采取的措施:
- 在年龄层偏高的男性常看的杂志媒体上打广告。
- 将夜间的营业模式转型为“适合夜间喝酒的店”。
建议,先在小范围内进行验证,在看到效果之后再考虑调整试行范围。
- 随机选择一部分店铺试行上述措施;
- 比较试点店铺与其他店铺的营业额。
比较可以用交叉表分析、t 检验的方式,以“是否为试点对象”为解释变量,总消费金额为输出结果。如果通过实验发现产生了“无法将其认定为偶然现象”的利润,接下来就可以扩大试点店铺的范围。