摘要:
从阿里云天池上下载到一份天猫婴幼儿商品销售记录,时间是从2012年7月至2015年2月。为了解婴儿用品销售概况,发现可能存在的问题,帮助店铺减少运营成本并提升销售利润,对数据进行初步分析。
从商品层面和用户层面分析数据,结论如下:
商品层面:
a. 市场整体趋势:
母婴用品市场整体销量逐年上升趋势,而且全年销量波动较大;
大型促销活动(“双十一”)引流效果十分明显,可以有效增加销量,且每年“双十一”的销量与上一年相比都有明显的增长。一方面要提前做好促销期间准备,一方面可以借势带动低销量产品的销售;
每年春节假期前后,商品销量下降至全年最低。
b. 商品需求
出售的商品总共有5大类,28、50008168、50014815这三类商品为热销产品,占本店铺总销量的80%。可以作为店铺首页宣传商品来引流;
商品的复购率仅不到0.1%,大多用户为一次性消费。但信息不足,无法判断仅消费一次的原因。如果能有效提升用户复购,可以明显增加销量。
用户层面:
婴幼儿期用户是主要购买对象,吸引更多婴幼儿用户;
从性别占比看,整体用户消费水平没有表现出特别明显的婴儿性别差异,在细分领域下女婴需求量稍大于男婴,根据需求可针对性制定营销策略,优化商品种类,吸引更多女婴用户;
不同年龄段的用户购买情况有明显的差别,可以针对不同的人群进行差异化营销。
一、分析目的:
通过分析某天猫店铺婴儿用品在2012年7月至2015年2月的销售情况和客户信息,了解婴儿用品销售概况,发现可能存在的问题,帮助店铺减少运营成本并提升销售利润。
二、理解数据:
获得的数据包含2个表,表中的字段名和含义如下所示。为了方便后面的分析,经过整理把它们汇总到一张表中。
三、提出问题
从商品维度:
1.哪类商品最热销?哪类商品相对冷门?
2.商品销售量是否存在周期性?情况如何?
从用户维度:
3.用户的购买忠诚度如何?
4.不同性别和不同年龄段的婴幼儿的对不同类别商品的购买需求各是怎样的?
五、数据清洗
数据清洗的步骤:
选择子集:隐藏商品属性
列名重命名:重命名为中文
删除重复值:数据-数据工具-删除重复值
缺失值处理:查找-定位条件-空值
一致化处理:对购买日期、出生日期通过数据-分列方法实现日期格式的一致化处理
六. 分析问题
(一) 商品方面
1. 热销商品
根据总销量,28、50008168和50014815是最畅销的三类商品,接近销量的90%。
最畅销商品的二级分类
2. 商品销售量随时间变化情况分析
由上两张图表可以看出:
除了2012和2015的部分数据不完整,2013和2014的整个销售量呈上升的趋势。
观察2013和2014两年销售额逐月变化,可以发现:
11月份出现销售量最高峰,在1-2月份销售量有明显的下降趋势。
首先看11月的高峰:
看历年11月每天的销量,双11有明显的销量高峰,可以认为是双11促销带来的11月销售高峰。
对于1-2月的低谷:
2013年的2月10日前后和2014年的1月31日前后有明显的低谷。查询可知,这正好是春节假期。两年的销售淡季正出现在法定春节假期期间,时间上吻合。而在假期结束后,销售量立刻有明显增长,因此可以认为1月和2月的低谷是放假的影响。
(二) 用户方面
用户复购率情况分析
通过透视数据,降序排序后可看出,最高纪录的购买次数4只出现在一位用户身上,且该用户购买记录集中在2013年这一年中,此后几年中无记录。
筛选出的所有复购用户,发现只有25人有复购行为,而总的用户数有29949人,复购率极低,连0.1%都不到,大多的用户都为一次性消费。
由于此份数据源局限性,根据现有数据暂时无法对导致复购率低的相关问题因素进行深入分析。
2. 商品销量与用户年龄段关系分析
用户涵盖未出生人口,为了便于分析,首先对用户年龄进行分段处理。此处使用VLOOKUP函数关联查询。
以用户年龄段、商品类别字符段,和购买量作为指标创建图表如下:
不同时期对不同种类商品的需求
婴幼儿期的用户是消费主力军,占据超过80%的市场。对主体用户婴幼儿期,50008168、28以及50014815类别的商品为用户喜爱产品类别TOP3,而38类别的商品在所有商品类别中销量最低。
3. 商品销量与婴儿性别关系分析
从性别占比上看,除去未知性别(宝宝未出生时购买)的销售数,女婴的需求量稍大于男婴,从占比来看母婴商品市场中整体用户消费水平没有表现出特别明显的性别差异。
由图可知,女童的人数高于男童,所有性别用户对产品的购买趋势相近,并没有明显的性别差异,性别不是影响销量的主要因素。