一、项目背景
唯品会是一个专门做特卖的网站(特卖一般是指在特定的时间段里,以优惠的价格出售指定的商品)。本文是对唯品会部分特卖商品在2019年双11销售情况的复盘,通过jupyter notebook,使用python的pandas和numpy包完成分析,通过分析结果,优化商品结构,让商品实现更好的销售情况。
二、数据处理
1.数据预览
数据集为excel表格,里面包含三张表:商品明细表、商品热度情况、用户销售明细表包含如下字段:
1)商品明细表:
主要包括每件商品的详细信息,包括:售价、吊牌价、折扣率、库存量、货值、成本价、利润率以及SKU这些字段。折扣率和利润率情况已经包含,后续可以省去计算步骤。
2)商品热度情况:
本表包含4个字段:商品名、UV数、收藏数和加购物车数。这些字段可以通过商品名和其余表关联,计算转化率等。
3)用户销售明细表:
本表记录每个用户购买商品的详细情况,包含:用户id、购买日期、商品名、购买数量、购买单价、购买金额、是否退货、退货件数、退货金额这些字段。可通过商品名和前两张表关联,完成商品销售情况的聚合分析。
2.读取数据
导入模块
读取数据集
读取商品热度数据表
读取用户销售明细表
本次通过sqlalchemy包读取数据库中的数据,将原表的字段名重命名方便观察数据,df.head()查看数据
3.数据预处理
将三张表合并成一张表,便于后续计算和分析:①首先通过“商品名”字段,将商品明细表和商品热度表合并;②用户销售明细表并不能直接合并,需要先以“商品名”为主,通过groupby聚合;③再将以上两张表通过“商品名”字段合并,完成三张表的聚合。
三、总体运营情况评价
总体运营部分,主要关注销售额、售卖比、UV、转化率等指标,其他指标作为辅助指标。销售额用来和预期目标做对比,售卖比用来看商品流转情况。
相关指标
GMV:销售额,在唯品会里称为到手价。
实销:GMV – 拒退金额。
销量:累计销售量(含拒退)。
客单价:GMV / 客户数,客单价与毛利率息息相关,一般客单价越高,毛利率越高。
UV:商品所在页面的独立访问数。
转化率:客户数 / UV。
折扣率:GMV / 吊牌总额(吊牌总额 = 吊牌价 * 销量),在日常工作中,吊牌额是必不可少的。
备货值:吊牌价 * 库存数。
售卖比:又称售罄率,GMV / 备货值。
收藏数:收藏某款商品的用户数量。
加购数:加购物车人数。
SKU数:促销活动中的SKU计数(一般指货号)。
SPU数:促销活动中的SPU计数(一般指款号)。
拒退量:拒收和退货的总数量。
拒退额:拒收和退货的总金额。
相关指标计算
汇总统计
四、 优化商品结构
1.通过划分不同的价格区段将各类数据分组
通过groupby聚合统计各类指标
计算货值占比、销售占比、客单价、转化率
重点目标为售卖价格400以上的商品,对其进行优化
首先挑选出售卖价格400以上的商品
计算其转化率、备货值和售卖比
通过箱线图查看转化率和售卖比的具体情况
通过观察箱线图提出优化方案:
临界值选取的是分位数值,转化率选取50%分位数的值,意味着50%的商品转化率是大于0.007的。售卖比可以选择75%分位数,表示75%的商品转化率是小于0.318的。可以基于这个数值进行浮动,这里选择的临界值是:转化率0.007,售卖比0.36
因此
保留商品:转化率大于0.7%的商品,暂时保留,用于下次促销活动;
保留商品:转化率小于0.7%的商品,但是售卖比大于36%的商品予以保留参加下次促销活动;
清仓商品:转化率小于0.7%的商品,并且售卖比小于36%的商品进行清仓处理。
挑选合格商品
2.通过折扣区间优化商品结构
我们选择0.35-0.4折扣区间进行深入探究。dt_product_discount_info表中,我们可以得到0.35-0.4折扣区间的售卖比为16.90%,转化率为0.53%,折扣率为37%,在进行商品结构优化的时候要着重对比这几个指标。
划分折扣区间
区间指标聚合计算
计算货值占比、销售占比、客单价、转化率
取出目标折扣区间0.35-0.4的数据内容
计算转换率、货值、售卖比
折扣率大于37%的部分找出售卖比大于36.5%且转化率大于0.7%的商品予以保留,其余进行清仓处理;
折扣率小于37%的部分找出售卖比大于36.5%且转化率大于0.7%的部分予以保留,其余进行清仓处理。
四、总结
通过对各类商品的折扣率、售卖比等相关指标进行计算分析,划分出不同的类别,不断的增加商品来保证SKU数,对于新增的商品我们也会增加在其中。对于平销款,我们将其作为快抢和疯抢处理。