数据分析:电商双11促销活动复盘分析总结

本文是对某品牌服装在唯品会上进行双11促销活动后的复盘分析,分为以下几个部分进行:
一:项目背景
二:分析目标
三:分析过程
四:产品结构优化建议

一、项目背景

  唯品会是一个专门做特卖的网站,什么是特卖呢。特卖一般是指在特定的时间段里,以优惠的价格出售指定的商品,一般以商城或者专卖店为多。该模式在线下早已存在(比如商场促销、街边的尾货甩卖),在国外成熟的大商场内也有针对滞销商品的打折特卖,如奥特莱斯。特卖一般是商家清库存,不过也有一些专门生产商品做特卖的商家。
  特卖行业也是有个真实存在的产业链,只是因为快速分销渠道,地理位置等关系,大多数都集中在一线城市,部分生活在一线城市的都基本或多或少去过几次各个品牌的特卖仓,但是二三线甚至四五线城市的就比较难接触到,后来就有一群人成了品牌搬运工,和各大品牌联系通过微信等渠道快速分销大牌库存,达到快速低价消除库存,加快周转回笼资金等目的。
  在货源上,由于品牌尾货具备天然的清仓需求,是折扣零售最常见的货源,但实际上,只要成本足够低,新品首发、定制包销、自有品牌均可以成为折扣特卖零售的可持续货源。成立初期,唯品会货源以尾货为主,但随着唯品会在电商领域的不断发展,新品和专供品的占比不断提升,早在 2016 年 Q2 分析中,唯品会当季新品和平台特供品就已经占 37%了。

二、分析目标

 评估本次促销活动的结果,并根据情况优化商品结构,以便让自己的商品卖的更好。
分析框架:
1、总体运营指标
2、从价格区间找出表现不好的产品,优化商品结构
3、从折扣区间来找出表现不好的产品,优化商品结构

三、分析过程

分析步骤如下:


image.png

具体分析如下:

3.1 数据读取及预处理

import pandas as pd
import numpy as np

import warnings
#忽略警告
warnings.filterwarnings('ignore')

import sqlalchemy
engine = sqlalchemy.create_engine('mysql+pymysql://frogdata05:Frogdata!1321@106.12.180.221:3306/froghd')
# 读取数据
# 商品信息表
sql_cmd = "select * from sales_info1"
# 执行sql语句,获取数据
dt1 = pd.read_sql(sql=sql_cmd, con=engine)
dt1.rename(columns={"sale_name":"商品名",
                    "sale_price":"售卖价",
                    "tag_price":"吊牌价",
                    "discout":"折扣率",
                    "stocks":"库存量",
                    "stocks_value":"货值",
                    "cost_price":"成本价",
                    "profit_rate":"利润率",
                    "skus":"SKU"},
          inplace=True)
dt1.head()
image.png
# 读取数据
# 商品热度表
sql_cmd = "select * from sales_info2"
# 执行sql语句,获取数据
dt2 = pd.read_sql(sql=sql_cmd, con=engine)
dt2.rename(columns={"sale_name":"商品名",
                    "uvs":"UV数",
                    "collections":"收藏数",
                    "carts":"加购物车数"},
          inplace=True)
dt2.head()
image.png
# 读取数据
# 商品信息表
sql_cmd = "select * from sales_info3"
# 执行sql语句,获取数据
dt3 = pd.read_sql(sql=sql_cmd, con=engine)
dt3.rename(columns={"user_id":"用户id",
                    "buy_date":"购买日期",
                    "sale_name":"商品名",
                    "buy_cons":"购买数量",
                    "buy_price":"购买单价",
                    "cost_price":"购买金额",
                    "is_tui":"是否退货",
                    "tui_cons":"退货件数",
                    "tui_price":"退货金额"},
          inplace=True)
dt3['是否退货']=dt3["是否退货"].map({"是":1,"否":0}) #退货为1,不退货为0
dt3.info()
dt3['购买日期']=pd.to_datetime(dt3['购买日期'],format="%Y%m%d") #规范日期数据类型
dt3.head()
image.png
image.png

3.2 多表合并

  从三张表的字段来看,3张表互相关联,所以如果我们想从总体上了解运营情况,需要对三张表的信息合并在一起。

# 把商品信息加上该商品的热度信息
# 得到基础的商品信息,以及商品的一些热度信息:加购物车数量,收藏数量、uv数
dt_product = dt1.merge(dt2,how="left",on="商品名")
dt_product.head()
product_sales = dt3.groupby("商品名").agg({"购买数量":"sum",
                                                 "购买金额":"sum",
                                                 "退货件数":"sum",
                                                 "退货金额":"sum",
                                                 "购买单价":"mean",
                                                 "用户id":pd.Series.nunique}).reset_index()
product_sales.rename(columns={"购买数量":"商品销售数量",
                              "购买金额":"商品销售金额",
                              "是否退货":"商品退货数量",
                              "退货金额":"商品退货金额",
                              "购买单价":"商品销售单价",
                              "用户id":"购买用户数量"},inplace=True)
product_sales.head()
# 合并商品信息
dt_product_sales = dt_product.merge(product_sales,how="left",on="商品名")
dt_product_sales.head()
image.png

3.3总体运营情况评价

  总体运营部分,主要关注销售额、售卖比、UV、转化率等指标,其他指标作为辅助指标。销售额用来和预期目标做对比,售卖比用来看商品流转情况。
指标定义如下:
GMV:销售额,在唯品会里称为到手价。
实销:GMV – 拒退金额。
销量:累计销售量(含拒退)。
客单价:GMV / 客户数,客单价与毛利率息息相关,一般客单价越高,毛利率越高。
UV:商品所在页面的独立访问数。
转换率:客户数 / UV。
折扣率:GMV / 吊牌总额(吊牌总额 = 吊牌价 * 销量),在日常工作中,吊牌额是必不可少的。
备货值:吊牌价 * 库存数。
售卖比:又称售罄率,GMV / 备货值。
收藏数:收藏某款商品的用户数量。
加购数:加购物车人数。
SKU数:促销活动中的SKU计数(一般指货号)。
SPU数:促销活动中的SPU计数(一般指款号)。
拒退量:拒收和退货的总数量。
拒退额:拒收和退货的总金额。

#1、GMV:销售额,包含退货的金额
gmv = dt_product_sales["商品销售金额"].sum()
#2、实际销售额=GMV - 退货金额
return_sales = dt_product_sales["商品退货金额"].sum()
return_money = gmv - return_sales
#3、销量:累计销售量(含拒退)
all_sales = dt_product_sales["商品销售数量"].sum()
#4、客单价:GMV / 客户数,客单价与毛利率息息相关,一般客单价越高,毛利率越高。
# dt3.user_id.unique().count()
custom_price = gmv / dt_product_sales["购买用户数量"].sum()
# 5、UV:商品所在页面的独立访问数
uv_cons = dt_product_sales["UV数"].sum()
# 6、转化率:客户数 / UV。
uv_rate = dt_product_sales["购买用户数量"].sum() / dt_product_sales["UV数"].sum()
# 7、折扣率:GMV / 吊牌总额(吊牌总额 = 吊牌价 * 销量),在日常工作中,吊牌额是必不可少的。
tags_sales = np.sum(dt_product_sales["吊牌价"] * dt_product_sales["商品销售数量"])
discount_rate= gmv / tags_sales 
# 8、备货值:吊牌价 * 库存数。
goods_value = dt_product_sales["货值"].sum()
# 9、售卖比:又称售罄率,GMV / 备货值。
sales_rate = gmv / goods_value
# 10、收藏数:收藏某款商品的用户数量。
coll_cons = dt_product_sales["收藏数"].sum()
# 11、加购数:加购物车人数。
add_shop_cons = dt_product_sales["加购物车数"].sum()
# 12、SKU数:促销活动中的最小品类单元(一般指货号)。
sku_cons = dt_product_sales["SKU"].sum()
# 13、SPU数:促销活动中的SPU计数(一般指款号)。
spu_cons = len(dt_product_sales["商品名"].unique())
# 14、拒退量:拒收和退货的总数量。退货件数
reject_cons = dt_product_sales["退货件数"].sum()
# 15、拒退额:拒收和退货的总金额。
reject_money = dt_product_sales["商品退货金额"].sum()
#汇总统计
sales_state_dangqi = pd.DataFrame(
    {"GMV":[gmv,],"实际销售额":[return_money,],"销量":[all_sales,],"客单价":[custom_price,],
     "UV数":[uv_cons,],"UV转化率":[uv_rate,],"折扣率":[discount_rate,],"货值":[goods_value,],
     "售卖比":[sales_rate,],"收藏数":[coll_cons,],"加购数":[add_shop_cons,],"sku数":[sku_cons,],
     "spu数":[spu_cons,],"拒退量":[reject_cons,],"拒退额":[reject_money,],}, 
    ) #index=["今年双11",]
sales_state_dangqi
image.png
# 去年的数据是已经统计好了的,不需要计算(写死的内容)
sales_state_tongqi = pd.DataFrame(
    {"GMV":[2261093,],"实际销售额":[1464936.517,],"销量":[7654,],"客单价":[609.34567,],
     "UV数":[904694,],"UV转化率":[0.0053366,],"折扣率":[0.46,],"货值":[12610930,],
     "售卖比":[0.1161,],"收藏数":[4263,],"加购数":[15838,],"sku数":[82,],
     "spu数":[67,],"拒退量":[2000,],"拒退额":[651188.57,],}, 
    ) #index=["去年双11",]
sales_state_tongqi
image.png

指标同比

#sales_state = pd.concat([sales_state_dangqi, sales_state_tangqi])
sales_state_dangqi_s = pd.DataFrame(sales_state_dangqi.stack()).reset_index().iloc[:,[1,2]]#stack,将列旋转到行,unstack是反操作
sales_state_dangqi_s.columns = ["指标","今年双11"]
sales_state_tongqi_s = pd.DataFrame(sales_state_tongqi.stack()).reset_index().iloc[:,[1,2]]
sales_state_tongqi_s.columns = ["指标","去年双11"]
sales_state = pd.merge(sales_state_dangqi_s, sales_state_tongqi_s,on="指标")
sales_state["同比"] = (sales_state["今年双11"] - sales_state["去年双11"]) / sales_state["去年双11"]
sales_state
image.png

3.4 从价格区间优化商品结构

(1)将用户对价格敏感度将价格分为1-200,200-400,400以上区间

# 划分价格区间段
#设置切分区域
listBins = [0,200, 400, 100000]
#设置切分后对应标签
listLabels = ['1_200','200_400','400及以上']
dt_product_sales['价格分组'] = pd.cut(dt_product_sales['售卖价'], bins=listBins, labels=listLabels, include_lowest=True)
dt_product_sales.head()
image.png

(2)计算各项指标

dt_product_sales['备货值']=dt_product_sales['吊牌价']*dt_product_sales['库存量']
image.png

价格区间分组

# 货值占比、销售占比、客单价、转化率  后面求
dt_product_sales_info = dt_product_sales.groupby("价格分组").agg({
                                        "货值":"sum",
                                        "商品销售金额":"sum",
                                        "商品销售数量":"sum",
                                        "UV数":"sum",
                                        "购买用户数量":"sum",
                                        "收藏数":"sum",
                                        "加购物车数":"sum",
                                        "备货值":'sum'}).reset_index()
dt_product_sales_info.head()
image.png

计算各价格区间转换率和售卖比

# 货值占比、销售占比、客单价、转化率
dt_product_sales_info["货值占比"]=dt_product_sales_info["货值"]/dt_product_sales_info["货值"].sum()
dt_product_sales_info["销售占比"]=dt_product_sales_info["商品销售金额"]/dt_product_sales_info["商品销售金额"].sum()
dt_product_sales_info["客单价"]=dt_product_sales_info["商品销售金额"]/dt_product_sales_info["购买用户数量"]
dt_product_sales_info["转化率"]=dt_product_sales_info["购买用户数量"]/dt_product_sales_info["UV数"]
dt_product_sales_info['售卖比']=dt_product_sales_info['商品销售金额']/dt_product_sales_info['备货值']
dt_product_sales_info.head()
image.png

(3)提取关键价格区间进行分析
400元及以上区间销售额占比最大且销售数量最低,容易造成商品积压,对该价格区间数据进行分析,首先找出在本次活动中此区间的销售数据,数据要求显示具体的款号、销售额、销量等信息。然后计算出每款商品的售卖比、转化率等指标。

# 取出400及以上价格区间的数据内容
product_400 = dt_product_sales[dt_product_sales["价格分组"]=='400及以上']
product_400.head()
image.png

计划该价格区间的转换率和售卖比等指标

# 转换率=客户数 / UV
product_400['转换率'] = product_400["购买用户数量"]/product_400["UV数"]
# 备货值=吊牌价 * 库存数
product_400["备货值"] = product_400["吊牌价"]*product_400["库存量"]
# 售卖比=又称售罄率,GMV / 备货值
product_400["售卖比"] = product_400["商品销售金额"]/product_400["备货值"]
product_400.head()
image.png
product_400[['商品名','商品销售金额','UV数','转化率','售卖比',"货值占比","销售占比"]]
image.png

400元以上价格区间的转换率和售卖比描述统计

product_400[['转换率','售卖比']].describe()
image.png

(4)优化方案:
以转化率和售卖比的中位数为临界点进行商品优化,即
1.转化率大于0.7%的商品,暂时保留,用于下次促销活动;
2.转化率小于0.7%的商品,但是售卖比大于23%的商品予以保留参加下次促销活动
3.转化率小于0.7%的商品,并且售卖比小于23%的商品进行清仓处理。

  • 保留商品:
# 挑选合格的商品:
#1.选择转换率大于0.7%的商品
stay_stocks571 = product_400[product_400["转化率"]>0.007]
stay_stocks571
image.png
# 挑选合格的商品:
# 2、保留商品:找出转化率小于0.7% 但是 售卖比大于23%的部分予以保留
stay_stocks573 = product_400[(product_400["售卖比"]>=0.23)&(product_400["转化率"]<0.007)]
stay_stocks573
image.png
  • 清仓商品:
# 清仓处理商品,找出转化率小于0.7%并且售卖比小于23%的部分
stay_stocks574 = product_400[(product_400["售卖比"]<0.23)&(product_400["转化率"]<0.007)]
stay_stocks574
image.png

3.5 从折扣区间来优化商品结构

dt_product_sales.head()
image.png

(1)划分折扣区间

# 划分价格区间段
#设置切分区域
listBins = [0.15, 0.2, 0.25, 0.3, 0.35, 0.4, 0.45, 0.5, 0.55, 0.6, 0.65, 0.7, 1]
#设置切分后对应标签
listLabels = ['0.15_0.2','0.2_0.25','0.25_0.3','0.3_0.35','0.35_0.4','0.4_0.45','0.45_0.5','0.5_0.55','0.55_0.6','0.6_0.65','0.65_0.7','0.7_1']
#利用pd.cut进行数据离散化切分,注意分组标签和分组数要一致
dt_product_sales['折扣区间'] = pd.cut(dt_product['折扣率'], bins=listBins, labels=listLabels, include_lowest=True)
dt_product_sales.head()
image.png

(2)分组各区间统计计算商品各项指标

# 货值占比、销售占比、客单价、转化率  后面求
dt_product_discount_info = dt_product_sales.groupby("折扣区间").agg({
                                        "货值":"sum",
                                        "商品销售金额":"sum",
                                        "商品销售数量":"sum",
                                        "UV数":"sum",
                                        "购买用户数量":"sum",
                                        "收藏数":"sum",
                                        "加购物车数":"sum"
                                        }).reset_index()
dt_product_discount_info
image.png

求货值占比、销售占比、客单价、转化率

# 货值占比、销售占比、客单价、转化率  后面求
dt_product_discount_info = dt_product_sales.groupby("折扣区间").agg({
                                        "货值":"sum",
                                        "商品销售金额":"sum",
                                        "商品销售数量":"sum",
                                        "UV数":"sum",
                                        "购买用户数量":"sum",
                                        "收藏数":"sum",
                                        "加购物车数":"sum",
                                        "货值占比":"sum",
    "销售占比":"sum",
    "备货值":"sum"
                                        }).reset_index()
dt_product_discount_info
image.png

求各折扣区间的转化率和售卖比

dt_product_discount_info['转化率']=dt_product_discount_info['购买用户数量']/dt_product_discount_info['UV数']
dt_product_discount_info['售卖比']=dt_product_discount_info['商品销售金额']/dt_product_discount_info['备货值']
dt_product_discount_info
image.png

(3)提取销售占比最大的折扣区间(0.35_0.4)的数据内容

dt_product_discount_sale_35_40=dt_product_sales[dt_product_sales['折扣区间']=='0.35_0.4']
dt_product_discount_sale_35_40
image.png

计算该折扣区间的商品指标

# 转换率=客户数 / UV
dt_product_discount_sale_35_40['转换率'] = dt_product_discount_sale_35_40["购买用户数量"]/dt_product_discount_sale_35_40["UV数"]
# 备货值=吊牌价 * 库存数
dt_product_discount_sale_35_40["备货值"] = dt_product_discount_sale_35_40["吊牌价"]*dt_product_discount_sale_35_40["库存量"]
# 售卖比=又称售罄率,GMV / 备货值
dt_product_discount_sale_35_40["售卖比"] = dt_product_discount_sale_35_40["商品销售金额"]/dt_product_discount_sale_35_40["备货值"]
dt_product_discount_sale_35_40.head()
image.png

对该区间转换率和售卖比进行统计描述

dt_product_discount_sale_35_40[['转换率','售卖比']].describe()
image.png

(4)优化策略:以中位数为临界点,即
1.对于转换率>0.5%的商品予以保留
2.对于转换率<=0.5%且售卖比>18%的商品予以保留
3.对于转换率<=0.5%且售卖比<=18%的商品予以清仓处理

  • 保留商品:
dt_product_discount_sale_35_40[(dt_product_discount_sale_35_40['转化率']>=0.005)]
image.png
dt_product_discount_sale_35_40[(dt_product_discount_sale_35_40['转化率']<=0.005)&(dt_product_discount_sale_35_40['售卖比']>0.18)]
image.png

完毕

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,012评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,628评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,653评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,485评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,574评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,590评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,596评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,340评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,794评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,102评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,276评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,940评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,583评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,201评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,441评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,173评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,136评论 2 352

推荐阅读更多精彩内容