案例背景:
唯品会是一个专门做特卖的网站,一般以商城或者专卖店为多。本案例便是一次促销活动后的复盘。
目的:
使用python对数据进行清洗,聚合,提出有用信息,评估每次促销活动的结果,并根据情况优化商品结构,以便让自己的商品卖的更好。
分析流程:
- 总体运营指标
- 从价格区间找出表现不好的产品,优化商品结构
- 从折扣区间来找出表现不好的产品,优化商品结构
导入需要用到的包
import pandas as pd
import numpy as np
import warnings
warnings.filterwarnings('ignore')
从数据库中导出活动相关数据
import sqlalchemy
engine = sqlalchemy.create_engine('mysql+pymysql://******:******@localhost:3306/***')
# 读取数据
# 商品信息表
sql_cmd = "select * from sales_info1"
dt1 = pd.read_sql(sql=sql_cmd, con=engine)
dt1.rename(columns={"sale_name":"商品名",
"sale_price":"售卖价",
"tag_price":"吊牌价",
"discout":"折扣率",
"stocks":"库存量",
"stocks_value":"货值",
"cost_price":"成本价",
"profit_rate":"利润率",
"skus":"SKU"},
inplace=True)
dt1.head()
# 读取数据
# 商品信息表
sql_cmd = "select * from sales_info2"
# 执行sql语句,获取数据
dt2 = pd.read_sql(sql=sql_cmd, con=engine)
dt2.rename(columns={"sale_name":"商品名",
"uvs":"UV数",
"collections":"收藏数",
"carts":"加购物车数"},
inplace=True)
dt2.head()
sql_cmd = "select * from sales_info3"
# 执行sql语句,获取数据
dt3 = pd.read_sql(sql=sql_cmd, con=engine)
dt3.rename(columns={"user_id":"用户id",
"buy_date":"购买日期",
"sale_name":"商品名",
"buy_cons":"购买数量",
"buy_price":"购买单价",
"cost_price":"购买金额",
"is_tui":"是否退货",
"tui_cons":"退货件数",
"tui_price":"退货金额"},
inplace=True)
dt3['是否退货']=dt3["是否退货"].map({"是":1,"否":0})
dt3.head()
对表三进行数据处理合,并合并上三表方便操作
# 把商品信息加上该商品的热度信息
# 得到基础的商品信息,以及商品的一些热度信息:加购物车数量,收藏数量、uv数
dt_product = dt1.merge(dt2,how="left",on="商品名")
dt_product.head()
# 统计每个商品的一个销售情况
product_sales = dt3.groupby("商品名").agg({"购买数量":"sum",
"购买金额":"sum",
"退货件数":"sum",
"退货金额":"sum",
"购买单价":"mean",
"用户id":pd.Series.nunique}).reset_index()
product_sales.rename(columns={"购买数量":"商品销售数量",
"购买金额":"商品销售金额",
"是否退货":"商品退货数量",
"退货金额":"商品退货金额",
"购买单价":"商品销售单价",
"用户id":"购买用户数量"},inplace=True)
product_sales.head()
# 合并商品信息
dt_product_sales = dt_product.merge(product_sales,how="left",on="商品名")
dt_product_sales.head()
一、总体运营情况评价
我们可以把总体运营情况分为运营、商品、市场三方面分析
总体运营情况评价
对思维导图的指标进行处理
#GMV:销售额,包含退货的金额
GMV = dt_product_sales.商品销售金额.sum()
#实际销售额
return_sale = dt_product_sales.商品退货金额.sum()
return_money = GMV - return_sale
#销量:累计销售量(含拒退)
all_sales = dt_product_sales.商品销售数量.sum()
#客户数
customer = dt_product_sales["购买用户数量"].sum()
#客单价:GMV / 客户数
custom_price = GMV / dt_product_sales["购买用户数量"].sum()
# UV:商品所在页面的独立访问数
uv_cons = dt_product_sales["UV数"].sum()
# 转化率:客户数 / UV。
uv_rate = dt_product_sales["购买用户数量"].sum() / dt_product_sales["UV数"].sum()
# 折扣率
tags_sales = np.sum(dt_product_sales["吊牌价"] * dt_product_sales["商品销售数量"])
discount_rate= GMV / tags_sales
#备货值:吊牌价 * 库存数。
goods_value = dt_product_sales["货值"].sum()
# 售卖比:又称售罄率,GMV / 备货值。
sales_rate = GMV / goods_value
# 收藏数:收藏某款商品的用户数量。
coll_cons = dt_product_sales["收藏数"].sum()
# 加购数:加购物车人数。
add_shop_cons = dt_product_sales["加购物车数"].sum()
# SKU数:促销活动中的最小品类单元
sku_cons = dt_product_sales["SKU"].sum()
# 促销活动中的SPU计数
spu_cons = len(dt_product_sales["商品名"].unique())
# 14、拒退量:拒收和退货的总数量。退货件数
reject_cons = dt_product_sales["退货件数"].sum()
# 拒退额:拒收和退货的总金额。
reject_money = dt_product_sales["商品退货金额"].sum()
将数据汇统并和去年同时期做对比
# 汇总统计
# 汇总统计
sales_state_dangqi = pd.DataFrame(
{"GMV":[GMV,],"实际销售额":[return_money,],"销量":[all_sales,],"客单价":[custom_price,],
"UV数":[uv_cons,],"UV转化率":[uv_rate,],"折扣率":[discount_rate,],"货值":[goods_value,],
"售卖比":[sales_rate,],"收藏数":[coll_cons,],"加购数":[add_shop_cons,],"sku数":[sku_cons,],
"spu数":[spu_cons,],"拒退量":[reject_cons,],"拒退额":[reject_money,],"客户数":[customer],},
) #index=["今年双11",]
# 去年的数据是已经统计好了的,不需要计算
sales_state_tongqi = pd.DataFrame(
{"GMV":[2261093,],"实际销售额":[1464936.517,],"销量":[7654,],"客单价":[609.34567,],
"UV数":[904694,],"UV转化率":[0.0053366,],"折扣率":[0.46,],"货值":[12610930,],
"售卖比":[0.1161,],"收藏数":[4263,],"加购数":[15838,],"sku数":[82,],
"spu数":[67,],"拒退量":[2000,],"拒退额":[651188.57,],"客户数":[3710]},
) #index=["去年双11",]
#sales_state = pd.concat([sales_state_dangqi, sales_state_tangqi])
sales_state_dangqi_s = pd.DataFrame(sales_state_dangqi.stack()).reset_index().iloc[:,[1,2]]
sales_state_dangqi_s.columns = ["指标","今年双11"]
sales_state_tongqi_s = pd.DataFrame(sales_state_tongqi.stack()).reset_index().iloc[:,[1,2]]
sales_state_tongqi_s.columns = ["指标","去年双11"]
sales_state = pd.merge(sales_state_dangqi_s, sales_state_tongqi_s,on="指标")
sales_state["同比"] = (sales_state["今年双11"] - sales_state["去年双11"]) / sales_state["去年双11"]
sales_state
可以看到,比起去年的,折扣力度更大了,所以客单价下降,但是由此带来的收益必去年大,总体的促销效果还是很不错的,但是需要注意退货量比起去年几乎翻了一倍。
二、从价格区间来优化商品结构
目的
深入探究不同区间的数据,以此来优化后期的促销结构。首先我们需要找到在本次促销中此区间的销售源数据,源数据要求显示具体的款号、销售额、销量等信息。第二步,计算出每个款的转化率、折扣率等数据
观察售卖价格信息
可以发现,75%的商品价格都低于426.5元
因此我们把价格分为['0-200','200-400','>=400']三个区间,对价格进行分组
bin=[0,200,400,10000]
label=['0-200','200-400','>=400']
dt_product_sales['价格区间'] = pd.cut(dt_product_sales['售卖价'],bins=bin,labels=label,include_lowest=True)
依旧将商品分开三个方面进行分析
dt_product_sales_info = dt_product_sales.groupby('价格区间').agg({'货值':'sum',\
'商品销售金额':'sum','商品销售数量':'sum','UV数':'sum', '收藏数':'sum','加购物车数':'sum',\
'购买用户数量':'sum'}).reset_index()
dt_product_sales_info["货值占比"] = dt_product_sales_info["货值"]/dt_product_sales_info["货值"].sum()
dt_product_sales_info["销售占比"]=dt_product_sales_info["商品销售金额"]/dt_product_sales_info["商品销售金额"].sum()
dt_product_sales_info["客单价"]=dt_product_sales_info["商品销售金额"]/dt_product_sales_info["购买用户数量"]
dt_product_sales_info["转化率"]=dt_product_sales_info["购买用户数量"]/dt_product_sales_info["UV数"]
dt_product_sales_info.head()
可见,>=400元的商品,虽然商品款式不多,但是起销售金额比其他价位商品都高
下面使用ABC分析法对>=400元的商品进行分析:
# 取出400及以上价格区间的数据内容
product_400 = dt_product_sales[dt_product_sales["价格区间"]=='>=400']
# 转换率
product_400['转换率'] = product_400["购买用户数量"]/product_400["UV数"]
# 备货值
product_400["备货值"] = product_400["吊牌价"]*product_400["库存量"]
# 售卖比
product_400["售卖比"] = product_400["商品销售金额"]/product_400["备货值"]
product_400[["商品名","商品销售金额","商品销售数量","商品销售单价","购买用户数量","UV数",'转换率',"库存量","备货值","售卖比"]]
- 转化率大于0.7%的商品,归于A类产品暂时保留,用于下次促销活动,并可作主推产品;
- 转化率小于0.7%的商品,但是售卖比大于36%的商品予,作为b类产品,以保留参加下次促销活动,
- 转化率小于0.7%的商品,并且售卖比小于36%的商品进行清仓处理。
# 挑选合格的商品:
# 1、保留商品:转化率大于0.7%的商品予以保留
stay_stocks571 = product_400[product_400["转换率"]>0.007]
stay_stocks571
# 2、保留商品:找出转化率小于0.7% 但是 售卖比大于36%的部分予以保留
stay_stocks573 = product_400[(product_400["售卖比"]>=0.36)&(product_400["转换率"]<0.007)]
stay_stocks573
# 3、清仓处理商品,找出转化率小于0.7%并且售卖比小于36%的部分
stay_stocks574 = product_400[(product_400["售卖比"]<0.36)&(product_400["转换率"]<0.007)]
stay_stocks574
折扣区间销售情况统计
将折扣进行划分
listBins = [0.15, 0.2, 0.25, 0.3, 0.35, 0.4, 0.45, 0.5, 0.55, 0.6, 0.65, 0.7, 1]
listLabels = ['0.15_0.2','0.2_0.25','0.25_0.3','0.3_0.35','0.35_0.4','0.4_0.45','0.45_0.5','0.5_0.55','0.55_0.6','0.6_0.65','0.65_0.7','0.7_1']
dt_product_sales['折扣区间'] = pd.cut(dt_product['折扣率'], bins=listBins, labels=listLabels, include_lowest=True)
dt_product_sales.head()
# 货值占比、销售占比、客单价、转化率 后面求
dt_product_discount_info = dt_product_sales.groupby("折扣区间").agg({
"货值":"sum",
"商品销售金额":"sum",
"商品销售数量":"sum",
"UV数":"sum",
"购买用户数量":"sum",
"收藏数":"sum",
"加购物车数":"sum"
}).reset_index()
dt_product_discount_info["货值占比"]=dt_product_discount_info["货值"]/dt_product_discount_info["货值"].sum()
dt_product_discount_info["销售占比"]=dt_product_discount_info["商品销售金额"]/dt_product_discount_info["商品销售金额"].sum()
dt_product_discount_info["客单价"]=dt_product_discount_info["商品销售金额"]/dt_product_discount_info["购买用户数量"]
dt_product_discount_info["转化率"]=dt_product_discount_info["购买用户数量"]/dt_product_discount_info["UV数"]
可见0.35-4.0之间的销售占比,货值占比最高
# 取出0.35-0.4价格区间的数据内容
product_354 = dt_product_sales[dt_product_sales["折扣区间"]=='0.35_0.4']
product_354.head()
# 转换率=客户数 / UV
product_354['转换率'] = product_354["购买用户数量"]/product_354["UV数"]
# 备货值=吊牌价 * 库存数
product_354["备货值"] = product_354["吊牌价"]*product_354["商品销售数量"]
product_354["售卖比"] = product_354["商品销售金额"]/product_354["备货值"]
product_354[["商品名","商品销售金额","商品销售数量","商品销售单价","购买用户数量","UV数","库存量","备货值","折扣率","售卖比",'转换率']]
优化结果:
- 转化率大于0.7%的商品予以保,用于下次促销活动,并可作下期主推商品;
- 找出售卖比大于36.5%且转化率大于0.7%的部分予以保留,其余进行清仓处理。
- 保留商品:找出售卖比小于于36.5%且转化率小于于0.7%的商品予以清仓
#转化率大于0.7%的商品予以保留
stay_stocks1 = product_354[product_354["转换率"]>0.007]
stay_stocks1
#转化率小于0.7%的商品予以保留,但是售卖比大于36%的商品予以保留参加下次促销活动
stay_stocks2 = product_354[(product_354["售卖比"]>0.365)&(product_354["转换率"]<0.007)]
stay_stocks2
# 清仓商品:折扣率大于37%的部分找出售卖比小于于36.5%且转化率小于于0.7%的商品予以清仓
stay_stocks3 = product_354[(product_354["售卖比"]<0.365)&(product_354["转换率"]<0.007)]
stay_stocks3