——目录————————————————————
一、数据描述
二、提出问题
三、数据探索
四、总结
—————————————————————————
一、数据描述
以上为优衣库销售数据的数据字典,根据优衣库数据进行业务的深入学习和理解
二、提出问题
1.优衣库的受众画像
20-40岁青壮年,女性偏多,线下为主,
2.整体销售情况随着时间的变化是怎样的
3.不同产品的销售情况是怎样的?顾客偏爱哪种购买方式
4.销售额和成本之间有什么关系?
三、数据探索
1.销售渠道
data['channel'].value_counts()
结论:优衣库以线下销售为主
#查看线上与线下每个订单的平均收入
data['revenue'].groupby(data['channel']).mean()
—————————————————————————————————
#output:
channel
线上 167.910149
线下 157.760277
结论:线上线下每个订单的平均收入基本上没有差别
2.性别
结论:女性偏多
3.年龄
data['age_group'].value_counts()
_____________________________
#output:
30-34 4426
25-29 4224
35-39 3691
20-24 3345
40-44 1955
>=60 1574
45-49 1095
50-54 672
<20 660
55-59 514
Unkown 137
20-40岁消费记录最多
data['revenue'].groupby(data['age_group']).mean().sort_values()
______________________
#output:
age_group
Unkown 89.079270
<20 122.922318
40-44 124.004000
>=60 127.982948
55-59 137.365253
45-49 138.654219
50-54 146.992009
35-39 157.302281
20-24 165.049151
30-34 176.660045
25-29 185.470419
同样,20-40岁每单平均消费金额最多
4.购买发生的时间段
#分别求和‘工作日’和‘周末’的总营业收入
data['revenue'].groupby(data['wkd_ind']).sum()
————————————————————
#output:
Weekday 2093947.98
Weekend 1462484.87
Name: revenue, dtype: float64
#分别计算"工作日"和"周末"的每日平均营业收入
print('Weekday average revenue:'+str(2093947.98/5))#weekday为5天
print('Weekend average revenue:'+str(1462484.87/2))#weekend为2天
————————————————————
#output:
Weekday average revenue:418789.596
Weekend average revenue:731242.435
wkd_ind
Weekday 21319
Weekend 15007
结论:周末每日的平均销售收入比工作日多
data['customer'].groupby(data['wkd_ind']).sum()
print('Weekday customers each day:'+str(21319/5))
print('Weekend customers: each day:'+str(15007/2))
_______________________
output:
wkd_ind
Weekday 21319
Weekend 15007
Weekday customers each day:4263.8
Weekend customers: each day:7503.5
结论:周末客人每日比工作日多3000人
5.每类产品的销售情况
每类产品销量 | 每类产品每件平均利润 | 每类产品总利润 |
---|---|---|
5.1每类产品销量
#每类产品卖出去多少件
data['quant'].groupby(data['product']).sum().sort_values()
T恤、当季新品最多,裙子、毛衣最少
5.2每类产品的利润情况
创建新的3个列:每笔记录的利润、每件产品利润、每笔记录是否亏损
#创建每笔记录利润:利润=收入-每件产品成本*产品数量
#profit=revenue-unit_cost*quant
def profit(revenue,unit_cost,quant):
return revenue-unit_cost*quant
data['profit']=data.apply(lambda x:profit(x['revenue'],x['unit_cost'],x['quant']),axis=1)
#创建每件产品利润:每件产品利润=每笔记录利润/每笔记录产品数量
data['profit_per_product']=data.apply(lambda x:x['profit']/x['quant'],axis=1)
#创建订单是否亏损:1为盈利,0为亏损
def profit_or_loss(profit):
if profit>0:
return 1
else:
return 0
data['profit_or_loss']=data.apply(lambda x:profit_or_loss(x['profit']),axis=1)
#可视化每类产品的订单亏损比例
sns.barplot(x='product',y='profit_or_loss',data=data)
发现:所有的记录中当季新品、运动和牛仔裤类型亏损比例最大,牛仔裤只有4成左右的记录是盈利的,这三类大部分记录在“亏本销售”。
接下来看下不同产品的总利润:
data['profit'].groupby(data['product']).sum().sort_values()
发现:T恤、配件、当季新品利润最高,尽管当季新品、牛仔裤大比例订单在亏损,但整体却仍可以实现盈利,
四、总结
1.优衣库的受众画像
20-40岁,女性偏多,T恤爱好者
2.整体销售情况随着时间的变化是怎样的
周末人流更多,销售额更高
3.不同产品的销售情况是怎样的?顾客偏爱哪种购买方式
优衣库的三大销售冠军:T恤、当季新品、配件
优衣库的三大盈利冠军:T恤、当季新品、配件
优衣库最具盈利潜力产品:毛衣,倒数第二的销量,贡献了第四的利润,单件利润极高
最需要调整生产营销策略的产品:牛仔裤,虽然整体盈利,但是6成交易都在亏损,可以考虑是不是产量预估、上市季节等策略失误有关系
顾客偏爱线下交易
4.销售额和成本之间有什么关系?
有一定关联,但关联度不是特别强