分析背景
CDNOW是一家在线零售商。公司于1994年2月由双胞胎兄弟杰森汀和马修汀共同创立。公司在1994年8月推出telnet服务。公司在1994年9月成为一家零售CD网站。
数据来源
CDNow网站的用户购买明细
分析目的
通过python制作数据分析报告,从订单数据和用户行为数据两方面分析电商销售情况,发现问题,提出建议。
本分析报告的框架:
第一部分-订单数据
整体销售情况
从时间维度上,分析销售情况
以总销售额作为关键指标,并对指标进行拆解分析
从相关性上,分析影响销售额的相关因素
第二部分-用户行为数据
用户整体购买情况
计算每月新用户占比
计算每月用户的复购率和回购率
根据RFM模型,构建用户画像
根据购买频次,构建用户分层,把用户划分为活跃、不活跃、流失、回流
根据用户生命周期,分析用户购买行为
第三部分-总结
一、数据探索&数据清洗
数据集有69659行数据,4列,没有空值,没有缺失值。
除了购买金额的数据类型是浮点数以外,其他3个字段都是整数型。
需要对购买时间做数据类型转换,改变为日期型数据,方便后面的分析。
二、订单数据分析
1. 整体销售情况
2. 从时间维度上,分析销售情况
(1) 对比月度销售额
(2) 按周对比销售额
对比不同年份和月份的销售额,可以看到1997年1-3月销售额呈现上升趋势,从1997年4月销售额出现大幅下降。
对比不同月份的平均销售额,1-3月销售额上升明显,4月出现大幅下降,7月和11月出现小幅上涨。
说明1997年4月开始,销售环节出现问题;在1997年下半年采取了某些措施,使销售额有所回升。
从购买时间是星期几的销售额看,购买时间不同,销售额没有太大的差异。星期一和星期天的销售额稍高于其他时间。
3.拆解指标分析
将指标拆解如下:销售额=订单数*客单价,并从时间维度-月份来看二级指标的变化
从对比1997-1998年每个月份的订单数、购买客户数、客单价中可以看出,订单数和购买客户数从1997年4月开始剧降,而客单价稳中有升,说明问题出在了销量上。
4. 从相关性上,分析影响销售额的相关因素
分析销量、总销售额、客单价的相关性,找出影响销售额的主要因素。
从相关系数和热力图中,可以看出,销售数量和总销售额相关系数高达0.99,对销量的影响最大。
从中可以看出,销售金额的下降,主要原因是销量下降。
三、用户行为数据分析
(1) 用户整体购买情况
从用户下单数量的分布看,平均下单两是7.1,75%的人下单量不足7单,而下单量最大值为1033
从购买金额上看,平均购买金额是106美元,75%的人平均购买金额不足106美元,而购买金额最大值为13990美元
95%的用户累计购买金额占总销售的63%,而5%的用户购买总金额占总销售的37%,符合二八法则。
从上可知,网站用户大部分人购买数量少,下单购买量低,购买力不高,并且存在一批超级用户,购买金额大,下单购买量高
(2)每月新用户占比
第一次购买集中在前3个月,之后的15个月没有第一次购买的用户,从上看出,1月到3月新用户购买占比呈现下降趋势。从新用户方面解释了销量剧降的原因。
从上看出,3月份后新用户购买为0,新用户的购买转化存在问题。
大量用户前3个月以后就不再购买,之后1997年4月后不再购买的人数保持平稳,购买用户留存保持稳定。
在1998年5月后不再购买的人数有了一个上升趋势,说明运营或者商品出现了问题。
(3)每月用户的复购率和回购率
前3个月受大量流失的新用户影响,复购率是10%-15%。
之后的复购率在20%左右上下波动,比较平稳。
前3个月回购率较低,回购率在3月后稳定在20%。
(4)根据RFM模型,构建用户画像
RFM模型是衡量客户价值和客户创利能力的重要工具和手段。通过一个客户的最近一次消费(R)、购买的总体频率(F)以及花了多少钱(M)3项指标来描述该客户的价值状况。
一般挽留客户人数最多,重要保持客户人数第二。
重要保持客户群体贡献了159万销售额,占总销售额的63%左右。
根据RFM模型,可以对相应的用户群体进行精准营销。在CDNow网站中,最重要的是重要保持客户,做好这一群体的运营,提高他们的购买频率,能更有效得跳高销售额。
(5)根据购买频次,构建用户分层,把用户划分为活跃、不活跃、流失、回流
新用户(new):第一次消费的用户
活跃用户(active):连续两个月都消费过的用户
不活跃用户(unactive):下一个月没有消费的活跃用户,即一二月份都消费过,三月份没消费过
回流用户(return):上一个月没有消费,而在当前月有消费
从上可以看出,新用户在前三月后大量流失,非活跃用户占比很高,回流用户和活跃用户数量保持平稳。
在拉新、促使购买方面,存在问题。
(6)根据用户生命周期,分析用户购买行为
定义第一次购买至最后一次购买为整个用户生命,计算用户生命周期。
只购买一次,生命周期为0天的用户占所有购买用户的50%以上。
购买2次以上的用户中,大部分在1-400天左右流失,而生命周期在400-500天的用户约占1/3。
说明用户留存还有提升空间,并且有一批忠实用户,他们的需求需要进一步跟进挖掘。
四、总结
1、 订单数据分析结果
在1997年1月到1998年6月18个月中,从1997年4月开始销售额出现大幅下降。而销售额的下降,主要原因是销量下降。
建议:需要分析用户行为数据,找出销量下降的原因。
2、 用户行为数据分析结果
(1)每个用户购买金额、购买量差异极大:大部分人购买数量少,下单购买量低,购买力不高,而一批超级用户购买金额大,下单量高。
(2)大量新用户在前3个月购买以后就没有购买行为,新用户的购买转化存在问题。
(3)用户的复购率和回购率受流失的新用户影响,前3个月较低,之后稳定在20%左右。
(4)根据RFM模型,在CDNow网站中,人数最多的是一般挽留客户,最重要的是重要保持客户:重要保持客户人数第二,贡献了159万销售额,占总销售额的63%。
(5)从用户分层看,新用户在前三月后大量流失,非活跃用户占比很高,回流用户和活跃用户数量保持平稳。 (6)生命周期为0天的用户占所有购买用户的50%以上,而生命周期在400-500天的用户约占1/3。
建议:
(1)针对新用户,需要解决第一次下单后就不再购买的问题。可以在第一次购买后赠送优惠券,调研访谈找到流失原因,推送感可能兴趣的产品等方式促使新用户再次购买。
(2)针对活跃用户,需要解决活跃用户数量少,占比低的问题。可以多举行用户感兴趣的促销、奖励、互动活动等,促进用户活跃。
(3)针对不活跃的流失用户,需要解决数量大,占比低的问题,可以多推送优惠信息、通讯录好友触发、推送活动信息等,来召回流失用户。
(4)针对忠实用户,需要进一步跟进挖掘他们的需求,并匹配自有产品,进行精准推荐、扩充品类、用户回馈、老用户社群营销等来满足忠实用户的需求,提高他们的留存率和购买金额额。