一、项目背景
随着电商行业的不断发展,获客成本显著上升,各大电商平台都不遗余力地开拓新的营销模式来刺激用户消费。如何获取高质量用户,精准营销,高效运营成为电商平台未来发展的关键。基于这样的背景,本文对电商用户行为进行分析,解读电商用户行为规律,理解用户需求,帮助平台提高销量,实现营收增长。
二、理解数据
本文基于国内热门电商网站淘宝网的用户行为数据进行分析。
数据来源于阿里云天池。
User Behavior Data from Taobao
数据集主要情况为:用户数量有近100万(987,994),商品数量约为416万(4,162,024),商品类目数量有近1万(9,439),所有行为数量超过1亿条(100,150,807).
数据集含义如下:
由于数据量较大,本文只导入10万条数据进行抽样分析。使用MySQL分析数据,获得分析结果,然后将分析结果导出到Power BI或者Excel进行可视化。
三、分析思路
本次分析的目的是提高销量,将采用对比分析、多维度拆解分析、漏斗模型、RFM模型等方法,并从以下四个维度进行分析和提出改进建议。
- 用户行为习惯(时间):分析不同日期及时间段的用户行为习惯,找出用户最活跃的时期。
- 用户行为转化(行为):分析用户从点击到购买整个环节中不同行为路径的转化率,并给出提高转化率的建议。
- 用户购买偏好(产品):分析热销商品以及系统推荐产品,优化营销推荐策略。
-
用户价值(用户):利用RFM模型进行客户群分类,建立评分机制,对不同价值的用户采用不同的运营刺激消费。
以下是分析思路
数据清洗
- 选择子集
源数据只导入10万条数据,列包含用户ID、商品ID、商品类目ID、行为类型、时间戳。 -
列名重命名
-
重复值处理
发现无重复值。
-
缺失值处理
将各字段设置成“not null”,确保每个字段中都没有缺失值,并且利用count函数进行计数查询,结果表明没有缺失值。
-
格式一致化
数据集一共有五列,其中timestamp列为时间戳,需转化为时间格式。在原数据表增加4个新字段datetime,date,time,hour。
6.数据异常值处理
由于我们利用2017年11月25日至2017年12月3日之间的用户行为数据进行研究,因此需要对该时间段外的数据进行删除。
五、分析过程
(一)用户行为习惯分析
分别以日和小时为单位分析用户购买行为,找出用户活跃规律。
1.2017年11月25日至12月3日间的用户行为习惯分布
在研究日期内,11月25日、11月26日与12月2日、12月3日为周末,其余为工作日。从点击量来看,我们可以看出用户的活跃度在12月2日和12月3日有明显增幅。从加购数和收藏数看,相对于收藏,用户更爱直接加购,并且在12月2日及3日间两者都出现明显增长。从购买数看,整体相对平稳,但在后一个周末出现了大幅增长。
流量急剧增长的原因可能是双十二的预热活动导致,用户开始浏览商品,并进行收藏及加购,但却未下单。总体而言,周末的用户活跃度整体比工作日高。
2.一天内的用户行为习惯分布
从点击量看,我们可以发现每日0点至3点用户活跃度快速降低,凌晨3点为一天最低值。4点至10点活跃度逐步上升,10点至18点活跃度相对平稳。其中13点至16点是白天的活跃期。18点后活跃度急剧上升,并在20点至22点达到一天的高峰期,其中21点时为最高值。说明用户习惯在晚上7点至23点浏览并选择商品进行购买。
从加购、收藏、购买及转化率看,用户加购意愿较强,且与点击量变化趋势相关性最高。购买转化率则在中午12点至13点最高,说明用户在午休时下单意愿较强。
(二)用户行为转化分析
从用户行为习惯分布(时)图中,我们发现一天中的购买转化率最大值为3.4%,相对较低。下面我们来分析用户行为转化中的问题。
1.用户整体行为转化分析
(1)建立用户行为视图
(2) 提取数据
(3) 建模分析
先对整体用户行为进行描述性分析,从行为数量占比图中,我们发现点击行为占比89.7%,加购行为约为收藏行为的2倍。从用户行为转化漏斗图中,我们可以看到用户从点击到购买的转化率约为2.3%。那么是什么原因导致从点击到购买的转化率偏低呢?
针对转化率低的问题,从用户行为和商品两个维度来做出3种假设,来研究是什么原因导致转化率低。
2.不同行为路径转化分析
行为路径指的是用户从点开商品到最终购买所经过的步骤。本文以点击、加购、收藏、购买为4个基本的步骤。通过分析不同行为路径的转化率,我们可以发现哪个环节产生了问题,而导致用户最终未购买。
假设一:不同的行为路径影响转化率。
可分为4种路径(收藏加购不分先后顺序):
- 点击—购买
- 点击—加购—购买
- 点击—收藏—购买
- 点击—收藏和加购—购买
(1)查询统计各行为路径用户数
(2)绘制转化漏斗图并分析
从上图,我们可以发现在点击商品后,48.58%的用户会进行加购,25%的用户会加购并收藏,12%的用户会进行收藏,而7.45%的用户会直接购买。
其次,我们发现收藏和加购-购买的转化率有80%,其次为加购-购买的转化率69%,收藏-购买的转化率60%,加购的转化率大于收藏。
经过分析,我们发现不同的购物行为路径对转化率存在影响。因此,假设一成立。
(三)用户商品偏好分析
现在从产品维度分析对转化率的影响。
1.商品类目数量
假设二:商品类目单一影响转化率。
查询商品类目发现有3128个,并不单一,用户的购买选择较为丰富。
因此假设二不成立。
2.热搜商品和热卖商品
假设三:推荐商品不符合用户偏好影响转化率。
(1)热搜与热卖TOP20商品ID
整理成表格可以发现两组数据的商品ID不存在重合。高点击的商品没有转化成高销量商品。由于商品ID较多,TOP20的样本数据较少,下面我们再从商品类目来进行分析。
(2)热搜与热卖TOP20商品类目
将数据整理成表格发现两组数据有12个相同类目,重合度达60%。说明商品类目存在明显的集中趋势。
而用户点击量最多的前5个类目在购买量中分别排名7,8,3,11,16。说明存在流量浪费,高流量并未直接对应高销量。
从商品ID和商品类目来看,高流量并没有带来高销量,推荐的商品未完全符合用户偏好,因此假设三成立。
综上所述,
- 假设一:不同的行为路径影响转化率 成立
- 假设二:商品种目单一影响转化率 不成立
- 假设三:推荐商品不符合用户偏好影响转化率 成立
(四)用户价值分析
RFM模型是衡量客户价值和客户创利能力的重要工具和手段。
- R:最近一次消费时间(最近一次消费到参考时间的间隔)
- F:消费的频率(消费次数)
- M:消费的金额(总消费金额)
由于本次分析中没有提供金额,所以从R、F两个维度对客户群进行分析。
1.计算R和F的值
2.确定R和F的评分规则
整理后发现R值范围1-9,F值1-43。
3.给R和F价值打分
4.计算R价值分和F价值分的平均数
5.进行用户分类并分析
由上图,我们可以发现91%用户为重要挽留用户和重要发展用户,两者分别占比52%和39%。而 重要价值用户和重要保持用户仅占约6%和3%。
六、总结与建议
(一)用户行为习惯
通过对用户行为习惯的分析,可以发现周末的用户活跃度整体比工作日高。一天中晚上7点至23点为高峰期。中午12点到下午1点则是白天的活跃时间段,并且购买转化率较高。
- 可以将营销活动、直通车、钻展等安排在用户活跃时间段,来促进引流并转化;
- 可以在中午12点左右设置各类限时促销或捆绑销售活动,缩短用户选择时间,促进转化率的提升,从而提高销量。
(二)用户行为转化
通过分析,发现用户收藏加购到购买的转化率达到80%,而流量行为从点击到购买的转化率仅为2.3%。说明从点击到其它环节中存在大量的流失,购买行为路径的优化是重要环节。
- 引导加购及收藏,可以加强营销机制引导顾客加购以及收藏,比如加购送优惠券、加购送小样赠品、收藏抽奖等;
- 优化人群画像,针对行为路径较短的人群,如占比7.45%的点击后即购买的用户 着重进行商品推荐,从而提高转化率,提升销量;
- 优化界面设计,可以给客户提供同类产品比较的功能。让用户不需要多次返回搜索结果进行点击查看,方便用户确定心仪产品,增加点击到购买行为的转化。
(三)用户购买偏好
高浏览的商品并未对应高销量,存在流量的浪费。TOP20的热销类目和热搜类目存在60%的相同类目,即热门的商品类目存在集中的趋势。
- 优化推荐机制,优先展示热销的商品和类目,满足用户的购买偏好;
- 优化推荐商品的展示方式,如美化图片、评论管理等,提升用户的购买意愿;
- 通过更完善的会员积分机制,促销活动等方式来降低流失率。
(四)用户价值
通过RFM模型对客户群进行划分,可以对不同的用户群体采用不同的策略,促进精准营销。
- 针对重要挽留客户,有流失的风险,要想办法主动联系用户,明确流失原因,想办法挽回并再次激活用户购物;
- 针对重要发展用户,消费频率较低,可以采取购物红包、每月会员日、限时优惠信息提醒等方式来提升消费频率;
- 针对重要价值用户,需要重点关注并给予VIP待遇,不断提升用户满意度;
- 针对重要保持用户,最近一次消费时间较长,可以采取短信推送、APP促销信息提醒等方式和客户保持联系,为其进行个性化推荐,以提高复购率。