基于MySQL的电商用户、商品、平台价值分析
随着数据量的积累,我们通过数据分析挖掘消费者的潜在需求,消费偏好成为平台运营过程中的重要环节。
本项⽬基于某电商平台⽤户⾏为数据,在MySQL关系型数据库,探索⽤户⾏为规律,寻找⾼价值⽤户;分析商品特征,寻找⾼贡献商品;分析产品功能,优化产品路径
从最基础的数据,到最上层的指标。这里的数据是用户历史行为数据,收藏,加购,购买都会产生一条记录。
在进行分析之前要明确指标体系以及指标体系需要哪些数据。这里我们使用的是“人货场”理论。分别针对人货场三个来进行指标分析。
2 使用“人货场”拆解方式来建立指标体系
⼈(⽤户) 是整个运营的核⼼。所有举动都围绕着,如何让更多的⼈有购买⾏为,让他们买的更多,买的更贵。所以对⼈的洞察是⼀切⾏为的基础。⽬前平台上的主⼒消费⼈群有哪些特征,他们对货品有哪些需求, 他们活跃在哪些场,还有哪些有消费⼒的⼈⽬前不在平台上,对这些问题的回答指向了接下来的⾏动。
货 就对应供给,涉及到了货品分层,哪些是红海(销量高、利润少,竞争多),哪些是蓝海(销量少,利润多,竞争少),如何进⾏动态调整,是要做⾃营还是平台,以满⾜消费者的需求。
场 就是消费者在什么场景下,以什么样的⽅式接触到了这个商品。
3 确认问题
1)基于漏⽃模型的⽤户购买流程各环节分析指标,确定各个环节的转换率,便于找到需要改进的环节;
2)商品分析:找出热销商品,研究热销商品特点;
3)基于RFM模型找出核⼼付费⽤户群,对这部分⽤户进⾏精准营销。
4 准备工作
4.1 数据读取
数据在excel中,注意这里的时间格式为2022-5-21 11就是只到小时这个单位上,并不是标准的秒位,所以这里需要稍作处理。
4.2 数据预处理
预处理这里我们只有两步,一步是时间格式转化:
将数据转为时间格式,考虑到后续的使用,这里我们将time这列转化为到秒的精确时间格式,和一个到年的粗劣时间格式。
这里其实还有两个点挺疑惑,1是str_to_date后面的参数,其实指的是str中的格式。2是date函数,直接取到日?
另一步是去重:
5 指标体系建设
5.1 用户指标体系
基础指标体系(UV、PV、留存率)+RFM模型
5.1.1 基础指标
UV,PV,留存率(按日计算留存率,如次日留存,7日留存
这里需要注意,这里的命名最好用引号阔起来。
用户留存这里,修改datediff的值就可以实现不同天数的留存情况,但这里并不是留存率,而是留存人数。