现在有一个大社区,该街区有A、B、C、D......、Z等26个小区,每个小区有100个居民,且编号唯一(A1,A2,A3,......,A100,其他小区居民编号以此类推),总共是2600个居民。
社区旁边5站公交的地方开了一家shopping mall,提供吃喝玩乐购物一条龙服务,命名百度广场。百度广场希望进行一次以小区为单位的促销推广活动(如赠送积分购物卡),在做活动之前,需要确定这26个小区中的哪些小区的居民用户质量最高,最具备促销价值,然后定点投放。
目前收集到了小区全部居民在8月1日——31日的全部数据,内容如下:
出门①→公交②→百度广场购物③→百度广场看电影④→百度广场唱歌⑤→百度广场餐厅吃饭⑥
其中:
(1)①②③④⑤⑥的行为发生时间点都有记录
(2)③④⑤⑥的具体消费金额都有记录
(3)③的购物明细(购买了哪些商品)都有记录
(4)④的观看电影的节目单都有记录
(5)⑤的点歌单的明细都有记录
(6)⑥的菜单明细都有记录
(7)该社区只有888路公交车是抵达百度广场的,但是该社区公交站还有通往其他地方的公交车,如514,521,602路
(8)①②③④⑤⑥不是完全连续发生的
问题如下:
(1)如何判断单个居民质量的高低?如何判定哪些用户最具备促销价值?
(2)如何选择一个最具促销价值的小区?
解这道题的人分两种,一种是了解RMF模型的面试者,另一种是不知道RMF的面试者。
一、先谈谈了解RMF模型的面试者是怎么解这道题的。
1.什么是RMF模型?
RFM模型是广泛使用于传统零售行业的用户分层模型,它主要以三个维度的数据来划分用户层级(质量高低),RFM分别是:
R(Recency):离某个时间点最近的一次消费,为【近度】维度;
F(Frequency):一段时间内的消费频次,为【频度】维度;
M(Monetary):对应这段时间内的消费金额,为【额度】维度。
通过RFM模型,我们可以轻松划分出用户的层级,如下表:
重要价值客户:最近消费时间近、消费频次和消费金额都很高的,这些是我们的高质量用户。
重要发展客户:最近消费时间较近、消费金额高,但频次不高,忠诚度不高的用户,都很有潜力,可以重点发展。
重要保持客户:最近消费时间较远,但消费频次和金额都很高,说明这是个一段时间没来的忠实客户,我们需要主动和他保持联系。
重要挽留客户:最近消费时间较远、消费频次不高,但消费金额高的用户,可能是将要流失或者已经要流失的用户,应当基于挽留措施。
在了解了这些基本信息后,我们就可以针对面试题目进行分析了。
在题目中,用户的行为路径是
出门①→公交②→百度广场购物③→百度广场看电影④→百度广场唱歌⑤→百度广场餐厅吃饭⑥
按照RFM模型,我们可以将用户层级分为如下几个部分:
R——7天(R3),8~15天(R2),16~31天(R1),考察的是客户购买的沉默期;
F——1次(F1),2~3次(F2),3次以上(F3),可以把3次作为客户是否发展为忠诚客户的一个参考标准;
M——100(M1),101~1000(M2),1000以上(M3),这个需要按照实际情况来划分,其重点在于考察客户的购买能力。
(1)通过上面的划分,我们就可以将客户群细分为(R1F1M1)、(R1F1M2)、(R1F1M3)等27个部分了。再将这27个客户群,按照RFM模型进行分析,划分出重要价值客户,一般价值客户等就OK,这样,各个用户质量的高低就出来了,R3,M3,F3次数多的,都是高质量用户。
其中,重要发展客户(最近消费时间较近、消费金额高,但频次不高,忠诚度不高)和重要保持客户(最近消费时间较远,但消费频次和金额都很高)是我们这次活动的重要促销对象。对于他们,可以通过消费积分活动感召回来,属于高促销价值用户。
当然,这里面百度广场也可以结合自身特点去调整R、F、M各项内容的划分,比如可以划分为2、5、2级别,然后RFM对应的就是20个区间了。
(2)如何选择一个最具促销价值的小区?
在我看来,这个就得看小区中高发展客户和重要保持客户的具体比例了,两者用户比例最高的小区,可以选择做为这次促销的主要针对小区。
二、再谈谈不知道RMF模型的面试者是怎么样解这道题的。
首先先确立两个底层认知,a.数据是人逛出来的;b.数据驱动解决方案;c.不同的人对数据的观察不一。
1.数据是人逛出来的,这些数据,组成可视化数据曲线,供我们进行分析。
我们先做一个xmind,整理一下资源:
2.数据驱动解决方案,解决方案是由数据驱动的,从数据的资源中寻找问题的切入点。
问题一是:如何确定单个居民质量的高低?
这个无关个性化推荐的事,第二个数据组属于无效数据。
单个居民所拥有的数据是:
这里有7个数据,仔细观察一下,总消费金额与平均消费金额和总频率与平均频率是正相关的,因此“平均”对“总”来说,是在分析同一组数据,我们把“平均”删掉,剩下5个数据:
这几个数据归类,就会得到3个维度:
这三个维度,就是衡量单个居民质量的高低。
xyz的高、中、低组合排序,就可以对单个居民得到27个维度的划分,再对这27个维度进行权重衡量,就是第一个问题的解。
第二个问题,单个居民的促销价值,是建立在第一个问题上面的。
两个维度,居民质量高的,转化率也高的,就是促销价值高的。
最后:不同的人对数据的观察不一,我认为把有效数据和无效数据区分开来,是数据分析的关键。