2021-08-28

笔记:

1、 基于RFM的精细化用户管理,可以精细用户管理,更好的对客户进行引流,制定差异化以及定制化的营销。

(另外,给业务部分做分析需要导出excel格式)

2、 使用的库包括:time(用来记录插入数据库时的当前日期)、numpy(基本数据处理)、pandas(日期转换、数据格式化处理、主要的RFM计算过程

RFM权重:利用sklearn的随机森林库

结果展示:excel可视化图表

3、 案例数据:

观察表格概要、具体数据

——导入库(numpy、pandas,机器学习包sklearn使用RandomForestClassifier)

——读取数据、定义列表以方便后续定制

——数据审查(注意转换前后格式是否一致,包括后续数据是否与真实数据一致)

——数据预处理(enumerate函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标)

——划分区间(对RFM做分箱或者离散化操作)

另外:r、m本身可以区分用户特征,但是f无法区分(主要需要根据行业特性进行设定数据)

原则:中间2个边界值、最大值边界

(问题:最左侧值无法划分为任何区间的)

最小值边界值定义得比数据框中的最小值要小。

——计算RFM因子权重

思路:我们利用会员等级来确定RFM三者的权重,建立一个rfm三个维度与会员等级的分类模型,然后通过模型输出维度的权重。

4、 案例数据结论:

(1)基于图形交互式分析

重点人群分布(柱状图)、重点分组分布

(2)基于RFM分组结果的分析

建立数据透视表——将分析重点转移在重点人群身上

(3)RFM用户特征分析

三类:占比超过10%,占比个位数,占比小个人价值度高

5、 不同行业对RFM的依赖度有差异,包括公司的发展等都会影响到RFM

6、 对R、F、M区间的划分是一个离散化的过程,具体需要划分为几个区间,需要与业务方确认

7、 最重要的是,不要只注重于多数人的定制化分析,一定要全面分析会员人群种类进行分析。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 《水浒传》中,有个细节。 西门庆逛街,恰好潘金莲落窗,支窗的棍条咣叽一声,砸到了西门庆。当时西门庆一扭头,正与潘金...
    amdli阅读 477评论 1 1
  • 特征工程(feature engineering):利用领域知识和现有数据,创造出新的特征,用于机器学习算法;可以...
    rowcolumn阅读 723评论 2 1
  • 0 关于本文 ​ 主要内容和结构框架由@jasonfreak--使用sklearn做单机特征工程提供,其中夹杂...
    mrlevo520阅读 21,474评论 4 61
  • 0x00 目标 学习目标有四个: 无量纲化:最值归一化、均值方差归一化及sklearn中的Scaler; 缺失值处...
    s0k0y阅读 1,317评论 0 1
  • 16宿命:用概率思维提高你的胜算 以前的我是风险厌恶者,不喜欢去冒险,但是人生放弃了冒险,也就放弃了无数的可能。 ...
    yichen大刀阅读 6,098评论 0 4