Python数据分析经典项目 -------CD消费用户行为分析


前言:

根据一家CD网站上的用户消费记录,对此数据消费情况以及用户行为进行分析。

数据样式如下:


数据来源:

链接:https://pan.baidu.com/s/1x8FzbYsAVdhAv24LsNkLfQ 

提取码:cvuk

具体步骤:

1.数据清洗

2.进行用户行为销售分析(按月):每月消费总额、次数、产品购买量、人数

3.用户个体消费分析:重点关注消费金额和消费次数情况

4.用户消费行为分析:首购、最后一次购买、用户分层(新老客、RFM)、用户购买周期、用户生命周期

5.用户回购率和复购率分析

一.数据清洗

1.导入常用包及数据集


导入数据的前十行:


2.检查数据并且清理数据:



修改后的源数据:


按月分析故新列【month】字段

二.进行用户消费趋势分析(按月)

1.每月的消费总金额


导入可视化包



由上图可知,消费金额在前三个月达到最高分,后续消费金额较为平稳,有轻微下降趋势

2.每月的消费次数


前三个月消费订单数在10000笔左右,后续月份的平均消费人数则在2500人

3.每月的产品购买量


前三个月产品购买数在20000以上,后续月份的产品购买量在6000-8000左右。

4.每月的消费人数


每月消费人数低于每月消费次数,但差异不大。前三个月每月的消费人数在8000-10000之间,后续几个月,平均消费人数2000人不到。

5.直接利用数据透视表分析消费金额,产品购买量,消费次数



二.用户个体消费分析

1.用户消费金额,消费次数的描述统计


用户平均买了5.39张CD,但是中位数只有1,说明小部分用户购买了大量的CD。用户平均消费了3.7元,中位值有7.37,判断同上,有极值干扰

2.用户消费金额和消费的散点图


3.用户消费金额的分布图


4.用户累积消费金额占比(百分之多少的用户占了百分值多少的消费额)


按用户消费金额进行升序排列,由图可知50%的用户仅仅贡献了15%的消费额度。而排名前5000的用户贡献了60%的消费额度。

三.用户消费行为

1.用户第一次消费(首购)


用户第一次购买分布,集中在前三个月。其中,在2月11日至2月25日有一次剧烈波动

2.用户的最后一次消费


用户最后一次购买的分布比第一次分布广 大部分最后一次购买,集中在前三个月,说明很多用户购买了一次后就不再购买

3.新老客户消费比

3.1多少用户仅仅消费一次


有一半用户,就消费了一次

3.2 每月新客户占比?



利用布尔值筛选True

97年3至4月新用户数量由90%跌落80%,后几个月新用户量保持在80~82%区间,1998年6月后再无新用户。

4.用户分层-RFM







从RFM分层可知,大部分用户为重要保持客户,但是这是由于极值的影响,所以RFM的划分标准应该以业务为准。尽量用小部分用户覆盖大部分的额度。不要为了数据好看而划分等级

5.用户分层 -新,活跃,回流,消失






若本月没有消费

- 若之前是为注册,则依旧为为注册

- 若之前有消费,则为流失/不活跃

- 其他情况,为未注册

若本月有消费

- 若是第一次消费,则为新用户

- 如果之前有过消费,则上个月为不活跃,则为回流

- 如果上个月未注册,则为新用户

- 除此之外,为活跃




流失用户(unactive)正在增加

新用户暂停

活跃用户越来越少

运营差



由上表可知,每月的用户消费状态变化
- 活跃用户,持续消费的用户,对应的是消费运营的质量
- 回流用户,之前不消费本月才消费,对应的是唤回运营
- 不活跃用户,对应的是流失

6.用户购买周期(按订单)

- 用户消费周期描述
- 用户消费周期分布




- 订单周期呈指数分布
- 用户的平均购买周期是68天
- 绝大多数用户的购买周期都低于100天

7.用户生命周期(按第一次&最后一次消费)

- 用户生命周期描述
- 用户生命周期分布



用户的生命周期受只够买一次的用户影响比较厉害(可以排除)。用户均消费134天,中位数仅0天


四.复购率和回购率分析

复购率
- 自然月内,购买多次的用户占比
回购率
- 曾经购买过的用户在某一时期内的再次购买的占比



复购率稳定在20%左右,前三个月有大量新用户涌入,而这批用户只购买了一次,所以导致复购率降低

绝大多数用户购买了一次后不再购买,老用户回购率在30%徘徊

总结

1.cd网站的用户在前三个月内涌入绝大多数新用户,其前三个月的平均消费次数为10000笔左右,消费人次达8000~10000左右,后续的消费次数及人次下跌至2000左右。

2.根据二八法则,50%的用户仅贡献了15%的消费额度,而消费金额前5000名用户贡献了60%消费额度,同时根据用户购买次数,平均购买7张CD,而中位数只有3,说明小部分用户购买大量的CD,符合上述二八法则的分析。

3.根据用户首次购买、最后购买及新老客占比分析,绝大部分用户购买在前三个月,且购买一次就不再进行购买,这部分客户占50%(符合2的50%用户仅贡献15%消费额度)。

4.根据每月新用户占比分析,3至4月的新用户占比由90%跌落80%,后几个月新用户量保持在80%到82%区间,1998年6月后再无新用户,前三个月新用户平均8000人左右,后续新用户在1000至1500人波动。

5.根据用户分层-RFM分析,重要价值客户的消费金额高,但近期消费下降,大部分为重要保持客户。

6.按用户购买时间分析,用户平均购买周期68天,绝大部分用户购买周期都低于100天。

7.根据复购率和回购率分析,复购率稳定在20%左右,回购率稳定在30%左右。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,372评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,368评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,415评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,157评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,171评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,125评论 1 297
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,028评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,887评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,310评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,533评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,690评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,411评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,004评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,659评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,812评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,693评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,577评论 2 353

推荐阅读更多精彩内容