Python+tableau电商用户行为数据分析实战

数据来源:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46&userId=1

数据背景:基于阿里巴巴电商平台上某店铺的真实用户商品行为数据,通过数据分析了解数据背后更深入的意义,并对商家提出适当的运营建议

实战工具:Python、tableau、Excel

实战过程:

一、数据清洗及整理

数据量约有104万,时间节点从2014年11月18日至12月18日,利用Python进行数据清洗(Excel跑不动的)

电商用户行为原始数据
数据说明

1. 导入数据并了解数据属性:数据不存在异常值,地址信息缺失值不影响数据分析,故不需要进行异常值及缺失值处理

异常及缺失数据检查-代码

2. 日期类数据类型处理:将日期与时间段分列,有利于每日及每个时间段的数据整理

日期类数据处理-代码

3.分组获取所需数据:

3.1 获取每日或每时间段的点击/收藏/加购/购买浏览量(代码可用循环进行优化)

3.2 获取相对应的每日或每时间段的点击/收藏/加购/购买独立访客数

3.3 获取每日或者每时间段的总访问量及总访客数

3.4 获取一个月内不同用户总购买次数

注:

访客数(UV):一天之内网站的独立访客数,一天内同一访客多次访问网站只计算1个访客

浏览量(PV): 即页面浏览量或点击量,若同一用户多次打开或刷新同一个页面,PV值会累加

(本文说的访问量与浏览量同义)

用户行为访问量数据获取-代码
用户行为访客数数据获取-代码
总访客数及浏览量-代码
一个月内用户总购买次数-代码

4.数据计算及整理

将Python获取的数据填入Excel中,利用Excel函数工具进行简单的计算并整理出一份数据表

运营数据计算:

(1)平均每付费用户收入=付费总收入/付费总用户数(用购买次数代替消费金额)

(2)平均每用户收入=付费总收入/付费总用户数(用购买次数代替消费金额)

(3)付费率=付费总人数/活跃用户数=购买访客数/访客数

(4)跳出率=浏览单页即退出的次数 / 访问次数=单日点击数/单日浏览量

(5)转化率=产生下一行为的访客人数 / 上一行为的访客人数

如:点击-购买转化率=购买访客数/点击访客数

数据整理表格(1)
数据整理表格(2)
数据整理表格(3)

二、数据分析

将Excel表格数据导入tableau,利用tableau进行数据分析及可视化操作

注:文中分析所说平日指的是不包含12月12日的数据值,当日指的是12月12日的数据值,所计算的平均值均是平日的数据

1. 用户行为箱线图分析:每日的点击量/收藏量/加购量/购买量的中位数分别31167/657/885/299,数据分布都比较集中,说明每日用户行为的数据波动性不大;因为12月12日是“双十二”促销,所以该天的用户行为数均比平常值高很多,临近的12月11日的用户行为也较为活跃

用户行为箱线图分析

2. 每日用户行为数据概况分析:“双十二”狂欢节对用户行为影响非常明显,当日点击量比平日增长1.77倍,购买量增长4.33倍,访客量增长1.29倍,浏览量增长1.80倍,付费率增长2.86倍,ARPPU增长1.14倍,ARPU增长3.24倍,跳出率降低2个百分点,说明促销效果非常好,给商家带来明显的营业收入增长

另外,受”双十二“影响,浏览量从12月9日开始明显增长,付费/购买行为也开始明显减少

每日用户行为概况
每日用户行为概况(双轴)
付费率与跳出率
浏览量与访客数
平均每用户收入及平均每付费用户收入

3. 转化率分析:平日的用户行为路径为:点击——>加入购物车——>收藏——>购买,平均转化率分别为0.1379—0.6886—0.5958,而点击——>购买的转化率为0.0566;当日的用户行为路径为点击——>加入购物车——>购买,转化率分别为0.2253—0.7346,而点击——>购买的转化率为0.1655

页面跳出率约为94%,点击到下一步的操作转化率低于30%,说明该商品本身的属性偏向于吸引有需要的人群,用户的加购、收藏、购买的转化率均高于50%,说明店家应该提高商品页面质量更容易吸引有需要的顾客进行购买

另外,12月12日的收藏数少于购买数,也就是当日用户偏向于先加入购物车再购买,或者当日直接购买,减少收藏这一环节,可能是为了在促销期间提高消费效率

每日用户行为转化漏斗分析

4. 每个时段的用户行为分析:

一天的时间内用户从17时开始持续活跃至23时,店家应该利用这个黄金时间段,譬如开展更多的促销、优惠、直播卖货等活动,吸引更多用户关注并购买,提高转化率

10-16时的转化率较高,说明用户偏向于在这个时间段完成购买活动,建议点击在此时间段开展促销活动,能够提高用户消费金额

每个时段的用户行为概况
每个时段的访问量与访客数
每个时段的转化率

5. 其它数据分析:

一个月内的用户购买次数分析:4330个用户ID中只有55个用户的单月购物次数大于10次,也就是87%的用户单月购买次数在10次以下

复购率分析:复购率=重复购买客户数量/客户样本数量(重复购买即为购买次数大于1)

购物次数大于1的用户数量为2295位,占总用户数的53%,也就是一个月内的复购率为53%

购物次数

三、数据可视化

利用tableau仪表板展示上述的数据分析结果

每日用户行为分析仪表板
每时段用户分析仪表板
用户行为分析仪表板
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,504评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,434评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,089评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,378评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,472评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,506评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,519评论 3 413
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,292评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,738评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,022评论 2 329
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,194评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,873评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,536评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,162评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,413评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,075评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,080评论 2 352

推荐阅读更多精彩内容

  • 本文结构: 一、理解数据 1、总体介绍 ①、数据来源: 本数据集数据来源于阿里巴巴天池:https://tianc...
    对三zzzzzzz阅读 2,697评论 0 14
  • 注:内容来源于网易云课堂产品经理微专业 一、数据分析概述 数据是量化事物的手段,数据指标代表了现实存在的客观情况,...
    夜妖黑猫阅读 3,339评论 3 49
  • 本文结构: 一、理解数据 1、总体介绍 ①、数据来源: 本数据集数据来源于阿里巴巴天池:https://tianc...
    对三zzzzzzz阅读 871评论 0 6
  • 随着移动互联网多年的快速发展,移动互联网已进入下半场 ,不再依靠用户红利来经营,发展业务,告别粗糙的/高成本企业发...
    大白菜995阅读 35,812评论 11 205
  • 人都想好、越好越好 入了写作群后认识了很多小伙伴,并开始写作,有很多东西一旦尝试便一发不可收拾,就像是冥冥之中注定...
    L_Yao阅读 1,032评论 0 0