分析分为两个部分:
一,数据清洗
二,数据分析
下面是具体步骤
一,数据清洗
1.使用python3,对数据进行截取;(截取前一百行)
2.将新的u_b100000.csv表格导入SQL Workbench
创建一个新的table:u_b2017,并导入u_b10000000.csv
3.确认重复项/缺失值
没有重复值
没有缺失值
4.新增一个主键ID
unsigned 为 非负数
5.将timestamp转换成when(%y-%m-%d %k:%i:%s), date(%y-%m-%d),time(%k:%i:%s)
6.整合数据
二,数据分析
a.活跃用户分析
每日活跃用户数量
可以看出活跃用户量在12月2日有明显上升,可结合相关策略进行分析
每时段活跃用户数量
可以看出凌晨4点用户活跃度最低
b)用户行为分析
每日4个维度的行为总数
可看出浏览次数远高于其他行为,证明曝光是足够的;在12月2日有明显上升,可结合相关策略进行分析;
加购物车行为远高于其他两种行为,证明购物车的形式比收藏利用率高;
c)浏览购买转换率
#直接购买的转化率
直接购买次数/总浏览次数=1.1%
#购物车购买的转换率
购物车购买的转换率 =0.32%
#收藏购买转换率
购物车购买的转换率 =0.01%
结论:
总体的浏览购买转化率 = 1.1%+0.32%+0.01%=1.43%,即用户每100次浏览行为,就会产生1.43次购买行为;
直接购买>加入购物车>收藏