分析分为两个部分:
一,数据清洗
二,数据分析
下面是具体步骤
一,数据清洗
1.使用python3,对数据进行截取;(截取前一百行)

2.将新的u_b100000.csv表格导入SQL Workbench
创建一个新的table:u_b2017,并导入u_b10000000.csv

3.确认重复项/缺失值

没有重复值

没有缺失值
4.新增一个主键ID

unsigned 为 非负数
5.将timestamp转换成when(%y-%m-%d %k:%i:%s), date(%y-%m-%d),time(%k:%i:%s)

6.整合数据

二,数据分析
a.活跃用户分析

每日活跃用户数量

可以看出活跃用户量在12月2日有明显上升,可结合相关策略进行分析

每时段活跃用户数量

可以看出凌晨4点用户活跃度最低
b)用户行为分析

每日4个维度的行为总数

可看出浏览次数远高于其他行为,证明曝光是足够的;在12月2日有明显上升,可结合相关策略进行分析;

加购物车行为远高于其他两种行为,证明购物车的形式比收藏利用率高;
c)浏览购买转换率

#直接购买的转化率

直接购买次数/总浏览次数=1.1%
#购物车购买的转换率


购物车购买的转换率 =0.32%
#收藏购买转换率


购物车购买的转换率 =0.01%
结论:
总体的浏览购买转化率 = 1.1%+0.32%+0.01%=1.43%,即用户每100次浏览行为,就会产生1.43次购买行为;

直接购买>加入购物车>收藏