一、案例背景:
元气海洋是一家以多维生素健康著称的新型互联网饮料企业,旗下的甜茶、烧茶深受年轻人的喜爱。目前公司即将设计新一轮的电商活动,元气海洋的运营负责人期望你协助他完成用户行为分析,从去年的双十一数据中,找到用户购物的高峰时间点,从而设计对应的运营节奏。
二、分析具体问题:
由于这一次要分析的数据体量上万,一打开Excel就死机,所以需要使用Python来进行相关的数据分析和可视化。
1、在去年的11月,哪几天是用户浏览网页的高峰期?
2、在一天中,什么时间点是用户浏览网页的高峰期?
3、在去年的11月,用户浏览量和访客数变化有什么关系(相关性)?
4、各个环节的转化率怎么样?
5、转化率低是因为哪一天的转化率有严重下滑?
三、具体代码实现
1、在去年的11月,哪几天是用户浏览网页的高峰期?
结论:在去年的双十一,双十一这天是用户浏览网页的高峰期
2、在一天中,什么时间点是用户浏览网页的高峰期?
结论:在一天中,0点、11-12点、18-21点是用户浏览网页的高峰期
3、在去年的11月,在去年的11月,用户的访客数情况
结论:在去年的11月,用户的访客数也是在双十一这天最高
4、每一天中,不同时间段用户的访客数情况
结论:在一天中,0点、11-12点、18-21点是访客数的高峰期
5、在去年的11月,用户浏览量和访客数变化有什么关系(相关性)?
结论:在一天中,用户浏览量和访客数变化呈现强正相关,相关系数为0.98接近1,表明随着访客数越高浏览量也就越高
6、各个环节的转化率怎么样?
结论:从用户行为转化率中可以看出,浏览到点击环节用户流失较大,点击环节的转化率仅有0.09%,需要优化点击环节
7、转化率低是因为哪一天的转化率有严重下滑
结论:整体点击转化率较低是因为双十一这天浏览量有了大幅度提升,但是点击量跟往日差不多,导致双十一这天点击率大幅度下滑;
需要优化双十一活动页面,因为活动页面内容太多,顾客抓不住重点,导致点击量减少。
四、得出结论
1、在去年的双十一,双十一这天是用户浏览网页的高峰期;在一天中,0点、11-12点、18-21点是用户浏览网页的高峰期;在去年的11月,用户的访客数也是在双十一这天最高;在一天中,0点、11-12点、18-21点是访客数的高峰期;在一天中,用户浏览量和访客数变化呈现强正相关,相关系数为0.98接近1,表明随着访客数越高浏览量也就越高。
2、虽然用户浏览量和访客数有较大提升,但是最后的产品购买量却没有较大提升,是因为:从用户行为转化率中可以看出,浏览到点击环节用户流失较大,点击环节的转化率仅有0.09%,需要优化点击环节;
整体点击转化率较低是因为双十一这天浏览量有了大幅度提升,但是点击量跟往日差不多,导致双十一这天点击率大幅度下滑;
需要优化双十一活动页面,因为活动页面内容太多,顾客抓不住重点,导致点击量减少。
五、一点体会
学完Python尤其是数据分析这块,真的可以帮助自己更快的处理数据,
1、其中可视化这块两个神库matplotlib和seaborn,虽然seaborn可视化更高阶,很多时候绘制图形只需要一两行代码即可解决(如绘制折线图直接用sns.lineplot(x=,y=,data=,color=))就能绘制出很漂亮的图形,相比较pyplot更简单,但是seaborn就类似套餐,很多时候不能自己选择,比如:x轴标签,图形x,y轴标题、图形线型等属性不能自己调整,pyplot虽然代码多一些,但是就类似自助餐,自己要什么就取什么,而更加个性化,我还是喜欢用pyplot来进行可视化。
2、还有就是pandas这个库功能真的很强大,连透视表这个都可以实现(直接用pivot_table()即可),查看数据的统计信息(比如均值、最大值、最小值等直接用describe()函数就能实现),连接两个表不需要Excel复杂的vlookup操作,直接用concat([表名1,表名2])就可以,去重的话直接用nunique()函数就能做到,诸如此类,真是一入Python深似海,爱到无法自拔~_~