拼多多学霸批数据分析笔试

问题一:(考点:活动运营数据分析)

表1——订单表orders,大概字段有(user_id‘用户编号’, order_pay‘订单金额’ , order_time‘下单时间’)。
表2——活动报名表act_apply,大概字段有(act_id‘活动编号’, user_id‘报名用户’,act_time‘报名时间’)

要求:

1.统计每个活动对应所有用户在报名后产生的总订单金额,总订单数。(每个用户限报一个活动,题干默认用户报名后产生的订单均为参加活动的订单)
2.统计每个活动从开始后到当天(考试日)平均每天产生的订单数,活动开始时间定义为最早有用户报名的时间。(涉及到时间的数据类型均为:datetime)

image.png

答案

image.png

解析:
使用左连接,如果orders有悬浮元组,即提交了订单,但是没有参加任一个活动,那么因为order_time>=atc_time会把悬浮元组剔除。保证最后结果的正确性。
2.

image.png

解析:窗口函数
image.png

之所以使用group by (act_id,act_start)而不是使用group by(act_id)是因为只有这样act_start才能出现在select中


问题二:(考点:用户行为路径分析)

表1——用户行为表tracking_log,大概字段有(user_id‘用户编号’,opr_id‘操作编号’,log_time‘操作时间’)
要求:
1.计算每天的访客数和他们的平均操作次数。
2.统计每天符合以下条件的用户数:A操作之后是B操作,AB操作必须相邻。

image.png

答案

image.png
image.png
image.png

问题三:(考点:用户新增留存分析)

表1——用户登陆表user_log,大概字段有(user_id‘用户编号’,log_time‘登陆时间’)
要求:
1.每天新增用户数,以及他们第2天、30天的回访比例

image.png
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容