问题一:(考点:活动运营数据分析)
表1——订单表orders,大概字段有(user_id‘用户编号’, order_pay‘订单金额’ , order_time‘下单时间’)。
表2——活动报名表act_apply,大概字段有(act_id‘活动编号’, user_id‘报名用户’,act_time‘报名时间’)
要求:
1.统计每个活动对应所有用户在报名后产生的总订单金额,总订单数。(每个用户限报一个活动,题干默认用户报名后产生的订单均为参加活动的订单)。
2.统计每个活动从开始后到当天(考试日)平均每天产生的订单数,活动开始时间定义为最早有用户报名的时间。(涉及到时间的数据类型均为:datetime)。
答案
解析:
使用左连接,如果orders有悬浮元组,即提交了订单,但是没有参加任一个活动,那么因为order_time>=atc_time
会把悬浮元组剔除。保证最后结果的正确性。
2.
解析:窗口函数
之所以使用
group by (act_id,act_start)
而不是使用group by(act_id)
是因为只有这样act_start
才能出现在select中
问题二:(考点:用户行为路径分析)
表1——用户行为表tracking_log,大概字段有(user_id‘用户编号’,opr_id‘操作编号’,log_time‘操作时间’)
要求:
1.计算每天的访客数和他们的平均操作次数。
2.统计每天符合以下条件的用户数:A操作之后是B操作,AB操作必须相邻。
答案
问题三:(考点:用户新增留存分析)
表1——用户登陆表user_log,大概字段有(user_id‘用户编号’,log_time‘登陆时间’)
要求:
1.每天新增用户数,以及他们第2天、30天的回访比例