数据分析面试会重点考查候选人两方面的能力,一个是基础的数据工具能力,最常考的就是SQL,这部分前面我们已经有4篇连载文章全面剖析了大厂的常考笔试题型,没看的同学不要错过了,可以戳:
考查的另一方面就是业务思维能力了,这一块主要是设定一些常见的业务场景,需要你给出对应的分析思路和方法,这一块对于没有数据分析经验的小伙伴们来说就很不友好了,很多面试的朋友碰到这类题都会很慌,无从下手,因为没做过,也不知道怎么分析啊!!!
不过不用怕,我收集了近几年一些大厂的面试笔试题,有笔试题也有业务题,通过这些题目的详细讲解,你应该就能掌握这类题目的解答思路了,话不多说,今天我们先来扒一扒字节跳动的面试题目吧!
一共有3道题目如下:
SQL笔试题:计算视频好评率
业务题1:使用ABTest对新算法效果进行评估
业务题2:如何评估一场活动的效果?
02 计算西瓜视频内容好评率
1)需求
西瓜视频近期开展了”2020百大人气创作者”优质内容扶持项目,鼓励用户产出优质的视频内容。现需要统计2020年11月01日至2020年11月30日期间创作的视频中,“科技”大类下“数码测评"子类的视频好评率(好评率=好评数/视频观看次数),写出sql语句进行查询。
用户观看视频后的评价详情表:content_action_info
id(视频id,主键)
create_time (创建时间,格式‘2020-11-01’)
user_id(观看者id)
content_id (视频id,外键)
content_action (视频评价,包括’点赞‘,’差评‘,‘无评价’)
视频详情表:dim_content
content_id (外键)
creator_id(创作者id)
content_category (商品类目)
content_sub_category (品牌名称)
2)解题思路
题目很简单,我们只需要明确好评率的计算公式,然后先定特定的大类和子类即可。
1.好评率=好评数/视频观看次数。
2.要求计算“科技”大类下“数码测评"子类的视频好评率,则要使用where条件筛选指定大类和子类的数据。
3.因为限定条件要指定视频内容的类别,所以要两个表做关联。
代码如下:
select
count(1) as all_action
sum(case when content_action='点赞' then 1 else 0 end) as like_action
sum(case when content_action='点赞' then 1 else 0 end)/count(1) as like_rate
from content_action_info as a
join dim_content as b
on a.content_id=b.content_id
where b.content_category='科技'
and b.content_sub_category='数码测评'
and a.create_time between '2020-11-01' and '2020-11-30';
03 使用AB Test评估算法效果
1)需求
某个购物APP最近优化了“猜你喜欢”模块的推荐算法,希望进一步提升推荐的精准度,进而提升销售额。现在需要通过AB Test(50%用户保留原先推荐算法的为控制组,50%用户使用新的推荐算法为实验组)来对新的推荐效果进行评估。假设你是此次实验的数据分析师,请问你会如何评估控制组和实验组的表现?请按重要性列出最重要的三个指标并给出你的分析过程。
2)解题思路
指标:推荐商品的销售额、推荐商品点击率、推荐商品的转化率
分析过程:
1.设原假设为使用新的推荐算法后上述指标降低或不变,备择假设为使用新的推荐算法后上述指标增加。
2.选择显著性水平临界值为5%,并根据指标的预期提升确定样本量和试验周期。
3.样本合理分流,AB测试上线,采集数据。
4.使用T检验,计算P值,进行效果验证。
5.分析结论,如果P值小于5%,那么原假设不成立,备择假设成立,即使用新算法后指标提升。
反之无法推翻原假设,不能证明使用新算法后指标提升.
04 如何评估一场活动的效果
1)需求
某APP近期上线了一个拉新活动,并在各个渠道进行了推广投放,活动结束后,作为数据分析师,你如何评估这场活动的效果?
2)解题思路
如果要对一个活动效果进行分析,无非是要回答以下3个问题:
1、活动效果怎么样?要不要继续做?
2、如果可以继续做,活动的做的好的方面是哪些?问题或者瓶颈环节在哪?
3、针对问题环节的改进方案是什么?
具体展开来讲,可以从以下几个方面
1、活动关键指标达成分析
活动关键核心指标达成情况,比如拉新多少用户,达成多少GMV?ROI如何?
2、活动关键流程漏斗分析
活动的关键流程是什么?以及各个流程的漏斗分析,定位问题发生的环节。
3、活动的渠道、用户分析
活动在哪些渠道推送?活动推送给哪些用户?用户画像是啥样的?各渠道用户的质量/ROI如何?
4、活动策略、节奏分析
活动玩法的裂变效果如何?利益点是否有吸引力?活动整个过程节奏把控如何,前期预热、中期爆发和尾期是否过短/过长,运营应该在何时进行适当干预。