学习笔记68 数据分析常见面试题04-26

35. 举一个具体的例子,在工作中分析了什么问题,对公司有哪些影响和风险,你是怎么给出方案去改善去落地的?(京东

参考答案:

(项目背景)在xx实习的时候,我们全量上线了一个短视频流的功能,但是全量上线后的数据表现没有达到预期,所以我们做了关于这个短视频流稿件的分析。

(分析过程)我们分别从近一周被消费的短视频情况、高粉博主发布的视频消费情况以及消费情况好的视频的详情分析。

(分析结论)结果发现虽然我们有好的视频但是好的视频并没有得到好的消费。

(策略落地)所以我们去与运营团队沟通分析什么是符合我们app特色的视频,并与算法团队沟通推荐策略。

(落地影响)在我们推进后一周,xx数据和xx数据得到了显著的提高。


36. 你现在独立做分析报告吗?多久做一次?(京东

参考答案:

之前有尝试过做xx项目的分析报告,我是从xxx方面进行分析,后和我的mentor讨论发现还可以从xxx方面进行分析,随后我们得出了xxx结论,想出来xx策略。大约一个月两次的样子,没有固定的时间,是业务出现问题或者我们在日常分析中发现问题后才回去做分析报告。

答案解析:

不止是回答有分析报告,最好介绍之前准备的分析项目报告,引导面试官接下来的问题。

46. 你刚才提到了版本你会用什么方法分析。(新版本上线分析)(字节跳动

参考答案:

我主要从以下几个方面写的分析报告:

1.基于什么样的背景(在什么样背景下版本更新了)。

2.为了达成怎样的目的(版本更新针对什么问题,针对哪些人群)。

3.做了怎样的功能(新功能/改动功能有哪些)。

4.监控了哪些指标项。

5.各指标得到的结论。

6.总结这次版本更新的表现。

25.爱奇艺想要提高付费会员数,应从哪几个方面分析。(拼多多

参考答案

内部和外部进行分析。

内部:从未付费用户,持续付费用户,流失付费用户。分别分析这些用户的付费率情况,以及如何提高对应用户的付费意愿。

外部:竞品用户。分析竞品的付费用户情况,可以从外部购买数据或数据爬虫等方法获取,分析这些用户能否转化为爱奇艺的付费用户。

26.给一张流量表,怎么识别不同渠道的变化?(拼多多

参考答案

取数的时候对groupby不同的渠道进行聚合。变化的话看不同渠道的影响系数=(该渠道变化前指标-该渠道变化后指标)/总的变化前指标,就可以量化比较不同渠道变化带来的影响。

12.选择AB实验的样本的时候,应该注意什么(滴滴

参考答案

选择AB实验的样本的时候,我们最要考虑的是样本量的选择,影响样本量选择通常有4个因素:显著性水平(α)、标准差(1 – β)、统计功效(μA-μB)、均值差异(σ)

● 显著性水平:显著性水平越低,对AB实验结果的要求也就越高,越需要更大的样本量来确保精度

● 统计功效:统计功效意味着避免犯二类错误的概率,统计功效越大,需要的样本量也越大

● 均值差异:如果真实值和测试值的均值差别巨大,也不太需要多少样本,就能达到统计显著

● 标准差:标准差越小,代表两组差异的趋势越稳定。越容易观测到显著的统计结果

将这四个值带入样本计算量公式就能得到需要的样本量,通常有网站专门计算AB实验的样本量,所以只要搞清楚上面四个值,就能计算出你需要的样本量

答案解析

这道题主要是对AB实验样本量选择的考量,因为在选择样本的时候最关键也是最重要的一步就是对样本量的选择,对于有经验的人来说可以按照经验判断样本量级,但是对于更多人来说还是需要有更多辅助的判断。通常来说样本量太少,实验结果不大可信,但是样本量太多,也不是更好,一个最直接的原因就是样本量越大,影响的用户越多,就有可能影响到用户对产品的体验。


13.如何设计ABtest确定此功能上线收益(正负收益平衡点)(快手

参考答案

1. A方案和B方案,哪个方案的结果更好?

首先的话,需要做需要运用假设检验,分为两种不同的检验方式,对于留存率、渗透率等漏斗类,采用卡方检验。对于人均时长类等均值类指标,采用t检验。

2. 通过假设检验后,如果结论置信,我们就能够得到A方案和B方案哪个指标更好(有显著性差异), 对于不置信的结论,尽管A方案和B方案 的指标可能略有差异,但可能是数据正常波动产生。哪个 ROI 更高?

一般有活动相比无活动,留存、人均时长等各项指标均会显著。

对于ROI 的计算,成本方面,每个实验组成本可以直接计算,对于收益方面,就要和对照组相比较,假定以总日活跃天(即 DAU 按日累计求和)作为收益指标,需要假设不做运营活动,DAU 会是多少,可以通过对照组计算,即:

● 实验组假设不做活动日活跃天 = 对照组日活跃天 * (实验组流量 / 对照组流量)

● 实验组收益 = 实验组日活跃天 - 实验组假设不做活动日活跃天

这样就可以量化出每个方案的ROI。

答案解析

这道题主要是考察ABtest上线后,从哪些维度来确认哪个方案更好,或者说新的方案是否比旧的方案更加适合上线


14.根据上面说的改进点做AB测试,从什么角度来分析?(小红书

参考答案

以下是ABtest常用的不同的分析指标,可以从这些指标来分析ABtest(以电商为例)

● 点击率

● 留存率

● 复购率

● 转化率

● 跳出率

● 平均保留率

● 平均使用时长(应用,手机网站、网页或游戏场景上的时间)

● 客户满意率

● 平均用户收入

● 平均订单金额

通过对比以上指标在ABtest中的效果,就可以分析不同方案的优缺点

答案解析

这题考虑的是ABtest的分析的角度,分析的角度可以通过不同的指标来分析,不同的指标体现了不同角度的意义


15.怎么验证你的改进办法有没有效(字节跳动

参考答案

常见的方法就是去关注一下指定的指标,因为大多数ABtest在确认做之前都会指定一些关键性指标,比如,点击率、留存率、复购率和转化率等等,所以在上线后就可以直接关注这些指标是否有提高,如果有就说明办法有效,如果没有提高就需要看看办法哪里出了问题。其次也能够通过计算ROI来比对不同的方案。

对于ROI 的计算,成本方面,每个实验组成本可以直接计算,对于收益方面,就要和对照组相比较,假定以总日活跃天(即 DAU 按日累计求和)作为收益指标,需要假设不做运营活动,DAU 会是多少,可以通过对照组计算,即:

● 实验组假设不做活动日活跃天 = 对照组日活跃天 * (实验组流量 / 对照组流量)

● 实验组收益 = 实验组日活跃天 - 实验组假设不做活动日活跃天

这样就可以量化出每个方案的ROI。

答案解析

这题主要还是考察ABtest上线后的效果,最简单的是一些指标可以看出是否有效果,也能看一个投资回报率ROI来看是否有效果


16.A/B test场景问题,第一类错误,第二类错误具体是什么,你觉得哪个更严重等延伸开的问题(阿里)

参考答案

第一类错误:原假设正确但是拒绝原假设,弃真错误。第二类错误:原假设错误但是接受原假设,取伪错误。第一类错误更严重,由于报告了本来不存在的现象,则因此现象而衍生出的后续研究、应用的危害将是不可估量的。


1.这份实习中主要跟的项目或者case,自己独立完成的(可以使行业分析、可以使指标体系的搭建等),整个框架详细介绍(美团


参考答案

先介绍项目背景:在xxx上线后,数据效果不明显,所以需要我们对其进行分析,找到原因。随后介绍分析思路:我们构建了指标体系:主指标为xxx,用户辅助指标为xxx。后我们从xxx,xxx等维度进行分析这些指标,得到xxx的现象。最后说明分析结论和对应的解决策略。如果后续有继续观察策略落地的情况可以继续说策略落地后的效果。


2.大三的实习怎么做数据的相关性分析和聚类(招联金融

参考答案

相关性分析:

1. 画散点图,观察两个变量有没有规律变化

2. 根据变量类型或者正态性检验,选择合适的相关系数公式

3. 计算相关系数r,评估相关程度

4. 显著性检验,如果P<α(一般取0.05),表示存在显著相关性

5. 总结分析结论,并从业务层面给出业务判断及策略

根据上面的步骤,即可完成相关性分析,注意,在回答的时候在每一步最好结合业务相关的场景去解释,这样回答起来会更有说服力

聚类分析:

下面以kmeans为例,因为在描述算法的时候尽量讲了解的算法,才不至于被考倒

(图片来源于网络)

同样的,最好能结合具体案例分析kmeans算法


3.DAU下降分析(快手滴滴

答案模板

两步分析法:首先定位问题原因,这里可以通过计算各个维度DAU的变动系数=(该维度下异常前DAU-该维度下异常后DAU)/该维度下异常前DAU,选出变动系数较大的前几个维度,对其进行分析。

然后可以从内部和外部进行分析,内部从产品(版本更新)、技术(卡顿,闪退)、运营(运营活动)分别沟通看是否能找到原因。外部从政策和竞品的角度找原因。

答案解析

定位问题+找到原因


4.相关性分析(快手

参考答案

有四种相关性分析的方法:

1.图标相关分析(折线图及散点图)

2.计算协方差及协方差矩阵

3.计算相关系数

4.建立一元回归或多元回归模型,做回归分析,计算r方。


5.微信日收入下降分析(快手

参考答案

1. 数据验证,验证日收入的数据口径是否一致,确认是否是真的日收入下降

2. 指标拆解,可以参考如下指标拆解

3. 从上述指标来看是否出问题,如果某个指标出问题,可能就是因为这个指标的下降导致收入下降。比如,从每一个数据指标去看后,发现是渠道A的付费人数下降,就可以找到负责这个渠道的同事来了解这个渠道是否真的付费人数减少,如果是真的减少的话,就找到了收入下降的原因,就可以跟进这个渠道去解决付费人数下降的问题。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,185评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,445评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,684评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,564评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,681评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,874评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,025评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,761评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,217评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,545评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,694评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,351评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,988评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,778评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,007评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,427评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,580评论 2 349

推荐阅读更多精彩内容