37. 假设给一个数据集,我会选择的分析步骤是什么样的?(快手)
参考答案:
数据清洗(删除重复项、填充缺失值和删除异常值等)--思考需要分析的问题,得到分析思路--指标整合--可视化
==先对数据进行清洗,然后根据目标分析思路,制定指标,再进行可视化。(4.22
38. 就快手而言,要如何分析在没有营销手段拉动的情况下,什么样的作者/作品类型/作品内容自然增长是具有快速增长增量的(快手)
参考答案:
首先,制订指标体系(七天内涨粉量、播转粉率、点赞率等)识别出快速增长的作者/作品。将这些作者的明细分为消费和供给两方面进行分析。消费包括这些作者的稿件的点赞情况、点赞率情况等指标;供给包括投稿频次,稿件属于哪一类型等。通过这些数据来看是否具有一定的共性规律性。
==定制指标体系(4.24
39. 所以你擅长的内容实际上是在现成数据集上做挖掘分析对吗?(快手)
参考答案:
不是,我熟练掌握python对数据集清洗,以及sql从数据库中取出数据。对于其他网络数据,我也会使用python爬虫从网站上爬取数据。
40. 实习中如何分析用户流失路径(字节跳动)
参考答案:
做埋点。用户的流失率的分析需要统计次日留存,三日留存,七日留存和一月留存,我们的流程是:
1、画出用户地图,每一步埋点,最后通过对数据的分析判断每一个步骤上的流失率,
2、优化具体的操作步骤,看题主描述的引导页应该是注册——选择喜欢音乐类型——选择喜爱歌手——APP首页,至于进入后的其他环节不太清楚,要对产品核心功埋点,分析每一个核心功能每一个步骤,分析用户在哪一步流失,这些数据的收集和分析有助于优化该功能,提高用户留存。
41. 工作中做过什么专题分析(字节跳动)
参考答案:
介绍专题分析的背景(为什么要做这个专题)-->分析思路(从什么方面进行分析,分析了哪些指标)-->分析结论(发现了什么现象,找出了什么原因)-->策略落地(针对这些现象实施什么策略,与哪些部门进行沟通)-->落地效果
42. 我们假设,飞书现在视频会议功能用户量骤减,你会怎么分析(字节跳动)
参考答案:
首先,验证数据的准确性,不是由于底层数据库或数据口径出现问题而出现的骤降。
随后,将用户进行分层,可以从地区、时段、行业等维度进行划分,看哪部分的用户显著下降。
最后从内部和外部进行原因分析,内部从产品、运营、技术层面找原因,外部从竞品找原因。
==应该还有一个漏斗吧,看看哪一个步骤出现问题(4.24
43. 那要是你作为一个内部人员的话,怎么分析这些数据呢(字节跳动)
参考答案:
首先,我会先从产品现状发现问题,针对问题进行分析。
随后,我会对问题进行拆解,再构建数据指标体系。
最后我会对用户进行分层,对各个层级的用户统计数据指标体系,看各层级用户是否有明显区别,能够解释问题。
44. 说一个你在实习中做异动指标分析的例子(滴滴)
参考答案:
在某视频直播平台实习时,我做过优质传输率异常值分析。这里的优质传输率指的是a和b在视频通话过程中的丢包情况,优质传输率一般在95%以上,但是当时突然下降到了85%。对此,我们将数据按照省份、传输机房、运营商等维度进行拆解,看各个维度的优质传输率情况。我们发现有两个省份的优质传输率很低,并且后来发现是机房原因,我们把该省份的传输端口手动接入附近省份,次日优质传输率恢复。
45. 如果最近DUA有较大抖动,你怎么去找核心原因?可以添加什么因素在这个分析模型中?(字节跳动)
参考答案:
首先确定是否是底层表或统计口径的问题造成的较大抖动。随后对用户进行分层,分层的维度可以有新老用户、各年龄段用户等,找到是哪部分用户的DAU下滑明显。随后从产品内部和外部进行分析,内部可以从产品、运营和技术上找原因,外部可以从政治经济和竞品分析找原因。
46. 你刚才提到了版本你会用什么方法分析。(新版本上线分析)(字节跳动)
参考答案:
我主要从以下几个方面写的分析报告:
1.基于什么样的背景(在什么样背景下版本更新了)。
2.为了达成怎样的目的(版本更新针对什么问题,针对哪些人群)。
3.做了怎样的功能(新功能/改动功能有哪些)。
4.监控了哪些指标项。
5.各指标得到的结论。
6.总结这次版本更新的表现。
17.淘宝某日销售额下降,分析原因(阿里)
参考答案
销量=下单数 *(1-订单取消率-退货率),
这个公式就可以把销量用“下单数、订单取消率、退货率”等三个维度去量化,下单数=咨询数 *(1-咨询流失率)+浏览量 *(1-浏览流失率);
订单取消率=支付取消数/下单数;
退货率=订单退货数/已支付订单数;所以又会引出“咨询流失率、浏览流失率、支付取消数、订单退货数”等多个衡量指标。
经过这样一层一层公式化的量化,找到那些“最小不可分割的指标”,进而最可能发现本质的问题所在了。
参考答案
首先,按照省市、价格区间等维度划分,找到是哪个维度下的二手房成交量下跌。找到原因后,分内外部进行归因,内部包括产品侧、运营侧和技术测。外部包括宏观经济政策和竞品分析。
答案解析
定位原因+内外部分析
19.用滴滴的行为情况,问你用哪些数据做分析,方案的优缺点,可行性,效益这类问题(滴滴出行)
参考答案
哪些数据做分析:指标体系搭建。采用“人货场”场景化搭建指标体系。“人”数据指标主要看发单用户数、完单用户数、客单价、周期内完单订单数、取消订单数、评价订单数等。“货”数据指标主要看成交了多少,交易额多少,花了多少,到具体数据指标主要会看GMV、成交率、取消率指标等等。“场”数据指标主要看哪个渠道用户点击量大曝光率大,带来了多少新用户,完成多少交易订单,客单价是多少。
方案的优缺点可行性等可以采用AB实验才量化。
具体步骤:
1. 收集指标,建立评估指标体系。
2. 设置实验组和对照组,分配流量。
3. 假设检验,评估实验结果是否显著。
4.给出决策方案。
答案解析
指标体系问题+ab实验步骤
20.总体转化率下降,但是其余各渠道转化率正常,应该怎么进行分析?(猿辅导)
参考答案
这是辛普森悖论问题,多组数据分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。要更客观分析产品的转化率情况,就需要设立更多角度去综合评判。也就是对用户进行更细致的划分。
答案解析
解释什么是辛普森悖论问题+解决方法