这是我上周投递寒假实习时候的一些问题总结,主要涵盖:
*滴滴-数据科学部 & 业务运营部
*腾讯 - qq音乐 & PCG部
*猿辅导-广告投放部
*字节跳动-电商部
具体就不细分了,把所有问题总结如下,希望对投日常实习的数分小伙伴有所帮助!
一、职业规划与未来分析
1.你现在更想做什么方面的数据分析?
2.你更想做什么类型的数据分析?未来的职业规划是什么?
二、实习经历
具体讲解实习经历,要非常了解。
三、比赛经历
比赛中所有模型与做法都需要很了解,不同面试官背景不一样,有的可能比你还更了解你比赛中用的模型。一定要非常了解,不了解别写上去!
四、sql题目
1.给我讲一下sql的调优方法
2.你如何解决数据倾斜的问题?
五、机器学习
1.给我讲一下随机森林的定义和原理;
2.给我讲一下模型的分类与评估标准;
3.问lightgbm: 为什么lightgbm比较快?快的原因是什么?lightgbm和xgboost的优势是什么?
4.贝叶斯分类器,给我讲解一下?
5.机器学习有什么避免过拟合的方法?
6.如何调整正样本权重
7.对于K-means KNN 线性回归 逻辑回归都给我讲一下
8.你是如何进行数据清洗的?
六、业务知识
1.如果让你搭建指标监控体系,从用户规模增长情况来分析,应该怎么做?
2.从电商数据维度(用户、作者、商家)三个维度构建指标体系
3.拆分问题,你自己设想一个问题,然后进行拆分,讲一下思路
4.如果给你一个广告投放的数据案例分析,你要如何尝试进行分析?讲一讲分析的步骤
5.某个产品3个新增用户渠道次留都降低了5%(新增渠道只有这3个),但是大盘新用户次留反而有所上涨,可能吗?
回答:可能,辛普森悖论。
6.如何实际用户增长dashboard
7.如果有指标出现异常,你应该如何进行问题分析
七、产品知识
1.你最近常用的app是什么?说说最近有什么变化。
2.你觉得单列和双列最大的区别是什么
七、统计学知识
1.考察贝叶斯公式的计算
2.点估计,区间估计有哪些,t检验的适用场合?卡方检验?因子分析?
八、abtest
1.abtest中可以样本进行二一对照的试验吗?(可以,前提做一个方差齐性检验)
2.abtest中中实验组和对照组的均值显著性检验用什么方式检验?这两个组的数据呈现什么样的分布
3.给我讲讲abtest的流程和步骤
九、其他问题
1.对加班什么看法?
2.觉得自己比其他人的优势在哪里?你的缺点是什么?
3.最近在学什么东西?
4.为什么投我们公司?
接下来还会对我在面试过程中没有回答上/回答不好的问题做一个总结梳理。一是为了帮助后续复习,二也是想和大家一起交流探讨。如果觉得这次分享有用,请点个赞吧~
作者:卢敬宜