学习笔记52 数据分析常见面试题 4-14

费米估算

1.费米问题:北京11点左右上空飞行的飞机数量?(拼室友)

参考答案

北京机场年旅客吞吐量一亿人次,每天旅客量1亿/365=27万;

考虑到机场有大中小型飞机,假设平均每架飞机载客150人,于是北京每天起降飞机架次:27万/150~1800架;

大部分的航班集中在早6点-晚12点的18个小时内。城市上空的飞机主要是起飞或等待降落,每架飞机起飞会立刻飞离北京,降落之前需盘旋等待进场,假设每架飞机在北京上空滞留时间在半小时.

故在白天的任意时刻(11点),北京上空飞机数量=1800*0.5/18=50架

==开放类题目,主要考察的可能是考虑的是否全面,例如时间,飞机大小等,最后的答案一定要合理。

考察这种问题一般要知道一个省或一个市有多少人口,旅游吞吐人口之类,知道大概在什么级别即可。这里指出北京旅游吞吐人口在1亿左右,一架飞机载客平均150左右,飞机集中工作时间在6-24点的18个小时内。

==这里要记住,北京旅客一年1亿,还要考虑飞机载客数150,工作时间18h和飞行时间30min,


2.费米估计:上海大约有多少家用小轿车(MobTech)

参考答案

家用小轿车数量=平均每家有小轿车数量 x 有小轿车的家庭数量= 平均每家有小轿车数量 x 上海家庭数量 x 有小轿车的比例=平均每家有小轿车数量 x 上海人口数量/平均每家人口数量 x有小轿车的比例

假设家庭拥有家用小轿车:电动车:自行车:啥都没有=6:2:1:1

即:有私家车的家庭占比=60%

假设平均每家有小轿车的数量为1。上海人口:2500w,平均每家人口数量4人。

家用小轿车数量=1 x 2500w/4 x 0.6=375w

==面试官考察的可能还是问题的拆解,将一个个问题细分。

上海有多少家用汽车=有汽车的家庭有几辆*有多少家有小汽车

=有汽车的家庭有几辆*有多少人家*汽车拥有占比

=有汽车的家庭有几辆*有多少人/平均一家几人*汽车占比。

上海大概2500万人口,平均4人一家,占比大概60%,一家大概1辆


3.估算北京五环实时车流量(滴滴

参考答案

北京每日车流量约50w人次,主要车流动的时间段为7点-20点,假设北京六环的车流量比例为:4:4:3:3:2:2;即五环车流量占比约11%。

故在白天的任意时刻,北京五环的实时车流量=50w*11%/14=4000辆。

==这种题目不好找规律总结,这里要记住,这类流量题目,需要考虑时间,这里说实时其实就等于说任意时刻,与第一题一样,要考虑时间。

北京每日车流量为50万,活跃时间大概14个小时,5环占比11%,即可得出答案。

==这里不太好用北京人口来进行估算。(4.17


4.每天全国的电单订单量大概是多少?(滴滴

参考答案

全国订单量=用户基数 x 渗透率 x 购买频次 x 单次购买件数

由于不同城市的渗透率和购买频次不同,所以将用户分为一线城市,二线城市,三线城市,四线及以下城市。

一线城市订单量=一线城市人数 x 渗透率 x 购买频次 x 单次购买件数=7000万x 0.8 x1/7 x 1=800w

同理可以得到其他城市的订单量,汇总就得到了全国的每日订单量。

==注意,这里的题目就更加扯蛋了,这题和前面几题不同,这里要求的是一个非常宏观的数据,不再是省或市了。那么这里对问题的拆分就出现了子维度了。将全国拆为多个城市,城市按照发达程度来区分,不同程度的城市计算方式不同。

一线城市为例,人口数为7000万(这是不是有点夸张),订单数的计算处理考虑人口外就是软件的渗透率了,然后就是购买频次。


5.如何估计某一时刻某地上空的飞机数量,或者说如何获取相关信息(滴滴

参考答案

某一时刻某地上空的飞机数量=某地机场年旅客吞吐量/365/平均每架飞机载客人数/航班集中时间*每架飞机在某地空滞留时间

平均每架飞机载客人数约为159人;航班集中在早6点-晚12点的18个小时内;每架飞机在上空滞留时间在半小时。

==这题同第一题类似,但是我一开始想的时候考虑的是全国各地的飞机都有可能经过该地上空,这么想想也的确不合理。

那么此题依旧是此地的一年的旅客吞吐量/一年/6-24的18个小时/飞机人数

以北京为例,那就是1亿/365/18/150


7.贝壳要进入一个新的城市要如何去估计这个城市的需求量(贝壳找房)

参考答案

其中用户基数和单价很容易得到,渗透率和消费频次可以根据日常经验或者问卷调查等方法得到,如果要更细致的划分,可以把用户按照年龄、职业等分层统计后汇总。

==这题有点像前面滴滴的那个全国电单订单数。首先要是到人数,然后就是渗透率,然后就是购买频次和购买数量。后面的几个都可以通过问卷调查得到。

然后前面滴滴的为了准确还对城市进行分级,这里也可以,这里是对用户。


8.怎么估算上海外卖员的数量(拼多多

参考答案

外卖员的数量= 每天订单总数/每人每天可配送的订单数

每天的总订单数=目标用户数/点单频度=上海市总人数 x 点外卖人数占比/5=2500万 x 0.4/5=200万

每人每天可配送的订单数= 每天工作时间/完成一个订单需要的时间=每天工作时间/(骑手到商家的时间+排队等待时间+配送时间 + 用户等待时间)= 每天工作时间/(商家距离/骑手速度+排队等待时间+目的地距离/骑手速度 + 用户等待时间)= 10/(3/25 + 0.25 + 4/25 + 0)= 18.9 单

外卖员的数量= 每天订单总数/每人每天可配送的订单数= 10.5万人

==这题我的估算是上海人口7000万*点外卖占比0.3*每人每天点2单/一个外卖员每天送40个外卖=100万

好家伙上海到底多少人?以后就按3000万来算吧

9.如何预估全国大学生人数(拼多多

参考答案

大学生为大一到大四的人数,一般为18-22岁,我们可以找到1999-2003年的出生人数平均为1800w,假设上学率为80%,都进行了九年义务教育,中考升学率60%,高考升学率60%,则最后

全国大学生人数1800 x 4 x 0.8 x 0.6 x 0.6=2000万

==是的,这类问题我一开始想的是20岁左右人口占总人口比例,但是岁数太分散,这不好比较。还是用出生人数来比较好做。

一年大概1800万,再考虑上学率,中考升学率,高考升学率即可,两个都设60%


10.如何预估2030年高考生的数量。(拼多多

参考答案

高考生一般为18岁,2030年高考生为2012年出生,2012年我国出生人口为1600万,假设上学率为80%,都进行了九年义务教育,中考升学率60%,则最后高考人数

1600 x 0.8 x 0.6=768万

==同上题一样,就是考出生人口数,2012年竟然就1600万了,还没有2000年的时候多


11. 估算上海地铁每天的客运量(拼多多

参考答案

客运量=每节车厢实际平均人数 x 车厢节数 x 每日列车次数 x 地铁线路数量

车厢节数约10节;

每日列车次数=冷清时段时间/列车间隔+高峰时段时间/列车间隔+正常时段时间/列车间隔=90/7+300/2+0.625 x 20 x60/5=15+150+150=315;

地铁线路数量18条;

地***量=167 x 10 x 315 x 18=950万。

答案解析

冷清时段:地铁一早开始运营的0.5个小时和晚上最后的1个小时,假设上座率是15%

高峰时段:从早晨6:30-9:30,下午4:30-7:30,假设上座率是95%

正常时段:剩下的时间里,假设上座率是60%

==这题直接上海人口数2500万*地铁占比0.4不就可以了吗,大概1000万左右

12.估算江苏省面积(快手

参考答案

我国国土面积为960平方公里,东北和西南和西北省份占地面积较大,新疆、西藏、内蒙古、青海、四川、黑龙江、甘肃、云南八个省份约占我国2/3的土地,剩下28个省占1/3,江苏省960/3/28=11平方公里。

==这题整的还蛮新颖的,首先全国是960万平方公里,上面写错了。然后东北,西北和西南占地面积比较大,大概是全国的2/3,剩下的28个省平分,那就是960/3/28=11


13.估算今年国庆全国的旅游消费总支出?(神策数据

参考答案

将出游城市划分为一线城市、二线城市、三线城市和四线及以下城市。

旅游消费总支出=该类城市总人数 x 出游率 x 平均出游天数 x 日均消费

一线城市居民旅游消费=7000w x 0.4 x 5 x 100=14亿

将各类城市的消费总支出汇总就得到了全国消费总支出。

==看到全国,就想起了前面滴滴的电单那个题目,首先还是对全国进行拆分,然后就是出游率,出游花费。注意这里的出游花费是按个人来算的。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容