现本科大三学生,今年开学就是大四了。从大一开始做web开发,在大二下开始投身于机器学习领域,因为要应用数据同时开始自学Hadoop、Spark等等。大三期间拿到了一些公司的机器学习岗offer,现告一段落,特此分享经验于大家。
阿里巴巴(3月面了一次,7月面了一次,大体如下):
一面:
1、自我介绍
2、看简历问(讲了SVM\AdaBoost等,在校情况、项目的具体实现、效率问题)
3、数据结构,自己实现一个栈,如何在需要时能最快取出最大值
4、操作系统
5、估算9的10万次方是几位数(15分钟内给答案)
6、计网、操作系统、数学知识
7、Hadoop、Spark知识
8、Apriori
二面:
1、自我介绍
2、看简历问(问了K均值聚类、kNN、svm拉格朗日乘子、贝叶斯估计,在校情况、项目的具体实现)
3、协同过滤、网络流等等算法
4、计网、操作系统、数学知识、Spark Streaming
5、召回率问题
终面:
1、自我介绍
2、看简历问(问了KNN,决策树、回归树、模型树之间的关系和区别、svm、AdaBoost、高斯核函数,在校情况、项目的具体目标、实现)
3、协同过滤、冷启动、Dijkstra、k折交叉验证
4、拿到1000万的高维数据怎么办?
5、不同情况的过拟合,怎么办?
6、分类和回归模型区别
7、Spark知识
9、FP-Growth
10、闲聊,今后发展打算等
hr面:
1、自我介绍
2、项目、大学期间经历,闲聊,基本是看性格怎么样、今后的发展打算等等
百度(也是3月、7月,面了两次,很喜欢让人写代码。。。):
一面:
1、自我介绍
2、看简历问(在校情况、项目)
3、各种操作系统命令
4、多个链表求交集
5、单链表判环
6、Hadoop、Spark知识
7、在线写代码:kmp、统计字符串中出现最多的字符、Dijkstra的演变、快排
8、给了一个表达式,对该表达式只能进行特定的操作,在次数最少的情况下让其变成另一个表达式。(动态规划,写状态转移方程,编辑距离算法)
9、分类和聚类的区别
二面(要求一定要到现场):
1、自我介绍
2、看简历问(在校情况、项目)
2、两个已排好序的链表按顺序合并(手写)
4、shell脚本(手写)
5、两个文本,每行都有一堆字符,按行求并集(python手写,不允许其他语言)
6、问了Spark Streaming的详细
7、每天有很多数据产生和变更,数据之间有关联性,各种联系每天都在动态变化,如何存储?如何处理关系?你的解决方案效率怎么样?(开放题)
8、手写Logistic回归!!!!!!!!!!!!!!!!!!!
终面(现场二面之后进行终面):
1、自我介绍
2、看简历问(在校情况、项目)
3、对最近百度事件的看法
4、压力面,考察性格、遇到问题如何处理等等问题
6、闲聊,今后发展打算等
hr面:
1、自我介绍
2、问简历,闲聊,今后发展打算等等
其余几家,Boss直聘、量化派、国美等创业公司面试经历都与上述差不多,额外问到一些数据维度、处理问题,便不再细写。
今后大四开始在北京百度实习一年,大约是工作日在百度,周末在学校实验室跟老师、师兄和师姐共同深入研究机器学习相关领域。
保研经历见我上一篇文章,下一篇文章我会开始写机器学习相关的详细知识和总结。