本人某东北水硕一枚,平时游手好闲没啥本事,已经拿了京东算法工程师offer,搞机器学习方向,实习工资批发价,面经在个人博客早就写好了,下面分享一下:http://blog.csdn.net/chixujohnny/article/details/51199091
搞机器学习的有几点要注意:
1)如何处理过拟合的现象(你在项目里用到的几个常用模型,别的不会问)
2)如何判别哪些特征比较重要
3)一定要看《统计学习方法》
4)对语言没要求,我面试这么多次没问过c语言掌握情况,甚至腾讯让我写伪代码都行,纠结语言是否过关的不用在纠结了。(我用python)
差不多就这样,觉得好希望大家去我博客踩踩,谢谢大家
博客搬运内容
经历一轮轮过关斩将也是成功的过了HR面,上面的状态不知道是不是等待拿offer,不出意外应该是没问题了吧,下面聊聊面试过程。
一面技术面在一个五星级酒店宴会厅进行的,由于跟腾讯冲突时间导致到场的人并不是很多。说正题,面试官首先问了项目,然后问了些细节问题,不是很难,比如说请手写一下决策树中信息增益的公式
, 说说信息增益代表一个什么意思(数据内的混乱度,也叫作信息熵),某个特征的信息增益对总体信息增益的偏离数值比较大,就把它看做是分类特征(ID3算 法)。说了一下还算ok,他说什么情况下会保证上面信息增益中的H最大,这个没遇到过,手推了一下:当所有的p(xi)相等时,H最大。后来我主动简要介 绍了一下C4.5和C5.0,表示满意。
第二个项目几乎没问,可能面试官没做过推荐算法吧。第三个kaggle的小比赛问了一下,说说你遇到的困难,如何调优什么的,大致说了一下,表示满意。主动告诉我你过了(好人性化)
二面面试官显得更年轻有活力,不知道是不是从bat挖过来的,他问第二个阿里移动推荐算法比较多,因为水平不够,一直在调优,我就大致说了一下怎么 做协同过滤的,怎么做的喜好权重等等(实际成绩并不好)。后来说如何用LR做基于内容的推荐,怎么提特征什么什么的。主要是协同过滤那边卡了很久,一方面 当时做的baseline效果不咋地就没怎么做协同过滤,后来也没复习,讲了半天总算是满意了又说了说第三个项目。
第三个项目他主要问了一下随机森林相关的基础内容,还有就是如何判断决策树及随机森林是过拟合了还是欠拟合,回归问题我都是画图看的,对于分类问题 我说我交叉验证了一下看看F1怎么样,这边他表示认同,但是我觉得应该有更好的,NG对于分类问题的你和情况有过讲解,只怪当时听得不认真吧。。。。
最后聊了一下京东在机器学习这边有什么业务,比如仓储预测,用户行为分析,推荐算法等等。仓储预测这个挺新颖,有搞头。不过跟腾讯部门直招不一样,京东是HR根据你的喜好分配,这点很不错,不像哈尔滨腾讯总监面完发现不匹配就不要了。。。
HR面
这个没啥说的,基本都能过吧,内推很加分,总之内推的小伙伴一定要说是内推来的。然后问我实习过没,我说去过东软,她说实习经历也很重要,威慑不写呢,我说太low了这公司。。。。确实如此,没有说东软不好啊,感觉确实没学到什么东西。
总的来说就这样吧,搞机器学习的同学真的不用纠结用什么语言实现什么的,面试官需要的是你的思维!甚至京东连手写代码都没有,不知道是不是我运气好,反正就算让写,伪代码都行。
另外,下一步准备通读《推荐系统实践》、《统计学习方法》,再把Andrew Ng的10~20集看完(这个本来打算一起看完的,后来觉得有点跟不上就先去写代码强化了)