算法工程师面经(搜狐、数旦、好未来)

算法工程师面经

2018年3月13日

搜狐一面

主要问了我硕士期间做的新闻推荐系统是什么,我讲了大约20分钟balabala。然后针对于这个新闻推荐系统提出了一系列的问题:

1.你用到了LDA,那么请讲一下LDA的原理是什么?我简单说了一下LDA生成文档的过程,但是根据什么生成没答上来2333(LDA是我的痛,看了几遍没看懂)

2.你的新闻的备选集如何获取?选取当天新闻,挨个算一遍。

3.也就是说你的计算是现场算的么?是的,我知道这样效率有问题,我的系统中没有解决,但是可以先对新闻进行聚类,然后对每个簇提出一个模型,先匹配簇在选择新闻(SCENE 论文中的方法)

4.你的数据量有多大?3万多条新闻,100个用户吧。

5.你的用户较少,那么在推荐的时候矩阵一定是稀疏的,对于这个稀疏矩阵应该如何处理?可以用PCA或者SVD进行矩阵分解

6.你的关键字是如何从文档中提取出来的?使用了中科院的NLPIR+TF-IDF算法。

7.讲一讲tf-idf是什么意思,TF就是表示词频,IDF是逆文档频率的意思计算方法为log(N/n),N新闻集的大小,n为包含这个词的新闻的数量

8.你系统使用什么语言实现的?Java

9.hashmap你用过么,底层是如何实现的?这个我不太清楚呢。见http://blog.csdn.net/yinbingqiu/article/details/60965080

10.计算机网络你有学过吧,还记得什么么?记不清太多了时间太久了。其实可以说说TCPIP,网络5层结构之类的

11.你说你做过Android  Android的生命周期是什么?忘记了。。

12.你用过Python 那么你Python都用过哪些机器学习的库?Scikit-learn,numpy,OpenCV 和dlib(其实还有LibLinear忘记说了)

13.好了,那么你觉着你自己都有哪些优点呢?。。。。。。。。

总而言之第一次面试毫无疑问的跪了


2018年3月15日

金山WPS

1.自我介绍巴拉巴拉

2.项目

3.深度学习!

深度学习!深度学习!

结论就是大家投岗位一定要看好是不是适合自己


2018年3月16日

数旦科技一面

1.数据库 三范式(不记得了)

2.bagging  和boosting  哪个可以让结果的方差更小一些,为什么?

偏差:偏差越大准确率越低,偏差越小准确度越高

方差:方差越大的模型越容易过拟合,方差越小越不容易过拟合

bagging减少方差(通过随机抽样和投票减少过拟合),boosting减少偏差(通过不断拟合残差来让偏差更小)

3.你都知道哪些分类算法

LR,SVM,决策树,随机森林,Adaboost,GDBT,Xgboost,朴素贝叶斯

4.bagging 和boosting的区别是什么

bagging的思想就是分别训练多个没有相关性的基分类器,每个基分类器在训练的时候,需要从样本集合有又放回的选择部分样本作为训练集。训练完成以后通过,多数表决(分类问题)、简单平均(回归问题),的得到最后的结果。

bagging的最大优点是可以并行化。

bagging的典型代表就是随机森林。

而boosting是一个串行的过程,下一个基学习器要基于上一个基学习器的结果来进行学习,从而一步一步的逼近真实的结果。

5.排序算法都有什么?当一个数据特别乱序的时候使用哪个排序算法更好一些

堆排序,最坏O(nlogn),虽然归并也可以O(nlogn),但是堆的空间复杂度为O(1)所以更好一些

6.你论文都怎么搜索的,如何保证质量?如何保证搜索结果是完整的?

Web of science、百度、谷歌,讲了用ccf和Jcr分区来保证论文基本质量,通过摘要Intruction的后两段还有Conclusion来初步判断论文讲的什么之类的。

7.面向对象 多态  继承 的关系

这个说的不好,有兴趣自己看就行

8.面对大数据量的推荐应该如何实现

算法上面,SVD降维,聚类

结构上面,分布式文件管理系统

分布式计算框架(Hadoop、MapReduce等)

并行计算

9.说说协同过滤是怎么回事

说了基于用户和基于物品的协同过滤及原理

10.你常用的推荐算法都有什么

基于内容与协同过滤(评分推荐的话主要用矩阵分解)

11.集成学习为什么要用简单的基学习器,不用一个复杂一点的学习器

为了防止过拟合啊

12.非线性的数据,可以使用什么分类器进行分类

总结一下,这个公司其实还有二面,但是二面由于没有什么有价值的内容所以就不写了,只问了一下随机森林的原理


2018年3月21日

好未来一面

视频面试好卡2333333,小哥主要是做NLP的,和我方向不是很对口,所以其实东西问的不是很多

项目,把隐式反馈和显式反馈结合的用户兴趣计算方法(我感觉小哥听得有点蒙,毕竟不是做推荐的)

1.用过什么语言,用没用过R,语言都干什么用的

Python,Java。新闻推荐系统用Java写的,机器学习模型什么的用Python跑的。

2.朴素贝叶斯原理

说了贝叶斯公式、属性独立性假设,以及贝叶斯的优缺点

3.TF-IDF原理

这个简单。不说了

4.性能评价指标,准确率召回率是怎么回事,二分类 和多分类的评价方法

准确率召回率。。不解释。忘了提Roc曲线和Auc面积

5.除了推荐方面的东西,你还做过一些别的事情么

说了自己练习的工资分类,take home test的电商诈骗检测

6.用过scikit-learn numpy么(pandas还有其他的没用过)

用过scikit-learn numpy没用过pandas

7.LDA你是怎么用的,LDA的表现如何,主题分的效果好不好

改的别人的代码,表现还好,但是运行效率很差。最后的主题分析效果还行,但是由于新闻量和主题定义的数量不够多,导致有些主题划分的不够纯粹和细致。

8.你觉得基于内容的方法和协同过滤有什么不同

谈了协同过滤的冷启动和原因,基于内容的优缺点(准确,但无法发现用户的新兴趣)

9.还有就是一些基本情况了,用没用过数据库啊之类的,数据库用的怎么样sql会不会

小哥大概的意思是把我的简历踢到推荐相关的部门去了

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,921评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,635评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,393评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,836评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,833评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,685评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,043评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,694评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,671评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,670评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,779评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,424评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,027评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,984评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,214评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,108评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,517评论 2 343

推荐阅读更多精彩内容