科大讯飞,NLP算法工程师
一面,电话
- 讲下论文,问细节
- 开放场景,一个就是微博信息部分信息缺失,怎么补全?
- 给一段话,怎么判断是乱码还是正常输入,提示n-gram语言模型
12-17 百度面试,百度智能云AI应用部,NLP算法工程师
一面
- cdssm原理、和dssm区别
- 逻辑回归推导
- 决策树、剪枝
- 过拟合的起因及解决方法,droupout原理
- 信息增益熵、交叉熵
- 评价指标:precision、recall、f1(调和平均数)、AOC、ROC
- 随机梯度下降(随机什么意思)、牛顿法、拟牛顿法
- 训练如何优化
- 激活函数几种形式
- 正则(L1,L2)手推公式
- 分类聚类的基本算法(如KNN和K-means)
- 深度学习的任务都有哪些?如分类、聚类、分割
- 降维:PCA...
- AlexNet, LeNet, VGG, ResNet区别
- 概率题:A和B抛硬币,谁先抛到正面谁赢,A先抛,求他赢得概率?
手撕代码环节- 手写快排,时间空间复杂度
- 两队小朋友,都是有序的,将其合并
二面
- 论文:softmax loss和KL loss形式,softmax如何将概率归一化到【0,1】区间两种有何区别
- 项目:反向翻译怎么做的,为什么添加3分类数据就对效果有提升?客服项目展示;cdssm模型原理,为何可以用来做敏感词的识别,相似度的度量方法有哪些?
手撕环节- 给一个26个字母的列表,一行python代码建词典
- 0-1背包问题
12-18 便利蜂 策略算法工程师
一面,现场
- 先讲下项目,有几种情感,怎么做的,word2vec怎么做的,反向翻译怎么做的,数据量多大,每一维的向量代表什么?都修改哪些参数?
- cdssm模型原理,衡量向量相似度方法,为什么用cosine不用其他?词法分析API指什么?
- 传统机器学习算法有哪些?深度学习比传统方法好在哪里?
- 讲下论文,cnn的基本结构
手撕代码环节- 判断有向图和无向图是否有环
- TOP K
- 快排