前面干货,后面废话。
1. 百度
- 2个有序数组取中位数
https://leetcode.com/problems/median-of-two-sorted-arrays/ - 建模预测,通过调整服务器更换组件策略,达到利益最大化(成本越低越好)
- 数据库:设计用户表。存储登陆信息,存储拓展信息,怎么实现第三方登陆的设计,表过大怎么扩展
- linux:awk,top,cat
- 1T数据,取最大10个数,分布式计算,hash分块
- 介绍决策树id3,c4.5,cart,随机森林,GBDT
- LR正则项
- SVM推导,核函数,松弛变量
- 协同过滤矩阵,推荐方法简述
2. 360
- LR更新权值的公式
- 批量梯度下降,随机梯度下降,mini批量梯度下降
- n边形的图形内交点个数
- 实现memcyp
- 二叉树中序遍历转链表
- 读过的数学书,编程书,机器学习书
3. 搜狗
- 翻转链表
- 顺时针输出矩阵
- n sum
https://leetcode.com/problems/combination-sum/ - 无序数组,大小相邻的最大间隔
例如2,11,8,9,15。相邻最大的是2和8,相差6
4. 亚马逊
- 翻转链表
- 一亿个数里找最大100个
- 建模分析仓库单位面积的效益,来做出进出货物的策略
5. 蘑菇街
- SVM分类器的输入输出
- SVM如何实现多分类,原理,分类器数量
- SVM优化的数学原理
- 文档词频矩阵构成
6. 京东(电面)
- 协同过滤矩阵的行列的代表意义
- 如何根据矩阵进行推荐
- 如何LDA打标签进行行为挖掘
- SVM分类参数意义
- 文本分类流程
7. 今日头条
- 字符串反转,就转单词顺序呢个,要求空间复杂度为1
- 大顶堆插入操作,大顶堆写递归的会改成循环
- 逻辑回归推导
- kmeans讲原理
- lda概率图模型,参数意义
8. 百度(nlp)
- 贝叶斯公式
- 信息熵度量2篇文章
- svm推导,高维映射,松弛变量
- lda概率图
- lr公式推导
- 有监督与无监督
- 搜索排名参考什么(词项,分类,主题,query分析,PageRank这些都是我猜的)
- 有环图搜索
- c++传引用传值,内存对齐,静态变量,对应的python相关问题表达
9. 滴滴-地图策略
- 协同过滤推荐的过程
- PageRank为什么会收敛
- SVM推导,仅线性硬间隔
- 二分
- 计算字符串索引。字符全排列,取字典序的位置索引。例如abcd这个字符串,aaaa对应索引为0,aaab对应为1.
10. 腾讯
- 二分查找,递归&循环
- 冒泡排序
- SVM与贝叶斯对于文本的区别,为什么有区别
- Kmeans和LDA区别
- L1和L2区别
- 自己主动推了一下的SVM的pegasos
- 项目相关问了些LDA,PageRank相关的概念,原理,使用场景
后面是废话
- 面了这么多有点伤,折腾不动了
- 可以搞定机器学习的数学原理,但是数学问题再深挖就要蒙蔽,后面计划好好学数学
- 回归预测系列算法,由于简历原因基本没被问过,集中于LR,GBDT吧