秋招记录-一点资讯

上午面了一点资讯
一面:
1、问简历
2、防止过拟合的方法
3、DeepFm模型介绍一下
4、判断是否是回文链表
5、链表反转
6、spark任务运行中,发生了数据倾斜,这种情况下你一般如何处理

二面:
1、问简历
2、Dueling DQN和DQN有什么区别
3、快速排序

三面:
1、介绍下DeepFM
2、信息流采样,有n份数据,但是n的长度并不知道,设计一个采样算法,使得每份被选择的概率是相同的。

考虑这样是不是可以,总是以1/i的概率去选择每一次遍历的对象,比如从1,2,3,....,N, 每一次遍历到x时,总是以1/x的概率去选择它。
一开始选择第一个数据,并以概率1/2选择第二个数据,以1/3选择第三个数据,也就是说设结果为result,遍历第一个时result = 1,第二个以1/2的概率替让result = 2,这样一直遍历概率性的替换下去,最终的result就是你的结果。被选择的概率就是1/n。
第x个数被选择的概率 = x被选择的概率 * (x+1没被选择的概率) * (x+2没有被选择的概率) ......(N没有被选择的概率)
被选择的概率 = 1/2 * 2/3 * 3/4 * 4/5 .....* (n-1/n) 我想你知道答案了吧? 对! 是1/n.这样就可以在不知道N的大小的情况下等概率的去选择任意一个对象了!

3、判断两个链表中是否有相同节点
https://blog.csdn.net/Audience_/article/details/77648916

4、模型在线下评估和线上使用时,往往出现线上实际效果不如线下效果的情况,请分析可能的原因。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容