唯品会
一面
-
hive的join执行过程?
之前看过也做过笔记,但是答得不好。http://www.jianshu.com/p/09e3a8f75492
-
hive中为什么要使用bucket?
-
Spark的shuffle阶段怎么做的?
感觉有必要再看一下hadoop的过程和spark的过程,不是只停留在使用的层次,http://blog.csdn.net/zhumr/article/details/52540994
-
spark join出现数据倾斜怎么做?
spark partition 怎么实现的?
spark cogroup怎么用,原理。
java onepair做什么用的?(貌似是这个问题,没见过,一脸懵逼)
二面
- 介绍项目
- java map concurrenthashmap;包括扩容等
- java 线程池
- lock volite syc
- java 内存模型
- hive 优化
- 实时处理的了解
三面
- hr面,没什么说的,聊聊薪资什么的?
- 怎么学习?offer怎么选
- 觉得一个实时开发工程师具备的素养是什么
- 自己的优缺点
小米
面试官给人最糟糕体验,不想多说,一生黑。
只记录一下问题。
- 任务调度依赖怎么配置?
- 简单介绍些spring,用过么?
- 写spark mr 什么的有过优化么?
- 一棵二叉树秋两个节点的公共父节点。
- 一个大数据下求topk
- 一个数组求连续递增序列最大长度
- 一个数组求连续递增再连续递减的最大长度
- 一个数组两个值相加等于k的所有组合