1 数据仓库的概念?和数据库的区别?
2 hdfs上传文件有哪几种方式?
3 Hive的优化问题?
4 Hive的数据倾斜问题?
5 数据分析?概念和总结
6 Django源码?
7 python的浅拷贝和深拷贝?
总结:
HDFS基本命令总结
Hive基本命令总结
HBase基本命令总结
Hive优化问题?
HBase优化问题?
出现的问题:
大数据开发没有理论支撑,应该可以涉及多一点的应用方面;
其次引导面试官提问MapReduce;
在问关于项目的时候可以进一步突出培训模块的内容和热点问题以及Kafka的问题;