1.MapReduce谈谈你们的理解
2.Map是什么
3.Reduce是什么
4.shuffle谈谈你们的理解
5.wordcount那副图,脑子是否有印象?
6.输入分片一般和什么有关?多少个分片就可以有多少个map task,对不对?
7.mapreduce架构设计中应用程序AM和task都运行在哪个抽象概念中?
8.假如hdfs的文件都是小文件,那么就会有多个map task,我们生产上一般设计时,是需要合并的或者设计我们文件存储时尽量保持一个文件在一个块大小(了解题),如何合并 等高级班若泽讲,这也是线下生产项目课程的一个知识点
9.NM节点的内存和容器的内存参数哪几个?
10.容器是使用物理core还是虚拟core
11.总结一下:
mapreduce架构设计
wordcount博客
容器的概念,内存和vcore的参数设置