1、大数据特征
2、数据存储单位
3、数据挖掘服务,Porter为数据集成服务
4、HDFS适用范围
5、HDFS存储机制
6、HDFS副本存放策略
7、Hadoop2.0之后引入的资源协调器
8、RDD中的Stage
9、HBase分布式存储的基本单元
10、HMaster的作用
11、Hive建表时的文件存储格式
12、Hive SQL语言
13、Streaming相对于Spark Streaming的性能
14、Flink任务部署方案
15、HDFS多副本机制
16、Loader
17、Flume的Source
18、Flume基础架构组件
19、华为FusionInsight产品
20、HDFS的HA高可靠性
21、对Spark的描述
MapReduce 适用于大批量离线计算
22、YARN中的资源抽象
23、当今大数据面临的挑战
24、大数据特性
25、HDFS进入安全模式时的情况
26、HBase中Hlog日志
27、Yarn-Client
28、RDD算子