相信现在很多做IT行业的多多少少都了解或者听说过大数据这个越来越火的名词,也有很多人想往大数据这边发展。 但是接触了就会发现其实大数据很广泛,相信大家都一样,刚刚接触大数据的时候完全一头雾水,不知道该往那方面发展,怎么开始进军大数据这个行业?
Hadoop基础
1、分布式储存基石:HDFS
2、分布式计算基础:MapReduce
3、Hadoop集群资源管家:YARN
离线数据处理
1、离线日志收集利器:Flume
2、离线批处理必备工具:Hive
3、速度更快的Hive:Impala
4、更快更强更好用的MR:Spark
实时数据处理
1、流数据集成神器:kafka
2、实时计算引擎:spark streaming
3、海量数据高速存取数据库:HBase
ETL与环境相关
1、ELT神器:Sqooq,Kettle
2、任务调度双量:Oozie,Azkaaban
当真正开始学习的时候难免不知道从哪入手,学习时频繁踩坑,导致效率低下影响继续学习的信心,最终浪费大量时间。
为了让学习变得轻松、高效!今天给大家免费分享一套教学资源!