【原创】第零篇大数据学习介绍

大数据相关技术学习和使用了一段时间,最近就没有怎么用了。打算把之前学习的知识总结并记录起来分享给大家,防止忘记了,那就浪费了花费的那么时间和精力了。本系列全部采用hadoop2.5.2的版本,下面大概介绍一下打算写的内容大纲:

如何安装和搭建虚拟机网络
hadoop2.5.2的伪分布式搭建
hadoop2.5.2+centos6.5编译源码
HDFS的讲解
Hadoop 2.5.2分布式环境部署
Zookeeper分布式集群部署
Hadoop 2.x高可用性部署
MapReduce详解1
MapReduce详解2
hive的功能介绍,安装和测试
hive 中UDF编程
Hive 表的创建、数据加载、导出、查询
Hive日志分析
Sqoop 导入导出数据
Flume实时抽取监控目录数据
大数据可视化工具Hue安装使用
Oozie工作流的安装及使用
Spark 功能、编译及安装部署测试
Spark SQL
Spark streaming
Hbase集群部署及测试

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容