Common : 一系列 组件和接口,用于分布式文件系统和通用I/O(序列化,java RPC和持久化数据结构)
Avro : 一种序列化系统,用于支持高效,快语言的RPC和持久化数据存储
MapReduce : 分布式数据处理模型和执行华景,运行于大型商用机集群
HDFS : 分布式文件系统,云星宇大型商用机集群
Pig:数据流语言和运行环境,用于探究非常庞大的数据集.Pig运行在MapReduce和HDFS集群上
Hive: 一种分布式的,按列存储的数据仓库.Hive管理HDFS中存储的数据,并提供基于SQL的查询语言用于查询数据
HBase:一种分布式.按列存储的数据库.HBase使用HDFS作为底层存储,同事支持MapReduce的批量式计算和点查询
zookeeper : 一种分布式,可用性高的协调服务.zookeeper提供分布式锁之类的基本服务用于构建分布式应用
Sqoop : 该工具用于结构化数据存储和HDFS之间高效批量传输数据
Oozie : 该服务用于运行和调度Hadoop作业
Hadoop项目基本
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
推荐阅读更多精彩内容
- //一共81个,开源大数据处理工具汇总(上) | 36大数据http://www.36dsj.com/archiv...
- e> Hadoop大数据平台架构与实践--基础篇 目录 内容概要Hadoop前生Hadoop的功能与优势Hadoo...
- 引用:http://www.jianshu.com/p/575b912a4781 Hadoop、HBase、Hiv...