Common : 一系列 组件和接口,用于分布式文件系统和通用I/O(序列化,java RPC和持久化数据结构)
Avro : 一种序列化系统,用于支持高效,快语言的RPC和持久化数据存储
MapReduce : 分布式数据处理模型和执行华景,运行于大型商用机集群
HDFS : 分布式文件系统,云星宇大型商用机集群
Pig:数据流语言和运行环境,用于探究非常庞大的数据集.Pig运行在MapReduce和HDFS集群上
Hive: 一种分布式的,按列存储的数据仓库.Hive管理HDFS中存储的数据,并提供基于SQL的查询语言用于查询数据
HBase:一种分布式.按列存储的数据库.HBase使用HDFS作为底层存储,同事支持MapReduce的批量式计算和点查询
zookeeper : 一种分布式,可用性高的协调服务.zookeeper提供分布式锁之类的基本服务用于构建分布式应用
Sqoop : 该工具用于结构化数据存储和HDFS之间高效批量传输数据
Oozie : 该服务用于运行和调度Hadoop作业
Hadoop项目基本
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- //一共81个,开源大数据处理工具汇总(上) | 36大数据http://www.36dsj.com/archiv...
- e> Hadoop大数据平台架构与实践--基础篇 目录 内容概要Hadoop前生Hadoop的功能与优势Hadoo...
- 引用:http://www.jianshu.com/p/575b912a4781 Hadoop、HBase、Hiv...