Hive | 绪

hive构建在hadoop上的数据仓库平台,为数据仓库管理提供了许多功能
定义了一种类SQL语言HiveQL,除了不支持更新、索引和事务,几乎SQL的其它特征都能支持

hive适用环境

hive不能提供排序和查询cache功能,也不提供在线事务处理,不提供实时查询和记录级的更新
hive能很好地处理不变的大规模数据集上批量任务
hive具有很好的可扩展性(基于Hadoop平台)和延展性(结合MapReduce和用户自定义的函数库)
hive拥有良好的容错性和低约束的数据输入格式

hive组成

  • 用户接口:Hive shellthrift客户端,web
  • Thrift服务器
  • 元数据库:DerbyMysql
  • 解析器:包括解释器、编译器、优化器和执行器,查询计划由MapReduce调用执行
  • Hadoop:数据仓库和查询计划存储在HDFS上,计算过程由MapReduce执行
hive组成
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容