Hive

Hive:基于jdk hadoop 生态圈数据仓库工具,通过类SQL (HQL)将结构性行文件映射为一张数据库表,通过类sql来统计数据,转换为MR ,节省创建MR应用程序,实现快速统计查询。

hive 构建在基于静态批处理的hadoop ,提供数据存储,查询。hive 将ETL 转换为MR,在讲MR 转换到Hadoop提交作业,在hd监控作业返回信息。hive处理几百M数据需要分钟级别延迟,是用来做离线分析。主要用在日志分析。不具备实时性,以及联机事务处理(一个联机事务处理数据库典型的特点是,拥有大量的并发用户,这些用户积极地完成实时修改数据的任务)。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • Hive是什么 我们知道传统数据存储都是存储在关系型数据库中,它们使用一种SQL(结构化查询语言)方言来查询数据库...
    零度沸腾_yjz阅读 4,788评论 0 7
  • 介绍 Hive是运行在Hadoop之上的数据仓库,将结构化的数据文件映射为一张数据库表,提供简单类SQL查询语言,...
    syncwt阅读 10,158评论 0 7
  • 第一部分 什么是Hive: Hive是基于Hadoop之上的数据仓库,数据存放在HDFS上,它同样可以通过ETL来...
    wangmin阅读 6,172评论 0 12
  • “希望杯”5V5篮球赛男篮比赛我环资队今天以胜利完美收官!就像每个舞台剧最后谢幕,主角是最帅的一样,就像每次每个体...
    叫我陆太太太太可爱阅读 1,607评论 0 0
  • 成功的路上要耐得住寂寞,你如果无法从自己身上获得快乐,无法学会享受与自己独处的时间,你对由外界获取快乐的依赖将越来...
    3c610e103e36阅读 3,146评论 0 0

友情链接更多精彩内容