Hive必知必会

这是Hive知识点的一个大纲,后续会不断地更新完善,做到对Hive相关知识点有一个比较全面的总结归纳,争取2020年7月之前完成

环境搭建

  1. Hive集群环境搭建
  2. Hive源码阅读环境

Hive架构

  • Hive整体架构
  • Hive存储格式
  • Hive数据类型
  • 执行引擎

DDL

  • DDL-数据库操作
  • DDL-内部表&外部表
  • DDL-分区表&分桶表

DML

  • DML-数据导入、导出、Update、Delete、Merge

DQL

  • select ... from
  • where
  • group by ... having ...
  • join
  • order by、sort by、distribute by
  • 窗口函数

UDF

  • UDF 和 GenericUDF
  • UDAF 和 UDTF

优化

  • 执行计划
  • map-side join
  • 大表join
  • 数据倾斜

参考资料

  1. 官网:https://cwiki.apache.org/confluence/display/Hive/Home
  2. 一起学hive:http://lxw1234.com/archives/2015/06/238.htm
  3. Hive必知必会:https://zhuanlan.zhihu.com/p/66705332
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • Hive总结 一、Hive架构 1.架构图 2.Hive架构解析 1)用户接口 CLI:cli即shell命令。C...
    农民2019阅读 5,057评论 0 1
  • 一. 什么是hive hive是基于Hadoop的一个[数据仓库]工具,可以将结构化的数据文件映射为一张数据库表,...
    zianL阅读 4,019评论 0 0
  • hive.ddl.output.format:hive的ddl语句的输出格式,默认是text,纯文本,还有json...
    博弈史密斯阅读 6,041评论 0 6
  • 2017年11月3日课后作业 Hive 第三天 [toc] 第二天内容回顾 Hive帮助文档的地址 https:/...
    Albert陈凯阅读 2,755评论 0 0
  • 朋友当你看到这篇文章时,你可能和我之前一样想要成为一个自律的人,下面就来介绍下我是如何用28天的时间养成一个自...
    峰彬阅读 3,043评论 1 7

友情链接更多精彩内容