240 发简信
IP属地:上海
  • 窗口函数

    窗口函数往往用在电商

  • 分桶表的创建

    关键字 clustered by (id)

  • hive多表查询

    多表连接时,hive总是按照从左到右的顺序执行的,当3个表连接时,如表a b c,a b的输出mapreduce job,和c进行连接。

  • 压缩方式,存储方式

    公司常用orc存储方式和snappy压缩方式 orc存储文件默认zlib压缩,而snappy的压缩效率比zlib高 具体实际项目,hive表数据...

个人介绍
穷则独善其身,达则兼济天下!