Parquet调研报告 1. 概述 1.1 简介 Apache Parquet是Hadoop生态圈中一种新型列式存储格式,它可以兼容Hadoop...

收录了4篇文章 · 1人关注
Parquet调研报告 1. 概述 1.1 简介 Apache Parquet是Hadoop生态圈中一种新型列式存储格式,它可以兼容Hadoop...
我承认我标题党了。 相信凡是写过几行服务端代码的同学都会回答: "当然了解"。但是我这里讨论的不是join的语法,而是实现join的具体算法。其...
1. Hive基本介绍和基础: Facebook公司最早完成并开源了hive框架,可以将sql语句直接翻译成MapReduce程序。Hive是基...
“麒麟出没,必有祥瑞。”—— 中国古谚语 前言 随着移动互联网、物联网等技术的发展,近些年人类所积累的数据正在呈爆炸式的增长,大数据时代已经来临...
专题公告
关于SQL的各种用法和对于数据仓库的一些理解