一、 Q&A Q1:什么是维度?维就可以相当于角度,当说按什么维度看数据就是你想从什么角度分析数据。Q2:什么是次留用户,7日留存?次留用户指的...
此篇内容:hive自定义函数UDF、UDTF,压缩存储方式,hive优化、hive实际编程基本涵盖了hive基础及常用场景,输出这篇单纯是为了忘...
更多精彩好文首发,尽在公众号《大数据阶梯之路》我是Akin,给大家整理了一些hive函数的高级用法,作为Hive进阶系列文章第四篇,其中有些SQ...
更多精彩好文,尽在微信公众号《大数据阶梯之路》 一、数据仓库工程师是什么 首先,我要声明一点,数仓工程师不能有一个惯性思维,那便是把自己当成一个...
肝了几个晚上,梳理总结了一份万字长文超详述hive企业级优化文章,也整理了一份hive优化总结思维导图和hive优化详细PDF文档,有需要可关注...
更多精彩好文,尽在微信公众号《大数据阶梯之路》 一、数据湖是什么 数据湖相当于一个汇集着来自各个异构数据源的原生态数据,不经过加工清洗数据,数据...
更多精彩好文,尽在微信公众号《大数据阶梯之路》 一、前言 大家好,我是Akin,考虑写下这篇文章的时候我已在互联网大数据领域工作了几年,主要是给...
一、前言 hive优化除了有hql语句逻辑优化,hql参数调优等等,还有一个不起眼的细节容易被忽视掉,那便是hive数仓模型表的存储格式和压缩方...
大家好,本篇聊一下数仓建设,讲一下面试常遇到的主题域与主题划分,更多精彩文章优先从微信公众号《大数据阶梯之路》首发,欢迎关注,公众号回复:大数据...