大数据相关 - 文集

大数据相关

13篇文章 · 25135字 · 2人关注

互联网数据指标名词一览
作为互联网从业人员，目前看来对数据指标、指标的运用还是需要再深入学习下。一、常见指标先来看一看常见的一些数据指标们 1、DAU：Daily ...

0.1 2150 0 3
Apache Calcite原理极简入门
Apache Calcite 是独立于存储与执行的SQL解析、优化引擎，广泛应用于各种离线、搜索、实时查询引擎，如Drill、Hive、Kyli...

0.3 1816 0 3

脏数据以及用箱形图分析异常值
本文仅为笔者平日学习记录之用，侵删原文：https://mp.weixin.qq.com/s/c6L_ign_vPD0crJ8FG-VuQ 导读...

0.1 583 0 2
Nginx日志采集工具：filebeat、logstash、rsyslog
本文仅供笔者平日自学记录之用，侵删原文：https://mp.weixin.qq.com/s/cqmsnjIwZ5b0s7VyHlKFkg 大数...

459 0 0
数据倾斜（四）：Hive是如何解决数据倾斜的
六、Hive解决数据倾斜具体方法 6.1 场景 6.1.1 group by 注：group by 优于distinct group情形：gro...

4603 0 0
数据倾斜（三）：MR是如何解决数据倾斜的
五、MR解决数据倾斜具体方法 5.1 大量相同key没有combine就传到Reducer combiner函数思想：提前在map进行comb...

1149 0 0
数据倾斜（二）：数据倾斜原理及解决思路
三、数据倾斜的原理 3.1 数据倾斜产生原因概述我们以Spark和Hive的使用场景为例。他们在做数据运算的时候会涉及到，count dis...

1319 0 0

数据倾斜（一）：数据倾斜及具体场景
一、什么是数据倾斜简单的讲，数据倾斜就是我们在计算数据的时候，数据的分散度不够，导致大量的数据集中到了集群中的一台或者几台机器上计算，而集群中...

0.2 2557 0 3
数据倾斜（五）：Spark是如何解决数据倾斜的
Spark数据倾斜表现 Spark数据倾斜原理 Spark数据倾斜例子 Spark数据倾斜解决方案七、Spark解决数据倾斜具体方法 7.1 ...

310 0 1