我还不够强 - 简书

IP属地：辽宁

Hive优化：map join
如果不指定MapJoin符合或者不符合MapJoin的条件，那么Hive解析器会将Join操作转换成Common Join，即：

311 0 0
kylin的入门使用
我们kylin环境安装成功之后，我们就可以在hive当中创建数据库以及数据库表，然后通过kylin来实现数据的查询第一步：创建hive数据库以...

701 0 1

Kylin的环境安装
1）官网地址 http://kylin.apache.org/cn/ 2）官方文档 http://kylin.apache.org/cn/doc...

191 0 1
Kylin前置基础知识了解
1、数据仓库、OLAP 与 BI 数据仓库数据仓库，英文名称 Data Warehouse，简称 DW。《数据仓库》一书中的定义为：数据仓库...

301 0 1
使用kylin来分析我们Hbase当中的数据
前面我们已经通过flink将数据介入到了hbase当中去了，那么我们接下来就可以通过hive整合hbase，将hbase当中的数据映射到hive...

1638 0 1
Linux命令总结1
大数据技术之linux第一章：linux系统简介与安装部署1.1发展背景 Linux 内核最初只是由芬兰人林纳斯•托瓦兹（Linus Torva...

1990 0 1
flink的广播变量，累加器，计数器以及分布式缓存
1、广播变量广播变量主要分为两种方式：dataStream当中的广播变量以及dataSet当中的广播变量，这两个地方的广播变量还有一定的不一样的...

1580 0 1

Flink批量处理之DataSet
flink不仅可以支持实时流式处理，它也可以支持批量处理，其中批量处理也可以看作是实时处理的一个特殊情况 1、 dataSet的内置数据源基于...

5688 0 1
Flink的DataStream集成kafka
对于实时处理当中，我们实际工作当中的数据源一般都是使用kafka，所以我们一起来看看如何通过Flink来集成kafka flink提供了一个特有...

0.2 1603 0 2