ClickHouse SQL 语法极简教程 ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。 在传统的行式数...
收录了10篇文章 · 4人关注
ClickHouse SQL 语法极简教程 ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。 在传统的行式数...
何为数仓DW Data warehouse(可简写为DW或者DWH)数据仓库,是在数据库已经大量存在的情况下,它是一整套包括了etl、调度、建模...
YARN Yarn产生背景 Yarn直接来自于MR1.0. MR1.0 问题:采用的是master slave结构,master是JobTrac...
Hadoop vs Spark Big Data Architecture https://www.youtube.com/watch?v=xD...
Spark 并行计算框架简介 大规模数据处理 类Hadoop MapReduce的通用并行框架. 分布式计算引擎 何谓计算引擎,一言以蔽之,就是...
HBase 对比 Redis https://db-engines.com/en/system/HBase%3BRedis[https://db...
1. 什么是 RDD RDD 是一个弹性的分布式的数据集,是 Spark 中最基础的抽象。它表示了一个可以并行操作的、不可变得、被分区了的元素集...
Spark Architecture Let's have a look at Apache Spark architecture, inclu...
智能五大技术方向 知识工程 面向垂直行业,结合专家知识、多源异构的碎片化知识和组织智能,引领从大数据分析到大知识工程进而大智慧系统的研发和落地应...
专题公告
大数据技术