IP属地:广东
spark1.4.1 启动过程 今天稍微没那么忙了,趁着这个时间,准备把spark的启动过程总结一下(),分享给大家。现在使用的spark1.4...
介绍 首先,它是一个文件系统,有一个统一的命名空间——目录树 其次,它是分布式的,由很多服务器联合起来实现功能; 1.hdfs文件系统会给客户端...
1. createStream会使用 Receiver;而createDirectStream不会,数据会通过driver接收。 2.creat...
0、注意安装时需要给server免密ssh登陆所有机器的权限 需要用到的命令:ssh -p 端口号 用户@ip scp -P 端口号 文件名...
架构简介 BlockManager 是一个嵌入在 spark 中的 key-value型分布式存储系统,是为 spark 量身打造的,Block...
# 简介 shuffle 是spark 计算核心的的部分之一,很多优化也是基于shuffle来做,所以了解它也是必要的。stage按照是否是宽依...
druid被设计成一个系统组合,每个系统都有不同的角色,一起构成一个工作系统。 结构图
概念 druid是基于olap的数据库查询系统。有点类似现在开源的kylin。下面我先简单介绍druid的一下基本概念,一些我认为需要重点展开和...