1、环境描述 jdk:jdk1.8.0_45 maven:3.3.9 hadoop:2.6.0-cdh5.14.0 其他:因为前期编译过hado...
该文章说的清晰明了,好文,赞一个! Apache Spark 统一内存管理模型详解 – 过往记忆
1、简介 RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象,它代表一个不...
spark简介: Spark学习之路 (一)Spark初识 - 扎心了,老铁 - 博客园 1、下载 地址:http://spark.apache...
1、broker 其实就是kafka的进程,代表kafka的一个节点 2、topic 其实就是对消息的分门别类进行存储,写的时候需要指定 3、生...
kafka运行需要zookeeper、scala2.11、jdk支撑 版本:kafka_2.11-0.10.0.1.tgz(2.11指的是sca...
hive的压缩本质上指的是MapReduce的压缩,因为hive其实就是MapReduce的高级语言版(SQL),hive SQL底层的运行也都...
原生API: package com.ruozedata.zookeeperimport org.apache.zookeeper.Watche...
hue的HA模式和非HA模式配置略有差别 安装: HUE安装及问题 - CSDN博客 hue 安装笔记 - CSDN博客 问题: 安装Hue后的...