8b4160d62bed - 简书

发简信

8b4160d62bed

2
关注
0
粉丝
0
文章
0

字数
0

收获喜欢

IP属地：北京

8b4160d62bed

两棵橘树
写了 25865 字，被 199 人关注，获得了 249 个喜欢

gaohangwang@gmail.com
8b4160d62bed

KUDU 介绍
前言近两年，KUDU 在大数据平台的应用越来越广泛。在阿里、小米、网易等公司的大数据架构中，KUDU 都有着不可替代的地位。本文通过分析 KUDU 的设计，试图解释为什么...

两棵橘树
100410 4 60

8b4160d62bed

Kafka 中使用 Avro 序列化组件(三)：Confluent Schema Registry
1. schema 注册表无论是使用传统的Avro API自定义序列化类和反序列化类还是使用Twitter的Bijection类库实现Avro的序列化与反序列化，这两种方法...

CoderJed
19596 2 10
8b4160d62bed

CoderJed
写了 231118 字，被 1243 人关注，获得了 863 个喜欢
8b4160d62bed

Kafka的分区数和消费者个数
Kafka的分区数是不是越多越好？分区多的优点 kafka使用分区将topic的消息打散到多个分区分布保存在不同的broker上，实现了producer和consumer消...

tenlee
68920 9 26
8b4160d62bed

Kafka权限管理
一、概述 1、Kafka的权限分类 1）、身份认证（Authentication）：对client 与服务器的连接进行身份认证，brokers和zookeeper之间的连接进...

一岁小宝
13524 2 10
8b4160d62bed

Cloudera Manager(简称CM)+CDH构建大数据平台
一、Cloudera Manager介绍 Cloudera Manager(简称CM)是Cloudera公司开发的一款大数据集群安装部署利器，这款利器具有集群自动化安...

mantch
39220 1 21

8b4160d62bed

如何给老婆解释什么是RPC
一个阳光明媚的早晨，老婆又在翻看我订阅的技术杂志。 “老公，什么是RPC呀，为什么你们程序员那么多黑话！”，老婆还是一如既往的好奇。“RPC，就是Remote Procedu...

柳树之
243544 106 1131 2
8b4160d62bed

什么是 RDD ？
Spark 中最基本的数据抽象是 RDD。 RDD：弹性分布式数据集 (Resilient Distributed DataSet)。 1，RDD 有三个基本特性这三个特性...

stone_zhu
46352 1 20
8b4160d62bed

什么是序列化？
-序列化是为了保持对象在内存中的状态，并且可以把保存的对象状态再读出来。 1、什么时候需要用到序列化？a、数据持久化：比如一个电商平台，有数万个用户并发访问的时候会产生数万个...

被驯服的大笨象
13876 0 4
8b4160d62bed

暂无个人介绍