Kafka Producer源码

Kafka Producer

Kafka Producer 是 kafka 提供的与 Kafka Broker 连接的客户端工具，其具备高吞吐量、高性能等特性。

Kafka Producer 核心组件

KafkaProducer：Kafka Producer 操作对象
ProducerConfig：Kafka Producer 配置类
ProducerMetadata：Kakfa Producer 客户端元信息
ProducerInterceptors：Kafka Producer 拦截器
Partitioner：分区选择器
- DefaultPartitioner：默认分区选择器
- RoundRobinPartitioner：轮训分区选择器
- UniformStickyPartitioner：随机分区选择器
KeySerializer：ProducerRecord Key 序列化
ValueSerializer：ProducerRecord Value 序列化
RecordAccumulator：消息缓冲队列
Metadata：Kafka Topic 元数据
Sender：Kafka Sender，主要负责与 Kafka Broker 业务逻辑交互的组件
- KafkaClient：Kafka Producer 与 Node 通信的接口
  - NetworkClient：提供异步的 Request/Response 的 IO 通信组件
Metrics：Kafka Producer Metric 指标收集组件
ProducerBatch：带发送的的一个组合对象
- TopicPartition：Topic、Partition 信息
- MemoryReocrdBuilder：Record 内存建造对象
Cluster：集群元数据

KafkaProducer 消息发送过程

send(ProducerRecord<K,V> record) | send(ProducerRecord(K,V) record,Callback callback)：Kafka 消息发送API

通过 interceptors 将 record 装饰成 interceptedRecord

doSend(ProducerRecord(K,V) record,Callback callback)

doSend(ProducerRecord(K,V) record,Callback callback)

waitOnMetadata(String Topic, Integer Partition, long nowMs, long maxWaitMs) = ClusterAndWaitTime：获取 Topic 对应的 Cluster 的元信息

通过 metadata.fetch() 获取 Cluster 集群元信息

通过 int lastVersion = cluster.partitionCountForTopic(topic) 获取 Topic 对应的 Partition 个数，如果已有缓存则直接返回 ClusterAndWaitTime；

否则，将 Topic 添加到 metadata 中，metadata.requestUpdateForTopic(topic) 更新需要 version 的版本号，然后 Sender.waitup() 唤醒 Sender 线程进行获取元信息

然后通过 metadata.awaitUpdate(int Version,long remainingWaitMs)，等待拉取元信息(其实现通过 Synchronized 的 wait(long waitMs) 方法)，通过乐观锁比较 updateVersion 和 lastVersion，如果 updateVersion 大于 laestVersion 则说明更新元信息成功，否则更新元信息失败；

然后再通过 Cluster cluster = metadata.fectch() 获取集群元信息，然后通过 cluster.partitionCountForTopic(topic) 获取 Topic 对应的 Partition 的个数

PS：waitOnMetadata() 是当前线程自旋获取 Topic 的元信息，除非执行时间大于 maxWaitMs 时间后抛出 TimeoutException，否则会一直轮训获取。

PS：ClusterAndWaitTime 包括了 Cluster 的 Partition 和 ISR 等；

通过 byte[] serializedKey，serializedValue = Serializer 序列化；Kafka 默认是 ByteArraySerializer。

partition(ProducerRecord record，byte[] serializedKey，byte[] serializedValue，Cluster cluster) -> int partiton：根据 ProducerRecord，serializedKey，serializedValue，Cluster 选择 Topic 对应的 Partition-Id

可根据ProducerConfig中指定的 Partitionor 策略或者在 KafkaProducer.send(ProducerRecord) 中指定PartitionId

根据 MagicVersion、CompressionType、SerializedKey，SerializedValue、Headers 计算整个请求字节大小(SerializedSize)

根据 ${max.request.size}、$ {buffer.memory} 校验 SerializedSize 是否大于配置，如果大于则抛出异常

将 Callback、Interceptors、TopicPartition 组合成 InterceptorCallback

通过 RecordAccumulator.append(TopicPartition，TimeStamp、SerializedKey，SerializedValue，Headers，InterceptorCallback，...) -> RecordAppendResult：方法追加入缓冲区，

返回 RecordAppendResult.future() -> Future<RecordMetadata>

Metadata 获取 Topic 元信息

Metadata 是 Kafka 元信息类，在 KafkaProducer 中，ProducerMetadata 是 Metadata 的实现。

KafkaProducer 在构造函数初始化时，new ProducerMetadata 赋予给 Metadata，然后通过 Metadata.bootstrap(List<InetSocketAddress> address) (PS：Metadata 会构建一个属性为 Empty 的 MetadataCache)。

KafkaProducer 通过 metadata.fetch() 获取 Cluster 集群信息。实际上是通过 MetadataCache 获取 Cluster 集群信息缓存。

KafkaProducer 将需要获取 Topic 的元信息添加到 metadata 集合，然后通过 cluster.partitionCountForTopic(Topic) 获取 Topic 对应的 Partition 分区个数。如果在 ProducerRecord 有指定 PartitionId，则判断 PartitionId 是否小于 Partition 分区个数并立刻返回 ClusterAndWaitTime，否则抛出异常。

通过 do...while 轮训获取 Topic 的元信息。

先将 Topic 添加到 Metadata，然后通过 metadata.requestUpdateForTopic() 返回当前拉取元信息的 LastVersion 版本号。

通过 sender.wakeup() 唤醒 Sender 线程，并通过 metadata.awaitUpdate(LastVersion, remainingWaitMs) 配合乐光锁拉取 Topic 的元信息

底层通过 Synchronized 的 wait(remainingWaitMs) 释放锁并等待 Sender 唤醒

返回封装最新的 Cluster 的 ClusterAndWaitTime

RecordAccumulator

类介绍

/**
 * This class acts as a queue that accumulates records into {@link MemoryRecords}
 * instances to be sent to the server.
 * <p>
 * The accumulator uses a bounded amount of memory and append calls will block when that memory is exhausted, unless
 * this behavior is explicitly disabled.
 */

RecordAccumulator 提供类似队列的数据结构，来存储 Accumualtor Record 数据
Accumualtor Record 的 ProducerBatch 是基于 MemoryRecords 存储在堆外内存的(NIO)
Accumualtor Record 是用于存储待 Sender 发送给 Broker 的缓冲队列
Accumualtor 通过累计方式来使用有限的内存存储，如果累计内存大于阈值则会阻塞(block)调用者，除非在配置中禁止此阻塞

RequestBatch

一个 RequestBatch 对应一块内存空间，batch.size 默认的大小为16kb，如果 ProducerRecord Size 大于 batch.size，则使用 ProducerRecord Size 的大小分配一块内存空间。如果小于 batch.size，则基于 batch.size 分配内存空间

ByteBuffer 组成

Kafka 消息实际上是二进制协议，严格遵循二进制的规范写入 buffer 里

offset | size | crc | magic | attibutes | timestamp | key size | key | value size | value

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,544评论 6赞 501
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,430评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,764评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,193评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,216评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,182评论 1赞 299
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,063评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,917评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,329评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,543评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,722评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,425评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,019评论 3赞 326
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,671评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,825评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,729评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,614评论 2赞 353

Kafka Producer源码

Kafka Producer源码

Kafka Producer

目录

Kafka Producer 核心组件

KafkaProducer 消息发送过程

Metadata 获取 Topic 元信息

RecordAccumulator

类介绍

RequestBatch

ByteBuffer 组成

推荐阅读更多精彩内容