Day69 Kafka 设计原理详解

可以实时处理大量数据，满足各种需求场景.

hadoop,hbase等.

装载到hadoop,数仓etl做离线分析和数据挖掘.

Screen Shot 2022-07-13 at 2.44.08 PM.png

消费者数量和消费分区有变化的时候。kafka会重新分配消息分区的关系，重启后分区又会归还给其他的消费者.

因为消费组无法送kafka消费消息，会对kafka的tps产生影响，比如有数百个那么rebalance会很耗时.

ISR && OSR
In Sync Replicas (所有与leader副本保持一定程度同步的副本在内组成ISR)
osd 和 leader副本同步情况滞后太多的副本组成osr.

正常情下: follower副本都应该与leader副本保持一定程度的同步.
offset偏移高低水位.

规定了一个段位的log文件最大为1g大小

一个segment可以有 index(稀疏索引，log消息体，timeindex(时间位移))

image.png

写入方式， push到Broker.
消息路由，根据分区算法选择存储到哪一个partition.

image.png

0 1 all 三种模式.

image.png

.index 根据这个定位offset(kafka的稀疏索引)
.log 消息存储文件，存放offset和消息体
(每次都会往分区发送4k的消息，记录一条当前消息的发送时间戳，对应的offset)
.timeindex 消息发送时间索引

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。