Kafka_读写流程

kafka集群

image.png
image.png

生产者和kafka集群之间的流程

image.png

1.生产者将数据封装到ProducerRecord中,将ProducerRecord放到一个批次batch中,当该batch达到一定大小,或者一定时间,提交写入请求
2.生产者根据分区规则确定该分区的编号,根据zk保存的元数据,确定该分区leader副本 所在的broker节点的地址
3.将数据写入leader副本所在机器的页缓存(pagecache)中,操作系统级别
4.操作系统后台将数据从页缓存中flush到磁盘segment片段的xxx.log文件中,顺序写入
5.该分区的其他follower副本跟leader副本同步数据

问题 kafak为何写入数据这么快
1.用户写入数据的时候,以batch批次形式写入,减少了连接时间
2.写入数据到pagecache页缓存中
3.flush到sgement中 000.log中是顺序写入
页缓存+顺序写入

kafka为何读数据这么快
1.先内存中读数据 pagecahche + 零拷贝
2.再.读取日志文件 index稀疏索引机制+顺序读

kafak为什么读数据这么快

消费者跟kakfa集群之间的关系


image.png

1.消费者访问zk的元数据,根据topic,partition,offset确定数据所在的broker节点地址
2.然后到该节broker中leader副本的pagecache页缓存中通zero copy 零拷贝机制读取数据
3.如果页缓存中没有,就到磁盘segment中读取,根据offset的范围确定segment,然后查询xxxx.index 稀疏索引 到xxxx.log文件中定位数据.

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 前言 本文将介绍kafka的一条消息的发送流程,从消息的发送到服务端的存储。上文说到kafak分为客户端与服务端,...
    挪威的senlin阅读 4,157评论 0 1
  • 一、消息队列 1. 消息队列的介绍 消息(Message)是指在应用之间传送的数据,消息可以非常简单,比如只包含文...
    米斯特白阅读 819评论 0 0
  • 架构 Client生产发送流程Server:kafka 网络架构kafka 数据存储kafka 副本同步kafka...
    fat32jin阅读 401评论 0 0
  • 本文是对Kafka的一个学习总结,共包括如下内容: 概述 基本结构 重要概念 快速起步 Java API 参考资料...
    我是老薛阅读 1,327评论 0 4
  • kafka笔记 一、kafak简介 1、消息队列 消息队列:用于存放消息的组件 程序员可以将消息放入到队列中,也可...
    KS保阅读 2,593评论 0 0