kafka消息格式

  • kafka发送消息是有消息格式的,有三个版本V0,V1,V2
  1. V0版本:主要指kafka0.10.0.0之前的版本,是kafka最早的消息版本,其消息格式如下,一共7个字段:


    V0消息格式

    CRC:是整条消息的CRC32校验,占用4个字节,但是CRC校验值发送到broker端,可能消息格式会变,那么crc值也会变,等consumer消费了数据后,crc可能已经变化了几个版本了,所以这个crc值没有太大作用
    版本号:占一个字节,其实就是一个数字 0
    属性字段:存的是消息压缩格式,LZ4、Snappy、GZIP
    key长度字段:占4字节,如果不指定key,那么key为负一,但是空间占用还是4字节,这个是V0的缺陷
    key字段:真实的key
    value长度字段:占4字节
    value字段:真实的消息本身

V0版本有一个很大的缺陷,kafka在删除过期日志时,会根据底层日志段文件的最后修改时间来删除,如果本来过期的日志文件的更新时间变了(比如touch命令),那么kafka是不会删除的,这样就可能发生有些数据可能很久很久都不会被删除,还一个缺点是没有时间戳字段,现在很多计算引擎都会用到时间窗口,那么这个时间戳字段也是很重要的,不过在V1版本时加上了

  1. V1版本
  • 在kafka0.10.0.0后推出了V1版本
  • V1与V0有两个差别:
    1. V1引入了8字节的时间戳字段
    2. attribute字段增加了指定时间戳类型(create_time和log_append_time,前者是在producer手动指定时间戳,后者是broker自动生成时间戳),V0版本只指定了压缩类型


      V1消息格式
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容