Librdkafka的基础数据结构 4 --- String和ByteArray

下面要介绍的数据类型都是在kafka protocol的序列化中使用的

  • Kafka Protocol String
  • Kafka Protocol ByteArray

Kafka Protocol String
  • 所在文件:src/rdkafka_proto.h
  • 表示kafka协议中的字符串,在协议的序列化中,先用2个字节表示字符串内容的长度,不包含结尾的\0, 紧随其后是字符串的内容: { uint16, data.. }
  • 定义如下,包含长度和指向实际字符内容的指针;
typedef struct rd_kafkap_str_s {
    /* convenience header (aligned access, host endian) */
    int         len; /* Kafka string length (-1=NULL, 0=empty, >0=string) */

    const char *str; /* points into data[] or other memory,
              * not NULL-terminated */
} rd_kafkap_str_t;

可以表示三种字符串格式:

  1. len = -1, 是一个null字符串,str = null;
  2. len = 0, 是一个空字符串, str = "";
  3. len > 0, 是一个长度 为len的字符串, 这个len不包含结尾的\0 ;
  • 获取Kafka String长度,根据rd_kafkap_str_t::len来判断
#define RD_KAFKAP_STR_LEN0(len) ((len) == RD_KAFKAP_STR_LEN_NULL ? 0 : (len))
#define RD_KAFKAP_STR_LEN(kstr) RD_KAFKAP_STR_LEN0((kstr)->len)
  • 获取Kafka String序列化后的长度,即在TCP发送协议中的长度:
/* Returns the actual size of a kafka protocol string representation. */
#define RD_KAFKAP_STR_SIZE0(len) (2 + RD_KAFKAP_STR_LEN0(len))
#define RD_KAFKAP_STR_SIZE(kstr) RD_KAFKAP_STR_SIZE0((kstr)->len)

上面的2字节用来放字串的长度

  • Kafka Protocol String的创建:不光要创建一个rd_kafkap_str_t对象,还要在其内存后紧挨着创建序列化所需要的内存空间,具体看下面代码里的注释
static RD_INLINE RD_UNUSED
rd_kafkap_str_t *rd_kafkap_str_new (const char *str, int len) {
    rd_kafkap_str_t *kstr;
    int16_t klen;

    if (!str)
        len = RD_KAFKAP_STR_LEN_NULL;
    else if (len == -1)
        len = str ? (int)strlen(str) : RD_KAFKAP_STR_LEN_NULL;

        //`rd_kafkap_str_t`结构体大小 + 2字节存放字符串长度 + 字符串实际长度 + 1字节的字符串结尾\0的长度
    kstr = rd_malloc(sizeof(*kstr) + 2 +
             (len == RD_KAFKAP_STR_LEN_NULL ? 0 : len + 1));
    kstr->len = len;

    /* 
           Serialised format: 16-bit string length 
           填充2字节的序列化后字符串长度
        */
    klen = htobe16(len);
    memcpy(kstr+1, &klen, 2);

    /* Serialised format: non null-terminated string */
    if (len == RD_KAFKAP_STR_LEN_NULL)
        kstr->str = NULL;
    else {
                // rd_kafkap_str_t::src指向实际的内存地址,copy实际字符串的内容
        kstr->str = ((const char *)(kstr+1))+2;
        memcpy((void *)kstr->str, str, len);
        ((char *)kstr->str)[len] = '\0';
    }

    return kstr;
}
Kafka Protocol Byte Array
  • 所在文件:src/rdkafka_proto.h
  • 与上在介结的String很相似,表示kafka协议中的字节娄组,在协议的序列化中,先用4个字节表示字节数组的内容的长度,紧随其后是其实际的内容: { uint32, data.. }
  • 定义如下:
typedef struct rd_kafkap_bytes_s {
    /* convenience header (aligned access, host endian) */
    int32_t     len;   /* Kafka bytes length (-1=NULL, 0=empty, >0=data) */
    const void *data;  /* points just past the struct, or other memory,
                * not NULL-terminated */
    const char _data[1]; /* Bytes following struct when new()ed */
} rd_kafkap_bytes_t;

可以表示三种byte数组:

  1. Kafka NULL bytes (bytes==NULL,len==0),
  2. Empty bytes (bytes!=NULL,len==0)
  3. 有实际数据 data (bytes!=NULL,len>0)
  • Kafka Byte Array的创建:
static RD_INLINE RD_UNUSED
rd_kafkap_bytes_t *rd_kafkap_bytes_new (const char *bytes, int32_t len) {
    rd_kafkap_bytes_t *kbytes;
    int32_t klen;

    if (!bytes && !len)
        len = RD_KAFKAP_BYTES_LEN_NULL;

        //`rd_kafkap_bytes_t`结构体大小 + 4字节存放byte array长度 + 内存实际长度
    kbytes = rd_malloc(sizeof(*kbytes) + 4 +
             (len == RD_KAFKAP_BYTES_LEN_NULL ? 0 : len));
    kbytes->len = len;

    klen = htobe32(len);
    memcpy(kbytes+1, &klen, 4);

    if (len == RD_KAFKAP_BYTES_LEN_NULL)
        kbytes->data = NULL;
    else {
        kbytes->data = ((const char *)(kbytes+1))+4;
                if (bytes)
                        memcpy((void *)kbytes->data, bytes, len);
    }

    return kbytes;
}

Librdkafka源码分析-Content Table

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,258评论 19 139
  • 1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语...
    子非鱼_t_阅读 31,839评论 18 399
  • Lua 5.1 参考手册 by Roberto Ierusalimschy, Luiz Henrique de F...
    苏黎九歌阅读 14,008评论 0 38
  • 在编写程序的过程中,不了避免的要用到字符串,所以String类的常用方法的用法是必须掌握的。学习一个类的使用方法最...
    Geg_Wuz阅读 1,339评论 0 4
  • (最近在看净界法师的《楞严经讲述》,这本书从成都文殊院拿来后,自己想起来的时候就翻一翻,因为书比较厚还是繁体字,所...
    哈帝阅读 3,065评论 0 0