protobuf反射详解(c++)

本文主要介绍protobuf反射的功能,其中部分内容转载至https://blog.csdn.net/chary8088/article/details/52876674,repeated 内容为原创。

最初是起源于这样一个问题:
给定一个pb对象,如何自动遍历该对象的所有字段?

即是否有一个通用的方法可以遍历任意pb对象的所有字段,而不用关心具体对象类型。
使用场景上有很多:
比如json格式字符串的相互转换,或者bigtable里根据pb对象的字段自动写列名和对应的value。

例如定义了pb messge类型Person如下:

Person person;
person.set_name("yingshin");
person.set_age(21);

能否将该对象自动转化为json字符串{"name":"yingshin","age":21}?

答案就是pb的反射功能

我们的目标是提供这样两个接口:

//从给定的message对象序列化为固定格式的字符串
void serialize_message(const google::protobuf::Message& message, std::string* serialized_string);
//从给定的字符串按照固定格式还原为原message对象
void parse_message(const std::string& serialized_string, google::protobuf::Message* message);

各个类以及接口说明:

1.1 Message
Person是自定义的pb类型,继承自Message. MessageLite作为Message基类,更加轻量级一些。
通过Message的两个接口GetDescriptor/GetReflection,可以获取该类型对应的Descriptor/Reflection。

1.2 Descriptor
Descriptor是对message类型定义的描述,包括message的名字、所有字段的描述、原始的proto文件内容等。
本文中我们主要关注跟字段描述相关的接口,例如:

获取所有字段的个数:int field_count() const
获取单个字段描述类型FieldDescriptor的接口有很多个,例如
  
const FieldDescriptor* field(int index) const;//根据定义顺序索引获取
const FieldDescriptor* FindFieldByNumber(int number) const;//根据tag值获取
const FieldDescriptor* FindFieldByName(const string& name) const;//根据field name获取

1.3 FieldDescriptor
FieldDescriptor描述message中的单个字段,例如字段名,字段属性(optional/required/repeated)等。
对于proto定义里的每种类型,都有一种对应的C++类型,例如:

  
enum CppType {
    CPPTYPE_INT32 = 1, //TYPE_INT32, TYPE_SINT32, TYPE_SFIXED32
}
获取类型的label属性:

  
enum Label {
    LABEL_OPTIONAL = 1, //optional
    LABEL_REQUIRED = 2, //required
    LABEL_REPEATED = 3, //repeated
    MAX_LABEL = 3, //Constant useful for defining lookup tables indexed by Label.
}
获取字段的名称:const string& name() const;。

1.4 Reflection
Reflection主要提供了动态读写pb字段的接口,对pb对象的自动读写主要通过该类完成。
对每种类型,Reflection都提供了一个单独的接口用于读写字段对应的值。

例如对于读操作:

  
  virtual int32  GetInt32 (const Message& message,
                           const FieldDescriptor* field) const = 0;
  virtual int64  GetInt64 (const Message& message,
                           const FieldDescriptor* field) const = 0;
特殊的,对于枚举和嵌套的message:

  
  virtual const EnumValueDescriptor* GetEnum(
      const Message& message, const FieldDescriptor* field) const = 0;
  // See MutableMessage() for the meaning of the "factory" parameter.
  virtual const Message& GetMessage(const Message& message,
                                    const FieldDescriptor* field,
                                    MessageFactory* factory = NULL) const = 0;
对于写操作也是类似的接口,例如SetInt32/SetInt64/SetEnum等。
  1. 反射示例
    示例主要是接收任意类型的message对象,遍历解析其中的每个字段、以及对应的值,按照自定义的格式存储到一个string中。同时重新反序列化该string,读取字段以及value,填充到message对象中。例如:

其中Person是自定义的protobuf message类型,用于设置一些字段验证我们的程序。
单纯的序列化/反序列化功能可以通过pb自带的SerializeToString/ParseFromString接口完成。这里主要是为了同时展示自动从pb对象里提取field/value,自动根据field/value来还原pb对象这个功能。

int main() {
  std::string serialized_string;
  {
      tutorial::Person person;
      person.set_name("yingshin");
      person.set_id(123456789);
      person.set_email("zhy198606@gmail.com");
      ::tutorial::Person_PhoneNumber* phone = person.mutable_phone();
      phone->set_type(tutorial::Person::WORK);
      phone->set_number("13266666666");
      serialize_message(person, &serialized_string);
  }
  {
      tutorial::Person person;
      parse_message(serialized_string, &person);
  }
  return 0;
}

其中Person定义是对example里的addressbook.proto做了少许修改(修改的原因是本文没有涉及pb里数组的处理)

package tutorial;
message Person {
required string name = 1;
required int32 id = 2;        // Unique ID number for this person.
optional string email = 3;
enum PhoneType {
    MOBILE = 0;
    HOME = 1;
    WORK = 2;
}
message PhoneNumber {
    required string number = 1;
    optional PhoneType type = 2 [default = HOME];
}
optional PhoneNumber phone = 4;
}
  1. 反射实例实现
    3.1 serialize_message
    serialize_message遍历提取message中各个字段以及对应的值,序列化到string中。
    主要思路就是通过Descriptor得到每个字段的描述符:字段名、字段的cpp类型。
    通过Reflection的GetX接口获取对应的value。
void serialize_message(const google::protobuf::Message& message, std::string* serialized_string) {
  const google::protobuf::Descriptor* descriptor = message.GetDescriptor();
  const google::protobuf::Reflection* reflection = message.GetReflection();
  for (int i = 0; i < descriptor->field_count(); ++i) {
      const google::protobuf::FieldDescriptor* field = descriptor->field(i);
      bool has_field = reflection->HasField(message, field);
      if (has_field) {
          //arrays not supported
          assert(!field->is_repeated());
          switch (field->cpp_type()) {
#define CASE_FIELD_TYPE(cpptype, method, valuetype)\
              case google::protobuf::FieldDescriptor::CPPTYPE_##cpptype:{\
                  valuetype value = reflection->Get##method(message, field);\
                  int wsize = field->name().size();\
                  serialized_string->append(reinterpret_cast<char*>(&wsize), sizeof(wsize));\
                  serialized_string->append(field->name().c_str(), field->name().size());\
                  wsize = sizeof(value);\
                  serialized_string->append(reinterpret_cast<char*>(&wsize), sizeof(wsize));\
                  serialized_string->append(reinterpret_cast<char*>(&value), sizeof(value));\
                  break;\
              }
              CASE_FIELD_TYPE(INT32, Int32, int);
              CASE_FIELD_TYPE(UINT32, UInt32, uint32_t);
              CASE_FIELD_TYPE(FLOAT, Float, float);
              CASE_FIELD_TYPE(DOUBLE, Double, double);
              CASE_FIELD_TYPE(BOOL, Bool, bool);
              CASE_FIELD_TYPE(INT64, Int64, int64_t);
              CASE_FIELD_TYPE(UINT64, UInt64, uint64_t);
#undef CASE_FIELD_TYPE
              case google::protobuf::FieldDescriptor::CPPTYPE_ENUM: {
                  int value = reflection->GetEnum(message, field)->number();
                  int wsize = field->name().size();
                  //写入name占用字节数
                  serialized_string->append(reinterpret_cast<char*>(&wsize), sizeof(wsize));
                  //写入name
                  serialized_string->append(field->name().c_str(), field->name().size());
                  wsize = sizeof(value);
                  //写入value占用字节数
                  serialized_string->append(reinterpret_cast<char*>(&wsize), sizeof(wsize));
                  //写入value
                  serialized_string->append(reinterpret_cast<char*>(&value), sizeof(value));
                  break;
              }
              case google::protobuf::FieldDescriptor::CPPTYPE_STRING: {
                  std::string value = reflection->GetString(message, field);
                  int wsize = field->name().size();
                  serialized_string->append(reinterpret_cast<char*>(&wsize), sizeof(wsize));
                  serialized_string->append(field->name().c_str(), field->name().size());
                  wsize = value.size();
                  serialized_string->append(reinterpret_cast<char*>(&wsize), sizeof(wsize));
                  serialized_string->append(value.c_str(), value.size());
                  break;
              }
              case google::protobuf::FieldDescriptor::CPPTYPE_MESSAGE: {
                  std::string value;
                  int wsize = field->name().size();
                  serialized_string->append(reinterpret_cast<char*>(&wsize), sizeof(wsize));
                  serialized_string->append(field->name().c_str(), field->name().size());
                  const google::protobuf::Message& submessage = reflection->GetMessage(message, field);
                  serialize_message(submessage, &value);
                  wsize = value.size();
                  serialized_string->append(reinterpret_cast<char*>(&wsize), sizeof(wsize));
                  serialized_string->append(value.c_str(), value.size());
                  break;
              }
          }
      }
  }
}

3.2 parse_message
parse_message通过读取field/value,还原message对象。
主要思路跟serialize_message很像,通过Descriptor得到每个字段的描述符FieldDescriptor,通过Reflection的SetX填充message。

void parse_message(const std::string& serialized_string, google::protobuf::Message* message) {
  const google::protobuf::Descriptor* descriptor = message->GetDescriptor();
  const google::protobuf::Reflection* reflection = message->GetReflection();
  std::map<std::string, const google::protobuf::FieldDescriptor*> field_map;
  for (int i = 0; i < descriptor->field_count(); ++i) {
      const google::protobuf::FieldDescriptor* field = descriptor->field(i);
      field_map[field->name()] = field;
  }
  const google::protobuf::FieldDescriptor* field = NULL;
  size_t pos = 0;
  while (pos < serialized_string.size()) {
      int name_size = *(reinterpret_cast<const int*>(serialized_string.substr(pos, sizeof(int)).c_str()));
      pos += sizeof(int);
      std::string name = serialized_string.substr(pos, name_size);
      pos += name_size;
      int value_size = *(reinterpret_cast<const int*>(serialized_string.substr(pos, sizeof(int)).c_str()));
      pos += sizeof(int);
      std::string value = serialized_string.substr(pos, value_size);
      pos += value_size;
      std::map<std::string, const google::protobuf::FieldDescriptor*>::iterator iter =
          field_map.find(name);
      if (iter == field_map.end()) {
          fprintf(stderr, "no field found.\n");
          continue;
      } else {
          field = iter->second;
      }
      assert(!field->is_repeated());
      switch (field->cpp_type()) {
#define CASE_FIELD_TYPE(cpptype, method, valuetype)\
          case google::protobuf::FieldDescriptor::CPPTYPE_##cpptype: {\
              reflection->Set##method(\
                      message,\
                      field,\
                      *(reinterpret_cast<const valuetype*>(value.c_str())));\
              std::cout << field->name() << "\t" << *(reinterpret_cast<const valuetype*>(value.c_str())) << std::endl;\
              break;\
          }
          CASE_FIELD_TYPE(INT32, Int32, int);
          CASE_FIELD_TYPE(UINT32, UInt32, uint32_t);
          CASE_FIELD_TYPE(FLOAT, Float, float);
          CASE_FIELD_TYPE(DOUBLE, Double, double);
          CASE_FIELD_TYPE(BOOL, Bool, bool);
          CASE_FIELD_TYPE(INT64, Int64, int64_t);
          CASE_FIELD_TYPE(UINT64, UInt64, uint64_t);
#undef CASE_FIELD_TYPE
          case google::protobuf::FieldDescriptor::CPPTYPE_ENUM: {
              const google::protobuf::EnumValueDescriptor* enum_value_descriptor =
                  field->enum_type()->FindValueByNumber(*(reinterpret_cast<const int*>(value.c_str())));
              reflection->SetEnum(message, field, enum_value_descriptor);
              std::cout << field->name() << "\t" << *(reinterpret_cast<const int*>(value.c_str())) << std::endl;
              break;
          }
          case google::protobuf::FieldDescriptor::CPPTYPE_STRING: {
              reflection->SetString(message, field, value);
              std::cout << field->name() << "\t" << value << std::endl;
              break;
          }
          case google::protobuf::FieldDescriptor::CPPTYPE_MESSAGE: {
              google::protobuf::Message* submessage = reflection->MutableMessage(message, field);
              parse_message(value, submessage);
              break;
          }
          default: {
              break;
          }
      }
  }
}

------------------------------以下为新增内容:
为了支持std::cout 直接调用pb序列化后的内容,且支持repeated 类型,新的接口如下:

void serialize_message_to_str(const google::protobuf::Message &message, std::string *serialized_str) {
    const google::protobuf::Descriptor* descriptor = message.GetDescriptor();
    const google::protobuf::Reflection* reflection = message.GetReflection();
    for (int i = 0; i < descriptor->field_count(); ++i) {
        const google::protobuf::FieldDescriptor* field = descriptor->field(i);
        if (field->is_repeated()) {
            //repeated
            int fieldSize = reflection->FieldSize(message, field);
            switch (field->cpp_type()) {
#define CASE_REPEATED_FIELD_TYPE(cpptype, method, valuetype)\
                case google::protobuf::FieldDescriptor::CPPTYPE_##cpptype:{\
                    serialized_str->append("repedted_field:\t");\
                    serialized_str->append(field->name().c_str(), field->name().size());\
                    serialized_str->append("\t");\
                    for(int i = 0; i < fieldSize; ++i) {\
                        valuetype value = reflection->GetRepeated##method(message, field, i);\
                        serialized_str->append(std::to_string(value));\
                        serialized_str->append("\t");\
                    }\
                    break;\
                }
                CASE_REPEATED_FIELD_TYPE(INT32, Int32, int);
                CASE_REPEATED_FIELD_TYPE(UINT32, UInt32, uint32_t);
                CASE_REPEATED_FIELD_TYPE(FLOAT, Float, float);
                CASE_REPEATED_FIELD_TYPE(DOUBLE, Double, double);
                CASE_REPEATED_FIELD_TYPE(BOOL, Bool, bool);
                CASE_REPEATED_FIELD_TYPE(INT64, Int64, int64_t);
                CASE_REPEATED_FIELD_TYPE(UINT64, UInt64, uint64_t);
#undef CASE_REPEATED_FIELD_TYPE
                case google::protobuf::FieldDescriptor::CPPTYPE_STRING: {
                    serialized_str->append("repedted_field:\t");
                    serialized_str->append(field->name().c_str(), field->name().size());
                    serialized_str->append("\t");
                    for(int i = 0; i < fieldSize; ++i) {
                        std::string value = reflection->GetRepeatedString(message, field, i);
                        serialized_str->append(value.c_str(), value.size());
                        serialized_str->append("\t");
                    }
                    break;
                }
                case google::protobuf::FieldDescriptor::CPPTYPE_ENUM: {
                    serialized_str->append("repedted_field:\t");
                    serialized_str->append(field->name().c_str(), field->name().size());
                    serialized_str->append("\t");
                    for(int i = 0; i < fieldSize; ++i) {
                        int value = reflection->GetRepeatedEnumValue(message, field, i);
                        serialized_str->append(std::to_string(value));
                        serialized_str->append("\t");
                    }
                    break;
                }
                case google::protobuf::FieldDescriptor::CPPTYPE_MESSAGE: {
                    serialized_str->append("repedted_field[sub_message]:\t");
                    serialized_str->append(field->name().c_str(), field->name().size());
                    serialized_str->append("\t");
                    std::string value;
                    for(int i = 0 ;i < fieldSize; ++i) {
                        const google::protobuf::Message& submessage = reflection->GetRepeatedMessage(message, field, i);
                        serialize_message_to_str(submessage, &value);
                    }
                    serialized_str->append(value.c_str(), value.size());
                    serialized_str->append("\t]");
                    break;
                }
            }
            
            continue;
        } 

        bool has_field = reflection->HasField(message, field);
        if (has_field) {
            //arrays not supported
            //assert(!field->is_repeated());
            switch (field->cpp_type()) {
#define CASE_FIELD_TYPE(cpptype, method, valuetype)\
                case google::protobuf::FieldDescriptor::CPPTYPE_##cpptype:{\
                    valuetype value = reflection->Get##method(message, field);\
                    serialized_str->append(field->name().c_str(), field->name().size());\
                    serialized_str->append("\t");\
                    serialized_str->append(std::to_string(value));\
                    serialized_str->append("\t");\
                    break;\
                }
                CASE_FIELD_TYPE(INT32, Int32, int);
                CASE_FIELD_TYPE(UINT32, UInt32, uint32_t);
                CASE_FIELD_TYPE(FLOAT, Float, float);
                CASE_FIELD_TYPE(DOUBLE, Double, double);
                CASE_FIELD_TYPE(BOOL, Bool, bool);
                CASE_FIELD_TYPE(INT64, Int64, int64_t);
                CASE_FIELD_TYPE(UINT64, UInt64, uint64_t);
#undef CASE_FIELD_TYPE
                case google::protobuf::FieldDescriptor::CPPTYPE_ENUM: {
                    int value = reflection->GetEnum(message, field)->number();
                    int wsize = field->name().size();
                    //写入name
                    serialized_str->append(field->name().c_str(), field->name().size());
                    serialized_str->append("\t");
                    //写入value
                    serialized_str->append(std::to_string(value));
                    serialized_str->append("\t");
                    break;
                }
                case google::protobuf::FieldDescriptor::CPPTYPE_STRING: {
                    std::string value = reflection->GetString(message, field);
                    serialized_str->append(field->name().c_str(), field->name().size());
                    serialized_str->append("\t");
                    serialized_str->append(value.c_str(), value.size());
                    serialized_str->append("\t");
                    break;
                }
                case google::protobuf::FieldDescriptor::CPPTYPE_MESSAGE: {
                    std::string value;
                    serialized_str->append("sub_message:\t");
                    serialized_str->append(field->name().c_str(), field->name().size());
                    serialized_str->append("\t[");
                    const google::protobuf::Message& submessage = reflection->GetMessage(message, field);
                    serialize_message_to_str(submessage, &value);
                    serialized_str->append(value.c_str(), value.size());
                    serialized_str->append("\t]");
                    break;
                }
            }
        }
    }
}
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,504评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,434评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,089评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,378评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,472评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,506评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,519评论 3 413
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,292评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,738评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,022评论 2 329
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,194评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,873评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,536评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,162评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,413评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,075评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,080评论 2 352

推荐阅读更多精彩内容