Protobuf开发者指南

欢迎访问 Protocol Buffers ——一个用于通信协议、数据存储及其它场景中,语言无关、平台无关、可扩展的结构化数据序列化方法——的开发者文档。

本文档是为那些想要在自己的应用中使用 Protocol Buffers 的Java、C++或Python开发者而写的。这份概述介绍 Protocol Buffers ,并告诉你如何将它用起来——然后你可以通过 教程 继续学习,或深入了解 Protocol Buffers 编码规则。也为这三种语言提供了API 参考文档,以及编写 .proto 文件的 语言风格 指导。

什么是Protocol Buffers?

Protocol Buffers 是一个序列化结构化数据的灵活、高效且自动化的机制——类似XML,但更小,更快,更简单。你定义一次结构化你的数据的方式,然后使用特别生成的代码简单地写入,或使用不同的语言从大量的数据流读出你的结构化数据。你甚至可以更新你的数据结构而不破坏已部署的基于 格式编译的程序。

它们如何工作的?

通过在 .proto 文件中定义 Protocol Buffers 消息类型来描述你想要结构化你在序列化的信息的方式。每个 Protocol Buffers 消息是一个信息的小逻辑记录,包含一系列名-值对。这里是一个非常基本的 .proto 文件的例子,它定义包含关于一个人的信息的消息:

message Person {
  required string name = 1;
  required int32 id = 2;
  optional string email = 3;

  enum PhoneType {
    MOBILE = 0;
    HOME = 1;
    WORK = 2;
  }

  message PhoneNumber {
    required string number = 1;
    optional PhoneType type = 2 [default = HOME];
  }

  repeated PhoneNumber phone = 4;
}

如你所见,消息的格式很简单——每个消息类型具有一个或多个唯一编号的字段,每个字段具有一个名和一个值,其中值类型可以是数字(整数或浮点数),布尔值,字符串,原始的字节,或者甚至是(如上面的例子所示)其它的Protocol Buffer消息类型,这允许层次式地结构化你的数据。你可以指定可选的字段、必需的字段,和重复的字段。你可以在Protocol Buffer 语言指南 找到更多关于编写 .proto 文件的信息。

一旦定义好消息,你就可以运行 Protocol Buffer 编译器为你的 .proto 文件产生应用程序的语言的数据访问类。这为每个字段提供了简单的访问器 (如name()set_name()),以及将整个结构序列化为原始字节,或从原始字节解析为结构的方法——因而,比如你选择C++,为上面的例子运行编译器将产生名为Person的类。然后你可以在你的应用程序中使用这个类,来放置、序列化和提取Person Protocol Buffer 消息。然后你可以编写如下这样的代码:

Person person;
person.set_name("John Doe");
person.set_id(1234);
person.set_email("jdoe@example.com");
fstream output("myfile", ios::out | ios::binary);
person.SerializeToOstream(&output);

随后你可以将消息读回:

fstream input("myfile", ios::in | ios::binary);
Person person;
person.ParseFromIstream(&input);
cout << "Name: " << person.name() << endl;
cout << "E-mail: " << person.email() << endl;

你可以在不破坏向后兼容性的前提下为你的消息格式添加新字段;老的程序在解析时简单地忽略新字段。如果你有一个以 Protocol Buffers 为数据格式的通信协议,则可以轻松地扩展你的协议而不用担心破坏已有的代码。你可以在 API 参考 找到使用生成的 Protocol Buffers 代码的完整参考,你可以在 Protocol Buffer编码 中找到更多关于 Protocol Buffers 消息编码的内容。

为什么不使用XML呢?

在序列化数据方面,相对于XML, Protocol Buffers 有许多有点。 Protocol Buffers

  • 更简单
  • 小3至10倍
  • 快20至100倍
  • 更少歧义
  • 产生数据访问类方便编程使用

比如,你想要为 person 建模,它有一个 name 字段和一个 email 字段。在XML中,你需要:

  <person>
    <name>John Doe</name>
    <email>jdoe@example.com</email>
  </person>

而对应的 Protocol Buffers 消息 (以 Protocol Buffers文本格式描述) 则是:

# Textual representation of a protocol buffer.
# This is *not* the binary format used on the wire.
person {
  name: "John Doe"
  email: "jdoe@example.com"
}

当消息被编码为 Protocol Buffers二进制格式 (上边的文本格式只是为了方便调试和编辑的人类可读的表示),它可能是28字节长,并需要大概100-200 纳秒来解析。如果移除空白符的话,XML版本至少需要69字节,并需要大概 5,000-10,000 纳秒来解析。

管理一个 Protocol Buffers 更简单:

  cout << "Name: " << person.name() << endl;
  cout << "E-mail: " << person.email() << endl;

使用XML的话你将不得不像下面这样:

  cout << "Name: "
       << person.getElementsByTagName("name")->item(0)->innerText()
       << endl;
  cout << "E-mail: "
       << person.getElementsByTagName("email")->item(0)->innerText()
       << endl;

然而, Protocol Buffers 也不总是比XML好——比如, Protocol Buffers 不是建模 含有标记的基于文本的文档 (如HTML) 的好方法,因为你不能简单地交叉含有文本的结构,此外,XML是人类可读且人类可编辑的; Protocol Buffers ,至少在它们的本地格式,不是。XML还——在一定程度上——是自描述的。 Protocol Buffers 只在你有消息定义 (.proto 文件) 时才有意义。

听起来正是我想要的方案!我要如何将它用起来呢?

下载 Protocol Buffers ——其中包含完整的Java、Python和C++ Protocol Buffers 编译器的代码,还包含你可以用于I/O测试的类。要构建并安装你的编译器,请依照README的指导进行。

一旦都设置好了,则可以试着按照 你选择的语言的 教程 继续学习 ——这将带你创建一个使用 Protocol Buffers 的简单应用。

proto3简介

我们最近的版本 3 发布 引入了一个新的语言版本 - Protocol Buffers 语言版本 3 (亦称proto3),并在我们已有的语言版本 (亦称proto2) 引入了一些新功能。Proto3简化了 Protocol Buffers 语言,使使用变得更简单,并可以在更广泛的语言中使用:我们当前的发行版让你可以为Java,C++,Python,Java Lite,Ruby,JavaScript,Objective-C,和C#产生 Protocol Buffers 代码。此外,你可以使用最新的Go protoc插件为Go产生proto3代码,可在 golang/protobuf Github 仓库找到。更多语言还在计划中。

当前我们建议只试用proto3:

  • 如果你想要试用我们新支持的语言。
  • 如果你想要使用我们的新开源RPC实现 gRPC – 我们建议为所有的新gRPC服务器和客户端使用proto3,以避免出现兼容性问题。

注意,两个语言版本的APIs不完全兼容。为了避免给现有用户造成不便,我们将在新的 Protocol Buffers 发行版中继续支持之前的语言版本。

你可以在 发行说明 中查看当前默认版本的主要差异,并在 Proto3语言指南 学习关于proto3语法的内容。完整的proto3文档很快就要到来了!

(如果说名字proto2和proto3似乎有点混乱,那是由于我们最初在开源 Protocol Buffers 时,它实际上是Google的第二个语言版本——也被称为proto2。这也是为什么我们的开源版本号是从v2.0.0开始的)。

历史

Protocol Buffers 最初是在Google开发的,用来处理一个索引服务器请求/响应协议。在 Protocol Buffers 之前,有一个请求和响应的格式用于手动序列化/反序列化请求和响应,而且它支持协议的大量版本。这导致了一些非常丑陋的代码,比如:

 if (version == 3) {
   ...
 } else if (version > 4) {
   if (version == 5) {
     ...
   }
   ...
 }

显式地格式化协议也使新协议版本的上线很复杂,因为开发者不得不在他们切换到新协议之前,确保所有发起请求的服务器和实际处理请求的服务器理解新协议。

Protocol Buffers 设计来解决许多这些问题:

  • 可以简单地引入新字段,无需深入理解数据的中间服务器可以简单地解析并传递数据而无需知道所有的字段。
  • 格式更加具有自描述性,且可由大量的语言 (C++,Java,等等) 处理。

然而,用户依然需要手写它们自己的解析代码。

随着系统的发展,它得到了大量的其它功能及使用:

  • 自动生成序列化和反序列化的代码以避免手动解析。
  • 此外被用于短暂的 RPC (Remote Procedure Call) 请求,人们开始使用 Protocol Buffers 作为持久存储数据的便利的自描述格式。
  • 服务器RPC接口开始被声明为协议文件的一部分,并以协议编译器生成stub类,用户可以以服务器的接口的实际实现覆盖。

Protocol Buffers 现在是Google的数据的通用语言——在写作本文的时候,有48,162个不同的消息类型定义在Google代码库的12,183 个 .proto 文件中。它们同时在RPC系统及不同的存储系统的数据存储中使用。

原文

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,332评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,508评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,812评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,607评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,728评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,919评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,071评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,802评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,256评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,576评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,712评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,389评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,032评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,798评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,026评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,473评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,606评论 2 350

推荐阅读更多精彩内容

  • 参考:http://www.jianshu.com/p/8c6c009bc500 http://blog.csdn...
    F麦子阅读 2,679评论 2 1
  • 由于工程项目中拟采用一种简便高效的数据交换格式,百度了一下发现除了采用 xml、JSON 还有 ProtoBuf(...
    黄海佳阅读 48,589评论 1 23
  • 简介 用简单的话来定义tcpdump,就是:dump the traffic on a network,根据使用者...
    保川阅读 5,947评论 1 13
  • [ 导读 ]过家家在2014年9月份成立,背景是广田股份上市公司,是中国做的较大的住宅精装修领域的上市公司。 我是...
    家装头条阅读 264评论 0 1
  • 不得不承认又老了一岁,不得不承认还一无所成,不得不承认父母老了,不得不承认我还未长大,不得不承认还未有男友,不得不...
    丽L阅读 219评论 0 1