Protobuf

Protobuf介绍

Protocol Buffers 是一种轻便高效的结构化数据存储格式,可以用于结构化数据串行化,或者说序列化。它很适合做数据存储或 RPC 数据交换格式。可用于通讯协议、数据存储等领域的语言无关、平台无关、可扩展的序列化结构数据格式,被广泛应用在网络传输

Protobuf编码原理

  • Message Buffer
    Message Buffer是指protobuf序列化后的二进制文件格式如下:
    image

    如图所示,消息经过序列化后会成为一个二进制数据流,该流中的数据为一系列的 Key-Value。protobuf采用Varint编码、ZigZag编码技术,使得这种Key-Pair 结构无需使用分隔符来分割不同的 Field。对于可选的 Field,如果消息中不存在该 field,那么在最终的 Message Buffer 中就没有该 field,这些特性都有助于节约消息本身的大小,protobuf利用巧妙的编码技术,压缩传输的字节数,可大大的提升网络传输效率
  • Varint编码

    • 原理介绍
      varint是一种对数字进行编码的方案,编码后的数据是不定长的,值越小的数字使用越小的字节数,编码后的一般占在1~5个字节。最高位表示是否继续,继续是1,代表后面7位仍然表示数字,否则为0,后面7位用原码补齐,小字节序
    • 小试牛刀
      400对应的二进制为00000001 10010000(原码)
    1. 每个字节保留后7位,去掉最高位,有效编码向前移动,生成编码如:0000011 0010000
    2. 因为protobuf使用的是小字节序,所以要把低位字节写到高字节,最后一个字节高位补0,其余各字节高位补1,生成编码如:10010000 0000011
    • Varint编码缺点
      计算机在表示负数的时候,最高位是1,导致使用varint编码的时候,会当作很大的整数处理,从而导致浪费资源,为了解决该问题,protobuf编码引入zigzag编码
  • ZigZag编码

    • 原理介绍
      Zigzag 编码用无符号数来表示有符号数字,正数和负数交错,如图所示:
      image

      使用 zigzag 编码,绝对值小的数字,无论正负都可以采用较少的 byte 来表示,充分利用了 Varint 这种技术。在实际使用过程中,先用zigzag编码后,再对编码后的数据进行varint编码,可以节省很大的空间
  • 字符串类型
    字符串等则采用类似数据库中的 varchar 的表示方法,即用一个 varint 表示长度,然后将其余部分紧跟在这个长度部分之后即可

  • key的计算方式

    • wireType

      image
    • 源码展示

    /** Makes a tag value given a field number and wire type. */
    static int makeTag(final int fieldNumber, final int wireType) {
        return (fieldNumber << TAG_TYPE_BITS) | wireType;
    }
    

    TAG_TYPE_BITS取值为3,也就是低位为wire_type,高位为field_number,举例说明:age声明为int32,age的field_number=1,所以wire_type =0,所以key=(1<<3 | 0 )=0x08

protobuf序列化

  • protobuf文件

            syntax ="proto3";
            package com.simple;
            option java_package="com.simple";
            option java_outer_classname="Person";
            message Person{
                int32 age= 1;
            }
    
    
  • 序列化

    Person.Builder builder = Person.newBuilder();
    builder.setAge(18);
    Person person =builder.build();
    byte[] byteArray = person.toByteArray();
    FileOutputStream outstream = new FileOutputStream(new File("Person.txt"));
    outstream.write(byteArray);
    outstream.close();
    

    打开Person.txt,使用十六进制查看:08 12

grpc应用

  • 概要

    protobuf提供了maven插件,可以利用插件生成对应的文件,如Java,可以生成对应的Java类,具体使用方法,这里不再累赘介绍

  • protobuf文件

        syntax = "proto3";
        option java_multiple_files = true;
        option java_package = "io.grpc.examples.helloworld";
        option java_outer_classname = "HelloWorldProto";
        option objc_class_prefix = "HLW";
    
        package helloworld;
    
        // The greeting service definition.
        service Greeter {
        // Sends a greeting
        rpc SayHello (HelloRequest) returns (HelloReply) {}
        }
    
        // The request message containing the user's name.
        message HelloRequest {
        string name = 1;
        }
    
        // The response message containing the greetings
        message HelloReply {
        string message = 1;
        }
    
  • maven依赖

         <dependency>
            <groupId>io.grpc</groupId>
            <artifactId>grpc-netty-shaded</artifactId>
            <version>${grpc.version}</version>
        </dependency>
        <dependency>
            <groupId>io.grpc</groupId>
            <artifactId>grpc-protobuf</artifactId>
            <version>${grpc.version}</version>
        </dependency>
        <dependency>
            <groupId>io.grpc</groupId>
            <artifactId>grpc-stub</artifactId>
            <version>${grpc.version}</version>
        </dependency>
        <dependency>
            <groupId>com.google.protobuf</groupId>
            <artifactId>protobuf-java</artifactId>
            <version>3.5.0</version>
        </dependency>
    
  • maven配置protobuf插件

        <!-- protobuf 编译组件 -->
        <plugin>
                <groupId>org.xolstice.maven.plugins</groupId>
                <artifactId>protobuf-maven-plugin</artifactId>
                <version>0.5.1</version>
                <extensions>true</extensions>
                <configuration>
                    <pluginId>grpc-java</pluginId>
                    <protocArtifact>com.google.protobuf:protoc:3.5.0:exe:${os.detected.classifier}</protocArtifact>
                    <pluginArtifact>io.grpc:protoc-gen-grpc-java:1.16.1:exe:${os.detected.classifier}</pluginArtifact>
                    <protoSourceRoot>${project.basedir}/src/main/resources/proto</protoSourceRoot>
                </configuration>
                <executions>
                    <execution>
                        <goals>
                            <goal>compile</goal>
                            <goal>compile-custom</goal>
                        </goals>
                    </execution>
                </executions>
         </plugin>
    

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,809评论 6 513
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,189评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 167,290评论 0 359
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,399评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,425评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,116评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,710评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,629评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,155评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,261评论 3 339
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,399评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,068评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,758评论 3 332
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,252评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,381评论 1 271
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,747评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,402评论 2 358

推荐阅读更多精彩内容

  • 翻译查阅外网资料过程中遇到的比较优秀的文章和资料,一是作为技术参考以便日后查阅,二是训练英文能力。此文翻译自 Pr...
    401阅读 10,668评论 5 11
  • 常见的序列化框架 xml序列化 在java发展早期开始,为了统一接口,xml协议横空出世,良好的可读性,自由度极高...
    逐梦々少年阅读 19,397评论 2 11
  • 在对 ProtoBuf 做了一些基本介绍之后,这篇开始进入正题,深入 ProtoBuf 的一些原理,让我们看看 P...
    401阅读 92,520评论 10 116
  • 前言 之前一直忙于移动端日志SDK Trojan的开源工作,已十分稳定地运行在饿了么团队App中,集成了日志加密和...
    水木飞雪阅读 24,728评论 16 96
  • 简介 protoBuf是google 的一种数据交换的格式,它独立于语言,独立于平台。google 提供了多种语言...
    ssochi阅读 2,999评论 0 2