[以太坊源码分析]:RLP编码

RLP编码

RLP编码是以太坊对象序列化和反序列化的主要方法,可编码任意嵌套的二进制数据。以太坊中多个地方都用到了RLP编码,例如区块,交易等。

RLP是 Recursive Length Prefix 三个单词的缩写,分别是递归,长度,前缀。以下是我的理解:递归指可以处理嵌套的数据结构,长度指编码是对数据的长度进行处理,前缀指编码结果是在数据前加一个前缀。

0.索引

01.为什么要使用RLP编码
02.RLP编码规则
03.总结

1.为什么要使用RLP编码

使用RLP编码的情况下,需要保存的额外数据比较少。RLP编码结果的前缀不会超过9个字节,举个例子:

type Tests struct{
    Name string
}
t := Tests{Name:"abc"}
  • 1.采用JSON编码,t的编码结果为{"Name":"abc"},长度为14个字节。
  • 2.采用RLP编码,t的编码结果为0x83616263,直观的表示为131 a b c,长度为4个字节。

t的有效的数据长度为3个字节,采用JSON编码的时候,额外的数据长度为11个字节,而采用RLP编码的时候,额外的数据长度为1个字节(即前缀)。由此可见,RLP编码可以节省编码后的数据的存储空间,这对以太坊来说是很必要的,区块和交易编码后的长度跟原来的长度相差不大,节省了存储空间的开销。

2.RLP编码规则

在以太坊的黄皮书附录B中,定义了如下的两种数据结构:



简单的理解为,L为列表类型的数据,B为字节数组,字符串类型的数据。如果是其他的数据类型,则需要先转换为这两种数据类型,比如说,结构体转换为嵌套的列表,布尔类型转换为整型。对此两种数据类型的RLP编码表示为:



RLP编码的规则一共有5个,3个对于字节数组而言,剩下2个与列表有关。
字节数组
字节数组的编码过程

Rb(x)涉及了3个规则:

  • 1.单个字节,小于128,结果为该字节
  • 2.字节数组,长度小于56,结果为128+字节数组长度,各个字节的编码两部分
  • 3.字节数组,长度大于等于56,结果为183+字节数组长度编码的长度,字节数组长度,各个字节的编码三部分 (长度不能超过288)

举个例子:

  • 1.单个字节:z => “7A”
    (z的十六进制ascii码为7A)
  • 2.长度小于56的字节数组:xyz => “8378797A”
    83为128+3的十六进制表示,xyz分别为78 79 7A)
  • 3.长度大于等于56的字节数组:“Lorem ipsum dolor sit amet, consectetur adipisicing elit” =>“B8384C6F72656D20697073756D20646F6C6F722073697420616D65742C20636F6E7365637465747572206164697069736963696E6720656C6974”
    (B8为183+1,1为字节数组长度56的编码长度;38为字节数组长度56十六进制;其余为各个字节的编码)

BE(x),去掉前导零的大端表示 (bn是8个字节的,所以以8个字节为例)
例如:1024 -> 0x00 00 00 00 00 00 04 00 -> 0x0400

(a)·(b,c)·(d,e) = (a,b,c,d,e),指的是字节的拼接,类似于把字符串连接起来。

列表
列表的编码过程

Rl(x)涉及了2个规则:

  • 1.列表,长度小于56,结果为192+列表长度,各个字节的编码两部分
  • 2.列表,长度大于等于56,结果为247+列表长度编码的长度,列表长度,各个子列表的编码三部分

举个例子:

  • 1.长度小于56的列表:[ 1, 2, 3] => “C3010203”
    C3为192+3的十六进制表示)
  • 2.长度大于等于56的列表:["aaa", "bbb", "ccc", "ddd", "eee", "fff", "ggg", "hhh", "iii", "jjj", "kkk", "lll", "mmm", "nnn", "ooo“] =>“F83C836161618362626283636363836464648365656583666666836767678368686883696969836A6A6A836B6B6B836C6C6C836D6D6D836E6E6E836F6F6F”
    F8为247+1,1为总的列表长度60的编码长度;3C为60十六进制表示;bbb为一个子列表83626262,80+3,以及b为62)

3.总结

  • 1.RLP编码是以太坊对象序列化和反序列化的主要方法,对数据进行编码,编码结果为在原本的数据前增加一个前缀。可节省编码后的数据的存储空间。
  • 2.RLP编码有5个规则,3个规则适用于字节数组,2个规则适用于列表。根据字节数组和列表的不同长度使用不同的编码规则。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 文章分为2部分, 第一部分是综合整理已有资料而生成的参考文档, 第二部分是python版以太坊代码中的源码实现分析...
    shi_qinfeng阅读 8,982评论 0 3
  • 这是以太坊源码研究的第一篇文章。基本上来说,我写什么内容,说明我正好在学习什么内容,并没有固定的顺序。之所以先写R...
    魏兆华阅读 5,403评论 0 0
  • GitHub上介绍(解码部分为本人编辑): https://github.com/ethereum/wiki/wi...
    AlbertGou阅读 8,193评论 1 3
  • 文化以不同的形式生长,博学这个词简直像是在反讽人类的创造力。
    Joshua_05d6阅读 1,209评论 0 0
  • 2018-01-31 ω 很棒 第三遍闹铃终于把我叫醒了 多跑了一个路口 穿过一群与凌晨不相符的嘈杂 我以为是垃圾...
    夏天的秘密花园阅读 3,523评论 0 0