RLP 递归长度前缀

RLP 递归长度前缀

RLP(recursive length prefix):递归长度前缀。

RLP编码是以太坊中主要的序列化格式,它的使用无处不在:区块、交易、账户状态以及线路协议消息。

RLP旨在成为高度简化的序列化格式,它唯一的目的是存储嵌套的字节数组。不同于protobufBSON等现有的解决方案,RLP并不定义任何指定的数据类型,如Boolean、floa、double或者integer。它仅仅是以嵌套数组的形式存储结构,并将其留给协议来确定数组的含义。RLP也没有明确支持map集合,半官方的建议是采用 [[k1, v1], [k2, v2], ...] 的嵌套数组来表示键值对集合,k1,k2 ... 按照字符串的标准排序。

与RLP具有相同功能的方案是protobufBSON,它们是一直被使用的算法。然而,以太坊中,更偏向于使用RLP,因为:(1)它易于实现;(2)绝对保证字节的一致性。许多语言的Map集合没有明确的排序,并且浮点格式有很多特殊情况,这可能造成相同数据却导致不同编码和hash值。通过内部开发协议,我们能确保它是带着这些目标设计的(这是一般原则,也适用于代码的其他部分,如VM)。BitTorrent使用的编码方式bencode也许可以替代RLP。不过它采用的是十进制的编码方式,与采用二进制的RLP相比,稍微逊色了点。

RLP定义

RLP编码功能只处理两类数据:字符串(字节数组)和列表(list)。

可以是:空字符串""、包含单词"cat"的字符串、包含任意数量字符串的列表(如,["cat","dog"])以及更复杂的数据结构["cat",["puppy","cow"],"horse",[[]],"pig",[""],"sheep"]。请注意,“字符串”将表示为“一定数量字节的二进制数据”的同义词。

RLP编码规则

  1. 对于值在[0x00, 0x7f]范围内的单个字节,编码就是本身。

     例如,"a"的编码为:[0x61]
     整数0的编码为:[0x00] 
    
  2. 如果一个字符串的长度是0-55字节,其RLP编码是前缀再拼接字符串本身,前缀的值是0x80加上字符串的长度。前缀取值范围是[0x80, 0xb7]

    例如,空字符串(‘null’)的编码为:[0x80]
    整数1024('\x04\x00')的编码为:[ 0x82, 0x04, 0x00 ]
    字符串"dog"的编码为:[0x83,'d','o','g']
    
  3. 如果一个字符串的长度大于55字节,编码结果为:[0xb7+字节数组长度的编码的长度,字节数组长度本身的编码,字节数组]。本规则下前缀的取值范围是[0xb8,0xbf]

    例如,字符串“Lorem ipsum dolor sit amet, consectetur adipisicing elit”
    1. 字符串长度为56,编码为0x38
    2. 长度56编码后仅占用一个字节,即0xb7 + 1 = 0xb8
    编码结果为:[0xb8,0x38,'L','o','r','e','m',' ',…,'e','l','i','t'] 
    
  4. 以上3个规则是针对字符串的,接下来的两个规则针对列表的。由于列表是任意嵌套的,因此列表的编码是递归的,先编码最里层列表,再逐步往外层列表编码。如果列表长度小于55,编码结果第一位是0xc0加列表长度的编码的长度,然后依次连接各子列表的编码。本规则下前缀的取值范围是[0xc0, 0xf7]

    例如,列表["cat","dog"]
    1. "cat"的编码为[0x83,'c','a','t']
    2. "dog"的编码为[0x83,'d','o','g']
    3. 两个子字符串的编码后总长度是8,即0xc0 + 8 = 0xc8
    编码结果为:[0xc8,0x83,'c','a','t',0x83,'d','o','g']
    空列表[]编码结果为:[0xc0]
    嵌套列表[[],[[]],[[],[[]]]]编码结果为:[0xc7,0xc0,0xc1,0xc0,0xc3,0xc0,0xc1,0xc0] 
    
  5. 如果列表长度超过55,编码结果第一位是247加列表长度的编码长度,然后是列表长度本身的编码,最后依次连接各子列表的编码。编码的第一个字节的取值范围是[0xf8, 0xff]

```
例如,列表["The length of this sentence is more than 55 bytes, ", "I know it because I pre-designed it"]
1. "The length of this sentence is more than 55 bytes, "的长度为51(0x33),根据规则二得出:0x80 + 0x33 = 0xb3
2. "I know it because I pre-designed it"的长度为35(0x23),根据规则2得出:0x80 + 0x33 = 0xa3
3. 列表长度本身的编码为:51 + 35 + 2 = 88,即0x58
4. 最后根据规则5,0x58只占用一个字节,即0xf7 + 1 = 0xf8
编码结果为:[0xf8,0x58,0xb3,'T','h',...,'e','s',',',' ',0xa3,'I',' ','k',...,'i','t']
```

代码如下:

def rlp_encode(input):
    if isinstance(input,str):
        if len(input) == 1 and ord(input) < 0x80: return input
        else: return encode_length(len(input), 0x80) + input
    elif isinstance(input,list):
        output = ''
        for item in input: output += rlp_encode(item)
        return encode_length(len(output), 0xc0) + output

def encode_length(L,offset):
    if L < 56:
         return chr(L + offset)
    elif L < 256**8:
         BL = to_binary(L)
         return chr(len(BL) + offset + 55) + BL
    else:
         raise Exception("input too long")

def to_binary(x):
    if x == 0:
        return ''
    else: 
        return to_binary(int(x / 256)) + chr(x % 256)

RLP解码规则

根据RLP编码规则和过程,RLP解码的输入一律视为二进制字符数组,其过程如下:

  1. 根据输入首字节数据,解码数据类型、实际数据长度和位置;

  2. 根据类型和实际数据,解码不同类型的数据;

  3. 继续解码剩余的数据;

其中,解码数据类型、实际数据类型和位置的规则如下:

  1. 如果首字节(prefix)的值在[0x00, 0x7f]范围之间,那么该数据是字符串,且字符串就是首字节本身;

  2. 如果首字节的值在[0x80, 0xb7]范围之间,那么该数据是字符串,且字符串的长度等于首字节减去0x80,且字符串位于首字节之后;

  3. 如果首字节的值在[0xb8, 0xbf]范围之间,那么该数据是字符串,且字符串的长度的字节长度等于首字节减去0xb7,数据的长度位于首字节之后,且字符串位于数据的长度之后;

  4. 如果首字节的值在[0xc0, 0xf7]范围之间,那么该数据是列表,在这种情况下,需要对列表各项的数据进行递归解码。列表的总长度(列表各项编码后的长度之和)等于首字节减去0xc0,且列表各项位于首字节之后;

  5. 如果首字节的值在[0xf8, 0xff]范围之间,那么该数据为列表,列表的总长度的字节长度等于首字节减去0xf7,列表的总长度位于首字节之后,且列表各项位于列表的总长度之后;

代码如下:

def rlp_decode(input):
    if len(input) == 0:
        return
    output = ''
    (offset, dataLen, type) = decode_length(input)
    if type is str:
        output = instantiate_str(substr(input, offset, dataLen))
    elif type is list:
        output = instantiate_list(substr(input, offset, dataLen))
    output + rlp_decode(substr(input, offset + dataLen))
    return output

def decode_length(input):
    length = len(input)
    if length == 0:
        raise Exception("input is null")
    prefix = ord(input[0])
    if prefix <= 0x7f:
        return (0, 1, str)
    elif prefix <= 0xb7 and length > prefix - 0x80:
        strLen = prefix - 0x80
        return (1, strLen, str)
    elif prefix <= 0xbf and length > prefix - 0xb7 and length > prefix - 0xb7 + to_integer(substr(input, 1, prefix - 0xb7)):
        lenOfStrLen = prefix - 0xb7
        strLen = to_integer(substr(input, 1, lenOfStrLen))
        return (1 + lenOfStrLen, strLen, str)
    elif prefix <= 0xf7 and length > prefix - 0xc0:
        listLen = prefix - 0xc0;
        return (1, listLen, list)
    elif prefix <= 0xff and length > prefix - 0xf7 and length > prefix - 0xf7 + to_integer(substr(input, 1, prefix - 0xf7)):
        lenOfListLen = prefix - 0xf7
        listLen = to_integer(substr(input, 1, lenOfListLen))
        return (1 + lenOfListLen, listLen, list)
    else:
        raise Exception("input don't conform RLP encoding form")

def to_integer(b)
    length = len(b)
    if length == 0:
        raise Exception("input is null")
    elif length == 1:
        return ord(b[0])
    else:
        return ord(substr(b, -1)) + to_integer(substr(b, 0, -1)) * 256

参考链接

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,951评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,606评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,601评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,478评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,565评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,587评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,590评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,337评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,785评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,096评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,273评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,935评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,578评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,199评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,440评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,163评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,133评论 2 352

推荐阅读更多精彩内容