★encoding | encoding包定义了供其它包使用的可以将数据在字节水平和文本表示之间转换的接口.
编码在之前一直是一个重大问题,更可读的?效率更高的?轻量级的?重量级的?多种编码类型共存。
encoding
encoding定义了四个接口(并没有多少对象去实现,甚至目录下的子包):
// 实现了本接口的对象可以把自身编码为二进制,并作为返回值返回
type BinaryMarshaler interface {
MarshalBinary() (data []byte, err error)
}
// 实现了本接口的对象可以把二进制编码为自身,接受者应该为指针,传参应该是TextMarshaler生成的二进制
type BinaryUnmarshaler interface {
UnmarshalBinary(data []byte) error
}
// 实现了本接口的对象可以把自身编码为文本,并作为返回值返回
type TextMarshaler interface {
MarshalText() (text []byte, err error)
}
// 实现了本接口的对象可以把文本编码为自身,接受者应该为指针,传参应该是TextMarshaler生成的文本
type TextUnmarshaler interface {
UnmarshalText(text []byte) error
}
encoding中有多个子包,实现了多种编码格式:
- ascii85:用于btoa工具、Adobe的PostScript 脚本和PDF文档格式,资料很少
- asn1:证书组成结构标准用ASN.1来进行描述,如X.509
- base32:使用了可打印的字符中的32个(A~Z和2~7)对任意字节数据进行编码
- base64:使用了可打印的字符中的32个(A~Z,a~z,0~9,"+","/")对任意字节数据进行编码
- binary:实现了了VarInt编码,低位在前,单byte最高位为1代表有后续字节,使用zig-zag编码映射有符号数(在最低位:正数x.VarInt=2x+0,负数x.VarInt=2x+1)
- csv:逗号分隔值Comma-Separated Values编码,记录之间用'\n'分割
- gob:rpc的编码格式
- hex:编码为16进制小写字符"0x3e",效率低下
- json:json编码
- xml:xml编码
- pem:常见在证书、密钥格式,包含Type(
-----BEGIN TYPE-----
)和内容(base64格式)与可选的Headers(asd: dsa),如:
pem.Block{
Type: "pem",
Headers: m,
Bytes: []byte("山东核炸朝鲜"),
}
结果:
-----BEGIN pem-----
asd: das
5bGx5Lic5qC454K45pyd6bKc
-----END pem-----