编码:将字符串转换为二进制数据(bytes)
解码:将bytes类型的数据转换为字符串类型
encode 编码的意思
格式:.encode(" 编码") 编码有很多种:UTF-8,GBK
编码:
a="你好" 注释:encode() 编码后会返回一个「Bytes类型」的结果,而不是「str类型」,下面缩写为b bytes:字节的意思
print(a.encode("GBK")) b'\xc4\xe3\xba\xc3' GBK编码格式时,一个中文对应两个字节
print(a.encode("UTF-8")) b'\xe4\xbd\xa0\xe5\xa5\xbd' UTF-8编码格式时,一个中文对应三个字节
解码:
decode 解读,破译的意思
a="你好" a="你好"
c=a.encode("GBK") c=a.encode("UTF-8")
print(c.decode("GBK")) print(c.decode("GBKUTF-8"))
你好 你好
注释:c 代表二进制的数据(字节类型的数据)
decode() 会将「bytes类型」转成「str类型」,这意味着它只能解码bytes类型的字符串
bytes类型格式是 b'xxx',如果只有str形式的字符串(比如 '\xe5\xbc\xa0\xe4\xb8\x89'),可以在前面加上b,变成bytes类型,再进行解码
c=a.encode("GBK")
print(c.decode("GBK"))