Python下的encode和decode

  • s是某编码格式的字符串

  • s.encode('xxx') 将Unicode格式的字符串s,编码为xxx格式 (这里的s一定要是Unicode的类型的)

  • s.decode('xxx') 将xxx格式的字符串s,按xxx进行解码为Unicode格式


  • Unicode内部是什么样子的呢

>>> u'嘻嘻'

u'\u563b\u563b'

  • UTF8呢

>>> s = u'嘻嘻'.encode('utf8')

>>> s

'\xe5\x98\xbb\xe5\x98\xbb'


  • 关于拼接转移字符串和编码
    举个例子,想要把gb2312编码的字符串'\x'和'01'拼接起来并输出,有什么办法吗?
    直接'\x'+'01'这样会出错。

方法是取消转义,然后用用指定的方法来解码:
(string-escape和unicode-escape都可以)

>>>(r'\x' + '01').decode('string-escape')
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容