Python2 编码问题

  • python使用unicode作为中间编码

s.decode('gb2312') 表示将s以gb2312的方式解码为unicode编码
s.encode('gb2312') 表示将s从unicode编码转换为'gb2312'

  • Python2的源码中在第一行添加:# -*- coding: utf-8 -*-

表示解释器在处理该文件时使用utf-8的格式。也就意味着我们定义a_str='你好'时a_str类型为str,但是其编码格式为utf-8.


其他:

  • unicode是一个标准,以32位长度为基础,给所有的符号以唯一的编号
  • 以unicode的方式将数据存储的话,比较浪费空间,所以出现了utf-8,utf-32等基于unicode的编码格式
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 字符集和编码简介 在编程中常常可以见到各种字符集和编码,包括ASCII,MBCS,Unicode等字符集。确切的说...
    兰山小亭阅读 12,877评论 0 13
  • 由于工作的需要,用了很久的python3又转回来用Python2,所以编码问题又摆在了面前。先看一下python2...
    Cindy小隐阅读 3,452评论 0 0
  • 几个基本概念 bit二进制位, 是计算机内部数据储存的最小单位,11010100是一个8位二进制数。一个二进制位只...
    西电大侠阅读 8,931评论 1 8
  • 可以看我的博客 lmwen.top 或者订阅我的公众号 简介有稍微接触python的人就会知道,python中...
    ayuLiao阅读 8,455评论 1 5
  • http://python.jobbole.com/85231/ 关于专业技能写完项目接着写写一名3年工作经验的J...
    燕京博士阅读 12,229评论 1 118