Python基础--编码(个人笔记)

编码史

  • ASCII
    最初计算机只使用英文及个数有限的字符,这样8个比特可以表示256个字符,足够当时的情况。
  • GB2312 & GBK
    计算机开始普及,进入中国国家标准总局发布了GB2312,收录了6763个汉字。
    由于其不能满足100%中国人的要求,后来又发布了GBK编码,收录了27848个汉字。
  • Unicode
    为了国际通用,统一联盟国际组织提出了Unicode编码。覆盖全部国家的文字及符号。
  • UTF-8
    UTF-8作为一种Unicode编码的实现方式,在互联网中使用广泛。可以根据具体情况使用1-4个字节表示一个符号。

Python字符编码

Python2

在Python2中,普通字符串是以8位ASCII码进行存储的。若无指定编码,则无法在源码中出现非ASCII字符。

一般在首行加上如下代码:

#!/usr/bin/python
# -*- coding: utf-8 -*-

Python3

在Python3中,所有的字符串都是Unicode字符串。

Python中的字符转换

字符转换

编解码函数

#str与bytes类型相互转换

str.encode(encoding='UTF-8',errors='strict')
bytes.decode(encoding="utf-8", errors="strict")

在实际编写过程中要同一编码防止乱码的发生。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 可以看我的博客 lmwen.top 或者订阅我的公众号 简介有稍微接触python的人就会知道,python中...
    ayuLiao阅读 8,430评论 1 5
  • 字符集和编码简介 在编程中常常可以见到各种字符集和编码,包括ASCII,MBCS,Unicode等字符集。确切的说...
    兰山小亭阅读 12,797评论 0 13
  • 数据库选择: MySQL 数据库名: pxxyca_website 数据库表: 表名全部小写,均使用ca_s+子系...
    年轻人Moriarty阅读 4,355评论 0 0
  • 好种子 1、早上给同士带了苹果,种下了分享的好种子。 2、中午在新开的烘焙房买了面包,种下了财富的种子,希望他们生...
    快乐妈妈说阅读 1,560评论 0 3
  • 前些天独自从丽江束河到香格里拉。徒步的目的地是拉萨。 微风不燥,夹杂着凉气钻进我衣襟,撩动着挂满在背脊的汗珠。 “...
    吃颗糖啦阅读 11,405评论 8 30