python2的编码问题

在使用Python2做中文相关代码时候,如果不是很熟悉Python2中的编码,那么十有八九你会被这个搞的很烦,所以下面就把编码问题搞个明白

名词解释

ASCII码

个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定。这被称为ASCII码,一直沿用至今。

ASCII码一共规定了128个字符的编码,比如空格"SPACE"是32(二进制00100000),大写的字母A是65(二进制01000001)。这128个符号(包括32个不能打印出来的控制符号),只占用了一个字节的后面7位,最前面的1位统一规定为0

Unicode编码

英语只用ASCII码就足够了,但其它语言不行啊,所以就会有很多编码方式。编码方式不同,就会出现乱码的问题。

那么这时候有这么一种编码,把所有的符号都纳入其中,就不再会有乱码的问题,这就是Unicode。

UTF-8

UTF-8就是Unicode的一种实现方式,是当前比较通用的一种编码方式。为什么不直接用Unicode呢,因为太浪费空间了。

为什么要编码和解码

计算机内存中,统一使用Unicode编码,需要保存或者传输时,转换成UTF8编码。

那么编码就是从Unicode转换成UTF-8或者ASCII,解码就是从UTF-8或ASCII转化为Unicode。

编码和解码是为了不出先乱码,可以正常的读写。

Python2中的编码

声明文件

Python2中默认的文件编码格式为ASCII码,所以我们一般会在文件开头声明文件编码为UTF-8.

# -*- coding: utf-8 -*-
  1. 如果不设置声明文件,则按照python2默认的ASCII码编码方式
  2. 如果声明编码和实际编码不一致,则会按照实际编码读取

str和unicode

其次Python2中的有两种类型,一种是 str,另一种是 unicode,如下

str1 = '中国'
print type(str)   #str
str2 = u'中国'
print type(str2)  #unicode

从str到unicode为解码,从unicode到str为编码,在输出的时候,输出为unicodes时可以正常显示,这样是较为通用的一种形式。

# -*- coding:utf-8 -*-

str1 = u"你好"
print str1  # unicode正常输出
str2 = str1.encode('utf-8') # 编码为UTF-8的格式
print str2    # 乱码
str3 = str1.encode('gbk')   # 编码为GBK格式
print str3    # gbk格式正常输出

输出unicode不会乱码,windows下控制台的编码格式为gbk,所以编码为gbk格式不会出错,但编码为UTF-8和控制台gbk不符所以乱码。

# -*- coding:utf-8 -*-

str1 = "你好"
print str1  # 编码UTF-8 乱码
str2 = str1.decode('utf-8') # 解码为unicode
print str2  # unicode正常显示
str3 = str1.decode('utf-8').encode('gbk') # 编码为gbk和控制台一致正常显示

总结

文件实际编码格式和声明编码格式统一采用UTF-8,涉及到存储相关的统一转换为unicode,输出时候再转换为UTF-8或者gbk即可。

--EOF--

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,951评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,606评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,601评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,478评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,565评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,587评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,590评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,337评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,785评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,096评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,273评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,935评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,578评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,199评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,440评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,163评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,133评论 2 352

推荐阅读更多精彩内容