1.初识编码
- ASCII:英文,一个字符占8位 = 1字节 2^8
- Unicode(万国码):一个字符占32位 = 4字节 2^32(常用于在内存中计算)
- UTF-8:对万国码进行压缩,用尽量少的位数表示,保留的位数必须是8的倍数,最少用1字节=8位,最多用4字节=32位表,中文3字节=24位(常用于数据传输)
- GBK 中文2字节=16位
2. Python解释器编码
- Pyhton2:ASCII
- Python3:UTF-8
指定Python解释器的编码
# -*- coding:utf-8 -*-
3.文件编码
建议:编写文件时,保存文件要用UTF-8格式