ACSII码不包含中文, 报语法错误
检查系统的默认编码
import sys
print sys.getdefaultencoding()
声明编码
1,#coding=utf-8
2,# -- coding:utf-8 --
打开文件有中文
1,打开文件
2, f = open(“路径/文件名”,“r”)
content = f.read()
f.close()
3,content.decode(“gbk”).encode(“utf-8”)
python 编码机制
内部所有编码为Unicode编码 Unicode属于一个中转码
中文的编码是gbk编码
utf-8 万国码 是Unicode的分支
乱码—》Unicode编码—-》转换为需要的编码
decode()—>Unicode中转码—》encode()
isinstance()数据判断
if isinstance(content,unicode):
print cotent.encode(“utf-8”)
else:
pint conten.decode(“gbk”).encode(“utf-8”)