使用python3的理由之中文编码,python2的编码实在是有点难受,经常出现奇怪的bug,总结一下方法:
- 文件指定utf8:
在文件头添加
# coding: utf-8 -*-
或者
#coding=utf-8
注意此处等号两边不要空格,bash的好习惯
- 文件中字符串指定编码方式:
unicode('中文','utf-8')
- 使用pandas读入的时候指定编码格式:
pd.read_csv(filename,header=None,encoding="utf8")
使用python3的理由之中文编码,python2的编码实在是有点难受,经常出现奇怪的bug,总结一下方法:
# coding: utf-8 -*-
或者
#coding=utf-8
注意此处等号两边不要空格,bash的好习惯
unicode('中文','utf-8')
pd.read_csv(filename,header=None,encoding="utf8")