现象
打印任何一种包含有中文的对象,字典、列表、DataFrame、或字符串。比如:
print('中文')
控制台报错:
Traceback (most recent call last):
File "printcn.py", line 1, in <module>
print('\u4e2d\u6587')
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)
查找原因:
如果是python 2.X的话需要在文件中加上 # -- coding: utf-8 -- 、以及 reload(sys) sys.setdefaultencoding("utf8") 。但是Python3应当默认就使用utf8编码,而且即使设置了这些也仍然不能正常打印。
有些人说用encode('utf-8')函数解决,但如果直接打印字典或DataFrame,总不能每个元素都encode一般吧。
最终查看了一下系统环境编码
>>> import sys
>>> sys.stdout.encoding
'US-ASCII'
解决办法
(1)设置环境变量LANG
在linux或Mac上设置环境变量的方式一样,编辑/.bash_profile文件(''指的是用户登录后的默认目录),添加一行:
export LANG="en_US.UTF-8"
(2)使用PYTHONIOENCODING
在运行python命令前添加参数 PYTHONIOENCODING=utf-8 python printcn.py
该参数的解释可查看官方文档:https://docs.python.org/3.6/using/cmdline.html#envvar-PYTHONIOENCODING
(3)重新定义标准输出
在代码中添加 sys.stdout = codecs.getwriter("utf-8")(sys.stdout.detach()) ,使代码变为:
import sys
import codecs
sys.stdout = codecs.getwriter("utf-8")(sys.stdout.detach())
print('中文')