Python如何查看文件的编码格式

有的时候无法打开文件,总是提示编码错误如下:

UnicodeDecodeError: 'gb2312' codec can't decode byte 0xe7 in position 514: illegal multibyte sequence

这种情况下我们可以采用二进制模式读取文件,然后查看文件的编码格式

>>> import chardet
>>> data =open(u"西游记.txt", "rb").read()
>>> chardet.detect(data)
{'encoding': 'GB2312', 'confidence': 0.99, 'language': 'Chinese'}


该文章于2017年9月23日于CSDN上首次发表,2017年12月24日搬家至此!

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容