学习所用,可随意转载,转载请注明出处,或在本文下方留言说明即可,谢谢!
对于一个中文文本分词,运行出错,结果如下:
'utf-8' codec can't decode byte 0xb2 in position 0: invalid start byte
万恶的编码问题,初步可以看出事编码问题,突然想到txt文件自带编码,赶紧打开发现
果然是默认的编码是“ANSI”,改为“utf-8”即可。
学习所用,可随意转载,转载请注明出处,或在本文下方留言说明即可,谢谢!
对于一个中文文本分词,运行出错,结果如下:
'utf-8' codec can't decode byte 0xb2 in position 0: invalid start byte
万恶的编码问题,初步可以看出事编码问题,突然想到txt文件自带编码,赶紧打开发现
果然是默认的编码是“ANSI”,改为“utf-8”即可。