[解决] 'gbk' codec can't decode byte 0xbb in position 53: illegal multibyte sequence

今天本人在用python读取csv文件格式数据并进行处理的过程中（如何读取方式参考另一篇短文），遇到了一个编译报错信息 'gbk' codec can't decode byte 0xbb in position 53: illegal multibyte sequence，如下图。

图1 报错信息

通过网上搜索，我找到了一些对我来说都不适用的解决方案，这里先罗列一下。

1、加上 encoding用 utf-8 编码打开，如第10行，with open("06142222.csv", 'r'，encoding = utf-8) as f:

2、加入 ‘ignore’，表示忽略错误，如第十行，with open("06142222.csv", 'r'，'ignore') as f:

但是这两个方法对我来说并不适用，并且在之前的那篇短文中，这个程序是可以运行的，于是，我开始怀疑数据本身格式的问题。这里我把这个csv文件中的数据复制到notepad++中查看，果然，发现了一些异样，如下图。

图2 csv中数据

图3 notepad++打开数据

可以发现，在csv中看似整整齐齐的数据，在notepad++中却存在错乱的问题，由于我的数据样本不大，经过我人为的调整之后，再次运行程序，直接通过。好了，回到这个csv数据格式的问题上，为什么会出现这样的问题，我在想这可能是我人为调整过csv源数据造成的。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。