[解决] 'gbk' codec can't decode byte 0xbb in position 53: illegal multibyte sequence

今天本人在用python读取csv文件格式数据并进行处理的过程中(如何读取方式参考另一篇短文),遇到了一个编译报错信息 'gbk' codec can't decode byte 0xbb in position 53: illegal multibyte sequence,如下图。

图1 报错信息

通过网上搜索,我找到了一些对我来说都不适用的解决方案,这里先罗列一下。

1、加上 encoding用 utf-8 编码打开,如第10行,with open("06142222.csv", 'r',encoding = utf-8) as f: 

2、加入 ‘ignore’,表示忽略错误,如第十行,with open("06142222.csv", 'r','ignore') as f:

但是这两个方法对我来说并不适用,并且在之前的那篇短文中,这个程序是可以运行的,于是,我开始怀疑数据本身格式的问题。这里我把这个csv文件中的数据复制到notepad++中查看,果然,发现了一些异样,如下图。

图2 csv中数据
图3 notepad++打开数据

可以发现,在csv中看似整整齐齐的数据,在notepad++中却存在错乱的问题,由于我的数据样本不大,经过我人为的调整之后,再次运行程序,直接通过。好了,回到这个csv数据格式的问题上,为什么会出现这样的问题,我在想这可能是我人为调整过csv源数据造成的。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容