Python3编码问题

导入txt中文一直报错,先用UltraEdit转成了unicode-ascii escaped,导入是没问题了,再使用就不太好用了。

最终解决方案:

for item in df_rate1['content'].head(20):
print(item.encode('utf-8').decode('unicode-escape'))

2019.05.17更新,识别爬虫抓取网页编码:

    print(web_data.encoding)

参考:
encode与decode讲解

Python爬虫起步:一步步解决中文乱码显示

1:字符串通过编码转换为字节码,字节码通过解码转换为字符串
str--->(encode)--->bytes,bytes--->(decode)--->str

后续编码相关问题均更新在本文档中。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。