Python:把GBK编码字符转换成UTF8

最近在试图爬一个编码为GBK的网页,始终得到的都是乱码,各种encode和decode都不行,后来在网上搜索了一下,终于找到了解决方法,记在这里备用。
如果s是一个GBK编码字符,使用如下办法可以转换成UTF8.

s.encode('latin-1').decode('gbk').encode('utf-8')
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容