导入txt中文一直报错,先用UltraEdit转成了unicode-ascii escaped,导入是没问题了,再使用就不太好用了。
最终解决方案:
for item in df_rate1['content'].head(20):
print(item.encode('utf-8').decode('unicode-escape'))
2019.05.17更新,识别爬虫抓取网页编码:
print(web_data.encoding)
参考:
encode与decode讲解
1:字符串通过编码转换为字节码,字节码通过解码转换为字符串
str--->(encode)--->bytes,bytes--->(decode)--->str
后续编码相关问题均更新在本文档中。