廖雪峰曾经曰过:用记事本编辑的时候,从文件读取的UTF-8字符被转换为Unicode字符到内存里,编辑完成后,保存的时候再把Unicode转换为UTF-8保存到文件(链接)
事件:在网上下载《西游记》txt做文本分析,发现一只read不成功,编码是GBK
廖雪峰曾经曰过:用记事本编辑的时候,从文件读取的UTF-8字符被转换为Unicode字符到内存里,编辑完成后,保存的时候再把Unicode转换为UTF-8保存到文件(链接)
事件:在网上下载《西游记》txt做文本分析,发现一只read不成功,编码是GBK