- 一般情况下Windows在创建编辑文本时默认使用GB18030编码。该编码是全称:“国家标准 GB 18030-2005《信息技术 中文编码字符集》”。这是微软在本土化过程中必须采用的格式。
- Windows会使用带bom的utf-8编码,但是由于bom本身违反了一个UNIX设计的常见原则,就是文档中存在的数据必须可见。Linux下使用不带bom的utf-8。
- 大多数脚本语言解释器,都有通过注释等方式标明编码格式。
- 虽然Windows官方的软件大多对于不带BOM的utf-8的解码完全没有问题,但是仍然有问题存在,比如excel打开csv文件。
- 一个比较简单的解决Linux,Windows的编码问题的方式是采用带bom的utf-8。Linux除了shell基本都支持bom,而Window会正确识别带bom的utf-8。
一点关于文本编码的记录
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 原文地址 用java生成一个UTF-8文件(指定了utf-8格式了): 如果文件内容中没有中文内容,则生成的文件为...