Linux ubuntu TXT 乱码问题

年纪大了,容易忘事情,记录下来,今天先留下关于ubuntu系统下面.txt乱码的问题。

这个乱码的主要原因是中文编码的问题,windows下打开正常,linux下面打开就有问题了,要么如我,从网上下载了一个文件,linux里先打开,是乱码,然后去windows打开,亦然是乱码。根据网上提示,windows下编码用的是GB2312,而linux下则使用的是UTF-8,所以要想两方都能打开,那只有在编码方式上下功夫了。

检查文件编码方式:   file   --mime-encoding 文件名\file  文件名

网上说: GB2312是国家制定的汉字编码标准,使用双子节进行编码,共收入6763个汉字和682个非汉字图形字符。GBK即对国标编码的扩展,在GB2312的基础上进行扩展形成的,使用双子节编码方式,共收入21003个汉字,从而大大满足了汉字使用的需要。 iso8859采用单字节编码, GB2312采用双字节编码,兼容iso8859。而GBK是对gb2312的扩展,在双字节上增加了更多的汉字,所以可以采用GBK的方式进行转码。

所以直接改文件的编码格式的话刻意采用如下命令:      sudo iconv     -f    'gbk'   -t   'utf-8'  源文件名>目标文件名\  iconv  -f  gb2312 -t  utf-8  -c    源文件名>目标文件名

不过奇怪的是,直接使用  iconv -f iso-8859-1  -t  utf-8居然是不行的,文件编码格式貌似改了,但是打开依然是乱码。iconv -l检查了一下系统支持的编码格式,的确有iso8859,不过为什么转不了暂时还不明白。

当然也可以在windows下面将文件从GBK 转到utf-8,不过这个方法我没有试过,暂时不知道成功与否。
F:\>for /r C4-Literature %i in (*.txt) do iconv.exe -f gbk -t utf-8 %i > %~ni.txt

还有想法是将打开文件用的编辑器更改其默认编码方式,具体没有试过,可以参考如下链接尝试。

参考链接:
www.linuxdiyf.com/linux/29770.html
https://blog.csdn.net/G_66_hero/article/details/66475746
www.cnblogs.com/zhangchaoyang/articles/2140311.html

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 1. 概述 本文主要包括以下几个方面:编码基本知识,java,系统软件,url,工具软件等。 在下面的描述中,将以...
    骚的掉渣阅读 1,231评论 0 0
  • 编码问题一直困扰着开发人员,尤其在 Java 中更加明显,因为 Java 是跨平台语言,不同平台之间编码之间的切换...
    x360阅读 2,516评论 1 20
  • ――聚焦目标,挖掘资源 (一)·聚焦正向,我有!我能! 自从打定接受“生涯规划课”的念头...
    箫音声声阅读 150评论 0 0
  • 你恋旧么? 恋旧这个词,似乎好久没有出现在我们的字典里。旧是什么?一个旧物,一段旧情,还是一个故人。我想,此刻看着...
    长亭微雨阅读 219评论 0 0
  • 小组组别:酒店管理1601 第一组 小组成员:林逸 陈潇杨 张杭吕德喜 冯宏涛 胡樊军陈弘翰 小组分工:文档制作:...
    破碎的星辰_5f38阅读 2,118评论 0 1