登录注册写文章

关于中文的编码格式

关于中文的编码格式

char foo='中'？

Java语言中，中文字符所占的字节数取决于字符的编码方式，一般情况下，采用ISO8859-1编码方式时，一个中文字符与一个英文字符一样只占1个字节；采用GB2312或GBK编码方式时，一个中文字符占2个字节；而采用UTF-8编码方式时，一个中文字符会占3个字节

在java中，char和byte都是基础数据类型，其中的byte和C++中的char类型是一样的，8位，1个字节，-128-127。但是，char类型，是16位，2个字节， '\u0000'-'\uFFFF'。

为什么java里的char是2个字节？

因为java内部都是用unicode的，所以java其实是支持中文变量名的，比如string 世界 = "我的世界";这样的语句是可以通过的。

还有各种编码 ascii 最基本的一种编码方式，一字节8位可以表示从0到127的数，ascii就是将简单的数字字母和符号与0到127的8位二进制建立一个映射 gb2312 简体中文的编码方式 BIG5 繁体中文的编码方式 gbk 亚洲所有文字的编码方式 unicode 所有国家文字的编码方式，万国码 utf-8 可变长度的万国码

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

深入分析 Java 中的中文编码问题http://www.ibm.com/developerw...
编码问题一直困扰着开发人员，尤其在 Java 中更加明显，因为 Java 是跨平台语言，不同平台之间编码之间的切换...
x360阅读 7,188评论 1赞 20
几种常见的编码格式
为什么要编码不知道大家有没有想过一个问题，那就是为什么要编码？我们能不能不编码？要回答这个问题必须要回到计算机是...
艾小天儿阅读 17,711评论 0赞 2

字符、编码和Java中的编码
字符是用户可以读写的最小单位。计算机所能支持的字符组成的集合，就叫做字符集。字符集通常以二维表的形式存在。二维表的...
刘惜有阅读 12,534评论 2赞 14
【字符编码】你真的了解字符编码吗
腾讯大讲堂——字符编码的前世今生字符串，那些你不知道的事编码字符集标准及分类研究通信用語の基礎知識 —— ISO/...
AItsuki阅读 5,262评论 0赞 4
特战四连五班
今天是开营第一天，我们一起迎来了我们的小战士们，来到这里，你们放下的是手机和电脑，摒弃的是散漫和懒惰，但你们收获的...
6ef943a477f4阅读 2,844评论 1赞 0

赞1赞

赞赏

手机看全文