计算机如何存储字符

字符分为英文字符和中文字符,这两种字符的存储方式不同。

计算机只能读懂二进制码,即0和1。计算机里的程序都是转换为0、1进行运算的。但二进制码对人类很不友好,每一个操作都需要输入一长串值包含0、1的数字,可读性差,难记,而且容易写错。因而,人们开发了编码方式,专门把人类的自然语言和计算机的二进制语言想对应。程序员只要用自然语言编写出代码,计算机里的编码方式就能自动把自然语言转成二进制语言,供计算机执行程序。

其中,英文字符的存储有两种编码方式为:ASCII和Latin-1。

ASCII:总共有128个,对所有的英文字母和符号进行了编码。

Latin-1:总共有256个,兼容ASCII,同时对欧洲符号进行了编码。

中文字符存储的编码方式有:GB2312、GBK、BIG5和Unicode。

GB2312:对六千多常用的汉字进行了编码,兼容ASCII。

GBK:对两万多汉字进行了编码,兼容GB2312。

BIG5:台湾繁体字编码,兼容ASCII。

Unicode:对世界上主要国家的主流语言进行了编码,兼容ASCII不兼容GBK,BIG5等,具体分为UTF-8,UTF-16,UTF-32三种存储方法。

补充:mysql默认使用Latin-1编码,与我们熟悉的UTF-8编码不同,会使得mysql中出现中文乱码。只需在脚本文件中设置客户端连接服务器端的编码为UTF-8,在服务器端创建数据库的时候设置编码为UTF-8即可。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 什么是字符集,什么是字符编码,它做什么用? 字符(Charcter)是文字与符号的总称,包括文字、图形符号、数学符...
    laravel阅读 2,507评论 0 0
  • 一、前言 为什么要进行编码,这些编码的关系如何,如ASCII,IOS-8859-1,GB2312,GBK,Unic...
    雪吹西门诗阅读 3,097评论 0 0
  • 在软件的编码和实现中,我们可能会碰到个一个比较头疼的问题--编码,不同字符间的编码和解码,你确定了解各种字符的编码...
    Java小铺阅读 7,245评论 0 5
  • 原文在这里:各种字符集和编码详解 在软件的编码和实现中,我们可能会碰到个 一个比较头疼的问题--编码,不同字符间的...
    舌尖上的大胖阅读 5,803评论 0 2
  • 他一米六五,她一米五零,从一开始,他俩听到的规劝就是“别着了!太矮!” 其实他俩本没有什么交集。那时她坐前排,他坐...
    彼岸很美阅读 2,958评论 0 0