前言
计算机仅仅能识别 “0” 和 “1”,这是由于电路的逻辑决定的。电路只有 “开” 和 “关” 两种状态。一切存储在计算机中的数据都是逻辑,或者说信息在计算机中的表示(数据)就是是一串”0”和”1”的组合。
1.如何存储数字
我们平时所说的数值一般都是十进制的,但计算机内部是采用二进制形式存储,所以需要将十进制的数转为二进制让计算机进行储存。
整数:直接转为二进制。
负数:由于计算机无法存储负号(-),所以对于负数(-100)的存储就需要使用补码。
小数:由于计算机无法存储小数点(.),所以对于小数(3.14)的存储就需要使用浮点数。
2.如何存储字符
ASCII(American Standard Code for Information Interchange:美国信息交换标准代码)
根据ASCII表将每个字符对应的ASCII值转成二进制存储到计算机中。
3.如何存储中文
GBK字符集 (GBK即“国标”、“扩展”汉语拼音的第一个字母,英文名称:Chinese Internal Code Specification)
中文的存储根据GBK中对应的code值转为二进制进行存储。
4.如何存储所有字符
1.Unicode
Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。
缺点:Unicode使用 32 位(4字节)来存储字符,导致表示简单的字符时也使用4个字节,浪费了很多资源。
2.UTF-8
UTF-8是一种编码方式,不是字符集。
优点:UTF-8的特点是对不同范围的字符使用不同长度的编码,节省了资源。