ascii
计算机只接受 “高”、“低”电压,所以使用二进制 1 和 0 分别代表高低电压
ascii 将 “字符”和“符号”转为二进制,在通过二进制转为电压让计算机识别
0-127 是 7 位ASCII 码的范围,是国际标准 0111 1111
byte
1 byte = 8 bit 就是8位二进制数 在不同语言中,字节范围不应,这主要取决于最高位是不是符号位
ascii 就是用一个字节,8位二进制表示一个字符或者符号
如 小写字母 a 的 ascii 编码是97,不同进制表示如下
二进制:01100001 (高四位 0110 低四位 0001)
十进制:26 + 25 + 20 = 64 + 32 + 1 = 97
了解了ASCII,再来看看其他编码和byte的关系
ASCII 英文一个字节
(美国发明 上)
(中国也要用计算机,也就需要一套字符编码集来表示汉字字符 下)
gb2312,gbk 中文两个字节,英文一个字节
在中文系统中ansi一般指gb2312或gbk
GB2312、GBK都属于双字节字符集 (DBCS)
(其他国家也需要计算机也就需要一套相应的字符编码来表示自己国家的字符)
Unicode 中文两个字节,英文两个字
(原来英文字符只占用一个字节,存放英文字符文档,unicode,会浪费一倍的空间)