今天偶然碰到补码反码,才发现自己一直搞错了一个事实,n位二进制表示的原码,反码,补码范围是不一样的。于是重新在纸上画一画,总结总结。
以8位2进制为例:
码制 | 范围 |
---|---|
原码 | -127 ~ 127 |
反码 | -127 ~ 127 |
补码 | -128 ~ 127 |
为什么补码会比原码和反码多一个呢?8位2进制编码结果一共有256种。原码和反码表示的数127*2+1=255,而补码是128+127+1=256,为什么补码多一个呢?
- 原码:
0000 0000 ~ 0111 1111 : 0 ~ 127
1000 0000 : -0
1000 0001 ~ 1111 1111: -1 ~ -127
反码:正数的反码和原码一致,负数的反码是原码除符号位以外取反
0000 0000 ~ 0111 1111 : 0 ~ 127
1111 1111 : -0
1111 1110 ~ 1000 0000 : -1 ~ -127补码:正数的补码和反码一致即和原码一致,负数的补码是反码加1
0000 0000 ~ 0111 1111 : 0 ~127
[1]0000 0000: -0
1111 1111 ~ 1000 0001 :-1 ~ -127
注:[1]截断,则0和-0相同,和数学统一。
从上面可以看出:[+0]和[-0]的原码和反码都是不一样,而补码是一样的。所以原码和反码只有255个,补码多出一个编码1000 0000没有用,于是规定用这个来表示-128。
顺便在谈一点为什么计算机采用补码表示数值?
- 因为原码和反码中0有2种编码规则,而补码只有一种。
- 更重要的是看下面:
- [1]原 - [1]原 = [1]原 + [-1]原:
0000 0001 + 1000 0001 = 1000 0001 显然结果是错的。 - [1]反 - [1]反 = [1]反 + [-1]反:
0000 0001 + 1111 1110 = 1111 1111 = -0 在数学中0没有正负。 - [1]补 - [1]补 = [1]补 + [-1]补:
0000 0001 + 1111 1111 = [1]0000 0000 [1]截断,此时结果为0的补码。正确
- [1]原 - [1]原 = [1]原 + [-1]原:
从上面看出,补码运算时不需要考虑符号位的问题,符号位可以直接参与计算,且0的表示方式唯一不分正负,也是符合数理逻辑。
顺便说到,unsigned int 使用有时候要注意:
// 伪代码
for (unsigned int8 n = 5; n >= 0; n--) {
//...
}
这种写法应该是一种死循环,[0] - [1] = [0] + [-1] = 0000 0000 + 1111 1111 = 1111 1111。定义为unsigned时,编译器会采用无符号数来解释,于是[1111 1111]被解释为512。也就永远不会跳出循环。
- 移位运算
算术移位