1.整型数据类型
- C语言支持多种整型数据类型,例如char、short、int等,64位机器上,不同的数据类型所表示的数值的范围。关于long类型的大小需要注意,取值范围与机器字长有关。在64位机器上,long类型占8个字节;在32位机器上,long类型占4个字节。
- 当变量声明中带有unsigned关键字时,限制了表示的数字只能是非负数。在计算机领域,非负数通常称为无符号数。C语言中支持无符号数和有符号数,有符号数既可以是正数,也可以是负数。
2.无符号数unsigned的编码
- 假设一个整数的数据类型有w位,用向量x来表示。如果把向量x看成一个二进制表示的数,向量x中每一个元素表示一个二进制位,其中每个位的取值是0或1。使用一个函数B2U来表示一个长度为w的0、1串是如何映射到无符号数的。
3.有符号数signed的编码
- 计算机中对于有符号数的编码采用补码的方式,假设一个整数的数据类型有w位,用向量x来表示。如果把向量x看成一个二进制表示的数,向量x中每一个元素表示一个二进制位,其中每个位的取值是0或1。需要注意:对于有符号数,最高位的权重是-2的w-1次方。当最高位等于1时,表示负数;当最高位等于0时,表示非负数;因此,最高位也称为符号位。
- 注意:对于有符号数-1,无论字长是8位还是64位,有符号数-1的补码是一个全为1的串,-1的补码与无符号数的最大值有着相同的二进制表示。
4.无符号数与有符号数之间的转换
-
对于大多数C语言的实现,有符号数和无符号数之间的转换规则是:位模式不变,但是解释这些位的方式改变了。
short int a = -12345; unsigned short b = (unsigned short)a; printf("a = %d, b=%u", a, b); a = -12345, b = 53191 -12345: 1100 1111 1100 0111 53191: 1100 1111 1100 0111
对于相同位模式,不同的函数映射所导致的数值差异。无符号数与有符号数的函数映射关系如下所示:
有符号数转无符号数:T2U来表示有符号数到无符号数的函数映射。当最高位x_w-1等于1时,此时有符号数x表示一个负数。经过转换后,得到的无符号数等于该有符号数加上2的w次方;当最高位x_w-1等于0时,此时有符号数x表示一个非负数。经过转换后,得到的无符号数等于该有符号数;
无符号数转有符号数:U2T来表示无符号数到有符号数的函数映射。当最高位等于0时,无符号数可以表示的数值小于有符号数的最大值。此时,转换后的数值不变;当最高位等于1时,无符号数可以表示的数值大于有符号数的最大值。在这种情况下,转换后得到有符号数等于该无符号数减去2的w次方;
-
在C语言中,执行一个运算时如果一个运算数是有符号数,另一个运算数是无符号数。那么,C语言会隐式的将有符号数强制转换成无符号数来执行运算。
int a = -1; // 有符号数-1会转换成无符号数2的32次方 - 1 unsigned int b = 0; if(a < b) printf("-1 < 0"); else printf("-1 > 0"); // 输出这句
-
C语言中还有一个常见的运算是在不同字长的整数之间进行转换,将一个较大的数据类型转换为一个较小的数据类型。由于目标数据类型太小,想要保持数值不变是不可能的。然而,将一个较小的数据类型转换成一个较大的数据类型时,保持数值不变是可以的。
// 无符号数的扩展:从较小数据类型转换成较大数据类型 unsigned char a; // 8位 unsigned short b; // 16位
- 将有符号数转换成一个较大的数据类型,需要执行符号位扩展,这个符号位就是最高位。当有符号数表示非负数时,最高位是0。此时,扩展的数位进行补0即可;当有符号数表示负数时,最高位是1。此时,扩展的数位需要进行补1;
- 将有符号数转换成一个较小的数据类型,例如int类型转成short类型,int类型的高16位数据被丢弃,留下低16位数据。因此,截断一个数字,可能会改变它原来的数值。
- 将一个w位的无符号数,截断成k位,丢弃最高的w-k位。截断操作可以对应于取模运算。对于二进制取模运算,通俗的理解是除以2的k次方后得到的余数。
5.参考资料
[1].本文图片来源,侵权必删:https://www.bilibili.com/video/BV1cD4y1D7uR?p=7