1
做了一个简单的DHCP客户端,深入了解了一下字节和类型。代码片段如下:
static void DumpUInt(const char* title, unsigned int n) {
assert(title != NULL);
printf("%s %u\n", title n);
unsigned char* bytes = (unsigned char*)&n;
for (int i = 0; i < sizeof(n); ++i) {
printf("%02x ", bytes[i]);
}
printf("\n");
}
int main() {
// ...
/*
struct Buffer {
char* base;
size_t len;
}
*/
unsigned char*bytes = (unsigned char*)buf->base;
printf("network\n");
for (int i = 16; i < 20; ++i) {
printf("%02x ", bytes[i]);
}
printf("\n");
unsigned int* asInt = (unsigned int*)buf->base;
unsigned int ipbin = ntohl(asInt[4]);
unsigned char ip[4] = {0};
for (int i = 0; i < 4; ++i) {
ip[i] = (ipbin >> i * 8) & 0xFF;
}
LOGINFO("Offered IP: %d.%d.%d.%d", ip[3], ip[2], ip[1], ip[0]);
DumpUInt("asInt[4]", asInt[4]);
DumpUInt("ipbin", ipbin);
// ...
}
网络数据存储在buf->base
中。数据块的第17-20字节存的是DHCP服务器返回的IP地址。一般我都会直接转成字节流,去读第多少个字节。但参考的代码使用了unsigned int
指针。这只是为了便利地访问到想要的数据:asInt[4]
。觉得这种方法挺有意思,就打印了一下值。打印结果如下:
network
0a 0b 3f 07
[18-07-26 XX:XX:XX][INFO]Offered IP: 10.11.63.7
asInt[4] 121572106
0a 0b 3f 07
ipbin 168509191
07 3f 0b 0a
这段代码跑在Win10 X64上。现在把感兴趣的数据拿出来:
network
a. 0a 0b 3f 07 网络序列
asInt[4]
121572106
b. 0a 0b 3f 07 网络序列
c. 07 3f 0b 0a asInt[4]的十六进制格式
ipbin
168509191
d. 07 3f 0b 0a 主机序列
e. 0a 0b 3f 07 ipbin的十六进制格式
IP
10.11.63.7
f. 0a 0b 3f 07 最终的IP结果
从asInt[4]
和ipbin
的打印可以看到,无论内存中是什么数据,unsigned int
指针都会从起始位置读取4个字节按照本机的序列来解析它。按类型读取出的数据和ntohl
转换出来的数据是一样的。这个结论在大端机上也适用。
看了一下glibc的源码,发现ntohl
只是简单的反序了参数的字节。如果知道读取的内容是什么类型时,可以不必给字节转序,直接使用该类型的指针读取就好了。
2
字节序是已字节为最小单位的。如果收发的数据都是单字节数据,那么不必考虑字节序的问题。不过,如果使用了bit filed特性,就需要考虑字节内的位序了。大端单字节的位序和小端单字节的位序是相反的。按位读取的时候如果不考虑位序就会出问题。例如,定义一个IP头数据结构:
typedef struct IPHeader {
// {{
unsigned char ipHeaderLength : 4;
unsigned char ipVersion : 4;
// }}
unsigned char typeOfService;
unsigned short ipTotalLength;
unsigned short ipId;
// {{
unsigned char ipFragmentOffset : 5;
unsigned char ipMoreFragment : 1;
unsigned char ipDontFragment : 1;
unsigned char ipReservedZero : 1;
// }}
unsigned char ipFragmentOffset1;
unsigned char ipTTL;
unsigned char ipProtocol;
unsigned short ipChecksum;
unsigned int ipSrcAddr;
unsigned int ipDstAddr;
} IPV4Header, *PIPV4Header, FAR* LPIPV4Header;
上面IP头的定义中Version和Header Length反了,同样,保留0字段,不分片字段,分片字段,分片偏移的顺序也反了。这就是考虑了大端和小端的位序不同。