理解这几个概念前,首先要遵循计算机以及通信中的几个规则:
1. 一个数字转化为16进制后,最左边的字节是最高字节,最右边的字节为最低字节。
2. 计算机中内存的最小单位是字节,也就是8个bit。读写数据时,先使用低地址,再用高地址内存。
3. 数据传输过程中,也是按1个字节1个字节传输的,发送时,先发送低地址的内存;接收时,把先接收到的数据存放在较低内存中。
1.主机字节序
比如现在有一个数a,值为857870592,转化成16进制为0x33221100,根据规则1:其中00是最低字节,33是最高字节。a一共占了4个字节,刚好需要4个字节的内存。
现在有一块内存,其中地址100是低地址内存,地址103是高地址内存:
地址 | 数据 |
---|---|
103(高地址) | 空 |
102 | 空 |
101 | 空 |
100(低地址) | 空 |
当要把数据a存入这块内存中时时,根据规则2,低地址100会先被填充,但是并没有规定是先填充a的最高字节33还是a的最低字节00。此时就有了大端格式和小端格式两种存法:
- 大端格式:数据的高字节(33)保存在内存的低地址(100)中,而数据的低字节(00)保存在内存的高地址(103)。
-
小端格式:数据的低字节(00)保存在内存的低地址(100)中,而数据的高字节(33)保存在内存的高地址(103)。
所以,如果按大端格式,有如下布局:
地址 | 数据 |
---|---|
103(高地址) | 0x00 |
102 | 0x11 |
101 | 0x22 |
100(低地址) | 0x33 |
如果按小端格式,有如下布局:
地址 | 数据 |
---|---|
103(高地址) | 0x33 |
102 | 0x22 |
101 | 0x11 |
100(低地址) | 0x00 |
可以这样方便记忆,大端格式是先取出数据的最高字节进行处理,小端格式是先取出数据的最低位处理。
2.网络字节序
解决了主机内存的数据存储方式,现在来解决网络通信过程中的数据传输顺序问题,UDP/TCP/IP协议规定:把接收到的第一个字节当作高位字节看待,这就要求发送端发送的第一个字节是高位字节,相当于先处理高位的字节。根据规则3,先发送内存低字节的数据,所以内存低字节的数据保存的是高位字节,即大端格式。所以UDP/TCP/IP是一种大端格式,发送主机和接收主机都要是大端格式的才能正确的通信,如果收发主机格式不同,就需要用相关的函数先转化下。
3.Intel和Motorola数据格式
从事嵌入式软件开发的人可能听说过这两种格式,比如在CAN协议中,一帧报文可以发送8个字节,在应用层软件中,可以用以下结构体表示一帧报文:
typedef struct CANMSG{
u32 STDID;
u32 EXDID;
u16 DL;
u8 data[8];
}CANMSG;
现在我想将数据0x1100通过CAN协议发出去,在填充data数组时,是按什么顺序呢?
如果按照Intel格式,data[0] = 0x00,data[1]=0x11
如果按照Motorola格式,data[0]=0x11,data[1]=0x00
当然还有其他复杂的情况,这里就不详细说了。