网络字节序问题和TCP粘包问题

网络字节序和主机序

我在大小端问题一文中介绍了,不同的开发语言和CPU有不同的字节序类型,有Little Endian和Big Endian。

所以没法保证客户端和服务端程序的字节序类型是一样,也就没法保证数据存储顺序是一样的,如果直接对某段数据进行网络传输,可能会导致数据的值在两端不一样。

而所有的网络协议都是采用的Big Endian,所以有时也会把Big Endian称为网络字节序。所以当两台采用不同字节序的主机进行网络通信时,在发送数据之前把字节序转换为网络字节序后再进行传输,接收数据后把网络字节序转换为主机字节序即可。
接口:
头文件:#include <arpa/inet.h>

  • 网络字节顺序转换为主机字节顺序:
    uint32_t ntohl(uint32_t netlong);
    uint16_t ntohs(uint16_t netshort);
  • 主机字节顺序转换成网络字节顺序:
    uint32_t htonl(uint32_t hostlong);
    uint16_t htons(uint16_t hostshort);

TCP粘包问题

什么是粘包?
从接收缓冲区看,后一包数据的头紧接着前一包数据的尾。
粘包可能由发送端引起也有可能由接收端造成。TCP有粘包问题,UDP没有。

粘包产生的原因
首先来说tcp是流式协议,然后下面两种情况就会导致粘包

  • Nagle算法导致发送端的粘包。当连续发送数据时,由于TCP协议的nagle算法,会将较小的内容拼接成大的内容,一次性发送到服务器端,因此造成粘包;
  • 接收方接收数据不及时。TCP会把接收到的数据存在自己的TCP缓冲区中,然后通知应用层取数据。当应用层没有及时读取TCP缓冲区数据时,就会造成TCP缓冲区中存在多段数据。

解决粘包
解决粘包的方案是封包和解包。
封包就是给一段数据加上包头,这样数据包就分包头和包体两部分,一般我们规定包头的前四个字节用来记录包体的长度。解包就是在接收到数据包时,先获取到包体的长度,然后循环recv,直到recv到包体长度的数据,就是一个完整的包体。

需要注意的是,发送端一般要把包体的长度转换为网络字节序,接收端再把包体长度转为主机字节序。

引用

大小端问题

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容