1. TCP粘包的原因
TCP是基于数据流传输的协议,消息都是字节流(byte[])。发送方可能会为了发送方便将多条比较短的消息凑到一块一次发送,而接收方也可能因为处理不及时导致缓存中堆积了多条消息组成的byte[],消息彼此黏连在一起,这导致接收方无法准确的区分消息。
2. TCP粘包的解决
一般有两种方式解决:
- 对数据的格式进行定义,协定一条数据的起始位和结束位标识
- 使用一段数据长度标识位,比如int(4字节)来标识紧跟着它的消息长度
这里以第二种为例,在Netty中使用自定义的MessageToMessageEncoder/ByteToMessageDecoder来解决写入时和接受时的粘包问题
接受方解码消息
public class MsgDecoder extends ByteToMessageDecoder {
/**
* @param ctx
* @param in byteBuf是一个可读写的缓冲区,这个缓冲区具有一定的byte容量,容量由读写决定,可读的容量不能超过写入的容量,
* 它内部持有读的标识位和写的标识位,在nio非阻塞特性中,IO操作不会阻塞,因为IO读到的数据会全放到Buf中
* @param out
* @throws Exception
*/
@Override
protected void decode(ChannelHandlerContext ctx, ByteBuf in, List<Object> out) throws Exception {
//因为TCP的二进制流传输特性,每次读取的包不一定是一条完整的消息,因此需要粘包,而in就是用来存放每次读取的包的
while (true) {
//使用4字节(Int)标记一条消息的长度,如果可读长度不超过4字节则等待下一个包
if (in.readableBytes() <= 4) {
break;
}
//标记当前读取的位数
in.markReaderIndex();
//读取4字节,即长度位,readerIndex会增加4
int length = in.readInt();
if (length <= 0) {
throw new Exception("a negative length occurd while decode!");
}
//如果剩余可读字节数量不足消息长度,则返回到标记的位数,则下一次又会读取长度位
if (in.readableBytes() < length) {
in.resetReaderIndex();
break;
}
//读取消息
byte[] msg = new byte[length];
in.readBytes(msg);
out.add(new String(msg, "UTF-8"));
}
}
}
发送方编码消息
public class MsgEncoder extends MessageToMessageEncoder<String> {
@Override
protected void encode(ChannelHandlerContext ctx, String msg, List<Object> out) {
if (msg == null)
return;
ByteBuf buffer = Unpooled.buffer(4);
//string->byte[]
byte[] msgBytes = msg.getBytes();
buffer.writeInt(msgBytes.length);
buffer.writeBytes(msgBytes);
out.add(buffer);
}
}