TCP(传输控制协议)是一种面向连接,确保数据在端到端之间可靠传输的协议,面向连接指的是在发送数据前,需要先建立一条虚拟的链路,然后让数据在这条链路上传输,为了确保数据的可靠传输,不仅需要对发出的每个字节进行编号确认,检验每一个数据包的有效性,在出现超时情况时进行重传,还需要通过实现滑动窗口和拥塞控制机制,避免网络情况恶化而最终影响数据传输的极端情形,每个TCP数据包都是封装在IP包中。每一个IP头的后面紧接着是TCP头,TCP报文格式如下:
三次握手
协议第一行的两个端口号各占两个字节,分别表示了源机器的端口号和目标机器的端口号。这个两个端口号和IP报头中的源IP地址和目标IP地址所组成的四元组可唯一标示一条TCP连接,由于TCP是面向连接的,因此有服务端和客户端之分。需要服务端先在相应的端口进行监听,准备好接受客户端发起的建立连接请求。当客户端发起第一个请求建立连接的TCP报时,目标机器端口就是服务端所监听的端口号,比如代表HTTP服务的80端口,代表SSH服务的22端口,代表HTTPS服务的443端口。
TCP的FLAG位由6个bit组成,分别代表ACK,SYN,FIN,URG,PSH,RST,都以置1表示有效,我们重点关注SYN,ACK和FIN。SYN(Synchronize Sequence Numbers)用作建立连接时的同步信号,ACK(Acknowledgement)用于对收到的数据进行确认,所确认的数据由确认序列号表示,FIN(finish)表示后面没有数据需要发送,通常意味着所建立的连接需要关闭了。
- A机器发出一个数据包并将SYN置1,表示希望建立连接,包序列号假设为x。
- B机器收到A机器发送过来的数据包后,通过SYN得知这是一个建立连接的请求,于是发送一个响应包并将SYN和ACK标记都置1,假设这个包的序列号是y,而确认序列号必须是x+1,表示收到了A收到了A发送过来的SYN。在TCP中,SYN被当作数据部分的一个字节。
-A收到B的响应包后需要进行确认,确认包中将ACK置1,并将确认序列号设置为y+1,表示收到了来自B的SYN。
这里为什么需要三次握手?主要有两个目的,信息对等和防止超时。先从信息对等角度来看,双方需要互相确认自己的发报能力,自己的收报能力,对方的发报能力,对方的收报能力。
连接三次握手也是防止出现请求超时导致脏连接,TTL网络报文的生存时间往往都会超过TCP请求超时时间,如果两次握手都可以创建连接,传输数据并释放连接后,第一个超时的连接请求才到达B机器的话,B机器会以为是A创建的新连接的请求,然后确认同意创建连接。因为A机器的状态不是SYN_SENT,所以直接丢弃了B的确认数据,以致最后只是B机器单方面创建连接完毕。
如果是三次握手,则B机器收到连接请求后,同样会向A机器确认连接,但因为A机器不是SYN_SENT状态,所以会直接丢弃,B机器由于长时间没有收到确认消息,最终超时导致连接创建失败,因而不会出现脏连接。
TCP 断开连接
TCP是全双工通信,双方都能作为数据的发送和接收方,但TCP连接也会有断开的时候,所谓相爱容易分手难,建立连接只有三次,而挥手断开需要四次。A机器想要关闭连接,则待本方数据发送完毕后,传递FIN信号给B机器。B机器应答ACK,告诉A机器可以断开,但是需要等B机器处理完数据,再主动给A机器发送FIN信号。这时,A机器处于半关闭状态(FIN_WAIT_2),无法再发送新的数据,B机器做好连接关闭前的准备工作后,发送FIN给A机器,此时B机器也进入半关闭状态(CLOSE_WAIT)。A机器发送针对B机器FIN的ACK后,进入TIME_WAIT状态,经过2MSL(Maximum Segment Lifetime)后,没有收到B机器传来的报文,则确定B机器已经收到A机器最后发送的ACK指令,此时TCP连接正式释放。
四次挥手断开连接可以用通俗的说法
男生 :我们分手吧。
女生:好,我的东西收拾完,发信息给你。(此时男生不能抱女生了)
(1小时后)
女生:我收拾好了,分手吧。(此时女生不能抱男生了)
男生:好的。(大家约定两个月的过渡期,双方才可以分别找新的对象)
- TIME_WAIT:主动要求关闭的机器表示收到对方的FIN报文,并发送方ACK报文,进入TIME_WAIT状态,等2MSL后即可进入CLOSED状态。如果FIN_WAIT_1状态下,同时收到带FIN标志和ACK标志的报文时,可以直接进入TIME_WAIT状态,而无需进入FIN_WAIT_2状态。
- CLOSE_WAIT:被动要求关闭的机器收到对方请求连接的FIN报文,在第一次ACK应答后,马上进入CLOSE_WAIT状态,这种状态其实表示在等待关闭,并且通知应用程序发送剩余的数据,处理现场信息。关闭相关资源。
- 2MSL是报文在网络中生存的最长时间,超过阀值便将报文丢弃。