回顾一下TCP报文的格式
TCP的首部有6个比特,它们可以被设置为1
其中
*ACK为1表示确认确认序号有效
*SYN表示建立连接
*FIN表示关闭连接
*RST表示恢复连接
*URG表示紧急指针
*PSH表示接收方应尽快接收
三次握手
第一遍先粗略总结:
第一次握手:
当连接建立的发起方要建立连接时,会先发送一个用于建立连接的报文,其中SYN设置为1(表示建立连接),并为连接选择一个初始序号ISN
ISN随着时间不断变化,RFC中描述每4毫秒增加1,因此每个连接都将具有不同的ISN
这里我们先假设为151303054
因为是建立连接所以报文中的数字字节段大小为0
第二次握手:
接受端接收到这个报文字段后,需要做出应答(回发该报文),同时将确认序号设置为客户端发送报文中的序号并增加1(151303055),
ACK设置为1,表示确认序号有效
第三次握手:
发送方收到回发报文之后,再发送一个确认序号为ISN+1的报文(151303059),ACK设置为1表示对服务端报文的确认
两方都确认完,开始发送数据
第二遍代码实战:
关于一些api的介绍:https://www.jianshu.com/p/36846272a58c
发送数据的三个函数:
所谓发送数据就是向Linux中的设备文件socket中写入数据,在linux中每一个进程都有一个执行这个进程时需要使用到的文件的数组,这个数组存放指向文件对象的指针,fd就是这个数组下标,所谓的socketfd,就是使用哪一个socket文件的指针
关于TCP连接中缓冲区的概念
我们需要建立一个概念,当TCP三次握手成功,操作系统内核就会为该连接分配一个发送缓冲区,并不是说建立连接后发送的数据就能直接被对方给接受,我们调用write写入数据时,实际执行的是程序将数据从程序中拷贝到被操作系统内核分配的发送缓冲区中,之后再由内核给发送出去
也就是说我们发送的数据速度依赖内核分配的缓冲区大小,当足够大时,write返回的就是写入的字节数;当不足时,应用程序会被阻塞在write的系统调用中不返回结果(即在程序的write处停留,程序的write函数和系统调用write是两个概念,一般是程序相关函数调用系统调用),内核之后会先将缓冲区的数据分块发送直到应用程序的数据都被拷贝到缓冲区,这个时候调用返回(返回只是意味着数据被拷贝到了缓冲区并不意味着已发送)
读取数据也是同理从套接字中读取存储到缓冲区中,当返回值为0表示对方发送了FIN包结束连接
但是c中的read是表示最多读取size字节,如果要固定读取多少字节还要另外自定义函数
demo演示(开启服务端和客户端,监听12345端口,客户端写入102400字节数据,服务端模拟延迟,每次读取1024字节即1K之后休眠1ms)
开启tcpdump观察
tcpdump -nn -i lo 'port 12345'
观察前三个报文
第一个报文
从48848端口往12345发送数据包(客户端不指定端口,系统会随机分配)
S表示SYN包,序号ISN为4202422899,窗口大小为win 43690(win不代表缓冲区大小),lentght 0 表示数据字段大小
第二个报文
回发第一个报文,设置ack,序号为170381755,确认序号ISN=4202422900,win为43690
同理第三个报文【.】表示SYN/FIN/RST/PSH都为0,将ack设置为1表示该报文为确认报文
开始发送数据
客户端向服务端发送了两次数据包每次为21845,此时窗口win被填满,暂时停止发送,seq为1:21846和21846:43691分别为两次数据的分组
虽然服务端对两个包21846和43691进行了ack确认,但是因为read每次只从socket中读取1024到缓冲区,因此即使接收了但还没处理完,窗口win大小不再为43960,为2388
TCP的连接一定是3次握手吗?
不一定还可能是4次,比如极端情况客户端和服务端同时发送SYN包建立连接(这是两次握手),之后再发回对方的SYN包和确认序号(两次握手),总共四次之后就进行传输数据
参考: