问题现象
一个搭建好的几台云服务器上面配置好了SNAT,其中某些通过公网访问A服务器通,而同样网络环境下的服务器访问访问A服务器就不通。
服务器A测:tcp_tw_recycle与tcp_timestamps均是开启的。
通过wireshark抓包可以看到:异常的云服务器,一直在重传syn,而对端收到了syn,却不响应ack,syn。
对比正常的报文与异常的报文,发现异常的报文timestamp值非常小,而正常的值大很多。
异常的服务器上:
[root@iZm5e936hzsu4ygadc0vw1Z ~]# sysctl -a | grep times
kernel.sched_rr_timeslice_ms = 100
net.ipv4.tcp_timestamps = 1
参数:/proc/sys/net/ipv4/tcp_timestamps - 控制timestamp选项开启/关闭
/proc/sys/net/ipv4/tcp_tw_recycle - 减少timewait socket释放的超时时间
根据tcp_timestamps选项的特性,
server端当tcp_tw_recycle和tcp_timestamps都是1的时候,会检查收到数据包TCP选项字段中的的timestamp(TS Value),当来自同一个IP地址(任意源端口号)后来的数据包中TCP选项字段如果有timestamp且比前面的数据包中的timestamp小,
则server不做ACK响应。
可行的处理方法如下:
1.服务器端不要将tcp_tw_recycle字段和tcp_timestamps字段同时设为1
2.客户端把tcp_timestamps字段设0,这样不会发送TCP选项字段中的timestamps选项
net.ipv4.tcp_timestamps = 0后能够正常访问。