(译)TCP Keepalive:What,Why&How


本文译自 TCP keepalive: what is it, why do you need it, how to configure it on #Linux,在原文的基础上加入了一些自己的理解,而非逐句转译。建议英文过关的同学直接参考原文。


众所周知,一个服务在服务器上运行时需要依赖于底层系统提供的一些环境。但我们跑服务时常常会忽略掉系统给我们做的一些“清理工作”(比如防火墙,路由器,交换机的一些环境设定),而这些很有可能会导致我们的应用层程序并不如预期那样运行。

一个典型的例子是系统对于长时间运行的TCP连接的清理。防火墙会经常设置一些清理任务:为了保证死掉的、超时的或者一些非正常关闭的连接不再占用防火墙资源,在某个特定时刻(通常是半夜)防火墙会杀掉所有的连接。这个目的是好的,但往往会弄巧成拙,如果应用层程序对于这种“清理”没有感知的话,反而影响到应用层程序的正常运行。

那么如果我们需要一个能够长时间保持连接状态,即使中间有很长一段时间没有数据传输的连接的话要怎么办呢?为了解决这个问题,Liunx内核提供了一个在正常TCP连接处于长时间不活跃状态(无数据传输)下还能让其保持“活跃”(不会被杀掉)的方法。这就是文题中的TCP Keepalive 特性。

简而言之,TCP Keepalive 特性就是通过模拟数据流量传输从而让TCP连接保持活跃,从而不会被communication layer标记为不活跃。

首先,内核中有三个参数控制Keepalive特性:

  • tcp_keepalive_time

    最后一个数据包(单独的ACK包不算在内)和第一个keepalive探针之间的间隔;在连接被标记为需要keepalive后,这个计时器之后就不再被使用

  • tcp_keepalive_intvl

    keepalive探针之间的时间间隔,不管在这期间连接交互了什么

  • tcp_keepalive_probes

    如果有N个keepalive探针没有被对端确认(N即tcp_keepalive_probes的值),内核会认为该连接已经死亡并且通知应用层

注意前两个参数的单位是秒(s),最后一个是个数。

调整这些参数最简单的方式(同时也保证它们能在重启后保持同样的值)是将它们放在/etc/sysctl.conf或者目录/etc/sysctl.d/下面的一个新文件内。

net.ipv4.tcp_keepalive_time = 60
net.ipv4.tcp_keepalive_intvl = 5
net.ipv4.tcp_keepalive_probes = 3

然后使其生效:

# sysctl -p /etc/sysctl.conf

上面的参数会导致如下的行为:

如果一个TCP连接经过了60s的非活跃状态(同时该连接并没有被其中一端关闭),内核会将其标记为“需要keepalive”。然后每隔5秒钟在这个连接上发送一个数据包(keepalive探针)模拟流量。如果超过3个探针没有被回复,内核会将这个连接标记为死亡,并通知应用层程序。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • HTTP Keep-Alive 在http早期,每个http请求都要求打开一个tpc socket连接,并且使用一...
    jiangmo阅读 4,784评论 0 2
  • 1. TCP连接 当网络通信时采用TCP协议时,在真正的读写操作之前,server与client之间必须建立一个连...
    麒麟楚庄王阅读 1,839评论 0 0
  • 本文主要参考自:https://blog.csdn.net/bytxl/article/details/46437...
    YDDMAX_Y阅读 1,668评论 0 1
  • 一、Socket Socket 作为一种通用的技术规范,首次是由 Berkeley 大学在 1983 为 4.2B...
    秀花123阅读 31,091评论 3 26
  • 正在努力不失去自我,正在努力保持有趣的灵魂,同时不失去漂亮的皮囊! 就得这么贪心,没办法,这世界对女人不那么宽容。...
    霞蔚千秋阅读 219评论 0 1