网卡网络驱动监控---网络数据包流程监控一

这一系列的目标是为了让我们的监控更全面,帮助我们优化和发现潜在问题。它涉及到很多方面,比如连接池的优化,系统层面的监控优化,网络方面,应用本身的监控。我们将先从网络这层去体系化的做这件事情。
关注网络整个流程,最终目的是为了知道哪些地方会造成性能问题,哪些地方会造成数据丢失,以及如何通过工具或者监控指标来发现这些异常。帮助发现隐藏网络问题以及提升故障排查以及运维效率。

本文将整理整体的流程框架,详细介绍网卡和驱动的细节以及围绕网卡和驱动采取的监控手段(图片来自网络)。
(在整理的整个过程中,我也不断在想这些指标的意义,是否确实对我们有意义。但我们不仅仅应该从监控的角度去考虑,我们也要考虑当问题发生时,能否清晰流程,让我们知道到底在哪层出现问题。所以在整理过程中,将围绕vip集群迁移延时问题,去思考底层需要知道些什么,能帮助去排查这种不了了之的问题。)

接受网络数据包与发送网络数据包是一个复杂的过程,涉及到庞杂的底层技术细节。
从应用编程的角度看:
NIC (网卡)->内核->user space
从网络协议的角度看:
物理层->链路层->ip->tcp->应用层
很难将我们熟悉的概念合在一起去讨论这个问题,比如内核中的网络驱动,你最多只能说它工作在数据链路层而不能说它实现了数据链路层。
http://bbs.chinaunix.net/thread-1924872-1-1.html
所以在描述整个过程,将用程序流程的角度去描述。

先梳理接受数据包的过程,大概分为以下几步:

1. 网卡(NIC)收到数据包。
2. 将数据包从网卡硬件缓存转移到内核管理的内存sk_buf中。
3. 硬中断通知内核处理。
4. 内核网卡驱动将sk_buf交给内核协议栈处理。
5. 经过TCP/IP协议栈逐层处理。
6. 应用程序通过read()从socket buffer读取数据。

图一:


image.png

下面我们具体看下各个流程,
步骤1.关于网卡网络故障方面的问题
这个交给网络工程师。如果你对此感兴趣,可参考 https://www.cnblogs.com/Security-Darren/p/4700387.html

步骤2.将数据包从网卡硬件缓存转移到内核管理的内存
网卡接收到数据包之后,首先需要将数据发送到内核中,这中间的桥梁是rx ring buffer。它是由NIC和驱动程序共享的一片区域。事实上,rx ring buffer存储的并不是实际的packet数据,而是一个描述符,这个描述符指向了它真正的存储地址,具体流程如下:
1). 系统启动NIC驱动首先在内存中分配一片缓冲区来接收数据包,叫做sk_buffer
2). 将上述缓冲区的地址和大小(即文件描述符),加入到rx ring buffer
3). 驱动通知网卡有一个新的描述符。
4). 网卡从rx ring buffer中取出描述符,从而获知缓冲区的地址和大小。
5). 网卡收到新的数据包。
6). 网卡将新数据包通过DMA直接写到sk_buffer中:

image.png

经过以上的过程,NIC接受的数据就转移到内核管理的内存sk_buf中。

当驱动处理速度跟不上网卡收包速度时,驱动来不及分配缓冲区,NIC接收到的数据包无法及时写到sk_buffer,就会产生堆积,当NIC内部缓冲区写满后,就会丢弃部分数据,引起丢包。这部分丢包为rx_fifo_errors,在/proc/net/dev中体现为fifo字段增长,在ifconfig中体现为overruns指标增长,ethtool -S em1中体现为rx_fifo_errors

通过ethtool -S em1来查看这个错误(em1为物理网卡,逻辑网卡无效):

image.png

可以看出这里面的err很多。其中TX表示的是发送数据,RX表示的是接受数据。这个命令可以帮助我们更详细的去定位错误,但一般监控通过/proc/net/dev关注 dropfifo即可。实际落地过程中,我们需要区分物理网卡,虚拟网卡,docker网络去确定时间监控目标。

image.png

如果我们确实要调优,一方面是看是否需要调整一下每个队列数据的分配,或者是否要加大Ring Buffer的大小。由于修改以上参数需要重启才能有意义,我们对这个参数主要是监控,以方便我们排查错误。

调整 Ring Buffer 队列数量


[root@ ~ ]$ ethtool -l em1
Channel parameters for em1:
Pre-set maximums:
RX:        0
TX:        0
Other:        1
Combined:    8
Current hardware settings:
RX:        0
TX:        0
Other:        1
Combined:    8

Combined = 8,说明当前 NIC 网卡会使用 8 个进程处理网络数据。
更改 eth0 网卡 Combined 的值:
ethtool -L eth0 combined 8
需要注意的是,ethtool 的设置操作可能都要重启一下才能生效。

调整 Ring Buffer 队列大小,查看当前 Ring Buffer 大小


[root@ ~ ]$ ethtool -g em1
Ring parameters for em1:
Pre-set maximums:
RX:        4096
RX Mini:    0
RX Jumbo:    0
TX:        4096
Current hardware settings:
RX:        256
RX Mini:    0
RX Jumbo:    0
TX:        256

看到 RXTX 最大是 4096,当前值为256。队列越大丢包的可能会小,但数据延迟会增加.
设置 RXTX 队列大小:

ethtool -G em1 rx 4096
ethtool -G em1 tx 4096

步骤4.内核网卡驱动将sk_buf交给内核协议栈处理
当NIC把数据包通过DMA复制到内核缓冲区sk_buffer后,NIC立即发起一个硬件中断。CPU接收后,首先进入上半部分,网卡中断对应的中断处理程序是网卡驱动程序的一部分,之后由它发起软中断,进入下半部分,开始消费sk_buffer中的数据,交给内核协议栈处理。

image.png

当内核开始消费sk_buffer中的数据,交由协议栈(如IPTCP)处理之前存在一个缓冲队列。每个CPU核都有一个backlog队列,当接收包的速率大于内核协议栈处理的速率时,CPUbacklog队列不断增长。当达到设定的netdev_max_backlog值时,数据包将被丢弃。这主要是由于中断处理的速度低于sk_buffer增长的速度。这部分丢包可以在cat /proc/net/softnet_stat的输出结果中进行确认。
待补CPU中断亲缘关系、调优以及监控。。。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,245评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,749评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,960评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,575评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,668评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,670评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,664评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,422评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,864评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,178评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,340评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,015评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,646评论 3 323
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,265评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,494评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,261评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,206评论 2 352