关于sk_buff
sk_buff(socket buffer)结构是Linux网络代码中重要的数据结构,用于管理和控制接收或发送数据包的信息。
sk_buff组成
部分字段说明:
- packet data:通过网卡收发的报文,包括链路层、网络层、传输层的协议头和携带的应用数据,包括`headroom`,`data`,`tailroom`三个部分。
- `skb_shared_info`作为packet data的补充,用于存储ip分片,其中`sk_buff *frag_list`是一系列子`sk_buff`链表
- `frag[]`是由一组单独的page组成的数据缓冲区。
- data buffer:用于存储packet data的缓冲区,分为以上两部分。
内核可以将`sk_buff`组织成一个双向链表,只是比常见的双向链表结构复杂一点。因此sk_buff中需要有两个指针next和prev,next指向下一个节点,而prev指向上一个节点。
此外,这个链表还有另外一个需求,每个sk_buff结构都必须能够很快找到链表头节点,为了满足这个需求,在第一个节点前面会插入另一个结构`sk_buff_head`,是一个辅助节点。
`sk_buff`和`sk_buff_head`的前两个元素都一样,next和prev指针,使得他们可以放到同一个链表中。相同的函数同样可以应用于sk_buff和sk_buff_head。
`struct sock *sk`,在网络包由本机或由本机进程接收时有效,因为插口相关的信息被L4(TCP或UDP)或者用户空间程序使用。如果sk_buff只在转发中使用(即源地址和目的地址都不是本机地址),该指针为NULL。
`refcount_t users`,主要用途是防止释放sk_buff后,还有其他实体引用这个sk_buff。因此,每个引用这个缓冲区的实体都必须在适当的时候增加或减少这个变量。这个计算器只保护sk_buff结构本身,而缓冲区的数据部分由类似的计数器来保护。通常使用skb_get和kfree_skb来操作此变量。
`char cb[40]`,在每一层中,访问这个变量的代码通常用宏实现,以增强代码的可读性。
sk_buff管理和操作函数
内核用这些函数操作sk_buff的成员变量或sk_buff链表。首先包括分配和释放缓冲区的函数,然后是一些通过移动指针在缓冲区的头部或尾部预留空间的函数。可以参看`inluce/linux/skbuff.h`和`net/core/skbuff.c`。
- skb_put,在缓冲区的尾部空间扩充len字节数据区,将tail指针下移,增加skb的len。data和tail之间的空间就是可以存放网络报文的空间。这个操作增加了可以存储网络报文的空间,但是增加不能使tail的值大于end的值,skb的len值大于truesize的值。
- skb_push,在缓冲区的头部空间扩充len字节的数据区,data指针上移,增加skb的len值。这个操作在存储空间的头部增加了一段可以存储网络报文的空间,但是增加不能使data的值小于head的值,skb的len值大于truesize的值。
- skb_pull,从缓冲区的数据区删除len字节,将空出来的内存归还给头部空间。data指针下移,并减小skb的len值。这个操作使data指针指向下一层网络报文的头部。
- skb_reserve,从空白缓冲区分配len字节的数据区,通过减少尾部空间,增加一个空&sk_buff的首部空间,将data指针和tail指针同时下移。此操作在存储空间的头部预留len长度的空隙。
sk_buff内存申请接口
在分配内存和释放是不建议使用`kmalloc()`和`kfree()`来为sk_buff相关结构体申请内存和销毁,尽量用内核提供好的一些函数去为这些结构体申请内存。
sk_buff的应用
注意:sk_buff并不会直接存储网络数据包,只是存放了数据包的指针。
![在这里插入图片描述](https://img-blog.csdnimg.cn/4fb11f54177d4fc4ac9dac403bd80cf2.png#pic_center)
在应用中,应用层数据前面加上协议的其他层级的头,如链路层、MAC层、IP协议头、TCP协议头等,用data指针保存。应用层尾部用tail指针保存。如果是从L4传输到L2,则通过往sk_buff结构体中增加该层协议头来操作;如果是从L4到L2,则是通过移动sk_buff结构体中的data指针来实现,不会删除各层协议头,可以提供CPU的工作效率。