4. 协议注册
前面我们已经跟到netif_receive_skb
函数了,我们当时说这函数是被驱动调用,将数据包送进协议栈的入口函数。我们一路跟进去,会发现,最后会有这样一个调用:
ret = pt_prev->func(skb, skb->dev, pt_prev, orig_dev);
这里是回调数据包对应协议的处理函数,但这个函数指针的处理让我们不得不停下来弄清原委。不然也很难知道具体调用了哪个函数。该行代码的调用路径为:netif_receive_skb
->netif_receive_skb_internal
->__netif_receive_skb
->__netif_receive_skb_core
。
框架
内核在初始化各子模块的过程中,网络子模块会将自己实现的各协议注册到内核的两个了表中,ptype_all
和ptype_base
,前者是双向链表,后者是hash表。最后驱动在调用netif_receive_skb
将数据包送进协议栈时。通过比对skb->protocol
和各协议注册的packet_type
。将skb
发往对应的协议处理函数。
初始化
前面我们在网络设备初始化时知道,内核初始化时要初始化哪些模块是一组宏控制的。在对协议初始化用到的是fs_initcall
。在IPv4协议的初始化是inet_init
,而IPv6协议的初始化是在inet6_init
。在当前内核中,IPv6是一个内核子模块,其初始化是在模块被install时做的。
下面是IPv4协议的初始化函数:
static int __init inet_init(void)
{
struct inet_protosw *q;
struct list_head *r;
int rc = -EINVAL;
sock_skb_cb_check_size(sizeof(struct inet_skb_parm));
rc = proto_register(&tcp_prot, 1);
if (rc)
goto out;
rc = proto_register(&udp_prot, 1);
if (rc)
goto out_unregister_tcp_proto;
rc = proto_register(&raw_prot, 1);
if (rc)
goto out_unregister_udp_proto;
rc = proto_register(&ping_prot, 1);
if (rc)
goto out_unregister_raw_proto;
这里一组通过proto_register
注册的struct proto
是提供给应用层套接字API的接口。
/*
* Tell SOCKET that we are alive...
*/
(void)sock_register(&inet_family_ops);
static const struct net_proto_family inet_family_ops = {
.family = PF_INET,
.create = inet_create, //创建socket时需要调用的函数
.owner = THIS_MODULE,
};
上面一行将在全局数组net_family
中注册inet_family_ops
,后面是inet_family_ops
的定义。
#ifdef CONFIG_SYSCTL
ip_static_sysctl_init();
#endif
/*
* Add all the base protocols.
*/
if (inet_add_protocol(&icmp_protocol, IPPROTO_ICMP) < 0)
pr_crit("%s: Cannot add ICMP protocol\n", __func__);
if (inet_add_protocol(&udp_protocol, IPPROTO_UDP) < 0)
pr_crit("%s: Cannot add UDP protocol\n", __func__);
if (inet_add_protocol(&tcp_protocol, IPPROTO_TCP) < 0)
pr_crit("%s: Cannot add TCP protocol\n", __func__);
#ifdef CONFIG_IP_MULTICAST
if (inet_add_protocol(&igmp_protocol, IPPROTO_IGMP) < 0)
pr_crit("%s: Cannot add IGMP protocol\n", __func__);
#endif
注册各协议传输层处理函数。
/* Register the socket-side information for inet_create. */
for (r = &inetsw[0]; r < &inetsw[SOCK_MAX]; ++r)
INIT_LIST_HEAD(r);
for (q = inetsw_array; q < &inetsw_array[INETSW_ARRAY_LEN]; ++q)
inet_register_protosw(q);
全局数组inetsw
表示支持socket
的四层处理协议表。调用inet_register_protosw
分别处理数组inetsw_array
的数据项。将proto
和proto_ops
联系起来了。proto_ops
提供了socket的统一处理接口(也就是就是可以采用socket->ops->sendmsg
,proto
结构体则提供了在四层统一的接口sock->sk_prot->accept
,对于不同的协议初始化为不用的处理函数,见inet_create
。看到这可能你会会心一笑,这不就是C++中虚函数多态的实现方式吗?子类有调用子类的实现,子类没有调用父类的实现。
arp_init();
ip_init();
/* Setup TCP slab cache for open requests. */
tcp_init();
/* Setup UDP memory threshold */
udp_init();
/* Add UDP-Lite (RFC 3828) */
udplite4_register();
ping_init();
if (icmp_init() < 0)
panic("Failed to create the ICMP control socket.\n");
#if defined(CONFIG_IP_MROUTE)
if (ip_mr_init())
pr_crit("%s: Cannot init ipv4 mroute\n", __func__);
#endif
if (init_inet_pernet_ops())
pr_crit("%s: Cannot init ipv4 inet pernet ops\n", __func__);
if (init_ipv4_mibs())
pr_crit("%s: Cannot init ipv4 mibs\n", __func__);
ipv4_proc_init();
ipfrag_init();
dev_add_pack(&ip_packet_type); //注册ip层收包回调函数
ip_tunnel_core_init();
rc = 0;
out:
return rc;
out_unregister_raw_proto:
proto_unregister(&raw_prot);
out_unregister_udp_proto:
proto_unregister(&udp_prot);
out_unregister_tcp_proto:
proto_unregister(&tcp_prot);
goto out;
}
fs_initcall(inet_init); //在系统初始化时被调用
使用
现在我们只关注dev_add_pack(&ip_packet_type)
这个调用。毕竟我们的目的是弄清楚,协议栈入口,netif_receive_skb
调用的函数指针到低是谁。我们的skb
最后由谁来处理。
void dev_add_pack(struct packet_type *pt)
{
struct list_head *head = ptype_head(pt);
spin_lock(&ptype_lock);
list_add_rcu(&pt->list, head);
spin_unlock(&ptype_lock);
}
static inline struct list_head *ptype_head(const struct packet_type *pt)
{
if (pt->type == htons(ETH_P_ALL))
return pt->dev ? &pt->dev->ptype_all : &ptype_all;
else
return pt->dev ? &pt->dev->ptype_specific :
&ptype_base[ntohs(pt->type) & PTYPE_HASH_MASK];
}
发现了吧,这里的ptype_base
和ptype_all
不正是__netif_receive_skb_core
中间使用的吗?那我们就可以说,netif_receive_skb
函数最后会通过ptype_all
将数据包交给IP层接收函数处理。从下面ip_packet_type
的定义我们可以看知道,IPv4的数据包最后是交给ip_rcv
来处理的,而IPv6的数据包则是交给ipv6_rcv
处理。
static struct packet_type ip_packet_type __read_mostly = {
.type = cpu_to_be16(ETH_P_IP),
.func = ip_rcv,
};
static struct packet_type ipv6_packet_type __read_mostly = {
.type = cpu_to_be16(ETH_P_IPV6),
.func = ipv6_rcv,
};
总结
通过上面的分析,我们知道了,协议栈入口netif_receive_skb
通过比对skb->protocol
和各协议注册的packet_type
。将skb
发往对应的协议处理函数。OK,后面就可以开始分析IP层的处理了。