4. 协议注册

4. 协议注册

前面我们已经跟到netif_receive_skb函数了,我们当时说这函数是被驱动调用,将数据包送进协议栈的入口函数。我们一路跟进去,会发现,最后会有这样一个调用:

ret = pt_prev->func(skb, skb->dev, pt_prev, orig_dev);

这里是回调数据包对应协议的处理函数,但这个函数指针的处理让我们不得不停下来弄清原委。不然也很难知道具体调用了哪个函数。该行代码的调用路径为:netif_receive_skb->netif_receive_skb_internal->__netif_receive_skb->__netif_receive_skb_core

框架

内核在初始化各子模块的过程中,网络子模块会将自己实现的各协议注册到内核的两个了表中,ptype_allptype_base,前者是双向链表,后者是hash表。最后驱动在调用netif_receive_skb将数据包送进协议栈时。通过比对skb->protocol和各协议注册的packet_type。将skb发往对应的协议处理函数。

初始化

前面我们在网络设备初始化时知道,内核初始化时要初始化哪些模块是一组宏控制的。在对协议初始化用到的是fs_initcall。在IPv4协议的初始化是inet_init,而IPv6协议的初始化是在inet6_init。在当前内核中,IPv6是一个内核子模块,其初始化是在模块被install时做的。

下面是IPv4协议的初始化函数:

static int __init inet_init(void)
{
    struct inet_protosw *q;
    struct list_head *r;
    int rc = -EINVAL;

    sock_skb_cb_check_size(sizeof(struct inet_skb_parm));
    
    rc = proto_register(&tcp_prot, 1);
    if (rc)
        goto out;
    rc = proto_register(&udp_prot, 1);
    if (rc)
        goto out_unregister_tcp_proto;
    rc = proto_register(&raw_prot, 1);
    if (rc)
        goto out_unregister_udp_proto;
    rc = proto_register(&ping_prot, 1);
    if (rc)
        goto out_unregister_raw_proto;

这里一组通过proto_register注册的struct proto是提供给应用层套接字API的接口。

    /*
     *  Tell SOCKET that we are alive...
     */

    (void)sock_register(&inet_family_ops);
static const struct net_proto_family inet_family_ops = {
    .family = PF_INET,
    .create = inet_create, //创建socket时需要调用的函数 
    .owner  = THIS_MODULE,
};

上面一行将在全局数组net_family中注册inet_family_ops,后面是inet_family_ops的定义。

#ifdef CONFIG_SYSCTL
    ip_static_sysctl_init();
#endif

    /*
     *  Add all the base protocols.
     */

    if (inet_add_protocol(&icmp_protocol, IPPROTO_ICMP) < 0)
        pr_crit("%s: Cannot add ICMP protocol\n", __func__);
    if (inet_add_protocol(&udp_protocol, IPPROTO_UDP) < 0)
        pr_crit("%s: Cannot add UDP protocol\n", __func__);
    if (inet_add_protocol(&tcp_protocol, IPPROTO_TCP) < 0)
        pr_crit("%s: Cannot add TCP protocol\n", __func__);
#ifdef CONFIG_IP_MULTICAST
    if (inet_add_protocol(&igmp_protocol, IPPROTO_IGMP) < 0)
        pr_crit("%s: Cannot add IGMP protocol\n", __func__);
#endif

注册各协议传输层处理函数。

    /* Register the socket-side information for inet_create. */
    for (r = &inetsw[0]; r < &inetsw[SOCK_MAX]; ++r)
        INIT_LIST_HEAD(r);

    for (q = inetsw_array; q < &inetsw_array[INETSW_ARRAY_LEN]; ++q)
        inet_register_protosw(q);

全局数组inetsw表示支持socket的四层处理协议表。调用inet_register_protosw分别处理数组inetsw_array的数据项。将protoproto_ops联系起来了。proto_ops提供了socket的统一处理接口(也就是就是可以采用socket->ops->sendmsg,proto结构体则提供了在四层统一的接口sock->sk_prot->accept,对于不同的协议初始化为不用的处理函数,见inet_create。看到这可能你会会心一笑,这不就是C++中虚函数多态的实现方式吗?子类有调用子类的实现,子类没有调用父类的实现。

    arp_init();
    ip_init();
    /* Setup TCP slab cache for open requests. */
    tcp_init();
    /* Setup UDP memory threshold */
    udp_init();
    /* Add UDP-Lite (RFC 3828) */
    udplite4_register();
    ping_init();
    if (icmp_init() < 0)
        panic("Failed to create the ICMP control socket.\n");
#if defined(CONFIG_IP_MROUTE)
    if (ip_mr_init())
        pr_crit("%s: Cannot init ipv4 mroute\n", __func__);
#endif

    if (init_inet_pernet_ops())
        pr_crit("%s: Cannot init ipv4 inet pernet ops\n", __func__);
    if (init_ipv4_mibs())
        pr_crit("%s: Cannot init ipv4 mibs\n", __func__);
    ipv4_proc_init();
    ipfrag_init();
    dev_add_pack(&ip_packet_type);  //注册ip层收包回调函数
    ip_tunnel_core_init();
    rc = 0;
out:
    return rc;
out_unregister_raw_proto:
    proto_unregister(&raw_prot);
out_unregister_udp_proto:
    proto_unregister(&udp_prot);
out_unregister_tcp_proto:
    proto_unregister(&tcp_prot);
    goto out;
}

fs_initcall(inet_init);     //在系统初始化时被调用

使用

现在我们只关注dev_add_pack(&ip_packet_type)这个调用。毕竟我们的目的是弄清楚,协议栈入口,netif_receive_skb调用的函数指针到低是谁。我们的skb最后由谁来处理。

void dev_add_pack(struct packet_type *pt)
{
    struct list_head *head = ptype_head(pt);
    spin_lock(&ptype_lock);
    list_add_rcu(&pt->list, head);
    spin_unlock(&ptype_lock);
}

static inline struct list_head *ptype_head(const struct packet_type *pt)
{
    if (pt->type == htons(ETH_P_ALL))
        return pt->dev ? &pt->dev->ptype_all : &ptype_all;
    else
        return pt->dev ? &pt->dev->ptype_specific :
                 &ptype_base[ntohs(pt->type) & PTYPE_HASH_MASK];
}

发现了吧,这里的ptype_baseptype_all不正是__netif_receive_skb_core中间使用的吗?那我们就可以说,netif_receive_skb函数最后会通过ptype_all将数据包交给IP层接收函数处理。从下面ip_packet_type的定义我们可以看知道,IPv4的数据包最后是交给ip_rcv来处理的,而IPv6的数据包则是交给ipv6_rcv处理。

static struct packet_type ip_packet_type __read_mostly = {
    .type = cpu_to_be16(ETH_P_IP),
    .func = ip_rcv,
};

static struct packet_type ipv6_packet_type __read_mostly = {
    .type = cpu_to_be16(ETH_P_IPV6),
    .func = ipv6_rcv,
};

总结

通过上面的分析,我们知道了,协议栈入口netif_receive_skb通过比对skb->protocol和各协议注册的packet_type。将skb发往对应的协议处理函数。OK,后面就可以开始分析IP层的处理了。

推荐阅读

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容