在探究Linux内核链表的过程中引发了一些疑问:
- Linux内核用到很多链表结构,其中有很多精妙的宏定义,着实让人叹为观止。
在/usr/src/../include/linux/kernel.h中有这么一个宏:
#define offsetof(TYPE, MEMBER) ((size_t) &((TYPE *)0)->MEMBER)
/**
* container_of - cast a member of a structure out to the containing structure
* @ptr: the pointer to the member.
* @type: the type of the container struct this is embedded in.
* @member: the name of the member within the struct.
*/
#define container_of(ptr, type, member) ({ \
const typeof(((type *)0)->member) * __mptr = (ptr); \
(type *)((char *)__mptr - offsetof(type, member)); })
- 链表是Linux内核中用到的最广泛的数据结构,可以说是其他各种数据结构的基础。Linux内核中用到的通用链表定义为:
struct list_head {
struct list_head *next, *prev;
};
- 围绕该链表Linux定义了一系列的链表操作,我们在使用的时候只需要定义一个包含该list_head类型的节点类型即可使用它的增、删、改、查功能:
struct my_list{
int a;
int b;
struct list_head list_node;
};
我们可以通过这个list_head来进行前后节点的获取,那么问题来了,你只能获取到下一个节点中list_head这个成员的首地址,那怎么访问这个节点的其他成员呢?首要问题是要获取到节点首地址才可以进行其他成员的访问,那么是怎么实现的呢?接下来你会感到叹为观止!
这就要说回到上述的两宏:
offsetof宏是计算给定类型TYPE(自定义的链表结构体)中,成员list_head的偏移地址。例如我们的my_list,利用该宏可以计算出成员list_node的偏移地址为8;
offsetof宏原理
1.((TYPE *)0)
:将0地址转换为TYPE类型的指针,因为这个宏是在编译期就可确定的,并不是运行时计算得到的,所以这里将0转换为TYPE*类型没有问题,其实这里根本不关心地址是多少,我只关心的是一个TYPE类型的指针,至于为什么要用0请往下看。
2.((TYPE *)0)->MEMBER
:这里就可以用一个TYPE类型的指针访问到它的成员MEMBER;
3.&((TYPE *)0)->MEMBER
:然后取该成员的地址,由于以内存空间的0地址作为上述TYPE类型指针,所以这里得到的地址就可可以计算出该成员的偏移地址:&((TYPE *)0)->MEMBER - 0。这就是为什么要以0地址作转型,方便计算而已,不论以哪个地址为基准进行计算得到的偏移地址都是定值。接下来说到container_of这个宏是怎么由成员list_node地址计算得到我们my_list类型的结构体的首地址的呢。上述我们的例子以及计算出list_node成员的偏移地址是8,所有在使用运行时我们定义一个链表:
//初始化链表
list_head *pos = &(x->list_node);
INIT_LIST_HEAD(head);//略
- 利用container_of宏即可求出地址tmp即是我们的x的首地址,
struct my_list *tmp = container_of(pos, struct my_list, node_list);
tmp->a;
tmp->b;
- 分析container_of:
container_of宏的作用很简单,就是通过一个容器(结构体)中某个成员的指针得到指向这个容器(结构体)的指针。这个宏的实现代码只有两行,我们逐行的分析一下container_of宏的实现
container_of 第一部分
const typeof(((type *)0)->member)* __mptr = (ptr);
1、typeof是GNU C对标准C的扩展,它的作用是根据变量获取变量类型,typeof也是利用了编译器在编译期计算得到的。
2、typeof获取了type结构体的member成员变量的类型,然后定义了一个该类型的指针__mptr,并将实际结构体该成员变量的指针的值赋值给__mptr。
3、通过这行代码,临时变量__mptr中保存了type结构体成员变量member在内存中分配的地址值。例如我们的例子中是以list_node这个成员指针为基准(注意,这里可以不用list_head类型成员,其他成员也可以,只不过用list_head类型的成员更通用直观一些),声明一个临时的同类型的指针__mptr保存这个传出的指针(地址)。然后用该指针(地址)减去之前计算的固定偏移量,不就是这个成员当前所处的结构体首地址吗。
container_of 第二部分
(type*)((char*)__mptr - offsetof(type, member));
这块代码是利用__mptr的地址,减去type结构体成员member相对于结构体首地址的偏移地址,得到的自然是结构体首地址,即该结构体指针。
到这里大致解释了这个宏的原理及用法,这里我注意到container_of的第二句为什么要将__mptr转换为(char *)再减去偏移量呢,这里有些莫名奇妙,为什么偏偏是(char *)而不是其他类型。
然而进一步研究发现,这里其实转型成(void *)也是没问题的,但是其他类型就不行。其实这里涉及到最基本的问题,不同类型指针在进行加减运算时地址跨越的字节数是不一样的。
例如:int *a; a++;
在64位系统中是a地址向后挪了4个字节而不是1个字节,字节是计算机可寻址的最基本单元,地址的增减就是按最小的粒度字节增减的,换句话说地址间的差值就是差的字节数。
那么这里用(char *)其实是因为(char)恰好是一个字节的长度,也就是最小粒度。而且(void *)是默认的一字节粒度,所以这里的困惑就此解开:
__mptr转型成(char *)类型的指针目的只不过是想让该地址以单字节的粒度进行偏移的加减。
注:测试环境 >>Ubuntu14.04、gcc 4.4