这篇文章是我于2011年左右先在百度博客写了,后来又搞到自己做的博客上,现在又把它放在简书上。
转载请标注来处:http://www.jianshu.com/p/d2e22da3a71b
两个 a.c b.c, a.c里实现了一个函数 void **malloc2d()返回一个void型的二级指针,然后b.c里会调用这个malloc2d的函数,但是在调试的时候始终得不到正确的值,遂用gdb进行调试一番,发现在调用malloc2d过后,rax寄存器的值发生了变化,高32位被截取为0了,我靠,这还了得,猜想会不会是哪把我这个内存给采掉了,我X,百思不得其解。于是乎慢慢的试,先将malloc2d的实现放在了b.c里了,结果是没问题的,这就很纳闷了,难道是跨文件惹的祸,将改变后的二进制文件进行objdump反汇编与原来的二进制的反汇编进行比较,发现原来的在调用malloc2d后多了一条指令cltq
1159 400f75: e8 8f 03 00 00 callq 401309 <malloc2d>
1160 400f7a: 48 98 cltq
1161 400f7c: 48 89 05 05 0d 20 00 mov %rax,0x200d05(%rip) # 601c88 <case_with_funcid>
这是一条神马指令啊,为什么不是直接将返回值RAX赋给变量呢,为什么要先cltq啊,到底是什么情况啊。
然后再用GDB调试了下原二进制文件,
(gdb)
0x0000000000400f7a in create_tmp_suite_table ([MySQL](http://lib.csdn.net/base/mysql)=0x7fffffffdde0, suite=0x601c50 "Oglconform_31",
cases=0x601c64 "(1.5)") at mysql_operation.c:165
165case_with_funcid = malloc2d(846, 626, sizeof(int), &tmp);
1: x/i $pc
=> 0x400f7a <create_tmp_suite_table+100>:cltq //下一条要执行的指令
(gdb) p /x $rax //先 check下 $rax
$3 = 0x7ffff6ebc010
(gdb) si //执行一条指令cltq
0x0000000000400f7c165case_with_funcid = malloc2d(846, 626, sizeof(int), &tmp);
1: x/i $pc
=> 0x400f7c <create_tmp_suite_table+102>:mov %rax,0x200d05(%rip) # 0x601c88 <case_with_funcid>
(gdb) p /x $rax //再check 下rax
$4 = 0xfffffffff6ebc010
看出来了吧,rax高32位被截了全补1了,什么情况,为什么GCC 出来会多一条没用的CLTQ 指令啊,GOOGLE一下,
http://www.cs.cmu.edu/~fp/courses/15213-s07/misc/asm64-handout.pdf
cltq R[%rax ] <- SignExtend(R[%eax]) Convert %eax to quad word,将$eax转化为4字,不就是RAX了嘛,切,
cltq是有符号数的扩展,如果$eax的最高的32位为1的话,刚RAX的高32扩展后全为1,相反如果$EAX的高位为0的话,则扩展出来后全为0
所以刚刚的$eax扩展后$rax 为0xfffffffff6ebc010多了,
BUT,BUT,BUT, 问题是找到了,但是是什么原因触发了这个cltq指令呢,大牛给出了解释,
http://forum.osdev.org/viewtopic.php?f=1&t=23133
二楼的兄弟给了这样的解释:
My guess is that "heap_sbrk"is not properly declared in the latter case, and thecompiler assumes it is returning an int (32 bits) instead of an uintptr_t (64 bits). Check the inclusion of the header file.
原来在写makefile的时候a.c 直接写的是gcc -c a.c 产生a.o,gcc a.o b.c -o b这样在编译b.c的时候,malloc2d函数会在a.o里找到malloc2d的sysbol,但是它并没有在b.c时申明,所以编译器会默认它返回32位,而我们在用malloc2d的时候会(int **)malloc2d强制转一次为64位(BTW,MY OS IS 64 BIT)的了,所以它要扩展下eax,就这样了,
所以在编译的时候最好加上 -Werror 参数 It will make you a much better developer.