一条cltq指令引发的血案

这篇文章是我于2011年左右先在百度博客写了，后来又搞到自己做的博客上，现在又把它放在简书上。

转载请标注来处：http://www.jianshu.com/p/d2e22da3a71b

两个 a.c b.c， a.c里实现了一个函数 void **malloc2d()返回一个void型的二级指针，然后b.c里会调用这个malloc2d的函数，但是在调试的时候始终得不到正确的值，遂用gdb进行调试一番，发现在调用malloc2d过后，rax寄存器的值发生了变化，高32位被截取为0了，我靠，这还了得，猜想会不会是哪把我这个内存给采掉了，我X，百思不得其解。于是乎慢慢的试，先将malloc2d的实现放在了b.c里了，结果是没问题的，这就很纳闷了，难道是跨文件惹的祸，将改变后的二进制文件进行objdump反汇编与原来的二进制的反汇编进行比较，发现原来的在调用malloc2d后多了一条指令cltq

1159   400f75:       e8 8f 03 00 00          callq  401309 <malloc2d>
1160   400f7a:       48 98                  cltq
1161   400f7c:       48 89 05 05 0d 20 00    mov    %rax,0x200d05(%rip)        # 601c88 <case_with_funcid>

这是一条神马指令啊，为什么不是直接将返回值RAX赋给变量呢，为什么要先cltq啊，到底是什么情况啊。
然后再用GDB调试了下原二进制文件，

(gdb) 
0x0000000000400f7a in create_tmp_suite_table ([MySQL](http://lib.csdn.net/base/mysql)=0x7fffffffdde0, suite=0x601c50 "Oglconform_31", 
    cases=0x601c64 "(1.5)") at mysql_operation.c:165
165case_with_funcid = malloc2d(846, 626, sizeof(int), &tmp);
1: x/i $pc
=> 0x400f7a <create_tmp_suite_table+100>:cltq    //下一条要执行的指令
(gdb) p /x $rax    //先 check下 $rax
$3 = 0x7ffff6ebc010
(gdb) si          //执行一条指令cltq
0x0000000000400f7c165case_with_funcid = malloc2d(846, 626, sizeof(int), &tmp);
1: x/i $pc
=> 0x400f7c <create_tmp_suite_table+102>:mov    %rax,0x200d05(%rip)        # 0x601c88 <case_with_funcid>
(gdb) p /x $rax     //再check 下rax
$4 = 0xfffffffff6ebc010

看出来了吧，rax高32位被截了全补1了，什么情况，为什么GCC 出来会多一条没用的CLTQ 指令啊，GOOGLE一下，
http://www.cs.cmu.edu/~fp/courses/15213-s07/misc/asm64-handout.pdf
cltq R[%rax ] <- SignExtend(R[%eax]) Convert %eax to quad word，将$eax转化为4字，不就是RAX了嘛，切，
cltq是有符号数的扩展，如果$eax的最高的32位为1的话，刚RAX的高32扩展后全为1，相反如果$EAX的高位为0的话，则扩展出来后全为0
所以刚刚的$eax扩展后$rax 为0xfffffffff6ebc010多了，

BUT,BUT,BUT, 问题是找到了，但是是什么原因触发了这个cltq指令呢，大牛给出了解释，
http://forum.osdev.org/viewtopic.php?f=1&t=23133

二楼的兄弟给了这样的解释：

My guess is that "heap_sbrk"is not properly declared in the latter case, and thecompiler assumes it is returning an int (32 bits) instead of an uintptr_t (64 bits). Check the inclusion of the header file.

原来在写makefile的时候a.c 直接写的是gcc -c a.c 产生a.o，gcc a.o b.c -o b这样在编译b.c的时候，malloc2d函数会在a.o里找到malloc2d的sysbol，但是它并没有在b.c时申明，所以编译器会默认它返回32位，而我们在用malloc2d的时候会(int **)malloc2d强制转一次为64位（BTW，MY OS IS 64 BIT)的了，所以它要扩展下eax，就这样了，

所以在编译的时候最好加上 -Werror 参数 It will make you a much better developer.

一条cltq指令引发的血案

一条cltq指令引发的血案

相关阅读更多精彩内容

友情链接更多精彩内容