重审C中老生常谈的swap函数交换数值

文章也同时在个人博客 http://kimihe.com/更新

概览

本文内容是关于C语言参数传值,以及x86底层实现的计算机科学。

包含了原理速览以及代码示例。

引言

如果你学习过C,可能会对经典的swap函数问题记忆深刻。简单的参数传值并不能在函数外部完成两个数的交换,而要用指针传地址。

对此的解释一般为:C语言是以传值的方式将参数传递给函数。因此传递进去的是参数的副本,纵使万千改动也无法触及本源丝毫。故有使用指针一说,以切实地修改两个参数地址处的值。

但对于单纯的传值与传指针(亦地址,引用)的区别是什么,能够道出原委的人可能并不多。因此笔者想通过本文进入更底层的汇编领域,向大家更加清晰地阐述在底层究竟发生了什么。

原料

基本必需配置
  • 任意文本编辑器(可以用来copy文中出现的代码)
  • GCC(我们需要用GCC来编译C源代码,并以GCC的规则来讲解,其它编译器产生的结果可能会不同)
额外建议配置
  • 类UNIX的环境(Linux与Mac等皆可,笔者是Mac)

实验

源代码

我们拥有swapValue.cswapAddr.c两份源代码,作为研究swap原理的基础,内容分别如下:

// swapValue.c

void swapValue(int a, int b)
{
    int tmp = a;
    a = b;
    b = tmp;
}

void fun()
{
    int a = 2;
    int b = 3;
    
    swapValue(a, b);
}

// swapAddr.c

void swapAddr(int *a, int *b)
{
    int tmp = *a;
    *a = *b;
    *b = tmp;
}

void fun()
{
    int a = 2;
    int b = 3;
    
    swapAddr(&a, &b);
}

代码内容很简单,分别是用传值和传地址两种方式实现swap,并都在fun函数中调用swap。

使用汇编器

启动命令行窗口,针对上述两份源代码进行汇编,输入如下命令:

gcc   -S swapValue.c
gcc   -S -O1 swapAddr.c

第二行多了一个-O1参数是为了让汇编代码更加便于阅读。之后得到swapValue.sswapAddr.s两份汇编代码。

分析汇编代码

swapValue.s

我们首先分析swapValue.s,撇去次要部分后,我们关注如下内容:

_swapValue:                             ## @swapValue
    ...
    ...
    movl    %edi, -4(%rbp)
    movl    %esi, -8(%rbp)
    movl    -4(%rbp), %esi
    movl    %esi, -12(%rbp)
    movl    -8(%rbp), %esi
    movl    %esi, -4(%rbp)
    movl    -12(%rbp), %esi
    movl    %esi, -8(%rbp)
    ...
    ...
    
_fun:                                   ## @fun
    ...
    ...
    movl    $2, -4(%rbp)
    movl    $3, -8(%rbp)
    movl    -4(%rbp), %edi
    movl    -8(%rbp), %esi
    callq   _swapValue
    ...
    ...

大家不必去理解汇编代码的含义,只需要理解笔者的讲解即可。可以看到汇编代码分为_fun_swapValue两个部分,与C源码中两个函数是对应的。

注意:在汇编中我们把函数改用过程来称呼。

_fun过程

对于_fun过程,我们可以看到参数2和参数3被最终分别传递到了寄存器%edi%esi中。随后调用了_swapValue子过程。

简而言之就是_fun过程将两个实参存放在两个寄存器中,然后调用_swapValue子过程。

在x86架构中,上述两个寄存器是专门用来向函数传递参数的,%edi负责传递第一个参数,%esi负责传递第二个参数。

_swapValue过程

可能是GCC优化问题,汇编代码拐弯抹角地实现了一个实际上很简单的操作。

上文有提到:两个参数存放在寄存器%edi%esi中。这段代码首先把两个参数分别复制到函数的栈内存中,即把%edi复制到-4(%rbp)中,把%esi复制到-8(%rbp)中,通过栈内存来存放局部变量。

随后拐弯抹角地交换了-4(%rbp)-8(%rbp)内部的值。可以看到:由于两个参数一开始就被复制,函数操作的一直都是这份副本。于是,这就是传值操作无法切实修改参数值的原因。

swapAddr.s

再来看看swapAddr.s,其中_fun过程没有特别的变化,区别集中在_swapAddr过程。

_swapAddr:                              ## @swapAddr
    ...
    movl    (%rdi), %eax
    movl    (%rsi), %ecx
    movl    %ecx, (%rdi)
    movl    %eax, (%rsi)
    ...
    ...
    
_fun:                                   ## @fun
    ...
    ...
    movl    $2, -4(%rbp)
    movl    $3, -8(%rbp)
    leaq    -4(%rbp), %rdi
    leaq    -8(%rbp), %rsi
    callq   _swapAddr
    ...
    ...


从外观上,可以看到_swapAddr中寄存器的操作,相比之前多了一对圆括号。(%rdi)(%rsi)互相交换内容。

这对圆括号就是传地址的奥秘所在,该操作统称为间接寻址

之前寄存器中存放的就是真实的数据,操作时直接取出寄存器中的内容即可。而这里,寄存器中存放的数据不能直接使用,它是一个索引(地址),先取出这个索引,然后去内存中与该索引相对应的位置处取出数据。有点像图书馆中根据书籍的编号去找书。

再仔细想想,这个理念与C语言中的指针是不是很像?没错,指针的底层实现就是它!

因此,由于内存中的地址是唯一对应的,因此在_swapAddr中我们就直接修改了两个参数地址处的值,于是两个参数也就完成了数据交换。

总结

以上就是对于传值与传地址的讲解。普通的变量就是保存一个数值而已,而指针是一种保存变量地址的变量,它的第一层含义是地址,第二层含义是根据该地址去取值。

指针常常是表达某个计算的唯一途径,而且可以生成更加高效紧凑的代码。例如字符串复制函数,关键代码若用指针只需如下:

char * strcpy(char *dest, char *src)
{
    char *ret = dest;
    while ((*dest++ = *src++))
        ;
    
    return ret;
}

正是有了指针,很多高级的操作才成为了可能,宏伟的程序才得以构建。

希望本文对大家有所帮助,感谢阅读,欢迎分享~

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,254评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,875评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,682评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,896评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,015评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,152评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,208评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,962评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,388评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,700评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,867评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,551评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,186评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,901评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,142评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,689评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,757评论 2 351

推荐阅读更多精彩内容

  • 原文地址:C语言函数调用栈(一)C语言函数调用栈(二) 0 引言 程序的执行过程可看作连续的函数调用。当一个函数执...
    小猪啊呜阅读 4,598评论 1 19
  • 一、温故而知新 1. 内存不够怎么办 内存简单分配策略的问题地址空间不隔离内存使用效率低程序运行的地址不确定 关于...
    SeanCST阅读 7,790评论 0 27
  • 站在巨人的肩膀上——IDA PRO权威指南阅读笔记 一,窗口 view->open subviews 打开/关闭各...
    SueLyon阅读 14,369评论 0 6
  • 注:这是第三遍读《C语言深度解剖》,想想好像自从大学开始就没读完过几本书,其中谭浩强的那本《C语言程序设计(第四版...
    HavenXie阅读 1,719评论 1 6
  • 蓝天,青山,白云。小草绿树成荫。 远眺山路逶迤,天山相连。山峰郁郁葱葱。 日影偏西。云儿偷偷躲在树隙中...
    旖旎i阅读 238评论 0 4