从内存角度看C函数的调用过程

时间：2016-04-11 12:26:57 阅读：258 评论：0 收藏：0 [点我收藏+]

从内存的角度详细的分析C语言中的函数调用过程：

首先写一个测试用的代码：
#include <stdio.h>

int add(int x, int y)
{
	int z = 0;
	z = x + y;
	return z;
}

int main()
{
	int a = 0, b = 0;
	int c = 0;

	c = add(a, b);

	return 0;
}
这是一个简单的的求和函数。

其次，让我们确定一下，程序是从哪里开始运行的：

调试程序，按一下F10（博主用的VS2013），

进入main函数：

然后进调试--->窗口--->调用堆栈（用来显示函数的调用关系）。

发现正在调用main这个函数，现在我想知道是谁在调用main函数，F10一路走到return 0,接着换F11，逐语句调试，然后会发现，main函数返回后，我们来到了这里：

再看看此时的调用堆栈：

直接来看，现在运行的函数是__tmainCRTStartup()，这个函数又被mainCRTStratup()调用，而我们刚刚是从main()函数返回来的，所以，main()函数是由__tmainCRTStartup()这个函数调用的。

了解了main()函数是被谁调用后，我们可以进一步分析这其中的细节了！

现在重新F10进入调试，到这一步：

进入main()函数后还没有执行任何一条语句，我们右击-->转到反汇编：

看到了汇编语言的代码，图中的ebp和esp是什么东西呢？我们知道，调用函数的时候操作系统要给这个函数分配一段内存空间，之前又说了main()函数是由—__tCRTStartup()函数调用的，所以请看：

mainCRTStratup()函数调用__tmainCRTStra()函数的时候就会从栈上为__tmainCRTStra()分配类似图中这么一块空间。我们知道栈是由高地址向低地址扩展的。其中ebp叫做栈底指针，esp叫做栈顶指针（当然也有其它叫法）。ebp，esp本身是一个寄存器，其中存放了地址时，我们就称之为指针！

现在再来看汇编程序：

按一下F10执行第一条语句，箭头指向下一条语句，变成这样：

（和我们再外边的调试是一样的）这句 push ebp 就是将ebp中的值进行压栈，而此时ebp存放的是系统分给__tmainCRTStartup()函数的空间的起始地址。因为我们现在要调用main()函数了，所以当然要先把__tmainCRTStartup()函数的运行状态保存下来，这样main()函数才能返回的时候才能找得到！push是在栈顶进行的，所以，push之后，esp要向上移动：

（为了方便字体显示我将图中的方块拉开了一些，与之前的表示并没有什么不同）

然后继续执行下一条语句： mov         ebp,esp

即把esp的值赋给ebp，这样，ebp也就指向了现在esp的位置，如下图：

接着又执行语句：sub         esp,0E4h

即将esp的值减去E4h，所以esp向上移动了E4h个位置（相当于申请了这么大的一块空间），如下：

新申请的这块空间就给main()用了。

接下来紧接着三条push语句将下边要用到的寄存器中原来的值存储起来，等我们借用完寄存器后再给人家pop回去，不管它，这里esp再向上移动三次。

下边四条语句共同完成一个任务，就是将图中的正方形区域初始化为0CCCCCCCh（你经常看到的：烫烫烫烫......）

然后是：lea         edi,[ebp-0E4h]
就是将ebp减去E4h的值赋给edi，这个E4h是不是很眼熟呢？它就是我们上一步分配给main()的空间的大小，即edi指向前一副图esp的位置；

接着：mov         ecx,39h
把39h放在ecx中（充当了计数器）

接着：mov         eax,0CCCCCCCCh

把要初始化的数据写入eax

最后：rep stos    dword ptr es:[edi]

循环的从低地址（ebp-0E4h）向高地址（ebp）写0CCCCCCCCh，循环了39h次！

我们转到内存中看一下：

先查找ebp

相应的位置已经被初始化为0CCCCCCCh，其它部分是乱码（此时ebp值为0x009EF860，它之上的空间是分配给main()的）

程序继续往下执行：

//这下面本来也是有很多的配图的，不知道什么原因显示不出来。。。我的图是动态变化的，没精力在从头搞一次了，大家有兴趣的话自己转到反汇编调试调试

//很容易理解的。不好意思了！

创建了两个变量，初始化为0：

接着创建c：

此时我们的内存分配变成了这样：

（底下多余的部分由于空间问题先不显示出来）

然后到了这里：

把b的值赋给eax，然后eax压栈

把a的值赋给ecx，然后ecx压栈，变成这样：

再然后就要调用add()函数了:

调用call的时候，程序会自动的将当前程序的下一条语句的地址压栈，以便调用完后返回，继续F11跟进去：

这下进入了add函数，这几句和之前分析的差不多，为add()开辟了一块空间，然后初始化，ebp，esp指向相应的位置。

然后创建变量z，将x的值放入eax，y的值加到eax里，又赋给了z，将z的值返回的时候当然不能把它留在z里，因为z是个局部变量，函数返回后就销毁了。所以将z值放入eax。

连续三个pop，然后把ebp的值赋给了esp！注意：esp是栈顶指针，让栈顶指针指向了栈底，又pop ebp，即把main()函数空间的ebp给了现在的ebp，所做的工作相当于释放了add()调用时产生的空间（实际上仍然在，只是不属于你）。最后ret（与之前的call配合使用），程序运行到之前call的下一条语句：

把eax的值赋给了变量z，然后eax异或eax即为清零。

接下来又是一样：

连续3个pop，释放main()函数的空间，又调用了一个__RTC_CheckEsp(0D4113Bh)，我们不管它，F10下去，ret，来到了之前看到的调用main()的函数：

一路F10，程序运行完毕（依次回到__tCRTStartup()函数和CRTStartup()函数，有兴趣的话可以跟进去看看）。