首页 > 其他 > 详细

基础知识—栈

时间:2016-04-29 19:27:33      阅读:244      评论:0      收藏:0      [点我收藏+]

操作系统是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

关于栈需要掌握以下几点:

  1. 整个内存由操作系统(OS)来管理。
  2. 每个进程都有自己的堆栈,操作系统决定了栈分配的大小,
  3. 32位系统每个进程有自己的4G空间,这4G为逻辑空间,堆栈都在4G逻辑空间里。
  4. 对于进程而言,进程之间操作不由进程管理
  5. 活动记录块!一个函数在运行中调用很多函数,每次调用函数由系统来处理。
  6. 用到的一些数据,为静态数据,放在静态存储区,进程结束时区域收回。
  7. 对于heap,进程有控制权
  8. 针对栈堆的攻击都比较难。
  9. UAF(use after free),发生在heap,其他由系统管理。
  10. 系统管理栈运用大量寄存器
  11. ax a代表累加器
  12. 栈里面存了动态分配的内存的指针
  13. 操作系统内,栈是由高向低地址扩展的数据结构,是一块连续的内存区域,栈顶的地址和栈的最大容量是系统预先规定好的,能从栈获得的空间较小。
  14. 堆是由低向高地址扩展的数据结构,是不连续的内存区域,这是由于系统是由链表在存储/组织空闲内存地址,自然堆就是不连续的内存区域,且链表的遍历也是从低地址向高地址遍历的,堆的大小受限于计算机系统的有效虚拟内存空间,因此,堆获得的空间比较灵活,也比较大。

栈 VS 堆

申请的效率不同:

  1. 栈由系统自动分配,速度快,但是程序员无法控制。
  2. 堆是由程序员自己分配,速度较慢,容易产生碎片,不过用起来方便。
  3. 栈更快因为所有的空闲内存都是连续的,因此不需要对空闲内存块通过列表来维护。只是一个简单的指向当前栈顶的指针。编译器通常用一个专门的、快速的寄存器来实现。更重要的一点事是,随后的栈上操作通常集中在一个内存块的附近,这样的话有利于处理器的高速访问。(局部性原理)

动态内存分配

malloc的参数就是需要分配的内存字节数。如果内存池中的可用内存可以满足这个需求,malloc就返回一个指向被分配的内存块起始位置的指针。

1>malloc所分配的是一块连续的内存。例如:如果请求分配100个字节的内存,那么它实际分配的内存就是100个连续的字节,并不会分开位于两块或多块不同的内存。同时,malloc实际分配的内存有可能比你请求的稍微多一点。但是这是由编译器定义的。

2>如果内存池是空的,或者它的可用内存无法满足要求时。在该情况下,malloc()函数向操作系统请求,要求得到更多地内存,并在这块内存上执行分配任务。如果操作系统无法向malloc提供更多的内存,malloc就返回一个NULL指针。因此,要对每个从malloc返回的指针都进行检查,确保它并非NULL是非常重要的。

问题:内存池大小可以变化?

常见的动态内存错误

  1. 使用动态内存分配的程序中,常常会出现很多错误。

    1>对NULL指针进行解引用操作
    2>对分配的内存进行操作时越过边界
    3>释放并非动态分配的内存
    4>试图释放一块动态分配的内存的一部分以及一块内存被释放之后被继续使用。
    说明:
    **动态分配最常见的错误就是忘记检查所请求的内存是否成功分配。
    动态内存分配的第二大错误来源是操作内存时超出了分配内存的边界。**

  2. 当你使用free时,可能出现各种不同的错误

    1>传递给free的指针必须是一个从malloc、calloc或realloc函数返回的指针。
    2>传递给free函数一个指针,让它释放一块并非动态分配的内存可能导致程序立即终止或在晚些时候终止。
    3>试图释放一块动态分配内存的一部分也有可能引起类似问题,如 free(pi + 5);

    释放一块内存的一部分是不允许的。动态分配的内存必须整块一起释放。但是,realloc函数可以缩小一块动态分配的内存,有效地释放它尾部的部分内存。

    4>不要访问已经被free函数释放了的内存。

系统栈的工作原理

内存的不同用途

不管什么样的操作系统、计算机结构, 一个进程使用的内存按照功能大致分为以下4个部分

  • 代码区(.text):存储着被转入执行的二进制代码,处理器会到这个区域取指并执行。text段禁用写权限,因为该段不用来存储变量,而只用来存储代码。可以防止人们修改程序代码。(该段只读的一个优点是:可被程序的不同副本所共享,使同时执行程序多次不出现任何的问题。注意:这段大小固定,因为里面没什么可变化。)
  • 数据区(.data && .bss):存储全局和静态程序变量。data段中充满了整个程序运行过程都要使用的已经初始化的全局变量、字符串和其他常量。bss段充满了相应的未初始化的内容。虽然这些段可以改写的,但是他们也有固定的大小
  • 堆区(heap):进程可以再堆区动态地请求一定大小的内存,并在用完之后归还给栈区。动态分配和回收是堆区的特点。大小可变,低地址想高地址增加
  • 栈区(stack):用于动态存储函数之间的调用关系,以保证被调用函数在返回时恢复到母函数中继续执行。大小可变

用户栈和内核栈的区别

操作系统中,每个进程会有两个栈,一个用户栈,存在于用户空间,一个内核栈,存在于内核空间。当进程在用户空间运行时,cpu堆栈指针寄存器里面的内容是用户堆栈地址,使用用户栈;当进程在内核空间时,cpu堆栈指针寄存器里面的内容是内核栈空间地址,使用内核栈。

内核栈是内存中属于操作系统空间的一块区域,其主要用途为:

1)保存中断现场,对于嵌套中断,被中断程序的现场信息依次压入系统栈,中断返回时逆序弹出;

2)保存操作系统子程序间相互调用的参数、返回值、返回点以及子程序(函数)的局部变量。

用户栈是用户进程空间中的一块区域,用于保存用户进程的子程序间相互调用的参数、返回值、返回点以及子程序(函数)的局部变量。

PS:那么为什么不直接用一个栈,何必浪费那么多的空间呢?
1)如果只用系统栈。系统栈一般大小有限,如果中断有16个优先级,那么系统栈一般大小为15(只需保存15个低优先级的中断,另一个高优先级中断处理程序处于运行),但用户程序子程序调用次数可能很多,那样15次子程序调用以后的子程序调用的参数、返回值、返回点以及子程序(函数)的局部变量就不能被保存,用户程序也就无法正常运行了。

2)如果只用用户栈。我们知道系统程序需要在某种保护下运行,而用户栈在用户空间(即cpu处于用户态,而cpu处于核心态时是受保护的),不能提供相应的保护措施(或相当困难)。

栈溢出

栈溢出就是缓冲区溢出的一种。程序在运行过程中,为了临时存取数据的需要,一般都要分配一些内存空间,通常称这些空间为缓冲区。如果向缓冲区中写入超过其本身长度的数据,以致于缓冲区无法容纳,就会造成缓冲区以外的存储单元被改写,这种现象就称为缓冲区溢出。缓冲区长度一般与用户自己定义的缓冲变量的类型有关。

由于缓冲区溢出而使得有用的存储单元被改写,往往会引发不可预料的后果。向这些单元写入任意的数据,一般只会导致程序崩溃之类的事故,对这种情况我们也至多说这个程序有bug。但如果向这些单元写入的是精心准备好的数据,就可能使得程序流程被劫持,致使不希望的代码被执行,落入攻击者的掌控之中,这就不仅仅是bug,而是漏洞(exploit)了。

注意:缓冲区只是某个进程栈中的一部分区域,不能与栈空间等同

寄存器与函数栈帧

每一个函数独占自己的栈帧空间。当前正在运行的函数的栈帧总是在栈顶。Win32系统提供两个特殊的寄存器用于标识位于系统栈顶端的栈帧。

(1)ESP:栈指针寄存器(extended stack pointer),其内存放着一个指针,该指针永远指向系统栈最上面一个栈帧的栈顶。

(2)EBP:基址指针寄存器(extended base pointer),其内存放着一个指针,该指针永远指向系统栈最上面一个栈帧的底部。

技术分享

函数栈帧:ESP和EBP之间的内存空间为当前栈帧,EBP标识了当前栈帧的底部,ESP标识了当前栈帧的顶部。

在函数栈帧中,一般包含以下几类重要信息。

(1)局部变量:为函数局部变量开辟的内存空间。

(2)栈帧状态值:保存前栈帧的顶部和底部(实际上只保存前栈帧的底部,前栈帧的顶部可以通过栈帧平衡计算得到),用于在本栈被弹出后恢复出上一个栈帧。

(3)函数返回地址:保存当前函数调用前的“断点”信息,也就是函数调用前的指令位置,以便在函数返回时能够恢复到函数被调用前的代码区中继续执行指令。

注:函数栈帧的大小并不固定,一般与其对应函数的局部变量多少有关。函数运行过程中,其栈帧大小也是在不停变化的。除了与栈相关的寄存器外,我们还需要记住另一个至关重要的寄存器。

EIP:指令寄存器(extended instruction pointer),其内存放着一个指针,该指针永远指向下一条等待执行的指令地址。 可以说如果控制了EIP寄存器的内容,就控制了进程——我们让EIP指向哪里,CPU就会去执行哪里的指令。王爽老师的汇编里面讲EIP讲的已经是挺好的了

参考链接:

  1. 系统栈的工作原理
  2. 系统栈的工作原理——码农网
  3. 堆空间&栈空间&&动态内存分配
  4. 《深入理解计算机系统》笔记(一)栈

问题:
1. 每个进程分配的栈空间是由操作系统决定?跟编译器有关吗?(看有的地方说跟编译器也有关系)
2. 内核栈和用户栈,是不是在所说的每个进程都有一个4G栈内再细分?

基础知识—栈

原文:http://blog.csdn.net/wyy_sunshine/article/details/51232433

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!