1.理解虚拟存储器的概念和作用
2.理解地址翻译的概念
3.理解存储器映射
4.掌握动态存储器分配的方法
5.理解垃圾收集的概念
6.了解C语言中与存储器有关的错误
计算机系统的主存被组织成一个由M个连续的字节大小的单元组成的数组,每字节都有一个唯一的物理地址PA。
根据物理地址寻址的是物理寻址。
虚拟存储器被组织为一个由存放在磁盘上的N个连续的字节大小的单元组成的数组。
使用虚拟寻址时,CPU通过生成一个虚拟地址VA来访问主存,这个虚拟地址在被送到存储器之前先转换成适当的物理地址(这个过程叫做地址翻译,相关硬件为存储器管理单元MMU)
地址空间是一个非负整数地址的有序集合:
{0,1,2,……}
地址空间中的整数是连续的。
CPU从一个有 N=2^n 个地址的地址空间中生成虚拟地址,这个地址空间成为称为虚拟地址空间。
由表示最大地址所需要的位数来描述。
N=2^n:n位地址空间
主存中的每个字节都有一个选自虚拟地址空间的虚拟地址和一个选自物理地址空间的物理地址。
虚拟存储器——虚拟页VP,每个虚拟页大小为P=2^平字节
物理存储器——物理页PP,也叫页帧,大小也为P字节。
任意时刻,虚拟页面的集合都被分为三个不相交的子集:
需要知道,这种缓存结构:
页表是一个数据结构,存放在物理存储器中,将虚拟页映射到物理页。
页表就是一个页表条目PTE的数组,组成为:
有效位+n位地址字段
地址字段表示DRAM中相应的物理页的起始位置,这个物理页中缓存了该虚拟页
表示该虚拟页未被分配
这个地址指向该虚拟页在磁盘上的起始位置。
几个定义:
局部性原则保证了在任意时刻,程序将往往在一个较小的活动页面集合上工作,这个集合叫做工作集/常驻集。
所以只要程序有良好的时间局部性,虚拟存储器系统就能工作的相当好。
不好?
颠簸:工作集大小超出了物理存储器的大小。
VM简化了链接和加载、代码和数据共享,以及应用程序的存储器分配。
这里需要知道PTE的三个许可位:
具体符号见上图
地址翻译就是一个N元素的虚拟地址空间VAS中的元素和一个M元素的物理地址空间PAS中元素之间的映射。
页面基址寄存器PTBR指向当前页表。
MMU利用VPN选择适当的PTE。
PPO=VPO。
高速缓存/主存返回所请求的数据给处理器。
返回原来的进程,再次执行导致缺页的指令,会命中
TLB:翻译后备缓冲器,是一个小的、虚拟存储的缓存,其中每一行都保存着一个由单个PTE组成的块
步骤:
多级页表——采用层次结构,用来压缩页表。
这一部分看懂书上的例题。
在这里,PTE有三个权限位:
还有连个缺页处理程序涉及到的位:
Linux为每个进程维持了一个单独的虚拟地址空间,如图:
内核虚拟存储器包括:内核中的代码和数据结构。
一部分区域映射到所有进程共享的物理页面
另一部分包含每个进程都不相同的数据。
区域:就是已分配的虚拟存储器的连续片。
区域的例子:
每个存在的虚拟页面都保存在某个区域中。内核为系统中的每个进程维护一个单独的任务结构task_struct:
一个具体区域的区域结构包括:
不合法,触发段错误,终止进程
合法,进入下一条
不合法,触发保护异常,终止程序
合法,进入下一条
即指Linux通过将一个虚拟存储器区域与一个磁盘上的对象关联起来,以初始化这个虚拟存储器区域的内容的过程。
映射对象:
1.Unix文件系统中的普通文件
2.匿名文件(全都是二进制0)
共享对象对于所有把它映射到自己的虚拟存储器进程来说都是可见的
即使映射到多个共享区域,物理存储器中也只需要存放共享对象的一个拷贝。
fork函数就是应用了写时拷贝技术,至于execve函数:
#include <unistd.h>
#include <sys/mman.h>
void *mmap(void *start, size_t length, int prot, int flags, int fd, off_t offset);
成功返回指向映射区域的指针,若出错则为-1
参数含义:
prot:访问权限位,具体如下:
PROT_EXEC:由可以被CPU执行的指令组成
PROT_READ:可读
PROT_WRITE:可写
PROT_NONE:不能被访问
flag:由描述被映射对象类型的位组成,具体如下:
MAP_ANON:匿名对象,虚拟页面是二进制0
MAP_PRIVATE:私有的、写时拷贝的对象
MAP_SHARED:共享对象
int munmap(void *start, size_t length);
成功返回0,失败返回-1
从start开始删除,由接下来length字节组成的区域。
是一个请求二进制0的区域,紧接在未初始化的bss区域后开始,并向上(更高的地址)生长。有一个变量brk指向堆的顶部
系统调用malloc函数,从堆中分配块:
#include <stdlib.h>
void *malloc(size_t size);
成功返回指针,指向大小至少为size字节的存储器块,失败返回NULL
系统调用free函数来释放已分配的堆块:
#include <stdlib.h>
void free(void *ptr);
无返回值
ptr参数必须指向一个从malloc、calloc或者reallov获得的已分配块的起始位置。
为什么要使用动态存储器分配?
因为经常知道程序实际运行时,它们才知道某些数据结构的大小。
虽然有未使用的存储器,但是不能用来满足分配请求时,发生这种现象。
发生在一个已分配块比有效载荷大的时候
易于量化。
发生在当空闲存储器合计起来足够满足一个分配请求,但是没有一个单独的空间块足以处理这个请求时发生
难以量化,不可预测。
堆块的格式:
由一个字的头部,有效荷载,和可能的额外填充组成。
空闲块通过头部中的大小字段隐含地连接着,分配器可以通过遍历堆中所有的块,从而间接地遍历整个空闲块的集合。
需要:特殊标记的结束块。
系统对齐要求和分配器对块格式的选择会对分配器上的最小块大小有强制的要求。
从头开始搜索空闲链表,选择第一个合适的空闲块
从上一次搜索的结束位置开始搜索
检索每个空闲块,选择适合所需请求大小的最小空闲块
用到sbrk函数:
#include <unistd.h>
vid *sbrk(intptr_t incr);
成功则返回旧的brk指针,出错为-1
通过将内核的brk指针增加incr来扩展和收缩堆。
合并是针对于假碎片问题的,任何实际的分配器都必须合并相邻的空闲块。
有两种策略:
这个合并的意思是,因为头部的存在,所以向后合并是简单的,但是向前合并是不方便的,所以???在块的最后加一个脚部,作为头部的副本,就方便了合并,具体四种情况如下:
空闲块总是需要脚部的。
这里课本上给了一个详细的例子,关于如何实现一个简单分配器的设计,有几点是需要注意的:
隐式的,分配时间是块总数的线性时间
但是显式的,是空闲块数量的线性时间。
隐式——隐式空闲链表
显式——双向链表,有前驱和后继,比头部脚部好使。
分离存储,是一种流行的减少分配时间的方法。一般思路是将所有可能的块大小分成一些等价类/大小类。
分配器维护着一个空闲链表数组,每个大小类一个空闲链表,按照大小的升序排列。
有两种基本方法:
每个大小类的空闲链表包含大小相等的块,每个块的大小就是这个大小类中最大元素的大小。
如果链表非空:分配其中第一块的全部
如果链表为空:分配器向操作系统请求一个固定大小的额外存储器片,将这个片分成大小相等的块,并且连接起来成为新的空闲链表。
优点:时间快,开销小
缺点:容易造成内部、外部碎片
每个空闲链表是和一个大小类相关联的,并且被组织成某种类型的显示或隐式链表,每个链表包含潜在的大小不同的块,这些块的大小是大小类的成员。
这种方法快速并且对存储器使用很有效率。
其中每个大小类都是2的幂
这样,给定地址和块的大小,很容易计算出它的伙伴的地址,也就是说:一个块的地址和它的伙伴的地址只有一位不同。
优点:快速检索,快速合并。
垃圾收集器是一种动态存储分配器,它自动释放程序不再需要的已分配块,这些块被称为垃圾,自动回收堆存储的过程叫做垃圾收集。
垃圾收集器将存储器视作一张有向可达图,只有当存在一条从任意根节点出发并到达p的有向路径时,才说节点p是可达的,而不可达点就是垃圾。
有两个阶段:
相关函数:
ptr定义为typedef void *ptr
根本原因是C语言不会用类型标记来标记存储器位置。
常见错误:
——scanf错误
常见错误:
——假设堆存储器被初始化为0
常见错误:
——缓冲区溢出错误
在远处起作用action at distance
参考资料:
1.《深入理解计算机系统》第九章
2.参考博客:http://www.cnblogs.com/20135202yjx/p/5040711.html
原文:http://www.cnblogs.com/20135223heweiqin/p/5043840.html