学习特权级切换,关键知识点是:
- 两个指令
call
和iret
。 - 一个CPU特性:特权级变换时会将一个特权级的堆栈复制到另外一个特权级堆栈。
从低到高
只有使用调用门才能从低特权级转移到高特权级,更具体地说,是使用语句call 门选择子
。
门描述符
门选择子的结构和段选择子一致,只不过它指向的是门描述符而不是段描述符。
门描述符和段描述符占用的内存空间相同,都是8个字节,64个bit。可后者包含的元素是:
- 目标代码段选择子。
- 在目标代码段中的偏移量。
- ParamCount。这是什么?后面再解释。
- 门描述符的属性。
代码
使用调用门从低特权级转移到高特权级的代码是:
push ax
push bx
;SelectorGate 指向一个高特权级的目标代码段
call SelectorGate:0
ParamCount
入栈了2个元素,2
就是上文提到的ParamCount
。可以把它理解成函数的参数。在门描述符中,ParamCount
占用5个bit位,能表示的最大值是2的5次方-1,即31。这意味着,使用一个调用门,最多能入栈31个元素。
堆栈复制
假定,上面的代码的能成功从低特权级代码段L转移到高特权级代码段H。L和H是不同的代码段,各自的堆栈也不同。这不是必须的。L和H共用一个堆栈,也不是不行。这样的话,在H中操作堆栈可能会破坏L中的堆栈(总之,存在这种可能)。所以,代码段拥有独立的堆栈更好。
那么,问题来了。入栈操作发生在L中,被入栈元素存在于L的堆栈LS,在H中怎么从LS中获取数据呢?也许存在方法,但一定很繁琐。现实中,CPU会自动把LS中的元素复制到H的堆栈中。并非复制LS中的全部元素,而是从LS的栈顶开始,复制ParamCount
个元素。这个复制操作发生在call
执行的时候。
示意图
短调用是段内部的调用,长调用是段之间的调用。长调用才能从低特权级转移到高特权级。
短调用和长调用示意图之间的差别,仅仅在于后者把cs
入栈了。cs
是调用者的代码段选择子。
示意图中的堆栈,是H的堆栈HS。
短调用
call执行前----> | 高地址 | |
---|---|---|
ss | ||
esp | <-----------堆栈 | |
参数二(ax) | ||
参数一(bx) | ||
call执行后----> | eip | |
长调用
call执行前----> | 高地址 | |
---|---|---|
ss | ||
esp | <-----------堆栈 | |
参数二(ax) | ||
参数一(bx) | ||
cs | ||
call执行后----> | eip | |
CPU工作流程--调用门
调用门的运行过程,涉及LS和HS两个堆栈。上面的示意图只画出了HS的状态,不足以阐述调用门的整个流程,本小节再用文字详细说明调用门的运行过程。
TSS
先介绍一个新东西,TSS,任务状态寄存器,一个寄存器。CPU在切换任务的时候,能用TSS给切换下来的任务建立一个快照,这个快照包含一个任务的所有寄存器数据。不过,大部分操作系统嫌弃这种切换方式太消耗时间,并没有完全按照CPU厂商的意图使用TSS。Linux系统也是如此。
在TSS中,包含ss0、esp0
、ss1、esp1
、ss2、esp2
三组数据,正好对应0特权级、1特权级、2特权级三个层次的特权级。
特权级不是有四个层次吗?为什么没有对应3特权级的那一组数据呢?TSS的作用是为低特权级向高特权级转移时提供高特权级的堆栈。3特权级是最低特权级,没有更低的特权级向它转移。
假如,从3特权级向0特权级转移,CPU会从TSS中选择ss0、esp0
作为0特权级代码段的堆栈。
流程
使用call SelectorGate:0
实现低特权级向高特权级转移的流程如下(不叙述CPL等特权级检查流程,假设满足这些条件):
- 执行
call
语句时。 - 把当前代码段的堆栈LS的
ss_old、esp_old
临时保存起来。 - 从门选择子指向的目标代码段中获取DPL,根据DPL的值,在TSS中选择
ss、esp
,将堆栈指向的新堆栈。例如,DPL的值是0,选择ss0、esp0
。 - 把
ss_old、esp_old
中的入栈到新堆栈中。 - 把LS中的栈元素复制到新堆栈中。复制规则是:从LS的栈顶开始,复制
ParamCount
个元素。 - 依次入栈
cs、eip
。
小结
从低特权级转移到高特权级的方法是,使用调用门,具体语句是call SelectorGate:0
。
不能使用jmp
。jmp
只能在实现短调用,在同一个特权级转移。因为jmp
不会将下一条指令的地址存储到新特权级的堆栈中,这意味着,jmp
是一个有去无回的指令。从低特权级转移到高特权级的场景,一般是用户进程求助操作系统完成某种功能,需要再次返回用户进程。