[虚拟机字节码执行引擎]1——栈桢

96
某昆
2018.01.06 12:10* 字数 1621

本文主要内容

  • 前言
  • 运行时栈桢结构

已经学习了虚拟机内存区域、Class文件结构、类加载机制等知识,是时候学习虚拟机字节码执行过程了。

前言

虚拟机是一个相对物理机而言的概念,它们都有代码执行能力,其区别是物理机的执行引擎是直接建立在处理器、硬件、指令集和操作系统层面的。而虚拟机的执行引擎则是自己实现的。

一个Java应用程序就对应着一个虚拟机进程,虚拟机根据规范,自己操作内存、解析字节码并执行。

运行时栈桢结构

栈桢是用于支持虚拟机进行方法调用和方法执行的数据结构,它是虚拟机运行时数据区中的虚拟机栈的栈元素。

栈桢中存储了方法的局部变量表、操作数栈、动态连接和方法返回地址等信息。

每一个方法从调用开始到执行完成的过程,就对应着一个栈桢在虚拟机栈里入栈到出栈的过程。

在编译代码的时候,栈桢中需要多大的局部变量表、多深的操作数栈都已经完全确定了,并且写入到方法的Code属性了。

如上图,stack = 1,表明操作数栈深度最大为1,locals = 1,局部变量表所需要的内容为1个slot。

对于执行引擎来说,活动线程中,只有栈顶的栈桢是有效的,称为当前栈桢,这个栈桢所关联的方法称为当前方法,执行引擎所运行的所有字节码指令都只针对当前栈桢进行操作。

1、局部变量表

局部变量表是一组变量值存储空间,用于存放方法参数和方法内部定义的局部变量。

在Java程序被编译为Class文件时,就在方法的Code属性的max_locals数据项中确定了该方法所需要分配的最大局部变量表的容量。

局部变量表以slot为单位,每个slot单位可以存放一个boolean,byte,char,short,int,float,reference或returnAddress类型的数据。对于64位类型的数据,虚拟机会以高位在前的方式为其分配2个连续的slot空间。64位的数据类型只有两种:long和double。

虚拟机通过索引定位方式引用局部变量表,如果是32位类型数据,索引n就代表使用了第n个slot,如果是64位,则说明要使用n和n+1两个slot

注意,如果是非static方法,局部变量表中的第0位索引的slot,默认是用于传递方法所属对象实例的引用,即this。

局部变量表中的slot是可以重用的,方法体中的定义的变量作用域不一定会覆盖整个方法体,如果超出作用域,那么这个变量的slot就可以交给其它变量使用。

2、操作数栈

操作数栈也称为操作栈,它是一个先入后出的栈。

同局部变量表一样,操作数栈的最大深度也在编译时候被写入Code属性的max_stacks属性中了。操作数栈的每一个元素可以是任意的Java数据类型,包括long和double,32位数据类型占据栈容量为1,64位栈空间占位为2,在方法执行的任何阶段,操作数栈的深度都不会超过max_stacks。

当一个方法开始执行时,操作数栈是空的。

举个例子说明操作数栈是如何工作的。整数加法的字节码指令iadd在运行的时候,要求操作数栈中最接近栈顶的两个元素已经存入了int值,当执行此命令时,会将这两个int值出栈并相加,然后将结果入栈。

Java虚拟机被称为“基于栈的执行引擎”,其中所指的栈就是操作数栈。Android虚拟机则是基于寄存器的虚拟引擎。

3、动态连接

每一个栈桢中都包含一个指向运行时常量池中该栈桢所属方法的引用,持有这个引用是为了支持方法调用过程中的动态连接。

Class文件加载过程中,有一个解析阶段,将符号引用转化为直接引用,但这个转化不是完全体的,只转化了一部分,还有一部分需要在运行时靠动态连接来完成。

Java三大特性中的多态就是依靠动态连接完成的,如果在编译期间就完全转化成直接引用,那多态就不会出现了。关于这点在方法调用那节再谈。

4、方法返回地址

当一个方法执行后,有两种方式退出方法

  • 执行引擎遇到任何一个方法返回的字节码指令。
  • 方法执行过程中遇到了异常,并且异常没有在方法中得到处理。

无论是何种退出方式,方法退出后,都需要返回到方法被调用的位置,程序才能继续执行。调用者的PC计数器的值就可以作为返回地址,栈桢中很可能会保存这个计数器值。

退出方法过程实际上等同于把当前栈桢出栈,因此退出时可能执行的操作有:恢复上层方法的局部变量表和操作数栈,把返回值(如果有)压入调用者栈桢的操作数栈中,调用PC计数器的值以指向方法调用指令后面的一条指令等。

关于方法调用、字节码详细解析过程,下一篇文章继续分析。

深入理解Java虚拟机
Web note ad 1