代码编译的结构:本地机器码--->字节码。
越来越多的程序语言选择了与操作系统和机器指令集无关的、平台中立的格式作为程序编译后的存储格式。
无关性基石
一次编写,到处运行。
虚拟机:平台无关性,可以运行在不同平台上,并且可以载入和执行同一种格式的字节码。
- 字节码是构成平台无关性的基石。
[图片上传失败...(image-9fbc02-1510229187478)] - 虚拟机不关心Class的来源是什么语言,只要它符合Class文件应有的机构,就可以在Java虚拟机上运行。
- Java语言中的各种变量、关键字和运算符号的语义最终都是由多条字节码命令组合而成,因此字节码命令所能提供的语义描述能力肯定比Java语言强大。因此,字节码比Java语言支持更多的语言特性。
Class类文件的结构
Class文件是一组以8字节为基础单位的二进制流。
当遇到需要占用8字节以上空间的数据时,则会按照高位在前的方式分割成若干个9字节进行存储。
各个数据项目按照顺序紧密排列,中间没有添加任何分隔符。
故:Class文件中存储的内容几乎全部是程序运行的必要数据。
- Class文件格式:类似C语言结构体的伪结构存储,这种伪结构只有两种数据类型:
- 无符号数。
- 表。
无符号数:属于基本数据类,以u1、u2、u4、u8分别代表1个字节、2个字节、4个字节、8个字节的无符号数。无符号数可以用来描述数字、索引引用、数量值、或UTF-8编码的字符串值。
表:多个无符号数或其他表作为数据项构成的复合数据类型。所有表都习惯以“_info”结尾。表用于描述由层次关系的复合结构的数据。
整个Class文件本质上就是一张表。如下表:
[图片上传失败...(image-857ea7-1510229187478)]
魔数与Class文件的版本
每个Class文件的头4个字节称为魔数,唯一作用是用于确定这个文件是否为一个能被JVM接受的Class文件。
- 使用魔数不使用扩展名来进行识别主要是基于安全考虑,因为文件扩展名可以随意变动 。
- 紧接着魔数的四个字节存储的是Class文件的版本号:第五六个字节是次版本号,第七八字节是主版本号。如下图,次版本号是0x0000,主版本号是0x0032,即50。
[图片上传失败...(image-8158b8-1510229187478)]
常量池
紧接着主版本号之后的是常量池入口。
常量池的数量不固定,所以会放置一项u2类型的数据,代表常量池容量计数值。(计数从1开始,不是0)
- 真实存储的常量个数:计数值-1.
- 常量池主要存放两大类常量:
- 字面量:
- 文本字符串。
- final的常量值。
- 符号引用:
- 类和接口的全限定名。
- 字段的名称和描述符。
- 方法的名称和描述符。
- 字面量:
JVM加载Class文件的时候进行动态连接。在Class文件中不会保存各个方法和字段的最终内存布局信息,因此这些字段和方法的符号引用不经过转换的话是无法直接被JVM使用的。当JVM运行时,需要从常量池获得对应的符号引用,再在类创建时或运行时解析并翻译到具体的内存地址上。(即:在执行某一方法或者使用某一字段前,JVM并不知道其具体内存地址是多少,只有在执行的时候才会当场通过读取常量表中对应的符号引用来计算需要访问的内存地址)
- 常量池中每一项常量都是一个表,共有11中结构不同的表结构数据。这11种表使用1-12标识,缺省为2.
[图片上传失败...(image-bd7bde-1510229187478)]
访问标志
在常量池结束后,紧接的2个字节代表访问标志(access_flag)。
- 用于识别一些类或接口的访问信息:
- 这个Class是类还是接口。
- 是否定义为public类型。
- 是否定义为abstract类型。
- 如果是类,是否声明为final。
- 等。
[图片上传失败...(image-e1b47c-1510229187478)]
access_flag占用两个字节,应该总共由32个标志位可以使用,但当前只定义了8个。
类索引、父类索引与接口索引集合
类索引、父类索引:都是一个u2类型的数据。
接口索引集合:一组u2类型数据的集合。
Class文件使用这三个索引确定这个类的继承关系。
- 类索引:确定这个类的全限定名。
- 父类索引:确定这个类的父类的全限定名。(除了Oject类外,其他类的父类索引都不为0)
- 接口索引集合:描述这个类实现了哪些接口。(实现的接口按照implements中的顺序,排列在索引集合中)
字段表集合
字段表(field_info)用于描述接口或类中声明的变量。
- 字段表包含的变量:
- 类级变量。
- 实例级变量。
- 不包含方法内部声明的变量。
字段的描述信息:
- 作用域:public、private、protected。
- 类级/实例级:static。
- 可变性:final。
- 并发可见性:volatile。(是否强制从主内存读写)
- 是否可序列化:transient。
- 变量数据类型:基本类型、对象、数组。
- 变量名称。
字段表的最终格式如下图:
[图片上传失败...(image-837b8c-1510229187478)]
方法表集合
Class文件对方法表的描述类似于字段表。其最终格式如下图:
[图片上传失败...(image-502b06-1510229187478)]
- 在access_flags中删除了不能修饰方法的volatile、transient关键字,添加了synchronized、native、strictfp和abstract关键字。
- 如果父类方法没有在子类中重写,则在子类的方法表集合中不会出现父类方法的信息。
属性表集合
在Class文件、字段表、方法表中都可以携带自己的属性表集合。以用于描述某些场景专有的信息。
- JVM定义的属性:
[图片上传失败...(image-cceb2c-1510229187478)] - 对于每一个属性,它的名称对应常量池中CONSTANT_Utf8_info类型的常量,而属性值的结构完全自定义。具体结构如下:
[图片上传失败...(image-d1c898-1510229187478)]