Java字节码的结构

参考《Java虚拟机规范JavaSE7版》的描述来看,每一个字节码文件其实都对应着全局唯一的一个类或者接口的定义信息。字节码文件采用的是一种类似于C语言结构体的伪结构来描述字节码文件格式。为了避免与类的字段、实例等概念产生混淆,本书将用于描述类结构格式的内容定义为项(item)

每一项都包括类型、名称以及该项的数量。类型可以是表明,也可以是“基本类型”。包含在字节码文件中,各项按照严格的顺序进行连续存放,其内部并不包含任何的分隔符区分段落。在此大家需要注意,这个结构体中只有两种数据结构,分别是无符号数和表,其中无符号数属于字节码文件中的“基本类型”,字节码文件中的无符号数有u1/u2/u4/u8,分别表示一个字节无符号类型、两个字节无符号类型、4个字节无符号类型、8个字节无符号类型。

表是由多个无符号数或者其他表作为数据项构成的复合数据类型,所有表的后缀都是使用“_info”进行结尾,并且字节码文件实质上也就是一张表。每一个字节码文件对应着一个ClassFile的结构,如下所示:

Class{

u4              magic

u2              minor_version

u2             major_version

u2              constant_pool_count

cp_info          constant_pool[constant_pool_count-1]

u2              access_flags

u2              this_class

u2              super_class

u2              interfaces_count

u2              interfaces[interfaces_count]

u2              fields_count

field_info        fields[fields_count]

u2              methods_count

method_info     methods[methods_count]

u2              attributes_count

attribute_info     attributes[attributes_count]

}

关于ClassFile结构的描述信息,如下所示:

1)  magic 魔术字符

一个有效地字节码文件的前4个字节为0xCAFEBABE,(咖啡宝贝),也称之为魔术字符。JVM用魔术字符来校验一个目标class文件是否是合法的。

2)  minor_version(此版本号)和major_version(主版本号)

紧跟在magic之后的4个字节就是编译的次版本号和主版本号,他们共同构成了字节码文件的版本号。如果字节码文件的版本号超出了JVM所能够处理的有效范围,那么Java虚拟机将不会处理这个字节码文件。不过高版本的JVM却能向下兼容运行由低版本JDK编译的字节码文件。

3)  constant_pool_count(常量池计数器)和constant_pool(常量池)

在字节码文件中,紧跟在次版本号和主版本号之后的就是常量池计数器和常量池。常量池是字节码文件中非常重要的数据项,同时也是字节码文件中与其他项关联最大和占用字节码空间最大的数据项。常量池主要存放字面量(Literal)和符号引用(Symbolic References)两大类数据常量,其访问方式是通过索引来进行访问的,但由于常量池列表中的数量并不固定,因此在常量池之前就需要通过一个2个字节的常量池计数器来统计常量池列表中到底拥有多少常量项。在此大家注意,常量池计数器中的计数值并不是从0开始进行计数的,而从1开始,也就是说,如果常量池中有两个常量时,计数值为2。

常量池中存放的字面量由文字字符串、final常量值等构成,而符号引用则包括了类和接口的全限定名(Fully Qualified Name)、字段的名称和描述符(Descriptor),以及方法的名称和描述符。

4)  access_flags(访问标志)

紧跟在常量池之后的2个字节是访问标志,访问标志就是用于表示某个类或者接口的访问权限。比如:访问标志指明的是字节码文件中的类还是接口;使用的访问修饰符是哪一种,是否是由abstract关键字修饰的抽象类;如果是被abstract修饰的抽象类,不能再标记为final类型;接口类型同样也不允许被final修饰。访问标志的定义如下所示(仅列举2项,具体请看书):

访问标志

描述

ACC_PUBLIC

0x0001

声明为public,可以被包的类进行外访问

ACC_FINAL

0x0010

声明为final,不允许有派生类

5)  this_class(类索引)和super_class(超类索引)

紧跟在访问标志之后的4个字节就是类索引和超类索引,类索引和超类索引各自会通过索引指向常量池列表中的一个类型为CONSTANT_Class_info的常量项。CONSTANT_Class_info由tag和name_index两部分组成,tag是一个具有CONSTANT_Class_info值的常量,而name_index则是指向常量池列表中类型为CONSTANT_Utf8_info常量项的索引,通过这个索引即可成功获取到CONSTANT_Utf8_info常量项中的全限定名字符串,如下图所示。简单来说,类索引用于确定当前类的全限定名,而超类索引则用于确定当前类的超类的全限定名。

6)  interfaces_count(接口计数器)和interface(接口表)

在类索引和超类索引之后的4个字节就是接口计数器和接口表。接口计数器用于表示当前类或者接口的直接超类接口数量。接口表实际上是一个数组集合,包含了当前类或者接口在常量池列表中直接超类接口的索引集合,通过这个索引即可确定当前类或者接口的超类接口的全限定名。

7)  fields_count(字段计数器)和fields(字段表)

在接口计数器和接口表之后就是字段计数器和字段表。字段计数器用于表示一个字节码文件中的field_info表总数,也就是一个类中类变量和实例变量的数量总和。而字段表实际上则是一个数组集合,字段表中的每一个成员都必须是一个field_info结构的数据项。简单来说,field_info用于表达一个字段的完整信息,比如字段的表示符、访问修饰符(public/private/protected)、是类变量还是实例变量(static 修饰符)、是否是常量(final修饰符)。字段表中所包含的字段信息仅限于当前类或接口的所属字段,并不包含继承超类后的字段信息。

8)  methods_count(方法计数器)和methods(方法表)

在字段计数器和字段表之后就是方法计数器和方法表。方法计数器用于表示一个字节码文件中的method_info表总数。而方法表实际上是一个数组集合,方法表中的每个成员都必须是一个method_info结构的数据项。简单来说,method_info用于表示当前类或者接口中某个方法的完整描述,比如方法标示符、方法的访问修饰符、方法的返回值类型以及方法的参数信息等。方法表中所包含的方法信息仅限于当前类或者接口中的所属方法,并不包含继承超类后的方法信息。

9)  attribute_count(属性计数器)和attributes(属性表)

在方法计数器和方法表之后的就是属性计数器和属性表。属性计数器用于表示当前字节码文件中的attribute_info表总数。而属性表同之前的字段表和方法表一样都是一个数组集合,属性表中的每一个成员都必须是一个attribute_info结构的数据项。每一个attribute_info表的第一项都是指向常量池列表中的CONSTANT_Utf8_info项的索引,该表给出了属性的名称。

属性可以出现在ClassFile表、字段表和方法表中,用以描述与其相关的信息,比如描述字节码文件中所定义的类和接口相关的信息、描述与字段相关的信息、描述与方法相关的信息。

摘自《Java虚拟机精讲》高翔龙

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 157,298评论 4 360
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 66,701评论 1 290
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 107,078评论 0 237
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,687评论 0 202
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,018评论 3 286
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,410评论 1 211
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,729评论 2 310
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,412评论 0 194
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,124评论 1 239
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,379评论 2 242
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,903评论 1 257
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,268评论 2 251
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,894评论 3 233
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,014评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,770评论 0 192
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,435评论 2 269
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,312评论 2 260

推荐阅读更多精彩内容