JVM-4-字节码

概述

  • 字节码采用Big-Endian,是Spark、PowerPC等处理器的默认字节序;x86则是用Little-Endian
jvm-001.jpg
  • 字节码文件采用一种类似于C语言结构体的伪结构来存储数据,只有两种数据类型:无符号数和表
    • 无符号数
      • 基本数据类型,以u1,u2,u4,u8分别代表1,2,4,8字节的无符号数
      • 可用来描述数字、索引引用、数量值或者按UTF-8编码构成字符串值
      • 由多个无符号数或者其他表作为数据项构成的复合数据类型
      • 习惯性地以“_info”结尾
      • 整个Class文件本质上也就是一张表

文件结构

ClassFile {
    u4             magic; # 0xCAFEBABE
    u2             minor_version;
    u2             major_version;
    u2             constant_pool_count;
    cp_info        contant_pool[constant_pool_count – 1]; # 之所以-1,是因为#0被做他用了
    u2             access_flags;
    u2             this_class;
    u2             super_class;
    u2             interfaces_count;
    u2             interfaces[interfaces_count];
    u2             fields_count;
    field_info     fields[fields_count];
    u2             methods_count;
    method_info    methods[methods_count];
    u2             attributes_count;
    attribute_info attributes[attributes_count];
}
magic, minor_version, major_version
    specifies information about the version of the class,  and the version of the JDK this class was compiled for
constant_pool
    similar to a symbol table although it contains more data this is described in more detail below
access_flags
    provides the list of modifiers for this class
this_class
    index into the constant_pool providing the fully qualified name of this class i.e. org/jamesdbloom/foo/Bar
super_class
    index into the constant_pool providing a symbolic reference to the super class i.e. java/lang/Object
interfaces
    array of indexes into the constant_pool providing a symbolic references to all interfaces that have been implemented
fields
    array of indexes into the constant_pool giving a complete description of each field
methods
    array of indexes into the constant_pool giving a complete description of each method signature, if the method is not abstract or native then the bytecode is also present
attributes
    array of different value that provide additional information about the class including any annotations with RetentionPolicy.CLASS or RetentionPolicy.RUNTIME

结构详解

  • 魔数
    • 标识class文件
  • 大小版本
    • major_version.minor_version合在一起为class文件版本,编译器产生,如59.0,与JDK版本相关
  • 常量池
    • 相同类型值在常量池中归一,以索引供外部引用,缩减字节码文件大小,便于网络传输的初衷
    • 逻辑类型:字面量(literal) + 符号引用(symbolic reference)
    • 常量池中装常量,每个常量都是一个表,一共14种常量(JDk 7之前只有前11种)
image.png

image.png

访问标识

名称 描述
ACC_PUBLIC 0x0001 public
ACC_FINAL 0x0010 final,不可被继承
ACC_SUPER 0x0020 兼容早期编译器,新编译器均设该标记,invokespecial指令会对子类方法做特定处理
ACC_INTERFACE 0x0200 接口,需同时设置ABSTRACT
ACC_ABSTRACT 0x0400 抽象类
ACC_SYNTHETIC 0x1000 synthetic,编译器产生
ACC_ANNOTATION 0x2000 注解,需同时INTERFACE和ABSTRACT
ACC_ENUM 0x4000 枚举
  • 多项值:或运算
    • PUBLIC+SUPER 0x0021

字段表

  • 类变量,实例变量,但不含继承变量,不含局部变量
  • Z(boolean) B C S I J(long) F D V L(object)
名称 类型 描述
access_flags u2 见属性访问标识
name_index u2 名称索引
descriptor_index u2 描述符索引
attributes_count u2 属性个数
attributes[attributes_count] attribute_info 属性集合
  • 属性访问标识
名称 描述
ACC_PUBLIC 0x0001 public
ACC_PRIVATE 0x0002 private
ACC_PROTECTED 0x0004 protected
ACC_STATIC 0x0008 static
ACC_FIANL 0x0010 final
ACC_VOLATILE 0x0040 volatile,直接读写内存,不可被缓存;与FINAL互斥
ACC_TRANSIENT 0x0080 transient
ACC_SYNTHETIC 0x1000 synthetic
ACC_ENUM 0x4000 enum

方法表

名称 类型 描述
access_flags u2 见方法访问标识
name_index u2 名称索引
descriptor_index u2 描述符索引
attributes_count u2 属性个数
attributes[attributes_count] attribute_info 属性集合
  • 方法访问标识
名称 描述
ACC_PUBLIC 0x0001 public
ACC_PRIVATE 0x0002 private
ACC_PROTECTED 0x0004 protected
ACC_STATIC 0x0008 static
ACC_FIANL 0x0010 final
ACC_SYNCHRONIZED 0x0040 synchronized
ACC_BRIDGE 0x0080 桥接方法,泛型时出现过
ACC_VARARGS 0x0080 含不定参数
ACC_NATIVE 0x0080 native
ACC_ABSTRACT 0x0080 abstract
ACC_STRICTFP 0x1000 strictfp
ACC_SYNTHETIC 0x4000 synthetic,编译器产生,如<init>,<clinit>

字节码命令

# 变量操作
aload_n # 本地变量数组->操作数栈 a代表对象引用,n代表本地变量数组索引
iload # int
lload # long
fload # float
dload # double
ldc # 运行时常量池常量->操作数栈
getstatic # 运行时常量池静态变量->操作数栈

# 方法
invokedynamic
invokeinterface
invokespecial # 实例初始化,私有方法,父类方法
invokestatic
invokevirtual # 普通实例方法

# return语句
return:void
ireturn:int
lreturn:long
freturn:float
dreturn:double
areturn:object reference

# java源码
Object foo = new Object();
# 字节码
 0: new #2           // Class java/lang/Object
 1: dup
 2: invokespecial #3 // Method java/lang/Object:"<init>"( ) V
 
 0 # 堆中开了块内存,返回对象引用至操作数栈
 1 # 复制栈顶对象引用,塞入栈顶
 3 # 对象初始化,消耗栈顶对象引用(作为参数)
 # 留下的那个栈顶对象引用,就是初始化好的对象引用

字节码文件例子

package some;
public class SimpleClass {
    private int m;
    public int inc() {
        return m + 1;
    }
}
cafe babe 0000 0034 0016 0700 0201 0010
736f 6d65 2f53 696d 706c 6543 6c61 7373
0700 0401 0010 6a61 7661 2f6c 616e 672f
4f62 6a65 6374 0100 016d 0100 0149 0100
063c 696e 6974 3e01 0003 2829 5601 0004
436f 6465 0a00 0300 0b0c 0007 0008 0100
0f4c 696e 654e 756d 6265 7254 6162 6c65
0100 124c 6f63 616c 5661 7269 6162 6c65
5461 626c 6501 0004 7468 6973 0100 124c
736f 6d65 2f53 696d 706c 6543 6c61 7373
3b01 0003 696e 6301 0003 2829 4909 0001
0013 0c00 0500 0601 000a 536f 7572 6365
4669 6c65 0100 1053 696d 706c 6543 6c61
7373 2e6a 6176 6100 2100 0100 0300 0000
0100 0200 0500 0600 0000 0200 0100 0700
0800 0100 0900 0000 2f00 0100 0100 0000
052a b700 0ab1 0000 0002 000c 0000 0006
0001 0000 0003 000d 0000 000c 0001 0000
0005 000e 000f 0000 0001 0010 0011 0001
0009 0000 0031 0002 0001 0000 0007 2ab4
0012 0460 ac00 0000 0200 0c00 0000 0600
0100 0000 0700 0d00 0000 0c00 0100 0000
0700 0e00 0f00 0000 0100 1400 0000 0200
15

javap -v -p -s -sysinfo -constant some/SimpleClass.class

package some;
public class SimpleClass {
    public int a = 1;//这个1并不会出现在常量池中,而a以Filedref出现
    final int b = 3;//这个3会以Integer表的身份出现在常量池中,b也以Fieldref出现
    public void sayHello() {
                final int c = 10;//只有c以Utf8出现,10并没有出现(这个final待究)
        System.out.println(c);
        System.out.println("Hello");
    }
}

推荐阅读更多精彩内容