在 class 文件中生成所有的字节码指令(一)

参考资料

  1. 2.11. Instruction Set Summary
  2. Chapter 6. The Java Virtual Machine Instruction Set
  3. Chapter 7. Opcode Mnemonics by Opcode
  4. 深入理解JVM字节码2.3.1 加载和存储指令小节
  5. 深入理解Java虚拟机(第3版) 的附录C

正文

Java Virtual Machine 中用到的所有字节码指令可以在 Chapter 6. The Java Virtual Machine Instruction Set 中找到。字节码指令一共有两百多个。

我们可以尝试写一些 java 代码,让这两百多个字节码指令出现在编译后的 class 文件中。如果想让这两百个多个字节码指令出现在同一个 class 文件中,那么对应的 java 文件可能会比较臃肿。我们换个思路。可以写若干个 java 文件,每编译一个 java 文件,我们就在对应的 class 文件中用到一部分字节码指令。这样也算是用到了所有的字节码指令。
例如如下的 java 文件编译后,应该会用到 aconst_null 指令。

public class Temp {
  public Object f() {
    return null;
  }
}

本文先处理一部分 加载和存储指令(Load and Store Instructions)

The Java® Virtual Machine Specification 中对 加载和存储指令 的描述

The Java® Virtual Machine Specification 2.11.2 小节 如下

2.11.2. Load and Store Instructions

The load and store instructions transfer values between the local variables (§2.6.1) and the operand stack (§2.6.2) of a Java Virtual Machine frame (§2.6):

  • Load a local variable onto the operand stack: iload, iload_<n>, lload, lload_<n>, fload, fload_<n>, dload, dload_<n>, aload, aload_<n>.

  • Store a value from the operand stack into a local variable: istore, istore_<n>, lstore, lstore_<n>, fstore, fstore_<n>, dstore, dstore_<n>, astore, astore_<n>.

  • Load a constant on to the operand stack: bipush, sipush, ldc, ldc_w, ldc2_w, aconst_null, iconst_m1, iconst_<i>, lconst_<l>, fconst_<f>, dconst_<d>.

  • Gain access to more local variables using a wider index, or to a larger immediate operand: wide.

Instructions that access fields of objects and elements of arrays (§2.11.5) also transfer data to and from the operand stack.

Instruction mnemonics shown above with trailing letters between angle brackets (for instance, iload_<n>) denote families of instructions (with members iload_0, iload_1, iload_2, and iload_3 in the case of iload_<n>). Such families of instructions are specializations of an additional generic instruction (iload) that takes one operand. For the specialized instructions, the operand is implicit and does not need to be stored or fetched. The semantics are otherwise the same (iload_0 means the same thing as iload with the operand 0). The letter between the angle brackets specifies the type of the implicit operand for that family of instructions: for <n>, a nonnegative integer; for <i>, an int; for <l>, a long; for <f>, a float; and for <d>, a double. Forms for type int are used in many cases to perform operations on values of type byte, char, and short (§2.11.1).

This notation for instruction families is used throughout this specification.

个人理解

刚才的引文中提到 加载和存储指令 分为四类,其中第一类指令的作用是 Load a local variable onto the operand stack, 也就是将 局部变量表 中的变量加载到 操作数栈 上。涉及的指令包括
. iload
. iload_<n> (n 的可能取值是 0, 1, 2, 3)
. lload
. lload_<n> (n 的可能取值是 0, 1, 2, 3)
. fload
. fload_<n> (n 的可能取值是 0, 1, 2, 3)
. dload
. dload_<n> (n 的可能取值是 0, 1, 2, 3)
. aload
. aload_<n> (n 的可能取值是 0, 1, 2, 3)

下面是实战环节

实战

生成 iloadiload_<n> 指令

iloadiload_<n>int 类型有关。 对 iload_<n> 而言,n 的可能取值是 0, 1, 2, 3,所以它其实包含了如下4个指令

  1. iload_0 = 26 (0x1a)
  2. iload_1 = 27 (0x1b)
  3. iload_2 = 28 (0x1c)
  4. iload_3 = 29 (0x1d)

Chapter 6. The Java Virtual Machine Instruction Set 中对 iload_<n> 有如下描述

The <n> must be an index into the local variable array of the current frame (§2.6). The local variable at <n> must contain an int. The value of the local variable at <n> is pushed onto the operand stack.

iload 指令有一个 index 参数
Chapter 6. The Java Virtual Machine Instruction Set 中对 iload 有如下描述

The index is an unsigned byte that must be an index into the local variable array of the current frame (§2.6). The local variable at index must contain an int. The value of the local variable at index is pushed onto the operand stack.

我来写一个程序,看看编译后生成的 class 文件中是否会出现 iloadiload_<n> 指令。
java代码如下

public class Load {
  public static int f(int p0, int p1, int p2, int p3, int p4) {
    return p0 + p1 + p2 + p3 + p4;
  }
}

执行如下的命令对它进行编译,并查看 class 文件中的内容

javac Load.java
javap -cp . -c Load

结果如下

Compiled from "Load.java"
public class Load {
  public Load();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return

  public static int f(int, int, int, int, int);
    Code:
       0: iload_0
       1: iload_1
       2: iadd
       3: iload_2
       4: iadd
       5: iload_3
       6: iadd
       7: iload         4
       9: iadd
      10: ireturn
}

可以看到在 f()Code 属性中,iload 以及4iload_<n> 指令都出现了。

生成 lloadlload_<n> 指令

lloadlload_<n>long 类型有关。
这里 n 的可能取值是 0, 1, 2, 3lload_<n> 其实包含了如下4个指令

  1. lload_0 = 30 (0x1e)
  2. lload_1 = 31 (0x1f)
  3. lload_2 = 32 (0x20)
  4. lload_3 = 33 (0x21)

lloadlload_<n> 的这些指令也可以用类似的方式来生成(这里直接贴一下代码/命令/结果,重复的话就不多说了)。

public class Load {
  public static long f0(long p0, long p1, long p2) {
    return p0 + p1 + p2;
  }
  public static long f1(int a, long p0, long p1) {
    return p0 + p1;
  }
}
javac Load.java
javap -cp . -c Load
Compiled from "Load.java"
public class Load {
  public Load();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return

  public static long f0(long, long, long);
    Code:
       0: lload_0
       1: lload_2
       2: ladd
       3: lload         4
       5: ladd
       6: lreturn

  public static long f1(int, long, long);
    Code:
       0: lload_1
       1: lload_3
       2: ladd
       3: lreturn
}

生成 floadfload_<n> 指令

floadfload_<n>float 类型有关。
这里 n 的可能取值是 0, 1, 2, 3fload<n> 其实包含了如下4个指令

  1. fload_0 = 34 (0x22)
  2. fload_1 = 35 (0x23)
  3. fload_2 = 36 (0x24)
  4. fload_3 = 37 (0x25)

floadfload_<n> 的这些指令可以参考 iload/iload_<n> 的方式来生成。

public class Load {
  public static float f(float p0, float p1, float p2, float p3, float p4) {
    return p0 + p1 + p2 + p3 + p4;
  }
}

执行如下命令可以编译并查看字节码文件中的内容

javac Load.java 
javap -cp . -c Load

我这里看到的内容如下

Compiled from "Load.java"
public class Load {
  public Load();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return

  public static float f(float, float, float, float, float);
    Code:
       0: fload_0
       1: fload_1
       2: fadd
       3: fload_2
       4: fadd
       5: fload_3
       6: fadd
       7: fload         4
       9: fadd
      10: freturn
}

可以看到在 f()Code 属性中,fload 以及4fload_<n> 指令都出现了。

dload 和 dload_<n>

dloaddload_<n>double 类型有关。
这里 n 的可能取值是 0, 1, 2, 3dload_<n> 其实包含了如下4个指令

  1. dload_0 = 38 (0x26)
  2. dload_1 = 39 (0x27)
  3. dload_2 = 40 (0x28)
  4. dload_3 = 41 (0x29)

dloaddload_<n> 的这些指令也可以用类似的方式来生成。

public class Load {
  public static double f0(double p0, double p1, double p2) {
    return p0 + p1 + p2;
  }
  public static double f1(int a, double p0, double p1) {
    return p0 + p1;
  }
}
javac Load.java
javap -cp . -c Load
Compiled from "Load.java"
public class Load {
  public Load();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return

  public static double f0(double, double, double);
    Code:
       0: dload_0
       1: dload_2
       2: dadd
       3: dload         4
       5: dadd
       6: dreturn

  public static double f1(int, double, double);
    Code:
       0: dload_1
       1: dload_3
       2: dadd
       3: dreturn
}

可以看到在 f()Code 属性中,dload 以及4dload_<n> 指令都出现了。

aload 和 aload_<n>

aloadaload_<n>引用 类型有关。
这里 n 的可能取值是 0, 1, 2, 3aload_<n> 其实包含了如下4个指令

  1. aload_0 = 42 (0x2a)
  2. aload_1 = 43 (0x2b)
  3. aload_2 = 44 (0x2c)
  4. aload_3 = 45 (0x2d)
public class Load {
  public static void f0(String s0, String s1, String s2, String s3, String s4) {
    Object o = s0;
    o = s1;
    o = s2;
    o = s3;
    o = s4;
  }
}
javac Load.java 
javap -cp . -c Load

我这里看到的内容如下

Compiled from "Load.java"
public class Load {
  public Load();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return

  public static void f0(java.lang.String, java.lang.String, java.lang.String, java.lang.String, java.lang.String);
    Code:
       0: aload_0
       1: astore        5
       3: aload_1
       4: astore        5
       6: aload_2
       7: astore        5
       9: aload_3
      10: astore        5
      12: aload         4
      14: astore        5
      16: return
}

可以看到在 f()Code 属性中,aload 以及4aload_<n> 指令都出现了。

Chapter 7. Opcode Mnemonics by Opcode 中将字节码指令进行了分类。

Loads.png

上图绿色框中的所有指令,本文都涉及到了,本文完。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,240评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,328评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,182评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,121评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,135评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,093评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,013评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,854评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,295评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,513评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,678评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,398评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,989评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,636评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,801评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,657评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,558评论 2 352

推荐阅读更多精彩内容