JVM代码优化:方法内联(Method inlining)

什么是方法内联

方法内联,是指JVM在运行时将调用次数达到一定阈值的方法调用替换为方法体本身,从而消除调用成本,并为接下来进一步的代码性能优化提供基础,是JVM的一个重要优化手段之一。

如何进行方法内联

方法内联是由JIT编译器在运行时完成的。既然涉及到编译,方法内联也是有一定的开销的,包括cpu时间和内存,所以这又是一个trade-off的老问题了。JIT根据以下信息决定是否进行内联:

  • 被调用方法是否足够hot。这个取决于该方法被调用的次数,次数阈值默认值为10,000。即运行时被调用次数超过10,000的方法,可以被认为是hot。
  • 被调用方法大小是否合适。对于过大的方法,JIT认为它是不适合做内联的。这个方法大小阈值由-XX:FreqInlineSize指定,不建议修改。即大于这个阈值size的方法,不考虑进行内联
  • 被调用方法运行时其实现是否可以唯一确定。显然,对于类方法、私有方法和final方法,JIT是可以唯一确定它们的具体实现代码的(这里对应字节码中的invokestatic和invokespecial);另一方面,对于public方法调用,它所指向的具体实现可能是自身、父类、子类的方法实现代码(多态),只有当JIT能唯一确定方法的具体实现时,才有可能完成内联(对应字节码中的invokevirtual和invokeinterface)

具体例子

我们看一下具体例子。

假设有如下接口和实现定义:

    interface Host {
        int compute(int x, int y);
    }

    static class HostA implements Host {
        @Override
        public int compute(int x, int y) {
            return x + y;
        }
    }

    static class HostB implements Host {
        @Override
        public int compute(int x, int y) {
            return x + x + y;
        }
    }

    static class HostC implements Host {
        @Override
        public int compute(int x, int y) {
            return x + y + y;
        }
    }

    static class HostD implements Host {
        @Override
        public int compute(int x, int y) {
            return x - y;
        }
    }

使用以下代码进行调用测试:

public class TestInline {
    private static final int COUNT = 2000000000;

    public static void main(String[] args) {
        System.out.println(arrayCompute() + " " + virtualCompute() + " " + interfaceCompute());
    }

    static long arrayCompute() {
        Host[] hosts = new Host[4];

        hosts[0] = new HostA();
        hosts[1] = new HostB();
        hosts[2] = new HostC();
        hosts[3] = new HostD();

        long start = System.currentTimeMillis();
        Random r = new Random(start);

        int x = r.nextInt(10);
        int y = r.nextInt(10);

        for (int i = 0; i < COUNT; i++) {
            for (Host host : hosts) {
                x = host.compute(x, y);
            }
        }

        return System.currentTimeMillis() - start;
    }

    static long virtualCompute() {
        HostA hostA = new HostA();
        HostB hostB = new HostB();
        HostC hostC = new HostC();
        HostD hostD = new HostD();

        long start = System.currentTimeMillis();
        Random r = new Random(start);

        int x = r.nextInt(10);
        int y = r.nextInt(10);

        for (int i = 0; i < COUNT; i++) {
            x = hostA.compute(x, y);
            x = hostB.compute(x, y);
            x = hostC.compute(x, y);
            x = hostD.compute(x, y);
        }

        return System.currentTimeMillis() - start;
    }

    static long interfaceCompute() {
        Host[] hosts = new Host[4];

        hosts[0] = new HostA();
        hosts[1] = new HostB();
        hosts[2] = new HostC();
        hosts[3] = new HostD();

        long start = System.currentTimeMillis();
        Random r = new Random(start);

        int x = r.nextInt(10);
        int y = r.nextInt(10);

        for (int i = 0; i < COUNT; i++) {
            x = hosts[0].compute(x, y);
            x = hosts[1].compute(x, y);
            x = hosts[2].compute(x, y);
            x = hosts[3].compute(x, y);
        }

        return System.currentTimeMillis() - start;
    }
}

测试方法说明:

  • arrayCompute,创建一个接口类型Host的数组Host[4],分别指向4个不同接口实现类实例;多次调用这些接口方法
  • virtualCompute,分别创建4个不同的接口实现类引用,并分别指向对应的实现类实例;多次调用这些方法
  • interfaceCompute,与arrayCompute类似,不同的是将在arrayCompute中的loop调用做展开;多次调用这些方法

添加如下JVM启动选项:

-XX:+PrintCompilation -XX:+UnlockDiagnosticVMOptions -XX:+PrintInlining

选项参数说明:

  • PrintCompilation,打印JIT编译日志
  • UnlockDiagnosticVMOptions和PrintInlining,打印inlining信息

3个测试方法(arrayCompute、virtualCompute和interfaceCompute)所做的工作完全一致,哪个方法在实际运行中性能最好呢?哪些Host::compute调用会被内联,这些内联又能对性能有多大影响呢?

运行结果及分析

运行时间结果:

43393 1477 1471

可以看到virtualCompute和interfaceCompute耗时相近,但arrayCompute耗时则远超其他两个方法

查看JIT编译日志和调试信息,可以看到对于arrayCompute方法,有以下日志信息:

TestInline$Host::compute (0 bytes)   not inlineable

而对于virtualCompute和interfaceCompute方法,有以下日志信息:

TestInline$HostA::compute (4 bytes)   inline (hot)
TestInline$HostB::compute (4 bytes)   inline (hot)
TestInline$HostC::compute (4 bytes)   inline (hot)
TestInline$HostD::compute (4 bytes)   inline (hot)

以上日志信息说明,arrayCompute方法中对Host::compute的调用,JIT认为“not inlineable”,未对其进行内联优化;另一方面,对virtualCompute和interfaceCompute中的Host::compute调用,JIT唯一确定了每个调用的具体实现方法,并进行了内联优化(注:inline (hot)表示当前调用已被内联)。结合运行时间结果,可以看到方法内联带来的性能提升是巨大的。在本例中,方法内联带来的性能提升约为20多倍。

比较有意思的一点是,interfaceCompute相对于arrayCompute,仅仅是将foreach loop做了展开,但结果却是让JIT唯一确定了interface方法的具体实现实例,从而可以正确的完成内联优化。这里面的JIT逻辑我也还没有进一步的了解,暂作留存,待后面再做研究吧。

结论

  • 对于调用次数较多的方法,考虑是否可以利用JIT方法内联对其进行优化,是非常有必要的
  • 为此,我们需要明确JIT方法内联的逻辑和先决条件
  • 必要时,可以通过打印JIT编译日志和调试信息,进一步确认JIT的实际行为

同时需要明白,方法内联带来的性能提升不仅仅在消除了调用开销上,而在于在代码内联的基础上,JVM可以对代码进行更进一步的优化。这部分将在后续的blog中继续探讨。

一些额外的观察

  1. 若我们仅调用和比较virtualCompute、interfaceCompute两个方法,运行时间结果如下:
1984 1699

可以看到第一个方法的耗时要大于第二个方法。即便更换这两个方法的调用次序,结果仍是如此,即第一个方法耗时都要大于第二个方法的耗时。我对这个结果的解释是,JIT需要进行一定的Profile之后,才能确定哪些方法调用是hot的,进而进行内联优化;而在这之前,该有的调用开销并没有办法被消除,从而导致了上面的耗时上的差异。

  1. 对于interfaceCompute,inlining调试信息中显示,在最初时JIT也认为Host::compute调用为“not inlineable”;但在若干次调用后,又将调用的方法明确到具体实例所实现的方法,并显示"inline (hot)"。这里的JIT逻辑需要进一步了解。

TODO

进一步了解JIT唯一确定某个public方法具体实现的逻辑。
进一步了解建立在内联基础之上的进一步JVM代码优化。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 222,729评论 6 517
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 95,226评论 3 399
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 169,461评论 0 362
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 60,135评论 1 300
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 69,130评论 6 398
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,736评论 1 312
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 41,179评论 3 422
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 40,124评论 0 277
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,657评论 1 320
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,723评论 3 342
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,872评论 1 353
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,533评论 5 351
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 42,213评论 3 336
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,700评论 0 25
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,819评论 1 274
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 49,304评论 3 379
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,876评论 2 361

推荐阅读更多精彩内容