JMH

笔记-JMH(Java Microbenchmark Harness)

原创少爷凡隐最后发布于2018-10-29 09:43:43 阅读数 889 收藏

展开

更多请移步我的博客

看开源项目时，时不常遇到一个叫做benchmark的目录，此时脑子停滞，一眼带过，最近一次看到就顺手问了下谷大哥，发现benchmark还是个挺有意思的东西。

基准测试是什么

基准测试是指通过设计科学的测试方法、测试工具和测试系统，实现对一类测试对象的某项性能指标进行定量的和可对比的测试。

例如，对计算机CPU进行浮点运算、数据访问的带宽和延迟等指标的基准测试，可以使用户清楚地了解每一款CPU的运算性能及作业吞吐能力是否满足应用程序的要求；再如对数据库管理系统的ACID（Atomicity, Consistency, Isolation, Durability, 原子性、一致性、独立性和持久性）、查询时间和联机事务处理能力等方面的性能指标进行基准测试，也有助于使用者挑选最符合自己需求的数据库系统。

通过基准测试我们可以了解某个软件在给定环境下的性能表现，对使用者而言可以用作选型的参考，对开发者而言可以作为后续改进的基本参照。

JMH是什么

JMH（Java Microbenchmark Harness）是Java用来做基准测试一个工具，该工具由openJDK提供并维护，测试结果可信度较高，该项目官方还在持续更新中。

下面只是JMH简单描述，正所谓“纸上得来终觉浅，绝知此事要躬行”，要想全面了解还得读完官方给出的Demo或者看我的翻译注解版本的官方Demo。

已经给标题加链接，直接戳标题即可闪现到例子。官方例子有37个，这里只列出了梗概。

举个例子

功能入门第一课，Hello World！

public class JMHSample_01_HelloWorld {

@Benchmark

public void wellHelloThere() {

// this method was intentionally left blank.

}

public static void main(String[] args) throws RunnerException {

Options opt = new OptionsBuilder()

// 指明本次要跑的类

.include(JMHSample_01_HelloWorld.class.getSimpleName())

// fork JVM的数量

.forks(1)

.build();

new Runner(opt).run();

}

看下输出：

# JMH version: 1.21

# VM version: JDK 1.8.0_74, Java HotSpot(TM) 64-Bit Server VM, 25.74-b02

# VM invoker: /Library/Java/JavaVirtualMachines/jdk1.8.0_74.jdk/Contents/Home/jre/bin/java

# VM options: -javaagent:/Applications/IntelliJ IDEA.app/Contents/lib/idea_rt.jar=51264:/Applications/IntelliJ IDEA.app/Contents/bin -Dfile.encoding=UTF-8

# 预热配置

# Warmup: 5 iterations, 10 s each

# 检测配置

# Measurement: 5 iterations, 10 s each

# 超时配置

# Timeout: 10 min per iteration

# 测试线程配置

# Threads: 1 thread, will synchronize iterations

# 基准测试运行模式

# Benchmark mode: Throughput, ops/time

# 当前测试的方法

# Benchmark: com.cxd.benchmark.JMHSample_01_HelloWorld.wellHelloThere

# 运行过程的输出

# Run progress: 0.00% complete, ETA 00:01:40

# Fork: 1 of 1

# Warmup Iteration 1: 2924740803.993 ops/s

# Warmup Iteration 2: 2916472711.387 ops/s

# Warmup Iteration 3: 3024204715.897 ops/s

# Warmup Iteration 4: 3051723946.668 ops/s

# Warmup Iteration 5: 2924014544.301 ops/s

Iteration 1: 2909665054.710 ops/s

Iteration 2: 2989675862.826 ops/s

Iteration 3: 2965046292.629 ops/s

Iteration 4: 3020263765.220 ops/s

Iteration 5: 2929485177.735 ops/s

# 当前方法测试结束的报告

Result "com.cxd.benchmark.JMHSample_01_HelloWorld.wellHelloThere":

2962827230.624 ±(99.9%) 171803440.922 ops/s [Average]

(min, avg, max) = (2909665054.710, 2962827230.624, 3020263765.220), stdev = 44616808.022

CI (99.9%): [2791023789.702, 3134630671.547] (assumes normal distribution)

# Run complete. Total time: 00:01:41

REMEMBER: The numbers below are just data. To gain reusable insights, you need to follow up on

why the numbers are the way they are. Use profilers (see -prof, -lprof), design factorial

experiments, perform baseline and negative tests that provide experimental control, make sure

the benchmarking environment is safe on JVM/OS/HW level, ask for reviews from the domain experts.

Do not assume the numbers tell you what you want them to tell.

# 所有benchmark跑完后的最终报告

Benchmark Mode Cnt Score Error Units

JMHSample_01_HelloWorld.wellHelloThere thrpt 5 2962827230.624 ± 171803440.922 ops/s

上面的报告显示，我们用1个线程对吞吐量测量，测量和预热分别迭代了5次，最终得出的Score（ops/s）是2962827230.624 ± 171803440.922，测量过程中没有出现Error。

测试控制

测试输出结果中开头的配置项都是我们可以通过注解、编程或者命令行的方式来控制的。它可以具体到每个benchmark。

@Fork 需要运行的试验(迭代集合)数量。每个试验运行在单独的JVM进程中。也可以指定(额外的)JVM参数。

@Measurement 提供真正的测试阶段参数。指定迭代的次数，每次迭代的运行时间和每次迭代测试调用的数量(通常使用@BenchmarkMode(Mode.SingleShotTime)测试一组操作的开销——而不使用循环)

@Warmup 与@Measurement相同，但是用于预热阶段

@Threads 该测试使用的线程数。默认是Runtime.getRuntime().availableProcessors()

测试维度

通过JMH提供的工具我们可以轻松的的获得某个功能的吞吐量、平均运行时间、冷启动等指标的数据。

这些输出结果通过@BenchmarkMode注解来控制，它的值定义在枚举类org.openjdk.jmh.annotations.Mode中。

@BenchmarkMode接受的参数是一个Mode数据，也就是说，我们可以指定一个或者多个Mode，测试时会把我们指定的模式依次运行，打印出结果。

public enum Mode {

/**

* Throughput: operations per unit of time.

* 计算一个时间单位内操作数量

Throughput("thrpt", "Throughput, ops/time"),

/**

* Average time: average time per per operation.

* 计算平均运行时间

AverageTime("avgt", "Average time, time/op"),

/**

* Sample time: samples the time for each operation.

* 计算一个方法的运行时间(包括百分位)

SampleTime("sample", "Sampling time"),

/**

* Single shot time: measures the time for a single operation.

* 方法仅运行一次(用于冷测试模式)

* 或者特定批量大小的迭代多次运行(具体查看的“`@Measurement“`注解)——这种情况下JMH将计算批处理运行时间(一次批处理所有调用的总时间)

SingleShotTime("ss", "Single shot invocation time"),

/**

* Meta-mode: all the benchmark modes.

* 所有模式依次运行

All("all", "All benchmark modes"),

;

// 省略...

}

数据的共享

测试的时候，我们可能需要向测试方法传入若干参数，这些参数还可能需要不同的隔离级别：每个线程单独一份还是每个benchmark一份还是一组线程共享等。

这些参数有以下要求：

有无参构造函数(默认构造函数)

是公共类

内部类应该是静态的

该类必须使用@State注解

参数必须是对象，因为@State被定义为ElementType.TYPE，即：可以用来注解类、接口或者枚举。

@State接受单个配置值Scope。

public enum Scope {

/**

* Benchmark state scope.

* 运行相同测试的所有线程将共享实例。

* 可以用来测试状态对象的多线程性能(或者仅标记该范围的基准)。

Benchmark,

/**

* Group state scope.

* 实例分配给每个线程组(查看后面的测试线程组)

Group,

/**

* Thread state scope.

* 实例将分配给运行给定测试的每个线程。

Thread,

}

数据的准备

数据的准备像极了JUnit和TestNG的方式，即：在测试开始前后分别进行处理。在JMH中对应到@Setup和@TearDown，我们可以在被进行标记的方法中对数据进行处理，并且处理的耗时不被记入正常测试的时间，也就是说不会影响我们测试结果。

@Setup和@TearDown分别接受单个配置值Level。

public enum Level {

/**

* Trial level: to be executed before/after each run of the benchmark.

* 在每个benchmark之前/之后运行

Trial,

/**

* Iteration level: to be executed before/after each iteration of the benchmark.

* 在一次迭代之前/之后(一组调用)运行

Iteration,

/**

* Invocation level: to be executed for each benchmark method execution.

* 每个方法调用之前/之后

* 该方式较为复杂，在没有搞清楚之前，不要使用。

Invocation,

;

}

测试线程组

我们可以通过指定线程组的的方式来模拟一些场景，比如：生产-消费。这种场景下生产消费的线程数量往往是不一致的，通过@Group和@GroupThreads我们可以很轻松的制造出这种场景。

具体的使用说明例子中说的很详细 ----传送门----> JMHSample_15_Asymmetric

编译器的控制

我们知道编译器在编译时会做一些优化，这个例子展示了如何用@CompilerControl来控制编译对**方法内敛**优化的控制。

public @interface CompilerControl {

/**

* Compilation mode.

enum Mode {

/**

* Insert the breakpoint into the generated compiled code.

BREAK("break"),

/**

* Print the method and it's profile.

PRINT("print"),

/**

* Exclude the method from the compilation.

* 不编译该方法 —— 用解释替代。

EXCLUDE("exclude"),

/**

* Force inline.

* 要求编译器内嵌该方法。

INLINE("inline"),

/**

* Force skip inline.

* 该方法不能被内嵌。用于测量方法调用开销和评估是否该增加JVM的inline阈值

DONT_INLINE("dontinline"),

/**

* Compile only this method, and nothing else.

* 仅编译被注解的方法，其他的不编译。

COMPILE_ONLY("compileonly"),;

}

基准测试中建议

编译器还有其他一些优化行为，常见的包括（更多参见）：死代码消除（DCE）、方法内敛（method inline）、循环优化、常量折叠。

方法内敛可以用上面提到的注解做控制，但更多的需要我们在些测试时采用一些小技巧规避，比如：DCE可以根据情况采用Blackhole消费输出结果。

测试前后较重的处理放在@Setup和@TearDown中

注意DCE（死代码消除）

不出现循环被编译器优化，具体建议参考JMHSample_34_SafeLooping

测试必须为fork，fork是分离出来子进程进行测试，@fork(2)含义为顺次（one-by-one）fork出子进程来测试

使用@fork多次fork测试，减少运行间差异

多线程测试时参考JMHSample_17_SyncIterations

对非循环方法需要测量冷启动的时间消耗，参考JMHSample_26_BatchSize

可以通过profiler获得基准测试时JVM的相关信息，比如栈、gc、classloader。参考JMHSample_35_Profilers

在使用profiler时遇到no tty present and no askpass program specified错误是因为帐号并没有开启sudo免密导致的。

通过以下步骤可解决，但测试完成后安全起见建议删除：sudo visudo；在文件最后追加 userName ALL=(ALL) NOPASSWD:ALL

知识点记录

编译优化

常见的编译器优化包括（更多参见）：死代码消除（DCE）、方法内敛（method inline）、循环优化、常量折叠。

方法内敛

许多优化手段都试图消除机器级跳转指令（例如，x86架构的JMP指令）。跳转指令会修改指令指针寄存器，因此而改变了执行流程。

相比于其他汇编指令，跳转指令是一个代价高昂的指令，这也是为什么大多数优化手段会试图减少甚至是消除跳转指令。

内联是一种家喻户晓而且好评如潮的优化手段，这是因为跳转指令代价高昂，而内联技术可以将经常调用的、具有不容入口地址的小方法整合到调用方法中。

Listing 3到Listing 5中的Java代码展示了使用内联的用法。

Listing 3. Caller method

int whenToEvaluateZing(int y) {

return daysLeft(y) + daysLeft(0) + daysLeft(y+1);

}

Listing 4. Called method

int daysLeft(int x){

if (x == 0)

return 0;

else

return x - 1;

}

Listing 5. Inlined method

int whenToEvaluateZing(int y){

int temp = 0;

if(y == 0) temp += 0; else temp += y - 1;

if(0 == 0) temp += 0; else temp += 0 - 1;

if(y+1 == 0) temp += 0; else temp += (y + 1) - 1;

return temp;

}

在Listing 3到Listing 5的代码中，展示了将调用3次小方法进行内联的示例，这里我们认为使用内联比跳转有更多的优势。

如果被内联的方法本身就很少被调用的话，那么使用内联也没什么意义，但是对频繁调用的“热点”方法进行内联在性能上会有很大的提升。

此外，经过内联处理后，就可以对内联后的代码进行进一步的优化，正如Listing 6中所展示的那样。

Listing 6. After inlining, more optimizations can be applied

int whenToEvaluateZing(int y){

if(y == 0) return y;

else if (y == -1) return y - 1;

else return y + y - 1;

}

unrolled loop 循环展开

for (i = 1; i <= 60; i++)

a[i] = a[i] * b + c;

可以如此循环展开：

for (i = 1; i <= 20; i+=3)

{

a[i] = a[i] * b + c;

a[i+1] = a[i+1] * b + c;

a[i+2] = a[i+2] * b + c;

}

分支预测

底层对循环中判断的优化。简单理解，对执行的循环判断做采样，根据采样来预测下一个判断会走到哪个分支中。

参考这篇文章---->深入理解CPU的分支预测(Branch Prediction)模型<----做进一步了解。

参考资料

编译器的优化

方法内敛

什么是基准测试

JMH官方Demo

JHM官网

JMH简介-译文 ----> 英文原文

————————————————

原文链接：https://blog.csdn.net/myjcxd/article/details/83501333

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,793评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,567评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,342评论 0赞 338
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,825评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,814评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,680评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,033评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,687评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 42,175评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,668评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,775评论 1赞 332
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,419评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,020评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,978评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,206评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,092评论 2赞 351
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,510评论 2赞 343

JMH

推荐阅读更多精彩内容