阿里开源性能监控神器 Arthas 入门记录

阿里开源性能监控神器 Arthas 入门记录

介绍

文档:https://arthas.aliyun.com/doc/

命令介绍:https://arthas.aliyun.com/doc/commands.html

  • Arthas(阿尔萨斯) 能为你做什么?
_images/arthas.png

Arthas 是Alibaba开源的Java诊断工具,深受开发者喜爱。

当你遇到以下类似问题而束手无策时,Arthas可以帮助你解决:

  1. 这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?
  2. 我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?
  3. 遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?
  4. 线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!
  5. 是否有一个全局视角来查看系统的运行状况?
  6. 有什么办法可以监控到JVM的实时运行状态?
  7. 怎么快速定位应用的热点,生成火焰图?

快速开始

😎😎😎😎😎😎😎😎😎😎😎😎😎😎😎😎😎 Quick start 😎😎😎😎😎😎😎😎😎😎😎😎😎😎😎😎😎😎😎

官方教程 : https://arthas.aliyun.com/doc/arthas-tutorials.html?language=cn

运行环境搭建

因为这是一款 Java 诊断工具,需要先启动一个java程序,才能使用 arthas 诊断 ,而 arthas 官方已经提供了一个demo示例 ,让我们快速上手arthas。

下载启动,arthas 的demo程序

wget https://arthas.aliyun.com/arthas-demo.jar
java -jar arthas-demo.jar

arthas-demo是一个很简单的程序,它随机生成整数,再执行因式分解,把结果打印出来。如果生成的随机数是负数,则会打印异常信息。

启动后的日志输出:

163228=2*2*13*43*73
illegalArgumentCount:893, number is: -104144, need >= 2
illegalArgumentCount:894, number is: -117496, need >= 2
122679=3*3*43*317
95191=95191

下载

wget https://arthas.aliyun.com/arthas-boot.jar

下载回来是一个jar 包 java -jar arthas-boot.jar 直接运行即可

运行

启动arthas java -jar arthas-boot.jar , 它启动后,会列出所有的Java进程,用户可以选择需要诊断的目标进程。

1602040202937.png

这时候 输入你想要诊断的进程的数组 然后回车即可


1602040077365.png

这时候会进入 arthas 的命令窗口 , 可以输入一个 help 来查看 arthas 的命令 (下方有命令的简介)

案例

1. 获取异常信息

很多问题是随机出现的,在本地无法检查出问题,到生产才可能出现问题。 这时候arthas 的监控 就十分重要了。

在 arthas 的demo 这是一个会随机出现异常的程序,这里我们来学习一下。 如何监控随机的异常信息

  • [ 确保 arthas-demo 和 arthas-boot 已经启动 ]

使用 watch 命令 来监控我们的异常信息

watch demo.MathGame primeFactors "{params[0],throwExp}" -e
  • 监控 demo.MathGame 类的 primeFactors 方法,异常时 输出 第一个参数 与 异常信息
[arthas@1553]$ watch demo.MathGame primeFactors "{params[0],throwExp}" -e
Press Q or Ctrl+C to abort.
Affect(class count: 1 , method count: 1) cost in 33 ms, listenerId: 6
ts=2020-10-07 12:38:08; [cost=0.403161ms] result=@ArrayList[
    @Integer[-50722],
    @IllegalArgumentException[java.lang.IllegalArgumentException: number is: -50722, need >= 2],
]
ts=2020-10-07 12:38:10; [cost=0.094364ms] result=@ArrayList[
    @Integer[-138218],
    @IllegalArgumentException[java.lang.IllegalArgumentException: number is: -138218, need >= 2],
]

2.监控springBoot 死循环异常

准备一个简单的controller

@RestController
@RequestMapping("/demo")
@Slf4j
public class DemoController {

    @GetMapping
    public String init(){
        return "sucess \n";
    }

    @GetMapping("/run/{num}")
    public String run(@PathVariable("num") int num){

        boolean flag = num == 666 ? true : false;
        while (flag){
            log.info("接收到 666 , 进入死循环状态~~~~ ");
        }

        return "您输入的数字是:" + num + "\n";
    }

}
  • 输入 正常数字 则正常返回,输入 [ 666 ] 程序会进入死循环状态

👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻 开启程序,开启 arthas 👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻👩‍💻

输入 dashboard 查看面板

1602062834228.png

参数详解 可以看官方文档,这里只需要关注 ID 、NAME 、%CPU 即可

这时候访问 localhost/demo/run/666 可以看到面板有一个线程 CPU占比率 高居不下

1602062940621.png

这时候使用 thread id 可以定位 看看是哪个小垃圾在搞事

1602063242700.png

可以很清楚的看到,cpu占用率高的线程调用栈里面 fun.hman.demo.web.DemoController.run(DemoController.java:31)

是我们自己写的,方法和行号已经告诉我们了。

热更新

下面介绍通过jad/mc/redefine 命令实现动态更新代码的功能。

  1. 将字节码文件输出到指定的位置 :
jad --source-only fun.hman.demo.web.DemoController > /tmp/DemoController.java
  • 命令中 --source-only 的含义为,只输出源码部分,如果不加这个参数,在反编译出的内容头部会携带类加载器的信息

修改 /tmp/DemoController.java 的内容,并保存

/*
 * Decompiled with CFR.
 * 
 * Could not load the following classes:
 *  org.slf4j.Logger
 *  org.slf4j.LoggerFactory
 *  org.springframework.web.bind.annotation.GetMapping
 *  org.springframework.web.bind.annotation.PathVariable
 *  org.springframework.web.bind.annotation.RequestMapping
 *  org.springframework.web.bind.annotation.RestController
 */
package fun.hman.demo.web;

import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.PathVariable;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;

@RestController
@RequestMapping(value={"/demo"})
public class DemoController {
    private static final Logger log = LoggerFactory.getLogger(DemoController.class);

    @GetMapping(value={"/run/{num}"})
    public String run(@PathVariable(value="num") int num) {
        return "您输入的数字是:" + num + "\n";
    }

    @GetMapping
    public String init() {
        return "sucess \n";
    }
}
  1. 使用 sc 命令找到 对于的 classLoad 类
sc -d fun.hman.demo.web.DemoController
1602064232275.png

最后一行 classLoaderHash 即为 DemoController 的类加载器 hash 值 。

  • 以上命令 可以 优化成 sc -d fun.hman.demo.web.DemoController | grep classLoaderHash 只查看 classLoaderHash
  1. 使用 mc 命令 编译
mc -c 685f4c2e /tmp/DemoController.java -d /tmp

成功后输出:

Memory compiler output:
/tmp/fun/hman/demo/web/DemoController.class
Affect(row-cnt:1) cost in 8476 ms.
  1. redefine 热更新代码
redefine /tmp/fun/hman/demo/web/DemoController.class

这时候 我们再传入 666 就可以看到正常返回的结果了

[root@hman01 ~]# curl http://192.168.153.171:8080/demo/run/666
您输入的数字是:666

Arthas 命令

命令介绍:https://arthas.aliyun.com/doc/commands.html

  • help——查看命令帮助信息
  • cls——清空当前屏幕区域
  • session——查看当前会话的信息
  • reset——重置增强类,将被 Arthas 增强过的类全部还原,Arthas 服务端关闭时会重置所有增强过的类
  • version——输出当前目标 Java 进程所加载的 Arthas 版本号
  • history——打印命令历史
  • quit——退出当前 Arthas 客户端,其他 Arthas 客户端不受影响
  • stop——关闭 Arthas 服务端,所有 Arthas 客户端全部退出
  • keymap——Arthas快捷键列表及自定义快捷键

  • dashboard—— 当前系统的实时数据面板

  • sc—— 查找JVM里已加载的类

  • watch——查看函数的参数/返回值/异常信息

  • tt——即 TimeTunnel,它可以记录下指定方法每次调用的入参和返回信息,并能对这些不同的时间下调用进行观测

启动命令

arthas-boot.jar 支持很多参数,可以执行 java -jar arthas-boot.jar -h 来查看。

允许外部访问

默认情况下, arthas server侦听的是 127.0.0.1 这个IP,如果希望远程可以访问,可以使用--target-ip的参数。

java -jar arthas-boot.jar --target-ip

动态执行函数

ognl ——可以动态的执行代码

例 :ognl '@java.lang.System@out.println("hello ognl")'

热更新代码

通过jad/mc/redefine 命令实现动态更新代码的功能。

退出Arthas

exit 或者 quit 命令可以退出Arthas。

退出Arthas之后,还可以再次用 java -jar arthas-boot.jar 来连接。

彻底退出Arthas

exit/quit命令只是退出当前session,arthas server还在目标进程中运行。

想完全退出Arthas,可以执行 stop 命令。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,686评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,668评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,160评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,736评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,847评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,043评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,129评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,872评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,318评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,645评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,777评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,470评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,126评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,861评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,095评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,589评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,687评论 2 351