webapp.yml文件编辑用户名密码
概括(可看到):应用数、Service监控、慢服务、每分钟请求、吞吐量
拓扑图、TraceId、每个方法哪个阶段具体耗时、sql语句。。。。
一、http://localhost:8080/#/monitor/dashboard
(1)52个app并不代表52个应用,比如paycenter有两台paycenter1和paycenter2就算了2个app。在我们公司,paycenter1、paycenter2这些运维都和我们跳板机管理平台上的名称设置的一样,约定大于配置,开发人员可以更加便捷的排查问题。
(2)app数,语言类探针app_code来决定的。比如我们公司的线上配置就是agent.application_code=auth-center-1
上图中需要解释两个概念:
cpm代表每分钟请求次数
SLA=(TRANSACTION_CALLS- TRANSACTION_ERROR_CALLS ) * 10000 ) / TRANSACTION_CALLS
二、该页面主要支持四个跳转:
1.Application监控页面
2.Service监控页面
3.、 慢服务监控页面。
4、 Application Throughput应用吞吐量监控页面。
Dashboard的页面上部分,选择功能模块: 定期refresh Dashboard数据,右:调整整体的查询区间。
三、Topology
Monitor下的Topology,会看到下面这张拓扑图
当然这张图太过于夸张了,如果接入SkyWalking的应用并不是很多,会如下图所示:
左侧的三个小按钮可以调整你的视图,支持拖拽。右侧可以输入你所关心的应用名。比如我们输入一个支付和订单两个应用,左侧的拓扑图会变得更加清晰:
另外,上图中的绿色圆圈都是可以点击的,如果你点击以后,还会出现节点信息:
Application
点击Monitor菜单下的Application你会看到下面这张图,这张图里你可以看到的东西都做了注解。
点开More Server Details,可看更多
是的,除了Host、IPv4、Pid、OS以外,你还可以看到CPU、Heap、Non-Heap、GC(Young GC、Old GC)等详细监控信息。
Service
Monitor菜单下的Service
Dependency Map鼠标悬停可以看到每个阶段的执行时间,这是Service下的功能
图中Top 20 Slow Traces下面的被我马赛克掉的trace的按钮框,可看到更加详细的信息:
每个方法哪个阶段具体耗时。每一行基本都是可以打开,包含了Tags、Logs等监控内容
Alarm
点击Monitor菜单下的Alarm你会看到告警菜单。目前5.X版本的还没有接入邮件、短信等告警方式,后续6支持webhook,用户可以自己去接短信和邮件。
告警内容中你可以看到Applicaion、Server和Service三个层面的告警内容
Trace
非常实用的功能,用户可以根据精确的TraceId去查找
也可以设定时间段去查找
我在写使用手册时候,非常巧的是,看到了上图三起异常,于是我们往下拉列表看到了具体的数据
点击进去,我们可以看到具体的失败原因
可以直接将Trace State调整为Error级别进行查询
再回顾一遍
一、首页:
二、首页Slow Service的projectC:
三、首页的Appliation Throughput中的projectD:
四、左下角的slow service里的Consumer:
https://www.jianshu.com/p/2fd56627a3cf
https://skywalking.apache.org/zh/blog/2018-12-18-Apache-SkyWalking-5-0-UserGuide.html