SkyWalking

webapp.yml文件编辑用户名密码

概括(可看到):应用数、Service监控、慢服务、每分钟请求、吞吐量

                        拓扑图、TraceId、每个方法哪个阶段具体耗时、sql语句。。。。

一、http://localhost:8080/#/monitor/dashboard

(1)52个app并不代表52个应用,比如paycenter有两台paycenter1和paycenter2就算了2个app。在我们公司,paycenter1、paycenter2这些运维都和我们跳板机管理平台上的名称设置的一样约定大于配置,开发人员可以更加便捷的排查问题。

(2)app数语言类探针app_code来决定的。比如我们公司的线上配置就是agent.application_code=auth-center-1

上图中需要解释两个概念:

cpm代表每分钟请求次数

SLA=(TRANSACTION_CALLS- TRANSACTION_ERROR_CALLS ) * 10000 ) / TRANSACTION_CALLS

二、该页面主要支持四个跳转:

1.Application监控页面

2.Service监控页面

3.、 慢服务监控页面

4、 Application Throughput应用吞吐量监控页面。

Dashboard的页面上部分,选择功能模块: 定期refresh Dashboard数据,右:调整整体的查询区间

三、Topology

Monitor下的Topology,会看到下面这张拓扑图 

当然这张图太过于夸张了,如果接入SkyWalking的应用并不是很多,会如下图所示:

左侧的三个小按钮可以调整你的视图,支持拖拽。右侧可以输入你所关心的应用名。比如我们输入一个支付和订单两个应用,左侧的拓扑图会变得更加清晰:

另外,上图中的绿色圆圈都是可以点击的,如果你点击以后,还会出现节点信息:

Application

点击Monitor菜单下的Application你会看到下面这张图,这张图里你可以看到的东西都做了注解。

点开More Server Details,可看更多

是的,除了Host、IPv4、Pid、OS以外,你还可以看到CPU、Heap、Non-Heap、GC(Young GC、Old GC)等详细监控信息。

Service

Monitor菜单下的Service

Dependency Map鼠标悬停可以看到每个阶段的执行时间,这是Service下的功能

图中Top 20 Slow Traces下面的被我马赛克掉的trace的按钮框,可看到更加详细的信息:

每个方法哪个阶段具体耗时。每一行基本都是可以打开,包含了Tags、Logs等监控内容

Alarm

点击Monitor菜单下的Alarm你会看到告警菜单。目前5.X版本的还没有接入邮件、短信等告警方式,后续6支持webhook,用户可以自己去接短信和邮件。

告警内容中你可以看到Applicaion、Server和Service三个层面的告警内容

Trace

非常实用的功能,用户可以根据精确的TraceId去查找

也可以设定时间段去查找

我在写使用手册时候,非常巧的是,看到了上图三起异常,于是我们往下拉列表看到了具体的数据

点击进去,我们可以看到具体的失败原因

可以直接将Trace State调整为Error级别进行查询

再回顾一遍

一、首页:

二、首页Slow Service的projectC:

三、首页的Appliation Throughput中的projectD:

四、左下角的slow service里的Consumer:

https://www.jianshu.com/p/2fd56627a3cf

https://skywalking.apache.org/zh/blog/2018-12-18-Apache-SkyWalking-5-0-UserGuide.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容