最近项目上使用spring cloud作为微服务分布式架构替代原来的dubbo架构,但随着应用的不断增长,每个服务的具体状态,一些指标就需要进行监控,以便于时刻了解各服务的运行状态,于是便有了搭一个监控系统的想法。查询网上的资料,很多都是用Prometheus
配上Grafana
作为监控展现(毕竟颜值即正义),我也试着搭了个。闲话少说,进入实际操作。
Spring cloud应用改动:
- 加入依赖 :
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
<dependency>
<groupId>io.prometheus</groupId>
<artifactId>simpleclient_spring_boot</artifactId>
<version>0.0.26</version>
</dependency>
-
修改Application类:加入
@EnablePrometheusEndpoint
和@EnableSpringBootMetricsCollector
注解
@SpringBootApplication
@EnableDiscoveryClient
@EnablePrometheusEndpoint
@EnableSpringBootMetricsCollector
public class AuthApplication {
public static void main(String[] args) {
SpringApplication.run(AuthApplication.class, args);
}
}
- 修改application.yml:
security:
basic:
enabled: false
management:
security:
enabled: false
我这是为了方便,禁用了相关安全认证选项,你可不要把这个配置应用到生产环境,不然你就要背锅咯
接着启动你的应用,打开浏览器输入http://localhost:2222/auth/prometheus,正常情况下你就可以在页面上看到很多键值对:
就像这样。
Prometheus:
-
安装:
去官网下载,根据你自己的操作系统选择版本,我这本地测试玩,就弄了个windows版本下的。下载完,解压,找到prometheus.yml
改配置:
# my global config
global:
scrape_interval: 15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
# scrape_timeout is set to the global default (10s).
# Attach these labels to any time series or alerts when communicating with
# external systems (federation, remote storage, Alertmanager).
external_labels:
monitor: 'codelab-monitor'
# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
# - "first.rules"
# - "second.rules"
# A scrape configuration containing exactly one endpoint to scrape:
# Here it's Prometheus itself.
scrape_configs:
- job_name: auth-service
scrape_interval: 5s
scrape_timeout: 5s
metrics_path: /auth/prometheus
scheme: http
static_configs:
- targets:
- 127.0.0.1:2222
这个是我自己的配置,你根据需要更改为你的应用合适的配置,主要更改在scrape_configs
节点下。
-
启动Prometheus:
windows下,进入命令行模式,进入到Prometheus的目录中,运行prometheus -config.file=prometheus.yml
,启动成功后,在http://localhost:9090/targets你会看到你所监控的目标,但在这里,你会发现居然有错:
然后Google一下,发现了这个https://github.com/prometheus/client_java/issues/130简直一模一样啊,莫非有救了,淡定,实际上并没有救,你会见证Prometheus client_java
项目组和spring boot
以及spring cloud
项目组之间的互相扯皮踢皮球,最后我只好用了个暂且有用的办法,就是去掉那些产生问题的指标,在你的Spring boot应用配置文件中加上:
spring:
application:
name: auth
##去除有问题的指标,因为指标名重复产生bug
metrics:
servo:
enabled: false
server:
port: 2222
context-path: /auth
eureka:
client:
serviceUrl:
defaultZone: http://localhost:1111/eureka/
instance:
prefer-ip-address: true
security:
basic:
enabled: false
management:
security:
enabled: false
endpoints:
actuator:
enabled: true
好啦,我们改好重新启动应用,重新刷新Prometheus
的页面http://localhost:9090/targets,就会很欣喜的看到没错了,正常了。
要看有哪些指标可以现成使用的,可以在Graph
菜单下,那个下拉列表中查找:
你可以选中一个指标,然后execute,就可以看到一个简陋的图表,显示指标的数据:
当然这个Prometheus自带的图表肯定不给力,这时就要请出Grafana
了。
Grafana:
安装:
同样的进入官网http://docs.grafana.org/installation/windows/下载,请根据你的操作系统下载。解压进入bin目录,然后启动,访问http://localhost:3000你就会看到登录界面,默认的账户和密码都是admin
。-
配置:
add datasource
,加上Prometheus的数据源配置。
接着我们新加入一个Dashboards:
新增一个Graph:
接着选择edit:
然后在metric中编辑数据源和指标,比如我们新增一个threads(线程数)的指标,完成后就可以看到美丽的图表了:
好了,暂时写到这里了,要去做饭了。