prometheus概述
概述
什么是普罗米修斯?
Prometheus是最初在SoundCloud上构建的开源系统监视和警报工具包 。自2012年成立以来,许多公司和组织都采用了Prometheus,该项目拥有非常活跃的开发人员和用户社区。现在,它是一个独立的开源项目,并且独立于任何公司进行维护。为了强调这一点并阐明该项目的治理结构,Prometheus在2016年加入了 Cloud Native Computing Foundation,这是继Kubernetes之后的第二个托管项目。
有关Prometheus的详细说明,请参见媒体部分中的资源链接 。
特征
普罗米修斯的主要特点是:
- 一个多维数据模型,其中包含通过度量标准名称和键/值对标识的时间序列数据
- PromQL,一种灵活的查询语言 ,可利用此维度
- 不依赖分布式存储;单个服务器节点是自治的
- 时间序列收集通过HTTP上的拉模型进行
- 通过中间网关支持推送时间序列
- 通过服务发现或静态配置发现目标
- 多种图形和仪表板支持模式
组件
Prometheus生态系统由多个组件组成,其中许多是可选的:
- Prometheus主服务器,它会刮取并存储时间序列数据
- 客户端库,用于检测应用程序代码
- 一个支持短期工作的推送网关
- 专用出口商,用于诸如HAProxy,StatsD,Graphite等的服务。
- 一个alertmanager处理警报
- 各种支持工具
大多数Prometheus组件都是用Go编写的,因此易于构建和部署为静态二进制文件。
建筑学
该图说明了Prometheus的体系结构及其某些生态系统组件:
Prometheus直接或通过中介推送网关从已检测作业中删除指标,以处理短暂的作业。它在本地存储所有报废的样本,并对这些数据运行规则,以汇总和记录现有数据中的新时间序列或生成警报。Grafana或其他API使用者可以用来可视化所收集的数据。
什么时候合适?
Prometheus可以很好地记录任何纯数字时间序列。它既适用于以机器为中心的监视,也适用于高度动态的面向服务的体系结构的监视。在微服务世界中,它对多维数据收集和查询的支持是一种特别的优势。
Prometheus是为可靠性而设计的,它是您在中断期间要使用的系统,可让您快速诊断问题。每个Prometheus服务器都是独立的,而不依赖于网络存储或其他远程服务。当基础结构的其他部分损坏时,您可以依靠它,并且无需设置广泛的基础结构即可使用它。
什么时候不适合?
普罗米修斯重视可靠性。即使在故障情况下,您始终可以查看有关系统的可用统计信息。如果您需要100%的准确性(例如按请求计费),则Prometheus并不是一个不错的选择,因为所收集的数据可能不会足够详细和完整。在这种情况下,最好使用其他系统来收集和分析数据以进行计费,并使用Prometheus进行其余的监视。
prometheus下载安装
欢迎来到普罗米修斯!Prometheus是一个监视平台,它通过在这些目标上刮擦度量标准HTTP端点来从被监视的目标收集度量标准。本指南将向您展示如何使用Prometheus安装,配置和监视我们的第一个资源。您将下载,安装并运行Prometheus。您还将下载并安装导出器,该工具可在主机和服务上显示时间序列数据。我们的第一个导出器将是Prometheus本身,它提供有关内存使用,垃圾回收等的各种主机级别指标。
下载Prometheus
下载适用于您的平台的最新版本的Prometheus,然后将其解压缩:
tar xvfz prometheus-*.tar.gz
cd prometheus-*
Prometheus服务器是一个称为prometheus
(或prometheus.exe
在Microsoft Windows上)的二进制文件。我们可以运行二进制文件,并通过传递--help
标志来查看有关其选项的帮助。
./prometheus --help
usage: prometheus [<flags>]
The Prometheus monitoring server
. . .
在启动Prometheus之前,让我们对其进行配置。
配置Prometheus
Prometheus配置为YAML。Prometheus下载在一个名为的文件中带有一个示例配置,prometheus.yml
这是一个入门的好地方。
我们删除了示例文件中的大多数注释,以使其更加简洁(注释以开头的行#
)。
global:
scrape_interval: 15s
evaluation_interval: 15s
rule_files:
# - "first.rules"
# - "second.rules"
scrape_configs:
- job_name: prometheus
static_configs:
- targets: ['localhost:9090']
有示例配置文件中配置的三个模块:global
,rule_files
,和scrape_configs
。
该global
块控制Prometheus服务器的全局配置。我们有两个选择。第一个scrape_interval
控制,Prometheus多久刮一次目标。您可以为单个目标覆盖此目标。在这种情况下,全局设置是每15秒刮一次。该evaluation_interval
选项控制Prometheus多久评估一次规则。Prometheus使用规则来创建新的时间序列并生成警报。
该rule_files
块指定了我们希望Prometheus服务器加载的任何规则的位置。目前,我们还没有任何规则。
最后一块,scrape_configs
控制Prometheus监视哪些资源。由于Prometheus还将有关自身的数据公开为HTTP端点,因此它可以抓取并监视其自身的运行状况。在默认配置中,有一个名为的作业,prometheus
它会刮擦Prometheus服务器公开的时间序列数据。该作业包含一个静态配置的目标localhost
on端口9090
。Prometheus希望指标可用于路径上的目标/metrics
。因此,此默认作业是通过以下网址进行抓取:http:// localhost:9090 / metrics。
返回的时间序列数据将详细说明Prometheus服务器的状态和性能。
有关配置选项的完整说明,请参阅 配置文档。
开始普罗米修斯
要使用我们新创建的配置文件启动Prometheus,请切换到包含Prometheus二进制文件的目录并运行:
./prometheus --config.file=prometheus.yml
普罗米修斯应该开始。您还应该能够在http:// localhost:9090上浏览到有关其自身的状态页。给它大约30秒钟的时间,以从其自己的HTTP指标终结点收集有关其自身的数据。
您还可以通过导航到自己的指标终结点:http:// localhost:9090 / metrics来验证Prometheus是否正在提供有关其自身的指标。
使用表达式浏览器
让我们尝试查看Prometheus收集的有关自身的一些数据。要使用Prometheus的内置表达式浏览器,请导航至 http:// localhost:9090 / graph,然后在“图形”选项卡中选择“控制台”视图。
正如您可以从http:// localhost:9090 / metrics收集的那样,称为Prometheus导出的有关其自身的一个指标 promhttp_metric_handler_requests_total
(/metrics
Prometheus服务器已处理的请求总数)。继续并将其输入到表达式控制台中:
promhttp_metric_handler_requests_total
这将返回多个不同的时间序列(以及每个时间序列的最新值),所有时间序列均带有度量名称promhttp_metric_handler_requests_total
,但带有不同的标签。这些标签指定不同的请求状态。
如果我们只对导致HTTP代码的请求感兴趣200
,则可以使用此查询来检索该信息:
promhttp_metric_handler_requests_total{code="200"}
要计算返回的时间序列数,您可以编写:
count(promhttp_metric_handler_requests_total)
有关表达语言的更多信息,请参见 表达语言文档。
使用绘图界面
要绘制表达式的图形,请导航到http:// localhost:9090 / graph并使用“图形”选项卡。
例如,输入以下表达式以图形化显示在自抓取的Prometheus中发生的每秒HTTP请求速率返回状态代码200:
rate(promhttp_metric_handler_requests_total{code="200"}[1m])
您可以尝试使用图形范围参数和其他设置。
安装node_exporter
1.下载安装包
下载地址:https://prometheus.io/download/
2.解压安装包
tar -zxvf node_exporter-1.1.2.linux-amd64.tar.gz
mv node_exporter-1.1.2.linux-amd64 node_exporter
3.添加到系统服务
- centos7以上
vi /usr/lib/systemd/system/node_exporter.service
添加以下内容:
[Service]
ExecStart=/server/node_exporter/node_exporter
[Install]
WantedBy=multi-user.target
[Unit]
Description=node_exporter
After=network.target
systemctl daemon-reload #重加载系统服务
systemctl restart node_exporter.service #启动node_exporter服务
systemctl enable node_exporter.service #加入开机自启
systemctl status node_exporter.service#查看启动状态
以上代表启动成功。
启动成功后默认端口为9100,可以查看下。
- centos7以下操作
nohup /server/node_exporter/node_exporter > /dev/null &
ps -ef | grep node
加入开机自启:
vim /etc/rc.local
添加如下内容
nohup /server/node_exporter/node_exporter > /dev/null &
4.开通端口
在prometheus服务器上telnet node_exporter端口,如果不通,则需要开启端口,或者关闭防火墙(正式环境不允许)。
下面演示开启防火墙:
systemctl status firewalld
firewall-cmd --zone=public --add-port=9100/tcp --permanent
systemctl restart firewalld.service
firewall-cmd --reload
5.添加prometheus规则
- job_name: 'k8s'
static_configs:
- targets: ['127.0.0.1:9100']
添加完成后务必重启prometheus生效。
pkill -9 prometheus
nohup ./prometheus --config.file="/server/prometheus/prometheus.yml" &
安装grafana
wget https://dl.grafana.com/oss/release/grafana-7.5.7-1.x86_64.rpm
sudo yum install grafana-7.5.7-1.x86_64.rpm
systemctl start grafana.service
网页输入ip:3000
默认账户密码为admin admin,进去会提示修改密码,修改即可。
然后点击'+',导入仪表。
仪表样例官方地址:
https://grafana.com/grafana/dashboards?search=docker
输入node搜索,点击一个仪表样例。
点击copy,打开grafana界面,输入id,加载,然后选择数据源为prometheus,就会看到一个精细的仪表监控了。
至此,完美实现prometheus+grafana+node_exporter监控。