promethues+grafana

1.prometheus安装地址:https://realinstall-package.oss-cn-beijing.aliyuncs.com/package/prometheus-2.21.0-rc.0.linux-amd64.tar.gz

2.pushgateway安装地址:https://realinstall-package.oss-cn-beijing.aliyuncs.com/package/pushgateway-0.4.0.linux-amd64.tar.gz

prometheus安装:

tar zxvf prometheus-2.21.0-rc.0.linux-amd64.tar.gz
cd prometheus
mv prometheus.yml prometheus.yml.buckup

下载prometheus.yml和规则(在promtheus的根目录)

wget https://raw.githubusercontent.com/milvus-io/docs/master/v0.10.2/assets/monitoring/prometheus.yml \ -O prometheus.yml
wget -P rules https://raw.githubusercontent.com/milvus-io/docs/master/v0.10.2/assets/monitoring/alert_rules.yml

pushgateway 镜像安装方式:

docker pull prom/pushgateway
docker run -d -p 9091:9091 prom/pushgateway

配置文件修改:prometheus.yml

global:
  scrape_interval:     2s # Set the scrape interval every 2 seconds. The default is every 1 minute.
  evaluation_interval: 2s # Evaluate rules every 2 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).
 
# Alertmanager configuration
alerting:
  alertmanagers:
  - static_configs:
    - targets: ['localhost:9093']
 
# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
   - "alert_rules.yml" # add alerting rules
 
# A scrape configuration containing exactly one endpoint to scrape:
# Here it's Prometheus itself.
scrape_configs:
  # The job name is added as a label `job=<job_name>` to any time series scraped from this config.
  - job_name: 'prometheus'
    static_configs:
    - targets: ['localhost:9090']
 
   # Allows ephemeral and batch jobs to expose their metrics to Prometheus
  - job_name: 'pushgateway'
    honor_labels: true
    static_configs:
    - targets: ['localhost:9091']
 
#其他工程(端口号58080是自己写的上报监控的接口)
  - job_name: 'min01'
    honor_labels: true
    static_configs:
    - targets: ['10.*.0.17:58080']
 
  - job_name: 'min02'
    honor_labels: true
    static_configs:
    - targets: ['10.*.0.18:58080']

启动方式:

[root@milvus01 prometheus]# pwd
/data/software/prometheus

./prometheus --config.file=prometheus.yml &

grafana安装:

chmod 777 /data/software/grafana/
docker run -d --name grafana -p 3000:3000 -v /data/software/grafana/:/var/lib/grafana grafana/grafana
docker cp grafana:/etc/grafana/grafana.ini /data/software/grafana-data/etc
docker kill grafanan
docker rm grafana
mkdir /data/software/grafana-data/
chmod 777 grafana-data/
docker run --user root  -d --name grafana -p 3000:3000  -v /data/software/grafana-data/etc:/etc/grafana/ -v /data/software/grafana-data/grafana:/var/lib/grafana  grafana/grafana

配置文件配置:(目前没有查到原因为什么不成功,发送失败,所以采用了下个方法)

[smtp]
enabled = true
host = smtp.exmail.qq.com:465
user =Grafana@*****.com
# If the password contains # or ; you have to wrap it with triple quotes. Ex """#password;"""
password =****123
;cert_file =
;key_file =
skip_verify = true
from_address = Grafana@*****.com
from_name = Grafana

配置alertmanager

global:
  resolve_timeout: 5m
  smtp_smarthost: 'smtp.exmail.qq.com:465'       # smtp地址
  smtp_from: 'grafana@******.com'                # 谁发邮件
  smtp_auth_username: 'grafana@*******.com'       # 邮箱用户
  smtp_auth_password: '******'                   # 邮箱密码
  smtp_require_tls: false

route:
  group_by: ['alertname']
  group_wait: 10s            #当一个新的报警分组被创建后,需要等待至少group_wait时间来初始化通知,这种方式可以确保您能有足够的时间为同一分组来获取多个警报,然后一起触发这个报警信息。
  group_interval: 10s        # 当第一个报警发送后,等待'group_interval'时间来发送新的一组报警信息。
  repeat_interval: 1h        # 如果一个报警信息已经发送成功了,等待'repeat_interval'时间来重新发送他们
  receiver: 'web.hook'

receivers:
- name: 'web.hook'
  webhook_configs:
  - url: 'https://qyapi.weixin.qq.com/cgi-bin/webhook/send?key=cbe4*********9d-d17f3d60990f'
- name: 'mail'
  email_configs:
  - to: '*****@******.com'




inhibit_rules:
  - source_match:
      severity: 'critical'
    target_match:
      severity: 'warning'
    equal: ['alertname', 'dev', 'instance']



启动:

./alertmanager --config.file=alertmanager.yml &

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,589评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,615评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,933评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,976评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,999评论 6 393
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,775评论 1 307
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,474评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,359评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,854评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,007评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,146评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,826评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,484评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,029评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,153评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,420评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,107评论 2 356