一.zabbix介绍
(1)zabbix:zabbix是一款基于web开发的分布式监控系统以及企业级的网络监控的开源解决方案
zabbix能监视各种网络参数,保证服务系统
的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。
(2)zabbix的工作原理:
zabbix主要分为这几个方面进行工作:
1.数据的采集
采集方式:
SNMP:简单网络管理协议
agent:客户端代理,属于被监控端
ICMP:网络控制管理协议
IPMI:智能平台管理接口
2.数据存储
zabbix:mysql,pgsql,oracle
nagios:mysql
cacti: rrd
3.数据展示
基于java,php,或是移动app
展示的级别有:简单图,图形,screen,slide show ,map
4.报警接口
mail(smtp)
chat (短信)
SMS
(3)zabbix的结构
二.zabbix的安装与环境配置
(1)官网下载地址: www.zabbix.com
也可以在repo.zabbix下载然后下载到虚拟机上并更新yum源
下载之后执行
wget http://repo.zabbix.com/zabbix/3.4/rhel/7/x86_64/zabbix-release-3.4-2.el7.noarch.rpm
rpm -ivh zabbix-release-3.4-2.el7.noarch.rpm
yum repolist——更新yum源
(2)设置数据库信息
vim /etc/my.cnf.d/server.cnf
开启数据库 systemctl start mariadb
mysql -uroot -pcentos
create database zbxdb character set 'utf8';
garant allon zbxdb.* to 'zbuser'@'172.18.%.%' identified by 'zbxpass';
flush priviages;
设置完成后退出
开始yum安装相应的包
yum install zabbix-server-mysql zabbix-web zabbix-web-mysql(gui) zabbix-agent zabbix-get zabbix-sender中cp /usr/share/doc/zabbix-server-mysql-3.4.4/create.sql.gz /root/
unzip create.sql.gz
mysql -uzbuser -pzbxpass -h172.18.254.242 zbxdb < create.sql
(3)配置zabbix配置文件
vim zabbix_server.conf
主要配置内容
ListenPort=10051
DBHost=172.18.254.242
DBName=zbxdb
DBUser=zbuser
DBPassword=zbxpass
DBPort=3306
开启httpd
在web 进行测试
三.在zabbix进行配置
(1)在客户端上同样安装wget http://repo.zabbix.com/zabbix/3.4/rhel/7/x86_64/zabbix-release-3.4-2.el7.noarch.rpm
rpm -ivh zabbix-release-3.4-2.el7.noarch.rpm
yum repolist——更新yum源
然后只需要yum install zabbix-agent.service zabbix-sender
vim /etc/zabbix/zabbix-agent.conf
配置内容
Server=172.18.254.242——服务地址
ListenPort=10050——监听端口
ListenIP=0.0.0.0——监听本机所有ip
ServerActive=172.18.254.242——服务端地址
Hostname=node3.magedu.com——解析本地主机名
配置完成后 systemctl start zabbix-agent.service
(2)在web端进行配置
创建group
创建host
确定后点击add即可
定义application
- item设定
item:key+parameter
key:
zabbix内建:
type:
agent (server:pull)
agent(active) (agent:push)
snmp v1
用户自定义(UserParameter)
采集到的数据的类型:
数值:
整数
浮点数
字符串:
字符串
文本
存储的值:
As is:不对数据做任何处理
Delta:(simple change),本次采样减去前一次采样的值的结果
Delta:(speed per second),本次采样减去前一次采样的值,再除以经过的时长;
设置实例:
选择一个内键命令
、
在zabbix-server端上执行
zabbix_get -s 172.18.250.89 -p 10050 -k "system.cpu.intr"
在zabbix-agent端
执行vmstat 1
在item进行设置
选择preprocessing
确定后点击apply
选择Monitoring,查看监控信息
点击graph来查看
示例:接下来多创建几个item来加深理解
选择创建item后设置内容
仍然不要忘了选择preprocessing,内容同上
创建完成后选择monitoring来选择graph来查看
此时还可以再创建一个出站的网络包的速率变化item
直接在原有的rate of packets(in)中点击clone来进行修改即可
只需要修改两个地方即可
创建成功后点击add即可
再创建以字节为单位的item,方法同上,最后创建的结果的是
(3) 定义触发器
- 触发器概念:界定某特定的item采集到的数据的非合理区间或非合理状态:逻辑表达式
- 逻辑表达式,阈值;通常用于定义数据的不合理区间;
OK:正常 状态 --> 较老的zabbix版本,其为FALSE;
PROBLEM:非正常 状态 --> 较老的zabbix版本,其为TRUE;
OK --> PROBLEM
Recovery:PROBLEM --> OK
也就是说如果满足触发器的请求则为problem,如果没有满足触发器要求则为ok- 触发器存在可调用的函数:
nodata()
last()
date()
time()
now()
dayofmonth()- Severity:严重等级
Not classified
Information
Warning
Average
High
Disaster- 触发器表达式:
{hostname:key[paramters].function(arguments)
, <, =, #(not equal)...
+, -, *, /
&, |{n1.magedu.com:net.if.in[eno16777736,packets].last(#1)}>15
trigger间存在依赖关系:
zabbix server <--> Router1 <--> Host1下面通过实例进行演示
点击创建触发器
设置危险级别
设置触发器内容
点击add
查看是否生成触发器
(4)action与media
- 1.Media:媒介
告警信息的传递通道;
类型:
Email:邮件
Script:自定义脚本
SMS:短信
Jabber:
Ez Texting:
接收信息的目标为zabbix用户:
需要用户上定义对应各种媒介通道的接收方式;- 2.Action:
conditions:
多个条件之间存在逻辑关系;
operations:
条件满足时触发的操作;
send message:- Media type:传递信息的通道;
(a) Email
(b) Script:报警脚本;
脚本放置路径:zabbix_server.conf配置文件中AlertScriptsPath参数定义的路径下;
/usr/lib/zabbix/alertscripts/
zabbix服务器在调用脚本时,会向其传递三个参数:
$1:经由此信道接收信息的目标;
$2:subject
$3:body
zabbix 3.0之后的版本,此三个变量定义为内部宏:{ALERT.SENDTO}
{ALERT.SUBJECT}
{ALERT.MESSAGE}- 信息接收人:
(a) User Groups
(b) Users
admin:
实例:
设置media和action来实现当中断redis服务后可以自动开启
1.选择administration的users里的media,然后编辑
2.选择Media types,创建Media types,进行编辑
3.定义hosts中的node3,创建新的item
4.定义触发器
5.在monitoring中查看状态
此时现在zabbix-service端测试一下
如果手动关闭redis服务,那么状态就会为down(0)
6.设置action来实现自动修复故障上线
定义operations
在zabbix-agent上定义
vim /etc/zabbix/zabbix_agentd.conf
7.当五分钟之内服务仍然没有开启的时候吧来定义第二个步骤
8.完成上述步骤后,手动关掉zabbix-agent的redis服务观察
据观察当手动关闭redis服务户,redis服务就会条件从而通过远程命令来恢复
使用mail来查看邮件
9.当服务在定义的五分钟内无法启动脚本时,则会触发第二个条件
我们可以将redis服务停掉并删除redis服务,来模拟触发条件的触发
systemctl stop redis.service && rpm -e redis
60秒执行第二个步骤
四.展示接口及宏的定义
(1)展示接口:
graph: simple, custom
以次类推再创建几个graphs
screen:把多个graph整合于同一屏幕进行展示;
设置screen格式
设置screen如图
slide show:把多个screen以slide show的方式进行展示
map:
创建一个新的screen
设置新的screen格式,与之前的screen格式不一样
此时创建一个slide,将之前的两个screen都加进来
创建成功后查看
5秒后观察变化
(2)模板
主机配置模板:用于链接至目标主机实现快速监控管理;
link, unlink, unlink and clear
模板可继承;
示例:导入linux操作系统模板
选择模板选项
选择node3用户,导入模板
选择导入的linux操作系统
点击add后查看hosts中的node3的信息
如果想取消模板链接则要在如图内容进行设置
注意:不是两个都要选择而是直接选择unlink and clear选项才能删除干净
(3)宏的定义
macro,预设的文本替换模式;
级别:
全局:Administration --> General --> Macros
模板:编辑模板 --> Macros
主机:编辑主机 --> Macros
类型:
内建:{MACRO_NAME}
文档:
https://www.zabbix.com/documentation/3.4/manual/appendix/macros/supported_by_location
自定义:{$MACRO_NAME}
命名方式:大写字母、数字和下划线;
选择action中operations
示例:设定一个宏
选择node3中的item,选择redis status进行宏的设定
确定后观察变化
在实际应用中如果有的主机的redis服务监听的端口是6380,而其他主机的监听端口仍然是6379,此时就可以通过宏的定义来实现监控
设置步骤:
1.模拟上述环境,将一台主机的redis服务的监听端口改为6380
2.在hosts中定义宏
不要在主机中定义宏,否则如果其他主机的redis服务仍然监控的是6379端口的时候,在全局定义就会造成其他主机都无法工作
而且主机的宏的优先级高于全局宏
补:定义脚本的存储路径
/etc/zabbix/zabbix_agentd.d/