工欲善其事,必先利其器。作为一款强大的开源软件,Zabbix号称“Monitor Everything”,其所依赖的,很大程度上便是SNMP的数据采集支持。SNMP 协议是用来管理设备的协议,目前SNMP已成为网络管理领域中事实上的工业标准,并被广泛支持和应用,大多数网络管理系统和平台都是基于SNMP的。如果 NMS( 网管系统 ) 需要查询被管理设备的状态,则需要通过 SNMP的get 操作获得设备的状态信息。但由于告警信息一般是由受管服务器进行主动告警,这时候就不能通过管理方主动使用snmpget来进行,而是由受管服务器通过SNMPTRAP进行。
一、什么是SNMPTRAP
SNMP trap(SNMP 陷阱):某种入口,到达该入口会使SNMP被管设备主动通知SNMP管理器,而不是等待SNMP管理器的再次轮询。
SNMP Trap 是 SNMP的一部分,当被监控段出现特定事件,可能是性能问题,甚至是网络设备接口宕掉等,代理端会给管理站发告警事件。假如在特定事件出现的时刻,不是由 Agent 主动通知 NMS,那么NMS 必须不断地对 Agent 进行轮询。这是非常浪费计算资源的方法,正如人们用中断通知 CPU 数据的到达,而不是让 CPU 进行轮询一样。Trap 通知是更加合理的选择。用一句话来说的话,SNMP Trap 就是被管理设备主动发送消息给 NMS 的一种机制。
二、SNMPTRAP功能特点
1、事件驱动,第一时间收到设备故障告警
以事件为驱动,由被监控的主机、网络设备、应用在发生故障时向NMS发送SNMP Trap,通过对接收到的SNMP Trap进行翻译和展现,以最快速度向管理人员发送告警。SNMP Trap不同于SNMP的主动采集,SNMP采集服务器按照固定的时间间隔,由网管系统以询问的方式,采集被监控端性能指标,因此发现被监控端性能问题的快慢取决于采集的频率间隔。而SNMP Trap是以事件为驱动,在被监控端设置陷阱,一旦被监控端设备出现相关问题,立刻发送SNMP Trap,因此能够在最短的时间内发现故障,避免因为设备故障带来的经济损失。
2、提供SNMPTrap的接收,并通过对Trap信息翻译,展现事件
支持设备,主机和应用的SNMP Trap信息,从被动变为主动,全面监控IT系统。通过对SNMP Trap的翻译和展现,一旦某个IT组件出现问题,可以在短时间之内,即可收到故障信息,满足企业的快速发现问题的需要。
通过SNMPTrap的接收规则定义,管理员可以过滤非重要设备的Trap信息,也可以过滤被监控设备的非重要故障信息,帮助管理员在第一时间收到真正需要的管理信息。
3、定制SNMPTrap告警规则触发告警,提供多种方式发送告警信息
用户通过管理端定制需要告警的SNMP Trap信息,针对特定SNMP Trap事件通过邮件、短信、语音、微信等方式向相关人员发送报警,帮助管理人员快速收到IT系统故障信息。
4、支持事件导出
汇总特定时间内特定SNMPTrap事件,同时可以以Excel格式导出事件数据,便于管理人员对故障信息进行统计和分析。
5、支持各类设备厂家MIB库的导入
虽然国内各种网络设备都支持SNMP Trap,但是各个厂家的MIB库并不能很好的支持公共标准,因此,很多监控系统都支持私有MIB库的导入,确保能够全面兼容各个厂家设备的SNMP Trap信息。
三、SNMPTRAP工作流程
1、Agent端
A、编写MIB文件,确定好TRAP名称等信息(一般MIB设备厂商会提供)
B、命令方式:发送各种TRAP命令(Manager地址后面一定要加端口号162),在Manager端看反应结果,在Agent端无反应
C、自动触发:配置snmpd.conf设置触发TRAP,系统发生某类错误时会自动触发相应类型的TRAP,发送给Manager
D、程序方式:一部份TRAP需要写C语言程序,用相应的api(send_easy_trap或send_v2trap)发送
2、Manager端
A、配置snmptrapd.conf文件,设置访问权限
B、将MIB文件导入到mibs文件夹中
C、用perl等脚本语言编写处理trap的程序
D、配置snmptrapd.conf文件,添加traphandler项,将不同的TRAP对应到不同的处理程序上
3、流程图
图中在测试机 M1 上启动 snmptrapd 进程,并且在 UDP 162 端口上监听 SNMP Trap 信息,一旦收到 Trap,snmptrapd 将所接收到的 Trap 信息内容打印到一个本地的文本文件中。 机器 M2 模拟发送 SNMP Trap 的设备,将调用 net-snmp 的命令行程序 snmptrap 发送一个 Trap。
四、SNMPTRAP在ZABBIX上实现过程
1、设置ZABBIX接收SNMP Trap
1)、安装依赖的程序包
yum install -y net-snmp-utils net-snmp-perl
2)、下载和解压Zabbix源码包
tar -zxvf zabbix-2.2.1.tar.gz
3)、从源码文件中复制脚本和添加执行权限
cp ./zabbix-2.2.1/misc/snmptrap/zabbix_trap_receiver.pl /usr/binchmod +x /usr/bin/zabbix_trap_receiver.pl
4)、设置Trap接收器和团体名称
vi /etc/snmp/snmptrapd.conf
# you can set multiple community names:
# authCommunity execute public
# authCommunity execute S7di@kjh8
authCommunity execute public
perl do "/usr/bin/zabbix_trap_receiver.pl"
5)、编辑zabbix_server.conf配置文件启用SNMP Trap
vi /etc/zabbix/zabbix_server.conf
StartSNMPTrapper=1
SNMPTrapperFile=/tmp/zabbix_traps.tmp (注:必须跟zabbix_trap_receiver.pl脚本中设置的相同)
6)、重启zabbix_server服务使配置生效
/etc/init.d/zabbix-server restart
7)、设置SNMP MIBs
MIBs默认在系统目录/usr/share/snmp/mibs下,添加MIB名称到/etc/snmp/snmp.conf配置文件中(如果不存在则手动新建配置文件),它们将被Net-SNMP进程用来解析trap OID值。
例:mibs +JUNIPER-MIB:JUNIPER-FABRIC-CHASSIS:BGP4-MIB
8)、重启snmptrapd服务
/etc/init.d/snmptrapd restart
2、配置ZABBIX
1)、创建"SNMP trap fallback"模板和"SNMP trap fallback"监控项:
监控项名称: SNMP trap fallback
类型: SNMP trap
键值: snmptrap.fallback
数据类型: Log
注:该监控项用来收集所有不匹配的trap
2)、创建触发器以通知管理员关于新的不匹配trap:
触发器名称: Unmatched SNMP trap received from {HOST.NAME}
表达式: {Template SNMP trap fallback:snmptrap.fallback.nodata(300)}=0
3)、创建"Template SNMP traps"模板并链接到"Template SNMP trap fallback"
在"Template SNMP traps"模板中,为trap创建需要的监控项. key值使用snmptrap[regex]格式,
例:
Key: snmptrap["SNMPv2-MIB::coldStart"]
替代OID值(数字或文本),您可以使用任何从一个trap文本中的单词/短语:
Key: snmptrap["No route to host"]
在这种情况下,Zabbix从匹配的地址中捕获所有SNMP Trap包含"No route to host"。
4)、为监控项创建触发器
在前面创建的模板,为必要的项目(Trap)创建触发器.
这里涉及一些变量,以前面例子中的监控项为例创建触发器:
表达式:
{Template SNMP traps:snmptrap["SNMPv2-MIB::coldStart"].nodata(5m)}=0
意思是如果5分钟后,trap接收和自动返回OK状态,则触发器进入警告状态
5)、查看ZABBIX获取到的数据
五、总结
SNMP Trap是一种事件驱动型的监控方式,避免了监控系统的资源浪费,提高了警告的及时性和准确性。目前很多监控系统都提供SNMP Trap的监控方式,主动型监控是比较推荐的选择方式。
原文地址
(出处: 乐维_一站式运维监控管理平台)