简介
运维工程师(Operations),负责维护并确保整个服务的高可用性,同时不断优化系统架构提升部署效率、优化资源利用率提高整体的ROI. 运维工程师面对的最大挑战是大规模集群的管理问题,如何管理好几十万台服务器上的服务,同时保障服务的高可用性,是运维工程师面临的最大挑战。
在我们的日常的运维工作中 会面临各种各样的运维问题,这里我们的理念是所有的问题都是人为的!
为什么这么说呢,我们常见的运维问题,网络波动,cup飙高,内存不够等……
这些问题都是人为的,都是由操作人员的操作导致的,我们运维的工作主要就是解决这些人为问题。
我们运维平时运维的服务器多则几百上千,少的也十几台,我们不可能时时守在服务器前,等待问题。
所以我们使用监控的方式,去管理服务器,实时动态的关注服务器状态 即使的到反馈,处理问题。
我们公司用的Zabbix监控,下面我会对Zabbix做一个基础配置的讲解
zabbix
zabbix是一款功能非常全面的监控软件,在我们的日常生产环境中,zabbix几乎可以监控我们所需要的所有参数
它可以针对服务器的cpu,内存,磁盘空间,网络进行监控,还可以对我们的服务进行监控,ip请求数,监听端口
数据字节等。
实际操作
准备环境
三台服务器
192.168.14.10 服务端
192.168.14.20 客户端1
192.168.14.30 客户端2
服务端操作
配置yum源
wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
wget -O /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo
rpm -ivh https://mirrors.aliyun.com/zabbix/zabbix/4.0/rhel/7/x86_64/zabbix-release-4.0-1.el7.noarch.rpm
Yum clean all
Yum makecache
安装服务端组件
yum -y install zabbix-server-mysql zabbix-web-mysql mariadb-server
开启数据库,开机自启
systemctl start mariadb
systemctl enable mariadb
进入数据库操作
create database zabbix character set utf8 collate utf8_bin;
grant all privileges on zabbix.* to zabbix@localhost identified by '123456';
退出数据库
把zabbix默认的数据库模板导入我们创建的数据库中
zcat /usr/share/doc/zabbix-server-mysql-4.0.7/create.sql.gz |mysql -uzabbix -p123456 zabbix
我们服务端的web页面用是lamp的环境 ,所以进入Apache配置文件中的Zabbix配置文件修改时间
#去掉备注 改成上海时间
php_value date.timezone Asia/Shanghai
开启Apache 开机自启
systemctl start httpd
systemctl enable httpd
配置Zabbix服务端
vim /etc/zabbix/zabbix_server.conf
DBPassword=123456
启动Zabbix服务端
systemctl start zabbix-server
systemctl enable zabbix-server
测试
http://服务端IP/zabbix
客户端操作
配置yum源
wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
wget -O /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo
rpm -ivh https://mirrors.aliyun.com/zabbix/zabbix/4.0/rhel/7/x86_64/zabbix-release-4.0-1.el7.noarch.rpm
Yum clean all
Yum makecache
安装zabbix组件
yum -y install zabbix-agent
配置客户端
vim /etc/zabbix/zabbix_agentd.conf
Server=192.168.14.10
#服务端IP
ServerActive=192.168.14.10
#主动模式
zabbix配置已经完成 多个客户端重复以上操作就可以了
在web页面上操作 自己摸索吧