一、容器监控概要
使用docker compose
组合应用并利用scale
可以实现快速对容器扩容。由于docker compose
启动的服务都在同一台宿主机上,对于一个宿主机上运行多个容器应用时,容器的运行情况如:CPU使用率、内存使用率、网络状态、磁盘空间等一系列随时间变化的时序数据信息,都是需要去了解的,因此监控是必须的。
二、容器监控方案选择
1、docker stats
对于容器的监控方案可谓多种多样,本身自带命令docker stats
命令、Scount、Data Dog、Sysdig Cloud、Sensu Monitoring Framework, CAdvisor等。
通过docker stats
命令可以很方便地看到当前宿主机上所有容器的CPU、内存以及网络流量等数据。但是docker stats
命令的缺点就是统计的只是当前宿主机的所有容器,而获取的监控数据是实时的。,没有地方存储,也没有报警功能。
docker stats
2、其他方案
Scount
、SysdigCloud
、Data Dog
虽然都提供了较完善的服务,但是它们都是托管的服务,而且都收费。Sensu Monitoring Framework
集成度较高,也免费,但是部署过于复杂。综合考虑,选择CAvisor
做容器监控工具。
(1)CAdvisor
CAdvisor
谷歌出品,优点是开源产品,监控指标齐全,部署方便,而且有官方的docker镜像。缺点是集成度不高,默认只在本地保存2分钟数据。不过可以加上InfluxDB
存储数据,对接Grafana
展示图表,比较便利地搭建好了容器监控系统,数据收集和图表展示效果良好,对系统的性能也几乎没有什么影响。
CAdvisor是一个容器资源监控工具,包括容器的内存、CPU、网络IO、磁盘IO等监控,同时提供了一个WEB页面用于查看容器的实时运行状态。CAdvisor默认存储2分钟的数据,而且只是针对单物理机。不过CAdvisor提供了很多数据集成接口,支持InfluxDB
、Redis
、Kafka
、Elasticsearch
等集成,可以加上对应配置将监控数据发往这些数据库存储起来。
CAdvisor功能主要有两点:
- 展示Host和容器两个层次的监控数据。
- 展示历史变化数据。
(2)InfluxDB
influxDB是用Go语言编写的一个开源分布式时序、事件和指标数据库,无需外部依赖。
CAdvisor默认只在本机保存最近2分钟的数据,为了持久化存储数据和统一收集展示监控数据,需要将数据存储到InfluxDB中。InfluxDB是一个时序数据库,专门用于存储时序相关数据,很适合存储CAdvisor的数据。而且,CAdvisor本身已经提供了InfluxDB的集成方法,在启动容器时指定配置即可。
influxDB主要功能:
- 基于时间序列,支持与时间有关的相关函数(如最大、最小、求和等)
- 可度量幸:可以实时对大量数据进行计算;
- 基于事件:支持任意的事件数据;
influxDB主要特点:
- 无结构(无模式);
- 可以是任意数量的列;
- 可拓展的;
- 支持min, max, sum, count, mean, median等一系列函数,方便统计;
- 原生的HTTP支持,内置HTTP API;
- 强大的类SQL语法;
- 自带管理界面,方便使用
(3)Grafana
Grafana是一个开源的数据监控分析可视化平台,支持多种数据源配置(支持的数据源包括influxDB
、MySql
、Elasticsearch
、OpenTSDB
、Graphite
等)和丰富的插件及模板功能,支持图表权限和报警。
Grafana主要特性:
- 灵活丰富的图形化选项
- 可以混合多种风格
- 支持白天和夜间模式
- 多个数据源
3、Cadvisor + InfluxDB + Grafana
三、安装部署
1、部署InfluxDB服务
docker run -d --name influxDB -p 8086:8086 \
-v /data/influxdb:/var/influxdb \
--hostname=influxdb \
influxdb
说明:
-
--name
:启动容器分配名字influxdb -
-p
:映射端口,8083端口为influxdb管理端口,8086端口是influxdb的数据端口 -
-v
:挂载数据 -
-d
:后台运行此容器 -
influxdb
:通过这个容器来运行的,默认会在docker官方仓库pull下来
(1)浏览器访问influxdb的管理端,http://ip:8083
(2)创建test的数据库与root用户,用于后期配grafana
docker exec -it influxdb influx
CREATE DATABASE "test"
CREATE USER "root" WITH PASSWORD 'root' WITH ALL PRIVILEGES
2、部署Cadvisor服务
谷歌的cadvisor可以用于收集Docker容器的时序信息,包括容器运行过程中的资源使用情况和性能数据。
docker run --volume=/:rootfs:ro --volume=/var/run:/var/run:ro\
--volume=/sys:/sys:ro --volume=/var/lib/docker/:/var/lib/docker:ro\
--volume=/dev/disk/:/dev/disk:ro --volume=/cgroup:/cgroup:ro \
--publish=8080:8080 --detach=true --privileged=true --name=cadvisor \
google/cadvisor:latest\
-storage_driver=influxdb-storage_driver_host=influxdb:8086\
-storage_driver_db=test-storage_driver_user=root\
-storage_driver_password=root
说明:
- -d:后台运行此容器
- --name:启动容器分配名字cadvisor
- -p:映射端口8080
- --mount:把宿主机的相关目录绑定到容器中,这些目录都是cadvisor需要采集的目录文件 和监控内容
- -storage_driver:需要指定cadvisor的存储驱动、数据库主机、数据库名
(1)通过ip + 8080端口访问测试以下,第一次访问该页面比较慢
3、部署Grafana服务
Grafana是一款开源的时序数据分析工具,而且界面专业易用。
docker run -d -p 3000:3000 \
-v /data/grafana:/var/lib/grafana \
--link=influxdb:influxdb\
--name grafana grafana/grafana
注意:如果使用-v把数据挂载出来会出现容器启动失败,错误为mkdir:cannot create directory '/var/lib/grafana/plugins':Permission denied,此时可以使用docker run --entrypoint "id" grafana/grafana得到uid,gid,groups(默认是472);
接着使用chown -R 472:472 /data/grafana/修改目录权限就可以启动成功。
(1)通过ip + 3000端口访问grafana的web服务,第一次访问需要修改admin用户密码,默认用户名/密码为admin/admin
4、docker-compose集成和快速部署
创建编辑docker-compose.yml文件
version: '3.1'
volumes:
grafana_data: {}
services:
# 收集数据服务
influxdb:
image: tutum/influxdb:0.9
#image: influxdb
restart: always
environment:
- PRE_CREATE_DB=cadvisor
ports:
- "8083:8083"
- "8086:8086"
expose:
- "8090"
- "8099"
volumes:
- ./data/influxdb:/data
# 存储数据
cadvisor:
image: google/cadvisor
links:
- influxdb:influxsrv
command: -storage_driver=influxdb -storage_driver_db=cadvisor -storage_driver_host=influxsrv:8086
restart: always
ports:
- "8080:8080"
volumes:
- /:/rootfs:ro
- /var/run:/var/run:rw
- /sys:/sys:ro
- /var/lib/docker/:/var/lib/docker:ro
# 展示数据
grafana:
user: "104"
image: grafana/grafana
user: "104"
restart: always
links:
- influxdb:influxsrv
ports:
- "3000:3000"
volumes:
- grafana_data:/var/lib/grafana
environment:
- HTTP_USER=admin
- HTTP_PASS=admin
- INFLUXDB_HOST=influxsrv
- INFLUXDB_PORT=8086
- INFLUXDB_NAME=cadvisor
- INFLUXDB_USER=root
- INFLUXDB_PASS=root
在yml所在目录下执行以下命令启动:
docker-compose up
查询是否正常启动
浏览grafana服务,http://ip:3000
登陆grafana服务
浏览influxdb服务
配置grafana工具
(1)配置数据源
选择influxdb数据源
具体配置如下
配置完成后,如下图
(2)配置面板
选择面板类型
选择图形
配置查询条件
配置完后,效果如图
grafana支持查询条件,可以从influxdb中了解
浏览cAdvisor服务,http://ip:8080/