想打造 New Relic 那样漂亮的实时监控系统我们只需要 InfluxDB/collectd/Grafana 这三个工具,这三个工具的关系是这样的:
采集数据(collectd)-> 存储数据(InfluxDB) -> 显示数据(Grafana)。
InfluxDB
是 Go 语言开发的一个开源分布式时序数据库,非常适合存储指标、事件、分析等数据,看版本号(v0.8.8)就知道这个项目还很年轻;
collectd
就不用介绍了吧,C 语言写的一个系统性能采集工具;
Grafana
是纯 Javascript 开发的前端工具,用于访问 InfluxDB,自定义报表、显示图表等。
collectd
- 安装
sudo apt-get update
sudo apt-get upgrade
sudo reboot
- 配置
配置 collectd 为客户端,收集到数据后直接发给 InfluxDB:
sudo vi /etc/collectd/collectd.conf
...
LoadPlugin network
...
<Plugin network>
Server "192.168.2.183" "25826"
</Plugin>
...
inluxdb
安装
sudo apt-get install influxdb
# 0.9.2版本 目前grafana只支持0.9版本
wget http://influxdb.s3.amazonaws.com/influxdb_0.9.2_amd64.deb
0.9版本无法在ubuntu16.04上直接安装,只能安装在14.04上,所以我们只能用docker镜像来运行influxdb
docker run -d -p 8083:8083 -p 8086:8086 -p 25826:25826/udp\
-e ADMIN_USER="root" -e INFLUXDB_INIT_PWD="root"\
-e PRE_CREATE_DB=collectd -e COLLECTD_DB="collectd" -e COLLECTD_BINDING=':25826'\
-e COLLECTD_RETENTION_POLICY="" tutum/influxdb:0.9
配置
默认的配置文件保存在:/etc/opt/influxdb/influxdb.conf
修改配置后要重启
重启
/etc/init.d/influxdb restart
默认端口: http://localhost:8083/
- 身份认证
身份认证 默认情况下,身份认证是关闭的。也就是说,不使用账号和密码就可以访问数据库。需要使用配置文件才能进行配置
Grafana
安装
wget https://s3-us-west-2.amazonaws.com/grafana-releases/release/grafana_4.3.2_amd64.deb
sudo dpkg -i grafana_4.3.2_amd64.deb
默认端口3000
,默认账号admin/admin
注意:不要使用apt-get install grafana来安装,可能版本问题,图标显示不出来,版本也比较老。
配置
网络流量统计
-- 传输
SELECT derivative("value") AS "value" FROM "interface_rx" WHERE "host" = 'localhost' AND "type" = 'if_octets' AND "instance" = 'eno1'
函数 derivative
意为导数, 微积分中的概念. value 为传输总量(字节), derivative("value") 为 value 在时间上的增量.
其中
host = localhost
type = if_octets
instance = eno1
cpu
-- 系统负载
SELECT mean("value") FROM "load_longterm" WHERE "host" = 'localhost' AND $timeFilter GROUP BY time($interval) fill(null)
SELECT mean("value") FROM "load_midterm" WHERE "host" = 'localhost' AND $timeFilter GROUP BY time($interval) fill(null)
SELECT mean("value") FROM "load_shortterm" WHERE "host" = 'localhost' AND $timeFilter GROUP BY time($interval) fill(null)
-- 内存用量
SELECT mean("value") FROM "memory_value" WHERE "type_instance" = 'used' AND $timeFilter GROUP BY time($interval) fill(null)