以往我们提及监控通常会想到zabbix,尽管zabbix对物理机/虚拟机监控方面比较擅长,但其对容器的监控能力是偏弱的;而prometheus天然支持集群化的容器云监控,并且提供了丰富的API供扩展其功能,本文我们在k8s集群中搭建prometheus监控其资源情况,通过grafana完成监控数据的可视化查看。
1.准备安装资源
镜像准备
docker pull 以下镜像,如果有私有镜像仓库,pull后自行push到仓库备用。
- prom/node-exporter
- prom/prometheus:v2.0.0
- grafana/grafana:4.2.0
YAML准备
链接:https://pan.baidu.com/s/19hu7663pmZNHGRsAEQCLcw
提取码:bvqn
2.安装
镜像准备完毕后,将yaml文件上传到master节点
注意:grafana.yaml中ingress的host节点可以修改为自己的域名,如果无域名,则忽略不用修改
按顺序执行以下命令:
kubectl apply -f node-exporter.yaml
kubectl apply -f rbac-setup.yaml
kubectl apply -f configmap.yaml
kubectl apply -f prometheus.deploy.yml
kubectl apply -f prometheus.svc.yml
kubectl apply -f grafana.yaml
执行后过一会我们查看节点状态:
kubectl get pods -n kube-system
如下所示,各节点运行正常
node-exporter-246mv 1/1 Running 0 32s
node-exporter-8xm6t 1/1 Running 0 30s
prometheus-68545d4fd8-rscl9 1/1 Running 0 17s
grafana-core-6ff599bfdc-znql9 1/1 Running 0 4s
3.配置grafana
执行如下命令查看grafana的服务端口,如果映射了域名直接用域名即可
kubectl get svc -n kube-system
NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE
grafana NodePort 10.98.113.119 <none> 3000:30353/TCP 38s
我看到到映射的nodePort是30353,我们访问该地址:
http://ip30353,然后浏览器默认会跳转到login界面,我们输入默认的帐户和密码admin/admin
添加数据源
点击Add Datasource添加prometheus数据源,如下图所示:
Name随意取,Type选择Pormetheus,Url输入http://prometheus:9090,即prometheus的服务名及服务端口,然后点击保存。
添加k8s集群监控Dashboard
点击菜单Dashboards--->Import,如下图
在导入界面,输入编号315,grafana会自动到其官网模板库中下载315编号的模板JSON进行渲染。
注意:如果你的服务器没有联网,则这里需要自行上传Json模板文件。
官方模板库地址:https://grafana.com/grafana/dashboards 里面有很多各种不同类型的软件监控的模板,315编号的模板是k8s主流的显示模板,下载地址:https://grafana.com/grafana/dashboards/315/revisions
输入315后,如果服务器能够自行下载模板文件,则会跳转到下面界面,数据源选择刚才创建的prometheus数据源即可,点击Import按钮。
如下图k8s的默认监控界面。
补充:grafana支持多种软件的监控,需要安装插件,支持插件清单:
https://grafana.com/grafana/plugins?orderBy=weight&direction=asc
后记
我们还可以使用其进行指标的告警通知等,此外一些可行的扩展思路抛砖引玉:
1.将不同的监控看板界面集成到我们自己的系统中,网上有一些成功集成案例。
2.通过SimpleJson对自己业务系统的指标进行监控,需要一些简单取数的开发。
3.通过prometheus获取监控指标,放到自己业务系统中的监控或报表页面,自行实现类似grafana的功能。