Loki的监控指标远比我想象得细

小白在Grafana Dashboard中发现居然没有现成的Loki2.0版本监控,无奈只有自己来造个轮子😂

先来看下截图吧:

image.png
image.png
image.png

面板版本基本信息:

  • Grafana v7.3.1
  • Loki2.0.0

依赖的服务

  • Cassandra (Index)
  • S3 (Chunk)
  • Redis(Cache)

如果没有以上依赖的同学可能Dashboard里面部分存在无数据

Loki部署部分可以参考我的demo,里面有loki集群的部署和依赖服务的配置

https://github.com/CloudXiaobai/loki-cluster-deploy

使用方法

小白已将Dashboard上传到Grafana Lab,访问如下链接就能找到

https://grafana.com/grafana/dashboards/13407

总结

当在绘制这个Dashboard时,小白发现Loki的监控指标远比我想象的要多和细,因为Loki中代码很多直接是从Cortex中移植过来的,所以它的Metrics也分成了好几个部分:

  • loki_*开头的主要是Loki组件和LogQL查询相关的性能指标
  • cortex_*开头的主要是Loki组件状态,集群状态相关的指标
  • prometheus-/*开头的主要是Alert事件通知相关指标

仍然还有大量非上述开头的指标,小白还没完全在Dashboard中绘制出来

总之,以Loki为首的云原生日志架构开始日趋完善,还是值得大家体验。


微信关注公众号「云原生小白」,回复【入群】进入Loki学习群

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容