利用grafana+influxdb+prometheus搭建监控系统

监控系统

  • 数据可视化:Grafana

  • 数据存储:InfluxDB/Prometheus

  • 数据采集:Telegraf/NodeExporter

Grafana

Grafana官方提供了很多dashboard,可以用来呈现操作系统、数据库、应用程序的运行状态。

我选择了以下几个dashboard:

这里选择的系统dashboard和数据库dashboard采用了InfluxDB作为数据源,InfluxDB一般通过Telegraf采集数据。

Java应用dashboard采用了Prometheus作为数据源,Prometheus一般通过NodeExporter采集数据,对于Java应用,可以借助micrometer采集数据。

参考资料:

Grafana安装:

https://grafana.com/docs/grafana/latest/installation/rpm/#install-manually-with-yum

Grafana基本操作,包括创建数据源、创建dashboard等。

https://grafana.com/tutorials/grafana-fundamentals/#1

InfluxDB

InfluxDB概念

概念 数据库 记录 数据保留多久,保留多少份 索引字段 普通字段 记录的时间戳
InfluxDB database measurement point retention policy tag field timestamp
MySQL database table row indexed column column

参考资料:

https://docs.influxdata.com/influxdb/v1.8/concepts/key_concepts/

Sample Data

  • 创建数据库
    CREATE DATABASE NOAA_water_database
  • 下载并写入数据
    curl https://s3.amazonaws.com/noaa.water-database/NOAA_data.txt -o NOAA_data.txt
    influx -import -path=NOAA_data.txt -precision=s -database=NOAA_water_database
  • 测试查询
   > SHOW measurements
    name: measurements
    ------------------
    name
    average_temperature
    h2o_feet
    h2o_pH
    h2o_quality
    h2o_temperature
    ​
    > SELECT COUNT("water_level") FROM h2o_feet
    name: h2o_feet
    --------------
    time                        count
    1970-01-01T00:00:00Z  15258
    ​
    > SELECT * FROM h2o_feet LIMIT 2
    name: h2o_feet
    --------------
    time                    level description       location        water_level
    2015-08-18T00:00:00Z    below 3 feet               santa_monica    2.064
    2015-08-18T00:00:00Z    between 6 and 9 feet       coyote_creek    8.12

参考资料:

https://docs.influxdata.com/influxdb/v1.8/query_language/sample-data/

Explore Schema

  • SHOW DATABASES

  • SHOW MEASUREMENTS

  • SHOW TAG KEYS

  • SHOW FIELD KEYS

参考资料:

https://docs.influxdata.com/influxdb/v1.8/query_language/explore-schema/

Explore Data

  • The SELECT statement
    SELECT <field_key>[,<field_key>,<tag_key>] FROM <measurement_name>[,<measurement_name>]
  • The WHERE clause
    SELECT_clause FROM_clause WHERE <conditional_expression> [(AND|OR) <conditional_expression> [...]]
  • The GROUP By clause
    SELECT_clause FROM_clause [WHERE_clause] GROUP BY [* | <tag_key>[,<tag_key]]
  • ORDER BY time DESC

  • The LIMIT and SLIMIT clauses

参考资料:

https://docs.influxdata.com/influxdb/v1.8/query_language/explore-data/

Functions

  • 聚合(Aggregations)

  • 选择(Selectors)

  • 转换(Transformations)

参考资料:

https://docs.influxdata.com/influxdb/v1.8/query_language/functions/

Telegraf

telegraf用于采集数据,输出到influxdb中。

telegraf支持采集系统和数据库的指标数据,只需要在/etc/telegraf/telegraf.conf做简单的配置。

telegraf在写入数据时,会为每一条数据加上一个tag[host],用来区分是哪个应用上报的数据。host的值可以在telegraf.conf中配置,也可以修改linux hostname。

### OUTPUT
​
# Configuration for influxdb server to send metrics to
[[outputs.influxdb]]
 urls = ["http://localhost:8089"]
 database = "telegraf_metrics"
​
 ## Retention policy to write to. Empty string writes to the default rp.
 retention_policy = ""
 ## Write consistency (clusters only), can be: "any", "one", "quorum", "all"
 write_consistency = "any"
​
 ## Write timeout (for the InfluxDB client), formatted as a string.
 ## If not provided, will default to 5s. 0s means no timeout (not recommended).
 timeout = "5s"
​
# Read metrics about cpu usage
[[inputs.cpu]]
 ## Whether to report per-cpu stats or not
 percpu = true
 ## Whether to report total system cpu stats or not
 totalcpu = true
 ## Comment this line if you want the raw CPU time metrics
 fielddrop = ["time_*"]
​
​
# Read metrics about disk usage by mount point
[[inputs.disk]]
 ## By default, telegraf gather stats for all mountpoints.
 ## Setting mountpoints will restrict the stats to the specified mountpoints.
 # mount_points = ["/"]
​
 ## Ignore some mountpoints by filesystem type. For example (dev)tmpfs (usually
 ## present on /run, /var/run, /dev/shm or /dev).
 ignore_fs = ["tmpfs", "devtmpfs"]
​
​
# Read metrics about disk IO by device
[[inputs.diskio]]
 ## By default, telegraf will gather stats for all devices including
 ## disk partitions.
 ## Setting devices will restrict the stats to the specified devices.
 # devices = ["sda", "sdb"]
 ## Uncomment the following line if you need disk serial numbers.
 # skip_serial_number = false
​
​
# Get kernel statistics from /proc/stat
[[inputs.kernel]]
 # no configuration
​
​
# Read metrics about memory usage
[[inputs.mem]]
 # no configuration
​
​
# Get the number of processes and group them by status
[[inputs.processes]]
 # no configuration
​
​
# Read metrics about swap memory usage
[[inputs.swap]]
 # no configuration
​
​
# Read metrics about system load & uptime
[[inputs.system]]
 # no configuration
​
# Read metrics about network interface usage
[[inputs.net]]
 # collect data only about specific interfaces
 # interfaces = ["eth0"]
​
[[inputs.netstat]]
 # no configuration

[[inputs.mysql]]
 server = ["root:root@tcp(127.0.0.1:3306)/"]

Prometheus

架构

prometheus_architecture.png

概念

概念 数据库 记录 数据保留多久,保留多少份 索引字段 普通字段 记录的时间戳
Prometheus - metric time series - - label timestamp
InfluxDB database measurement point retention policy tag field timestamp
MySQL database table row indexed column column

Prometheus和InfluxDB差异:

  • Prometheus metric的一条记录由多个label加一个value构成,metric类型包括Counter、Gauge、Histogram、Summary,InfluxDB measurement并没有区分这些类型。

  • Prometheus通过pull的方式拉取数据,InfluxDB通过push的方式推送数据。

  • Prometheus的一条记录一般只有一个value,同样是记录cpu的指标数据,InfluxDB measurement会包含3个field[usage_idle, usage_system, usage_user],1条记录[97, 2, 1],Prometheus table会包含1个label[mode],3条记录['idle', 97], ['system', 2], ['user', 1]。

参考资料:

https://prometheus.io/docs/concepts/metric_types/

查询数据

Prometheus通过网页查询数据,默认地址是http://your_host:9090

${Prometheus_home}/prometheus.yml文件可以添加需要拉取数据的实例(instance),通过Metric Up 可以查看所有实例的工作状态。

参考资料:

https://prometheus.io/docs/prometheus/latest/querying/examples/

Micrometer

micrometer用于采集java应用的指标数据,可以适配多数主流的监控系统,比如Prometheus、InfluxDB。有点像SLF4J,适配很多日志系统,而micrometer面向的是应用的Metrics。

使用Spring为Prometheus提供指标数据:

@Controller
@RequestMapping(value = "/prometheus")
public class PrometheusController {
​
   @Getter
   private PrometheusMeterRegistry registry;
​
   @PostConstruct
   private void init() {
     PrometheusConfig config = k -> {
       return null;
     };
     this.registry = new PrometheusMeterRegistry(config);
     this.registry.config().commonTags("application", "myAppName");
     new ClassLoaderMetrics().bindTo(this.registry);
     new JvmMemoryMetrics().bindTo(this.registry);
     new JvmGcMetrics().bindTo(this.registry);
     new ProcessorMetrics().bindTo(this.registry);
     new JvmThreadMetrics().bindTo(this.registry);
   }
​
   @RequestMapping(method = { RequestMethod.Get, RequestMethod.POST})
   public void index(HttpServletRequest req, HttpServletResponse resp) {
     resp.getWriter().write(registry.scrape());
     resp.getWriter().flush();
   }
}

参考资料:

https://micrometer.io/docs

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,313评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,369评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,916评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,333评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,425评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,481评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,491评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,268评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,719评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,004评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,179评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,832评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,510评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,153评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,402评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,045评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,071评论 2 352