第十周

一.基于Operator和二进制安装prometheus环境

基于Operator安装prometheus环境

1.下载项目文件，创建基础环境
[root@deploy-1 ~]#  wget https://github.com/prometheus-operator/kube-prometheus/archive/refs/tags/v0.12.0.tar.gz

[root@deploy-1 ~]# tar -xf kube-prometheus-0.12.0.tar.gz

[root@deploy-1 manifests]# cd kube-prometheus-0.12.0/manifests/

[root@deploy-1 manifests]# kubectl create -f setup/      #使用apply创建会提示注解太长

2.查看对应yaml文件所需镜像
[root@deploy-1 manifests]# grep -R 'image: ' ./*
./alertmanager-alertmanager.yaml:  image: quay.io/prometheus/alertmanager:v0.25.0
./blackboxExporter-deployment.yaml:        image: quay.io/prometheus/blackbox-exporter:v0.23.0
./blackboxExporter-deployment.yaml:        image: jimmidyson/configmap-reload:v0.5.0
./blackboxExporter-deployment.yaml:        image: quay.io/brancz/kube-rbac-proxy:v0.14.0
./grafana-deployment.yaml:        image: grafana/grafana:9.3.2
./kubeStateMetrics-deployment.yaml:        image: registry.k8s.io/kube-state-metrics/kube-state-metrics:v2.7.0
./kubeStateMetrics-deployment.yaml:        image: quay.io/brancz/kube-rbac-proxy:v0.14.0
./kubeStateMetrics-deployment.yaml:        image: quay.io/brancz/kube-rbac-proxy:v0.14.0
./nodeExporter-daemonset.yaml:        image: quay.io/prometheus/node-exporter:v1.5.0
./nodeExporter-daemonset.yaml:        image: quay.io/brancz/kube-rbac-proxy:v0.14.0
./prometheusAdapter-deployment.yaml:        image: registry.k8s.io/prometheus-adapter/prometheus-adapter:v0.10.0
./prometheusOperator-deployment.yaml:        image: quay.io/prometheus-operator/prometheus-operator:v0.62.0
./prometheusOperator-deployment.yaml:        image: quay.io/brancz/kube-rbac-proxy:v0.14.0
./prometheus-prometheus.yaml:  image: quay.io/prometheus/prometheus:v2.41.0

3.下载镜像
[root@deploy-1 ~]# docker pull bitnami/kube-state-metrics:2.7.0

[root@deploy-1 ~]# docker pull v5cn/prometheus-adapter:v0.10.0

4.上传镜像至本地harbor仓库

[root@deploy-1 ~]# docker tag bitnami/kube-state-metrics:2.7.0   qj.harbor.com/baseimages/kube-state-metrics:v2.7.0

[root@deploy-1 ~]# docker tag v5cn/prometheus-adapter:v0.10.0 qj.harbor.com/baseimages/prometheus-adapter:v0.10.0

[root@deploy-1 ~]# docker push qj.harbor.com/baseimages/kube-state-metrics:v2.7.0

root@deploy-1 ~]# docker push  qj.harbor.com/baseimages/prometheus-adapter:v0.10.0

5.修改yaml文件镜像名称
[root@prometheus manifests]# vim ./kubeStateMetrics-deployment.yaml
image: qj.harbor.com/baseimages/kube-state-metrics:v2.7.0

[root@prometheus manifests]# vim ./prometheusAdapter-deployment.yaml
image: qj.harbor.com/baseimages/prometheus-adapter:v0.10.0

6.执行创建
[root@deploy-1 manifests]# kubectl apply -f .

[root@deploy-1 manifests]# kubectl get pod -n monitoring 
NAME                                   READY   STATUS    RESTARTS      AGE
alertmanager-main-0                    2/2     Running   1 (18m ago)   19m
alertmanager-main-1                    2/2     Running   1 (18m ago)   19m
alertmanager-main-2                    2/2     Running   1 (18m ago)   19m
blackbox-exporter-6fd586b445-wggkv     3/3     Running   0             20m
grafana-9f58f8675-hsrjm                1/1     Running   0             20m
kube-state-metrics-75586f4d76-dccd8    3/3     Running   0             20m
node-exporter-8jz2n                    2/2     Running   0             20m
node-exporter-d8d4j                    2/2     Running   0             20m
node-exporter-pkgdc                    2/2     Running   0             20m
node-exporter-qcb66                    2/2     Running   0             20m
node-exporter-r9hgm                    2/2     Running   0             20m
node-exporter-v5m8w                    2/2     Running   0             20m
prometheus-adapter-89c46bf6c-jqz8j     1/1     Running   0             20m
prometheus-adapter-89c46bf6c-t5wt8     1/1     Running   0             20m
prometheus-k8s-0                       2/2     Running   0             19m
prometheus-k8s-1                       2/2     Running   0             19m
prometheus-operator-776c6c6b87-f6k8t   2/2     Running   0             20m

[root@deploy-1 manifests]# kubectl get svc -n monitoring 
NAME                    TYPE        CLUSTER-IP       EXTERNAL-IP   PORT(S)                         AGE
alertmanager-main       ClusterIP   10.100.251.166   <none>        9093/TCP,8080/TCP               21m
alertmanager-operated   ClusterIP   None             <none>        9093/TCP,9094/TCP,9094/UDP      19m
blackbox-exporter       ClusterIP   10.100.253.34    <none>        9115/TCP,19115/TCP              21m
grafana                 NodePort    10.100.253.167   <none>        3000:33000/TCP                  21m
kube-state-metrics      ClusterIP   None             <none>        8443/TCP,9443/TCP               21m
node-exporter           ClusterIP   None             <none>        9100/TCP                        21m
prometheus-adapter      ClusterIP   10.100.96.127    <none>        443/TCP                         21m
prometheus-k8s          NodePort    10.100.26.134    <none>        9090/TCP,8080/TCP   21m
prometheus-operated     ClusterIP   None             <none>        9090/TCP                        19m
prometheus-operator     ClusterIP   None             <none>        8443/TCP                        21m

7.验证Prometheus  grafana Web页面
#客户端浏览器访问，需将yaml文件中service type更改为NodePort
[root@deploy-1 manifests]# cat prometheus-service.yaml  
apiVersion: v1
kind: Service
metadata:
  labels:
    app.kubernetes.io/component: prometheus
    app.kubernetes.io/instance: k8s
    app.kubernetes.io/name: prometheus
    app.kubernetes.io/part-of: kube-prometheus
    app.kubernetes.io/version: 2.41.0
  name: prometheus-k8s
  namespace: monitoring
spec:
  type: NodePort
  ports:
  - name: web
    port: 9090
    targetPort: web
    nodePort: 39090
  - name: reloader-web
    port: 8080
    targetPort: reloader-web
    nodePort: 38080 
  selector:
    app.kubernetes.io/component: prometheus
    app.kubernetes.io/instance: k8s
    app.kubernetes.io/name: prometheus
    app.kubernetes.io/part-of: kube-prometheus
  sessionAffinity: ClientIP

[root@deploy-1 manifests]# cat grafana-service.yaml 
apiVersion: v1
kind: Service
metadata:
  labels:
    app.kubernetes.io/component: grafana
    app.kubernetes.io/name: grafana
    app.kubernetes.io/part-of: kube-prometheus
    app.kubernetes.io/version: 9.3.2
  name: grafana
  namespace: monitoring
spec:
  type: NodePort
  ports:
  - name: http
    port: 3000
    targetPort: http
    nodePort: 33000
  selector:
    app.kubernetes.io/component: grafana
    app.kubernetes.io/name: grafana
    app.kubernetes.io/part-of: kube-prometheus

#默认已设置相关网络策略，可先删除相关策略，后续可根据实际需求进行修改调整
[root@k8s-deploy manifests]#for i in `ls |grep network`;do kubectl delete -f $i;done
networkpolicy.networking.k8s.io "alertmanager-main" deleted
networkpolicy.networking.k8s.io "blackbox-exporter" deleted
networkpolicy.networking.k8s.io "grafana" deleted
networkpolicy.networking.k8s.io "kube-state-metrics" deleted
networkpolicy.networking.k8s.io "node-exporter" deleted
networkpolicy.networking.k8s.io "prometheus-k8s" deleted
networkpolicy.networking.k8s.io "prometheus-adapter" deleted
networkpolicy.networking.k8s.io "prometheus-operator" deleted

image.png

基于二进制安装prometheus环境

[root@prometheus ~]# wget   https://github.com/prometheus/prometheus/releases/download/v2.37.0/prometheus-2.37.0.linux-amd64.tar.gz

[root@prometheus ~]# tar -xf   prometheus-2.37.0.linux-amd64.tar.gz

[root@prometheus ~]# mv   prometheus-2.37.0   /usr/local/prometheus

[root@prometheus ~]# vim /etc/systemd/system/prometheus.service   #添加服务自启动
[Unit]
Description=Prometheus Server
Documentation=https://prometheus.io/docs/introduction/overview/
After=network.target
[Service]
Restart=on-failure
WorkingDirectory=/usr/local/prometheus/
ExecStart=/usr/local/prometheus/prometheus --config.file=/usr/local/prometheus/prometheus.yml

[Install]
WantedBy=multi-user.target

[root@prometheus ~]# systemctl daemon-reload

[root@prometheus ~]# systemctl start  prometheus

[root@prometheus ~]# systemctl enable prometheus

二.通过node-exporter和cadvisor收集指标数据

node-exporter

1.所有node节点二进制安装node-exporter
cd /usr/local/src

wgethttps://github.com/prometheus/node_exporter/releases/download/v1.5.0/node_exporter-1.5.0.linux-amd64.tar.gz

tar -xf node_exporter-1.5.0.linux-amd64.tar.gz

mv  node_exporter-1.5.0.linux-amd64.tar.gz /usr/local/node_exporter

vim /etc/systemd/system/node-exporter.service        
[Unit]
Description=Prometheus Node Exporter
After=network.target

[Service]
ExecStart=/usr/local/node_exporter/node_exporter

[Install]
WantedBy=multi-user.target

systemctl  daemon-reload

systemctl start node_exporter.service

systemctl  enable node_exporter.service

2.prometheus server添加采集node节点数据配置
[root@prometheus ~]# vim /usr/local/prometheus/prometheus.yml 
 - job_name: "ks-node"
    static_configs:
      - targets: ["10.10.20.12:9110","10.10.20.14:9110","10.10.20.15:9110"]

[root@prometheus ~]# systemctl  restart  prometheus

image.png

cadvisor

1.下载cadvisor镜像
[root@deploy-1 ~]# docker pull registry.cn-hangzhou.aliyuncs.com/zhangshijie/cadvisor-amd64:v0.39.3

[root@deploy-1 ~]# docker tag registry.cn-hangzhou.aliyuncs.com/zhangshijie/cadvisor-amd64:v0.39.3 qj.harbor.com/baseimages/cadvisor-amd64:v0.39.3

[root@deploy-1 ~]# docker push qj.harbor.com/baseimages/cadvisor-amd64:v0.39.3

2. 编写yaml文件
[root@deploy-1 case]#  vim case1-daemonset-deploy-cadvisor.yaml
apiVersion: apps/v1
kind: DaemonSet
metadata:
  name: cadvisor
  namespace: monitoring
spec:
  selector:
    matchLabels:
      app: cAdvisor
  template:
    metadata:
      labels:
        app: cAdvisor
    spec:
      tolerations:    #污点容忍,忽略master的NoSchedule
        - effect: NoSchedule
          key: node-role.kubernetes.io/master
      hostNetwork: true
      restartPolicy: Always   # 重启策略
      containers:
      - name: cadvisor
        image: qj.harbor.com/baseimages/cadvisor-amd64:v0.39.3 
        imagePullPolicy: Always     # 镜像策略
        ports:
        - containerPort: 8080
        volumeMounts:
          - name: root
            mountPath: /rootfs
          - name: run
            mountPath: /var/run
          - name: sys
            mountPath: /sys
          - name: docker
            mountPath: /var/lib/containerd
      volumes:
      - name: root
        hostPath:
          path: /
      - name: run
        hostPath:
          path: /var/run
      - name: sys
        hostPath:
          path: /sys
      - name: docker
        hostPath:
          path: /var/lib/containerd # containerd默认数据目录，docker默认数据目录为/var/lib/docker

3.执行创建
kubectl create ns monitoring

kubectl apply -f case1-daemonset-deploy-cadvisor.yaml

[root@deploy-1 case]# kubectl get pod -n monitoring 
NAME             READY   STATUS    RESTARTS   AGE
cadvisor-42jvm   1/1     Running   0          22m
cadvisor-9dlw5   1/1     Running   0          22m
cadvisor-h78sv   1/1     Running   0          22m
cadvisor-pq7ct   1/1     Running   0          22m
cadvisor-r9l8k   1/1     Running   0          22m
cadvisor-xwvkf   1/1     Running   0          22m

4.prometheus server添加采集cadvisor数据配置
[root@prometheus ~]# vim /usr/local/prometheus/prometheus.yml 
 - job_name: "ks-cadvisor"
    static_configs:
      - targets: ["10.10.20.12:8080","10.10.20.14:8080","10.10.20.15:8080","10.10.20.17:8080","10.10.20.19:8080","10.10.20.6:8080"]

[root@prometheus ~]# systemctl  restart  prometheus

image.png

三.通过grafana展示prometheus的node和pod数据

安装grafana

[root@prometheus src]# rpm -ivh grafana-8.4.6-1.x86_64.rpm

[root@prometheus src]# vim /etc/grafana/grafana.ini
[server]
protocol = http
http_addr = 0.0.0.0
http_port = 3000

[root@prometheus src]# systemctl  restart  grafana-server.service

添加数据源

image.png
导入模版

image.png

image.png

pod数据展示

image.png

-node数据展示

image.png

四.梳理prometheus服务发现

服务发现机制
prometheus默认是采用pull方式拉取监控数据的，也就是定时去目标主机上抓取metrics数据，每一个被抓取的目标需要暴露一个HTTP接口，prometheus通过这个暴露的接口就可以获取到相应的指标数据，这种方式需要由目标服务决定采集的目标有哪些，通过配置在scarpe_confis中的各种job来实现，无法动态感知新服务，如果后面增加了节点或组件信息，就得手动修改prometheus配置，并重启prometheus，很不方便，所以出现了动态服务发现，动态服务发现能够自动发现集群中的新端点，并加入到配置中，通过服务发现，prometheus能查询到需要监控的target列表，然后轮询这些target获取监控数据。
标签重写（relabeling）
prometheus的relabeling能够在抓取到目标实例之前把目标实例的元数据标签动态重新修改，动态添加或者覆盖标签。
prometheus从kubernetes API动态发现target之后，在被发现的target实例中，都包含一些原始的Metadata标签信息，默认标签有：
address: 以<host>:<port>格式显示targets地址
scheme: 采集的目标服务地址的scheme形式，HTTP或HTTPS
metrics_path:采集的目标服务访问路径

image.png
重写目的
为了更好的识别监控指标，便于后期调用数据绘图、告警等需求，prometheus支持对发现的目标进行label修改，在两个阶段可以重新标记：

image.png
relabel_configs
在对target进行数据采集之前（例如在采集数据之前重新定义标签信息，如目的IP、目的端口等信息），可以使用relabel_configs添加、修改或修改一些标签，也可以只采集特定目标或过滤目标。
metric_relabel_configs
在对target进行数据采集之后，即如果是已抓取到指标数据时，可以使用metric_relabel_configs做最后的重新标记和过滤
label
source_label：源标签，没有经过relabel处理之前标签的名称
target_label：通过action处理之后新的标签名称
regex：给定的值或正则表达式匹配，匹配源标签的值
replacement：通过分组替换后标签（target_label）对应的/()/() $1:$ 2
action
replace：替换标签值，根据regex正则匹配到源标签的值，使用replacement来引用表达式匹配的分组
keep：满足regex正则条件的实例进行采集，把source_labels中没有匹配到regex正则内容的target实例丢掉，即只采集匹配成功的实例
drop：满足regex正则条件的实例不采集，把source_labels中匹配到的regex正则内容的target实例丢掉，即只采集没有匹配成功的实例
hashmod：使用hashmod计算source_labels的Hash值并进行对比，基于自定义的模数取模，以实现对目标进行分类、重新赋值等功能

scrape_configs:
  - job_name: ip_job
    relabel_configs:
    - source_labels: [__address__]
      modulus: 4
      target_label: __ip_hash
      action: hashmod
    - source_labels: [__ip_hash]
      regex: ^1$
      action: keep

labelmap：匹配regex所有标签名称，然后复制匹配标签的值进行分组，可以通过replacement分组引用（ ${1},$ {2},...）替代
labelkeep：匹配regex所有标签名称，其他不匹配的标签都将从标签集中删除
labeldrop：匹配regex所有标签名称，其他匹配的标签都将从标签集中删除

服务发现类型
1.静态服务发现：
静态服务发现，基于prometheus配置文件指定的监控目标，每当有一个新的目标实例需要监控，都需要手动修改配置文件，配置目标target

scrape_configs:
  - job_name: "staic_test"  # job名称
    # metrics_path: "/metrics"  # 默认URI
    # scheme: http      # 默认协议
    static_configs:     # 静态服务配置
      - targets: ["10.0.0.11:8080","10.0.0.12:8080","10.0.0.13:8080"]   # 目标端点地址

2.基于文件的服务发现:

scrape_configs:
  # 基于文件服务发现监控配置
  - job_name: 'file_sd_test'
    scrape_interval: 10s    # 数据采集间隔时间
    file_sd_configs:
    - files:            # 支持yaml和json格式文件
       - /data/prometheus/static_conf/*.yml
       refresh_interval: 10s    # 重新读取文件的刷新时间

DNS服务发现
基于DNS的服务发现允许配置指定一组的DNS域名，这些域名会定期查询以发现目标列表，域名需要可以被配置的DNS服务器解析为IP。
此服务发现方式仅支持基本的DNS A、AAAA和SRV记录查询。

A记录：        域名解析为一个IPv4地址
AAAA记录: 域名解析为一个IPv6地址
SRV：    SRV记录了哪台计算机提供了具体哪个服务，格式为：服务名称.协议类型.域名(如:_example-server._tcp.www.mydns.com)

scrape_configs:
  - job_name: 'dns_sd_test'
    scrape_interval: 10s    # 数据采集间隔时间
    dns_sd_configs:
    - name: ["node1.example.com","node2.example.com"]   # 域名
      type: A
      port: 9100

4.Consul服务发现
consul基于golang开发的开源工具，主要面向分布式，服务化的系统提供服务注册、服务发现和配置管理的功能，提供服务发现/注册、健康检查和保持一致性等功能。
Consul是一个分布式k/v数据库，常用于服务的服务注册和发现。基于consul服务动态发现监控目标，prometheus一直监控consul服务，当发现在consul中注册的服务有变化，prometheus就会自动监控到所有注册到consul中目标资源。

scrape_configs:
  - job_name: 'consul_sd_test'
    honor_labels: true
    metrics_path: "/metrics"
    scheme: http
    consul_sd_configs:
    - server: 10.0.0.11:8500
      services: []      # 发现的目标服务名称，空为所有服务
    - server: 10.0.0.12:8500
      services: []

参数说明：

honor_labels ：控制prometheus如何处理已经存在于已抓取数据中的标签与prometheus将附加服务器端的标签之间的冲突（"job"和"instance"标签，手动配置的目标标签已经服务发现实现生成的标签）。

如果honor_labels设置为“true”，则保留已抓取数据的标签值并忽略冲突的prometheus服务器端标签来解决标签冲突；另外如果被采集端有标签但是值为空，则使用prometheus本地标签值；如果被采集端没有此标签，但是prometheus配置了，那使用prometheus配置的标签值。

如果honor_labels设置为“false”，则通过将已抓取数据中的冲突标签重命名为exported_<original-label>（如expoeterd_instance，exporterd_job）然后附加服务器端标签来解决标签冲突。

5.基于kubernetes API实现服务发现
基于kubernetes API实现服务发现，prometheus与kubernetes的API进行交互，动态的发现kubernetes中部署的所有可监控的目标资源。

在Kubernetes中，Prometheus 通过与 Kubernetes API 集成主要支持5种服务发现模式：Node、Service、Pod、Endpoints、Ingress。不同的服务发现模式适用于不同的场景，例如：node适用于与主机相关的监控资源，如节点中运行的Kubernetes 组件状态、节点上运行的容器状态等；service 和 ingress 适用于通过黑盒监控的场景，如对服务的可用性以及服务质量的监控；endpoints 和 pod 均可用于获取 Pod 实例的监控数据，如监控用户或者管理员部署的支持 Prometheus 的应用。

scrape_configs:
  - job_name: "kubernetes_sd_test"
    scheme: http
    kubernetes_sd_configs: 
      - role: node

五.在prometheus实现kubernetes-apiserver及coredns服务发现

目标发现模式：

1.node：node角色可以发现集群中每个node节点的地址端口，默认为Kubelet的HTTP端口。目标地址默认为Kubernetes节点对象的第一个现有地址，地址类型顺序为NodeInternalIP、NodeExternalIP、NodeLegacyHostIP和NodeHostName。
作用：监控K8S的node节点的服务器相关的指标数据。

2.service
service角色可以发现每个service的ip和port,将其作为target。这对于黑盒监控(blackbox)很有用。
即：一个Service访问到哪个pod，就把哪个pod的数据传上来。使用的场景很少。只是看Service对应业务是否健康的时候可以使用。

3.pod
pod角色可以发现所有pod并将其中的pod ip作为target。如果有多个端口或者多个容器，将生成多个target(例如:80,443这两个端口,pod ip为10.0.244.22,则将10.0.244.22:80,10.0.244.22:443分别作为抓取的target)。
如果容器没有指定的端口，则会为每个容器创建一个无端口target，以便通过relabel手动添加端口。

4.Endpoints
endpoints角色可以从ep（endpoints）列表中发现所有targets

5.Ingress
ingress角色发现ingress的每个路径的target。这通常对黑盒监控很有用。该地址将设置为ingress中指定的host。

apiserver服务发现

[root@deploy-1 case]# kubectl get svc 
NAME         TYPE        CLUSTER-IP   EXTERNAL-IP   PORT(S)   AGE
kubernetes   ClusterIP   10.100.0.1   <none>        443/TCP   21d

[root@deploy-1 case]# kubectl get ep
NAME         ENDPOINTS                                           AGE
kubernetes   10.10.20.17:6443,10.10.20.19:6443,10.10.20.6:6443   21d

[root@deploy-1 case]# cat case3-1-prometheus-cfg.yaml
---
kind: ConfigMap
apiVersion: v1
metadata:
  labels:
    app: prometheus
  name: prometheus-config
  namespace: monitoring 
data:
  prometheus.yml: |
    global:
      scrape_interval: 15s
      scrape_timeout: 10s
      evaluation_interval: 1m
    scrape_configs:
    - job_name: 'kubernetes-node'
      kubernetes_sd_configs:
      - role: node
      relabel_configs:
      - source_labels: [__address__]
        regex: '(.*):10250'
        replacement: '${1}:9100'
        target_label: __address__
        action: replace
      - action: labelmap
        regex: __meta_kubernetes_node_label_(.+)
    - job_name: 'kubernetes-node-cadvisor'
      kubernetes_sd_configs:
      - role:  node
      scheme: https
      tls_config:
        ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
      bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
      relabel_configs:
      - action: labelmap
        regex: __meta_kubernetes_node_label_(.+)
      - target_label: __address__
        replacement: kubernetes.default.svc:443
      - source_labels: [__meta_kubernetes_node_name]
        regex: (.+)
        target_label: __metrics_path__
        replacement: /api/v1/nodes/${1}/proxy/metrics/cadvisor
    - job_name: 'kubernetes-apiserver'
      kubernetes_sd_configs:
      - role: endpoints
      scheme: https
      tls_config:
        ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
      bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
      relabel_configs:
      - source_labels: [__meta_kubernetes_namespace, __meta_kubernetes_service_name, __meta_kubernetes_endpoint_port_name]
        action: keep
        regex: default;kubernetes;https
    - job_name: 'kubernetes-service-endpoints'
      kubernetes_sd_configs:
      - role: endpoints
      relabel_configs:
      - source_labels: [__meta_kubernetes_service_annotation_prometheus_io_scrape]
        action: keep
        regex: true
      - source_labels: [__meta_kubernetes_service_annotation_prometheus_io_scheme]
        action: replace
        target_label: __scheme__
        regex: (https?)
      - source_labels: [__meta_kubernetes_service_annotation_prometheus_io_path]
        action: replace
        target_label: __metrics_path__
        regex: (.+)
      - source_labels: [__address__, __meta_kubernetes_service_annotation_prometheus_io_port]
        action: replace
        target_label: __address__
        regex: ([^:]+)(?::\d+)?;(\d+)
        replacement: $1:$2
      - action: labelmap
        regex: __meta_kubernetes_service_label_(.+)
      - source_labels: [__meta_kubernetes_namespace]
        action: replace
        target_label: kubernetes_namespace
      - source_labels: [__meta_kubernetes_service_name]
        action: replace
        target_label: kubernetes_service_name

image.png

cdn服务发现

注意：在部署dns时，使用的yaml文件必须加上注解。否则可能无法收集数据
注解添加哪里，取决的发现方式的类型。使用什么类型发型，注解就加到那个类型中
annotations:
    prometheus.io/port: "9153"
    prometheus.io/scrape: "true"

#编写配置prometheus配置
- job_name: 'kubernetes-service-endpoints'
      kubernetes_sd_configs:
      - role: endpoints
      relabel_configs:
      - source_labels: [__meta_kubernetes_service_annotation_prometheus_io_scrape]
        action: keep
        regex: true
      - source_labels: [__meta_kubernetes_service_annotation_prometheus_io_scheme]
        action: replace
        target_label: __scheme__
        regex: (https?)
      - source_labels: [__meta_kubernetes_service_annotation_prometheus_io_path]
        action: replace
        target_label: __metrics_path__
        regex: (.+)
      - source_labels: [__address__, __meta_kubernetes_service_annotation_prometheus_io_port]
        action: replace
        target_label: __address__
        regex: ([^:]+)(?::\d+)?;(\d+)
        replacement: $1:$2
      - action: labelmap
        regex: __meta_kubernetes_service_label_(.+)
      - source_labels: [__meta_kubernetes_namespace]
        action: replace
        target_label: kubernetes_namespace
      - source_labels: [__meta_kubernetes_service_name]
        action: replace
        target_label: kubernetes_service_name

#查看core-dns状态
[root@deploy-1 coredns]# kubectl describe svc kube-dns -n kube-system
Name:              kube-dns
Namespace:         kube-system
Labels:            addonmanager.kubernetes.io/mode=Reconcile
                   k8s-app=kube-dns
                   kubernetes.io/cluster-service=true
                   kubernetes.io/name=CoreDNS
Annotations:       prometheus.io/port: 9153     # 注解标签，用于prometheus匹配发现端口
                   prometheus.io/scrape: true          # 注解标签，用于prometheus匹配抓取数据
Selector:          k8s-app=kube-dns
Type:              ClusterIP
IP Family Policy:  SingleStack
IP Families:       IPv4
IP:                10.100.0.2
IPs:               10.100.0.2
Port:              dns  53/UDP
TargetPort:        53/UDP
Endpoints:         10.200.31.193:53,10.200.35.129:53
Port:              dns-tcp  53/TCP
TargetPort:        53/TCP
Endpoints:         10.200.31.193:53,10.200.35.129:53
Port:              metrics  9153/TCP
TargetPort:        9153/TCP
Endpoints:         10.200.31.193:9153,10.200.35.129:9153
Session Affinity:  None
Events:            <none>

image.png

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 218,451评论 6赞 506
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,172评论 3赞 394
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 164,782评论 0赞 354
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,709评论 1赞 294
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,733评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,578评论 1赞 305
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,320评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,241评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,686评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,878评论 3赞 336
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,992评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,715评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,336评论 3赞 330
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,912评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,040评论 1赞 270
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,173评论 3赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,947评论 2赞 355

第十周

一.基于Operator和二进制安装prometheus环境

二.通过node-exporter和cadvisor收集指标数据

三.通过grafana展示prometheus的node和pod数据

四.梳理prometheus服务发现

五.在prometheus实现kubernetes-apiserver及coredns服务发现

推荐阅读更多精彩内容