Überwachung des Kubernetes-Clusters: Überblick und Einführung in Prometheus

Betrachten wir das Konzept der Überwachung von Kubernetes, machen Sie sich mit dem Prometheus-Tool vertraut und sprechen Sie über Warnungen.



Das Überwachungsthema ist umfangreich und kann nicht in einem Artikel zerlegt werden. Der Zweck dieses Textes ist es, einen Überblick über die Werkzeuge, Konzepte und Ansätze zu geben.



Das Material des Artikels ist ein Auszug aus einer offenen Vorlesung der Slurm-Schule . Wenn Sie die vollständige Schulung abschließen möchten, melden Sie sich für den Kurs zur Überwachung und Protokollierung der Infrastruktur in Kubernetes an .





Was wird in einem Kubernetes-Cluster überwacht?





Physische Server. Wenn ein Kubernetes-Cluster auf seinen Servern bereitgestellt wird, müssen Sie dessen Zustand überwachen. Diese Aufgabe wird von Zabbix übernommen. Wenn Sie mit ihm arbeiten, müssen Sie sich nicht weigern, es wird keine Konflikte geben. Es ist Zabbix, das den Status unserer Server überwacht.



Fahren wir mit der Überwachung auf Clusterebene fort.



Steuerebenenkomponenten: API, Scheduler und andere. Zumindest müssen Sie überwachen, ob die API von Servern oder etcd größer als 0 ist. Etcd kann viele Metriken angeben: auf den Festplatten, auf denen es sich dreht, auf den Zustand seines Clusters etcd und anderer.



Docker : . Docker, , , .



DNS. DNS, Discovery, . , , DNS . CoreDNS.



Ingress. ( Ingress Controller) .



— , .



, , , . : , ; 10, 2. . . , : -? , , — . .



, -: , .



Prometheus



Prometheus. , Prometheus . , « Kubernetes», Prometheus.



, Prometheus: Helm Prometheus Prometheus Operator.



  1. Prometheus. , ConfigMap — , , , .
  2. Prometheus Operator , , : , , .


, Prometheus. , : , . Prometheus Operator , .



Prometheus Kubernetes: API Server .



Prometheus , . , Prometheus , , . . , PostgreSQL Exporter: PostgreSQL Prometheus, Prometheus .



Prometheus





Prometheus Server — , Prometheus. .



time series database (TSDB). TSDB — , Go, Prometheus. , .



TSDB



Prometheus . 15 . , : TSDB , . Prometheus .



, , . TSDB « », . , , InfluxDB, ClickHouse . ClickHouse.

Prometheus Server pull: , . : « API Server», n- .



(job cron job), , Pushgateway. : job , , Pushgateway . Prometheus Pushgateway.



Prometheus — Alertmanager. — alerting rules. , alert , API 0. , alert alert manager . alert manager : - , , . Slack, Telegram, email .



- Prometheus — Discovering. Prometheus , . « IP-, — », , (targets — ). Prometheus , , , .



Kubernetes, : 10 , 3. IP- , , — Discovering .



Prometheus PromQL. , .



https://prometheus.io/docs/prometheus/latest/querying/basics/

 

    container_memory_usage_bytes

 

    container_memory_usage_bytes / 1024 / 1024

 

    sum(container_memory_usage_bytes) / 1024 / 1024

 

    100 - avg by (instance) (rate(node_cpu_seconds_total{mode="idle"}[5m]) * 100)


- Prometheus



Prometheus , -. .





Expression PromQL.



Alerts — alerting rules, :



  1. inactive — , , ;
  2. pending — , , . , : , ;
  3. firing — , .


Status , Prometheus. (targets), .





Prometheus Kubernetes.



Grafana



- Prometheus , . , Prometheus Grafana. .





Prometheus Grafana , : GRAFANA SUPPORT FOR PROMETHEUS, .



: Grafana Loki .



: , Kubernetes, Southbridge, .




All Articles