Доступно в редакциях:  CE, BE, SE, SE+, EE, CSE Lite (1.67), CSE Pro (1.67)

Модуль monitoring-kubernetes обеспечивает прозрачный и своевременный контроль состояния всех узлов кластера и ключевых инфраструктурных компонентов.

Возможности модуля:

  • предоставляет возможность планировать ресурсы инфраструктуры (Capacity planning);
  • отслеживает версию container runtime (docker, containerd) на каждом узле и проверяет её на соответствие разрешенным версиям;
  • контролирует работоспособность самой подсистемы мониторинга кластера (Dead man’s switch);
  • снимает метрики о доступности файловых дескрипторов, сокетов, свободного места и inode на каждом узле;
  • следит за корректной работой ключевых компонентов мониторинга: kube-state-metrics, node-exporter, kube-dns;
  • проверяет состояние всех узлов (NotReady, drain, cordon) и своевременно сигнализирует о неполадках;
  • следит за синхронизацией времени и уведомляет об отклонениях;
  • выявляет случаи продолжительного превышения CPU steal (когда узел не получает нужного времени процессора);
  • контролирует состояние таблицы Conntrack на узлах;
  • показывает поды с некорректными статусами — например, если kubelet не справился со своей работой;
  • позволяет экспортировать метрики во внешние системы мониторинга для единой точки контроля.