Доступно в редакциях: CE, BE, SE, SE+, EE, CSE Lite (1.67), CSE Pro (1.67)
Модуль monitoring-kubernetes
обеспечивает прозрачный и своевременный контроль состояния всех узлов кластера и ключевых инфраструктурных компонентов.
Возможности модуля:
- предоставляет возможность планировать ресурсы инфраструктуры (Capacity planning);
- отслеживает версию container runtime (docker, containerd) на каждом узле и проверяет её на соответствие разрешенным версиям;
- контролирует работоспособность самой подсистемы мониторинга кластера (Dead man’s switch);
- снимает метрики о доступности файловых дескрипторов, сокетов, свободного места и inode на каждом узле;
- следит за корректной работой ключевых компонентов мониторинга: kube-state-metrics, node-exporter, kube-dns;
- проверяет состояние всех узлов (
NotReady
,drain
,cordon
) и своевременно сигнализирует о неполадках; - следит за синхронизацией времени и уведомляет об отклонениях;
- выявляет случаи продолжительного превышения CPU steal (когда узел не получает нужного времени процессора);
- контролирует состояние таблицы Conntrack на узлах;
- показывает поды с некорректными статусами — например, если kubelet не справился со своей работой;
- позволяет экспортировать метрики во внешние системы мониторинга для единой точки контроля.