Модуль предназначен для базового мониторинга узлов кластера.
Обеспечивает безопасный сбор метрик и предоставляет базовый набор правил для мониторинга:
- Текущей версии container runtime (docker, containerd) на узле и ее соответствия версиям, разрешенным для использования.
- Общей работоспособности подсистемы мониторинга кластера (Dead man’s switch).
- Доступных файловых дескрипторов, сокетов, свободного места и inode.
- Работы
kube-state-metrics
,node-exporter
,kube-dns
. - Состояния узлов кластера (NotReady, drain, cordon).
- Состояния синхронизации времени на узлах.
- Случаев продолжительного превышения CPU steal.
- Состояния таблицы Conntrack на узлах.
- Pod’ов с некорректным состоянием (как возможное следствие проблем с kubelet) и др.