Модуль предназначен для базового мониторинга узлов кластера.

Обеспечивает безопасный сбор метрик и предоставляет базовый набор правил для мониторинга:

  • текущей версии container runtime (docker, containerd) на узле и ее соответствия версиям, разрешенным для использования;
  • общей работоспособности подсистемы мониторинга кластера (Dead man’s switch);
  • доступных файловых дескрипторов, сокетов, свободного места и inode;
  • работы kube-state-metrics, node-exporter, kube-dns;
  • состояния узлов кластера (NotReady, drain, cordon);
  • состояния синхронизации времени на узлах;
  • случаев продолжительного превышения CPU steal;
  • состояния таблицы Conntrack на узлах;
  • подов с некорректным состоянием (как возможное следствие проблем с kubelet) и др.