Модуль предназначен для базового мониторинга узлов кластера.

Обеспечивает безопасный сбор метрик и предоставляет базовый набор правил для мониторинга:

  • Текущей версии container runtime (docker, containerd) на узле и ее соответствия версиям, разрешенным для использования.
  • Общей работоспособности подсистемы мониторинга кластера (Dead man’s switch).
  • Доступных файловых дескрипторов, сокетов, свободного места и inode.
  • Работы kube-state-metrics, node-exporter, kube-dns.
  • Состояния узлов кластера (NotReady, drain, cordon).
  • Состояния синхронизации времени на узлах.
  • Случаев продолжительного превышения CPU steal.
  • Состояния таблицы Conntrack на узлах.
  • Pod’ов с некорректным состоянием (как возможное следствие проблем с kubelet) и др.