Мониторинг
Для групп узлов (ресурс NodeGroup) DKP экспортирует метрики доступности группы.
Какую информацию собирает Prometheus?
Все метрики групп узлов имеют префикс d8_node_group_
в названии, и метку с именем группы node_group_name
.
Следующие метрики собираются для каждой группы узлов:
d8_node_group_ready
— количество узлов группы, находящихся в статусеReady
;d8_node_group_nodes
— количество узлов в группе (в любом статусе);d8_node_group_instances
— количество инстансов в группе (в любом статусе);d8_node_group_desired
— желаемое (целевое) количество объектовMachines
в группе;d8_node_group_min
— минимальное количество инстансов в группе;d8_node_group_max
— максимальное количество инстансов в группе;d8_node_group_up_to_date
— количество узлов в группе в состоянииup-to-date
;d8_node_group_standby
— количество резервных узлов в группе (см. параметр standby);d8_node_group_has_errors
— единица, если в группе узлов есть какие-либо ошибки.