Модуль устанавливает prometheus operator, который позволяет создавать и автоматизированно управлять инсталляциями Prometheus.
Функционал устанавливаемого оператора:
- определяет следующие custom resource’ы:
Prometheus
— определяет инсталляцию (кластер) PrometheusServiceMonitor
— определяет, как собирать метрики с сервисовAlertmanager
— определяет кластер Alertmanager‘овPrometheusRule
— определяет список Prometheus rules
- следит за этими ресурсами и:
- генерирует
StatefulSet
с самим Prometheus и необходимые для его работы конфигурационные файлы, сохраняя их вSecret
; - следит за ресурсами
ServiceMonitor
иPrometheusRule
и на их основании обновляет конфигурационные файлы Prometheus через внесение изменений вSecret
.
- генерирует
Prometheus
Что делает Prometheus?
В целом, сервер Prometheus делает две ключевых вещи — собирает метрики и выполняет правила:
- Для каждого target’а (цель для мониторинга), каждый
scrape_interval
, делает HTTP запрос на этот target, получает в ответ метрики в своем формате, которые сохраняет к себе в базу - Каждый
evaluation_interval
обрабатывает rules, на основании чего:- или шлет алерты
- или записывает (себе же в базу) новые метрики (результат выполнения rule’а)
Как настраивается Prometheus?
- У сервера Prometheus есть config и есть rule files (файлы с правилами)
- В
config
имеются следующие секции:scrape_configs
— настройки поиска target’ов (целей для мониторинга, см. подробней следующий раздел).-
rule_files
— список директорий, в которых лежат rule’ы, которые необходимо загружать:rule_files: - /etc/prometheus/rules/rules-0/* - /etc/prometheus/rules/rules-1/*
alerting
— настройки поиска Alert Manager’ов, в которые слать алерты. Секция очень похожа наscrape_configs
, только результатом ее работы является список endpoint’ов, в которые Prometheus будет слать алерты.
Где Prometheus берет список target’ов?
-
В целом Prometheus работает следующим образом:
- (1) Prometheus читает секцию конфига
scrape_configs
, согласно которой настраивает свой внутренний механизм Service Discovery - (2) Механизм Service Discovery взаимодействует с API Kubernetes (в основном — получает endpoint`ы)
- (3) На основании происходящего в Kubernetes механизм Service Discovery обновляет Targets (список target’ов)
- (1) Prometheus читает секцию конфига
-
В
scrape_configs
указан список scrape job’ов (внутреннее понятие Prometheus), каждый из которых определяется следующим образом:scrape_configs: # Общие настройки - job_name: d8-monitoring/custom/0 # просто название scrape job'а, показывается в разделе Service Discovery scrape_interval: 30s # как часто собирать данные scrape_timeout: 10s # таймаут на запрос metrics_path: /metrics # path, который запрашивать scheme: http # http или https # Настройки service discovery kubernetes_sd_configs: # означает, что target'ы мы получаем из Kubernetes - api_server: null # означает, что адрес API-сервера использовать из переменных окружения (которые есть в каждом Pod'е) role: endpoints # target'ы брать из endpoint'ов namespaces: names: # искать endpoint'ы только в этих namespace'ах - foo - baz # Настройки "фильтрации" (какие enpoint'ы брать, а какие нет) и "релейблинга" (какие лейблы добавить или удалить, на все получаемые метрики) relabel_configs: # Фильтр по значению label'а prometheus_custom_target (полученного из связанного с endpoint'ом service'а) - source_labels: [__meta_kubernetes_service_label_prometheus_custom_target] regex: .+ # подходит любой НЕ пустой лейбл action: keep # Фильтр по имени порта - source_labels: [__meta_kubernetes_endpointslice_port_name] regex: http-metrics # подходит, только если порт называется http-metrics action: keep # Добавляем label job, используем значение label'а prometheus_custom_target у service'а, к которому добавляем префикс "custom-" # # Лейбл job это служебный лейбл Prometheus: # * он определяет название группы, в которой будет показываться target на странице targets # * и конечно же он будет у каждой метрики, полученной у этих target'ов, чтобы можно было удобно фильтровать в rule'ах и dashboard'ах - source_labels: [__meta_kubernetes_service_label_prometheus_custom_target] regex: (.*) target_label: job replacement: custom-$1 action: replace # Добавляем label namespace - source_labels: [__meta_kubernetes_namespace] regex: (.*) target_label: namespace replacement: $1 action: replace # Добавляем label service - source_labels: [__meta_kubernetes_service_name] regex: (.*) target_label: service replacement: $1 action: replace # Добавляем label instance (в котором будет имя Pod'а) - source_labels: [__meta_kubernetes_pod_name] regex: (.*) target_label: instance replacement: $1 action: replace
- Таким образом, Prometheus сам отслеживает:
- добавление и удаление Pod’ов (при добавлении/удалении Pod’ов Kubernetes изменяет endpoint’ы, а Prometheus это видит и добавляет/удаляет target’ы)
- добавление и удаление сервисов (точнее endpoint’ов) в указанных namespace’ах
- Изменение конфига требуется в следующих случаях:
- нужно добавить новый scrape config (обычно — новый вид сервисов, которые надо мониторить)
- нужно изменить список namespace’ов
Prometheus Operator
Что делает Prometheus Operator?
- С помощью механизма CRD (Custom Resource Definitions) определяет четыре custom ресурса:
- prometheus — определяет инсталляцию (кластер) Prometheus
- servicemonitor — определяет, как “мониторить” (собирать метрики) набор сервисов
- alertmanager — определяет кластер Alertmanager’ов (мы не пользуемся, так как шлем метрики напрямую в madison)
- prometheusrule — определяет список Prometheus rules
- Следит за ресурсами
prometheus
и генерирует для каждого:- StatefulSet (с самим Prometheus’ом)
- Secret с
prometheus.yaml
(конфиг Prometheus’а) иconfigmaps.json
(конфиг дляprometheus-config-reloader
)
- Следит за ресурсами
servicemonitor
иprometheusrule
и на их основании обновляет конфиги (prometheus.yaml
иconfigmaps.json
, которые лежат в секрете).
Что в Pod’е с Prometheus’ом?
- Два контейнера:
prometheus
— сам Prometheusprometheus-config-reloader
— обвязка, которая:- следит за изменениями
prometheus.yaml
и, при необходимости, вызывает reload конфигурации Prometheus’у (специальным HTTP-запросом, см. подробнее ниже) - следит за PrometheusRule’ами (см. подробнее ниже) и по необходимости скачивает их и перезапускает Prometheus
- следит за изменениями
- Pod использует три volume:
- config — примонтированный secret (два файла:
prometheus.yaml
иconfigmaps.json
). Подключен в оба контейнера. - rules —
emptyDir
, который наполняетprometheus-config-reloader
, а читаетprometheus
. Подключен в оба контейнера, но вprometheus
в режиме read only. - data — данные Prometheus. Подмонтирован только в
prometheus
.
- config — примонтированный secret (два файла:
Как обрабатываются Service Monitor’ы?
- (1) Prometheus Operator читает (а также следит за добавлением/удалением/изменением) Service Monitor’ы (какие именно Service Monitor’ы — указано в самом ресурсе
prometheus
, см. подробней официальную документацию). - (2) Для каждого Service Monitor’а, если в нем НЕ указан конкретный список namespace’ов (указано
any: true
), Prometheus Operator вычисляет (обращаясь к API Kubernetes) список namespace’ов, в которых есть Service’ы (подходящие под указанные в Service Monitor’е label’ы). - (3) На основании прочитанных ресурсов
servicemonitor
(см. официальную документацию) и на основании вычисленных namespace’ов Prometheus Operator генерирует часть конфига (секциюscrape_configs
) и сохраняет конфиг в соответствующий Secret. - (4) Штатными средствами самого Kubernetes данные из секрета прилетают в Pod (файл
prometheus.yaml
обновляется). - (5) Изменение файла замечает
prometheus-config-reloader
, который по HTTP отправляет запрос Prometheus’у на перезагрузку. - (6) Prometheus перечитывает конфиг и видит изменения в scrape_configs, которые обрабатывает уже согласно своей логике работы (см. подробнее выше).
Как обрабатываются Custome Resources с rule’ами?
- (1) Prometheus Operator следит за PrometheusRule’ами (подходящими под указанный в ресурсе
prometheus
ruleSelector
). - (2) Если появился новый (или был удален существующий) PrometheusRule — Prometheus Operator обновляет
prometheus.yaml
(а дальше срабатывает логика в точности соответствующая обработке Service Monitor’ов, которая описана выше). - (3) Как в случае добавления/удаления PrometheusRule’а, так и при изменении содержимого PrometheusRule’а, Prometheus Operator обновляет ConfigMap
prometheus-main-rulefiles-0
. - (4) Штатными средствами самого Kubernetes данные из ConfigMap прилетают в Pod
- Изменение файла замечает
prometheus-config-reloader
, который:- (5) скачивает изменившиеся ConfigMap’ы в директорию rules (это
emptyDir
) - (6) по HTTP отправляет запрос Prometheus’у на перезагрузку
- (5) скачивает изменившиеся ConfigMap’ы в директорию rules (это
- (7) Prometheus перечитывает конфиг и видит изменившиеся rule’ы.