Доступно в редакциях: CE, BE, SE, SE+, EE, CSE Lite (1.67), CSE Pro (1.67)
Модуль не требует обязательной конфигурации (все работает из коробки).
В модуле реализовано 26 алертов.
Модуль включен по умолчанию в наборах модулей: Default, Managed.
Модуль выключен по умолчанию в наборе модулей Minimal.
Конверсии
Модуль настраивается с помощью ресурса ModuleConfig, схема которого содержит номер версии. При применении в кластере старой версии схемы ModuleConfig выполняются автоматические преобразования. Чтобы обновить версию схемы ModuleConfig вручную, необходимо последовательно для каждой версии выполнить следующие действия :
- Обновление из версии 1 в 2:
Удалите поле
.auth.password. Если в результате объект.authстановится пуст, удалите его.
Настройки
Чтобы настроить модуль, используйте ресурс ModuleConfig с именем prometheus (подробнее о настройке Deckhouse…).
Пример ресурса ModuleConfig/prometheus для настройки модуля:
apiVersion: deckhouse.io/v1alpha1
kind: ModuleConfig
metadata:
name: prometheus
spec:
version: 2
enabled: true
settings: # <-- Параметры модуля из раздела "Параметры" ниже.
Параметры
Версия схемы: 2
- объектsettings
- объектsettings.auth
Опции, связанные с аутентификацией или авторизацией в приложении.
- массив строкsettings.auth.allowedUserEmails
Массив адресов электронной почты, пользователям которых разрешен доступ к веб-интерфейсу.
Используется, если включен модуль
user-authnили задан параметрexternalAuthentication. - массив строкsettings.auth.allowedUserGroups
Массив групп, пользователям которых позволен доступ в Grafana и Prometheus.
Используется, если включен модуль user-authn или параметр
externalAuthentication.Внимание! При использовании совместно с модулем user-authn необходимо также добавить разрешенные группы в соответствующее поле в настройках DexProvider.
- объектsettings.auth.externalAuthentication
Параметры для подключения внешней аутентификации (используется механизм NGINX Ingress external-auth, работающий на основе модуля NGINX auth_request.
Внешняя аутентификация включается автоматически, если включен модуль user-authn.
- строкаsettings.auth.externalAuthentication.authSignInURL
URL, куда будет перенаправлен пользователь для прохождения аутентификации (если сервис аутентификации вернул код ответа HTTP, отличный от 200).
Пример:
authSignInURL: https://example.com/dex/sign_in - строкаsettings.auth.externalAuthentication.authURL
URL сервиса аутентификации. Если пользователь прошел аутентификацию, сервис должен возвращать код ответа HTTP 200.
Пример:
authURL: https://example.com/dex/auth
- булевыйsettings.auth.satisfyAny
Разрешает пройти только одну из аутентификаций.
В комбинации с опцией
whitelistSourceRangesпозволяет считать авторизованными всех пользователей из указанных сетей без ввода логина и пароля.По умолчанию:
falseПример:
satisfyAny: true - массив строкsettings.auth.whitelistSourceRanges
Список адресов в формате CIDR, которым разрешено проходить авторизацию в Grafana и Prometheus.
Пример:
whitelistSourceRanges: - 1.1.1.1/32
- объектsettings.externalLabels
Набор внешних меток для маркировки метрик.
Допускается использование значений переменных окружения контейнера
config-reloaderв качестве значений меток, например:HOSTNAME/POD_NAME— содержит наименование пода (например,prometheus-main-0,prometheus-main-1и т. д.);SHARD— содержит номер шарда.
Пример:
externalLabels: prometheus_replica: "$(POD_NAME)" shard: "$(SHARD)" hostname: "$(HOSTNAME)" - объектsettings.grafana
Настройки для инсталляции Grafana.
- массив строкsettings.grafana.customPlugins
Список дополнительных plug-in’ов для Grafana.
Необходимо указать в качестве значения список имен плагинов из официального репозитория.
Пример добавления plug-in’ов для возможности указания clickhouse в качестве datasource и панели flow-chart:
grafana: customPlugins: - agenty-flowcharting-panel - vertamedia-clickhouse-datasourceВы также можете устанавливать плагины из других источников передав ссылку на zip-архив плагина в формате
<url to plugin zip>;<plugin name>:grafana: customPlugins: - http://10.241.32.16:3000/netsage-bumpchart-panel-1.1.1.zip;netsage-bumpchart-panelПример:
customPlugins: - agenty-flowcharting-panel - vertamedia-clickhouse-datasource - булевыйsettings.grafana.enabled
Включить установку Grafana в кластер.
По умолчанию:
trueПример:
enabled: false - булевыйsettings.grafana.useDarkTheme
Использование по умолчанию пользовательской темной темы.
По умолчанию:
falseПример:
useDarkTheme: true
- булевыйsettings.highAvailability
Ручное управление режимом отказоустойчивости.
По умолчанию режим отказоустойчивости определяется автоматически. Подробнее про режим отказоустойчивости.
Пример:
highAvailability: true - объектsettings.https
Тип сертификата, используемого для Grafana/Prometheus.
При использовании этого параметра полностью переопределяются глобальные настройки
global.modules.https.Примеры:
https: mode: CustomCertificate customCertificate: secretName: foobarhttps: mode: CertManager certManager: clusterIssuerName: letsencrypt- объектsettings.https.certManager
- строкаsettings.https.certManager.clusterIssuerName
ClusterIssuer, используемый для Grafana/Prometheus.
Доступны
letsencrypt,letsencrypt-staging,selfsigned, но вы можете определить свои.По умолчанию:
letsencrypt
- объектsettings.https.customCertificate
- строкаsettings.https.customCertificate.secretName
Имя Secret’а в namespace
d8-system, который будет использоваться для Grafana/Prometheus.Secret должен быть в формате kubernetes.io/tls.
По умолчанию:
false
- строкаsettings.https.mode
Режим работы HTTPS:
Disabled— Grafana/Prometheus будут работать только по HTTP;CertManager— Grafana/Prometheus будут работать по HTTPS и заказывать сертификат с помощью ClusterIssuer, заданного в параметреcertManager.clusterIssuerName.CustomCertificate— Grafana/Prometheus будут работать по HTTPS, используя сертификат из namespaced8-system.OnlyInURI— Grafana/Prometheus будут работать по HTTP (подразумевая, что перед ними стоит внешний балансировщик, который терминирует HTTPS) и все ссылки в user-authn будут генерироваться с HTTPS-схемой. Балансировщик должен обеспечивать перенаправление с HTTP на HTTPS.
По умолчанию:
DisabledДопустимые значения:
Disabled,CertManager,CustomCertificate,OnlyInURI
- строкаsettings.ingressClass
Класс Ingress-контроллера, который используется для Grafana/Prometheus.
Опциональный параметр, по умолчанию используется глобальное значение
modules.ingressClass.Шаблон:
^[a-z0-9]([-a-z0-9]*[a-z0-9])?(\.[a-z0-9]([-a-z0-9]*[a-z0-9])?)*$Пример:
ingressClass: public - целочисленныйsettings.longtermMaxDiskSizeGigabytesПараметр устарел
Устарел и будет удален. Ни на что не влияет.
- объектsettings.longtermNodeSelector
Структура, аналогичная
spec.nodeSelectorпода Kubernetes.Если значение не указано или указано
false, будет использоваться автоматика.Пример:
longtermNodeSelector: disktype: ssd - строкаsettings.longtermPodAntiAffinity
Устанавливает конфигурацию podAntiAffinity для Prometheus longterm по отношению к Prometheus main.
Preferred— позволяет размещать Prometheus longterm на одном узле с Prometheus main, если нет возможности их разместить на разных узлах.Required— не позволяет размещать Prometheus longterm на одном узле с Prometheus main ни при каких условиях.
По умолчанию:
PreferredДопустимые значения:
Preferred,Required - целочисленныйsettings.longtermRetentionDays
Сколько дней хранить данные в Longterm Prometheus. Если указать 0, Longterm Prometheus не будет запущен в кластере.
По умолчанию:
1095 - строкаsettings.longtermScrapeInterval
Как часто Longterm Prometheus должен собирать себе «снимок» данных из основного Prometheus.
По умолчанию:
5m - строкаsettings.longtermStorageClass
Имя StorageClass, который будет использован для Longterm Prometheus.
Если значение не указано, используется StorageClass существующей PVC Longterm Prometheus. Если PVC нет, будет использоваться StorageClass, согласно настройке глобального параметра storageClass.
Настройка глобального параметра
storageClassучитывается только при включении модуля. Изменение глобального параметраstorageClassпри включенном модуле не приведет к перезаказу диска.Внимание. Если указать значение, отличное от текущего (используемого в существующей PVC), диск будет перезаказан, и все данные удалятся.
Пример:
longtermStorageClass: ceph-ssd - массив объектовsettings.longtermTolerations
Структура, аналогичная
spec.tolerationsпода Kubernetes.Если значение не указано или указано
false, будет использоваться автоматика.Пример:
longtermTolerations: - key: key1 operator: Equal value: value1 effect: NoSchedule- строкаsettings.longtermTolerations.effect
- строкаsettings.longtermTolerations.key
- строкаsettings.longtermTolerations.operator
- целочисленныйsettings.longtermTolerations.tolerationSeconds
- строкаsettings.longtermTolerations.value
- целочисленныйsettings.mainMaxDiskSizeGigabytesПараметр устарел
Устарел и будет удален. Ни на что не влияет.
- объектsettings.nodeSelector
Структура, аналогичная
spec.nodeSelectorпода Kubernetes.Если значение не указано или указано
false, будет использоваться автоматика.Пример:
nodeSelector: disktype: ssd - целочисленныйsettings.retentionDays
Сколько дней хранить данные.
По умолчанию:
15 - строкаsettings.scrapeInterval
Как часто Prometheus должен собирать метрики с target’ов.
Evaluation Interval всегда равен
scrapeInterval.По умолчанию:
30sШаблон:
^([\d]*y)?([\d]*w)?([\d]*d)?([\d]*h)?([\d]*m)?([\d]*s)?$ - строкаsettings.storageClass
Имя StorageClass, который будет использоваться по умолчанию в кластере.
Если не указано, используется StorageClass существующей PVC Prometheus. Если PVC нет, будет использоваться StorageClass, согласно настройке глобального параметра storageClass.
Настройка глобального параметра
storageClassучитывается только при включении модуля. Изменение глобального параметраstorageClassпри включенном модуле не приведет к перезаказу диска.Внимание. Если указать значение, отличное от текущего (используемого в существующей PVC), диск Prometheus будет перезаказан, а все данные удалены.
Внимание. При переносе Prometheus с локальным хранилищем на другие узлы, поды зависнут в состоянии Pending. В этом случае будет необходимо сохранить базу данных Prometheus, удалить старые PVC и перезапустить под вручную. Под локальным хранилищем подразумевается StorageClass, связанный не с сетевым хранилищем, а с локальным томом на узле (например, StorageClass, создаваемый модулем local-path-provisioner).
Если указать
false, будет принудительно использоватьсяemptyDir.Примеры:
storageClass: ceph-ssdstorageClass: 'false' - массив объектовsettings.tolerations
Структура, аналогичная
spec.tolerationsпода Kubernetes.Если значение не указано или указано
false, будет использоваться автоматика.Пример:
tolerations: - key: key1 operator: Equal value: value1 effect: NoSchedule- строкаsettings.tolerations.effect
- строкаsettings.tolerations.key
- строкаsettings.tolerations.operator
- целочисленныйsettings.tolerations.tolerationSeconds
- строкаsettings.tolerations.value
- объектsettings.vpa
Настройки VPA для подов.
По умолчанию:
{"updateMode":"Initial"}Примеры:
vpa: updateMode: Initial longtermMaxCPU: '1' longtermMaxMemory: 1500Mi maxCPU: 1000m maxMemory: 1500Mivpa: updateMode: 'Off'- settings.vpa.longtermMaxCPU
Максимальное значение, которое может выставить VPA для запроса CPU (CPU requests) для подов Longterm Prometheus.
Значение по умолчанию подбирается автоматически, исходя из максимального количества подов, которое можно создать в кластере при текущем количестве узлов и их настройках. Подробнее см. хук
detect_vpa_maxмодуля.Пример:
longtermMaxCPU: 0.1 - settings.vpa.longtermMaxMemory
Максимальное значение, которое может выставить VPA для запроса к памяти (memory requests) для подов Longterm Prometheus.
Значение по умолчанию подбирается автоматически, исходя из максимального количества подов, которое можно создать в кластере при текущем количестве узлов и их настройках. Подробнее см. хук
detect_vpa_maxмодуля.Пример:
longtermMaxMemory: 4Mi - settings.vpa.maxCPU
Максимальное значение, которое может выставить VPA для запроса CPU (CPU requests) для подов основного Prometheus.
Значение по умолчанию подбирается автоматически, исходя из максимального количества подов, которое можно создать в кластере при текущем количестве узлов и их настройках. Подробнее см. хук
detect_vpa_maxмодуля.Пример:
maxCPU: '3' - settings.vpa.maxMemory
Максимальное значение, которое может выставить VPA для запроса к памяти (memory requests) для подов основного Prometheus..
Значение по умолчанию подбирается автоматически, исходя из максимального количества подов, которое можно создать в кластере при текущем количестве узлов и их настройках. Подробнее см. хук
detect_vpa_maxмодуля.Пример:
maxMemory: 3Mi - строкаsettings.vpa.updateMode
Режим работы VPA.
По умолчанию:
InitialДопустимые значения:
Initial,Auto,Off
Аутентификация
По умолчанию используется модуль user-authn. Также можно настроить аутентификацию через externalAuthentication (см. ниже).
Если эти варианты отключены, модуль включит basic auth со сгенерированным паролем и пользователем admin.
Посмотреть сгенерированный пароль можно командой:
d8 k -n d8-system exec svc/deckhouse-leader -c deckhouse -- deckhouse-controller module values prometheus -o json | jq '.internal.auth.password'
Чтобы сгенерировать новый пароль, нужно удалить Secret:
d8 k -n d8-monitoring delete secret/basic-auth
Внимание! Параметр
auth.passwordбольше не поддерживается.
Примечание
retentionSizeдляmainиlongtermрассчитывается автоматически, возможности задать значение нет!- Алгоритм расчета:
pvc_size * 0.85— если PVC существует;10 GiB— если PVC нет и StorageClass поддерживает ресайз;25 GiB— если PVC нет и StorageClass не поддерживает ресайз.
- Если используется
local-storageи требуется изменитьretentionSize, необходимо вручную изменить размер PV и PVC в нужную сторону. Внимание! Для расчета берется значение из.status.capacity.storagePVC, поскольку оно отражает реальный размер PV в случае ручного ресайза.
- Алгоритм расчета:
40 GiB— размер PersistentVolumeClaim создаваемого по умолчанию.- Размер дисков Prometheus можно изменить стандартным для Kubernetes способом (если в StorageClass это разрешено), отредактировав в PersistentVolumeClaim поле
.spec.resources.requests.storage.