Стадия жизненного цикла модуля: General Availability
У модуля есть требования для установки

v1.13.0

Новые возможности

  • Мониторинг производительности приложений (APM) (экспериментально). Новый раздел APM предоставляет распределённую трассировку с полноценным просмотром трейсов (waterfall, детали спанов, flame graph), обозреватель связанных логов и карту сервисов с детализацией по сервисам, операциям и зависимостям. Трейсы принимаются из любого источника, совместимого с OpenTelemetry, а встроенные инструкции помогают инструментировать приложения на 10 языках.
  • Хранилище метрик на базе Deckhouse Prom++ (экспериментально). Хранилище метрик теперь может работать на базе Deckhouse Prom++ и принимает тот же объём метрик, потребляя до 10 раз меньше памяти.
  • Более экономичное хранение данных для Ceph (экспериментально). При создании кластера теперь можно выбрать более экономичный по месту режим размещения данных: тот же объём данных хранится с сохранением отказоустойчивости, но занимает заметно меньше диска, чем при полном реплицировании.

Улучшения

  • Добавлена возможность настраивать максимальное число агентов, которые могут писать в один коллектор, — для более гибкой настройки ёмкости; алерт уведомляет, когда этот лимит достигается.

Безопасность

  • Устранены известные уязвимости (CVE) в образах компонентов платформы.

v1.12.14

Новые возможности

  • Мониторинг виртуальных машин QEMU/libvirt и VMware/vCenter. Обновлённый агент мониторинга собирает CPU, память, диск и сеть на уровне отдельных ВМ: для QEMU/libvirt — автоматически на хост-гипервизорах без дополнительной настройки, для VMware — через vCenter (учётные данные указываются в конфигурации агента). В интерфейсе появились три новых дашборда: VM Detail, QEMU/KVM Hypervisors и VMware/ESXi Hypervisors.
  • Бейдж «managed by code» для сайтов веб-мониторинга. На сайты, конфигурация которых задаётся через внешние инструменты (webmon-cli, GitOps и т.п.), может быть навешен бейдж «managed by code» — оператор сразу видит, что правки через UI будут перезаписаны при следующей синхронизации с источником истины.

Улучшения

  • Дашборды веб-мониторинга теперь поддерживают локализацию в зависимости от локали платформы.
  • Улучшенная поддержка новых версий pgbouncer в агенте мониторинга.

Исправления ошибок

  • Исправлен алерт проверки конфигурации плагина PostgreSQL: раньше при некоторых типах ошибок настройки агента алерт мог не срабатывать. Теперь все проверки конфигурации плагина обрабатываются корректно.

v1.12.13

Улучшения

  • Унифицирована валидация конфигурации веб-мониторинга в API сервера, утилите webmon-cli и публичной документации. Один и тот же формат полей теперь принимается во всех трёх местах: поддерживается HTTP-метод TRACE, поле disableHttp2ForHttps отклоняется, если значение указано не как строка-булево ("true" / "false"), единица измерения h (часы) больше не принимается в responseTime.max у проверок, заголовки валидируются поэлементно (у каждого должен быть непустой name, строковое value, без посторонних ключей), а блок requestDefaults (scheme, timeout, headers) проверяется по тем же правилам, что и конфигурация конкретной пробы. Удалено устаревшее поле dataBase64 в webmon-cli (выпущено как v0.5.0). Конфигурации, ранее проходившие валидацию по нестрогим правилам, могут начать падать в webmon-cli validate и в API — рекомендуется проверить CI-пайплайны, использующие webmon-cli как merge-гейт.

Исправления ошибок

  • Исправлена шаблонизация переменных в drilldown-дашборде веб-мониторинга — навигация по drilldown теперь работает корректно.

v1.12.10

Исправления ошибок

  • Исправлено отображение кнопок действий в таблице контролируемых сайтов веб-мониторинга — иконки «Открыть дашборд», «Открыть логи», «Редактировать» и «Удалить» ранее могли обрезаться и быть скрыты.

v1.12.9

Новые возможности

  • Поддержка интернационализованных доменных имён (IDN) в веб-мониторинге. В поле хоста сайта можно указывать имена на любых национальных алфавитах (например, дом.рф или 例え.jp); агенты корректно выполняют проверки, а в интерфейсе имя отображается в оригинальном виде.
  • Новая кнопка «IP-адреса проверок» на странице Веб-мониторинга. Открывает список «IP-адреса, с которых выполняются проверки веб-мониторинга» с группировкой по зонам мониторинга и текущим статусом (онлайн/офлайн) каждого агента. Удобно для настройки списков разрешённых адресов на контролируемых сайтах.

Улучшения

  • Отображение проверок на странице контролируемого сайта: составные проверки (например, SSL вместе со сроком сертификата) показываются единым блоком со статусом каждого условия; подписи унифицированы, повторяющиеся различаются.
  • UX форм и таблицы сайтов веб-мониторинга: добавлены недостающие хлебные крошки, длинные имена сайтов и хостов корректно усекаются в таблице, блок дополнительных настроек разворачивается автоматически при заполненных полях.
  • Интервал проверок по умолчанию для новых контролируемых сайтов изменён с 20 на 30 секунд.
  • Форма создания и редактирования токена показывает только поля, применимые к его области действия — «Проект», «Пространство» или «Вся система»; неиспользуемые параметры скрыты.
  • Восстановлена возможность задавать максимальный размер тела ответа в HTTP-проверках веб-мониторинга. Теперь можно указывать минимальный размер, максимальный или оба одновременно.
  • Улучшена валидация конфигураций в утилите webmon-cli: правила приведены в соответствие с проверками на стороне сервера, а сообщения об ошибках теперь указывают проект и номер строки в YAML-файле.

Изменения

  • Более строгая валидация конфигураций в webmon-cli. Утилита теперь отклоняет YAML-конфиги, которые отклонил бы сервер: для HTTP-проб обязательна явная scheme (http или https), SSL-проверки запрещены при scheme: http, в host и hosts допускаются только IPv4-адреса, длительности и размеры тела должны указываться с единицей измерения (5s, 1500ms, 10Kb), единица h (например, 1h) не является поддерживаемой единицей длительности, составные длительности (например, 1m30s) не поддерживаются, а в siteLabels.zone запрещены дубли. Конфигурации, которые молча проходили в прошлых версиях, теперь могут падать на webmon-cli validate — проверьте CI-пайплайны, использующие его как гейт перед мержем.
  • Токены с несколькими областями действия больше не редактируются через интерфейс. На странице редактирования такие токены отображаются как сводка только для чтения с подсказкой «Токен привязан к нескольким областям — область действия здесь не редактируется»; для токенов, у которых нельзя однозначно определить путь редактирования, вместо кнопки «Редактировать» показывается «Токен редактируется через API». Изменение области действия таких токенов выполняется через Observability API; ротация и архивация остаются доступны в интерфейсе.

Исправления ошибок

  • Исправлено сохранение проверки срока действия SSL-сертификата в веб-мониторинге — ранее такую проверку не удавалось сохранить.
  • Исправлено отображение панелей статусов на дашбордах веб-мониторинга: устранены дублирующиеся строки, некорректные подписи и цвета ячеек.
  • Исправлена ошибка при открытии дашборда проекта для сайта с именем на национальных алфавитах.
  • Исправлено поведение настройки «Использовать свой список адресов» при редактировании контролируемого сайта: при её отключении ранее заданные адреса теперь действительно удаляются.
  • Исправлено сохранение имени группы проверок в веб-мониторинге, а также неразличимые подписи у нескольких однотипных проверок на странице контролируемого сайта.

v1.12.8

Исправления ошибок

  • Исправлена проблема, из-за которой выгрузка отчёта веб-мониторинга в формате CSV могла завершиться с ошибкой.

v1.12.7

Улучшения

  • Утилита webmon-cli теперь поддерживает назначение нескольких зон мониторинга для сайта через перечисление в метке zone через запятую.

Исправления ошибок

  • Исправлена ошибка, из-за которой могли перестать обновляться автоматически обнаруженные хосты и доступные дашборды в интерфейсе.

v1.12.6

Исправления ошибок

  • Исправлена проблема, при которой конфигурация веб-мониторинга не обновлялась на агентах мониторинга при удалении проверок из сайта.

v1.12.5

Улучшения

  • Переработана форма создания сайта в веб-мониторинге. Новый простой режим позволяет быстро настроить мониторинг, указав только URL — остальные параметры заполняются автоматически. Расширенный режим предоставляет полный доступ ко всем настройкам: метод, заголовки, аутентификация, параметры TLS, список хостов.
  • Добавлена история изменений конфигурации сайтов веб-мониторинга с отображением деталей каждого изменения.
  • Новая утилита командной строки webmon-cli для импорта и валидации конфигураций веб-мониторинга из YAML-файлов, заменяющая ранее встроенный конвертер.

v1.12.4

Исправления ошибок

  • Исправлена ошибка валидации при деплое модуля на новых версиях Deckhouse Kubernetes Platform.

v1.12.3

Исправления ошибок

  • Исправлена проблема, при которой некоторые компоненты могли не запускаться.

v1.11.5

Исправления ошибок

  • Исправлена проблема, при которой некоторые компоненты могли не запускаться.

v1.10.5

Исправления ошибок

  • Исправлена проблема, при которой некоторые компоненты могли не запускаться.

v1.12.1

Исправления ошибок

  • Исправлено сохранение привязки зон мониторинга при создании и редактировании контролируемого сайта.
  • Исправлена работа API веб-мониторинга с именами сайтов, содержащими точки (например, vcenter.example.com).
  • Исправлена проверка TLS-сертификатов для сайтов, мониторинг которых настроен через явные IP-адреса вместо DNS-резолва.
  • Исправлен фильтр зон на дашборде веб-мониторинга, который не отображал доступные значения.
  • Исправлена ширина полей ввода параметров проверок, из-за которой значения обрезались.

v1.12.0

Новые возможности

  • Веб-мониторинг. Добавлена возможность распределённого мониторинга доступности веб-сайтов с внешних точек наблюдения. Агенты мониторинга запускаются на серверах за пределами кластера, выполняют HTTP-, TCP-, DNS- и ICMP-проверки и отправляют результаты в платформу.
    • Настройка контролируемых сайтов на уровне проекта: интервалы проверки (10–60 сек), правила валидации ответов (коды статусов, тело ответа, заголовки, SSL-сертификаты), зоны мониторинга.
    • Управление зонами мониторинга и агентами в административном интерфейсе. Агенты поддерживают установку одной командой, автоматическое обновление бинарных файлов и отслеживание статуса (online/offline).
    • Дашборды Grafana: общий статус мониторинга, статус по зонам, метрики по сайтам, логи агентов.
    • Автоматические алерты при недоступности сайтов, ошибках DNS и проблемах с зонами мониторинга.
    • Обнаружение аварий и отчёты о доступности с метриками за 24 часа и 30 дней.
    • API для программного управления конфигурацией веб-мониторинга.

Улучшения

  • Уменьшено потребление памяти компонентом scheduler.

v1.11.2

Улучшения

  • Повышена стабильность процесса перехода на managed-postgres.
  • Зависящие от БД компоненты (backend, scheduler, alertgate) теперь автоматически перезапускаются при изменении учётных данных.
  • Увеличено покрытие тестами встроенных хуков с интеграцией в CI и отчётами о покрытии.

v1.11.0

Улучшения

  • Добавлен алерт для хранилища логов при отбрасывании записей из-за превышения лимитов, помогающий администраторам выявлять проекты, требующие корректировки лимитов.

Изменения

  • Встроенный PostgreSQL теперь работает на базе модуля managed-postgres Deckhouse Kubernetes Platform. Для инсталляций со встроенной базой данных (без внешнего PostgreSQL) предыдущий operator-postgres заменён на модуль managed-postgres DKP. Это обеспечивает более оперативное устранение CVE и обновления безопасности, а также полноценное решение для управляемой базы данных с расширенными возможностями. Для обратной совместимости прежняя схема с operator-postgres пока доступна, но будет удалена в следующем релизе. Перед обновлением ознакомьтесь с инструкцией по миграции.

Исправления ошибок

  • Исправлена избыточная детализация аудит-логов в продакшен-окружении.
  • Исправлен сбой хука конфигурации деплоя при отключённом хранилище трейсов или логов.

v1.10.3

Исправления ошибок

  • Исправлена ошибка при деплое модуля, когда хранилище трейсов, хранилище логов или подсистема мониторинга не включены.

v1.10.2

Исправления ошибок

  • Исправлена работа кэширования хранилища метрик, которая могла приводить к увеличению задержек и нагрузки на долгосрочное хранилище.
  • Исправлены алерты хранилища трейсов, которые могли приводить к ложноположительным срабатываниям.
  • Исправлено отображение служебных вкладок в пользовательских дашбордах проектов.
  • Исправлена нехватка ресурсов для вспомогательных компонентов на крупных инсталляциях.

v1.10.1

Исправления ошибок

  • Исправлена работа кэширования store-gateway.

v1.10.0

Новые возможности

  • Добавлено распределённое хранилище трейсов. Платформа теперь поддерживает приём, хранение и просмотр трейсов:
    • Приём трейсов по протоколам OpenTelemetry (OTLP), Jaeger и Zipkin.
    • Просмотр и поиск трейсов в UI.
    • Настройка лимитов приёма трейсов на уровне проекта через административный интерфейс и API.
    • Статистика использования хранилища трейсов.
    • Документация по архитектуре и инструкции по интеграции.
  • Страницы пространств и проектов теперь используют в URL человекочитаемые имена вместо UUID. Ранее сохранённые ссылки с UUID продолжают работать.

Улучшения

  • Агент мониторинга теперь может быть развёрнут на узлах, использующих среду выполнения контейнеров containerdV2.
  • Устранены ложные срабатывания алертов о статусе синхронизации кластеров в инсталляциях с одним кластером.
  • Обновлён агент мониторинга до версии v0.89.5:
    • Исправлено определение версии ОС при запуске агента в контейнере.
    • Исправлен сбой, который мог возникать на CentOS 7 при определении версий пакетов.
    • Исправлены проблемы плагина PostgreSQL при мониторинге инстансов Yandex Cloud RDS.
  • Обновлены имена, описания и правила агрегации алертов для повышения их информативности и снижения числа ложных срабатываний.

Исправления ошибок

  • Исправлена ошибка миграции данных, при которой дублирующиеся recording rules Prometheus могли приводить к сбою миграции.
  • Исправлена обработка специальных символов в выражениях PromQL, что предотвращает ошибки в запросах, содержащих одинарные кавычки и другие зарезервированные символы.

Безопасность

  • Устранены уязвимости (CVE) критического и высокого уровня в компонентах хранилища трейсов и базовых образах.
  • Обновлены базовые контейнерные образы до актуальных версий.
  • Среда выполнения Go в агенте мониторинга обновлена до версии 1.24.12 для устранения известных CVE.

v1.9.9

Безопасность

  • Все компоненты Ceph переведены на Distroless-образы для снижения рисков безопасности, связанных с ненужным ПО в стандартных контейнерных образах.

Улучшения

  • Обновлена документация: добавлены инструкции по настройке плагина Nginx для мониторинга с использованием не стандартных путей к логам и форматов логов.

Исправления ошибок

  • В дашборде Main единицы измерения памяти и диска изменены с SI на IEC для обеспечения согласованности с другими дашбордами.

v1.9.8

Безопасность

  • Устранены уязвимости, связанные с CVE-2024-25621

v1.9.5

Безопасность

  • Устранены уязвимости, связанные с CVE (CVE-2025-30153, CVE-2025-47912, CVE-2025-58183, CVE-2025-58185, CVE-2025-58186, CVE-2025-58187, CVE-2025-58188, CVE-2025-58189, CVE-2025-61723, CVE-2025-61724, CVE-2025-61725)

v1.9.4

Улучшения

  • Добавлена поддержка обнаружения процессов внутри контейнеров, запущенных с помощью CRI-O.
  • Улучшен процесс создания пользователей при внутренней аутентификации: теперь суперпользователи могут создавать пользователей и задавать им пароли без необходимости подтверждения по электронной почте.

Исправления ошибок

  • Обновлён агент мониторинга до версии v0.89.0:
    • Исправлена сборка метрик репликации MySQL для версии 8.5+.
    • Также устранена ошибка, из-за которой версия PostgreSQL могла определяться некорректно, что приводило к ошибкам при сборе метрик.

v1.9.3

Безопасность

  • Устранены уязвимости (CVE) с критическим и высоким уровнем.

v1.9.2

Безопасность

  • Устранены уязвимости (CVE) с критическим и высоким уровнем.

v1.9.1

Исправления ошибок

  • Исправлена ошибка, из-за которой operator-ceph мог зависать в состояние Pending.

v1.9.0

Улучшения

  • Обновлена документация по резервному копированию: добавлен пример использования rclone для создания и восстановления резервных копий.
  • Внутренние CRD скрыты из публичной документации.

Безопасность

  • Устранены все уязвимости (CVE) с критическим и высоким уровнем.

v1.8.0

Изменения

  • Ceph-оператор теперь встроен в модуль. Отдельный внешний модуль operator-ceph больше не требуется.
  • Для некоторых компонентов теперь используются базовые образы, предоставляемые DKP, что обеспечивает лучшую совместимость и сопровождаемость.
  • Обновлены базовые контейнерные образы, частично исправлены уязвимости (CVE) для повышения безопасности.

Исправления ошибок

  • Исправлены проблемы в хуках, которые могли приводить к неполной или некорректной установке модуля.

v1.7.3

Исправления ошибок

  • Исправлена ошибка, из-за которой некорректно работал выход из “Edit Mode” дашборда.

v1.7.2

Исправления ошибок

  • Исправлена ошибка, из-за которой в поле GeneratorURL алерта Prometheus ошибочно добавлялся внутренний порт сервиса, что приводило к некорректной работе ссылки.

v1.7.1

Исправления ошибок

  • Исправлена ошибка, из-за которой backend не мог устанавливать подключения к внешним сервисам — регрессия была внесена в версии 1.7.0. Это влияло на работу механизмов авторизации при использовании внешних систем.
  • Приведён security context backend-приложения в соответствие требованиям политики безопасности “restricted”.

v1.7

Изменения

  • Заменены образы Alt Linux на Distroles образы для всех компонентов, работающих на ALT Linux.
  • Добавлены livenessProbe и readinessProbe в поды, где они отсутствовали.
  • Все компоненты переведены на использование того же security context, что и в DKP.
  • Обновлены образы Distroles, теперь используется базовый образа Distroles из DKP.
  • Исправлены уязвимости безопасности (CVE).

Улучшения

  • Переведены сервисы с портов 80 и 443 на высокие порты.

Новые возможности

  • Добавлена возможность пользователям с ролью User создавать API-токены для дашбордов и правил.
  • В образ Grafana добавлены несколько широко используемых плагинов.

Исправления ошибок

  • Исправлены проблемы валидации сертификатов, вызванные отсутствием CA bundle.
  • Добавлен отсутствующий поддомен для внутреннего registry в SAN TLS-сертификата.
  • Исправлена ошибка, из-за которой триггеры отключаться или перезаписываться при удалении родительского триггера.
  • Исправлена проблема с отсутствующей категорией в форме дашборда.
  • Исправлена ошибка, из-за которой аварийное ограничение (останавливающее сбор метрик и логов при приближении заполнения Ceph) не срабатывало, если компоненты мониторинга были отключены в ModuleConfig.
  • Выполнена миграция дашбордов, использующих источники данных Loki, на использование источника данных default-logs.
  • Исправлены ложные предупреждения о некорректных источниках данных при использовании default-logs в дашбордах.
  • Исправлены некорректные названия метрик в дашборде Redis.