Встроенная в Deckhouse Kubernetes Platform система сквозной наблюдаемости инфраструктуры и приложений
Deckhouse Observability в кластере
Готовая наблюдаемость «из коробки»
Observability в кластере обеспечивает мгновенную видимость компонентов инфраструктуры и показывает, где и почему произошёл сбой до того, как это затронет пользователей или нарушится SLA
Обнаружение сбоя и уведомление команды
до того, как он перерастёт в инцидент
Диагностика проблемы (RCA) за минуты
и отображение цепочки инцидента
Контроль SLA и состояния платформы
в реальном времени
Как Observаbility решает ваши задачи
Максимальное покрытие аварийных сценариев
60+ готовых дашбордов от инженеров Deckhouse развёртываются с установкой Deckhouse Kubernetes Platform и позволяют быстро находить, что вышло из строя
Алертинг без шума и ложных срабатываний
300 проверенных алертов с 9 уровнями критичности помогают фокусироваться только на сбоях, влияющих на работу сервисов
Мониторинг как код (IaC)
Настройки можно задавать через кастомные Kubernetes-ресурсы, версионировать, отправлять на code review и развёртывать вместе с приложением
Мультитенантность и изоляция данных
Метрики, дашборды, настройки алертинга и логи изолированы по проектам без доступа к чужим данным и с меньшими ИБ-рисками
Готовый мониторинг для пользовательских приложений
Все необходимые метрики (CPU, RAM, диск, сеть, поды, Ingress и др.) уже встроены в мониторинг и собираются автоматически
Гибкость и кастомизация без вендорлока
Дашборды и алерты можно создавать, копировать и адаптировать под специфику проекта. Поддерживается сбор своих метрик
Для кого
Сценарии использования

Как это работает
Настройка мониторинга платформы
Настройка мониторинга приложений
Возможности наблюдаемости в кластере DKP
Коммерческие редакции Deckhouse Kubernetes Platform | |||||||
---|---|---|---|---|---|---|---|
Community Edition | Basic Edition | Standard Edition | Standard Edition+ | Enterprise Edition | Certified Security Edition Lite | Certified Security Edition Pro | |
Мониторинг сетевого взаимодействия между всеми узлами кластера, а также (опционально) до дополнительных внешних узлов | |||||||
Статистика по доступности (SLA) для компонентов кластера и DKP | |||||||
Автоматическая настройка системы мониторинга для сбора метрик с бизнес-приложений | |||||||
Планирование ресурсов на инфраструктуру (Capacity planning) | |||||||
Deckhouse Prom++ (экономия памяти до 10 раз по сравнению с Prometheus) | |||||||
Возможность глубокой кастомизации мониторинга под себя | |||||||
Управление мониторингом как кодом (IaC подход) | |||||||
Мультитенантность мониторинга: разделение прав доступа к метрикам, дашбордам, алертам | |||||||
Просмотр и анализ исторических трендов (до 3 месяцев) | |||||||
Мультитенантное централизованное хранилище метрик и логов на 5+ лет | |||||||
Упрощенная настройка мониторинга пользовательских приложений: место/inode’ы на диске, HTTP-ошибки на ingress, нагрузка CPU, неработающие pod’ы | |||||||
Мониторинг сроков действия SSL-сертификатов | |||||||
Мониторинг доступности образов в registry для запущенных приложений | |||||||
Мониторинг пользовательских системных приложений: баз данных, брокеров очередей и других | |||||||
Мониторинг Linux-серверов за пределами кластера | |||||||
Push- и pull-модель сбора метрик | |||||||
Режим отказоустойчивости и высокой доступности мониторинга (HA) | |||||||
Умная диагностика инцидентов | |||||||
Сбор и хранение логов встроенными средствами | |||||||
Отправка логов во внешние системы | |||||||
Создание метрик по логам | |||||||
Алертинг по логам | |||||||
Логи без потребления ресурсов: мультитенантность, квотирование, LogQL |