Deckhouse Observability в кластере

Встроенная в Deckhouse Kubernetes Platform система сквозной наблюдаемости инфраструктуры и приложений

Готовая наблюдаемость «из коробки»

Observability в кластере обеспечивает мгновенную видимость компонентов инфраструктуры и показывает, где и почему произошёл сбой до того, как это затронет пользователей или нарушится SLA

Обнаружение сбоя и уведомление команды
до того, как он перерастёт в инцидент

Диагностика проблемы (RCA) за минуты
и отображение цепочки инцидента

Контроль SLA и состояния платформы
в реальном времени

Как Observаbility решает ваши задачи

Максимальное покрытие аварийных сценариев

60+ готовых дашбордов от инженеров Deckhouse развёртываются с установкой Deckhouse Kubernetes Platform и позволяют быстро находить, что вышло из строя

Алертинг без шума и ложных срабатываний

300 проверенных алертов с 9 уровнями критичности помогают фокусироваться только на сбоях, влияющих на работу сервисов

Мониторинг как код (IaC)

Настройки можно задавать через кастомные Kubernetes-ресурсы, версионировать, отправлять на code review и развёртывать вместе с приложением

Мультитенантность и изоляция данных

Метрики, дашборды, настройки алертинга и логи изолированы по проектам без доступа к чужим данным и с меньшими ИБ-рисками

Готовый мониторинг для пользовательских приложений

Все необходимые метрики (CPU, RAM, диск, сеть, поды, Ingress и др.) уже встроены в мониторинг 
и собираются автоматически

Гибкость и кастомизация без вендорлока

Дашборды и алерты можно создавать, копировать и адаптировать под специфику проекта. Поддерживается сбор своих метрик

Для кого

Предупреждает о проблеме до сбоя

Мониторинг Deckhouse Kubernetes Platform выявляет сбои на ранней стадии и отправляет алерт нужной команде до того, как это повлияет на пользователей

Помогает быстро найти причину проблемы (RCA)

Более 60 готовых дашбордов с drill down помогают быстро локализовать сбои, а 300 алертов с инструкциями упрощают поиск первопричины


Работает стабильно

Deckhouse Prom++ потребляет в 10 раз меньше памяти, чем обычный Prometheus и остаётся надёжным даже при высокой нагрузке

Прозрачный контроль SLA

Дашборды показывают доступность платформы и состояние компонентов в реальном времени

Планирование ресурсов и эффективность инфраструктуры

Дашборд Capacity Planning позволяет отслеживать нагрузку, выявлять недозагруженные ресурсы и оптимизировать инфраструктурный бюджет

Безопасный доступ к данным мониторинга

Метрики изолированы по зонам видимости, доступ к данным регулируется через RBAC

Снижение затрат (TCO)

Не нужно тратить ресурсы на разработку собственного мониторинга — дашборды, алерты, логирование и интеграции уже включены в поставку

Единая точка управления мониторингом


Удобный интерфейс для создания алертов, дашбордов и настройки каналов доставки уведомлений

Быстрое подключение мониторинга своего приложения


Быстрый сбор метрик со своего приложения, удобное включение преднастроенных алертов: место на диске, ошибки Ingress и др.

Мониторинг как код (IaC)

Используются кастомные Kubernetes-ресурсы. Настройки можно версионировать, хранить в репозитории вместе с приложением и отправлять на code review

Сценарии использования

Мониторинг кластера 
Deckhouse Kubernetes Platform

Метрики и алерты по всем компонентам кластера «из коробки»

Мониторинг пользовательских приложений

Подключайте приложения и настраивайте дашборды под свои метрики

Мониторинг внешних Linux-серверов

Сбор метрик ОС, загрузки, сетей и логов в единую систему 

Мониторинг популярных сервисов и ПО

Готовые интеграции: PostgreSQL, Redis, Nginx, Kafka и другие

Как это работает

Настройка мониторинга платформы

Разверните Deckhouse Kubernetes Platform — мониторинг включится автоматически

Настройте отправку алертов в команду платформы

Настройка мониторинга приложений

Подключите приложения и начните собирать метрики

Настройте дашборды и алерты под свои сценарии

Настройте отправку алертов в команду разработки

Возможности наблюдаемости в кластере DKP

Коммерческие редакции Deckhouse Kubernetes Platform
Community EditionBasic EditionStandard EditionStandard Edition+Enterprise EditionCertified Security Edition LiteCertified Security Edition Pro
Мониторинг сетевого взаимодействия между всеми узлами кластера, а также (опционально) до дополнительных внешних узлов
Статистика по доступности (SLA) для компонентов кластера и DKP
Автоматическая настройка системы мониторинга для сбора метрик с бизнес-приложений
Планирование ресурсов
на инфраструктуру
(Capacity planning)
Deckhouse Prom++ (экономия памяти до 10 раз по сравнению с Prometheus)
Возможность глубокой кастомизации мониторинга под себя
Управление мониторингом как кодом (IaC подход)
Мультитенантность мониторинга: разделение прав доступа к метрикам, дашбордам, алертам
Просмотр и анализ исторических трендов (до 3 месяцев)
Мультитенантное централизованное хранилище метрик и логов на 5+ лет
Упрощенная настройка мониторинга пользовательских приложений: место/inode’ы на диске, HTTP-ошибки на ingress, нагрузка CPU, неработающие pod’ы
Мониторинг сроков действия SSL-сертификатов
Мониторинг доступности образов в registry для запущенных приложений
Мониторинг пользовательских системных
приложений: баз данных, брокеров очередей и других
Мониторинг Linux-серверов за пределами кластера
Push- и pull-модель сбора метрик
Режим отказоустойчивости и высокой доступности мониторинга (HA)
Умная диагностика инцидентов
Сбор и хранение логов встроенными средствами
Отправка логов во внешние системы
Создание метрик по логам
Алертинг по логам
Логи без потребления ресурсов: мультитенантность, квотирование, LogQL

Мы используем файлы cookie, чтобы сделать работу с сайтом удобнее.
Подробнее — в политике обработки персональных данных и политике использования файлов «cookie».

Помогите нам сделать сайт удобнее — поделитесь своим мнением в нашем исследовании.
Мы будем очень признательны и предложим полезные бонусы!