Наблюдаемость в Deckhouse Kubernetes Platform

Готовая встроенная система сквозного мониторинга для компонентов кластера и пользовательских приложений

Мониторинг «из коробки»

Наблюдаемость в DKP обеспечивает мгновенную видимость компонентов инфраструктуры и показывает, где и почему произошёл сбой до того, как это затронет пользователей или нарушится SLA

Обнаружение сбоя и уведомление команды
до того, как он перерастёт в инцидент

Диагностика проблемы (RCA) за минуты
и отображение цепочки инцидента

Контроль SLA и состояния платформы
в реальном времени

Как мониторинг Dеckhouse Kubernetes Platform решает ваши задачи

Максимальное покрытие аварийных сценариев

60+ готовых дашбордов от инженеров Deckhouse развёртываются с установкой Deckhouse Kubernetes Platform и позволяют быстро находить, что вышло из строя

Алертинг без шума и ложных срабатываний

300 проверенных алертов с 9 уровнями критичности помогают фокусироваться только на сбоях, влияющих на работу сервисов

Мониторинг как код (IaC)

Настройки можно задавать через кастомные Kubernetes-ресурсы, версионировать, отправлять на code review и развёртывать вместе с приложением

Мультиарендность и изоляция данных

Метрики, дашборды, настройки алертинга и логи изолированы по проектам без доступа к чужим данным и с меньшими ИБ-рисками

Готовый мониторинг для пользовательских приложений

Все необходимые метрики (CPU, RAM, диск, сеть, поды, Ingress и др.) уже встроены в мониторинг  и собираются автоматически

Гибкость и кастомизация без вендорлока

Дашборды и алерты можно создавать, копировать и адаптировать под специфику проекта. Поддерживается сбор своих метрик

Мониторинг внешних серверов и системных приложений

Агент позволяет подключать к наблюдаемости в DKP Linux-сервера вне кластера, базы данных, брокеры очередей и другие системные приложения. Все их метрики попадают в общую среду мониторинга без дополнительных настроек

Удобная работа с логами и быстрая диагностика

Автоматический сбор логов со всех компонентов кластера с возможностью поиска и фильтрации

Для кого

Команды эксплуатации

ИТ-руководители

DevOps-команды

Предупреждает о проблеме до сбоя

Мониторинг Deckhouse Kubernetes Platform выявляет сбои на ранней стадии и отправляет алерт нужной команде до того, как это повлияет на пользователей

Помогает быстро найти причину проблемы (RCA)

Более 60 готовых дашбордов с drill down помогают быстро локализовать сбои, а 300 алертов с инструкциями упрощают поиск первопричины 

Работает стабильно

Deckhouse Prom++ потребляет в 10 раз меньше памяти, чем обычный Prometheus и остаётся надёжным даже при высокой нагрузке

Прозрачный контроль SLA

Дашборды показывают доступность платформы и состояние компонентов в реальном времени

Планирование ресурсов и эффективность инфраструктуры

Дашборд Capacity Planning позволяет отслеживать нагрузку, выявлять недозагруженные ресурсы и оптимизировать инфраструктурный бюджет

Безопасный доступ к данным мониторинга

Метрики изолированы по зонам видимости, доступ к данным регулируется через RBAC

Снижение затрат (TCO)

Не нужно тратить ресурсы на разработку собственного мониторинга — дашборды, алерты, логирование и интеграции уже включены в поставку

Единая точка управления мониторингом 

Удобный интерфейс для создания алертов, дашбордов и настройки каналов доставки уведомлений

Быстрое подключение мониторинга своего приложения 

Быстрый сбор метрик со своего приложения, удобное включение преднастроенных алертов: место на диске, ошибки Ingress и др.

Мониторинг как код (IaC)

Используются кастомные Kubernetes-ресурсы. Настройки можно версионировать, хранить в репозитории вместе с приложением и отправлять на code review

Как это работает

Настройка мониторинга платформы

Разверните Deckhouse Kubernetes Platform — мониторинг включится автоматически

Настройте отправку алертов в команду платформы

Настройка мониторинга приложений

Подключите приложения и начните собирать метрики

Настройте дашборды и алерты под свои сценарии

Настройте отправку алертов в команду разработки

Возможности наблюдаемости в кластере DKP

		Коммерческие редакции Deckhouse Kubernetes Platform
	Community Edition	Basic Edition	Standard Edition	Standard Edition+	Enterprise Edition	Certified Security Edition Lite	Certified Security Edition Pro
Мониторинг компонентов кластера
Мониторинг компонентов кластера: — api server — controller manager — состояние узлов кластера — Ingress — сеть — DNS и тп.
Мониторинг доступности образов в registry для запущенных приложений
Мониторинг качества сетевого взаимодействия между всеми узлами кластера, а также (опционально) до дополнительных внешних узлов
SLA кластера и планирование ресурсов
Планирование ресурсов на инфраструктуру (Capacity planning)
Мониторинг SLA кластера
Просмотр и анализ исторических трендов (до 3 месяцев)
Мониторинг приложений и серверов
Автоматическая настройка системы мониторинга для сбора метрик с бизнес-приложений
Упрощенная настройка мониторинга пользовательских приложений: — место/inode’ы на диске — HTTP-ошибки на ingress — нагрузка CPU — неработающие pod’ы
Мониторинг пользовательских системных приложений: БД, брокеры очередей и тд
Мониторинг Linux-серверов за пределами кластера
Мониторинг сроков действия SSL‑сертификатов
Возможность глубокой кастомизации мониторинга «под себя»
Управление мониторингом как кодом (IaC подход)
Push- и pull-модель сбора метрик
Журналирование
Сбор и отправка логов
Хранение логов
Создание метрик по логам
Алертинг по логам
Логи без потребления ресурсов: мультитенантность, квотирование
Безопасность и надежность
Мультитенантность мониторинга: разделение прав доступа к метрикам, дашбордам, алертам
Режим отказоустойчивости и высокой доступности мониторинга (HA)
Экономия ресурсов
Deckhouse Prom++ экономия памяти до 10 раз по сравнению с Prometheus
Централизованный мониторинг
Мультитенантное централизованное хранилище метрик и логов на 5+ лет
RCA
Умная диагностика инцидентов